Die Quantentheorie eines Teilchens

Werbung
Die Quantentheorie eines Teilchens
(Dated: 6. Dezember 2012)
Das vorliegende Skript präsentiert einen recht modernen Zugang zu den Konzepten, die die Quantenmechanik heute so präzie und umfassend wie möglich definieren, tragen und ausmachen, und der
Phänomenologie, die sich zum einen aus diesen Konzepten ergibt und zum anderen in der Natur
beobachtbar realisert ist.
Bei aller Sorgfalt und Mühe vermag dieses Skript keinesfalls den bekannten Kanon von
Lehrbüchern zu diesem Thema zu ersetzen. Ein hinreichend tiefes Verständnis dieser fundamentalsten Naturbschreibung ist nur möglich, wenn der gesamte Kanon genutzt wird, und nicht nur
eines seiner Werke.
PACS numbers:
I.
EINE INFORMELLE EINLADUNG
Statt den hoffnungslosen Versuch zu unternehmen, bereits an dieser Stelle—ohne weitere begriffliche geschweige denn konzeptioneller Vorbereitung und Vorbildung—
den Anwendungsbereich der Quantenmechanik konstruktiv zu definieren oder zumindestens zu charakterisieren,
beginnen wir statt dessen mit einer Einladung.
Ein wenig Ideengeschichte vorweg: O. Stern hat sich
den weiter unten grob beschriebenen Versuchsaufbau
1921 ausgedacht und zusammen mit W. Gerlach 1922
in Frankfurt durchgeführt. Das sogenannte Stern–
Gerlach–Experiment (SGE) illustriert eindrucksvoll
den radikalen Bruch mit den Konzepten der klassischen Mechanik und dem klasischen Naturverständnis
überhaupt. Das betrachtete System kann als das am wenigsten klassische und als das quantenmechanische System schlechthin betrachtet werden. Das SGE kann daher
mit Fug und Recht als paradigmatisches Experiment
bezeichnet werden.
Das Studienobjekt, hier Silberatome und eine gewisse Eigenschaft, die diese tragen, sowie eine Messmethode basierend auf einer sogenannten Stern–Gerlach–
Apparatur (SGA), darf Ihnen vollkommen unbekannt
sein. Unser Ziel ist im Moment nicht ein präzises
Verständnis des SGE mit all seinen relevanten und auch
interessanten Komponenten. Vielmehr konzentrieren wir
uns auf nicht–klassische Eigenschaften dieses Systems,
die weniger mit dem hier betrachteten speziellen Versuchsaufbau zusammenhängen, als vielmehr von quantenmechanischen Eigentümlickeiten herühren, die wir extrahieren möchten.
In einem Ofen werden Silberatome erhitzt, die durch
eine kleine Öffnung im Ofen diesen verlassen können, und
dann auf einen Spalt treffen, der die Silberatome passiv
fokusiert. Diesen Teil des Versuchaufbaus bezeichnen wir
mit Q. Hinter Q befinde sich ein inhomogenes Magnefeld, das von einem speziell geformten Magneten erzeugt
wird. Schliesslich wird ein weiterer Spalt in den Strahlgang gebracht, wiederum zur passiven Fokussierung. Diesen zweiten Teil des Aufbaus bezeichnen wir mit M.
Der dritte und letzte Teil dieses ersten Aufbaus bildet
ein Detektor D, also eine Anordnung, die das Aufprallen
von Silberatomen auf eine Oberfläche nachhaltig anzeigt.
Die Prozessführung sieht also schematisch folgenderma-
ßen aus: SGE≡ Q −→ M −→ D.
Ein Silberatom stellen wir uns ganz primitiv als eine
Ansammlung von 47 Elektronen und einem Kern vor.
Dabei sind die Elektronen derart angeordnet, daß 46 von
ihnen eine kugelsymmetrische Elektronenwolke um den
Kern bilden, die keinen Gesamtdrehimpuls trägt. Der
Kern spielt in unseren Betrachtungen keine Rolle, da das
Experiment nur auf die Elektronenhülle, genauer auf das
äusserste Elektron (in der 5s–Schale) sensitiv ist. Dieses
trägt eine Eigenschaft (Observable), die wir Spin nennen, oder auch intrinsischen Drehimpuls, um sie vom
Bahndrehimpuls (extrinsischer Drehimpuls) deutlich zu
unterscheiden. Auch der Kern trägt diese Eigenschaft, allerdings ist er ∼ 105 mal schwerer als die Elektronenhülle
und trägt daher nicht wesentlich zum magnetischen
Moment µ des Silberatoms bei. Dieses ist praktisch alleine durch den Spin S des 5s–Elektrons gegeben:
µ ≈ (e/me ) S ,
(1)
wobei e < 0 und die Lichtgeschwindigkeit c = 1 gesetzt
wurde.
Das magnetische Moment koppelt an das inhomogene
Magnetfeld B und die Wechselwirkungsenergie (potentielle Energie) dieser Konfiguration ist V = −hµ, Bi. Mit
anderen Worten, das inhomogene Magnetfeld übt eine
Kraft auf das Silberatom aus: F = −∇V = ∇ (hµ, Bi).
Ohne Beschränkung der Allgemeinheit nehmen wir an,
daß B = Bz ez , schliesslich können wir unser Koordinatensystem immer so ausrichten. Bei geeigneter Magnetfeldkonfiguration und Orientierung haben wir dann folgende Situation: Atome mit µz > 0 erfahren eine nach
unten gerichtete Kraft, während Atome mit µz < 0 eine
Beschleunigung noch oben erfahren1 . SGE erlaubt somit,
µz ∝ Sz zu messen. Da die Ausrichtung des inhomogenen Magnetfeldes wichtig ist, notieren wir die Vorzugsrichtung immer mit, also SGEz .
Die nahe liegende Frage ist, welche Verteilung von Silberatomen auf D wir erwarten? Zunächst die klassische
1
Auch wenn wir es hier mit Atomen zu tun haben, gilt diese klassische Betrachtungsweise. Der Spin ist hier die relevante nicht–
klassische Eigenschaft, während das Atom aufgrund seiner grossen Masse einer klassischen Trajektorie folgt, wie wir später sehen
werden.
2
Erwartung: Die Silberatome sind im Ofen beliebig ausgerichtet (es gibt ja keine Vorzugsrichtung) und jeder
mögliche Wert µz ∈ I ≡ [−|µ|, |µ|] sollte demokratisch
angenommen werden. Wir erwarten eine ensprechende
Verteilung von Detektorregistrierungen über I, also etwa
eine gleiche Anzahl von Treffern für jedes µz ∈ I nach
hinreichend langer Experimentierdauer.
Die klassische Erwartung hält der Konfrontation mit dem Experiment nicht stand: Tatsächlich
spaltet sich der Strahl von Silberatomen in nur zwei
disjunkte Strahlen auf, die nur zwei möglichen Werten
Sz ∈ {Sz (+), Sz (−)} entsprechen. Natürlich kommt der
z–Richtung dabei keine Sonderrolle zu.
Damit sind wir noch lange nicht am Ende. Wir betrachten als nächstes Ketten von Stern–Gerlach Experimenten. Mit obigen Erläuterungen definieren wir:
Def. I.1 Eine Stern–Gerlach Apparatur SGa (α) , (a ∈
{x, y, z} , α ∈ {±, +, −}) besteht aus einem inhomogenen Magnetfeld in a–Richtung, und einer nachgeschalteten Selektionsvorrichtung, die ausschliesslich die Spinkomponente(n) Sa (α) passieren lässt.
Def. I.2 Eine Kette von Stern–Gerlach Experimenten
K ({SGa (α)}) besteht aus einer Quelle Q, einer
Sequenz
von
Stern–Gerlach
Apparaturen
SGa (α) , (a ∈ {x, y, z} , α ∈ {±, +, −}) und einem
Detektor D.
Wir betrachten zunächst einmal die folgende Kette: K(SGz (±), SGz (+)), also eine Komposition von
zwei SGz –Apparaturen, wobei die erste Sz (−) aussortiert2 . Daher erwarten wir ausschliesslich Sz (+)
auf D. Als nächstes betrachten wir die SGE–
Kette K(SGx (±), SGz (+)). Im Detektor werden Sx ±–
Anteile gleich häufig ausfallen. Bedeutet dies, daß
50 Prozent der Atome im Sz (+)–Strahl als Sx (+)–
Komponente vorliegen? Im dritten Anlauf betrachten wir
K(SGz (±), SGx (+), SGz (+)). Der Detektor registriert
beide Spinkomponenten Sz (+) und Sz (−). Aber wie
kann dies sein, SGz (+) hat doch als erstes Glied in der
Sequenz alle Atome mit Sz (−) aussortiert? Es scheint,
als ob das Glied SGx (+) die Wirkung von SGz (+) aufhebt bezüglich der auf D beobachteten Verteilung. Unsere zwar durch gesunden Menschenverstand aber dennoch
offenbar falsche Intuition versagt bei der Interpretation
von K(SGx (±), SGz (+)).
Es ist klug, nun nach guten Analogien in anderen Bereichen der Physik zu suchen. Wir werden fündig in der
elementaren Wellenoptik: Wir betrachten eine monochromatische Welle mit Wellenzahlvektor k = kez . Dabei
kann es sich um x–polarisiertes Licht E = E(ωt − kz)ex
handeln, oder auch um y–polarisiertes E = E(ωt−kz)ey ,
wobei in beiden Fällen E(ωt−kz) = E0 cos (ωt − kz) gilt,
2
Die Reihenfolge ist relativ zu einem von rechts einfallenden Strahl
gewählt.
und ω die Kreisfrequenz (∝ Energie) des elektrischen Feldes bezeichne. Nun brauchen wir eine schöne Analogie zu
den SGa (α). Hier kommt sie:
Def. I.3 Ein variabler Filter F ist eine Abbildung
F : R3 × R3 −→ R3 ,
(A, B) −→ FA (B) ≡ hA, BiA .
Hierbei heisst A die Polarisationsrichtung und die lineare
Abbildung
lin.
FA : R3 −→ R3 , B −→ FA (B)
heisst A–Filter.
Sei nun E eine monochromatische Welle, die sich in z–
Richtung ausbreitet. Nun nehmen wir einen ex –Filter zu
Hand und gucken durch: Fex (E) = hex , Eiex . Natürlich
ist Fex ◦Fex = Fex . Setzen wir nun stattdessen einen ey –
Filter auf den ex –Filter, bilden wir also die Komposition
Fey ◦ Fex , so wird es dunkel hinter dieser Filterkomposition: Fey (Fex (E)) = 0. Damit handelt es sich bei den
Filtern Fex , Fey um Projektoren in der Ebene senkrecht
zu k ∝ ez .
Aber auch schon elementare Wellenoptik hat mehr zu
bieten:
Def. I.4 Unter einer Filtersequenz {FA }A∈M ⊂R3 verstehen wir die Komposition von A–Filtern, wobei A über die
geordnete Menge M läuft.
Hier kommt es offenbar auf die Reihenfolge an. Betrachten wir einmal die Filtersequenz Fex ◦ Fee ◦ Fey , wobei
e
e ⊥ k and e
e 6= ex,y . Nun sind wir geschult in elementarer Wellenoptik, trotzdem ist es gut sich über folgendes
zu wundern: Obwohl der erste Filter in obiger Sequenz
alle x–polarisierten Anteile aus einer monochromatischen
Welle filtert, besitzt die Welle nach dem Einsatz des e
e–
Filters wieder x–polarisierte Anteile. Offenbar hebt die
Polariation mittels des e
e–Filters die Wirkung des ey –
Filters auf. Damit haben wir eine sehr passende Analogie zu den oben diskutierten SGE–Ketten. Nur hier kennen wir die mathematische Beschreibung: Zunächst einmal rotieren wir das Koordinatensystem, so daß k q ez .
Nun, Fey (E) = Ey ey , und Fee (Fey (E)) = Ey Fee (ey ) =
Ey hey , e
eie
e. Per Konstruktion ist heb , e
ei 6= 0 , b ∈ {x, y}.
Somit gilt:
Fex (Fee (Fey (E))) = Ey hey , e
ei Fex (e
e)
= Ey hey , e
eihe
e, ex i ex .
(2)
Unser mathematisches Modell liefert hier in der Tat das
gewünschte Resultat, nämlich, daß die Wirkung des ey –
Filters (partiell) aufgehoben wird durch den anschliessenden Einschub des e
e–Filters. Wir erhalten nachweisbar
wieder x–polarisierte Komponenten. Der Grund hierfür
ist folgender: Die Wahl der z–Achse verlegt alle Polarisationseffekte in die Ebene, die k als Normale hat. Der erste
3
Polarisationsfilter führt in dieser Ebene eine Basis ein, die
den Teilraum beschreibt, der durch den Polarisationsvektor gegeben ist, und auch den Teilraum senkrecht hierzu.
Der Filter liefert also eine Basis. Bezüglich dieser Basis
hat die Polarisationsrichtung des zweiten Filters ausschliesslich nicht–verschwindende Projektionen. Der dritte
Filter konstituiert nun wieder die ursprüngliche Basis.
Wir betrachten ein konkretes Beispiel:
^(ex , e
e) =
√
π/4, also he
e, ex i = hey , e
ei = 1/ 2. Nun spannt ja
der zweite Polarisationsfilter auch eine Basis auf, die
wir jetzt mit {e
e≡e
e1 , e
e2 } bezeichnen. Wir haben dann
Fee1 (E) = hE, e
e1 ie
e√
e1 i(he
e1 , ex iex + he
e1 , ey iey ) =
1 = hE, e
e
hE, e
e√
(E)
=
hE,
e1 i(−ex +
1 i(ex + ey )/ 2, und Fe
e2
ey )/ 2. Wir fassen unsere elementaren Rechnungen zusammen:
√
Fee1 (E) = hE, e
e1 ie
e1 = hE, e
e1 i(ey + ex )/ 2 ,
√
Fee2 (E) = hE, e
e2 ie
e2 = hE, e
e1 i(ey − ex )/ 2 . (3)
Es ist an der Zeit, die Analogie dingfest zu machen: wir übertragen unsere Erkenntnisse aus der Wellenoptik auf das SGE. Dazu brauchen wir lediglich
folgende Ersetzung zu machen: Sz (±)–Atome ←→
x, y–polarisiertes Licht, und Sx (±)–Atome ←→ 1, 2–
polarisiertes Licht. Das entspricht natürlich noch keiner
lexikografischen Ersetzung in der mathematischen Beschreibung. Das kommt jetzt: Gegeben sei die SGE–Kette
K(SGz (±), SGx (+), SGz (+)). Wie modellieren wir diese
und welche mathematischen Objekte brauchen wir dazu? Die Lichtwelle wurde durch einen Vektor beschrieben, bezüglich der Polarisationen hatten wir es mit einem
zwei–dimensionalen Vektorraum zu tun (senkrecht zur
Ausbreitungsrichtung der Welle). Dieser Polarisationsvektor beschrieb den Zustand des E–Feldes hinsichtlich
der Frage, die uns interessierte. Der zwei–dimensionale
Vektorraum ist also ein Zustandsraum und die Vektoren darin nennen wir Zustandsvektor. Wir bezeichnen den Vektor, der den Spinzustand eines Silberatoms
(genauer seines 5s–Elektrons) bezogen auf ein inhomogenen Magnetfeldes in z–Richtung angibt mit |Sz ±i ∈ H,
wobei wir den zwei–dimensionalen Zustandsraum H genannt haben. Kennen wir den Spinzustand a priori nicht,
so schreiben wir kurz |ini ∈ H.
Als nächstes benötigen wir eine operationelle Vorschrift, die ein SGE mit inhomogenen Magnetfeld in z–
Richtung (äquivalent K(SGz (±))) erklärt. In der Wellenoptik war für die analoge Fragestellung eine mathematische Struktur wesentlich, nämlich ein Skalarprodukt,
h◦|◦i, wobei ◦ ein Platzhalter ist. Dieses induziert eine
geometrische Struktur auf H und erlaubt uns
|ini = hSz − |ini|Sz −i + hSz + |ini|Sz +i ,
zunächst mit einer SGz (+)–Apparatur auf den einlaufenden Spinzustand |ini operieren wollen. Schematisch
notiert soll gelten: SGz (+)|ini = hSz + |ini|Sz +i. Die
SGz (+)–Apparatur können wir also folgendermaßen modellieren: Ihre Wirkung ist die einer Projektion auf |Sz +i
entlang desselben Basiselementes. Formal3 können wir
die Wirkung der SGz (+)–Apparatur so beschreiben:
lin.
Pz (a) ≡ |Sz aihSz a| : H −→ H , a ∈ {±} ,
df
Pz (a) (|V i) = hSz a|V i|Sz ai .
Offenbar handelt es sich bei den Pz (a) um Projektoren,
wie Sie leicht überprüfen können.
Kommen wir zur betrachteten SGE–Kette zurück, deren interessanter Bestandteil nun folgendermaßen angegeben werden kann: (Pz (−) ◦ Px (+) ◦ Pz (+))(|ini). Es ist
einmal ganz ausführlich:
Pz (+) (|ini) =
= Pz (+) (hSz + |ini |Sz +i + hSz − |ini |Sz −i) =
= hSz + |iniPz (+) (|Sz +i) + hSz − |iniPz (+) (|Sz −i) =
= hSz + |ini |Sz +i .
Und genauso weiter:
Px (+) (Pz (+) (|ini)) =
= hSz + |ini Px (+) (|Sz +i) =
= hSz + |iniPx (+) (hSx + |Sz +i |Sx +i) =
= hSz + |inihSx + |Sz +i |Sx +i .
Endlich,
Pz (−) Px (+) Pz (+) (|ini)
=
= hSz + |inihSx + |Sz +i Pz (−) (|Sx +i) =
= hSz + |inihSx + |Sz +i Pz (−) (hSz − |Sx +i|Sz −i) =
= hSz + |inihSx + |Sz +ihSz − |Sx +i|Sz −i .
(6)
Diese Rechnung verlief tatsächlich vollkommen analog zu
(2). Unser mathematisches Modell kann den beobachteten Sachverhalt erfassen und der Wissenstransfer aus der
elementaren Wellenoptik hat sich gelohnt. Für das Resultat (6) war ebenfalls wichtig, daß der einlaufende Zustand nicht mit einem Koordinatensystem ausgestattet
war, dieses wird vielmehr durch die erste SG–Apparatur
bereit gestellt und in dessen Basis entwickeln wir den einlaufenden Zustand, und so weiter. Analog zu (3) haben
wir
|Sx +i = hSz − |Sx +i|Sz −i + hSz + |Sx +i|Sz +i ,
|Sx −i = hSz − |Sx −i|Sz −i + hSz + |Sx −i|Sz +i . (7)
(4)
wie üblich zu interpretieren: die Zahlen (den Körper lassen wir noch unspezifiziert) hSz ± |ini interpretieren wir
als Projektionen des unbekannten Spinzustandes |ini auf
das betreffende Basiselement von H. daß wir diese Basis gewählt haben liegt einzig und alleine daran, daß wir
(5)
3
Keine Sorge, die benötigten mathematischen Objekte werden alsbald eingeführt. Hier begnügen wir uns lediglich darauf zu zeigen,
warum diese Objekte in der Naturbeschreibung auftauchen, und
unterdrücken die Lust auf mehr Formalität noch.
4
Wenn wir fordern, daß hSx ± |Sx ±i = 1 gilt (Normierungsbedingung), so dürfen wir es wagen (in Anlehnung an das optische
√ Analogon), folgendes anzunehmen:
hS√
z ± |Sx +i = 1/ 2, und hSz − |Sx −i = −hSz + |Sx −i =
1/ 2.
Die nächste Frage, die sich uns stellt und die wir ja
verschoben hatten, ist die Frage nach einem geeigneten
Körper K, über dem H liegt. Wir beginnen mit einer
banalen Beobachtung in Anlehnung an (7):
|Sy +i = hSz − |Sy +i|Sz −i + hSz + |Sy +i|Sz +i ,
|Sy −i = hSz − |Sy −i|Sz −i + hSz + |Sy −i|Sz +i . (8)
Nun besitzt eine SGz –Apparatur eine Vorzugsrichtung,
die durch das inhomogene Magnetfeld in ez –Richtung gegeben ist. Um diese Richtung besitzt das Experiment eine Rotationssymmetrie. Daher √
liegt es nahe, folgendes
anzunehmen: hSz ±√|Sy +i = 1/ 2, und hSz − |Sy −i =
−hSz + |Sx −i = 1/ 2. Diese Werte sind allerdings schon
vergeben, siehe (7). Damit stellt sich die Frage, wie |Sy ±i
dargestellt werden kann. Eine rasche Feststellung ist, daß
K 6= R.
Wieder hilft eine Analogie aus der elementaren Wellenoptik, wenn auch eine gewagterer— es steht ja aber
auch einiges auf dem Spiel. Dieses Mal interessieren
wir uns für zirkular polarisiertes Licht, das sich wieder in ez –Richtung ausbreiten soll. Ohne Beschränkung
der Allgemeinheit betrachten wir folgende√zirkular polarisierte Lichtwelle:
E = E(ωt − kz)ex / 2 + E(ωt −
√
kz − π/2)ey / 2. In komplexer
Schreibweise: E =
√
exp (ωt − kz)(ex + iey )/ 2, wobei Re(E) = E/E0 . Klarerweise ist zirkular polarisiertes Licht leicht zu unterscheiden von linear polarisiertem Licht. In unsere Übersetzungsliste nehmen wir folgendes auf: (Sy +)–Atome
←→ rechts zirkular polarisiertes Licht, und (Sy −)–Atome
←→ links zirkular polarisiertes Licht. Dann bereiten die
Zustände |Sy ±i überhaupt keine Probleme:
√
√
|Sy ±i = |Sz +i/ 2 ± i|Sz −i/ 2 .
(9)
Wir sehen also, daß K = C unser Problem löst. Damit wird H also ein Vektorraum über dem komplexen
Zahlenkörper. Nun ist es wichtig daran zu erinnern,
daß die komplexe Schreibweise in der Elektrodynamik
nur rechentechnisch von Bedeutung ist, die Zustände
der Elektrodynamik aber immer reelle Vektorfelder sind.
Tatsächlich können wir die zur zirkularen Polarisation
notwendige Phasenverschiebung komplett reell erfassen,
es ist halt nur bequemer mit komplexen Grössen zu rechnen. Dies ist im Falle der Spinzustände offenbar nicht der
Fall: hier ist der komplexe Zahlenkörper essentiell, und
kein Luxus. Wir benötigen für die betrachteten Projektionen einfach einen grösseren Wertevorrat, als der reelle Zahlenkörper zu bieten hat. Damit stossen wir aber
auf komplexe Zustandsvektoren. Mit anderen Worten:
die hier betrachteten Spinzustände sind komplexe Linearkombinationen. Folglich können die zur Beschreibung von
SGE notwendigen Zustände keine Beobachtungsgrössen
sein. Somit wird die zu studierende Theorie essentiell
nicht–observabel zu formulieren sein. Eine grasse Abkehr von der klassischen Naturbeschreibung.
II.
PRÄLIMINARIEN (FUNDAMENTE)
In diesem Kapitel wird eine hoffentlich angemessene
Würdigung der mathematischen Konzepte dargelegt, wie
sie zur Formulierung von physikalischen Sachverhalten in
der Quantenmechanik zum Einsatz kommen. Allerdings
liegt hier die Betonung auf den mathematischen Strukturen, weniger auf den praktischen Einsatz derselben. Auch
nicht auf der durch Erfahrung gschulten Verwässerung
dieser Konzepte, die eine bequeme Intuition ermöglichen.
Die passiert in Kapitel III. Für das erste durchdenkende Lesen kann das vorliegende Kapitel bis zu den Weihnachtsferien aufgehoben werden, sollte dann aber in der
einen oder anderen ruhigen Stunde tiefsinnig durchdacht
werden.
Wir brauchen also einen komplexen Vektorraum, der
als Zustandsraum fungiert, und ein Skalarprodukt, das
die relevante geometrische Struktur induziert. Diesen Luxus haben wir in der Quantenmechanik immer. Unsere
Notation folgt P.A.M. Dirac, da diese viele Einsichten erleichtert (und sich gut memorieren lässt), und ungemein
praktisch fürs bequeme Rechnen (allerdings auch etwas
holprig bei formalen Manipulationen) ist.
A.
Die Geometrie von Hilbert–Räumen
Def. II.1 Ein komplexer Vektorraum V heisst ein
Prä–Hilbert–Raum, wenn es eine komplexwertige Funktion h◦|◦i : V × V −→ C gibt, die für alle |xi , |yi , |zi ∈ V
und α ∈ C folgende Bedingungen erfüllt:
(1) hx|xi ≥ 0 und hx|xi = 0 genau dann, wenn |xi = 0
(2) hx|y + zi = hx|yi + hx|zi
(3) hx|αyi = αhx|yi
(4) hx|yi = hy|xi∗
Die Funktion h◦|◦i heisst Skalarprodukt.
Wir bringen zwei Beipiele:
Bsp. II.1 Sei Cn , n ∈ N die Menge aller n–Tupels
von komplexen Zahlen. Für x = (x1 , . . . , xn ) und y =
(y1 , . . . , yn ) in Cn definiere wir
df
hx|yi =
n
X
x∗j yj .
(10)
j=1
Bsp. II.2 Sei C[a, b] die Menge (wir brauchen es nicht
genauer) der stetigen komplexwertigen Funktionen auf
5
dem abgeschlossenen Intervall [a, b] ⊂ R. Für f, g ∈
C[a, b] definieren wir
df
Z
hf |gi =
b
dx f ∗ (x) g(x) .
(11)
a
Wir kommen nun zu den nützlichen geometrischen
Aspekten, die ein Prä–Hilbert–Raum ganz allgemein zu
bieten hat.
Def. II.2 Sei V ein Prä–Hilbert–Raum. Zwei Vektoren
|xi , |yi ∈ V heißen orthogonal (zueinander), wenn
hx|yi = 0. Sei I ⊂ N eine Indexmenge. Eine Menge {|xj i}j∈I von Vektoren in V heißt eine orthonormal
Menge, wenn hxj |xj i = 1 ∀j ∈ I, und hxi |xj i =
0 , ∀i, j ∈ I , i 6= j gilt.
df p
Wir schreiben kurzerhand k|xik = hx|xi. Weiter unten zeigen wir, daß k ◦ k tatsächlich eine Norm ist.
Satz II.1 (Satz von Pythagoras) Sei {|xa i}a∈I , I ⊂
N eine orthonormale Menge in einem Prä–Hilbert–Raum
V. Dann gilt für alle |xi ∈ V
k|xik
2
=
X
a∈I
2
X
|hx|xa i| + |xi −
|xa ihxa |xi (12)
Lemma II.2 (Schwarzsche Ungleichung) Sei V ein
Prä–Hilbert–Raum und |xi, |yi ∈ V. Dann gilt:
khx|yik ≤ k|xik k|yik .
(14)
Beweis II.3 Der Fall |yi = |0i ist trivial. Sei also |yi =
6
|0i. Der Vektor |yi/k|yik bildet selbst eine orthonormale Menge. Mit Hilfe der Besselschen Ungleichung (II.1)
folgt daher für jedes |xi ∈ V:
2
k|xik2 ≥ |hx|y/k|yiki|
2
y k|xik2 k|yik2 ≥ |hx|yi| ,
woraus sich unmittelbar die Behauptung ergibt. ∗–< [{; 0)
Aus der Linearen Algebra ist bekannt, daß jeder normierte Vektorraum ein metrischer Raum ist. Der folgende
Satz besagt nun, daß jeder Prä–Hilbert–Raum ein normierter Vektorraum ist.
Satz II.2 Jeder Prä–Hilbert–Raum V ist ein normierter
Vektorraum bezüglich der Norm
df
kxk =
p
hx|xi , ∀x ∈ V .
(15)
Beweis II.4 Als Übung.
2
a∈I
Beweis II.1 Wir stellen |xi folgendermaßen dar:
!
X
X
|xi =
|xa ihxa |xi + |xi −
|xa ihxa |xi .
a∈I
a∈I
Eine kurze Rechnung zeigt, daß
X
X
|xa ihxa |xi ⊥ |xi −
|xa ihxa |xi .
a∈I
a∈I
Folglich gilt
k|xik2 =
2
2 X
X
|xa ihxa |xi =
= |xa ihxa |xi + |xi −
a∈I
a∈I
2
X
X
2
=
|hxa |xi| + |xi −
|xa ihxa |xi .
a∈I
a∈I
Eine unmittelbare Einsicht, die sich aus Satz II.2 ergibt
ist, daß wir auf V eine natürliche Metrik d haben: Für
|xi , |yi ∈ V definieren wir
df
d(|xi, |yi) =
p
hx − y|x − yi .
(16)
Damit stehen uns Konzepte wie Konvergenz,
Vollständigkeit und Dichte zu Verfügung. Insbesondere können wir V immer vervollständigen zu einem normierten Raum V 0 , in dem V isometrisch als dichte Untermenge eingebettet ist. Tatsächlich ist V 0 selbst ein Prä–
Hilbert–Raum, da das Skalarprodukt von V auf V 0 wegen
Stetigkeit erweitert werden kann.
Def. II.3 Ein vollständiger Prä–Hilbert–Raum heisst
Hilbert–Raum.
Def. II.4 Zwei Hilbert–Räume H1 und H2 heißen isomorph (zueinander), wenn es eine lineare Abbildung
U : H1 −→ H2 gibt, sodaß
hU (x)|U (y)iH2 = hx|yiH1 , ∀|xi, |yi ∈ H1
(17)
Damit ist der Satz bewiesen. ∗–< [{; 0)
gilt. Eine solche Abbildung heisst unitärer Operator.
Lemma II.1 (Besselsche
Ungleichung)
Sei
{|xa i}a∈I , I ⊂ N eine orthonormale Menge in
einem Prä–Hilbert–Raum V. Dann gilt für alle |xi ∈ V:
X
2
k|xik2 ≥
|hx|xa i| .
(13)
Wir vertiefen diese Konzepte anhand einiger wichtige
Beispiele, die Sie mit Hilverträumen vertraut machen, die
für die Quantenmechanik relevant sind.
a∈I
Beweis II.2 Als Übung. ∗–< [{; 0)
Bsp. II.3 Sei L2 ([a, b]) die Menge von komplexwertigen
Funktionen auf I ≡ [a, b] ⊂ R, für die gilt:
Z
2
(18)
dx |f (x)| < ∞ .
I
6
Wir definieren ein Skalarprodukt durch: Für alle f, g ∈
L2 (I)
Z
hf |gi =
dx f ∗ (x)g(x) .
(19)
I
Dies ist sinnvoll, da 2 |f ∗ (x)g(x)| ≤ |f (x)|2 +|g(x)|2 , also
f ∗ (x)g(x) ∈ L1 (I). In Ihrer einführenden Vorlesung zur
Funktionalanalysis beweisen Sie, daß L2 (I) vollständig
und daher ein Hilbert–Raum ist. Ausserdem lässt sich
zeigen, daß bezüglich der Norm
sZ
df
2
dx |f (x)| ,
kf k =
(20)
I
L2 (I) gerade die Vervollständigung von C(I) ist.
Bsp. II.4 Sei `2 die Menge der komplexen Zahlenfolgen
{zn }n∈N , für die gilt:
∞
X
2
|zn | < ∞ .
(21)
n=0
h{yn }n∈N |{zn }n∈N i =
∞
X
(yn )∗ zn .
(22)
n=0
Bei `2 handelt es sich um einen archetypischen Hilbertraum in folgendem Sinn: Jeder nicht endlich–
dimensionale Hilbert–Raum mit einer abzählbar dichten
Untermenge ist isomorph zu `2 . Damit ist `2 ein kanonisches Beispiel für einen Hilbert–Raum.
Bsp. II.5 Sei µ ein Borel–Maß auf Rn . Dann bezeichne L2 (Rn , dµ) die Menge aller komplexwertigen Funktionen auf Rn , für die gilt:
Z
2
dµ |f (x)| < ∞ .
(23)
Rn
Bezüglich des Skalarproduktes
Z
df
hf |gi =
dµ f ∗ (x)g(x)
(24)
Rn
wird L2 (Rn , dµ) zu einem Hilbert–Raum.
B.
df
M⊥ = {|yi ∈ H | hy|xi = 0 , ∀|xi ∈ M} .
Der Satz von Riesz
Eine für uns wichtige Methode zur Konstruktion von
neuen Hilbert–Räumen aus alten besteht darin, einen abgeschlossenen Unterraum M eines gegebenen Hilbert–
Raumes H zu betrachten. Dabei erbt M das auf H erklärte Skalarprodukt und wird so selbst zu einem Hilbertraum. Dies erlaubt vertiefende geometrische Einsichten,
die uns dann auch mit einer geometrischen Vorstellung
von dualen Zuständen ausstattet.
(25)
Aus der Linearität des Skalarprodukts folgt, daß M⊥
ein linearer Unterraum von H. Ausserdem ist M⊥ abgeschlossen. Also ist auch M⊥ ein Hilbert–Raum. Die
Hilbert–Räume M und M⊥ haben lediglich den Nullvektor gemein. Zentral wird folgende Aussage sein: Zu jedem
abgeschlossenen Unterraum gibt es senkrechte Vektoren,
und zwar ausreichend viele, so daß
H = M + M⊥ = |xi + |yi | |xi ∈ M , |yi ∈ M⊥ .
(26)
Lemma II.3 Sei H ein Hilbert–Raum, M ⊂ H ein abgeschlossener Unterraum, und |xi ∈ H. Dann gibt es einen
eindeutig bestimmten Vektor |zi ∈ M, der zu |xi den
kürzesten Abstand hat.
Beweis II.5 Sei d := inf |yi∈M k|xi − |yik. Wir wählen
eine Folge {|yn i} , |yn i ∈ M mit k|xi − |yn ik −→ d.
Dann gilt
k|yn i − |ym ik2
Wir definieren ein Skalarprodukt durch:
df
Wir definieren das orthogonale Komplement M⊥
von M:
k|yn i − |xi − (|ym i − |xi) k2
2k|yn i − |xik2 + 2k|ym i − |xik2 +
−k − 2|xi + |yn i + |yn ik2
= 2k|yn i − |xik2 + 2k|ym i − |xik2 +
−4k|xi − (|yn i + |yn i) /2k2
≤ 2k|yn i − |xik2 + 2k|ym i − |xik2 − 4d2
−→ 2d2 + 2d2 − 4d2 = 0 .
=
=
Die zweite Gleichung folgt aus der Parallelogramm–
Identität,
die
Ungleichung
resultiert
aus
(|yn i + |yn i) /2 ∈ M. Also ist {|yn i} eine Cauchy–
Folge. Da M abgeschlossen ist, konvergiert {|yn i}
gegen ein |zi ∈ M. Es folgt, daß k|xi − |zik = d. Die
Eindeutigkeit überlassen wir einer Übung. ∗–< [{; 0)
Nun kommt die zentrale geometrische Aussage, das
Projektionstheorem:
Satz II.3 Sei H ein Hilbert–Raum und M ⊂ H ein abeschlossener Unterraum. Dann kann jeder Vektor |xi ∈ H
folgendermaßen eindeutig dargestellt werden: |xi = |zi +
|wi , |zi ∈ M , |wi ∈ M⊥ .
Beweis II.6 Sei |xi ∈ H. Nach dem Lemma II.3 gibt
es ein eindeutig bestimmtes Element |zi ∈ M, daß |xi
am nahesten ist. Wir setzen |wi = |xi − |zi. Klarerweise
ist dann |xi = |wi + |zi. Sei |yi ∈ M und t ∈ R. Für
d = k|xi − |zik gilt:
d2 ≤ k|xi − (|zi + t|yi) k2 = k|wi − t|yik2
= d2 − 2t Re (hw|yi) + t2 k|yik2 .
Folglich ist für alle t ∈ R: −2t Re (hw|yi) + t2 k|yik2 ≥ 0.
Daher muß Re (hw|yi) = 0. Benutzen wir it statt t, so
liefert ein ähnliches Argument, daß auch Im (hw|yi) = 0
gilt. Als Resultat haben wir somit: |wi ∈ M⊥ . Eindeutigkeit bleibt einer Übung vorbehalten. ∗–< [{; 0)
7
Das Projektionstheorem liefert einen natürlichen Isomorphismus zwischen H und M ⊕ M⊥ . Für uns ist es
vollkommen in Ordnung, den Isomorphismus zu unterdrücken und einfach H = M ⊕ M⊥ zu notieren.
Wir wenden uns nun beschränkten linearen Abbildungen von einem Hilbert–Raum H in einen anderen H0 zu.
Sei B (H, H0 ) die Menge der beschränkten linearen Abbildungen von H nach H0 . Offenbar ist B (H, H0 ) ein Vektorraum. Wir definieren auf B (H, H0 ) die folgende Norm:
Für T ∈ B (H, H0 ) setzen wir
df
kT k =
sup
kT (|xi) kH0 .
(27)
k|xikH =1
Für Interessierte: Bezüglich dieser Norm wird B (H, H0 )
ein Banach–Raum. Uns interessiert insbesondere der
Fall H0 = C:
Def. II.5 Der Vektorraum B (H, C) heißt der zu H
duale Raum und wird mit H∗ bezeichnet. Die Elemente
von H∗ heissen stetige lineare Funktionale.
Eine anschauliche Charakterisierung von H∗ verdanken wir F. Riesz und M. Fréchet. Diese macht natürlich
von der geometrischen Struktur auf H guten Gebrauch.
Satz II.4 Zu jedem T ∈ H∗ existiert genau ein |yT i ∈
H mit T (|xi) = hyT |xi , ∀|xi ∈ H. Weiterhin gilt:
k|yT ikH = kT kH∗ .
Beweis II.7 Sei N := {|xi ∈ H | T (|xi) = 0}. Wegen der Stetigkeit von T folgt, daß N ⊂ H ein abgeschlossener Unterraum ist. Falls N = H, dann ist
T (|xi) = 0 = h0|xi , ∀|xi ∈ H und wir sind fertig.
Wir nehmen im weiteren an, daß N 6= H. Der Projektionssatz II.3 garantiert dann, daß es einen vom Nullvektor verschiedenen Vektor |x0 i ∈ N ⊥ gibt. Wir setzen
|yT i := (T (|x0 i))∗ k|x0 ik−2 |x0 i. Es bleibt zu zeigen, daß
|yT i die richtigen Eigenschaften hat. Falls |xi ∈ N , dann
gilt T (|xi) = 0 = hyT |xi (da |yT i ∝ |x0 i ∈ N ⊥ ). Weiterhin, für |xi = α|x0 i , α ∈ C, haben wir
T (|xi) = T (α|x0 i) = αT (|x0 i) =
∗
= h(T (|x0 i)) k|x0 ik−2 x0 |αx0 i = hyT |αx0 i .
Da die Funktionen T (◦) und hyT |◦i linear sind und auf N
und |x0 i übereinstimmen, stimmen sie auch überein auf
dem Raum, der von N und |x0 i aufgespannt wird. Dieser
Raum ist aber gerade H, denn jedes Element |yi ∈ H
kann folgendermassen dargestellt werden:
T (|yi)
T (|yi)
|yi = |yi −
|x0 i +
|x0 i . (28)
T (|x0 i)
T (|x0 i)
Offenbar ist |yi − T (|yi) |x0 i/T (|x0 i) ∈ N und der letzte Term ist ∝ |x0 i. Also ist T (|xi) = hyT |xi , ∀|xi ∈
H. Nun zur Eindeutigkeit: Sei |y 0 i ∈ H und außerdem T (x) = hy 0 |xi. Insbesondere gilt dann einerseits
T (|y 0 i − |yT i) = hy 0 |y 0 i − hy 0 |yT i, und andererseits
T (|y 0 i − |yT i) = hyT |y 0 i − hyT |yT i. Daraus folgt nun,
k|y 0 ik2 + k|yT ik2 − hy 0 |yT i − hyT |y 0 i = 0, also k|y 0 i −
|yT ik2 = 0 y |y 0 i = |yT i, womit Eindeutigkeit gezeigt
ist.
Es bleibt zu zeigen, daß k|yT ikH = kT kH∗ . Wir bemerken (C als normierter Raum (C, | ◦ |)):
kT kH∗ =
|T (x)| =
sup
k|xikH =1
≤
sup
|hyT |xi|
Schwarz
=
k|xikH =1
k|yT ikH k|xikH
sup
k|xikH =1
kT kH∗ =
|T (x)| ≥ |T (|yT i/k|yT ikH )|
sup
k|xikH =1
= hyT ||yT i/k|yT ikH = k|yT ikH .
Damit ist auch die letzte Behauptung des Satzes bewiesen.
∗–< [{; 0)
Die Umkehrung von Satz II.4 gilt auch: jedes |yi ∈ H
definiert ein stetiges lineares Funktional Ty ∈ H∗ durch
Ty (|xi) = hy|xi , ∀|xi ∈ H. Daher schreiben wir in der
Physik statt Ty in der Regel hy|.
C.
Othonormale Basen
In diesem Abschnitt übertragen wir das Konzept
der Basis von endlich–dimensionalen Vektorräumen auf
vollständige Vektorräume, die mit einem Skalarprodukt
versehen sind, also auf Hilbert–Räume. Sei S ⊂ H eine Menge orthonormaler Vektoren im Hilbert–Raum H,
die in keiner anderen Menge orthonormaler Vektoren in
H enthalten ist. Dann heißt S eine vollständige orthonormale Basis von H, kurz vONB(H), oder einfach
vONB.
Satz II.5 Jeder Hilbertraum H hat eine vONB.
Beweis II.8 Bezeichne F ⊂ H die Familie von orthonormalen Mengen in H. Wir versehen diese Familie mit
einer partiellen Ordnung: S1 ≺ S2 wenn S1 ⊂ S2 für beliebige S1,2 ∈ F. Die Familie F ist nicht–leer, denn mit
|vi ∈ H ist |vi/k|vik eine orthonormale Menge. Seien
nun {Sa }a∈A eine linear geordnete Untermenge von F.
Dann ist die Vereinigung aller Sa , a ∈ A eine orthonormale Menge, die jedes Sa enthält und daher eine obere
Schranke für {Sa }a∈A darstellt. Da jede linear geordnete
Untermenge von F eine obere Schranke hat, können wir
das Lemma von Zorn anwenden. Aus diesem folgt, daß
F ein maximales Element besitzt. Also ein orthonormales System, das in keinem anderen orthonormalen System
echt enthalten ist. ∗–< [{; 0)
Der folgende Satz zeigt, daß, wie schon im endlich–
dimensionalen Fall, jeder Vektor in einem Hilbert–Raum
als Linearkombination von Basisvektoren dargestellt werden kann.
8
Satz II.6 Sei H ein Hilbert–Raum und S = {|ea i}a∈A
eine ONB. Dann gilt für jedes |yi ∈ H:
X
|yi =
|ea ihea |yi ,
(29)
a∈A
sX
k|yik =
2
|hea |yi| .
(30)
a∈A
Die Gleichung (29) ist folgendermaßen gemeint: Die
Summe auf der rhs(29) konvergiert gegen |yi ∈
H
von der Reihenfolge). Umgekehrt, ist
P (unabhängig
2
< ∞ , ca ∈ C, so konvergiert die Lineara∈A |ca | P
kombination a∈A ca |ea i gegen ein Element aus H.
Beweis II.9 Aus der Besselschen Ungleichung (Lemma
II.1) folgt, daß für jede endliche Untermenge A0 ⊂ A gilt:
X
2
|hea |yi| ≤ k|yik2 .
(31)
a∈A0
Somit ist hea |yi 6= 0 für höchstens eine abzählbare Anzahl von a’s in A, die wir nach Belieben
anordnen:
2
PN a1 , a2 , a3 , . . . , aN . Da die Summe j=1 heaj |yi monoton anwächst und gleichzeitig beschränkt
Pnist, konvergiert
sie im Limes N −→ ∞. Sei |yn i := j=1 |eaj iheaj |yi.
Dann gilt für n > m,
2
X
n
k|yn i − |ym ik2 = |e
ihe
|yi
aj
aj
j=m+1
n
X
heaj |yi2 .
=
j=m+1
Also ist {|yn i} eine Cauchy–Folge. Sei |zi ∈ H der
Grenzwert dieser Cauchy–Folge. Wir notieren:
hy − z|eak i =

*
= lim hy|eak i −
n→∞
n
X
j=1
eaj heaj |yieak  =
|yi = lim
n→∞
|eaj iheaj |yi .
(33)
j=1
Also gilt (29). Weiterhin folgt
2
n
X
0 = lim |yi −
|eaj iheaj |yi
=
n→∞
j=1


n
X
heaj |yi2  =
= lim k|yik2 −
n→∞
= k|yik2 −
a∈A
|v1 i = |w1 i/k|w1 ik
|v2 i = |w2 i/k|w2 ik
..
.
|vn i = |wn i/k|wn ik
..
.
Die Menge {|vj i} ist eine orthonormale Menge
und hat folgende nützliche Eigenschaft: Sei Im :=
{1, . . . , m} , m ∈ N. Für jedes m ∈ N spannen die Vektoren {|uj i}Im und {|vj i}Im den gleichen Vektorraum auf.
Def. II.6 A metrischer Raum M heißt separabel, wenn
es eine abzählbare Untermenge U gibt, die dicht in M
liegt.
Viele für die Praxis relevante Hilbert–Räume sind separabel. Diese können bis auf einen Isomorphismus wie folgt
charakterisiert werden (ohne Beweis):
D.
(34)
Beschränkte Operatoren
1.
Adjungierte
Es bezeichne L(X , Y) den Banach–Raum von Operatolin.
ren O : X −→ Y, wobei X , Y selbst Banach–Räume seien. Uns interessiert am meisten der Fall L(H, H) ≡ L(H),
mit H ein separabler Hilbert–Raum. Wir können hier
nicht auf topologische Untersuchungen eingehen, allerdings sei erwähnt, daß L(X , Y) mit der Norm
kT k =
j=1
X
hea |yi2 ,
j
|w1 i = |u1 i
|w2 i = |u2 i − |v1 ihv1 |u1 i
..
.
Pn−1
|wn i = |un i − j=1 |vj ihvj |un i
..
.
(32)
Und für a 6= ak , k ∈ {1, 2, . . . , N } folgt hy − z|ea i = 0.
Somit ist |y − zi orthogonal zu allen |ea i ∈ S , a ∈ A.
Da nach Voraussetzung S eine vONB ist, muß |yi = |zi
gelten. Damit ist
n
X
Die Gleichung (30) heißt Parzevalsche Gleichung. Die
Koeffizienten hea |yi werden oft Fourier–Koeffizienten
von |yi bezüglich der Basis {|ea i}a∈A genannt. Der
Grund für diese Namensgebung wird erst weiter unten
klar.
Dies ist eine gute Stelle, um an das Gram–Schmidt–
Verfahren zur Konstruktion einer orthonormalen Menge zu erinnern. Gegeben seien linear unabhängige Vektoren |u1 i, |u2 i, . . . . Wir definieren
Satz II.7 Ein Hilbert–Raum H ist genau dann separabel, wenn er eine abzählbare ONB S besitzt. Sind N < ∞
Vektoren in S, dann ist H isomorph zu CN . Gibt es
abzählbar viele Elemente in S, so ist H isomorph zu `2 .
+
= hy|eak i − hy|eak i = 0 .
woraus sich (30) ergibt. Die umgekehrte Schlussrichtung
überlassen wir einer Übung. ∗–< [{; 0)
kT |xikY
, T ∈ L(X , Y) , |xi ∈ X (, 35)
|xi6=|0i kxikX
sup
ausgestattet ist, die auf L(X , Y) eine Topologie induziert, die sogenannte Norm–Topologie. In dieser
Norm ist die Komposition L(X , Y) × L(Y, Z) −→
L(X , Z) , (A, B) −→ A ◦ B stückweise stetig.
9
Sei T ∈ L(X , Y). Die Menge von Vektoren |xi ∈ X mit
der Eigenschaft T |xi = |0i ∈ Y heißt der Kern von T
und wird folgendermaßen notiert: Kern(T ). Die Menge
der Vektoren |yi ∈ Y mit |yi = T |xi , |xi ∈ X heißt
das Bild von T und wird mit Bild(T ) notiert. Offenbar
ist Kern(T ) ⊂ X und Bild(T ) ⊂ Y. Der Kern(T ) ist ein
abgeschlossener Unterraum, während das Bild(T ) nicht
abgeschlossen zu sein braucht.
Im Folgenden führen wir den zu einem beschränkten Operator adjungierten Operator ein. Mit obigen
Bezeichnungen wird dabei zunächst (ein wenig spitzfindig) unterschieden zwischen Operatoren aus L(X , Y) und
L(H).
Wie weiter oben schon bemerkt, interessieren wir
uns hauptsächlich für beschränkte lineare Transformationen O ∈ L(H) von Hilbert–Räumen H. Der Banch–
adjungierte Operator zum beschränkten Operator T ∈
L(H, H) ist dann eine lineare Abbildung von H∗ nach
H∗ . Sei C : H −→ H∗ , |yi −→ C(|yi)◦ := hy|◦i.
Wir definieren eine lineare Abbildung T † : H −→ H
als folgende Komposition
Def. II.7 Seien X , Y Banach–Räume und T ∈ L(X , Y)
beschränkt. Der beschränkte Operator T 0 ∈ L(Y ∗ , X ∗ )
(wobei X ∗ , Y ∗ die zu X , Y dualen Räume bezeichnen) sei
folgendermaßen definiert:
hx|T yi = (C|xi) (T |yi) =
= (T 0 C|xi) (|yi) = hC −1 T 0 Cx|yi =
= hT † x|yi .
df
(T 0 hy|) (|xi) = hy|T xi , ∀hy| ∈ Y ∗ , |xi ∈ X .
(36)
Der so definierte Operator T 0 heißt Banach–adjungiert
zu T .
Die Konstruktion ist sehr natürlich, bitte machen Sie sich
das klar.
Bemerken Sie folgende Schreibweise: |T xi ≡ T |xi ∈ Y.
Ein bisschen klarer hätte man die Definition so notieren können: Sei Y 3 |zi := T |xi. Dann soll gelten:
(T 0 hy|) (|xi) := hy|zi. In der Physik sind wir oft intuitiver was die Schreibweise betrifft: hyT 0 |xi := hy|T xi,
wobei der duale Vektor (stetiges lineares Funktional)
hyT 0 | := T 0 hy|. In der Physik wird formal nicht unterschieden zwischen der Operation von Elementen des dualen Vektorraumes und dem Skalarprodukt als lineare Abbildung, weil wir immer Hilbert–Räume zu Verfügung haben und uns daher zweckmäßig der Charakterisiung von
Fréchet und Riesz bedienen.
Satz II.8 Seien X , Y Banach–Räume. Die Abbildung
L(X , Y) −→ L(Y ∗ , X ∗ ) , T −→ T 0 ist ein isometrischer
Isomorphismus.
Beweis II.10 Die Abbildung L(X , Y) 3 T −→ T 0 ∈
L(Y ∗ , X ∗ ) ist linear. Die Aussagen, daß T 0 beschränkt
und obige Abbildung eine Isometrie ist folgen aus der
Rechnung:
kT kL(X ,Y) =
sup
k|xikX =1
kT |xikY =
df
T † = C −1 T 0 C .
Dann gilt für alle |xi, |yi ∈ H:
T † heißt der Hilbert–adjungierte Operator zu T ∈
L(H, H). Es hat sich eingebürgert, einfach vom adjungierten Operator zu sprechen. Wir listen einige Eigenschaften der Abbildung T −→ T † .
Satz II.9 Es gilt mit offensichtlichen Notationen:
(1) T → T † ist ein linearer isometrischer isomorphismus
von L(H) auf L(H).
†
(2) (T S) = S † T † .
(3) T †
†
= T.
(4) Hat T ein beschränktes Inverses, T −1 , so hat auch
−1
T † ein beschränktes Inverses, und es gilt T †
=
−1 †
T
.
2
(5) T † T = kT k .
Beweis II.11 Als Übung. ∗–< [{; 0)
Die folgende Definition ist zentral für die Quantenmechanik, insbesondere für die funktionalanalytische Charakterisierung von Observablen.
Def. II.8 Ein beschränkter Operator T ∈ L(H) auf einem Hilbert–Raum H heißt selbstadjungiert, wenn T =
T † gilt.
!
=
sup
sup
k|xikX =1
khy||Y ∗ =1
|hy|T xi|
=
!
=
=
|(T hy|) (|xi)|
sup
sup
khy|kY ∗ =1
k|xikX =1
sup
kT 0 hy|kX ∗ =
khy|kY ∗ =1
0
=
= kT 0 |kL(Y ∗ ,X ∗ ) .
Die zweite Gleichung benutzt ein Korrolar des Hahn–
Banach Theorems.∗–< [{; 0)
Wir erinnern daran, daß auf Cn , n ∈ N, eine lineare
Transformation genau dann selbstadjungiert ist, wenn in
einer orthonormalen Basis die zugeordnete Matrix invariant ist unter der Komposition von Spiegelung an der
Diagonalen und komplexer Konjugation.
Eine wichtige Klasse von Operatoren auf einem
Hilbert–Raum bilden die sogenannten Projektoren.
Def. II.9 Sei P ∈ L(H). Gilt P 2 := P ◦ P = P , so heißt
P eine Projektion. Gilt zusätzlich P = P † , so heißt P
eine orthogonale Projektion.
10
Bild(P ) ist ein abgeschlossener Unterraum, auf dem P
wie die Identität operiert. Ist P sogar orthogonal, dann
⊥
gilt:P (Bild(P )) = 0. Sei H 3 |xi = |yi + |zi , |yi ∈
⊥
Bild(P ) , |zi ∈ (Bild(P )) , die vom Projektionssatz II.3
garantierte Zerlegung, dann gilt P |xi = |yi. P heißt die
orthogonale Projektion auf Bild(P). Mit anderen
Worten: der Projektionssatz II.3 konstituiert eine bijektive Korrespondenz zwischen orthogonalen Projektionen
und abgeschlossenen Unterräumen. Wir sind ausschließlich an orthogonalen Projektionen interessiert und unterdrücken daher die Qualifikation orthogonal im weiteren.
2.
Das Spektrum
Sei nun T ∈ L(Cn , Cn ) , n ∈ N. Die Eigenwerte von T
sind dann die λ ∈ C mit T − λI = 0. Die Menge dieser λ
heißt das Spektrum von T . Das Spektrum von T kann
höchstens aus n Punkten bestehen, da det(T − λI) ein
Polynom vom Grade n ist. Ist λ kein Eigenwert von T , so
kann T − λI invertiert werden, da dann det(T − λI) 6= 0.
Die Spektraltheorie von Operatoren auf unendlich–
dimensionalen Vektorräumen ist wesentlich interessanter
und extrem relevant für die Charakterisierung der Operatoren selbst (und damit der Observablen, wie wir sehen
werden). Wir werden präziser:
Beweis II.12 Wir beginnen mit dem Beweis von (2).
Zunächst eine kurze Rechnung: Seien λ ∈ C , |xi ∈ H.
Dann ist
2
k[T − (Re(λ) + i Im(λ))] |xik =
2
2
2
= k[T − Re(λ)] |xik + (Im(λ)) k|xik .
2
2
2
Also, k[T − (Re(λ) + i Im(λ))] |xik ≥ (Im(λ)) k|xik .
Für Im(λ) 6= 0 ist daher die Abbildung T − (Re(λ) +
i Im(λ)) injektiv und hat ein beschränktes Inverses auf ihrem Wertebereich, der abgeschlossen ist. Ist nun Bild(T −
(Re(λ) + i Im(λ))) 6= H, so wäre (Re(λ) + i Im(λ)) ∈
σ(T ), im Widerspruch zu obiger Ungleichung. Also ist
(Re(λ) + i Im(λ)) ∈ ρ(T ) für Im(λ) 6= 0. Damit ist (2)
gezeigt. Sei nun Im(λ) = 0 und λ ∈ ρ(T ). Dann wäre
λ∗ = λ ∈ σ(T † ) = σ(T ), im Widerspruch zur Definition
von Punkt– und Residualspektrum, die ja disjunkt sind.
Damit ist (1) gezeigt. (3) überlassen wir einer Übung.
∗–< [{; 0)
Wir charakterisieren nun einige Klassen von relevanten
beschränkten Operatoren.
3.
Positive Operatoren
Def. II.10 Sei T ∈ L(X ). Die Resolventenmenge ρ(T )
von T ist die Menge aller λ ∈ C, für die T − λI bijektiv
ist und ein beschränktes Inverses besitzt. Rλ (T ) = (T −
λI)−1 heißt die Resolvente von T bei λ. Das Spektrum
σ(T ) von T besteht aus allen C 3 λ 3 ρ(T ).
Wir wollen im Folgenden zeigen, daß eine spezielle Darstellung von Operatoren auf Hilbert–Räumen existiert,
die ähnlich der Polardarstellung von komplexen Zahlen
C 3 z = |z| exp (i arg(z)) ist. Dazu benötigen wir ein
Analogon zu den positiven reellen Zahlen.
Wir merken noch an, daß T − λI automatisch ein beschränktes Inverses besitzt, wenn es bijektiv ist. Wir unterscheiden zwei Teilmengen des Spektrums:
Def. II.12 Sei H ein Hilbert–Raum. Ein Operator B ∈
L(H) heißt positiv, wenn hBx|xi ≥ 0 , ∀|xi ∈ H. Wir
schreiben B ≥ 0, wenn B positiv ist und B ≤ A (A ∈ H)
wenn A − B ≥ 0.
Def. II.11 Sei T ∈ L(X ).
(1)
Ein Vektor |xi 6= 0 mit T |xi = λ|xi , λ ∈ C
heißt Eigenvektor von T , und λ heißt der zugehörige Eigenwert. Ist λ ein Eigenwert, dann ist T − λI
nicht injektiv, also ist λ ∈ σ(T ). Die Menge aller
Eigenwerte heißt das Punktspektrum von T .
(2) Ist λ kein Eigenwert und ist Bild(T − λI) nirgends
dicht in X , so gehört λ zum Residualspektrum.
Der Grund warum hier diese Unterscheidung eingeführt wird ist, daß selbstadjungierte Operatoren kein
Residualspektrum besitzen.
Satz II.10 Sei T ∈ L(H) ein selbstadjungierter Operator auf einem Hilbert–Raum H. Dann gilt:
(1) T besitzt kein Residualspektrum.
(2) σ(T ) ⊂ R.
(3) Eigenvektoren zu unterschiedlichen Eigenwerten von
T sind orthogonal zueinander.
Jeder beschränkte positive Operator auf einem komplexen Hilbert–Raum ist selbstadjungiert. Das sehen wir
folgendermaßen ein: Ist A ein positiver Operator, so ist
hAz|zi = hAz|zi∗ = hz|Azi , ∀|zi ∈ H, d.h. hz|Azi ∈ R.
Wir betrachten den Fall |zi = |xi + |yi , |xi, |yi ∈ H. Da
A positiv ist, folgt aus obiger Gleichung Im (hAx|yi) =
Im (hx|Ayi) , ∀|xi, |yi ∈ H. Das kann nur der Fall sein,
wenn Im (hAx|yi) = 0, also hAx|yi = hx|Ayi , ∀|xi, |yi ∈
H. Dies bedeutet aber gerade, daß A selbstadjungiert ist.
Beachten Sie, daß es essentiell war, einen Hilbert–Raum
über dem komplexen Zahlenkörper zu betrachten.
Für jeden Operator A ∈ L(H) gilt: A† A ≥ 0, denn
hA† Ax|xi = kA|xik2 ≥ 0 , ∀|xi ∈ H. In Anlehnung
an
√
√
∗
†
|z| = z z , ∀z ∈ C läge es nun nahe |A| := A A zu
definieren. Dafür müssen wir uns aber versichern, daß wir
Wurzeln aus positiven Operatoren ziehen können. Wir
beginnen mit einem Lemma:
√
Lemma II.4 Die Taylor–Reihenentwicklung von 1 − z
an der Stelle z = 0 konvergiert absolut für z ∈ C mit
|z| ≤ 1.
11
√
2
Beweis II.13 Sei 1 − z = c√
0 + c1 z + c2 z + . . . die
Taylor–Reihenentwicklung
von 1 − z am Ursprung. Da
√
1 − z analytisch ist für |z| < 1, konvergiert
die Reihe
√
für |z| < 1 absolut. Die Ableitungen von 1 − z am Ursprung sind alle negativ, also cj < 0 , N 3 j ≥ 1. Somit
gilt für ein beliebiges N ∈ N
N
X
|cj | = 2 −
j=0
n
X
cj =
j=0
= 2 − lim−
x→1
≤ 2 − lim
x→1−
y
∞
X
n
X
cj x j =
1−x=
= 2y
|cj | ≤ 2 .
j=0
Daraus folgt unmittelbar, daß die Reihenentwicklung für
|z| = 1 absolut konvergiert. ∗–< [{; 0)
Satz II.11 Sei A ∈ L(H) und A ≥ 0. Dann gibt es einen
eindeutig bestimmten Operator B ∈ L(H) mit B ≥ 0 und
B 2 = A.
Beweis II.14 Es genügt den Fall kAk ≤ 1 zu betrachten.
Da kI − ak ≤ 1 ist, folgt auf dem Lemma II.4, daß die
Reihe c0 +c1 (I −A)+c2 (I −A)2 +. . . bezüglich der Norm–
Topologie absolut gegen ein B ∈ L(H) konvergiert. Daher
können wir die Reihe quadrieren und die Terme geeignet
umsortieren und so zeigen, daß B 2 = A. Da weiterhin
0 ≤ I − A ≤ I ist, folgt 0 ≤ hx|(I − A)n xi ≤ 1 , ∀n ∈
N, |xi ∈ H : k|xik = 1. Daher,
hx|Bxi = 1 +
∞
X
≥ 1+
Wir sind jetzt am Ziel:
Satz II.12 Polarzerlegung Sei H ein Hilbert–Raum
und A ∈ L(H) beschränkt. Dann gibt es eine partielle Isometrie U mit der Eigenschaft: A = U |A|. Dabei ist U eindeutig bestimmt aus der Forderung Kern(U ) = Kern(A).
Außerdem ist Bild(U ) = Bild(A).
Beweis II.16 Wir definieren U : Bild(|A|)
Bild(A) , U (|A||xi) := A|xi , |xi ∈ H. Da
k|A| |xik
2
−→
= hx||A|2 |xi = hx|A† A|xi
2
= kA|xik ,
ist U wohl definiert, d.h. wenn |A||xi = |A||yi, dann gilt
A|xi = A|yi. U is eine Isometrie auf Bild(|A|), und induziert auch eine Isometrie auf auf Bild(A). U kann bequem auf ganz H erweitert werden, dazu brauchen wir
lediglich U |ni := 0 , |ni ∈ (Bild(|A|))⊥ ⊂ H. Da |A|
selbstadjungiert ist, ist (Bild(|A|))⊥ = Kern(|A|). Außerdem ist |A||ni = 0 genau dann, wenn A|ni = 0, so daß
Kern(|A|) = Kern(A). Damit gilt: Kern(U ) = Kern(A).
Eindeutigkeit überlassen wir einer Übung. ∗–< [{; 0)
cj hx|(I − A)n xi =
j=1
∞
X
Lemma II.5 Sei U ∈ L(H) eine partielle Isometrie des
Hilbert–Raumes H. Dann ist Pin := U † U die Projektion
auf (Kern(U ))⊥ , und Pfi := U U † ist die Projektion auf
Bild(U ). Umgekehrt, ist U ∈ L(H) und sind U † U und
U U † Projektoren, so ist U eine partielle Isometrie
Beweis II.15 Als Übung.∗–< [{; 0)
j=0
√
Wenn U eine partielle Isometrie ist, dann kann
der Hilbert–Raum H folgendermaßen dargestellt werden: H = Kern(U ) ⊕ (Kern(U ))⊥ und auch H =
Bild(U ) ⊕ (Bild(U ))⊥ . U ist ein unitärer Operator U :
(Kern(U ))⊥ −→ Bild(U ). Und U † ist gerade die Umkehrabbildung, also U † : Bild(U ) −→ (Kern(U ))⊥ .
4.
cj = 0 , ∀|xi ∈ H ,
j=1
wobei wir cj < 0 , N 3 j ≥ 1 und die Abschätzung aus
dem Lemma II.4 benutzt haben. Folglich gilt: B ≥ 0. Eindeutigkeit zeigen wir hier nicht. ∗–< [{; 0)
So, jetzt haben wir alles beisammen:
Def. II.13 Sei A ∈ L(H). Dann |A| :=
√
A† A.
Bitte die Bezeichnung mit Vorsicht genießen: Für A, B ∈
L(H) gilt weder |AB| = |A||B|, noch |A| = |A† |, im
allgemeinen!
Das Analogon zu den komplexen Zahlen auf dem Einheitskreis stellt sich nicht so direkt ein.
Def. II.14 Ein Operator U ∈ L(H) heißt eine Isometrie,
wenn gilt: k|U xik = k|xik , ∀|xi ∈ H. U heißt eine
partielle Isometrie, wenn U eingeschränkt auf den abgeschlossenen Unterraum (Kern(U ))⊥ eine Isometrie ist.
Kompakte Operatoren
Viele Fragestellungen in der Physik sind natürlicher
Weise als Probleme von Differentialgleichungen formuliert. Eine Umformulierung dieser Fragestellungen als
Integralgleichungen erlaubt oft neue Einsichten und
auch deren Beantwortung. Das wohl bekannteste Beispiel in dieser Kategorie ist das weiter unten diskutierte
Dirichlet–Problem. Vorbereitend betrachten wir einen
Operator K ∈ L(C[0, 1]), definiert durch
Z 1
df
(KΦ) (x) =
dy G(x, y)Φ(y) ,
0
wobei die Funktion G(x, y) stetig auf x, y ∈ I := [0, 1] ⊂
R sei. G(x, y) heißt der Integralkern zum Integraloperator K. Es gilt (beachten Sie, daß y ∈ [0, 1])
|(KΦ) (x)| ≤
sup |G(x, y)|
sup |Φ(y)| y
x,y∈I
y kKΦk∞ ≤
y∈I
sup |Φ(y)| kΦk∞ .
y∈I
12
Somit ist K ein beschränkter Operator auf C[0, 1]. Der
Integraloperator K hat eine weitere sehr wichtige Eigenschaft: Bezeichne BM := {Φ ∈ C[0, 1] : kΦk∞ ≤
M } , M ∈ R. Da G(x, y) stetig ist für x, y ∈ I, und weiterhin der I×I kompakt ist, ist G(x, y) sogar gleichmäßig
stetig auf I × I. Also zu einem gegebenen R 3 ε > 0 gibt
es ein R 3 δ > 0, so daß |x − x0 | < δ bereits impliziert
|G(x, y) − G(x0 , y)| < ε , ∀y ∈ I. Ist nun Φ ∈ BM , so folgt
|(KΦ) (x) − (KΦ) (x0 )| ≤
≤ sup |G(x, y) − G(x0 , y)| kΦk∞
y∈I
≤ εM .
Somit sind die Funktionen K[BM ] gleichgradig stetig.
Da sie auch gleichmäßig beschränkt sind durch kKkM ,
kann mit dem Satz von Ascoli gefolgert werden, daß zu
jede Folge Φn ∈ BM , die Folge KΦn eine konvergente
Teilfolge besitzt, wobei der Grenzwert nicht in der Menge K[BM ] liegen muß. Mit anderen Worten: Die Menge
K[BM ] ist präkompakt, d.h. die abgeschlossene Hülle von
K[BM ] ist kompakt in C[0, 1]. Dabei spielt die konkrete
Wahl von M ∈ R keine Rolle, und wir haben gezeigt, daß
der Integraloperator K beschränkte Mengen in präkompakte Mengen abbildet.
Def. II.15 Seien X , Y Banach–Räume. Ein Operator
T ∈ L(X , Y) heißt kompakt, wenn T beschränkte Mengen
in X auf präkompakte Mengen in Y abbildet. Äquivalent,
T heißt kompakt genau dann, wenn für jede beschränkte Folge {xn } ⊂ X , die Folge {T xn } eine konvergente
Teilfolge in Y besitzt.
Bsp. II.6 Neben der oben betrachteten Klasse von Integraloperator spielt die folgende Klasse von Operatoren
eine wichtige Rolle. Sei dim(Bild(T )) < ∞. Also besitzt
|yi ∈ Bild(T ) die folgende Darstellung:
|yi = T |xi =
N
X
αj |ej i ,
wobei N ∈ N, und {|ej i}j={1,...,N } ∈ Y eine vorgegebene Familie von Vektoren ist. Ist {|xn i} eine beschränkte
Folge von Vektoren in X , so sind die Koeffizienten αnj beschränkt, weil T beschränkt ist. Wir können (wie üblich)
eine konvergente Teilfolge von T |xn i isolieren, womit gezeigt ist, daß T kompakt ist.
Banach–Räume und T
Satz II.14 Sei H ein separabler Hilbert–Raum.
Bezüglich der Norm–Topologie, ist jeder kompakte
Operator T ∈ L(H) der Limes einer Folge {Tn } von
Operatoren mit dim(Bild(Tn )) < ∞ , n ∈ N.
Beweis II.17 Der Beweis setzt ein paar mehr topologische Betrachtungen voraus, als wir hier disktutiert haben. Allerdings können wir die essentielle Schlussfolgerung trotzdem würdigen, zumindestens moralisch.
Sei also T ∈ L(H) gegeben. Der konstruktive Teil des
Beweises ist dann lediglich eine kleine Rechnung: Sei
{|ej i}j∈N eine orthonormale Menge in H. Wir betrachten
die Folge
df
Tn =
n
X
T |ej ihej |◦i .
j=1
Offenbar gilt Tn −→ T in der Norm–Topologie. ∗–< [{; 0)
Bisher haben wir noch keine wirklich überzeugende
Motivation für das Studium von kompakten Operatoren
geliefert. Grundsätzlich sind kompakte Operatoren wegen der sogenannten Fredholmschen Alternative von
so großer Bedeutung. Worum geht es dabei? Sei H ein
Hilbert–Raum und A ∈ L(H) kompakt. Dann gilt entweder A|xi = |xi , |xi ∈ H, oder aber (A − I)−1 existiert.
Machen Sie sich klar, daß diese Eigenschaft keineswegs
von allen beschränkten Operatoren geteilt wird.
Satz II.15 (Fredholm) Sei D ⊂ C offen und zusammenhängend, und f : D −→ L(H) eine analytische operatorwertige Funktion mit: f (z) ist kompakt für alle z ∈ D.
Dann gilt genau eine der folgenden Aussagen:
(1) (f (z) − I)−1 ist nicht definiert für z ∈ D.
j=1
Satz II.13 Seien X , Y
L(X , Y).
Satz II.13 zeigt, daß der Grenzwert einer Folge von
Operatoren mit den Spezifikationen von Beispiel II.6 ein
kompakter Operator ist. Gönnen wir uns einen Hilbert–
Raum, so ist auch die Umkehrung war, wie der folgende
Satz besagt.
∈
(1) Ist die Folge {Tn } , Tn ∈ L(X , Y) kompakt und konvergiert gegen T bezüglich der Norm–Topologie, so
ist auch T kompakt.
(2) T ist genau dann kompakt, wenn T 0 kompakt ist.
(3) Sei Z ein Banach–Raum und S ∈ L(Y, Z) und T
oder S kompakt, dann ist auch die Komposition
ST ∈ L(X , Z) kompakt.
(2) (f (z) − I)−1 exisitert für alle z ∈ D \ S, wobei S ⊂ D
diskret ist (d.h. S hat keine Häufungspunkte in D).
(f (z) − I)−1 ist dann meromorph in D, analytisch
in D \ S, und für die Residuen an den isolierten
Polstellen zp ∈ S gilt: dim(Bild(f (zp ))) < ∞. Ist
z ∈ S, so besitzt f (z)|xi = |xi eine von Null verschiedene Lösung in H.
Beweis II.18 Wir zeigen, daß in einer Umgebung von
z0 ∈ D entweder (1) oder (2) gilt. Wegen der geforderten
Zusammenhangseigenschaft von D kann diese Aussage
dann auf ganz D ausgeweitet werden. Sei also z0 ∈ D gegeben. Wir wählen ein r ∈ R so, daß aus |z−z0 | < r folgt:
kf (z) − f (z0 )k < 1/2, und einen Operator F ∈ L(H)
mit dim(Bild)(F ) < ∞, so daß kf (z0 ) − F k < 1/2. Für
z ∈ Dr := {z ∈ D : |z−z0 | < r} gilt dann kf (z)−F k < 1.
Wir entwickeln nun (f (z) − F − I)−1 in eine geometrische Reihe und sehen, daß (f (z) − F − I)−1 existiert und
analytisch ist.
13
Da nach Wahl dim(Bild)(F ) < ∞, gibt es Vektoren |x1 i, . . . , |xn i , N 3 n := dim(Bild)(F ), so daß jedes |yi ∈PH folgendermaßen dargestellt werden kann:
n
F (|yi) = j=1 αj (|yi)|xj i. Hierbei sind αj (◦) beschränkte lineare Funktionale auf H. Daher folgt mit dem Satz
von Riesz II.4,
es Vektoren |y1 i, . . . , |yn i ∈ H gibt
Pdaß
n
mit F (|yi) = j=1 |xj ihyj |yi , ∀|yi ∈ H. Wir definieren
den φj (z) := ((f (z) − F − I))∗ |yj i , N 3 j ∈ {1, . . . , n}
und
Pn
df
−1
g(z) = F (f (z) − F − I) = j=1 |xj ihφj (z)|◦i .
Nun schreiben wir umständlich
(f (z) − I) = F (g(z) − I) (f (z) − F − I) .
Also ist f (z) − I , z ∈ Dr genau dann invertierbar, wenn
g(z)−I , z ∈ Dr invertierbar ist. Die Gleichung f (z)|xi =
|xi besitzt somit genau dann eine von Null verschiedene
Lösung, wenn g(z)|yi = |yi eine nicht–triviale Lösung
besitzt.
Pn
Gilt nun g(z)|yi = |yi, dann ist |yi = j=1 βj |yj i und
die Koeffizienten βj ∈ C erfüllen folgende Bestimmungsgleichung:
βn =
n
X
hφn (z)|xj iβj .
(37)
j=1
Umgekehrt,
Pn hat (37) eine Lösung (β1 , . . . , βn ), so ist
|yi = j=1 βj |xj i eine Lösung von g(z)|yi = |yi. Folglich hat g(z)|yi = |yi genau dann eine nicht–triviale
Lösung, wenn
df
d(z) = det [δab − hφa (z)|xb i] = 0 .
Mit hφa (z)|xb i ist auch d(z) analytisch in Dr . Damit
ist klar, daß entweder Sr := {z ∈ Dr : d(z) = 0} eine diskrete Menge ist, oder Sr = Dr . Sei d(z) 6= 0 und
|xi ∈ H gegeben. Wir suchen eine Lösung der
PGleichung
n
(g(z) − I)|yi = |xi. Der Ansatz |yi = |xi + j=1 βj |xj i
ist erfolgreich, vorausgesetzt, die Koeffizienten lösen
βa = hφa (z)|xi +
n
X
hφa (z)|xj iβj .
(38)
Satz II.16 (Satz von Riesz & Schauder) Sein A ∈
L(H) kompakt. Dann ist das Spektrum σ(A) eine diskrete
Menge mit höchstens einem Häufungspunkt bei λ = 0.
Jeder von Null verschiedene Eigenwert λ ∈ σ(A) gehört
zu endlich vielen Eigenvektoren.
Satz II.17 (Hilbert–Schmidt Theorem) Sei A ∈
L(H) selbstadjungiert und kompakt. Dann gibt es eine vONB {|ej i}j∈N für den Hilbert–Raum H, so daß
A|ej i = λj |ej i und λj −→ 0 für j −→ ∞.
Beweis II.20 Für jeden Eigenwert von A ∈ L(H)
wählen wir eine ONB für die zugehörigen Eigenvektoren. Die Familie aller dieser Vektoren, {|ej }j∈N ist eine
orthonormale Menge, da Eigenvektoren zu unterschiedlichen Eigenwerten orthogonal zueinander sind. Sei M :=
Spann({|ej i}). Da A nach Voraussetzung selbstadjungiert ist und A ∈ L(M), ist auch A ∈ L(M⊥ ). Es bezeichne B die Restriktion von A auf M⊥ . Als Restriktion
ist B selbstadjungiert und kompakt. Nach dem Satz von
Riesz und Schauder gilt: ist λ 6= 0 in σ(B), so ist λ ein
Eigenwert von B und damit auch von A. Der Spektralradius von B, r(B) := supλ∈σ(B) |λ|, ist daher Null, denn
jeder Eigenvektor von A (dies schliesst die Eigenvektoren
von B ein) ist in M. Daher korrespondiert B zur Null–
Abbildung (Null–Operator) auf M⊥ . Also ist M⊥ = ∅,
denn |xi ∈ M⊥ bedeutet A|xi = 0, und daraus folgt
|xi ∈ M. Damit gilt M = H.
Die Aussage λj −→ 0 ist eine Folge des Satzes von
Riesz und Schauder. Der erste Teil dieses Satzes besagt
ja, daß jeder von Null verschiedene Eigenwert nur zu
endlich vielen Eigenvektoren gehört und der einzig mögliche Häufungspunkt von {λj } die Null ist. ∗–< [{; 0)
Satz II.18 (Kanonische Form kompakter Operatoren) Sei A ∈ L(H) kompakt. Dann gibt es (nicht
notwendigerweise vollständige) orthonormale Mengen
{|ej i}j∈I , {|fj i}j∈I , I ⊂ N, und {λj }j∈I , λj ∈ R+ ∀j ∈
I mit λj −→ 0, so daß
X
A =
λj hej |◦i|fj i .
(39)
j∈I
Die Summe (39) konvergiert bezüglich der Norm–
Topologie.
j=1
Da d(z) 6= 0 angenommen wurde, hat (38) eine Lösung.
Also existiert (g(z)−I)−1 . Die Aussage, daß die Residuen
von endlichem Rang sind, folgt aus (38). ∗–< [{; 0)
Der Satz von Fredholm hat vier wichtige Konsequenzen:
Lemma II.6 (Die Fredholmsche Alternative) Sei
A ∈ L(H) kompakt. Dann gilt: Entweder (A − I)−1 existiert, oder A|xi = |xi , |xi ∈ H hat eine von Null verschiedene Lösung.
Beweis II.19 Wir benutzen den Satz von Fredholm für
f (z) := zA an der Stelle z = 1. ∗–< [{; 0)
Beweis II.21 Mit A ist nach Satz II.13 auch A† A kompakt. Außerdem ist A† A selbstadjungiert. Der Satz von
Hilbert und Schmidt garantiert dann die Existenz einer
orthonormalen Menge {|ej i}j∈I mit der hübschen Eigenschaft: A† A|ej i = µj |ej i , µj ∈ R , j ∈ I, und
A† A ist der Null–Operator auf dem Unterraum orthogonal zu Spann({|ej i}j∈I ). Da A† A > 0, ist µj > 0. Sei
√
λj := + µj und |fj i := A|ej i/λj . Eine kurze Rechnung
ergibt:
X
A|xi =
λj hej |xi|fj i .
j∈I
Der Beweis zeigt, daß die Koeffizienten λj gerade die Eigenwerte von |A| sind. ∗–< [{; 0)
14
Bsp. II.7 (Dirichlet–Problem) Im nächsten Semester werden Sie sich ausführlich mit dem Dirichlet–
Problem in der Elektrostatik auseinandersetzen. Es stellt
eine gute Motivation für das Studium von kompakten
Operatoren dar. Kompakte Operatoren treten auf die
Bühne, wenn klassische Randwertprobleme durch Integralgleichungen gelöst werden wollen. Sei D ⊂ R3 offen
und beschränkt mit einem glatten Rand ∂D (Oberfläche).
Das Dirichlet–Problem für die Lalace–Gleichung ist
wie folgt gegeben: gegeben sei eine stetige Funktion f :
∂D −→ R. Wir suchen eine zweimal stetig differenzierbare Funktion u : D −→ R, die auch stetig auf D sein
soll, so daß
∆u(x) = 0 , x ∈ D ,
u(x) = f (x) , x ∈ ∂D .
(40)
Es bezeichne n(y) die nach außen weisende Normale zu ∂D am Punkt y ∈ ∂D. Sei G(x, y) := hx −
y, n(y)i/8π|x − y|3 . Als Funktion von x löst G(x, y) die
Laplace–Gleichung ∆(x)G(x, y) = 0 , x ∈ D. Da die
Laplace–Gleichung linear ist, schreiben wir ihre Lösung
formal als Superposition
Z
d2 S(y) G(x, y)Q(y) ,
u(x) =
wobei dann ein h ∈ C(∂D) existiert mit (T − I)h = 0,
oder aber (T − I)Q = f hat eine eindeutige Lösung
für jedes f ∈ C(∂D). Ist u definiert wie in (41), wobei jetzt Q durch h ersetzt wird, so ist u ≡ 0 , ∀x ∈ D.
Da weitherin ∇n u stetig ist bei Randdurchquerung, gilt
auch ∇n u ≡ 0 , ∀x ∈ ∂D. Partielle Integration zeigt, daß
u ≡ 0 außerhalb ∂D. Daher liefern (41) und (42) die
Bedingung: 2h(x) ≡ 0 , ∀x ∈ ∂D. Damit ist die erste Alternative obsolet, und wir finden tatsächlich Quellen, die
mit den möglichen Randbedingungen verträglich sind.
5.
Spurklasse–Operatoren
Wir haben im letzten Abschnitt gelernt, daß kompakte
Operatoren schöne Eigenschaften haben, die sie auch sehr
nützlich in Anwendungen machen. Ein naheliegende Motivation ist somit, effiziente Kriterien zu finden, die es uns
praktisch und einfach erlauben, Operatoren dieser Klasse
zu identifizieren. Das Ergebnis können wir bereits vorweg nehmen, weil es sich an unsere Betrachtungen schön
anschließt: Wir werden zeigen, daß ein Integraloperator
T ∈ L(L2 (M, dµ)), definiert durch
∂D
Z
wobei Q ∈ C(∂D) Quellen auf dem Rand beschreibt
(z.B. elektrische Ladungen), und dS(y) das übliche Oberflächenmaß bezeichne. Mit Sicherheit macht das Integral
in (41) Sinn für x ∈ D, tatsächlich gilt ∆u(x) = 0 , x ∈
D. Aber wie schaut die Situation auf dem Rand aus? Sei
x0 ∈ ∂D und wir lassen x −→ x0 , x ∈ D. Es kann gezeigt
werden, daß
Z
u(x) −→ −Q(x0 ) +
d2 S(y) G(x0 , y)Q(y) . (41)
∂D
Für x −→ x0 , x ∈ R3 \ D erhalten wir
Z
u(x) −→ +Q(x0 ) +
d2 S(y) G(x0 , y)Q(y) . (42)
(T Q) (x) =
dµ(y) G(x, y)Q(y) ,
M
kompakt ist, wenn K(◦, ◦) ∈ L2 (M × M, dµ ⊗ dµ).
Dazu bedarf es einiger Vorbereitung, die auch recht
instruktiv ist. Insbesondere wollen wir das Konzept der
Spur aus der gewöhnlichen Linearen Algebra auf L(H)
übertragen. Offenbar involviert dies aber unendliche Reihen, weshalb sich die Spur nicht für alle Operatoren definieren läßt.
Satz II.19 Sein H ein separabler Hilbert–Raum und
{|ej i}j∈N eine vONB. Für jeden Operator L(H) 3 A ≥ 0
definieren wir
∂D
Da Q ∈ C(∂D), ist auch das Integral als Funktion von
x vom Typ C(∂D). Dies folge im wesentlichen aus der
Voraussetzung, daß der Rand glatt sein soll. Daher gilt:
Für x, y ∈ ∂D ist hx − y, n(y)i ∝ |x − y|2 im Limes
x −→ y.
Die entscheidende Frage ist, ob wir Quellen Q finden
können, so daß u(x) = f (x) , x ∈ ∂D, also
Z
f (x) = −Q(x) +
d2 S(y) G(x, y)Q(y) , x ∈ ∂D .
df
Sp (A) =
∞
X
hej |Aej i .
j=1
Die Zahl Sp(A) heißt die Spur von A und ihr Wert ist
unabhängig von der gewählten vONB. Die Spur hat folgende Eigenschaften: Für alle L(H) 3 A, B ≥ 0 , λ ∈ R+
gelten
(1) Sp(A + B) = Sp(A) + Sp(B).
∂D
Dazu definieren wir T : C(∂D) −→ C(∂D) durch
Z
df
(T Q) (x) =
d2 S(y) G(x, y)Q(y) .
∂D
T ist beschränkt und kompakt (zeigen wir hier nicht).
Nun hilft uns die Fredholmsche Alternative, die ja garantiert, daß entweder λ = 1 im Punktspektrum σ(T ) liegt,
(2) Sp(λA) = λSp(A).
(3) Sp(U AU −1 ) = Sp(A) , ∀U ∈ L(H) : U † = U −1 .
(4) Für 0 ≤ A ≤ B ist Sp(A) ≤ Sp(B).
Beweis II.22 Wir zeigen zuerst, daß die Definition
nicht von der gewählten vONB abhängt. Seien {|ej i}j∈N
15
und {|fj i}j∈N zwei vONB. Mit offensichtlichen Bezeichnungen rechnen wir nach:
∞
∞ E2
X
X
√
Sp|ei (A) =
hej |Aej i =
Aej =
j=1
j=1
ED √
E2
fi Aej =
=
j=1 i=1
!
∞
∞ D E2
X
X
√
=
=
fi Aej ∞ ∞ X
X
=
fi
j=1
i=1
∞
X
∞ D
E2
X
√
Afi ej j=1
i=1
=
∞
X
i=1
i=1
E2
√
Afi =
N
N
X
X
hej |U † V |A|ej i =
h|A|1/2 V † U ej | |A|1/2 ej i =
j=1
j=1
N X
1/2 †
≤
|A| V U |ej i · |A|1/2 |ej i =
j=1

1/2 
1/2
N N 2
2
X
X
1/2
1/2 †
≤
|A| |ej i 
|A| V U |ej i  
=
hfi |Afi i =
= Sp|f i (A) .
Die Summen durften vertauscht werden, da alle Summanden positiv sind.
Die Eigenschaften (1), (2) und (4) überlassen wir einer Übung. Es bleibt der Beweis von (3). Dazu bemerken
wir, daß mit {|ej i}j∈N auch {|U ej i}j∈N eine vONB ist.
Daher gilt
Sp U AU −1 = Sp|U ei U AU −1 = Sp|ei (A) = Sp(A) .
Das war es auch schon. ∗–< [{; 0)
Def. II.16 A ∈ L(H) heißt Spurklasse–Operator genau
dann, wenn Sp(|A|) < ∞. Die Familie von Spurklasse–
Operatoren wird mit F1 bezeichnet.
Die Definition läßt eine strukturelle Relevanz dieser
Operatorklasse vermuten, weshalb wir die wichtigen Eigenschaften von F1 darlegen wollen:
1/2

N 2
X
1/2
.
=
|A|1/2 V † U |ej i  · (Sp(|A|))
Wir müssen uns um den ersten Faktor in der letzten Zeile
kümmern, was wir sogleich tun: Zunächst erinnern daran, daß U eine partielle Isometrie ist, d.h. U ist eine Isometrie auf (Kern(U ))⊥ . Jeder Vektor der vONB
{|ej i}j∈N ist entweder in Kern(U ) oder im orthogonalen
Komplement (Kern(U ))⊥ . Also
N 2
X
1/2 †
|A| V U |ej i ≤ Sp|ei U † V |A|V † U =
j=1
≤ Sp{U |ei} V |A|V † .
Wir iterieren unser letztes Argument ein weiteres Mal:
Jeder Vektor U |ej i ∈ (Kern(U ))⊥ ist entweder in
Kern(V † ) oder in (Kern(V † ))⊥ . Daher gilt weiter:
N 2
X
1/2 †
|A| V U |ej i ≤ Sp{V † U |ei} (|A|) ≤ Sp(|A|) < ∞ .
j=1
Einsetzen in (80) liefert
N
X
hej |U † V |A|ej i ≤ Sp(|A|) < ∞ .
j=1
(1) F1 ist ein Vektorraum.
(2) Ist A ∈ F1 und B ∈ L(H), so ist auch AB, BA ∈ F1 .
(3) Ist A ∈ F1 , so ist auch A† ∈ F1 .
Beweis II.23 Wir beginnen mit dem Beweis von (1).
Für λ ∈ C gilt |λA| = |λ||A|, also ist F1 abegeschlossen
unter Multiplikation mit Skalaren. Seien A, B ∈ F1 . Der
Beweis, daß dann auch A + B ∈ F1 ist langwieriger.
Es seien U, V, W die partiellen Isometrien zu folgenden
Polarzerlegungen: A + B = U |A + B| , A = V |A| , B =
W |B|. Dann ist (zunächst für endliche Reihen)
N
N
X
X
hej | |A + B|ej i =
hej |U † (A + B)ej i =
≤
(43)
j=1
Satz II.20 F1 ist ein †–Ideal in L(H), d.h.
j=1
j=1
j=1
!
2
∞ X
E
X
∞ ED √
=
ej ej Afi =
i=1 j=1
∞ X
Wir schätzen die erste Summe auf der rechten Seite der
Ungleichung ab (mit der zweiten verfahren wir genauso):
j=1
N
X
N
X
hej | U † V |A|ej i +
hej | U † W |B|ej i .
j=1
j=1
Insgesamt ergibt sich so endlich
N
X
hej | |A + B|ej i ≤ Sp(|A|) + Sp(|B|) < ∞ .
j=1
Damit haben wir gezeigt, daß mit A, B ∈ F1 auch A+B ∈
F1 , und (1) is bewiesen.
Wir kommen nun zum Beweis von (2). Zunächst einmal zeigen wir, daß jeder Operator B ∈ L(H) als Linearkombination von vier unitären Operatoren geschrieben
werden kann. Es gilt: B = (B + B † )/2 − i(B − B † )/2, also B kann als Linearkombination zweier selbstadjungierter Operatoren geschrieben werden. Sei nun C ∈ L(H)
selbstadjungiert, und ohne Einschränung
der Allgemein√
2 unitäre Operatoheit kCk ≤ 1. Dann sind C
±
i
I
−
C
√
√
ren und es gilt: C = (C +i I − C 2 )/2+C −i I − C 2 /2.
16
Nach dieser Vorarbeit genügt es zu zeigen: Mit A ∈ F1
ist auch√U A, AU ∈ F1 , U ∈ L(H) : U † = U −1 . Es ist
|U A| = A† U † U A = |A|, also U A ∈ F1 . Zeigen Sie, daß
|AU | = U −1 |A|U . Mit (II.19) folgt nun |AU | ∈ F1 .
Es bleibt (3) zu beweisen. Seien A = U |A| und A† =
V |A† | die Polarzerlegungen von A und A† . Dann gilt:
|A† | = V † A† = V † |A|U † . Ist A ∈ F1 , so ist auch |A| ∈
F1 . Wegen (2) ist dann auch |A† | ∈ F1 . Und damit auch
A† = V |A† | ∈ F1 . ∗–< [{; 0)
Satz II.21 Sei k◦k1 definiert durch: kAk1 := Sp|A| , A ∈
F1 . Damit wird F1 zu einem Banach–Raum mit Norm
k ◦ k1 . Es gilt kAk ≤ kAk1 .
Der Zusammenhang zwischen den Spurklasse–
Operatoren und den kompakten Operatoren ist folgender:
Satz II.22 Jeder Operator A ∈ F1 ist kompakt. Ein
kompakter
Operator A ist in F1 genau dann, wenn
P∞
λ
<
∞,
wobei λj die Eigenwerte von |A| bezeichj
j=1
ne.
Beweis II.24 Sei A ∈ F1 . Dann ist auch |A|2 ∈ F1 .
Daher gilt bzgl. einer beliebigen vONB {|ej i}j∈N :
Sp |A|2
=
∞
X
2
kA|ej ik < ∞ .
j=1
Sei nun |f i ∈ {|e1 i, . . . , |en i}⊥ , n ∈ N und k|f ik = 1.
Dann ist
2
kA|f ik
n
X
2
≤ Sp |A|2 −
kA|ej ik ,
j=1
da {|e1 i, . . . , |en i, |f i} immer zu einer ONB vervollständigt werden kann. Also,
n→∞
sup kA|f ik : |f i ∈ {|e1 i, . . . , |en i}⊥ , k|f ik = 1 −→ 0 .
Satz II.24 Seien A, B ∈ F2 und C ∈ L(H) kompakt,
außerdem sei T ∈ L(H) mit dim(Bild)(T ) < ∞, und
{|ej i}j∈N eine beliebige vONB. Wir definieren
df
(A, B)2 =
∞
X
hej |A† Bej i .
j=1
Dies ist sinnvoll, da die Definition nicht vonp
der gewähl(A, A)2 =
ten
vONB
abhängt.
Weiterhin
sei
kAk
:=
2
p
Sp(A† A). Schließlich bezeichnen wir die Eigenwerte
von |A| mit λj . Dann gilt:
(1) F2 ist ein †–Ideal.
(2) Die Reihe (A, B)2 ist absolut summierbar.
(3) Mit (◦, ◦)2 wird F2 zu einem Hilbert–Raum.
(4) kAk ≤ kAk2 kAk1 und kAk2 = kA† k2 .
(5) Jeder A ∈ F2 ist kompakt.
(6) C ∈ F2 genau dann, wenn
P∞
j=1
λ2j < ∞.
(7) T liegt dicht in F2 bzgl. der Norm k ◦ k2 .
(8) A ∈ F2 genau dann, wenn {A|ej i}j∈N ∈ `2 .
(9) Z ∈ F1 genau dann, wenn Z = AB.
Eine wichtige Tatsache über F2 ist, daß im Falle H =
L2 (M, dµ) sich der Hilbert–Raum F2 konkret realisieren
läßt.
Satz II.25 Sei (M, µ) ein Maßraum und H =
L2 (M, dµ). Dann ist A ∈ L(H) genau dann ein Hilbert–
Schmidt Operator, wenn es eine Funktion G ∈ L2 (M ×
M, dµ ⊗ dµ) gibt mit der Eigenschaft
Z
(AQ) (x) =
dµ(y) G(x, y)Q(y) ,
M
Z
2
kAk22 =
dµ(x)dµ(y) |G(x, y)| .
M×M
Pn
Damit konvergiert
j=1 A|ej ihej |◦i gegen A bezüglich
der durch die Norm induzierten Topologie. Somit ist A
kompakt. Der zweite Teil des Satzes folgt aus der kanonischen Form kompakter Operatoren und der Beweis bleibt
Ihnen überlassen. ∗–< [{; 0)
Satz II.23 T ∈ L(H) mit dim(Bild)(T )∞ liegen dicht
in F1 bzgl. der Norm k ◦ k1 .
Beweis II.25 Sei G ∈ L2 (M × M, dµ ⊗ dµ) und AG der
assoziierte Integraloperator. Überzeugen Sie sich, daß AG
wohldefiniert ist und kAG k ≤ kGkL2 .
Sei {ej (x)}j∈N eine vONB von L2 (M, dµ). Dann ist
{ei (x)e∗j (y)}i,j∈N eine vONB für L2 (M × M, dµ ⊗ dµ).
Daher,
G(x, y) =
Def. II.17 T ∈ L(H) heißt Hilbert–Schmidt Operator
genau dann, wenn Sp(T † T ) < ∞. Die Familie von
Hilbert–Schmidt Operatoren notieren wir mit F2 .
Ganz ähnliche Argumente wie wir sie zur Charakterisierung von F1 herangezogen haben, führen auf
∞
X
αij ei (x)e∗j (y) .
i,j=1
Wir definieren
Gn (x, y) =
n
X
i,j=1
αij ei (x)e∗j (y) .
17
Per Konstruktion ist Gn , n ∈ N ein Integralkern zu einem Operator AGn mit dim(Bild(AGn )) < ∞. In der
Tat,
AG n =
n
X
αij ei (x)(ej (y), ◦) .
i,j=1
Aus kGn − GkL2 −→ 0 folgt kAGn − AG k −→ 0 im Limes
n −→ ∞. Somit ist AG kompakt, was wir auch folgendermaßen einsehen:
∞
X
Sp AG† AG =
kAG ej k2 =
=
j=1
∞
X
2
|αij | = kGkL2 .
i,j=1
Also ist AG ∈ F2 (und daher kompakt) und kAG k2 =
kGkL2 .
Wir haben gezeigt, daß die Abbildung G −→ AG eine
isometrische Einbettung von L2 (M × M, dµ ⊗ dµ) in F2
ist. Zeigen Sie, daß das Bild von G −→ AG sogar F2 ist.
∗–< [{; 0)
Bitte beachten Sie, daß obiger Satz eine hinreichende
Bedingung für die Eigenschaft Kompaktheit eines Operators liefert, die sehr nützlich, allerdings nicht notwendig
ist. Ebenfalls haben wir eine hinreichende Bedingung für
die Qualifikation, daß ein Operator ein Integraloperator
ist, aber auch diese ist nicht hinreichend.
Satz II.26 Sei A ∈ F1 P
und {|ej i}j∈N eine beliebige
∞
vONB. Dann konvergiert j=1 hej |Aej i absolut und der
Grenzwert ist unabhängig von der vONB–Wahl.
Beweis II.26 Als Übung. ∗–< [{; 0)
Def. II.18PDie Abbildung Sp : F1 −→ C, definiert durch
∞
Sp(A) =
j=1 hej |Aej i, wobei {|ej i}j∈N eine beliebige
vONB sei, heißt die Spur.
E.
Der Spektralsatz für beschränkte Operatoren
Der Spektralsatz ist eine konkrete Beschreibung der
strukturellen Eigenschaften aller selbstadjungierter Operatoren. Diese strukturelle Aufklärung existiert in verschiedenen Formulierungen, die aus zunächst ganz unterschiedlichen Standpunkten resultieren, aber in der
Charakterisierung der maßgeblichen Struktur äquivalent
sind.
Wir schränken uns zunächst auf beschränkte selbstadjungierte Operatoren ein, um dann im nächsten
Unterkapitel von der Qualifikation beschränkt hin zu
unbeschränkt zu relaxieren. Der für uns vielleicht
zweckmässigste Standpunkt ist folgender: Sei A ∈
L(H) , A† = A beschränkt auf dem Hilbert–Raum H.
Dann gibt es immer ein Maß µ auf einem Maßraum M
und ein U ∈ L(H) , U † = U −1 , erklärt durch
U : H −→ L2 (M, dµ) ,
U AU −1 f (x) = F (x)f (x) ,
wobei F eine beschränkte reellwertige meßbare Funktion
auf M ist.
Dieser Standpunkt ist so attraktiv, weil er eine Verallgemeinerung des entsprechenden Sachverhaltes liefert,
der uns aus der Linearen Algebra bekannt ist für endlichdimensionale Vektorräume: Jede selbstadjungierte n ×
n(n ∈ N) Matrix ist diagonalisierbar. Genauer: Sei V
ein Vektorraum über C und A : V −→ V eine selbstadjungierte lineare Abbildung. Dann gibt es eine unitäre
lineare Abbildung U : V −→ Cn und reelle Zahlen
λ1 , . . . , λn ∈ R, so daß
U AU −1 v j = λj vj , j ∈ {1, . . . , n} ,
für jeden Vektor Cn 3 v = (v1 , . . . , vn ).
In der Physik wird M in aller Regel eine Vereinigung von Kopien von R sein und F ≡ x. Das Hauptaugenmerk liegt daher auf der Konstruktion geeigneter Maße. Bevor wir diesen Weg gedanklich beschreiten,
beschäftigen wir uns im folgenden Abschnitt damit, wie
wir h : L(H) −→ L(H) sinnvoll erklären für stetige Funktionen h angewandt auf selbstadjungierte beschränkte
Operatoren.
Wir listen die relevanten Eigenschaften:
Satz II.27 Für A ∈ F1 , B ∈ L(H) gilt:
(1) Sp(◦) ist linear.
(2) Sp(A† ) = (Sp(A))∗ .
(3) Sp(AB) = Sp(BA).
Beweis II.27 Die Aussagen (1) und (2) folgen unmittelbar aus der Spur–Definition und aus der Definition des
Hilbert–adjungierten Operators. Den Beweis der Aussage
(3) überlassen wir einer Übung. ∗–< [{; 0)
1.
Stetiges Funktionalkalkül
Die dringlichste Frage ist wohl: gegeben ein beschränkter Operator A ∈ L(H) ohne weitere Qualifikation. Für
welche Funktionen f : L(H) −→ L(H) können wir f (A)
überhaupt definieren? Zunächst einmal naiv, lassen Sie
uns eine Wunschliste aufstellen. Bestimmt hätten
PNwir aus
Bequemlichkeit gerne Folgendes: Sei f (x) = j=1 aj xj
PN
ein Polynom, dann soll f (A) = j=1 aj Aj sein. Nehmen
P∞
j
wir einmal an, daß f (x) =
j=0 cj x eine Potenzreihe mit Konvergenzradius
R ist. Falls kAk < R, dann
P∞
konvergiert j=0 cj Aj in L(H), also ist es nur natürlich
18
P∞
f (A) = j=0 cj Aj zu setzen. Beachten Sie, daß in diesem Fall f analytisch auf einem Definitionsbereich ist,
der ganz σ(A) beinhaltet.
Welche strukturelle Unterstützung kommt nun von der
Qualifikation selbstadjungiert? Sei P ein Polynom und
A ∈ L(H) , A† = A beschränkt. Dann ist kP (A)k =
supλ∈σ(A) |P (λ)|. Dann erlaubt der zentrale Satz über beschränkte lineare Transformationen4 , das oben skizzierte
Funktionalkalkül auf stetige Funktionen auszuweiten.
Wir beginnen mit einem Lemma, das wieder für beschränke aber sonst beliebe Operatoren A gilt:
PN
j
Lemma II.7 Sei P (x) =
j=0 aj x , und P (A) =
PN
j
j=0 aj A . Dann gilt σ(P (A)) = {P (λ) : λ ∈ σ(A)}.
Beweis II.28 Sei λ ∈ σ(A). Da x = λ eine Nullstelle
von P (x) − P (λ) ist, folgt P (x) − P (λ) = (x − λ)Q(x),
und damit P (A) − P (λ) = (A − λ)Q(A). Da (A − λ)
nicht invertiert werden kann, besitzt auch P (A) − P (λ)
kein Inverses. Damit ist aber P (λ) ∈ σ(P (A)).
Umgekehrt, sei µ ∈ σ(P (A)) und λ1 , . . . , λN die Nullstellen von P (x) − µ. Dann gilt P (x) − µ = a(x −
λ1 ) · · · (x − λN ). Wäre nun λ1 , . . . , λN 3 σ(A), so existierte
−1
(P (A) − µ)
−1
= a−1 (A − λ1 )
−1
· · · (A − λN )
.
Dies kann aber nicht sein, da nach Voraussetzung µ ∈
σ(P (A)). Also gibt es wenigstens ein i ∈ {1, . . . , N } mit
λi ∈ σ(A), also µ = P (λ) für ein λ ∈ σ(A). ∗–< [{; 0)
Wir brauchen noch ein weiteres Lemma. Hier wird ganz
wesentlich benutzt, daß für selbstadjungierte Operatoren
A der Spektralradius, r(A) := supλ∈σ(A) |λ|, gleich der
Norm von A ist, also r(A) = kAk, was wir nicht zeigen,
aber zum Beweis des folgenen Lemmas benutzen werden.
Lemma II.8 Sei A ein beschränkter selbstadjungierter
Operator, und P ein Polynom. Dann gilt: kP (A)k =
supλ∈σ(A) |P (λ)|.
Beweis II.29 Wir rechnen:
!
2
kP (A)k = P (A)† P (A) = k(P ∗ P ) (A)k =
=
=
sup
II.7
|λ| =
λ∈σ(P ∗ P (A))
∗
sup |P P (λ)| =
λ∈σ(A)
!2
=
sup |P (λ)|
.
λ∈σ(A)
Daraus folgt unmittelbar die Behauptung. ∗–< [{; 0)
Jetzt sind wir endlich in der Lage, obige Frage zu beantworten.
Satz II.28 (Stetiges Funktionalkalkül) Sei H ein
Hilbert–Raum und A ∈ L(H) selbstadjungiert. Dann gibt
es genau eine Abbildung Φ : C(σ(A)) −→ L(H) mit den
folgenden Eigenschaften:
(1) Φ ist ein algebraischer †–Homomorphismus, d.h.
Φ(f g)
Φ(λf )
Φ(1)
Φ(f ∗ )
Zur Erinnerung: Sei T eine beschränkte lineare Transformation
von einem normierten Vektorraum (V1 , k◦k1 ) in einen vollständigen normierten Raum (V2 , k ◦ k2 ). Dann kann T eindeutig erweitert werden zu einer beschränkten linearen Transformation, T̂ ,
die die Vervolständigung von V1 auf (V2 , k ◦ k2 ) abbildet.
Φ(f )Φ(g) ,
λΦ(f ) (λ ∈ C) ,
I,
Φ(f )† .
(2) Φ ist stetig, d.h. kΦ(f )kL(H) ≤ Ckf k∞ , C ∈ R.
(3) Sei f die Funktion f (x) = x, dann ist Φ(f ) = A.
(4) Gilt A|ψi = λ|ψi, so ist Φ(f )|ψi = f (λ)|ψi.
(5) σ[Φ(f )] = {f (λ) : λ ∈ σ(A)}.
(6) Ist f ≥ 0, so ist Φ(f ) ≥ 0.
(7) kΦ(f )k = kf k∞ .
Die Idee für den Beweis von Satz II.28 ist ganz einfach. Zunächst einmal ist Φ(P ) für jedes Polynom P (x)
wegen (1) und (3) eindeutig bestimmt. Lemma II.7 ist
bereits ein Spezialfall der zentralen Gleichung (5). Der
Satz von Weierstrass liefert uns sofort folgenden Befund:
Die Menge der Polynome ist dicht in C(σ(A)). Im Zentrum des Beweises steht daher die Aussage von Lemma
II.8. Denn mit der Fußnote 4 folgt dann bequem die Existenz und Eindeutigkeit der Abbildung Φ.
Beweis II.30 Sei P ein Polynom und Φ(P ) = P (A).
Dann ist kΦ(P )kL(H) = kP kC(σ(A)) . Somit hat Φ genau
eine lineare Erweiterung auf die abgeschlossene Hülle der
Polynome in C(σ(A)). Die Polynome bilden eine Algebra,
die die 1 enthält, abgeschlossen unter komplexer Konjugation ist, und die die Punkte von σ(A) separiert. Damit
ist die abgeschlossene Hülle der Polynome ganz C(σ(A)).
Die Aussagen (1), (2), (3), (7) folgen direkt. Für (4) bemerken wir: Φ(P )|ψi = P (A)|ψi = P (λ)|ψi. Diese Tatsache läßt sich wegen der Stetigkeit auf ganz C(σ(A)) ausdehnen. Für (6) bemerken wir: Sei f ≥ 0yf = g 2 , g ∈
C(σ(A)) reell. Folglich ist Φ(f ) = Φ(g 2 ) = Φ(g)Φ(g) und,
da Φ(g) selbstadjungiert ist, weiter Φ(f ) = Φ(g)† Φ(g) ≥
0. Die Aussage (5) überlassen wir einer Übung (einen
Spezialfall haben wir ja in II.7 betrachtet). ∗–< [{; 0)
2.
4
=
=
=
=
Die Spektralmaße
Sei H ein Hilbert–Raum und A ∈ L(H) , A† = A beschränkt. Sei |ψi ∈ H. Dann ist die Abbildung C(σ(A)) 3
f −→ hψ|f (A)ψi ein semi–positiv definites Funktional auf C(σ(A)). Das Riesz–Markov Theorem garantiert
19
dann die Existenz eines eindeutig bestimmten Maßes µψ
auf der kompakten Menge σ(A), so daß
Z
hψ|f (A)ψi =
dµψ f (λ) .
σ(A)
Def. II.19 Das
Maß
µψ
heißt
mit dem Vektor ψ assoziierte Spekralmaß.
das
Die einfachste Sache, die wir ausgestattet mit dem
Maß µψ anstellen können, ist das Funktionalkalkül auf
die Menge der beschränkten Borel–Funktionen auf R, bezeichnet mit B(R), auszuweiten.
Satz II.29 (Spektralsatz, Standpunkt: Funktionalkalkül) Sei H ein Hilbert–Raum und A, B ∈
L(H) , A† = A beschränkt. Es gibt genau eine Abbildung
Φ̂ : B(R) −→ L(H) mit folgenden Eigenschaften:
(1) Φ̂ ist ein algebraischer †–Homomorphismus.
Beweis II.32 Wir definieren U durch U Φ(f )|ψi = f ,
wobei f ∈ C(σ(A)). Wir zeigen zuerst, daß U wohldefiniert ist. Dazu rechnen wir:
kΦ(f )|ψik2 = hψ|Φ† (f )Φ(f )ψi
Z
(6) Für f ≥ 0 gilt auch Φ̂(f ) ≥ 0.
R−M
hψ|Φ(f ∗ f )ψi =
2
σ(Φ(f ∗ f ))
Also, ist f = g bzgl. µψ fast überall, dann gilt auch
Φ(f )|ψi = Φ(g)|ψi. Damit ist U wohldefiniert auf
{Φ(f )|ψi : f ∈ C(σ(A))} und U erhält die Norm. Da
nach Voraussetzung |ψi ein zyklischer Vektor ist folgt
weiterhin {Φ(f )|ψi : f ∈ C(σ(A))} = H. Wir können
wieder die Fußnote 4 heranziehen und notieren: U kann
erweitert werden zu einer isometrischen Abbildung von
H nach L2 (σ(A), dµψ ). Da C(σ(A)) dicht liegt in L2 ,
folgt Bild(U ) = L2 (σ(A), dµψ ). Es bleibt: Sei f ∈
C(σ(A)) , λ ∈ σ(A). Dann gilt,
II.28:(3)
Df
U AU −1 f (λ) = (U AΦ(f )) (λ) =
Df
= (U Φ(xf )) (λ) =
= λf (λ) .
(3) Sei f die Funktion f (x) = x. Dann gilt Φ̂(f ) = A.
(5) Sei A|ψi = λ|ψi. Dann ist Φ̂(f )|ψi = f (λ)|ψi.
=
dµψ |f (λ)| .
=
(2) Φ̂ ist stetig bzgl. der Norm: kΦ̂(f )kL(H) ≤ kf k∞ .
(4) Für fn (x) −→ f (x) punktweise und kfn k∞ beschränkt, gilt: Φ̂(fn ) −→ Φ̂(f ) bzgl. der starken
Topologie.
II.28:(1)
Dieses Argument kann von f ∈ C(σ(A)) auf f ∈ L2 erweitert werden. ∗–< [{; 0)
Lemma II.10 Sei H ein separabler Hilbert–Raum und
A ∈ L(H) selbstadjungiert. Dann gibt eine Zerlegung von
H in eine direkte Summe: H = ⊕N
j=1 Hj , wobei N ∈ N
oder N = ∞, so daß gilt:
(1) Aus |ψi ∈ Hj folgt A|ψi ∈ Hj für jedes j.
(7) Falls AB = BA, dann gilt Φ̂(f )B = B Φ̂(f ).
(2) ∀j ∃ |φj i ∈ Hj : Hj = {f (A)|φj i : f ∈ C(σ(A))}.
Beweis II.31 Im wesentlichen wie Satz II.28, ist aber
nicht vollkommen trivial, da wir intelligent den Übergang
vom stetigen Funktionalkalkül zum meßbaren Funktionalkalkül vollziehen müssen. ∗–< [{; 0)
Def. II.20 Ein Vektor |ψi ∈ H heißt zyklischer Vektor
von A ∈ L(H), wenn endliche Linearkombinationen von
Elementen aus {An |ψi}n∈N dicht in H liegen.
Diese Eigenschaft wird leider nicht von allen Operatoren geteilt, aber wenn ein Operator einen zyklischen
Vektor besitzt, so ist das ungemein nützlich:
Lemma II.9 Sei A ∈ L(H) , A† = A beschränkt, und
|ψi ∈ H ein zyklischer Vektor von A. Dann gibt es einen
unitären Operator U : H −→ L2 (σ(A), dµψ ) mit der Eigenschaft:
U AU −1 f (λ) = λf (λ) , f ∈ L2 (σ(A), dµψ ) , λ ∈ R.
Die Gleichheit bezieht sich hier auf die Gleichheit von
Elementen aus L2 (σ(A), dµψ ).
Beweis II.33 Als Übung mit Zorn. ∗–< [{; 0)
Die letzten beiden Lemmata lassen sich mächtig kombinieren zu der Version des Spektralsatzes, die für uns
am transparentesten und praktischtesten ist:
Satz II.30 (Spektralsatz, Standpunkt: Lieblingsversion von Physikerinnen und Physikern oder
Multiplikationsoperator–Form) Sei H ein separabler
Hilbert–Raum, A ∈ L(H) beschränkt und selbstadjungiert. Dann gibt es Maße {µj }N
j=1 , (N = 1, 2, . . . oder
∞) auf σ(A) und einen unitären Operator mit
U : H −→
N
M
L2 (R, dµj ) ,
j=1
U AU −1 Ψ
j
(λ) = λΨj , Ψj ∈ L2 (R, dµj ) , λ ∈ σ(A) .
2
Hierbei gilt folgende Notation: Ψ ∈ ⊕N
j=1 L (R, dµj ) ist
das N –Tupel (Ψ1 (λ), . . . , ΨN (λ)). Diese Realisierung von
A heißt Spektraldarstellung.
20
Beweis II.34 Die Idee ist: Sie benutzen Lemma II.10
zur Zerlegung von H und wenden Lemma II.9 auf jeden
Teilraum an. Bitte füllen Sie die Lücken. ∗–< [{; 0)
Die Formulierung des Spektralsatzes besagt einfach,
daß jeder beschränkte selbstadjungierte Operator als
Multiplikationsoperator auf einem geeigneten Maßraum
dargestellt werden kann.
Def. II.21 Die Maße dµj heißen Spektralmaße. Sie sind
gerade die dµψ für geeignete ψ.
Diese Maße sind nicht eindeutig bestimmt, was uns
noch beschäftigen wird. Zunächst ein paar Beispiele:
Bsp. II.8 Sei A eine selbstadjungierte (n × n)–Matrix
(n ∈ N). Das Spektraltheorem für endlichdimensionale
Vektorräume ist Ihnen ja aus der Linearen Algebra bekannt. Zur formlosen Erinnerung: Es besagt, daß es zu A
einen orthonormalen Satz von Eigenvektoren ψ1 , . . . , ψn
mit Aψj = λj ψj , j ∈ {1, . . . , n} gibt.
Wir nehmen an, daß alle Eigenwerte λ1 , . . . , λn disjunkt sind. Die Frage, die uns in diesem Beispiel interessiert ist, welcher Maßraum den Satz II.30 auf das entsprechende Resultat aus der Linearen
Pn Algebra reduziert?
Wir probieren folgendes: Sei µ := j=1 δ(x − λj ), wobei
δ(x) ein Dirac–Maß bezeichne. L2 (R, dµ) ist dann einfach Cn : f ∈ L2 ist durch f = (f (λ1 ), . . . , f (λn )) gegeben. Probieren Sie es aus! Der Funktion λf entspricht
das n–Tupel (λ1 f (λ1 ), . . . , λn f (λn )).
Dieses Beispiel eignet sich auch dafür, die Beliebigkeit
Pn des Maßes explizit aufzuzeigen: Sei nämlich µ̃ :=
j=1 aj δ(x − λj ) mit aj > 0 , j ∈ {1, . . . , n}. A kann
dann auch als Multiplikationsoperator auf L2 (R, dµ̃) dargestellt werden.
Weiterhin sehen wir an diesem Beispiel, wann mehr
als ein Maß benötigt wird: Ein selbstadjungierter Operator A auf einem Hilbert–Raum H mit dim(H) < ∞ kann
genau dann als Multiplikationsoperator auf L2 (R, dµ)
dargestellt werden, wenn A ausschließlich disjunkte Eigenwerte besitzt.
Bsp. II.9 Wir wissen bereits, daß kompakte Operatoren
viele Eigenschaften mit ihren Verwandten aus der Linearen Algebra teilen. Obiges Beispiel sollte also für kompakte Operatoren eine mühelose Verallgemeinerung besitzen.
Dem ist auch so: Sei A kompakt und selbstadjungiert.
Das Hilbert–Schmidt Theorem (Satz II.17) garantiert die
Existenz eines vONS von Eigenvektoren {ψj }nj=1 , n ∈ N,
mit der Eigenschaft: Aψj = λj ψP
j . Sind alle Eigenwer∞
n
te disjunkt, so eignet sich µ :=
j=1 δ(x − λj )/2 als
Spektralmaß.
Bsp. II.10 Wir betrachten den Differentialoperator
−id/dx auf L2 (R, dx). Um ganz ehrlich zu sein, dabei
handelt es um einen unbeschränkten Operator und als solcher gehört er nicht in diesen Abschnitt. Allerdins werden
wir später sehen, daß auch für unbeschränkte Operatoren eine Aussage ganz analog zu Satz II.30 gilt. Wir erlauben uns daher eine gesunde Portion an Naivität und
konzentrieren uns auf die unitäre Transformation: Gesucht wird also ein unitären Operator U und ein Maß dµ
(es stellt sich an anderer Stelle heraus, daß lediglich ein
µ gebraucht wird) mit U : L2 (R, dx) −→ L2 (R, dµ(k)).
Sei f (x) := (U −1 g(k))(x) , g ∈ L2 (R, dµ(k)). Die
entscheidende Gleichung des Spektralsatzes II.30 lautet dann: (U (−id/dx)f (x))(k) = k(U f (x))(k) , k ∈
σ(−id/dx). Die gesuchte Transformation ist die Fourier–
Transformation:
Z
−1/2
(U f (x))(k) = (2π)
dx exp (ixk)g(k) .
R
Die Fourier–Transformation ist also ein Beispiel für eine
Spektraldarstellung.
Wir kommen nun zu der bereits angesprochenen Frage, wann A unitär äquivalent zu einem Multiplikationsopearator auf L2 (R, dµ) ist, also wann wir mit nur einem
Spektralmaß auskommen. Beispiel II.8 hat uns gelehrt,
daß im Falle endlich–dimensionaler Vektorräume dies der
Fall ist, wenn alle Eigenwerte von A verschieden sind.
Def. II.22 Ein beschränkter selbstadjungierter Operator
A heißt nicht–entartet genau dann, wenn A unitär äquivalent zur Multiplikation mit λ auf L2 (R, dµ) für ein Maß
µ ist.
Intrinsische Charakterisierungen sind:
Satz II.31 Die folgenden Aussagen sind äquivalent:
(1) A ist nicht–entartet.
(2) A hat einen zyklichen Vektor.
(3) {B : AB − BA = 0} ist eine Abelsche Algebra.
Als nächstes wenden wir uns der Nichteindeutigkeit
des Spektralmaßes für nicht–entartete Operatoren zu.
In Beipiel II.8 haben wir gesehen, daß akzeptable Maße (Anschluß an die Lineare Algebra) von der Form
PN
µ =
j=1 αj δ(x − λj ) , αj > 0 , j ∈ {1, . . . , n} sind.
Diese Einsicht hat eine natürliche Verallgemeinerung auf
den Fall unendlich–dimensionaler Vektorräume. Wir nehmen an, daß dµ auf R gegeben ist. Sei F eine meßbare
Funktion, die positiv und fast überall von Null verschieden ist bzgl. des Maßes µ,
R außerdem soll sie lokal vom
Typ L1 (R, dµ) sein, d.h. K dµ |F | < ∞ , K ⊂ R kompakt. Dann ist auch dν = F dµ ein Borel Maß, und die
Abbildung
U : L2 (R, dµ) −→ L2 (R, dν) ,
p
(U f ) (λ) = F (λ)f (λ)
(44)
ist unitär (F 6= 0 fast überall) und λU (f ) = U (λf ).
Folglich kann ein Operator A mit einer Spekraldarstellung bzgl. µ genau so gut bzgl. ν dargestellt werden. Der
entscheidende Fortschritt gelingt nun dank eines Satzes
von Radon–Nikodym, der besagt, daß dν = F dµ mit
F 6= 0 fast überall gilt genau dann, wenn µ und ν die
gleichen Nullmengen haben (also gleiche Teilmengen vom
Maß Null). Dies motiviert folgende Definition:
21
Def. II.23 Zwei Borel–Maße µ, ν sind genau dann
äquivalent, wenn sie die gleichen Nullmengen haben. Eine Äquivalenzklasse [µ] heißt Maßklasse.
Die Nichteindeutigkeit von Spekralmaßen erfährt nun
folgende Aufklärung:
Satz II.32 Seien µ, ν Borel–Maße auf R mit beschränktem Träger. Sei Aµ auf L2 (R, dµ) gegeben durch
(Aµ f )(λ) = λf (λ), und Aν entsprechend auf L2 (R, dν).
Dann sind Aµ und Aν genau dann unitär äquivalent,
wenn µ und ν äquivalente Maße sind.
Die Verallgemeinerung auf den Fall mit Entartung sparen wir uns hier, auch wenn diese in der Physik durchaus
wichtig ist, nimmt es hier zuviel Platz weg.
3.
Natürlich können wir bzgl. eines projektorwertigen
Maßes auch integieren. Sei PΩ ein projektorwertiges Maß,
dann ist hφ|PΩ φi das gewöhnliches Maß für jedes φ. In
suggestiver Manier werden wir in den Präliminarien die
Integration bzgl. dieses Maßes ganz barock mit dhφ|PΩ φi
bezeichnen.
Satz II.33 Sei PΩ ein projektorwertiges Maß und f eine
beschränkte Borel–Funktion auf Träger(PΩ ). Dann gibt
Res einen eindeutig bestimmten Operator B, den wir mit
dPλ f (λ) bezeichnen, so daß
Z
hΦ|BΦi =
dhφ|Pλ φi f (λ) , ∀|Φi ∈ H . (45)
Bsp. II.11 Ist A ein selbstadjungiertert Operator, und
PΩ das zugehörige projektorwertige Maß, so gilt:
Z
A=
dPλ λ ,
λ∈σ(A)
Spektralprojektoren
Im letzten Abschnitt haben wir das Funktionalkalkül
f −→ f (A) für jede Borel–Funktion f und jeden beschränkten selbstadjungierten Operator A angesprochen.
Die wichtigsten Funktionen, die wir beim Übergang vom
stetigen zum meßbaren Funktionalkalkül gewonnen haben, sind die charakteristischen Funktionen auf Mengen.
Def. II.24 Sei A ein beschränkter selbstadjungierter
Operator und Ω eine Borel–Menge in R. Wir definieren
einen Spektralprojektor von A durch PΩ := χΩ (A).
wie wir recht schnell einsehen können in einer ruhigen
Minute.
Satz II.34 (Spektralsatz, Standpunkt: Auch eine
Lieblingsversion von Physikerinnen und Physikern, oder kurz: der maßtheoretische Blickwinkel) Zwischen (beschränkten) selbstadjungierten Operatoren A und beschränkten projektorwertigen Maßen {PΩ }
gibt es folgende eineindeutige Beziehung:
Z
A −→ {PΩ } = {χΩ (A)} , {PΩ } −→ A = dPλ λ .
Wie die Definition suggeriert: PΩ ist eine orthogonale
Projektion, da χ2Ω = χΩ gilt. Die wichtigen Eigenschaften
der Familie {PΩ } := {PΩ : Ω ist eine Borel–Menge} sind
die Folgenden:
Dieser Satz ist nicht nur mächtig, sondern auch robust gegen eine wichtige Verallgemeinerung, die für den
Aufbau der Quantenmechanik essentiell ist: Die Verallgemeinerung auf unbeschränkte Operatoren.
Spektralprojektoren sind nützlich zur Untersuchung
des Spektrums eines selbstadjungierten Operators:
Lemma II.11 Die Familie {PΩ } von Spektralprojektoren eines beschränkten selbstadjungierten Operators A
hat die folgenden Eigenschaften:
Satz II.35 λ ∈ σ(A) genau dann, wenn für jedes > 0
folgendes gilt:
P(λ−,λ+) 6= 0 .
(1) Jedes PΩ ist eine orthogonale Projektion.
Beweis II.35 Die wesentliche Idee des Beweises beruht
auf folgender Feststellung:
−1 −1
.
(A − λI) = [d(λ, σ(A))]
(2) P∅ = 0.
(3) Sei Ω = ∪∞
j=1 Ωj mit Ωi ∩ Ωj = ∅ , ∀i 6= j. Dann
PΩ = lim
N →∞
∞
X
Die Ausarbeitung überlassen wir einer Übung. ∗–< [{; 0)
PΩj .
Satz II.35 motiviert folgende Klassifikation des Spektrums:
j=1
(4) PΩi PΩj = PΩi ∩Ωj , ∀i, j .
Dies erinnert schon sehr an die ein Maß definierenden
Eigenschaften. Kein Zufall, denn
Def. II.25 Eine Familie von Projektoren,
(1)–(3) von Lemma II.11 erfüllt, heißt
projektiorwertiges Maß.
die
ein
Def. II.26 Wir nennen
n
o
df
σkont (A) = λ ∈ σ(A)dim(Bild(P(λ−,λ+) )) = ∞ , ∀ > 0
das kontinuierliche Spektrum, und
df
σdisk (A) = σ(A) \ σkont (A)
das diskrete Spektrum von A.
22
Damit ist σ(A) zerlegt in zwei notwendigerweise disjunkte Untermengen. Dabei ist σdisk nicht unbedingt abgeschlossen, aber:
Satz II.36 σkont ist abgeschlossen.
Beweis II.36 Sei σkont (A) 3 λn −→ λ, und Iδ := (λ −
δ, λ + δ). Nach Voraussetzung gibt es immer n ∈ N und
> 0, so daß I := (λn − , λn + ) ⊂ Iδ . Damit ist
dim(Bild(PIδ (A))) = ∞, also λ ∈ σkont (A). ∗–< [{; 0)
Es folgenden zwei Sätze geben alternative Charakterisierungen von σdisk und σkont . Die Beweise überlassen
wir den Übungen.
Satz II.37 λ ∈ σdisk genau dann, wenn die folgenden
beiden Kriterien gleichzeitig erfüllt sind:
Bsp. II.12 Der Ortsoperator Sei H = L2 (R) und
Z
df
D(T ) = f ∈ L2 (R) :
dx x2 |f (x)|2 < ∞ .
R
Für f ∈ D(T ) definieren wir:(T f )(x) := xf (x).
Natürlich ist T unbeschränkt, wir brauchen ja lediglich
Funktionen in D(T ) zu wählen, deren Träger sich bis
nach ±∞ erstreckt. Wir können also kT f k so groß machen, wie wir wollen und gleichzeitig kf k = 1 haben.
Nun macht xf (x) auch Sinn, wenn f ∈
/ D(T ), aber
liegt dann halt nicht in L2 (R). Wollen wir aus bestimmten Gründen, oder müssen gar, auf den Hilbert–Raum
L2 (R) einschränken, so erfordert dies, den Definitionsbereich von T zweckmäßig einzuschränken. Der hier angegebene Definitionsbereich ist tatsächlich der größt mögliche, für den das Bild(T ) noch in L2 (R) liegt.
(1) ∃ > 0, so daß (λ − , λ + ) ∩ σ(A) = {λ}.
(2) dim({|ψi ∈ H : A|ψi = λ|ψi}) < ∞.
Satz II.38 (Weyls Kriterium) Sei A ein beschränkter
selbstadjungierter Operator. Dann ist λ ∈ σ(A) genau
dann, wenn es eine Folge {|ψj i}j∈N gibt mit k|ψj ik = 1
und limj→∞ k(A − λI)|ψj ik = 0. λ ∈ σkont genau dann,
wenn die Folgenglieder {|ψj i}j∈N alle orthogonal gewählt
werden können.
F.
Unbeschränkte Operatoren
Wir werden schon recht früh sehen, daß wichtige Observablen in der Quantenmechanik durch unbeschränkte Operatoren beschrieben werden. Nach einem Satz
von Hellinger–Toeplitz gilt für einen auf dem gesamten
Hilbert–Raum H definierten Operator A mit der Eigenschaft hφ|Aψi = hAφ|ψi , |φi, |ψi ∈ H, daß dieser beschränkt ist. Daher wird ein unbeschränkter Operator
nur auf einer Untermenge von H definiert sein.
1.
Grundbegriffe
5
Präziser, ein Operator T auf einem Hilbert–Raum H
ist eine Abbildung von D(T ) ⊂ H −→ H, wobei der Unterraum D(T ) der Definitionsbereich des Operators T
heißt. Wir nehmen immer an, daß der Definitionsbereich
dicht in H liegt, D(T ) = H. Damit ist der Definitionsbereich eines (unbeschränkten) Operators ein wichtiges
Charakteristikum desselben und gehört eigentlich in die
Definition des Operators, neben dessen expliziten Wirkung auf Vektoren im Definitionsbereich. Diese buchhalterische Mühe wird in der Physik nicht gepflegt.
5
Wir weisen lediglich auf die Qualifikation ’beschränkt’ explizit
hin, ansonsten handelt es sich um einen unbeschränkten Operator.
Von von Neumann stammt folgender nützliche Begriff
zum Studium von linearen Abbildungen, der sich als besonders nützlich zur Charakterisierung von unbeschränkten Operatoren erweist.
Def. II.27 Unter dem Graph Γ(T ) einer linearen Abbildung T verstehen wir folgende Menge: {(f, T f ) : f ∈
D(T )} ⊂ H × H. T heißt ein abgeschlossener Operator,
wenn Γ(T ) eine abgeschlossene Untermenge von H × H
ist.
Def. II.28 Seien T1 und T Operatoren auf H. Gilt
Γ(T1 ) ⊃ Γ(T ), dann heißt T1 eine Erweiterung von T ,
kurz: T1 ⊃ T .
Dies ist offenbar äquivalent zu: T1 ⊃ T genau dann, wenn
D(T1 ) ⊃ D(T ) und T1 f = T f , ∀f ∈ D(T ).
Def. II.29 Ein Operator T heißt abschließbar, wenn T
eine abgeschlossene Erweiterung hat. Jeder abschließbare
Operator T hat eine kleinste abgeschlossene Erweiterung,
die wir den Abschluß von T nennen und mit T bezeichnen.
Es ist verführerisch, eine abgeschlossene Erweiterung
von T zu finden, im dem wir den Abschluß des entsprechenden Graphen in H × H suchen. Im allgemeinen ist
dies keine gute Strategie, da Γ(T ) nicht der Graph eines Operators zu sein braucht. Wir werden weiter unten
einsehen, daß dies aber kein Drama für uns darstellt.
Lemma II.12 Sei T ein abschließbarer Operator. Dann
gilt: Γ(T ) = Γ(T ).
Beweis II.37 Sei S eine beliebige abgeschlossene Erweiterung von T , nicht notwendigerweise die kleinste.
Dann gilt Γ(T ) ⊂ Γ(S). Wir definieren einen Operator R durch (1) den Definitionsbereich D(R) = {H 3
|ψi : (|ψi, |φi) ∈ Γ(T )} (|φi = T |ψi), und (2) durch die
Vorschrift: R|ψi = |φi, wobei |φi ∈ H durch die Forderung (|ψi, |φi) ∈ Γ(T ) eindeutig bestimmt ist. Offenbar
23
ist Γ(R) = Γ(T ), also ist R eine abgeschlossene Erweiterng von T . Folglich gilt auch R ⊂ S. Nun ist S aber
eine beliebige abgeschlossene Erweiterung. Mit anderen
Worten R ⊂ S gilt für alle abgeschlossenen Erweiterungen. Das ist aber nur möglich, wenn R = T . ∗–< [{; 0)
Def. II.30 Sei T ein linearer Operator auf dem Hilbert–
Raum H, dessen Definitionsbereich D(T ) dicht in H ist.
Sei D(T † ) die Menge der |φi ∈ H für die es ein |ηi ∈ H
gibt, so daß
Und gleich noch ein Beispiel zu den eben eingeführten
Konzepten:
Für jedes |φi ∈ D(T † ) definieren wir: T † |φi = |ηi. T †
heißt der adjungierte Opertator zu T .
Bsp. II.13 Sei H = L2 (R) , D(T ) = C0∞ (R), die beliebig oft stetig differenzierbaren Funktionen mit kompakten Träger, und D(T1 ) = C01 (R), die einmal stetig differenzierbaren Funktionen mit kompakten Träger.
Sei (T f )(x) = if 0 (x) , ∀f ∈ D(T ) und (T1 f )(x) =
if 0 (x) , ∀f ∈ D(T1 ). T1 ist eine Erweiterung von T , hier
beschränken wir uns aber bescheiden auf die Aussage, daß
Γ(T ) ⊃ Γ(T1 ). Weiter unten zeigen wir, daß T ein symmetrischer Operator und daher abschließbar ist, woraus
folgt T ⊃ T1 . Sei {j (x)} eine Approximation der Eins,
konkret: j (x) := j(x/)/, wobei j(x) eine positive, beliebig oft differenzierbare Funktion auf dem RTräger (−1, 1)
bezeichne, mit der weiteren Eigenschaft: R dx j(x) = 1.
Für φ ∈ D(T1 ) setzen wir
Z
df
φ (x) =
dt j (x − t)φ(t) .
Nach dem Satz II.4 von Riesz ist |φi ∈ D(T † ) genau dann,
wenn |hT ψ|φi| ≤ Ck|ψik ∀|ψi ∈ D(T ). Wir bemerken
noch: S ⊂ T y T † ⊂ S † . Die Forderung, daß D(T ) dicht
in H sein soll, war hier wichtig, damit |ηi eindeutig durch
(46) bestimmt ist. Machen Sie sich klar, daß es prinzipiell
möglich ist, folgende Situation vorzufinden: D(T † ) = ∅.
R
Da j (x) einen kompakten Träger hat und beliebig oft differenzierbar ist, gilt: φ ∈ C0∞ (R), also φ ∈ D(T ) ∀ ∈
R+ . Es ist
Z
|φ (x) − φ(x)| ≤
dt j (x − t) |φ(t) − φ(x)|
R
!Z
≤
{t:|x−t|≤}
=
sup
∀|ψi ∈ D(T ) .
(46)
Satz II.39 Sei T ein auf H dicht definierter Operator.
Dann gelten:
(1) T † ist abgeschlossen.
(2) T ist abschließbar genau dann, wenn D(T † ) = H.
(3) Ist T abschließbar, so gilt: (T )† = T † .
Def. II.31 Sei T ein abgeschlossener Operator auf dem
Hilbert–Raum H. Die Resolventenmenge ρ(T ) ist folgendermaßen definiert:
n
bijektiv
df
ρ(T ) = λ ∈ C : T − λI : D(T ) −→ H
o
und (T − λI)−1 ist beschränkt .
Ist λ ∈ ρ(T ), so heißt Rλ (T ) := (T −λI)−1 die Resolvente
dt j (x − t) von T an der Stelle λ.
|φ(t) − φ(x)|
sup
hT ψ|φi = hψ|ηi
R
|φ(t) − φ(x)| .
{t:|x−t|≤}
Da φ einen kompakten Träger hat, ist φ gleichmäßig
stetig. Daher konvergiert φ ∈ D(T ) gleichmäßig gegen
φ ∈ D(T1 ) in L2 (R). Und ähnlich,
Z
(T φ )(x) =
dt (T j )(x − t)φ(t)
ZR
d
=
dt (−i)
j (x − t) φ(t)
dt
ZR
=
dt j (x − t)(T1 φ)(t)
R
L2 (R)
−→ (T φ)(x) .
L2 (R)
Insgesamt haben wir also gezeigt, daß φ −→ φ und
L2 (R)
T φ −→ T φ für jedes φ ∈ D(T1 ). Daraus folgt Γ(T ) ⊃
Γ(T1 ). ∗–< [{; 0)
Das Konzept des adjungierten Operators kann direkt
auf unbeschränkte Operatoren übertragen werden:
Das Spektrum, Punktspektrum und residuale
Spektrum werden genau so definiert wie im Falle von
beschränkten Operatoren.
Oft kann sich die Physik–Gemeinschaft nicht
des Eindruckes erwehren, daß Fragestellungen
bezüglich des Definitionsbereiches oder des Abschlusses eines Operators lediglich eine buchhalterische Pflicht darstellen, die allenfalls eine technische Unannehmlichkeit von periphärem Interesse bedeutet. Dieser Eindruck kommt in etwa
von folgender Idee: es ist doch lediglich notwendig, den Definitionsbereich ausreichend klein zu
wählen, so daß mit dem unbeschränkte Operator
sinnvoll gerechnet werden kann und mehr steht
da nicht dahinter. Na ja, den Meinungsbildungsprozeß auf Ihrer Seite will ich nicht beeinflussen, allerdings ist es fair zu erwidern, daß ein
sinnvoller Definitionsbereich oft mit der konkreten physikalischen Fragestellung zusammenhängt.
Außerdem hängen viele wichtige Eigenschaften
von Operatoren sensibel von der Wahl des Definitionsbereichs ab, insbesondere natürlich das
Spektrum.
24
2.
Symmetrische und selbst-adjungierte Operatoren
Wir beginnen zügig mit zwei ganz zentralen Begriffen:
Def. II.32 Ein auf einem Hilbert–Raum H dicht definierter Operator T heißt symmetrischer Operator (oder
auch hermitescher Operator), wenn T ⊂ T † , also wenn
D(T ) ⊂ D(T † ) und T |ψi = T † |ψi , ∀|ψi ∈ H. Äquivalent: T ist symmetrisch genau dann, wenn
Auch um den Unterschied zwischen Kapitel II und dem
vorliegenden zu betonen, folgen wir hier der angelsächsischen Schule der informativen Wissensvermittlung ohne
axiomatischen Herangehensweise, sondern behalten einen
lockeren und hoffentlich flüssigen Erzählstil.
Bitte behalten Sie immer das einleitende einladende
Kapitel I im Blick.
A.
hT φ|ψi = hφ|T ψi ∀|φi, |ψi ∈ H .
Def. II.33 T heißt selbstadjungiert, wenn T = T † , also
genau dann, wenn T symmetrisch ist und D(T ) = D(T † ).
Ein symmetrischer Operator kann immer abgeschlossen werden, da D(T † ) ⊃ D(T ) dicht in H ist. Ist T
symmetrisch, so ist T † ein Abschluß von T . Präziser,
für symmetrische Operatoren gilt: T ⊂ (T † )† ⊂ T † .
Für einen abgeschlossenen symmetrischen Operator gilt:
T = (T † )† ⊂ T † , und für selbstadjungierte Operatoren
gilt sogar: T = (T † )† = T † . Dies impliziert, daß ein
abgeschlossener symmetrischer Operator T genau dann
selbstadjungiert ist, wenn T † symmetrisch ist.
Die Unterscheidung zwischen abgeschlossenen symmetrischen Operatoren und selbstadjungierten Operatoren
ist ungemein wichtig. Nur für selbstadjungierte Operatoren gilt der Spektralsatz. Außerdem können auch lediglich selbstadjungierte Operatoren exponiert werden,
um so unitäre 1–Parametergruppen zu liefern, die unter anderem für die Dynamik in der Quantenmechanik
zuständig sind. Daher benötigen wir ein Kriterium für
Selbsradjungiertheit.
Def. II.34 Ein symmetrischer Operator T heißt
essentiell selbstadjungiert, wenn T selbstadjungiert ist.
Ist T abgeschlossen, so heißt eine Untermenge D ⊂ D(T )
Kern von T , wenn gilt: T |D = T .
Ein essentiell selbstadjungierter Operator T hat genau
eine selbstadjungierte Erweiterung.
III.
PRÄLIMINARIEN (PRAXIS)
Dieser Praxisteil ist gut zum Rechnen und zur Erörterung der physikalischen Grundlagen der Quantenmechanik, hilft Ihnen aber nicht bei der Fundierung der mathematischen Konzepte, die zur Formulierung der Quantenmechanik eingesetzt werden. Eine klare Trennung
zwischen mathematischen und physikalischen Konzepten ist nur schwer möglich und vielleicht auch gar nicht
wünschenswert.
Trotzdem hilft Ihnen dieses Kapitel, in die faszinierende Physik der Quantenmechanik alsbald einzutauchen,
ohne die mathematische Finesse und das Eigenleben der
mathematischen Sprache gebührend zu bewundern. Eine zwar skizzenhafte, aber dennoch angemessene Würdigung des mathematischen Intellekts finden Sie im vorherigen Kapitel II.
Der Zustandsraum
Gegeben sei ein quantenmechanisches System S, dessen physikalischen Zustand wir mit lediglich einer Observablen notwendigerweise unvollständig charakterisieren wollen. Sei O diese Observable und M(O) ⊂ R die
Menge von möglichen Werten dieser Observablen, die bei
einem entsprechenden Experiment am betrachteten System S gemessen werden könnten. Übrigens ist M(O) a
priori nicht bekannt6 . Den Zustandsvektor (oder kurz:
Zustand) bezeichnen wir mit |mi (m ∈ M(O)), genannt
ket (nach Dirac). Für den Moment beschränken wir uns
als Zustandsraum Z auf einen komplexen Vektorraum
(später erweitern wir auf Hilbert–Räume).
Sei c ∈ C, c 6= 0, und |m0 i := c|mi ∈ Z. Die naheliegende Frage ist, ob |mi und |m0 i wirklich unterschiedliche Charakterisierungen von S liefern können sollen? Die
Antwort ist nein, denn das System S soll ja hinsichtlich
einer Messung von O durch M(O) charakterisiert werden7 . Daher führen wir folgende Äquivalenzrelation ein:
|mi ∼ |m0 i, wenn |m0 i = c|mi (c 6= 0). Der komplexe Zustandsraum zerfällt dann durch Quotientenbildung Z/ ∼
in Äquivalenzklassen:
df
[|mi] = {|m0 i : ∃ c ∈ C , c 6= 0, mit |m0 i = c|mi} .
Solche Äquivalenklassen heißen Strahlen. Wir verzichten auf die umständliche Schreibweise und arbeiten immer mit Repräsentanten, sind uns aber der Quotientenbildung stets bewußt.
Wie lesen wir denn nun die Information über O aus einem Zustandsvektor von S aus? Dies ist eine erste naive
Frage nach der mathematischen Beschreibung des Meßprozesses. Physikalisch wäre folgendes wünschenswert:
Das System S wird mit einem Meßapparat in Kontakt
gebracht, welche in der Lage ist, O zu messen, also entsprechend m ∈ M(O) aus dem Zustand |mi auszulesen.
Das Resultat der Messung besteht in der Kenntnis des
Meßwertes m ∈ R und des Zustandes |mi, der das System S direkt nach seinem Kontakt mit dem Meßapparat
charakterisiert. Wir operieren also mit der Meßapparatur
6
7
Es handelt sich bei der Menge M(O) um das Spektrum der Observablen O, siehe Kapitel II.
Tatsächlich renormiert der komplexe Skalar c ja lediglich den
Vektor, der als Informationsträger für die möglichen Meßwerte
fungiert, allerdings haben wir den Begriff der Norm noch nicht
bereitgestellt in diesem Kapitel.
25
auf den Zustand |mi und das Resultat der Messung ist,
daß unsere Apparatur m mißt und das detektierte System
nach der Messung (falls keine weitere Wechselwirkung
folgt) im Zustand |mi ist. Dies können wir mathematisch
durch eine Eigenwertgleichung modellieren, wobei wir
die Apparatur durch die Observable, die sie messen soll,
ersetzen:
linear
O : Z −→ Z ,
O|mi = m|mi .
Hierbei wird die Observable O als linearer Operator realisiert, und der angesprochene Meßprozeß als Eigenwertgleichung, wobei die Eigenwerte m ∈ M(O) ⊂ R die
möglichen Meßwerte bei einer Messung von O am System S im Zustand |mi , m ∈ M(O) sind.
Nun braucht ein System S aber nicht derart präpariert zu sein. Die verwendete Mathematik kommt uns
jetzt zur Hilfe und erklärt auch c1 |m1 i + c2 |m2 i , c1 , c2 ∈
C , m1 , m2 ∈ M(O) als legitimen Zustand, schließlich
ist der Zustandsraum ja ein Vektorraum. Dies bedarf
natürlich einer physikalischen Interpretation, die weiter
unten auch kommen wird. Im Moment halten wir fest: Sei
M(O) = {m1 , . . . , mn } ⊂ R. Dann muß sich ein beliebiger
Zustand von S hinsichtlich O als komplexe Linearkombination der |mj i , j ∈ {1, . . . , n} darstellen lassen:
| zi =
n
X
cj |mj i , cj ∈ C .
j=1
Natürlich fehlt uns im Moment vollkommen die physikalische Interpretation einer solchen Linearkombination
(modulo unserer Einsichten aus Kapitel I)
B.
Der duale Zustandsraum
(1) hn|mi = hm|ni∗ ∀|mi, |ni ∈ Z.
(2) hm|mi ≥ 0 ∀|mi ∈ Z,
wobei hm|mi = 0 genau dann gilt, wenn |mi = 0|m0 i für
|m0 i ∈ Z, und |mi in diesem Fall Null–ket genannt wird.
Das Skalarprodukt erlaubt es, Geometrie auf dem Zustandsraum Z zu betreiben, und auch eine geometrische
Vorstellung und Intuition zu entwickeln. Zum Beispiel
heißen zwei Zustände |mi, |ni ∈ Z orthogonal zueinander, wenn hn|mi = 0. Dann gilt offenbar auch hm|ni = 0.
Oder ebenfalls ein wichtiges Beispiel: Für |mi =
6 Null–ket
betrachten wir normierte Zustandsvektoren,
p
f = |mi/ hm|mi , hm|
f mi
f=1,
|mi
(47)
wobei hm|mi die Norm des Zustandes |mi bezeichnet.
Wir wählen immer normierte Zustandsvektoren als Repräsentanten der entsprechenden Strahlen, diese sind damit ausgezeichnet und diese Auszeichnung wird später
begründet werden.
C.
Beschränkte Observablen
linear
Operatoren O : Z −→ Z sind ein wichtiger Bestandteil zur mathematischen Modellierung von Messungen an
einem quantenmechanischen System S. Sie sind gewissermaßen die Auslesewerkzeuge, mit denen wir Informationen (Werte von Observablen) aus den Zustandsvektoren (kets) extrahieren, die S hinsichtlich der Observablen
O charakterisieren. Eine Besonderheit ist dabei, daß der
Auslesevorgang (die Messung) im wesentlichen durch eine Eigenwertgleichung des Operators beschrieben wird,
der der Observablen zugeordnet wird:
O|mi = m|mi ,
Sicherlich wollen wir die Möglichkeit haben, Zustandsvektoren linear auf komplexe Zahlen abzubilden. Dies
erlaubt die Identifikation der relevanten geometrischen
Struktur und stellt somit auch eine Intuitionsstütze dar.
Duale Vektoren, bezeichnet mit hn| (nach Dirac bra genannt), tun genau diesen Job für uns:
linear
hn| : Z −→ C ,
df
|mi −→ hn|(|mi) = hn|mi ,
wobei n ∈ M(O0 ) und zur Observablen O0 auch der Zustandsraum Z gehört.
Die komplexe Zahl hn|mi (nach Dirac bracket gennant) haben wir nicht von ungefähr so notiert: Die Vektoren des Dualraums Z ∗ operieren als lineare Funktionale auf Z. Ist nun der komplexe Vektorraum Z mit einem
Skalarprodukt
bilin.
h◦|◦i : Z × Z −→ C , |m1 i , |m2 i −→ hm1 |m2 i
ausgestattet, so erlaubt der Satz II.4 von Riesz folgende
salopp notierte Interpretation von dualen Vektoren: Zu
jedem hm| ∈ Z ∗ exisitiert ein |mi ∈ Z mit hm| = hm|◦i.
Das Skalarprodukt hat folgende Eigenschaften:
wobei der Bezeichner (möglicher Meßwert) reell sein muß,
m ∈ R. Diese Beschreibung wird uns aufgezwungen, weil
|mi ∈ Z und Z ein komplexer Vektorraum ist, und der
Zustand |mi selbst damit nicht observable sein kann.
Erinnern wir uns an die Klassische Mechanik
nach Hamilton: Hier war der Zustand eines Hamilton–
Systems (P, H) durch einen Vektor in einem reellen Vektorraum (Phasenraum) P = T ∗ M ∼
= Rn × Rn (n ∈ N)
gegeben. Denken wir uns den Phasenraum P global durch
(q, p) ∈ Rn ×Rn koordinatisiert, so sind Klassische Observablen (bzw. deren Komponenten) Funktionen
B : P −→ R , (q, p) −→ B(q, p) .
Wichtige Spezialfälle sind die klassische Ortsvariable:
j
BOrt
:= Pj ◦ Pr1 , j ∈ {1, 2, 3}, wobei Pra , a ∈ {1, 2} die
Projektion auf den a-ten Faktor im kartesischen Produkt
(q, p) bezeichne, und Pj (q) = q j die kanonische Projektion, zum Beispiel durch P j := hej , ◦i über das Euklidische Skalarprodukt h◦, ◦i realisiert. Also ausführlich,
j
BOrt
(q, p) = Pj (Pr1 (q)) = Pj (q) = q j . Und die klassische Impulsvariable: BImp j := Pj ◦ Pr2 , j ∈ {1, 2, 3},
26
ganz entsprechend. Es hat sich eingebürgert, diese grundlegenden klassischen Observablen mit den entsprechenden Komponenten des Phasenraumvektors gleichzusetj
zen: BOrt
= q j , BImp j = pj .
Wir können folgendermaßen eine engere Beziehung zur
klassischen Formulierung herstellen: Sei P := Z ×Z ∗ und
BO : P −→ R ,
df
(|mi, hn|) −→ BO (m, n) =
hn|O|mi
,
hn|mi
where Z 3 |mi , |ni 6= 0. Mit anderen Worten:
BO (|mi, hn|) = m ∈ M(O) ⊂ R. Die Notation ist so gemeint: Z 3 |Omi := O|mi und hn|O|mi := hn|Omi.
Es bietet sich nun an zu fragen, welche Eigenschaft von
O verantwortlich ist für M(O) ⊂ R. Zunächst führen wir
den zu O adjungierten Operator O† ein:
linear
O† : Z ∗ −→ Z ∗ , hn| −→ hn|O† .
Dank Riesz können wir dies salopp so interpretieren: es
gibt einen Zustand |Oni := O|ni mit der Eigenschaft
hn|O† = hOn|◦i. Also, hn|O† |mi = hOn|mi = hm|Oni∗ =
hm|O|ni∗ ∀|mi, |ni ∈ Z.
Operatoren mit hn|O|mi = hn|O† |mi heißen selbstadjungiert, also hn|O|mi = hm|O|ni∗ , was auch kurz
folgendermaßen notiert wird: O† = O. Selbstadjungierte
Operatoren eignen sich wunderbar als Observablen, denn
BO (m, n) = BO† (m, n) y hn|mi(BO (m, n) − BO∗ (n, m)) =
0 y (m − n∗ )hn|mi = 0. Ist n = m, so folgt m = m∗ ,
also m ∈ R. Gilt m 6= n, so folgt (wegen M(O) ⊂ R)
(m − n)hn|mi = 0, weshalb außerdem hn|mi = 0 ∀m, n ∈
M(O) , m 6= n folgt. Das bedeutet, daß die Eigenvektoren
(Eigenzustände) von O zu unterschiedlichen Eigenwerten orthogonal sind (setzen wir normierte Eigenzustände
voraus, so sind Eigenzustände zu unterschiedlichen Eigenwerten sogar orthonormiert).
Bezüglich einer Observablen O muß ein beliebiger Zustand | z i als Linearkombination
| zi =
X
c(m)|mi , c(m) ∈ C ∀ m ∈ M(O) .
m∈M(O)
geschrieben werden können, d.h. {|mi}m∈M(O) ist eine vONB von Z. Dies ist physikalisch absolut sinnvoll, allerdings wollen wir diese folkloristische Aussage ein bisschen genauer beleuchten. Der Zustand | z i
kann prinizpiell nämlich noch Information über andere
Observablen O(1) , O(2) , . . . tragen, zum Beispiel | z i =
|m(1) , m(2) , . . . i , m(1) ∈ M(O(1) ), m(2) ∈ M(O(2) ), . . . .
Obige Linearkombination ist daher präziser folgendermaßen zu verstehen: Bezüglich der Observablen O(j) , j ∈
{1, 2, . . . } ⊂ N gilt,
(1)
(j)
| z i ≡ |z , . . . , z , . . . i
X
c z(1) , . . . , m(j) , . . . |z(1) , . . . , m(j) , . . . i .
=
m(j) ∈M(O (j) )
Es hat sich aber eingebürgert, lediglich den Bezeichner zu
verwenden, der zu der Observablen gehört, die wir konkret zur Charakterisierung des physikalischen Zustandes
eines quantenmechanischen Systems heranziehen wollen.
Es drängt sich die Frage auf, ob wir ohne Sorge Informationen zu jeder beliebigen Observablen-Kombination
oder gar aller Observablen in einen Zustand | z i ablegen
können?
Dies ist in der Klassischen Mechanik der Fall, was wir
sogleich als Eigenschaft der Observablen-Konstruktion
i
einsehen: Zum Beispiel gilt offenbar BOrt
◦ BImp j =
i
BImp j ◦ BOrt . Genau diese Eigenschaft charakterisiert die
Algebra der klassischen Observablen als Abelsch, d.h. es
kommt nicht auf die Reihenfolge der Messungen an, es ist
egal, ob zuerst die j–Komponente des Impulses und dann
die i–Komponente des Ortes gemessen wird, oder umgekehrt. Diese algebraische Eigenschaft von klassischen Observablen ermöglicht es, den Phasenraum eines HamiltonSystems als Informationsspeicher für die gesamte Information über ein gegebenes mechanisches System anzusehen.
Im Falle der Quantenmechanik fragen wir zunächst,
linear
welche Eigenschaft die Observablen O(j) : Z −→
(j)
(1) (2)
(j)
(1) (2)
Z , O |m m i = m |m m i , j ∈ {1, 2} erfüllen
müssen, damit die Reihenfolge, in der diese gemessen
werden, keine Rolle spielt. Die Antwort ist schnell gefunden und für auf eine neue mathematische Struktur:
0 = BO(1) O(2) − BO(2) O(1) = B[O(1) ,O(2) ] , wobei wir den
Kommutator [O(1) , O(2) ] := O(1) ◦ O(2) − O(2) ◦ O(1)
von O(1) und O(2) eingeführt haben. Offenbar spielt
die Reihenfolge der Komposition (Hintereinanderschaltung) von O(1) und O(2) genau dann keine Rolle, wenn
[O(1) , O(2) ] = 0, wenn also O(1) und O(2) kommutieren.
Noch ein kleiner Vermerk zur Notation: [O(1) , O(2) ] = 0
meint [O(1) , O(2) ]|Zi = 0 ∀ | z i ∈ Z. Kommutierende Observablen heißen auch miteinander verträgliche Observablen. Es macht sicherlich Sinn, quantenmechanische Zustände mit miteinander verträglichen Observablen zu kennzeichnen. Aber macht es auch keinen
Sinn, quantenmechanische Zustände mit unverträglichen
(nicht verträglichen) Observablen zu bezeichnen? Sei also [O(1) , O(2) ] = R 6= 0. Dann kann |m(1) , m(2) i nicht
gleichzeitig Eigenzustand von O(1) und O(2) sein. Somit eignen sich nur miteinander verträgliche Observablen als gemeinsame Bezeichner von quantenmechanischen Zuständen.
Wir haben oben physiaklisch motiviert, daß
{|mi}m∈M(O) eine vONB von Z hinsichtlich der
Observablen O bildet,
X
| zi =
c(m)|mi , c(m) ∈ C ∀ m ∈ M(O) .
m∈M(O)
Daher sind die c(m) ∈ C durch c(m) = hm | z i gegeben.
Einsetzen in die Linearkombination liefert
X
X
| zi =
hm | z i|mi ≡
|mihm | z i .
m∈M(O)
m∈M(O)
27
Dies legt dem Objekt |mihm| eine strukturelle Bedeutung
dann gilt
linear
nahe. Abbildungstechnisch haben wir |mihm| : Z −→
Z , | z i −→ c(m)|mi. Mit c(m) = hm | z i handelt es bei
|mihm| im geometrischen Sinne um eine Projektion von
| z i auf |mi entlang des Eigenzustandes |mi der Observablen O. Tatsächlich gilt (|mihm| ◦ |mihm|) | z i = |mihm | z i
und (|m0 ihm0 | ◦ |mihm|) | z i = 0 für m 6= m0 . Da die
{|mi}m∈M(O) eine vONB bilden, gilt auch
X
|mihm| = id ,
m∈M(O)
wobei id : Z −→ Z , id | z i =| z i den Identitätsoperator
(die identische Abbildung) bezeichne.
Sei | z i ∈ Z normiert. Dann gilt
1 = hz | z i
X
=
X
m0 ∈M(O)
X
=
hz|m0 ihm0 |mih m | z i
| {z }
m∈M(O)
δm,m0
2
|c(m)| .
Wir erhalten also ohne jede Mühe eine Einschränkung
der Koeffizienten in der Linearkombination, die ganz den
geometrischen Charakter der Projektion widerspiegelt.
Die gewonnene geometrische Einsicht können wir nun
nutzen, um eine bessere Vorstellung von Operatoren auf
Zustandsräumen Z mit dim(Z) < ∞ zu erhalten. Im wesentlichen haben wir es ja mit Endomorphismen zu tun
und können daher nach einer Matrixdarstellung solcher
Operatoren fragen:
X
X
Y =
|m0 ihm0 |Y|mihm|
m0 ∈M(O) m∈M(O)
X
X
|m0 iYm0 m hm| ,
m0 ∈M(O) m∈M(O)
wobei die Komponenten Ym0 m der zu Y zugeordneten Matrix folgendermaßen angeordnet seien:


hm1 |Y|m1 i hm1 |Y|m2 i . . .


hm |Y|m i hm |Y|m i . . .
 2
 .
1
2
2




..
..
..
.
.
.
X
|m0 ihm0 |O|mihm|
m0 ∈M(O) m∈M(O)
=
X
m|mihm| .
(48)
m∈M(O)
Ebenso können wir Zustände | z i als Komponenten
(hm1 | z i, hm2 | z i, . . . ) von Vektoren bezüglich der Basis
{|mj i}mj ∈M(O) auffassen.
Wir beschließen diesen Abschnitt über beschränkte
Observablen mit einem Beispiel:
Bsp. III.1 Gegeben sei eine SGz (±)–Apparatur. Ein
Silberatom, welches diese Apparatur durchläuft, hat die
Observable Spin Sz in z–Richtung mit den möglichen
Meßwerten: M(Sz ) = {Sz (+), Sz (−)}, der zugehörige Vektorraum ist also 2–dimensional und wird von
{|Sz (−)i, |Sz (+)i} aufgespannt. Der Identitätsoperator
ist explizit durch id = |Sz (−)ihSz (−)| + |Sz (+)ihSz (+)|
gegeben. Nach (48) gibt es dann folgende nützliche Darstellung von Sz :
X
O
(1)
(1)
m0 m00 O m00 m
Da {|Sz (−)i, |Sz (+)i} eine vONB ist, finden wir ohne
Mühe
Sz |Sz (±)i = Sz (±) |Sz (±)i .
Ein beliebiger Zustand ist durch | z i = c(+)|Sz (+)i +
c(−)|Sz (−)i gegeben, wobei c(±) = hSz (±) | z i
und wegen |c(+)|2 + √
|c(−)|2 = 1 aus Symmetriegründen c(±) = 1/ 2 gilt. Bezüglich der vONB
{|Sz (−)i, |Sz (+)i} können wir die Eigenzustände von
Sz folgendermaßen darstellen: |Sz (+)i =
b (1, 0) und
|Sz (−)i =
b (0, 1). Wenn Sie es nicht gleich sehen,
dann schreiben Sie für den allgemeinen Zustand | z i =
|Sz (+)ihSz (+) | z i + |Sz (−)ihSz (−) | z i, dies entspricht
in der vONB dem Vektor (hSz (+) | z i, hSz (−) | z i). Jetzt
brauchen Sie lediglich auf | z i = |Sz (±)i zu spezialisieren
und die Normierung der Basis–Eigenzustände zu berücksichtigen. Die Matrixdarstellung von Sz ist somit:
Sz (+)
0
Sz =
b
.
(49)
0
Sz (−)
IV.
Diese Darstellung ist sinnvoll: Sei Y := O(1) ◦ O(2) die
Komposition zweier Operatoren O(j) , j ∈ {1, 2} in Z.
Dann gilt für m, m0 ∈ M(O):
Ym0 m =
X
Sz = Sz (+) |Sz (+)ihSz (+)| + Sz (−) |Sz (−)ihSz (−)| .
m∈M(O)
≡
O =
.
m00 ∈M(O)
Die Matrixdarstellung eines
P Operators O wird besonders
einfach, wenn wir id = m∈M(O) |mihm| benutzen, denn
MESSPROZESS & INTERPRETATION
Die Tatsache, daß Zustandsräume in der Quantenmechanik notwendig Vektorräume über dem komplexen
Zahlenkörper sind, zwingt uns so ausführlich über Observablen und den Meßprozeß nachzudenken, insbesondere
auch was die Interpretation von Zuständen als Linearkombination der Basis–Eigenzustände einer Observablen
betrifft.
Statt eine Reihe von an dieser Stelle mehr oder weniger
motivierten Postulaten zu verdauen, wollen wir den Meßprozeß in der Quantenmechanik ein wenig naiv aber instruktiv modellieren. Das Ziel ist, eine sich beinahe schon
28
aufzwingende, wenn vielleicht auch nicht zwingende Klarheit zu gewinnen, die diese Postulate nachhaltig inspiriert
und motiviert.
Der Einfachheit halber betrachten wir den Zustandsraum Z = ZO ⊗ ZA , dim(Z) < ∞ eines Systems S,
welches sich aus einem Studienobjekt O und einer Meßapparatur A zusammensetzt. Konzeptionell ist hier zu
betonen, daß wir auch A in die quantenmechanische
Beschreibung miteinbeziehen, nicht nur das eigentliche
quantenmechanische Objekt O unserer Forscherbegierde.
Dies hat folgende Konsequenz: Sei O(1) eine Observable, die wir zur Beschreibung von O heranziehen wollen, und {|o(1) i}o(1) ∈M(O(1) ) die zugehörige vONB aus
Eigenzuständen von O(1) . Sei weiterhin {|aj i}j∈J ⊂N eine
vONB von ZA , die wir nicht weiter spezifizieren, weil wir
ja an einer Messung von O(1) am Subsystem O interessiert sind. Dann ist ein allgemeiner Zustand | z i durch
eine Linearkombination der Form
X
| zi =
c(o(1) , aj ) |o(1) i ⊗ |aj i , (50)
einem Eigenzustand
vorliegen, sondern kann als LinearP
kombination o(1) ∈M(O(1) ) d(o(1) )|o(1) i gegeben sein. In
diesem Fall ist der Zustand des Gesamtsystems somit:
X
| zi =
d(o(1) ) | o(1) i ⊗ | [o(1) ] i . (53)
o(1) ∈M(O (1) )
Damit nicht genug: Der Zustand von O kann durch
eine nicht–leere Menge von verträglichen Observablen beschrieben werden, sagen wir {O(1) , . . . , O(n) :
[O(i) , O(j) ] = 0 , ∀ i, j ∈ {1, . . . , n} ⊂ N}, die uns
alle interessieren. Hinsichtlich dieser Beschreibung ist
ZO = ⊗ni=1 ZOi . Sind wir zunächst wieder lediglich an
einer Beschreibung mittels O(1) interessiert und liegt der
Zustand von O wieder in einer Überlagerung von Eigenzuständen bzgl. O(1) vor, so gilt für den Zustand des
Gesamtsystems unmittelbar nach der Messung:
| zi =
X
f1 (o(1) ) | o(1) i ⊗
mit c(o(1) , aj ) ∈ C ∀ o(1) ∈ M(O(1) ) , j ∈ J gegeben. Offenbar ist z ein legitimer Zustand in Z, allerdings können
aus (50) den Zustandsräumen ZO und ZA nicht voneinander unabhängige Zustände zugeordnet werden, außer
c(o(1) , aj ) = 0 ∀ o(1) ∈ M(O(1) ) , j ∈ J .
Nehmen wir einmal an, das Subsystem O läge im Zustand o ∈ M(O(1) ) vor. Dann ist der Zustand von A
relativ zu dem von O und kompatibel mit | z i folgender:
X
|A ` O . oi = N (o)
c (o, aj ) |aj i ,
(51)
j∈J
wobei N (o) eine Normierungskonstante bezeichne. Das
Konzept des relativen Zustandes |A a O . oi ist offenbar sinnvoll, da |A a O . oi eindeutig durch |oi bestimmt
ist, und insbesondere nicht von {|o(1) i}o(1) ∈M(O(1) ),o(1) 6=o
abhängt. Es gilt dann
X
| zi =
N −1 o(1) |o(1) i ⊗ |A a O . o(1) i .
o(1) ∈M(O (1) )
Der Begriff des relativen Zustandes (auch relationaler Zustand) ist nicht nur sinnvoll, sondern auch zentral
insofern, als es ausschließlich sinnvoll ist, nach relativen
Zuständen von Subsystemen zu fragen. Wir vereinfachen
jetzt die Notation: |[o(1) ]i := N −1 o(1) |A a O . o(1) i,
X
| zi =
| o(1) i ⊗ | [o(1) ] i .
(52)
o(1) ∈M(O (1) )
Die Interpretation ist: Liegt O im Zustand |o(1) i , o(1) ∈
M(O(1) ) vor, so registriert A dies nachdem beide Subsysteme in Kontakt gebracht wurden, und zeichnet dies
entsprechend auf, in dem der zu |o(1) i gehörende Meßwert
in den Speicher von A eingetragen wird. Dies verallgemeinern wir sogleich: Der Zustand von O braucht ja nicht in
|zj i =
X
|zj i ⊗ | [o(1) ] i ,
j=2
o(1) ∈M(O (1) )
o(1) ∈M(O (1) ),j∈J
n
O
fj (o(j) )|o(j) i , j ∈ {1, . . . , n} ⊂ N .
o(j) ∈M(O (j) )
(54)
Interessiert uns anschließend die Observable O(2) für
O im Zustand (54), so erhalten wir unmittelbar nach der
Messung den Zustand
X
X
| zi =
o(1) ∈M(O (1) ) o(2) ∈M(O (2) )
f1 (o(1) )f2 (o(2) ) | o(1) i ⊗ | o(2) i ⊗
n
O
|zj i ⊗ | [o(1) , o(2) ] i ,
⊗
(55)
j=3
wobei fj = ho(j) |zj i , j ∈ {1, 2}, und die Definition von
|z1 i ist klar. Die Meßaparatur (Beobachter) hat jetzt
[o(1) , o(2) ] in den Speicher geladen.
Eine wichtige Annahme bei unserer Modellierung ist,
daß auch der uns als klassisch erscheinenden Meßaparatur ein quantenmechanischer Zustand zugeordnet wird,
also die quantenmechanische Beschreibung als fundamentaler angesehen wird, die sich tatsächlich auf alle Objekte erstreckt. Tatsächlich halten viele diese Sichtweise in
Ehren und betrachten die klassischen Systeme als emergente Objekte, die auf bestimmten Skalen den Gesetzen
der Klassischen Mechanik approximativ gehorchen, aber
fundamental eine quantenmechanische Natur haben, und
exakt eben quantenmechanisch zu beschreiben sind.
Dies hat nun eine interessante Konsequenz für eine erste vorsichtige Interpretation von (55). Relativ zu den
unterschiedlichen Zuständen, die O bezüglich den Observablen O(j) einnehmen kann, gibt es eben auch unterschiedliche Zustände für die Meßapparatur, die ja die
möglichen Meßwerte speichert. Dies bedeuter aber, daß
es zu jeder möglichen Kombination von Meßwerten auch
29
entsprechende unterschiedliche Zustände des Meßapparates gibt, obwohl wir diesen zumindestens näherungsweise sicherlich als klassisches Objekt ansehen. Der Meßappart ist aber ein Synonym für eine Beobachterin/einen
Beobachter. Da die Beobachter als Subsytem Teil des
Gesamtsystems sind, gibt es keine externen Beobachter.
Damit scheint es entsprechend der Anzahl der Kombinationen von möglichen Meßwerten genauso viele Beobachterzustände zu geben. Dieser rohen Gedankengänge
führt mehr oder weniger unmittelbar zur Vielwelten–
Interpretation der Quantenmechanik, die zumindestends
vom Sci-Fi–Standpunkt her beurteilt eine fulminante Interpretation darstellt.
Fallen wir für den Moment auf den einfacheren Fall
(53) zurück. Nach der Messung von O(1) und der
entsprechenden Speicherung der möglichen Meßwerte
o(1) ∈ M(O(1) ) in den zugehörigen möglichen relativen
Zuständen des Meßapparates gibt es keine unabhängigen
Zustände mehr, die die Subsysteme O und A unabhängig
voneinander beschreiben. Allerdings ist in jedem Summanden |o(1) i ⊗ |[o1 ]i der Linearkombination (53) der relative Objektzustand durch einen Eigenzustand von O(1)
gegeben und der Zustand der entsprechende relative Zustand der Meßapparatur beschreibt stellt exakt den Sachverhalt dar, daß der Meßapparat diesen Objektzustand
tatsächlich registriert hat.
Lassen wir das Objektsystem nun ein weiteres Mal
mit der Meßapparatur in Kontakt treten und fragen, wie
das Gesamtsystem, welches ursprünglich im Zustand (53)
vorliegt, nun zu beschreiben ist. Die Antwort kennen wir:
| zi =
X
d(o(1) ) | o(1) i ⊗ | [o(1) , o(1) ] i . (56)
o(1) ∈M(O (1) )
Wieder beschreibt |o(1) i ⊗ |[o(1) , o(1) ]i den relativen Objektzustand in einem Eigenzustand von O(1) , aber jetzt
beschreibt der relative Beobachterzustand den Sachverhalt, daß der entsprechende Meßwert zweimal registriert
wurde. Somit ist die Messung reproduzierbar, was eine direkte Konsequenz davon ist, daß nach einer Beobachtung
der Objektzustand relativ zu einem bestimmten Beobachterzustand eben der entsprechende Eigenzustand von
O(1) ist.
Wir betrachten jetzt eine ganz andere Situation: Das
Objekt O sei N 3 n-mal identisch kopiert worden, die Kopien sollen in keiner direkten Wechselwirkung miteinander stehen, können aber jeweils mit der Meßapparatur in
Kontakt gebracht werden. Was können wir mit so einem
Aufbau zustande bringen? Wir können die Observable O
an einer Untermenge der Kopien messen, sagen wir an
N 3 r ≤ n Kopien. Offenbar gilt dann für den Zustand
des Gesamtsystems (jede Kopie wird als Subsystem aufgefaßt),
|z(r) i =
X
o1 ∈M(O)
···
X
or ∈M(O)
f (o1 ) . . . f (or )|o1 i ⊗ · · · ⊗ |or i ⊗
⊗
n
O
|zj i ⊗ |[o1 , . . . , or ]i .
(57)
j=r+1
Die Interpretation von (57) ist jetzt klar: jeder Term
r
|o1 i⊗· · ·⊗|or i⊗|zj i⊗j=1 ⊗|[o1 , . . . , or ]i in der Linearkombination (57) beschreibt eine Beobachterin/einen Beobachter mit einem bestimmten Speicherinhalt [o1 , . . . , or ].
Bezüglich dieser so charakterisierten Beobachter sind die
beobachteten Kopien von O relativ zum Speicherinhalt
in Zuständen |oj i , j ∈ {1, . . . , r} ⊂ N, die allesamt Eigenzustände von O sind, währen die restlichen Kopien
unberührt in ihren ursprünglichen Zuständen |zk i , k ∈
{r + 1, . . . , n} ⊂ N bleiben.
Betrachten wir nun die Situation, in der eine Beobachterin/ein Beobachter die folgende Konfiguration von
Meßdaten im Speicher hat: [o1 , . . . , or ], wobei die oj , j ∈
{1, . . . , r} jetzt fest sind. Wir nehmen an, daß jetzt einer
der Meßwerte reproduziert wird, die Konfiguration von
Meßdaten im Speicher sieht dann so aus:[o1 , . . . , or , ok ] :
k ∈ {1, . . . , r}. Jeder Term der Linearkombination (57)
beschreibt dann eine Beobachterin/einen Beobachter mit
einem Speicherinhalt, bei dem an der k-te und (r + 1)te Position der gleiche Meßwert eingetragen ist. Für die
Beobachterin/den Beobachter, selbst ein Subsystem und
eben nicht losgelöst vom Objektsystem, erscheint die Sequenz von Messungen derart, daß jede Messung das Objektsystem in den entsprechenden Objektzustand (Eigenzustand der Observablen) springen läßt, in dem es dann
während der Meßreihe verbleibt.
Dies bedeutet: Obwohl während der gesamten Meßreihe nur ein physikalisches System die Beobachterin/den
Beobachter repräsentiert, gibt es dennoch keinen einzigen
Zustand, der die Beobachterin/den Beobachter eindeutig
beschreibt. Vielmehr ist der Zustand des Gesamtsystems
als Linearkombination gegeben, in der jeder Term einen
bestimmten Beobachterzustand relativ zum zugehörigen
Objektzustand ausweist. Jede Beobachtung führt dazu,
daß jeder ursprüngliche Beobachterzustand in weitere
verschiedene Beobachterzustände aufspaltet. Jedem dieser Zustände entspricht ein unterschiedliches Meßergebnis und der zugehörige Objektzustand. Alle Möglichkeiten nach einer Meßreihe sind dabei simultan realisiert in
der Linearkombination.
Im Gegensatz zur Klassischen Mechanik (Trajektorie
im Phasenraum) existiert in der Quantenmechanik für
eine Meßreihe also nicht nur eine Speicherkonfiguration, sondern ein ganzer Graph von Speicherkonfigurationen derart, daß sämtliche nach einer Meßreihe möglichen Speicherkonfigurationen Teil der Linearkombination sind, die den Zustand des Gesamtsystems beschreibt,
wobei die möglichen Konfigurationen mit unterschiedlichen Koeffizienten in der Linearkombination auftreten
können.
Nun ist Physik aber eine quantitative Naturbeschreibung und es stellt sich die Frage, was es in dieser Situation überhaupt quantitativ auszusagen gibt? Eine quantitative Aussage, die wir gerne machen möchten, betrifft
30
die Frequenz, mit der bestimmte Meßwerte in einer Meßreihe auftauchen. Es genügt, Linearkombinationen der
folgenden Form zu betrachten:
X
Z 3| z i =
f (o)|oi .
(58)
o∈M(O)
Wir suchen ein Vorschrift, jedem Element der Linearkombination ein Maß µ : Z −→ R+ so zuzuordnen, die
kompatibel ist mit der Häufigkeit, mit der der betreffende Meßwert von einem gegebenen Beobachter gemessen
wird.
Da die {|oi}o∈M(O) eine vONB bilden, können wir | z i
auch als den Vektor (f (o1 ), . . . , f (odim(Z) ))T ∈ Cdim(Z)
auffassen, wobei oj ∈ M(O) , j ∈ {1, . . . , dim(Z)}.
Jede Komponente zerlegen wir nun so: C 3 f (oj ) =
|f (oj )| exp (iϕ(oj )). Die Phasen exp (iϕ(oj )) fassen wir als
Elemente von U(1) auf, die als Abbildung R −→ C einbetten. Sie können damit nicht als Bewegungen auf R im
maßtheoretischen Sinn erklärt werden. Nach Voraussetzung sind die Eigenzustände {|oi}o∈M(O) normiert. Die
Normierungsvorschrift legt den Zustand aber ebenfalls
nur bis auf eine Phase fest, die aber prinzipiell willkürlich
ist: [|oi] := {|o0 i ∈ Z : |o0 i = exp (iψ)|oi , ψ ∈ [0, 2π] ⊂
R}. Insgesamt ergibt sich also für einen Term in der Linearkombination (58) wieder eine Äquivalenzklasse, die
wir kurz mittels der Äquivalenzrelation charakterisieren:
f (oj )|oj i ∼ exp (iγj )|f (oj )||oj i , γj ∈ [0, 2π] ⊂ R. In obiger Notation, γj = ϕ(oj ) + ψj , da aber ψj prinizpiell beliebig ist, ist auch γj beliebig. Es bietet sich nun an, diesen Phasenfaktor ganz im Eigenzustand zu absorbieren.
Dann gilt | z i =
b (|f (o1 )|, . . . , |f (odim(Z) )|)T . So gesehen
ist das gesuchte Maß eine Funktion µ : Rdim(Z) −→ R der
Komponenten |f (oj )|. Da Maße extensive Größen sind,
gilt
X
µ |f (o1 )| , . . . , f (odim(Z) ) =
µ (|f (o)|) .
o∈M(O)
(59)
Wir haben immer die Freiheit, das Maß auf
Eins zu normieren. Dann haben wir einerseits
µ(|f (o1 )|, . . . , |f (odim(Z) )|) = 1, da alle möglichen
Meßwerte im Spektrum M(O) berücksichtigt wurden.
Andererseits liefert die Normierung des Zustandes
X
!
2
1 = hz | z i =
|f (o)| .
(60)
o∈M(O)
Gleichsetzen von (59) und (60) liefert µ(|f (o)|) = |f (o)|2 ,
o ∈ M(O), da dies für alle Linearkombinationen gelten
muß.
Wenden wir sogleich unsere Vorschrift auf (57) an,
so wird jedem
NnElement der Linearkombination |o1 i ⊗
· · · ⊗ |or i ⊗ j=r+1 |zj i ⊗ |[o1 , . . . , or ]i das Maß (Gewicht) µ(f (o1 ), . . . , f (or )) = |f (o1 )|2 · · · |f (or )|2 zugeordnet. Das Gewicht, welches einer bestimmten Speicherkonfiguration [o1 , . . . or ] zugeordnet wird, ist also das Produkt der Gewichte für die einzelnen Speicherinhalte.
Es gibt einen direkten Zusammenhang zwischen Maßtheorie, wie sie hier ganz simpel zum Einsatz kommt, und
Wahrscheinlichkeitstheorie. Dieser erlaubt uns, Gewichte der Form µ(f (o1 ), . . . , f (or )) gleichzusetzen mit der
Wahrscheinlichkeit, eine Meßreihe (Speicherkonfiguration) [o1 , . . . or ] vorzufinden, vorausgezetzt die Meßreihe
ist ausreichend lang, so daß sie als zufällig generierte
Folge von Messungen angesehen werden kann. Dies kann
sofort verallgemeinert werden auf Meßreihen verschiedener Observablen.
V.
UNBESCHRÄNKTE OBSERVABLEN
Wir lassen jetzt die Einschränkung dim(Z) < ∞ fallen, betrachten also zum Beispiel Observablen O mit
M(O) = R. Die Theorie dieser Observablen (unbeschränkte Operatoren) ist recht vielseitig und auch subtil.
Eine präzise Skizze finden Sie in Abschnitt II F, hier gehen wir heuristischer vor mit einem strengen Augenmerk
auf die Aspekte, die tatsächlich relevant sind für die Beschreibung quantenmechanischer Systeme und nicht ausschließlich der logischen Konsistenz geschuldet sind.
Zunächst fällt auf, daß es wohl wenig sinnvoll scheint
von der Wahrscheinlichkeit zu sprechen, einen Meßwert
o ∈ M(O) bei einer entsprechenden Messung von O an
einem Zustand aus Z vorzufinden. Auch klassisch können
wir Meßwerte nur mit endlicher Genauigkeit bestimmen,
in diesem Sinne sind reelle Zahlen in der Natur nicht observabel realisiert. Es mach vielmehr Sinn, in beiden Naturbeschreibungen, einen Meßwert in einem bestimmten
Intervall anzusiedeln.
In der Theorie Linearer Operatoren ist diese Einsicht
eng mit der mathematischen Tatsache verknüpft, daß
die zugehörigen Eigenzustände gar nicht normierbar sind
und daher nicht bona fide Zustände eines quantenmechanischen Systems darstellen können. Insbesondere ist
es unmöglich, ein System so zu präparieren, daß es durch
einen nicht normierbaren Zustand repräsentiert werden
kann.
Eine Beschreibung solcher Observablen verdanken wir
von Neumann. Seine Charakterisierung basiert auf der
Existenz von 1–Parameter Familien von Projektoren
{Eo }o∈R , mit der Eigenschaft: Für beliebige Zustände
|φi|, |ψi ∈ Z gilt
Z
hφ|O|ψi =
dhφ|Eo |ψi o .
(61)
R
Hierbei ist f (o) := hφ|Eo |ψi als differenzierbare Funktion zu verstehen, und df (o) = do f 0 (o), wobei f 0 (o) :=
df /do. Das Integral ist dann das gewöhnliche Riemann–
Integral. Es soll nicht verschwiegen werden, daß die Mathematik diese Charakterisierung von O auch dann noch
hoch hält, wenn die Funktion f nicht differentierbar ist.
Allerdings erfordert dies eine Verallgemeinerung des Integralbegriffs hin zum sogenannten Riemann–Stieltjes–
Integral.
31
Für jedes Intervall I := [b, c] ⊂ R , b < c definieren wir
Z
df
EI =
dEo .
(62)
(4) Sei M(O) nicht entartet. Dann ist mit obiger Notation
W (o ∈ I ⊂ M(O) , |ψi ∈ Z)
Z
=
do |hψ|oi|2
I
EI projiziert auf den Unterraum von Z, in dem die
Zustände liegen, die zu Eigenwerten o ∈ I ⊂ M(O) der
Observablen O gehören. Die Wahrscheinlichkeit W(o ∈
I ⊂ M(O) , |ψi ∈ Z), daß eine Messung von O am physikalischen System im Zustand |ψi ∈ Z einen Meßwert
o ∈ I ⊂ M(O) im Intervall I liefert ist
W (o ∈ I ⊂ M(O) , |ψi ∈ Z) = hψ|EI |ψi .
die Wahrscheinlichkeit dafür, bei einer Messung der
Observablen O an einem physikalischen System im
Zustand |ψi einen Meßwert im Intervall I zu beobachten.
(63)
Für diese Konstruktion ist essentiell, daß I 3 b, c : b <
c, da keine Projektoren auf einzelne Zustände |oi , o ∈
M(O) existieren, noch schlimmer: @|oi ∈ Z : O|oi = o|oi.
Eine kreativere Charakterisierung unbeschränkter Observablen verdanken wir Dirac. Dirac hat hemmungslos
angenommen, daß Eigenzustände |oi in irgend einem Sinne existieren müssen. Diese mutige Annahme konnte im
Rahmen von sogenannten Gel0 fand − Tripeln mathematisch konsistent realisiert werden, aber das ist Thema
einer anderen Vorlesung. Wir lassen uns von Dirac’s erfahrener Leichtigkeit anstecken und postulieren folgende
empirische Regeln:
Diese empirischen Regeln können als kontinuierliche Verallgemeinerung der diskreten Beschreibung aus Abschnitt
III C angesehen werden. Regel (1) ist natürlich mit Vorsicht zu genießen, da im Falle o0 6= o dem Zustand |oi
ja keine vernünftige Norm zugeordnet werden kann. Von
Neumanns Konstruktion erlaubt folgende Meinung: im
Prinzip sollten wir mit einer kontinuierlichen Überlagerung von Zuständen arbeiten, deren zugehörigen Eigenwerte in einem abgeschlossenen Intervall liegen. Aber das
ist mühsam.
Der heuristische Anschluß an von Neumanns Beschreibung unbeschränkter Observablen ist folgendermaßen
gut einprägsam:
(1) Gibt es Zustände {|oi}o∈M(O) mit O|oi = o|oi für
o ∈ M(O), wobei M(O) = R möglich ist, so können
diese in folgendem verallgemeinerten Sinne orthonormiert werden:
ho0 |oi = δ (o0 − o) , o, o0 ∈ M(O) .
VI.
M(O)
(3) Folgende Rechnung macht Sinn: Seien |ψi, |φi ∈ Z.
Dann ist
Z
Z
hψ|φi =
do
do0
0
M(O)
0
hψ|oiho|o iho |φi
Z
do hψ|oiho|φi
=
M(O)
Z
≡
do ψ ∗ (o)φ(o) .
(66)
M(O)
Insbesondere gilt:
Z
k|ψik2 ≡ hψ|ψi =
do |hψ|oi|2
M(O)
Z
≡
do |ψ(o)|2 .
M(O)
dEo = do |oiho| .
(64)
(2) Jeder Zustand | z i ∈ Z kann nach den verallgemeinersten Eigenzuständen entwickelt werden:
Z
| zi =
do |oiho | z i .
(65)
M(O)
(68)
I⊂M(O)
(67)
(69)
KONSTRUKTION VON OBSERVABLEN I
— ELEMENTARE OBSERVABLEN
Elementare Observablen heißen die Observablen,
die in einem bestimmten Sinne zu den klassischen Observablen korrespondieren, die den Phasenraum eines mechanischen Systems bilden, also Ort und Impuls. In der
Klassischen Mechanik lassen sich aus diesen dann alle
anderen Observablen in bekannter Weise konstruieren.
A.
Ort als quantenmechanische Observable
Gegeben sei ein quantenmechanisches System im Zustand | z i ∈ Z. Zum Beispiel kann | z i den Zustand
eines freien Teilchens beschreiben, welches sich irgendwo
auf dem reellen Zahlenstrahl R1 befinde. Sicherlich ist es
legitim zu fragen, und diese Frage stellen wir uns klassisch gewohnheitsmäßig, wo sich das Teilchen im Zustand
| z i zum Zeitpunkt der Ortsmessung befindet?
Diese Frage ist der Anker unserer Konstruktion von
Observablen. In diesem Stadium brauchen wir empirische Erfahrungen, die wir klug in unsere mathematische Modellbildung einbeziehen. Da es sich um ein freies
Teilchen handelt, kann es a priori jeden Punkt im R1
als Ort einnehmen. Bezeichnen wir die Ortsobservable mit Oq , so gilt sicherlich M(Oq ) = R1 . Es handelt
sich also um eine unbeschränkte Observable. Es gibt nun
32
Zustände |xi , x ∈ M(Oq ), in denen Orte gespeichert werden können, und aus denen diese folgendermaßen ausgelesen werden können Oq |xi = x|xi , x ∈ M(Oq ). Diese Ortsspeicher sind verallgemeinerte Eigenzustände von
Oq , und wir erinnern uns, daß |xi ∈
/ Z.
Der Ausleseprozeß (die Ortsmessung) setzt voraus, daß
unser Meßgerät (Detektor) irgendwo auf R1 stationiert
wird. Sagen wir, der Detektor nehme das abgeschlossene
Intervall I ⊂ R1 ein. Ausschließlich im Detektorintervall
kann das Teilchen nachgewiesen werden, d.h. wenn gilt
Z
Z
dx |xihx | z i = | z i −
dx |xihx | z i
I⊂M(Oq )
M(Oq )/I
6= 0 .
(70)
Das Teilchen muß sich offenbar entweder im Detektorintervall befinden oder außerhalb davon:
Z
| zi =
dx |xihx | z i
I∪(M(Oq )/I)
Z
dx |xihx | z i .
=
(71)
R
Daraus folgt, daß die Wahrscheinlickeit dafür, das Teilchen im Detektor vorzufinden (also dafür, daß der Detektor das Teilchen nachweist) folgendermaßen gegeben
ist:
Z
W (x ∈ I, | z i ∈ Z) =
dx |Z(x)|2
I
= 1 − W (x ∈ M(Oq )/I, | z i ∈ Z) .
(72)
wobei wir Z(x) := hx | z i gesetzt haben. In der Literatur wird W (x ∈ I, | z i ∈ Z) oft die Aufenthaltswahrscheinlichkeit des Teilchens im Detektor genannt, oder
auch
Der Erwartungswert E(Oq , | z i) := hz|Oq | z i für
den Ort des Teilchens im Zustand | z i ∈ Z ist
Z
E(Oq , | z i) ≡ hz|Oq | z i =
dx |Z(x)|2 x . (73)
R
Die Interpretation dieses Ausdrucks ist klar: |Z(x)|2 ist
das Gewicht (die Wahrscheinlichkeit) dafür, das Teilchen
am Ort x ∈ R vorzufinden, und das Integral summiert
alle möglichen Aufenthaltsorte mit ihrer entsprechenden
Gewichtung auf. Die Gewichte sind wie üblich normiert:
E(id, | z i) = hz | z i = 1, wobei id | z i =| z i , | z i ∈
Z. Nun muß auch |z0 i := Oq | z i normierbar sein, also
E(id, |z0 i) < ∞. Dies führt auf
Z
dx |Z(x)|2 x2 < ∞ .
(74)
Für Z ∈ D(Oq ) setzen wir (Oq Z)(x) = xZ(x).
Offenbar ist Oq unbeschränkt, wir brauchen lediglich
Z ∈ L2 (R) mit Träger nahe bei ±∞ zu wählen. So
können wir kOq Zk beliebig groß werden lassen, und
gleichzeitig kZk = 1 haben. Natürlich macht der Ausdruck xZ(x) auch dann noch Sinn, wenn Z ∈
/ D(Oq ),
aber es ist dann halt xZ(x) ∈
/ L2 (R). Wir sehen jedoch,
daß es aus physikalischen Gründen unerläßlich ist, nur
Z ∈ D(Oq ) ⊂ L2 (R) zu erlauben, weswegen obige Einschränkung des Definitionsbereiches vorgenommen werden muß. Dabei ist D(Oq ) der größte Definitionsbereich,
für den Oq Z ∈ L2 (R) gilt.
Die Verallgemeinerung auf R3 als Ortsraum macht keine große Mühe. Allerdings lohnt es sich, auf eine konzeptionelle Überlegung hinzuweisen. Bezeichnen wir mit Oq1
die Ortsobservable, mit deren Hilfe die Ortsinformation
entlang der q1 –Richtung ausgelesen werden kann, und ensprechend mit Oq2 die Ortsinformation entlang der q2 –
Richtung. Das quantenmechanische System liege im Zustand | z i ∈ Z vor. Eine interessante Frage ist nun, ob
die Reihenfolge der Ortsmessungen eine Rolle spielt? Es
ist eine Erfahrungstatsache, daß auf den Längenskalen,
die uns in dieser Vorlesung interessieren, Ortsmessungen
kommutieren: [Oq1 , Oq2 ] | z i = 0 ∀ | z i ∈ Z, d.h. die
Reihenfolge der Ortsmessungen ist unerheblich, Ortsoperatoren kommutieren. Wir ahnen bereits, daß dies keine
Selbstverständlichkeit ist. Andererseits betrachten wir im
Moment nur quantenmechanische Systeme im Euklidischen Vektorraum, der mit einer klassischen Geometrie
ausgestattet ist. Die Fragestellung, ob diese Geometrie
quantisiert werden kann, liegt außerhalb dieses Vorlesungsrahmens.
B.
Impuls als quantenmechanische Observable
Gegeben sei eine klassische Observable B : P −→ R
auf dem Phasenraum P ∼
= T ∗M ∼
= R3 × R3 eines mechanischen Systems, und (q, p) ∈ P. Wir vergleichen jetzt
B(q + a, p) , a ∈ R3 mit B(q, p). Ohne große Bedenken
gilt formal: B(q + a, p) = (1 + ∇a + . . . )B(q, p), wobei
∇a ≡ a · ∇ die Richtungsableitung in Richtung a bezeichne. Also können wir in der Klassischen Mechanik
einen Translationsoperator einführen. Bezeichne O(P)
die Menge der Observablen auf P, so ist eine endliche
Translation in Richtung a ∈ R3 folgendermaßen gegeben: Ta : O(P) −→ O(P), definiert als B −→ Ta (B) :=
B ◦ Ta , wobei
df
R
Dies ist der Ausgangspunkt für eine anständige Definition
der Ortsobservablen:
Def. VI.1 (Ortsoperator) Sei Z = L2 (R) und D(Oq )
der Definitionsbereich von Oq ,
Z
2
2 2
D(Oq ) = Z ∈ L (R) :
dx |Z(x)| x < ∞ .(75)
R
(Ta (B))(q, p) = B(q + a, p)
= exp (∇a )B(q, p) .
(76)
Nun ist es oft zweckmäßiger direkt mit dem Generator
Gâ für Translationen in Richtung â ≡ a/kak
df
Gâ =
lim dTa /dkak
kak→0
(77)
33
zu arbeiten, wobei die Abbildungsvorschrift klar sein sollte. Somit ist Gâ = ∇â der (infinitesimale) Generator für
Translationen in Richtung â. Offenbar handelt es sich bei
Translationen um eine Abelsche Gruppe, d.h. die Generatoren für Translationen kommutieren. Ist ein mechanisches System invariant unter räumlichen Translationen
(Homogenität des Raumes), so impliziert diese Symmetrie mittels eines Satzes von Noether die Erhaltung des
linearen Impulses.
Es ist instruktiv, eine algebraische Vorschrift für Translationen zu finden. Dazu betrachten wir die Fourier–
Transformierte von B(q, p), die wir folgendermaßen noe p)](q, p). Damit wird aus (76):
tieren: B(q, p) = FT [B(k,
e p)] (q, p) =
Ta FT [B(k,
h
i
e p) (q, p)
FT exp (iha, ki)B(k,
(78)
Der Generator für Translationen in Richtung â im
Fourier–Raum ist also gerade hâ, iki. Für den Spezialfall,
daß â mit einem Einheitsvektor unseres Koordinatensystems zusammenfällt, finden wir somit, daß der zugehörige Generator im Fourier–Raum gerade die entsprechende
Komponente des zu q Fourier–konjugierten Impulses ist.
Wir merken uns als wichtiges Resultat folgende Fourier–
Korrespondenz: ∇ =
b ik.
Noch ein Wort zu den Maßeinheiten: Eigentlich hat k
die Maßeinheit einer inversen Länge L, [k] = 1/L. Dies
garantiert, daß ha, ki frei von Maßeinheiten ist. Damit
trägt k aber nicht die Maßeinheit, die zu einem Impuls
gehört: [Impuls] = M L/T , wobei M für die Maßeinheit
von Masse steht, und T für die Maßeinheit in der Zeit
gemessen wird. Wir werden weiter unten sehen, daß k
mittels einer dimensionsbehafteten Konstante so reskaliert werden kann, daß k ∝ Impuls gilt.
Unsere Sichtweise ist jetzt folgende: In der Klassischen
Mechanik ist der Impuls definiert als der Generator
von räumlichen Translationen, wenn diese im Fourier–
Raum ausgewertet werden. Diese operationelle Sichtweise übertragen wir nun in die Quantenmechanik. Zunächst
einmal müssen wir das Konzept von Translationen in die
Quantenmechanik übertragen. Das prinzipiell (also nicht
nur für diesen Fall) geeignte Mittel zum Übertragen von
klassischen Konzepten ist Darstellungstheorie.
Def. VI.2 Sei G eine (Matrix–) Gruppe, Z ein komplexer Hilbert–Raum und U(Z) die unitäre Gruppe von Z.
Eine unitäre Darstellung von G in Z ist ein Gruppenhomomorphismus
U : G −→ U(Z) ,
(79)
der in folgendem Sinn stetig ist: Für alle konvergenten Folgen (gν ) in G und alle |ψi ∈ Z gilt: Die Folge
(U (gν )|ψi) konvergiert bezüglich der Norm in Z und es
gilt lim U (gν )|ψi = U (lim gν )|ψi.
Die Darstellung heißt treu, wenn U injektiv ist, also
wenn G isomorph zur Untergruppe U (G) ⊂ U(Z) ist.
Die Qualifikation unitär spielt eine wichtige Rolle, weil
sie grantiert, daß die Darstellung auf Z normerhaltend
operiert.
Betrachten wir einmal etwas umständlich für | z i ∈ Z,
Z ∈ D(Oq ), x, x0 ∈ M(Oq ) und a ∈ R3 :
Z
(U (Ta )Z)(x) ≡ hx|U (Ta ) | z i =
d3 x0 hx|U (Ta )|x0 ihx0 | z i
R3
Z
df
=
d3 x0 hx|x0 + aihx0 | z i
R3
= Z(x − a)
= (exp (−∇a )Z) (x) .
(80)
Es fällt auf, daß U (Ta ) nicht manifest unitär ist. Das
bedeutet nicht, daß die Darstellung nicht unitär ist, sondern zunächst einmal lediglich, daß die Unitarität der
Darstellung nicht offenkundig ist. Aber dies bedeutet
auch, daß wir noch nicht davon ausgehen können, daß
U (Ta )|xi = |x + ai eine sinnvolle Vorschrift ist.
Wir beginnen ganz heuristisch ohne allzu große Bedenken technischer Natur. In Anlehnung an den klase
sischen Fall betrachten wir Z(x) = FT [Z(k)](x)
e
und rechnen (U (Ta )Z)(x) = (U (Ta )FT [Z(k)])(x)
=
e
FT [exp (iha, ki)Z(k)](x).
Dabei haben wir benutzt, daß
∇ exp (ihk, xi) = ik exp (ihk, xi) .
(81)
Dies suggeriert, daß ∇/i ein unbeschränkter Operator ist
mit ebenen Wellen als Eigenfunktionen zu Eigenwerten
k ∈ R3 , M(∇/i) = R3 . Damit ist ∇/i ein guter Kandidat
für eine Observable. Außerdem ist seine Interpretation
evident: Modulo dem oben angesprochenen Problem mit
den Maßeinheiten ist ∇/i ∝ Op , dem Impulsoperator (der
Observable Impuls in der Quantenmechanik).
Lassen Sie uns das Problem mit den Maßeinheiten ein
für alle Mal aus der Welt schaffen, bevor wir mit der
Konstruktion fortfahren. De Broglie hatte 1924 eine ungemein revolutionäre Idee. Er fand es angebracht (wir
folgen hier nicht der historischen Entwicklung und halten uns eher bedeckt, was wellenmechanische Ideengeschichte betrifft, da dies aus heutiger Sicht nicht mehr
so relevant zu sein scheint), Teilchen Welleneigenschaften zuzusprechen. Für ein Teilchen der Masse m mit
einer Geschwindigkeit v c soll nach de Broglie folgende Beziehung zwischen dem Impuls p dieses Teilchens im Laborsystem und der diesem Teilchen über seine
Welleneigenschaft zugeordnete Wellenlänge λ bestehen:
λ = h/p, dabei ist h eine dimensionsbehaftete Konstante mit [h] = [Wirkung] = M T . Es stellte sich heraus,
daß h gerade die Planck–Konstante (auch Plancksches
Wirkungsquantum). Nach de Broglie vermittelt das Wirkungsquantum gerade die Konversion zwischen Teilchen–
und Welleneigenschaften der Materie. Für uns ist wichtig, daß Op = ~∇/i, wobei ~ := h/2π.
Bei unserer heuristischen Untersuchung haben wir also folgendes gefunden: Generator für räumliche Translationen von quantenmechanischen Zuständen ist der Impulsoperator Op = ~∇/i mit M(Op ) = R3 , und
Op N exp (ihp, xi/~) = p N exp (ihp, xi/~) , (82)
34
wobei N eine Konstante bezeichnet. Offenbar liegen die
Eigenfunktionen von Op nicht in Z. Eine rigorose Untersuchung bezüglich der Fragestellung, ob Op selbstadjungiert ist oder eine selbstadjungierte Erweiterung besitzt
wird hier nicht gegeben und ist Gegenstand der Theorie Linearer Operatoren in Hilbert–Räumen. Wir halten
fest:
Die Konstante N bestimmt sich aus der Rechnung
(p, p0 ∈ M(Op ))
Z
0
hp|p i =
d3 x hp|xihx|p0 i
R3
Z
2
= |N |
d3 x exp (ihx, p − p0 i/~)
R3
2
Def. VI.3 (Impulsoperator) Sei AC(R) die Menge
der absolut stetigen Funktionen auf R. Der Impulsoperator Op ist definiert durch: D(Op ) = AC(R) und
(Op Z)(x) = −i~Z 0 (x) , Z ∈ AC(R).
Bemerken Sie, daß die Definition für eine Komponente
der Impulsobservablen gegeben wurde. Wichtig ist nun
der
Satz VI.1 Es gilt Op = Op† , d.h. der Impulsoperator ist
selbstadjungiert.
Weiter oben, Gleichung (80), haben wir gefunden, daß
U (Ta ) = exp (−∇a ) ist. Dies können wir aber auch so
notieren: U (Ta ) = exp (−ia Op /~). Da Op selbstadjungiert ist, ist U (Ta ) unitär (nach einem Satz von Stone). Wir müssen hier natürlich vorsichtig sein mit dem
Verständnis von U (Ta ) als Exponentialfunktion, da Op
unbeschränkt und selbstadjungiert ist.
So einsichtig diese Konstruktion der quantenmechanischen Impulsobservablen analog zur operationellen Vorschrift in der Klassischen Mechanik verläuft, so bricht sie
doch mit einer modernen Einsicht, nämlich, daß essentielle Informationen des quantenmechanischen Systems
immer von den Zustandsvektoren | z i ∈ Z getragen
werden und Wellenfunktionen wie Z(x) ≡ hx | z i oder
Z(p) ≡ hp | z i lediglich wegen ihres anschaulichen Charakters Einzug finden. Mathematisch könnten wir an dieser Stelle entgegnen, daß Wellenfunktionen wenigstens in
einem Hilbert–Raum liegen, aber das ist nur auf der formalen Ebene von einer gewissen strukturellen Relevanz.
Mit Dirac fordern wir die Existenz von Eigenzuständen
{|pi}p∈M(Op ) zu Op :
Op |pi = p|pi ,
(83)
auch wenn diese nicht normierbar sind, wichtig zur Naturbeschreibung ist ja vielmehr
Z
Z 3 Op | z i =
d3 x |xihx|Op | z i
R3
Z
=
d3 x |xi (Op Z) (x) ,
(84)
R3
woraus folgt, daß hx|Op | z i = Op Z(x). Insbesondere
erhalten wir daraus die nützliche Beziehung hx|Op |pi =
Op hx|pi. Die Eigenwertgleichung (83) lautet dann ausgedrückt durch Wellenfunktionen: Op hx|pi = phx|pi. Ein
Vergleich mit (82) liefert:
hx|pi = N exp (ihx, pi/~) .
(85)
3
= |N | (2π~) δ (3) (p − p0 ) .
(86)
!
Wir wählen in Einklang p
mit hp|p0 i = δ (3) (p − p0 ) die Kon+
stante als R 3 N = 1/ (2π~)3 .
Es ist zwar fast schon offensichtlich, aber trotzdem instruktiv: Den Zusammenhang zwischen den Wellenfunktionen Z(x) und Z(p) erhalten wir ganz zwanglos:
Z
Z(x) ≡ hx | z i =
d3 p hx|pihp | z i
R3
d3 p
Z
=
R3
p
(2π~)3
Z
Z(p) ≡ hp | z i =
exp (ihx, pi/~)Z(p) ,
d3 x hp|xihx | z i
R3
d3 x
Z
=
R3
p
(2π~)3
exp (−ihx, pi/~)Z(x) , (87)
was noch einmal die Praktikabilität von Diracs Notation eindrucksvoll unterstreicht, insbesondere, wenn wir
uns auch noch zu einer Verallgemeinerung der Einsteinschen Summenkonvention durchringen könnten. Dann
wären die Fourier–Transformationen kurz und bündig
wie folgt notiert: Z(x) ≡ hx | z i = hx|pihp | z i und
Z(p) ≡ hp | z i = hp|xihx | z i, wobei |pihp| = id und
|xihx| = id benutzt wurde in dieser Schreibweise. Sie
verlangt eine gewisse Erfahrung, denn zum Beispiel ist
(Op Z)(x) ≡ hx|Op | z i = hx|Op |pihp | z i = phx|pihp |
z i 6= phx | z i = pZ(x) wenn | z i kein Eigenzustand von
Op ist.
C.
Verträglichkeit
Die sich aufdrängende Frage ist nun, ob sich ein Analogon zum Phasenraum der Klassischen Mechanik finden läßt. Dies setzt voraus, daß Ort und Impuls an einem quantenmechanischen System im Zustand | z i ∈
Z quasi simultan gemessen werden können, d.h., daß
Orts– und Impulsmessung sich nicht beeinflussen dürfen.
Dies können wir sofort überprüfen: Bezeichne Oq =
{Oq1 , Oq2 , Oq3 }, wobei q a ≡ hea , qi , a ∈ {1, 2, 3}, und
Op = {Op1 , Op2 , Op3 }, mit pb ≡ heb , pi , b ∈ {1, 2, 3},
usw. Dann ist
[Oqa , Opb ] | z i = (Oqa ◦ Opb − Opb ◦ Oqa ) | z i ,
Oqa ◦ Opb | z i = xa pb |xihx|pihp | z i ,
Opb ◦ Oqa | z i = −i~δba | z i + pb xa |pihp|xihx | z i (88)
.
35
Nun benutzen wir, daß M(Oq ) = M(Op ) und x, p stumme Bezeichner sind. Daher können wir im letzten Term
von (88) folgende Identität benutzen: pb xa |pihp|xihx |
z i = xa pb |xihx|pihp | z i. Als wichtiges Resultat erhalten
wir:
[Oqa , Opb ] = i~ δba ,
Z
dx |Z(x)|2 xa .
hz|Oqa | z i =
(90)
R
Ein Maß für die Ungenauigkeit, mit der q a im Zustand
| z i festgelegt ist, gibt die sogenannte Varianz
D
2 E
z Oqa − qza z
Z
2
=
dx Oqa − qza Z(x) ,
df
Varz (q a ) =
(91)
R
beziehungsweise die Streuung
df
Streuz (q a ) =
q
Varz (q a ) .
(92)
Für die Impulskoordinate pb gilt entsprechendes.
Offenbar gibt es Zustände, für die die Ortskoordinate bzw. die Impulskoordinate beliebig genau lokalisiert
sind, d.h. die Streuung der Orts– bzw. Impulskoordinate
ist beliebig klein. Jedoch ist es prinzipiell unmöglich, sowohl Streuz (q a ) als auch Streuz (pa ) gleichzeitig beliebig
klein (scharf) zu machen. Dieses ungeheuerliche Resultat
formulieren wir als
Satz VI.2 (Unschärferelation von Heisenberg)
Für jeden normierten Zustand | z i ∈ D ⊂ Z gilt:
Streuz (q a ) · Streuz (pa ) ≥ ~/2 .
Streuz (q a ) · Streuz (pa ) =
Schwarz
= Oqa − qza | z i k(Opa − pza ) | z ik =
D E
≥ z Oqa − qza (Opa − pza ) z E
D
≥ Im z Oqa − qza (Opa − pza ) z E
D = z Oqa − qza (Opa − pza ) z +
D
E
− z (Opa − pza ) Oqa − qza z /2
D E
= z Oqa − qza , Opa − pza z /2
E (89)
D = z [Oqa , Opa ] z /2 =
(89)
für alle möglichen Zustände eines beliebigen quantenmechanischen Systems.
Also sind Orts– und Impulsmessung in der Quantenmechanik nicht miteinander verträglich. Folglich macht
es keinen Sinn, daß ein Zustand als Speicher gleichzeitg
Orts– und Impulsinformation tragen kann. Im Vergleich
zur Klassischen Mechanik erlaubt die Quantenmechanik
nur Zustände, aus denen eben nicht die gesamte denkbare
Observablen–Information gleichzeitig ausgelesen werden
kann. Dies führt zum Konzept der maximal möglichen
(< gesamten) Information, die ein quantenmechanischer
Zustand quasi als Speicher tragen kann.
Wir können unser Erstaunen über die prinzipielle
Unverträglichkeit von Orts– und Impulsmessung weiter quantifizieren: Der Erwartungswert der Koordinate
q a , a ∈ {1, 2, 3} im Zustand | z i ∈ Z ist
df
qza =
schen Ungleichung:
(93)
Beweis VI.1 Zunächst einmal gilt mit der Schwarz-
= ~/2
(94)
Damit ist die Unschärferelation bewiesen. ∗–< [{; 0)
Die Unschärferelation von Heisenberg ist eine direkte Folge der Unverträglichkeit von Orts– und Impulsmessung,
die von prinizpieller Natur ist und nicht eine praktische
Schranke darstellt. Sie besagt salopp gesschrieben, daß
wir an einem quantenmechanischen System selbst mit
idealen Meßapparaturen niemals Ort und Impuls gleichzeitig beliebig scharf messen können. Und mehr noch:
Legen wir Wert auf mehr Schärfe bei der Ortsmessung,
so führt das aus fundamentalen Gründen zwingend zu
mehr Unschärfe bei der Impulsmessung. Eine solche fundamentale Unschärfe existiert im Gütligkeitsbereich der
Klassischen Mechanik nicht. Sie widerspricht sogar ganz
entschieden ihrer Zustandsbeschreibung. Damit sind wir
gezwungen, die Suche nach einem direkten Analogon zum
Phasenraum der Klassischen Mechanik nach Hamilton zu
verwerfen.
Im übrigen läßt sich die Unschärferelation wesentlich
verallgemeinern:
Satz VI.3 (Verallgemeinerte Unschärferelation)
Seien OA , OB Observablen. Dann gilt für alle Zustände
| z i ∈ D(OA OB ) ∩ D(OB OA ) ⊂ Z,
D E
Streuz (A) · Streuz (B) ≥ z [OA , OB ] z /2 . (95)
Beweis VI.2 Wie Beweis VI.1, da dort lediglich die
Selbstadjungiertheit von Oq , Op ausgenutzt und keine
speziellen Eigenschaften dieser Observablen benutzt wurden. ∗–< [{; 0)
D.
Energie als quantenmechanische Observable
Ein mechanisches System ist in der Formulierung nach
Hamilton charakterisiert durch das Paar (P, H), wobei P den Impuls–Phasenraum bezeichne und H die
Hamilton–Funktion. Unsere bisherigen Überlegungen haben sich daran orientiert, das Konzept des Phasenraumes
36
in die Quantenmechanik zu übertragen. Wir waren semi–
erfolgreich, da uns diese Überlegungen zwar zu Orts–
und Impulsobservablen geführt haben, diese allerdings
nicht beide gleichzeitig beliebig scharf gemessen werden
können. Mit der Energiefunktion H haben wir uns noch
nicht beschäftigt und das holen wir nun an dieser Stelle
nach.
Dazu bedarf es einer Erinnerung: Auch die Energie
eines Systems ist in der Klassischen Mechanik eine Bewegungskonstante, allerdings ist der Zusammenhang zu
einer Symmetrie etwas komplizierter zu verstehen, weil
ihre Erhaltung eine Konsequenz der Invarianz unter Zeittranslationen ist, und Zeit eine Sonderrolle in der Klassischen Mechanik spielt, was der Ignoranz gegenüver der
Speziellen Relativitätstheorie geschuldet ist. Zum einen
nämlich ist Zeit eine Komponente der Galilei–Raumzeit,
andererseits wird sie als Paramer benutzt, der die Dynamik in P schlicht parametrisiert.
Um den Zusammenhang zwischen Energieerhaltung
und Symmetrie bei Zeittranslationen aufzuzeigen, ist es
notwendig, die Doppelrolle der Zeit als Komponente der
Galilei–Raumzeit einerseits und als dynamischer Parameter andererseits in zwei getrennte Konzepte zu zerlegen. Das geht schnell so: Wir betrachten ein Lagrange–
System mit einem Konfigurationsraum Q ⊂ Rn und einer
Lagrange–Funktion L : Q × Rn −→ R. Wir erweitern Q
zum neuen Konfigurationsraum Q0 := Q × R mit Koordinaten (q, τ ). Der erweiterte Geschwindigkeitsphasenraum
ist dann Q0 × Rn+1 mit den Koordinaten (q, τ, v, ν). Die
Parameter–Zeit bezeichnen wir mit t, nicht zu verwechseln mit der physikalischen Zeit τ = f (t). Also ist ν =
dτ /dt. Was ist nun der Zusammenhange zwischen der
neuen (erweiterten) und der alten Lagrange–Funktion?
Diese Frage muß mit besonderem Bedacht angegangen
werden: Das ist der Fall, weil in der ursprünglichen Wirkung L ja über die Parameter–Zeit integriert wird. Es
gilt L0 (q, v, ν)dτ = L(q, v/ν)νdt. Wählen wir ν(t) = 1, so
liefern die Euler–Lagrange–Gleichungen für die erweiterte Lagrange–Funktion die gleichen Bewegungsgleichungen wie für die ursprüngliche Lagrange–Funktion.
Die Schar von Zeittranslationen {Ts }s∈R mit Ts :
Q0 −→ Q0 , definiert durch Ts (q, τ ) := (q, τ + sb) , b ∈ R
erfüllt offenbar L0 (Ts (q, τ ), DTs (v, ν)) = L0 (q, v, ν) wegen DTs = T0 = id, so daß sich nach dem Satz von
Noether über X(q, τ ) = d(q, τ +sb)/ds = (0, b) als Erhaltungsgröße IX (q, v) = h∂L0 /∂v, oi + (∂L0 /∂ν)(q, v, 1)b =
−bE ergibt. Der Name Energie ist gerechtfertigt, da für
natürliche Systeme E = T + U . Soweit die Wiederholung
aus der elementaren Mechanik.
Alternativ: Sei B(q, τ, v) eine Observable im erweiterten Geschwindigkeitsphasenraum. Wir vergleichen
B(q, τ + δ, v) , δ ∈ R mit B(q, τ, v). Ohne große Bedenken gilt formal B(q, τ + δ, v) = (1 + δ∂τ + . . . )B(q, τ, v).
Operationell führen wir daher in die Klassische Mechanik einen Zeittranslationsoperator folgendermaßen ein:
Tδ : O(P 0 ) −→ O(P 0 ), definiert durch
df
(Tδ (B)) (q, τ, v) = B(q, τ + δ, v)
= exp (δ∂τ )B(q, τ, v) .
(96)
Natürlich ist ∂τ der Generator für Zeittranslationen.
Die Fourier–konjugierte Variable zur physikalischen
Zeit τ hat die Maßeinheit einer Frequenz f . Durch ähnliche Überlegungen wie bei der Konstruktion der Impulsobservablen kann diese Frequenz mittel E = ~2πf ≡ ~ω
zu einer Energie E transformiert werden. Aus stilistischen Gründen bezeichnen wir die Energie–Funktion mit
H(q, p) (Hamilton–Funktion). Also ist der Generator für
Zeittranslationen im Frequenzraum gerade die Hamilton–
Funktion.
Die Übertragung in die Quantenmechanik ist nicht
so direkt, auch wenn sie trotzdem mittels unitärer
Darstellungstheorie geschieht, da die Zeit auch in der
Quantenmechanik eine Sonderrolle spielt. Tatsächlich ist
die Bühne für die Quantenmechanik auch die Galilei–
Raumzeit. Vorab die Situation: Eine zweckmäßige Vorstellung ist die, daß die Zeit mit einer Uhr gemessen wird,
die Teil eines klassischen Labors ist, aber niemals aus
einem quantenmechanischen Zustand extrahiert werden
kann. Mit anderen Worten, die Zeit bleibt eine externe
Größe. Nun könnten Sie mit Fug und Recht einwenden,
daß dies doch eigentlich auch für den Ort so sein sollte,
zumindestens sollten doch Ort und Zeit eigentlich über
Maßstab und Uhr beides Größen sein, die externen Charakter haben, weil sie eher unsere Laborausstattung (Koordinatensystem, etc) reflektieren, als eine intrinsische
Eigenschaft eines Systems. Und Sie haben damit vollkommen recht, sobald wir gezwungen sind, der spezielle
Relativitätstheorie Rechnung zu tragen, wird dies auch
so sein: dann werden weder Ort noch Zeit Eigenschaften
sein, die ein Zustand intrinsisch trägt. Vielmehr wird der
Zustand vermessen in einem Laborsystem, daß mit einem
Koordinatensystem und einer Uhr daherkommt.
Dass wir hier gegen Ihre Erwartung verstoßen liegt
nur daran, daß bereits in der klassischen Mechanik der
Ort (Konfigurationsraum, Phasenraum) eine ganz andere Rolle spielt als die Zeit (Parameter). Die Zeit ist bereits in der Klassischen Mechanik keine Meßgröße. Wie
gehen wir also vor? Zunächst einmal beschaffen wir uns
eine unitäre Darstellung der Zeittranslation, die wir mit
U (t − t0 ) , t ∈ [t0 , ∞) ⊂ R bezeichnen, und eine Zeittranslation von t0 nach t beschreiben soll. Wir setzen
Z 3| z i(t) := U (t − t0 ) | z i, wobei wir | z i den Zeitpunkt t0 zuordnen, also hierfür auch | z i(t0 ) schreiben
könnten. Dies setzt voraus, daß U (0) = id, was offenbar
sinnvoll ist. Für die Wellenfunktion im Ortsraum schreiben wir Z(t, x) := hx|U (t − t0 ) | z i(t0 ), auch wenn das
die offenkundige Ungleichbehandlung von Zeit und Ort
notationstechnisch verwässert.
Ähnliche Überlegungen wie zur Impulsobservablen zeigen, daß i~∂t ein selbstadjungierter Operator ist und
U (t − t0 ) = exp (−i(t − t0 )(i~∂t )/~) die gesuchte unitäre
Darstellung für Zeittranslationen über das Zeitintervall
t − t0 . Eine ensprechende Analyse im Fourier–Raum legt
nahe, i~∂t mit dem Hamilton–Operator OH zu identifizieren. Für diesen suchen wir noch einen Ausdruck in
Abhängigkeit von Orts– und Impulsobservablen, was ja
37
die Analogie zur Klassischen Mechanik darlegt, in der
die Hamilton–Funktion ja im Impulsphasenraum definiert ist. Der Frage ob OH = H(Oq , Op ) sinnvoll ist,
gehen wir im Abschnitt Kanonische Quantisierung
nach.
Im Moment haben wir folgende Beziehung zwischen
Operatoren: i~∂t = OH , also gilt für alle | z i ∈ Z,
i~∂t | z i(t) = OH | z i(t) .
(97)
Gleichung (97) heißt Schrödinger–Gleichung. Sie ist
die grundlegende Prozessgleichung der Quantenmechanik und beschreibt die (externe) Zeitentwicklung eines
quantenmechanischen Zustandes relativ zu einer externen Uhr, die als klassische Komponente des Labors vorausgesetzt wird. Im modernen Zugang, also nicht über
die Wellenmechanik, ist die Schrödinger–Gleichung eine direkte Konsequenz der unitären Darstellungstheorie von Zeittranslationen auf komplexen Zustandsräumen
Z, wenn als Isometriegruppe der Raumzeit die Galilei–
Gruppe angenommen wird.
Wir nehmen in dieser Vorlesung an, daß OH nicht explizit von der Zeit abhängt. Dann kann die Schrödinger–
Gleichung bequem integriert werden und wir erhalten als
formale Lösung der Schrödinger Gleichung mit Anfangsbedingung | z i(t)|t=t0 =| z i(t0 ):
| z i(t) = exp (−i(t − t0 )OH /~) | z i(t0 ) .
(98)
Dies war so bequem möglich, weil im Falle, daß OH
explizit zeitunabhängig ist, [OH , OH ] = 0 ∀t ∈
R. Im allgemeinen ist OH explizit zeitabhängig und
[OH (t1 ), OH (t2 )] 6= 0 , t1 , t2 ∈ R. Dann ist immer noch
eine formale Lösung der Schrödinger–Gleichung möglich,
und zwar in Form der sogenannten Dyson–Reihe.
Da zumindestens OH = f (Oq , Op ) gilt, ist es nicht
möglich, direkt Energie–Eigenzustände zu konstruieren,
denn Oq , Op vertragen sich ja nicht. Außerdem setzt
die Operatorbeziehung i~∂t = OH ja die Energie–
Observablen gleich der Zeittranslation relativ zu einer
externen Uhr, die nicht von den Zuständen | z i ∈ Z getragen wird und auch keine intrinsische Eigenschaft dieser Zustände mißt. Es läßt sich aber folgendermaßen eine
indirekte Konstruktion bewerkstelligen: Sei OA eine Observable mit [OA , OH ] = 0, also eine zu OH verträgliche
Observable, mit OA |ai = a|ai , a ∈ M(OA ). Dann ist offenbar OH |ai = E(a)|ai , E(a) ∈ M(OH ) ∀a ∈ M(OA ),
d.h. die möglichen Energie–Eigenwerte hängen von den
OA –Eigenwerten ab.
Für die Zeitevolution eines Zustandes | z i gilt dann
| z i(t) ≡ U (t − t0 ) | z i(t0 )
Z
X
= U (t − t0 )
|aiha | z i(t0 )
a∈M(OA )
=
Z
X
|ai exp (−i(t − t0 )E(a)/~)Z(t0 , a)
a∈M(OA )
≡
Z
X
Z(t, a)|ai .
a∈M(OA )
(99)
Hier wird deutlich, daß die Zeitabhängigkeit den Entwicklungskoeffizienten zugeschrieben wird, nicht den
Energie–Eigenzuständen. Mit anderen Worten, Zustände
entwickeln sich intrinsich gar nicht, lediglich die Wahrscheinlichkeiten, mit denen ein Zustand in einem bestimmten Observablen–Eigenzustand vorliegt. Das ist ein
ganz anderes Dynamik–Konzept, als wir es aus der Klassischen Mechanik gewöhnt sind, näher an der Dynamik
von Systemen die wir im Rahmen der Statistischen Mechanik behandeln.
Einsetzen unseres Resultates (99) in die Schrödinger–
Gleichung gibt die Schrödinger–Gleichung für die
Wellenfunktion Z(t, a) ≡ ha | z i(t),
i~∂t Z(t, a) = OH Z(t, a) .
(100)
Ein Zustand |ai eines quantenmechanischen Systems
heißt stationär, wenn er Eigenzustand von OH ist,
d.h. wenn es eine Observable OA gibt mit [OA , OH ] = 0
und OA |ai = a|ai, sagen wir zum Energie–Eigenwert
E(a) ∈ M(OH ). Im allgemeinen wird ein solcher Eigenzustand nicht im physikalischen Zustandsraum Z liegen,
aber das kümmert uns im Moment nicht, weil wir ja jeden
physikalischen Zustand des Systems nach diesen Eigenzuständen entwickeln können.
Für diesen Fall liefert die Schrödinger–Gleichung
|ai(t) = exp (−i(t − t0 )E(a)/~)|ai(t0 ). Da |ai ein Eigenzustand von OH ist, tritt in der Auswertung
der Zeittranslation keine Superposition von Energie–
Eigenzuständen auf, was eine wichtige Konsequenz hat:
|ai(t) ∼ |ai(t0 ), wobei die Äquivalenzrelation beide
Zustände dem selben Strahl zuweist, womit beide exakt
die gleiche physikalische Zustandsbeschreibung liefern.
E.
Nachlese: Unitäre Operatoren & Symmetrien
Wir systematisieren ein wenig unsere Erkenntnisse
über Symmetrien in der Quantenmechanik und Observablen.
Def. VI.4 Ein unitärer Operator ist eine surjektive C–
lineare Abbildung U : Z −→ Z, welche das Skalarprodukt in Z invariant läßt, d.h. für alle |φi, |ψi ∈ Z gilt:
hφ|U † U |ψi = hφ|ψi.
Ein unitärer Operator ist automatisch beschränkt
(und deshalb auch stetig), denn es gilt ja kU |ψik2 =
hψ|U † U |ψi = hψ|ψi = k|ψik2 wegen der Invarianzeigenschaft, also kU k = sup{kU |ψik : k|ψik = 1} =
sup{k|ψik : k|ψik = 1}. Ein unitärer Operator ist außerdem injektiv, denn für |φi, |ψi ∈ Z mit U |φi = U |ψi
gilt U (|φi − |ψi) = 0, also k|φi − |ψik = 0, und es folgt
|φi = |ψi. Damit ist jeder unitäre Operator U stetig
(nicht gezeigt) und bijektiv. Daher ist auch der inverse
Operator U −1 als linearer Operator auf ganz Z definiert,
und ist auch ein unitärer Operator.
Da außerdem für zwei unitäre Operatoren U1 , U2 auch
die Komposition U1 ◦ U2 : Z −→ Z unitär ist, bildet die
38
Gesamtheit der unitären Operatoren auf Z eine Gruppe
U(Z), die sogenannte unitäre Gruppe.
Def. VI.5 Eine 1–Parametergruppe von unitären Operatoren ist eine Schar {Us }s∈R , welche durch die Wirkung
Φ : R × Z −→ Z der Gruppe R auf Z gegeben ist, also
Us |ψi = Φ(s, |ψi) für (s, |ψi) ∈ R × Z, mit den folgenden
Eigenschaften:
(1) Us ∈ U(Z) ∀s ∈ R.
(2) s −→ Us |ψi , s ∈ R, ist stetig ∀|ψi ∈ Z.
Insbesondere folgt aus der Eigenschaft von Φ als Wirkung, daß für alle s, t ∈ R stets Us ◦Ut = Us+t gilt. In moderner Terminologie ist die Abbildung s −→ Us , s ∈ R,
von R nach U(Z) eine unitäre Darstellung der additiven
Gruppe R der reellen Zahlen.
Def. VI.6 Sei {Us }s∈R
eine 1–Parametergruppe
von
unitären
Operatoren.
Der
zugehörige
infinitesimale Erzeuger T ist wie folgt definiert:
n
o
df
D(T ) = |ψi ∈ Z : ∃ lim (Us − idZ ) |ψi/s
s→0
df
T |ψi = i lim (Us − idZ ) |ψi/s , |ψi ∈ D(T ) .
s→0
Es gilt jetzt der folgende
Satz VI.4 von Stone 1. Der infinitesimale Erzeuger einer 1–Parametergruppe von unitären Transformationen
ist selbstadjungiert.
2. Zu jedem selbstadjungierten Operator T auf Z gibt
es eine eindeutig bestimmte 1–Parametergruppe von
unitären Operatoren, zu der T der infinitesimale Erzeuger ist. Diese 1–Parametergruppe von unitären Transformationen wird in Abhängigkeit von T mit Us =
exp (−isT ) bezeichnet.
Damit stehen also Observablen in einer eineindeutigen
Korrespondenz zu einer 1–Parametergruppe von unitären
Operatoren.
Def. VI.7 Sei G eine (Matrix–) Gruppe, Z ein komplexer Hilbert–Raum und U(Z) die unitäre Gruppe von Z.
Eine unitäre Darstellung von G in Z ist ein Gruppenhomomorphismus
U : G −→ U(Z) ,
(101)
der in folgendem Sinn stetig ist: Für alle konvergenten Folgen (gν ) in G und alle |ψi ∈ Z gilt: Die Folge
(U (gν )|ψi) konvergiert bezüglich der Norm in Z und es
gilt lim U (gν )|ψi = U (lim gν )|ψi.
Die Darstellung heißt treu, wenn U injektiv ist, also
wenn G isomorph zur Untergruppe U (G) ⊂ U(Z) ist.
Die Qualifikation unitär spielt eine wichtige Rolle, weil
sie garantiert, daß die Darstellung auf Z normerhaltend operiert.
Für eine unitäre Darstellung U im physikalischen Zustandsraum Z macht die durch U definierte Wirkung
Φ : G × Z −→ Z , (g, | z i) −→ U (g) | z i = Φ(g, | z i)
die Gruppe G zu einer Symmetriegruppe im Sinne Ihrer Mechanik–Vorlesung. Die Struktur, die erhalten wird,
ist die unitäre Struktur des Zustandsraumes Z, die
durch das Skalarprodukt oder durch die unitäre Gruppe
U(Z) gegeben ist. Zu der in der Mechanik getroffenen
Definition kommt hier allerdings noch die Stetigkeitsbedingung hinzu.
Der Begriff der unitären Darstellung für Symmetriebetrachtungen bei quantenmechanischen Systemen rückt
ins Zentrum des Interesses, weil, wie oben angemerkt,
eine unitäre Darstellung das Skalarprodukt und damit
die Übergangswahrscheinlichkeit unverändert läßt. Wir
nennen eine unitäre Darstellung U : G −→ U(Z) eine Symmetrie des quantenmechanischen Systems
(Z, OH ), wenn außerdem noch die Rolle von OH invariant gelassen wird in folgendem Sinne: Jede Lösung der
Gleichung i~∂t | z i = OH | z i soll durch U (g) für jedes g ∈ G in eine Lösung überführt werden, das heißt,
es soll gelten, i~∂t U (g) | z i = OH U (g) | z i. Wegen
i~∂t U (g) | z i = U (g)i~∂t | z i = U (g)OH | z i folgt:
[OH , U(g)] | z i = 0. Wir fassen zusammen:
Def. VI.8 Eine unitäre Darstellung U der Matrixgruppe
G im Zustandsraum Z ist eine Symmetrie des quantenmechanischen Systems (Z, OH ), wenn für alle g ∈ G gilt:
[OH , U (g)] = 0.
Mit dieser Definition von Symmetrie ist in Analogie zu
der Situation in der Klassischen Mechanik ein Erhaltungssatz verbunden. Der selbstadjungierte Operator OX
heißt Bewegungskonstante des quantenmechanischen
Systems (Z, OH ), wenn [OH , OX ] = 0. Diese Definition
ist sinnvoll, wie wir gesehen haben.
Wie in der Klassischen Mechanik ist es zweckmäßig,
statt direkt mit der Symmetriegruppe G besser mit den
zugehörigen ’infinitesimalen Symmetrien’, also den Elementen aus g = Lie G, zu arbeiten.
Eine Rechtfertigung für dieses Vorgehen findet sich in
der Tatsache, daß eine unitäre Darstellung der Gruppe
G in natürlicher Weise eine Darstellung der zugehörigen
Lie–Algebra wie folgt induziert. Sei U : G −→ U(Z) eine endlichdimensionale Darstellung unitäre Darstellung
(d.h. dim(Z) < ∞) der Matrixgruppe G. Dann ist für
X ∈ g durch Us := U (exp (sX)) , s ∈ R, eine 1–
Parametergruppe von unitären Transformationen gegeben. Us hat einen infinitesimalen Erzeuger σ(X), wobei
df
σ(X)|ψi = i lim (Us − idZ ) |ψi/s , |ψi ∈ D(σ(X)) .
s→0
Tatsächlich ist σ(X) auf ganz Z definiert als
d σ(X) = i
Us
.
ds s=0
(102)
Das ist so, weil dim(Z) < ∞ und daher alle unitäre
Operatoren durch unitäre Matrizen dargestellt werden
39
können. Es gilt für die Lie–Klammer auf g bzw. End(Z):
[σ(X), σ(Y )] = iσ ([X, Y ]) , ∀X, y ∈ g .
(103)
Das sehen wir schnell ein: Wir setzen ρ(X) :=
−iσ(X), also ρ(X) = dU (exp (sX))/ds|s=0 und rechnen [ρ(X), ρ(Y )] = ρ([X, Y ]) nach. Somit ist ρ : g −→
End(Z) eine Darstellung von g in Z, welche auch mit
Lie U = ρ bezeichnet wird.
Der angesprochene Erhaltungssatz lautet jetzt folgendermaßen:
Satz VI.5 Sei (Z, OH ) ein quantenmechanisches System mit einer Symmetrie, die durch eine unitäre Darstellung U : G −→ U(Z) gegeben ist. Für jedes Element
X ∈ g der Lie–Algebra g von G ist der infinitesimale Erzeuger σ(X) von U (exp (sX)) eine Bewegungskonstante.
Beweis VI.3 Das ist klar, denn [OH , σ(X)]
=
[OH , idUs /ds|s=0 ] = i d[OH , Us ]/ds|s=0 . Nach Voraussetzung gilt aber [OH , Us ] = 0 ∀s ∈ R y [OH , σ(X)] = 0.
Also ist σ(X) eine Bewegungskonstante. ∗–< [{; 0)
Im Folgenden wollen wir einen kleinen Einblick in die
Darstellungstheorie von kompakten Gruppen wagen, um
dann ausführlich einen Überblick über die unitären Darstellungen der Drehgruppe SO(3) zu bekommen. Das Ziel
ist also das Konzept der Drehung vom Konfigurationsraum der klassischen Mechanik in die komplexen Zustandsräume quantenmechanischer Systeme zu übertragen. Dazu benötigen wir noch folgenden Begriff:
Def. VI.9 Sei U : G −→ U(Z) eine unitäre Darstellung.
Ein abgeschlossener linearer Unterraum V ⊂ Z heißt
invariant, wenn U (g)V ⊂ V ∀g ∈ G.
Ist V ein invarianter Unterraum, so ist die Einschränkung U |V : G −→ U(V), definiert durch U |V (g) :=
U (g)|V : V −→ V , g ∈ G, eine unitäre Darstellung in V,
die sogenannte Reduktion von U auf V.
Die unitäre Darstellung U heißt irreduzibel, wenn es
keine solche Reduktion gibt, das heißt, wenn für jeden
invarianten Unterraum bereits gilt: V = Z oder V = ∅.
Es erweist sich nun als ungemein vorteilhaft, daß der
Darstellungsraum ein Hilbert–Raum ist, der mit einer
schönen und nützlichen geometrischen Struktur ausgestattet ist, daß wir zum Beispiel das Folgende leicht einsehen können: Sei U : G −→ U(Z) eine unitäre Darstellung, und V ⊂ Z ein invarianter Unterraum. Dann ist
auch das orthogonale Komplement,
df
V ⊥ = {|ψi ∈ Z : hφ|ψi = 0 ∀|φi ∈ V} ,
ein invarianter Unterraum zu U . Deshalb zerlegt sich im
Falle ∅ 6= V 6= Z die unitäre Darstellung U in die Einschränkungen U |V und UV ⊥ von U aus V und V ⊥ . Es
gilt somit: U = U |V ⊕ UV ⊥ in folgendem Sinne: Jedes
|χi ∈ Z hat die eindeutige Zerlegung |χi = |χiV ⊕ |χiV ⊥
mit |χiV ∈ V und |χiV ⊥ ∈ V ⊥ . Und für g ∈ G gilt:
U (g)|χi = U |V |χiV ⊕ UV ⊥ |χiV ⊥ . Falls nun V und V ⊥
ebenfalls nichttriviale Unterräume enthalten, so läßt sich
dieses Zerlegungsverfahren wiederholen. Es gilt der wichtige
Satz VI.6 (von Peter und Weyl) Sei G eine kompakte
Matrixgruppe. Dann gilt für jede unitäre Darstellung U :
G −→ U(Z) in einem Hilbert–Raum Z:
(1) Ist U irreduzibel, so ist dim(Z) < ∞.
(2) U zerfällt in irreduzible Darstellungen Uj in folgendem Sinne: Es gibt invariante Teilräume Vj ⊂ Z,
welche paarweise orthogonal zueinander sind und
Z aufspannen:Z = ⊕j Vj , so daß für die Einschränkungen U |Vj gilt U = ⊕j U |Vj . Je nachdem,
ob Z endlich– oder unendlichdimensional ist, ist
die Summation über eine endliche oder unendliche
Indexmenge {j} zu verstehen.
Um den Satz von Peter und Weyl auf physikalische
Symmetrien mit einer kompakten Symmetriegruppe G
anwenden zu können, ist es also sinnvoll, die irreduziblen
Darstellungen von G umfassend zu beschreiben. Es erweist sich als zweckmäßig, anstelle der Gruppe G erst
einmal die zugehörigen infinitesimalen Symmetrien zu
betrachten, wie wir bereits wissen.
Am Beispiel der Drehgruppe SO(3) gehen wir so explizit vor, beschaffen uns also zunächst die irreduziblen
Darstellungen der Lie–Algebra so(3) ∼
= su(2). Eine Basis
von so(3) ist durch die drei Matrizen




0 0 1
0 0 0
M1 = 0 0 −1 , M2 =  0 0 0 ,
−1 0 0
0 1 0


0 −1 0
(104)
M3 = 1 0 0 ,
0 0 0
gegeben. Es gilt [Ma , Mb ] = εabc Mc , a, b, c ∈ {1, 2, 3}.
Dies ist die definierende Algebra von infinitesimalen Drehungen.
Sei Z ein Hilbert–Raum mit dim(Z) < ∞, und ρ :
so(3) −→ End(Z) eine Darstellung von so(3) in Z. Wir
setzen Ja := iρ(Ma ) , a ∈ {1, 2, 3}. Ja ist dann der Generator für Drehungen um die a–Achse und entspricht
der selbstadjungierten Version der a–ten Komponente
des Drehimpulses. Wir werden alsbald einsehen, daß dies
mehr liefert als nur die kanonische Quantisierung des
klassischen Bahndrehimpulses (siehe unten). Da ρ die
Lie–Klammern respektiert, gilt [Ja , Jb ] = iεabc Jc .
Statt direkt mit dem Satz {Ja }a∈{1,2,3} zu arbeiten, erweist es sich als zweckmäßiger, mit folgenden
Operatoren zu arbeiten: J3 , J± := J1 ± iJ2 . Dies ist
natürlich nicht evident, insbesondere weil lediglich J3
ein selbstadjungierter Operator ist, während J± offenbar nicht selbstadjungiert sind, sondern zueinander adjungiert: (J+ )† = J− . Andererseits wissen wir, daß die
Komponenten Ja , a ∈ {1, 2, 3} sich nicht vertragen, folglich können wir physikalische Zustände ohnehin nur mit
40
einer Drehimpulskomponente charakterisieren. Wir haben uns für J3 entschieden. Die nicht–selbstadjungierten
Operatoren J± sind also in diesem Sinne genauso gut
wie die verbleibenden Komponenten. Da wir algebraisch
vorgehen wollen, notieren wir
Also ist M(J3 ) nach oben beschränkt. Wir sehen aber
u.a. gleich, daß das Spektrum M(J3 ) auch nach unten
beschränkt sein muß, und zwar aus dem gleichen Grund,
nämlich der Voraussetzung eines endlichdimensionalen
Darstellungsraumes.
[J3 , J± ] = ±J± , [J+ , J− ] = 2J3 ,
J ◦ J = J− J+ + (id + J3 ) ◦ J3 .
Lemma VI.3 Sei m ∈ M(J3 ) wie in Lemma VI.2. Dann
gilt m ∈ N/2. Wir setzen |m − ki := (J− )k |mi , k ∈ N.
Die Menge {|mi, . . . , | − mi} ist eine Basis eines invarianten Untervektorraumes V ⊂ Z.
Es gilt mit J 2 = J1 ◦J1 +J2 ◦J2 +J3 ◦J3 , daß J 2 |m−ki =
m(m + 1)|m − ki , k ∈ {0, . . . , 2m} ⊂ N. Das bedeutet,
daß V Eigenraum zu J 2 zum Eigenwert m(m + 1) ist.
(105)
Die folgenden drei Aussagen enthalten die wesentlichen
Informationen über irreduzible Darstellungen von so(3).
Lemma VI.1 Sei |mi ∈ Z (dim(Z < ∞)) mit J3 |mi =
m|mi. Dann gilt:
J3 (J± |mi) = (m ± 1)J± |mi .
(106)
Beweis VI.4 Mittels elementarer Rechnung:
J3 (J± |mi)
(105)
=
=
=
(±J± + J± ◦ J3 ) |mi
(±J± + J± m) |mi
(m ± 1) J± |mi .
Beweis VI.6 Zunächst ist m − k ∈ M(J3 ) nach Lemma
VI.1, und J− |m − ki = |m − (k + 1)i nach Definition.
Außerdem gilt
J+ |m − ki = k (2m − (k − 1)) |m − (k − 1)i ,(108)
(107)
Das war es auch schon. ∗–< [{; 0)
Die Interpretation dieses Lemmas liefert uns eine Interpretation für die durch J± gegebenen Operationen,
nämlich, J± |mi ist wieder ein Eigenzustand zu J3 , allerdings zu einem um eine Einheit erhöhten/erniedrigten
Eigenwert. Mit anderen Worten, mittels J± können wir
das Spektrum M(J3 ) von J3 in äquidistanten Abständen
nach oben und unten durchlaufen, wobei jede Stufe dieser Leiter selbst wieder durch einen Eigenwert von J3 gekennzeichnet. Das bedeutet natürlich noch nicht, daß wir
auf diese Weise wirklich das gesamte Spektrum durchlaufen, aber es rechtfertigt den Begriff Leiteroperator für
J± . Außerdem reflektiert sich hier eine gewisse Logik unserer Methodik: da wir vereinbart haben, Zustände mit
den möglichen Meßwerte von J3 zu bezeichnen, und J3
sich nicht mit J1 , J2 verträgt, nutzen wir Linearkombinationen von lezteren, um möglichst viel über M(J3 ) aus
algebraischen Betrachtungen zu lernen. Zum Beispiel:
wie Sie als Übung per Induktion nach k zeigen sollen.
Die Folge J− |mi muß wegen dim(Z) < ∞ irgendwann
abbrechen. Sei m ∈ N mit |m − mi =
6 0 und J− |m − mi =
0, wobei m := inf{k 0 ∈ N : J3 |m − k 0 i = 0}. Also ist
|m − (m + 1)i = 0 y
(108)
0 = J+ |m − (m + 1)i = (m + 1)(2m − m)|m − mi .
Nach Voraussetzung ist |m − mi =
6 0y 2m − m =
0y2m = m ∈ N.
Für O ∈ {J3 , J± } zeigen die aufgestellten Gleichungen,
daß O|m − ki , k ∈ {0, . . . , 2m} ⊂ N eine Linearkombination der Basiszustände {|m − ki}k∈{0,...,2m} ist. Also,
OV ⊂ V, d.h. V ist invariant.
Schließlich ist J 2 = J− ◦J+ +J3 ◦(id+J3 ), woraus nach
einer kleinen Rechnung J 2 |m−ki = m(m+1)|m−ki , k ∈
{0, . . . , 2m} ⊂ N folgt. ∗–< [{; 0)
Wir fassen unsere Ergebnisse in einer gebräuchlichen
Notation folgendermaßen zusammen:
Satz VI.7 Es sei ρ : so(3) −→ End(Z) eine endlichdimensionale Lie–Algebra–Darstellung. Sei j ∈ M(J3 ) mit
|ji =
6 0 und J+ |ji = 0.
Lemma VI.2 Es gibt einen Eigenzustand |mi ∈ Z von
J3 mit J+ |mi = 0.
(1) Sei zunächst k ∈ N und Z 3 |j − ki := (J− )k |ji , |j +
1i = 0. Dann gilt für m = j − k:
Beweis VI.5 Anschaulich ist das klar, da nach Voraussetzung dim(Z) < ∞. Nun ja: Sei |mi ∈ Z , m ∈ M(J3 )
beliebig. Mit (105) folgt: J3 ◦ J+ |mi = (m + 1)J+ |mi,
also J+ |mi =: N |m + 1i, wobei N ∈ C und wir
wählen N = 1. Wir denken uns über J3 |m + ni =
(m + n)|m + ni , n ∈ N induktiv eine Folge von Eigenzuständen erzeugt. Bricht diese Folge irgendwann ab? Da
nach Voraussetzung dim(Z) < ∞, existiert ein n0 ∈ N
mit J+ |m + n0 i = 0, sonst wäre dim(Z) = ∞ im Widerspruch zur Voraussetzung. Sei nun n = sup{n0 ∈
N : J3 |m + n0 i = 0}. Für den Zustand |m + ni ∈ Z
gilt: m + n ∈ M(J3 ) und J+ |m + ni = 0. Wir setzen
m := m + n. ∗–< [{; 0)
J3 |mi = m|mi , J− |mi = |m − 1i ,
J+ |mi = [j(j + 1) − m(m + 1)] |m + 1i ,
|mi = 0 f ür m < j .
(109)
(110)
(111)
(2) Es ist 2j ∈ N, und {| − ji, | − j + 1i, . . . , |ji} ist
Basis eines invarianten Unterraums V(j) ⊂ Z mit
dim(V(j)) = 2j + 1.
(3) Für jeden Zustand |mi ∈ V(j) gilt: J 2 |mi = j(j +
1)|mi. Daher gibt es j1 , j2 , . . . , jn , n ∈ N, so daß
J 2 auf Z = ⊕na=1 V(ja ) die Darstellung J 2 =
⊕na=1 ja (ja + 1)Pa , wobei Pa : Z −→ Z die orthogonale Projektion auf den Teilraum V(ja ) bezeichnet.
41
(4) Die Einschränkung ρa von ρ auf V(ja ) ist eine irreduzible Darstellung ρa : so(3) −→ End(V(ja )), und
ρ zerlegt sich wie folgt: ρ = ⊕na=1 ρa .
R ist (k1 B1 + k2 B2 ) ∈ O(P) ∀(q, p) ∈ P, und 2. ist für
B1 , B2 ∈ O(P) auch (B1 B2 ) ∈ O(P) ∀(q, p) ∈ P, wobei
(B1 B2 )(q, p) := B1 (q, p)B2 (q, p). Wir vereinbaren:
Jede endlichdimensionale irreduzible Darstellung ρ von
so(3) hat die im Satz VI.7 angegebene Form mit V(j) =
Z für n = 1, j = j1 . Für jede Zahl j ≥ 0 mit 2j ∈ N gibt
es eine irreduzible Darstellung ρ(j) : so(3) −→ End(Zj )
in einen (2j +1)–dimensionalen C–Vektorraum Zj mit einer Basis {|mi}m∈M(J3 ) und der Wirkung der J3 , J± wie
in Satz VI.7. Die Zahl j heißt der Spin der Darstellung.
Eine bessere Bezeichnung wäre Drehimpuls, da j sowohl
den Bahndrehimpuls der Klassischen Mechanik, als auch
einen mit Spin bezeichneten intrinischen Drehimpuls umfaßt. Letzterer besitzt kein Analogon in der Klassischen
Mechanik.
An dieser Stelle bleibt noch, die unterdrückten Einheiten durch entsprechende Potenzen von ~ wieder zu
restaurieren, zum Beispiel:
Vereinbarung VII.1 (Quantisierungsvorschrift)
Quantisierung respektiert folgende Strukturen:
[Ja , Jb ] = iεabc ~Jc .
VII.
(112)
QUANTISIERUNG & KANONISCHE
QUANTISIERUNG
Die Schrödinger–Gleichung beschreibt die Enwtwicklung eines quantenmechanischen Zustandes | z i während
des Zeitintervalls t − t0 ∈ R relativ zu einer externen Uhr
wie oben beschrieben als | z i(t) = U (t, t0 ) | z i(t0 ) =
exp (−i(t − t0 )OH /~) | z i(t0 ). Dies motiviert die Fragestellung, wie OH als Funktion der elementaren Observablen Oq , Op ausschaut?
In diesem Abschnitt stellen wir uns der Frage, wie
wir praktisch und konkret von einem gegebenen mechanischen System mit Impulsphasenraum P und Observablenmenge O(P) zum enstsprechenden quantenmechanischen System mit Zustandsraum Z und Observablenmenge O(Z) übergehen. Viele der prominentesten
quantenmechanischen Systeme werden so erzeugt. Die
Theorie der klassischen Observablen war recht einfach:
Jeder klassischen Observablen ist eine Borel–Funktion
O(P) 3 B : P −→ R , (q, p) −→ B(q, p) zugeordnet.
Wichtige Beispiele (Abschnitt III C) waren die elemenj
taren klassischen Observablen Ort BOrt
= Pj ◦ Pr1 und
Impuls BImp j = Pj ◦ Pr2 , j ∈ {1, 2, 3}.
Quantisierung kann nun zunächst etwas salopp als
Abbildung Q : O(P) −→ O(Z) betrachtet werden, so daß
jeder klassischen Observablen B ∈ O(P) ein selbstadjungierter Operator Q(B) ≡ OB auf dem Zustandsraum Z
zugeordnet wird.
Diese Betrachtungsweise ist hauptsächlich von struktureller Relevanz, da O(P) selbst gewisse strukturelle Eigenschaften hat, die bei der Quantisierung (möglicherweise) erhalten bleiben, und daher selbst Einsicht in die
Quantisierungsvorschrift vermitteln. Da sind zunächst
einmal die beiden natürlichen Strukturen, die O(P)
trägt, nämlich 1. die üblichen linearen Operationen auf
jedem Vektorraum, also für B1 , B2 ∈ O(P) und k1 , k2 ∈
(1) Linearität, d.h. die Abbildung Q : O(P) −→ O(Z),
B −→ Q(B) := OB ist linear: Für B1 , B2 ∈ O(P)
und k1 , k2 ∈ R ist k1 B1 + k2 B2 −→ k1 OB1 + k2 OB2 .
(2) Sei F(R) 3 F : R −→ R eine beliebige Funktion
und O(P) 3 B : P −→ R eine klassische Observable. Dies induziert qua Komposition folgendermaßen eine Abbildung H : F(R) × O(P) −→ O(P):
(F, B) −→ H(F, B) := F ◦ B, also H(F, B)(q, p) =
F (B(q, p)).
Bezeichne OB : Z −→ Z die zu B korrepondierende
quantenmechanische Observable und {|bi}b∈M(OB ) ,
so gilt:
OF ◦B |bi = F (b)|bi .
(113)
Für unbeschränkte Observablen liegt {|bi}b∈M(OB ) nicht
in Z, jedoch läßt sich die entscheidende Definition in (2)
durch eine kleine Rechnung auf beliebige Zustände | z i ∈
Z ausweiten:
Z
X
OF ◦B | z i =
F (b)|bihb | z i .
(114)
b∈M(OB )
Diese Definition ist sinnvoll, zumindestens für alle komplexwertige Polynome R auf R, denn ausgehend von der
Spektraldarstellung für OB ,
Z
X
OB =
b |bihb| ,
(115)
b∈M(OB )
gilt für diese (Funktionalkalkül)
Z
X
R (OB ) =
R(b) |bihb| .
(116)
b∈M(OB )
Leider ist die Quantisierungsvorschrift VII.1 noch nicht
ausreichend, schlimmer noch, sie muß um sogenannte
Ersetzungsregeln heuristisch ergänzt werden. Das sehen wir schnell an folgendem Beispiel ein: BOrt BImp
ist als klassische Observable genauso gut wie BImp BOrt ,
während diese Aussage aufgrund der Unverträglichkeit
von Oq und Op in der Quantenmechanik nicht mehr gelten kann. Die folgende Ersetzungsregel versucht diesem
Umstand Rechnung zu tragen: BOrt BImp 7−→ (Oq ◦ Op +
Op ◦ Oq )/2.
Die Quantisierungsvorschrift VII.1 erlaubt dann eine
zügige Verallgemeinerung: Seien B , B 0 ∈ O(P) beliebige
klassische Observablen. Es gilt dann folgende Ersetzungsregel:
BB 0 7−→ (OB ◦ OB0 + OB0 OB ) /2 .
(117)
42
Eine letzte Anmerkung zu diesem Thema: Wir haben hier die Quantisierung von klassisch realisierten
Systemen diskutiert, ausgehend von einer Hamilton–
Formulierung für das klassische System, insbesondere von
einem Impulsphasenraum P. Dieser ist mit einer weiteren Struktur ausgestattet, der sogenannten symplektischen Struktur, die zum Beispiel über die Poisson–
Klammer charakterisiert werden kann: {◦, ◦} : O(P) ×
O(P) −→ O(P). Auch diese Struktur wird von der Quantisierung respektiert, in folgendem Sinne:
Vereinbarung VII.2 (Kanonische Quantisierung)
Sei (P, H) ein Hamilton–System gegeben durch einen
Phasenraum P ∼
= Q × Rn , n ∈ N für eine offene Menge Q ⊂ Rn , oder durch eine symplektische Mannigfaltigkeit P, zusammen mit einer Hamilton–Funktion H. Die
geometrische Struktur von P liefert die Poissonklammer,
{◦, ◦} : O(P) × O(P) −→ O(P), die O(P) zu einer Lie–
Algebra macht.
Zu einer kanonischen Quantisierung gehört die Quantisierungsvorschrift VII.1 und eine Auswahl A ⊂ O(P)
von klassischen Observablen, die quantisiert werden sollen. Eine kanonische Quantisierung von (P, H, A) ist
dann eine Abbildung ρ : A −→ O(Z) mit den folgenden
Bedingungen:
(1) Für alle B1 , B2 ∈ A mit {B1 , B2 } ∈ A gilt
[ρ (B1 ) , ρ (B2 )] = iρ ({B1 , B2 }) .
(118)
(2) Ist die konstante Funktion idP ∈ A, so ist
ρ (idP ) = idZ .
(119)
(3) Mit Oq := ρ(BOrt ) und Op := ρ(BImp ) liefert (1),
[Oqa , Opb ] = iδba , a, b ∈ {1, 2, 3} .
(120)
Bsp. VII.1 (Der 1–d harmonische Oszillator) Der
Phasenraum ist P = R2 . Als Menge der zu quantisierenden Observablen wählen wir A = {q, p, H, idP }, wobei
die Hamiltonfunktion durch H = (p2 + m2 ω 2 q 2 )/(2m)
gegeben ist. Als Hilbert–Raum wird L2 (R) genommen.
Durch ρ(q) := Oq , ρ(p) := Op , ρ(idP ) := idZ und
ρ(H) := OH = (Op ◦ Op + m2 ω 2 Oq ◦ Oq )/(2m) ist dann
eine kanonische Quantisierung gegeben, wobei OH folgendermaßen definiert ist: Der Definitionsbereich D(OH )
enthält den linearen Unterraum
Z
df
D = ψ ∈ L2 (R) :
dq |q|4 |ψ(q)|2 < ∞ ,
R
Z
Z
2
∃∆f ∈ L (R) :
dq g∆f =
dq (∆g)f ,
R
R
∀g ∈ E(R) : Träger(g) kompakt in R , (121)
wobei E(R) die Menge der differenzierbaren Funktionen
auf R bezeichne. Die Wirkung von OH auf D ist folgen-
dermaßen definiert: Für |ψi ∈ Z , ψ(q) ∈ D ist
hq|OH |ψi ≡ OH ψ(q)
=
−~2 ∆ + m2 ω 2 q 2 ψ(q) .
(122)
Deibei ist ∆ := ∂ 2 /∂q 2 .
Bsp. VII.2 (Der n–d harmonische Oszillator)
Verläuft ganz analog zum 1 − −d harmonischen Oszillator, allerdings ist die Buchhaltung aufwendiger. Zunächst
ist der Hilbert–Raum L2 (Rn ) , n ∈ N. Wir gehen hier
nicht explizit auf die Definitionsbereiche der Operatoren
ein, sondern notieren lediglich, daß die Festsetzungen
Oqa ψ = q a ψ, OPa ψ = −i~∂ψ/∂q a , a ∈ I := {1, 2, 3}
und
!
X
1
2
2 2
−~ ∆ + m ω
Oqa ◦ Oqa ψ(q)
OH ψ(q) =
2m
a∈I
(123)
eine kanonische Quantisierung von A = {q a , pa , H, idP }
liefern. Dabei ist ∆ der klassische Laplace–Operator.
Bsp. VII.3 (Das freie nicht–relativistische Teilchen) Der Phasenraum ist P ∼
= R3 × R3 , die Hamilton–
Funktion H(q, p) = p2 /2m. Die zu quantisierenden Observablen sind A = {q a , pa , H, idP }. Als Hilbert–Raum
dient L2 (R3 ). Wie im vorherigen Beispiel wählen wir
Oqa , OPa und OH := −~2 ∆/2m. Damit ist die kanonische Quantisierung spezifiziert.
Bsp. VII.4 (Kanonische Quantisierung in Algebraischer Manier) Wir diskutieren diese Konstruktion wieder am Beispiel des 1–d harmonischen Oszillators.
Unter der Annahme, daß eine kanonische Quantisierung
bereits gegeben ist, gelten folgende algebraische Relationen für die Observablen:
[Oq , Op ] = i~ ,
[Oq , OH , ] = i(~/m)Op ,
[OH , Op ] = i(m2 ω 2 /2)Oq .
(124)
In der Klassischen Mechanik haben wir den harmonischen Oszillator auch qualitativ untersucht. Da die Energie R+ 3 E = const. eine Bewegunsinvariante ist, gilt
H(q(t), p(t)) = E ∀t ∈ R. Dies führt zum Konzept der
2 2 2
Energieniveauflächen, H −1
√(E) = {(q, p ∈ P : m ω q +
2
1
p = 2mE} = Sr mit r = 2mE. Eine übersicht über alle Bahnen zu einer festen Energie E > 0 erhalten wir, indem wir auf H −1 folgende Äquivalenzrelation einführen:
Für a, b ∈ H −1 (E) sei a ∼ b, wenn es eine Bahn mit
Energie E im Phasenraum P gibt, die a und b miteinander verbindet. Der Quotient BE := H −1 / ∼ ist dann
der Bahnenraum zur Energie E und parametrisiert offenbar alle möglichen Bahnen des Systems mit Energie E.
In dieser Situation lassen sich die Bahnen mit Hilfe der
43
komplexen Struktur auf R2 besonders einfach beschreiben: Für (q, p) ∈ P schreiben wir z := mωq + ip ∈ C.
Auf diese Weise ist R2 mit C identifiziert. Zeigen Sie,
daß folgendes gilt: a ∼ b genau dann, wenn es φ ∈ R gibt
mit a = exp (iφ)b. In der Mechanik haben wir an dieser Stelle an den komplex–projektiven Raum P0 (C) erinnert, nämlich P0 (C) := S1r / ∼ mit der Äquivalenzrelation
a ∼ b, wenn es ein λ ∈ U (1) := {λ ∈ C : |λ| = 1} gibt mit
a = λb. Als Resultat erhalten wir so: Der Bahnenraum
BE für den (1 − d) harmonischen Oszillator zur Energie
E > 0 ist der komplex–projektive Raum P0 (C), und die
Quotientenabbildung ϕ : H −1 (E) −→ BE = P0 (C) hat
als Fasern ϕ−1 (x) gerade die Bahnen zur Energie E.
Salopp gesprochen versucht die algebraische Methode, die Quantisierung auf obiger qualitativer Beschreibung aufzubauen, natürlich im
Al√ Einklang mit (124).
∗
2m~ω
=:
a
und
ρ(z
)
:=
so, ρ(z) := (mωO
+
iO
)/
p
√ q
†
(mωOq − iOp )/ 2m~ω =: a auf dem noch zu bestimmenden Hilbert–Raum. Die Operatoren a und a† sind
nicht selbstadjungiert. Es gilt OH = (a◦a† −1/2)~ω. Wir
bemerken, daß E0 := ~ω die Einheit einer Energie hat.
Somit wird OH in Vielfachen von E0 gemessen (relativ
zur Grundzustandsenergie). Der Operator On := a ◦ a†
ist selbstadjungiert und dimensionslos.
Die algebraischen Relationen (124) liefern:
a, a† = 1 .
(125)
Offenbar ist OH = (On − 1/2)E0 , also M(OH ) =
M(On ) − 1/2. Wir nsetzen voraus, daß es einen Eigenvektor |ni ∈ Z gibt mit On |ni = n|ni , n ∈ R. Offenbar
ist dann OH |ni = (n − 1/2)~ω|ni.
Wir definieren |n − 1i := a|ni. Der Bezeichner des
neuen Zustandes ist schon sinnvoll, denn mit (125) ist:
On |n − 1i = On a|ni = a(On − 1)|ni = (n − 1)|n − 1i.
Genauso gilt mit der Definition |n + 1i := a† |ni und wegen (125): On |n + 1i = On a† |ni = (1 + On )a† |ni =
a† (1 + On )|ni = (1 + n)|n + 1i. Außerdem ist für jedes Z 3 |ψi =
6 0 auch a† |ψi =
6 0, denn ka† |ψik2 =
†
hψ|On |ψi = hψ|a a|ψi + hψ|ψi = ka|ψik2 + k|ψik2 > 0.
Wir setzen |n−ki := (a)k |ni , k ∈ N, wobei (a)k die k–
fache Komposition von a mit sich selbst bezeichne. Offenbar ist On |n−ki = (n−k)|n−ki und ka† |n−kik2 = hk −
n|On |k−ni = (n−k)hk−n|k−ni = (n−k)k|n−kik2 ∀k ∈
N. Folglich ist (n − k) ≥ 0 oder hn − k|n − ki = 0 ∀k ∈ N.
Daher gibt es ein N 3 k : |n − ki =
6 0 und a|n − ki = 0.
Für diesen Zustand ist n − k − 1 = 0 y n = k + 1 ∈ N,
also n ∈ N.
Mit all diesen Informationen können wir nun
tatsächlich explizit einen geeigneten Hilbert–Raum mit
den Operatoren Oq , Op , OH konstruieren. Sei |zi ein
Zustand
mit Wellenfunktion Z(n) := hn|zi und
P∞
2
|Z(n)|
< ∞. Dann können wir so vorgehen:
n=1
Es sei H = `2 der Hilbert–Raum der komplexen, quadratsummierbaren
Folgen, `2 := {(Z(n))n∈N : Z(n) ∈
P∞
2
C,
|Z(n)| < ∞} mit dem Skalarprodukt hz|wi :=
P∞ n=1
Z(n)W
(n) und den Einheitsvektoren {en }n∈N =
n=1
(0, . . . , 1, . . . , 0), wobei die Eins an der Position n ∈ N
der Folge steht. Wir finden
a† en =
√
n en+1 ,
√
a en = n − 1 en−1 , n ∈ N/{0} ,
a e0 = 0 .
(126)
Und weiter folgt für alle |zi mit: ∀n ∈ N ist Z(n) ∈ `2 :
On en = n en y
OH en = (n − 1/2)E0 en ,
hn|OH |zi ≡ OH Z(n)
= (n − 1/2)E0 Z(n) .
(127)
Geeignete Fortsetzungen von Oq , Op , OH sind dann
selbstadjungierte Operatoren auf H, also Observablen,
die den gewünschen Kommutator–Beziehungen (124)
genügen.
Der Zusammenhang zu den Zuständen p
|ni , n ∈ N/{0}
ist schnell hergestellt: en ↔ |ni := |ni/ hn|ni. In der
Tat ist dann, a† |ni = N(+) |n + 1i , N(+) ∈ C. Wegen der
√
Definition |n + 1i = a† |ni folgt N(+) = n. Genauso
√
sehen wir ein, daß a|ni = n − 1|n − 1i.
Die algebraische Behandlung des harmonischen Oszillators in der Quantenmechanik heisst auch Besetzungszahldarstellung des harmonischen Oszillators.
Der Name stammt von folgender Überlegung: Aufgrund
der Wirkung von a und a† liegt es nahe, diese als
Vernichtungs– und Erzeugungsoperatoren zu bezeichnen. Was in dieser Sprache etws irreführend vernichtet und erzeugt wird sind Anregungen des Oszillators relativ zu seinem Grundzustand mit der Energie
−E0 /2 6= 0. Da diese Anregungen immer in natürlichen
Portionen kommen, die wir mit n ∈ M(On ) = N parametrisiert haben, scheint diese Sprache sinvoll zu sein.
Allerdings ist es wichtig zu betonen, daß eine solche Anregung mittels Operation von a und a† nicht wirklich vernichtet oder erzeugt werden kann, denn diese Operatoren
sind ja nicht selbstadjungiert und folglich kann ihre Wirkung auf einen Zustand keinen physikalischen Prozess
beschreiben. Vielmehr erlaubt uns On zu zählen, wieviel
Anregunsenergie in Portionen E0 relativ zur Grundzustandsenergie E0 /2 in diesem System steckt. Wir notieren auch, daß der Grundzustand nicht zu einem Teilchen
mit verschwindender Energie korrespondiert!
Eine analoge Konstruktion funktioniert sogar für ein
System von unendlich vielen harmonischen Oszillatoren,
was zur üblichen Interpretation der Quantentheorie von
Feldern führt. Bemerkenswert an dem 1-d Fall ist einerseits, daß es nicht möglich ist, die so einfach strukturierte Menge A = {q, p, H, idP } von klassischen Observablen auf dem Phasenraum P = R2 unter Vewendung eines endlich–dimensionalen Hilbert–Raumes zu quantisieren. Andererseits ist in der Besetzungszahldarstellung die
Konstruktion des wichtigsten Operators, OH , der ja die
44
Dynamik es quantenmechanischen Systems als selbstadjungierter Generator der unitären Darstellung von Zeittranslationen auf dem entsprechenden Hilbert–Raum hervorbringt, von vornherein als in seine Eigenräume zerlegt
gegeben.
VIII.
ELEMENTARE ANWENDUNGEN
In diesem Kapitel betrachten wir einfache Systeme, die
immer durch ein einzelnes Teilchen in einem von außen
vorgegebenen klassischen Potentialfeld gegeben sind, und
die wir quantenmechanisch beschreiben wollen. Dazu bedarf es ab und an einer ausführlicheren Vorbereitung, in
der wir unsere algebraischen Einsichten um analytische
Resultate aufstocken, etwa beim harmonischen Oszillator
oder beim quantenmechanischen Drehimpuls.
A.
Harmonischer Oszillator in einer Dimension
Bei der algebraischen Behandlung des harmonischen
Oszillators in der Quantenmechanik haben wir uns ausschließlich für kinematische Informationen interessiert,
die rein algebraisch abgerufen werden konnten. Die explizite Berechnung von Wellenfunktionen war hierfür nicht
erforderlich, beschäftigt uns aber im Folgenden.
Eine zentrale Rolle bei der algebraischen Behandlung
kam den Erzeugungs– und Vernichtungsoperatoren zu,
a† und a, die eine Besetzungszahldarstellung |ni , n ∈
M(On := aa† ) des Oszillators erlaubten. Gewissermaßen interessieren wir uns für die Anzahl der elementaren Anregungen im Oszillator relativ zum nicht–trivialen
Grundzustand, wobei jede Anregung die gleiche Energie E0 = ~ω trägt. Die Gesamtenergie des harmonischen
Oszillators ergibt sich wegen der Additivität der Energie einfach aus der Anzahl der Anregungen mit Energie
E0 zuzüglich der Grundzustandsenergie E0 /2. Die Besetzungszahldarstellung ist salopp geschrieben ein Anregungsportrait des Oszillators.
Um ein wenig gelenkiger mit den algebraischen Relationen zu werden, nutzen wir sogleich die zentrale Relation
[a, a† ] = 1 und redefinieren damit den Besetzungszahl–
Operator On . Es gilt ja: On = 1 + a† a. Dies zeigt, daß
auch N := a† a als Besetzungszahl–Operator fungieren
darf. Damit gilt OH = (N + 1/2)E0 . Beim Übergang von
On nach N wird also lediglich die Grundzustandsenergie
verschoben, und zwar wird sie um E0 erhöht. Mathematisch haben wir hier sicher alles richtig gemacht, aber
verzerrt diese Energieverschiebung nicht unser physikalisches Verständnis? Dies wäre sicherlich der Fall, wenn
die Energiemessung absolut wäre. Ist sie aber nicht, wir
messen in der Physik immer relative Energien, also Energiedifferenzen!
Die algebraischen nützlichen Relationen sind jetzt:
a, a† = 1 , [N, a] = −a , N, a† = a† .
(128)
Mit der Wahl von ON als Besetzungszahl ändert sich
auch die Normierung der entsprechenden Zustände. Wir
finden:
√
a|0i = 0 , a|ni = n|n − 1i , N 3 n ≥ 1 , (129)
√
a† |ni = n + 1|n + 1i ,
(130)
was konsistent mit (126) ist, wenn wir bedenken, daß
jetzt n ∈ M(N ) ist.
Wir wollen nun die Energie–Eigenfunktionen im Ortsraum berechnen. Wie gehen wir geschickt vor? Geleitet
von unseren algebraischen Einsichten fragen wir zunächst
nach der Wellenfunktion des Grundzustandes |0i. Dieser war definiert als der Besetzungszahl–Zustand für den
a|0i = 0 gilt, also von dem aus der Oszillator nicht weiter
abgeregt werden kann. Um eine Differentialgleichung für
die Grundzustandswellenfunktion zu erhalten, bietet es
sich nun an, diese Definition in den Ortsraum zu bringen. Sei x ∈ M(Oq ). Dann gilt
hx|a|0i = x + x02 ∂x hx|0i = 0 ,
(131)
p
wobei wir x0 :=
~/mω eingeführt haben. Bemerken
Sie, daß [x0 ] = L, also setzt x0 eine durch die Kreisfrequenz und die Masse des Oszillators gegebene charakteristische Längenskala.
Die Gleichung (131) ist rasch gelöst, Z0 (x) :=
hx|a|0i ∝ exp [−(x/x0 )2 /2]. Mit der korrekten Normierung finden wir explizit:
"
2 #
1
1 x
Z0 (x) = p√
exp −
.
(132)
2 x0
πx0
Die Grundzustandswellenfunktion Z0 (x) ist modulo einer multiplikativen Konstante die eindeutige Lösung von
(131), es liegt also keine Entartung des Grundzustandes
vor. Im Gegensatz zur klassischen Mechanik ist die Energie des Grundzustandes von Null verschieden und der
Oszillator braucht sich nicht an der Stelle des Potentialminimums befinden, was durch die endliche räumliche
Ausdehnung der zugehörgen Wellenfunktion Z0 (x) zum
Ausdruck gibt, die ja wiederum durch x0 charakterisiert
ist.
Es ist instruktiv, sich die Erwartungswerte für die kinetische und potentielle Energie des harmonischen Oszillators im Grundzustand zu beschaffen. Wir benötigen
also E(Op p
◦ Op , |0i) und E(Oq ◦ Oq , |0i). Zunächst einmal
ist Op = i mE0 /2(a† − a) und daher
0
Op ◦ Op = − mE
a† ◦ a† + a ◦ a − a† ◦ a − a ◦ a† .
2
Wenn wir den Erwartungswert von Op ◦ Op bezüglich des
Grundzustandes bilden, dann tragen nur die letzten beiden Summanden bei. Daher finden wir E(Op ◦ Op , |0i) =
mE0 /2. Genauso finden wir, daß E(Oq ◦ Oq , |0i) = x02 /2
ist. Der Erwartungswert der kinetischen Energie OT :=
Op ◦ Op /2m im Grundzustand des harmonischen Oszillators ist somit E(OT , |0i) = E0 /4. Im Grundzu-
45
stand erwarten wir außerdem für die potentielle Energie OV := mω 2 Oq ◦ Oq /2 des harmonischen Oszillators ebenfalls E(OV , |0i) = E0 /4. Mit anderen Worten:
E(OT , |0i) = E(OV , |0i) = E(OH , |0i)/2.
Weiterhin ist E(Op , |0i) = 0 und E(OV , |0i) = 0. Folglich gilt:
Streu|0i (q) · Streu|0i (p) = ~/2 .
(133)
Damit ist die Unschärferelation zwischen dem quantenmechanischen Ort und Impuls im Grundzustand des harmonischen Oszillators saturiert, das heißt, der minimal
mögliche Wert für die Unschärfe wird angenommen.
Für beliebige Anregungszustände des harmonischen
Oszillators finden folgenden konstruktiven Ausdruck zur
Berechnung der zugehörigen
Wellenfunktionen im Orts√
raum: Es sei Nn := 1/ 2n n!. Dann gilt
n
Zn (x) ≡ hx|ni = Nn x−n
x − x02 ∂x Z0 (x) .(134)
0
Für diese Wellenfunktionen des angeregten harmonischen
Oszillators ist die prinzipielle Unschärfe in Ort und Impuls größer als im Grundzustand. Es ist
Streu|0i (q) · Streu|0i (p) = (n + 1/2)~ .
(135)
Die Energie–Eigenzustände des harmonischen Oszillators sind natürlich stationär. Folglich oszillieren auch
nicht die Erwartungswerte E(q, |ni) , E(p, |ni), sie verschwinden sogar unbhängig vom Anregungszustand. Wir
können aber umgekehrt fragen, ob es Linearkombinationen von Energie–Eigenzuständen gibt, die den klassischen harmonischen Oszillator möglichst treu imitieren?
Die Antwort hierauf ist ja und führt auf das Konzept
der kohärenten Zustände, welches leider jenseits dieser
Einführung liegt.
B.
Bahndrehimpuls und Kugelflächenfunktionen
Kanonische Quantisierung der kinetischen Energie eines Teilchens liefert nach Beispiel VII.3 den selbstadjungierten Operator T := Op ◦ Op /2m = −~2 ∆/2m auf dem
Hilbert–Raum L2 (Rd ). Der Laplace–Operator ∆ kann
folgendermaßen zerlegt werden:
∆ = ∆r + ∆Ω /r2 ,
df
∆r =
∆Ω
d−1 ∂
∂2
+
,
2
∂r
r ∂r
2
d 1 X
∂
∂
=
xj k − xk j
,
2
∂x
∂x
j,k=1
2
X ∂
∂
=
xj k − xk j
.
∂x
∂x
df
r unabhängiger Differentialausdruck ist, und insbesondere in Kugelkoordinaten lediglich vom Azimuth– und
Polarwinkel abhängt. Dabei sind die Richtungsableitungen ∇ab ≡ xab · ∇ , a, b ∈ {1, . . . , d}, wobei die Vektoren xab := (0, . . . , 0, −xb , 0, . . . , xa , 0 . . . , 0) , (xab )a =
−xb , (xjk )b = xa , a, b ∈ {1, . . . , d}, bis auf den Faktor −i~ gerade die Komponenten des Bahndrehimpulses,
üblicherweise folgendermaßen bezeichnet: La = −i~∇bc .
Tatsächlich gilt [La , Lb ] = iεabc ~Lc .
Der Vektor xab beschreibt eine Tangente an die Kugel
K(0, |x|) mit Mittelpunkt 0 und Radius |x| im Punkt x,
die parallel zur (xa , xb )–Ebene verläuft. ∆Ω ist also gewissermaßen ein Differentialausdruck auf der Sphäre, den
wir insbesondere auch auf der Einheitssphäre S d−1 :=
{y ∈ Rd : |y| = 1} ⊂ Rd untersuchen können.
Für f ∈ C 2 (S d−1 ) können wir den sogenannten
Laplace–Beltrami –Differentialausdruck Bf folgendermaßen erklären: (Bf )(ω) := ∆Ω f (x/|x|)|x=ω , ω ∈
S d−1 . Mit anderen Worten, wir setzen erst f radial konstant fort, wenden dann den Differentialausdruck ∆Ω an,
und schränken anschließend wieder auf S d−1 ein.
Damit ist auch klar, warum Kugelflächenfunktionen eine wichtige Rolle spielen — wie wir weiter unten sehen werden, bilden sie eine ONB von Eigenfunktionen zu B, denn Kugelflächenfunktionen erhalten wir
durch Einschränkung harmonischer Polynome in Rd auf
die Einheitssphäre S d−1 .
Zur Notation: Ein Multi–Index der Dimension d ∈ N
ist ein d–Tupel α = (α1 , . . . , αd ) ∈ Nd . Für einen Multiindex α definieren wir:
|α| :=
a=1
(136)
Hierbei bezeichnet r den euklidischen Abstand vom Koordinatenursprung, und Ω soll an den Raumwinkel erinnern. Letztere Bezeichnung ist sinnvoll, weil ∆Ω ein von
αa ,
α
x :=
d
Y
(xa )αa , x ∈ Rd .
(137)
a=1
Für ein beliebiges Polynom P vom Grad k ∈ N in d
Variablen schreiben wir also
X
P(x) =
cα x α .
(138)
|α|≤k
Es genügt hier homogene harmonische Polynome zu
betrachten:
Lemma VIII.1 Sei P ein harmonisches Polynom vom
Grad k in d Variablen. Dann läßt sich P in der Form
Pk
P =
q=0 Pq schreiben mit homogenen harmonischen
Polynomen vom Grad q.
P
Beweis VIII.1 Wir wählen Pq = |α|≤q cα xα als homogene Polynome vom Grad q. Dann gilt offenbar
P(x) =
1≤j<k≤d
d
X
k
X
q=0
Pq (x) , und 0 = ∆P(x) =
k
X
∆Pq (x) .
q=0
Für jedes q ∈ {0, . . . , k} ist ∆Pq (x) entweder ein homogenes Polynom vom Grad q − 2, oder ∆Pq = 0, wobei letzteres insbesondere für q < 2 gilt. Also muß auch
∆Pq = 0 , ∀q ∈ {1, . . . , k} gelten. ∗–< [{; 0)
46
Für niedrige Grade können die harmonischen Polynome
explizit angegeben werden: Jedes Polynom von Grad 0
und 1 ist harmonisch. Linear unabhängige Systeme harmonischer Polynome sind zum Beispiel: P0 (x) = 1(1
Funktion),P1 (x) = xa , a ∈ {1, . . . , m}(m Funktionen),
P2 (x) = xa xb , 1 ≤ a < b ≤ d und (x1 )2 − (xj )2 , j ∈
{2, . . . , d}. Für diesen Grad haben wir 0 Funktionen für
d = 1, 2 Funktionen für d = 2, 5 Funktionen für d = 3,
und allgemein: (d+2)(d−1)/2–Funktionen. Weiter unten
zeigen wir, daß dies jeweils maximal linear unabhängige
Systeme sind.
Eine Funktion F : S d−1 −→ C heißt eine Kugelflächenfunktion vom Grad k ∈ N, wenn es ein homogenes harmonisches Polynom P vom Grad k gibt mit
k
F (ω) = P(ω) = P(rω)/r ∀ω ∈ S
d−1
.
(139)
Es ist faszinierend, daß diese spärlichen Informationen
bereits ausreichen um zu zeigen, daß die Kugelflächenfunktionen in L2 (S d−1 ) total sind:
Satz VIII.1 (Approximationssatz) Zu jeder stetigen
Funktion f : S d−1 −→ C und zu jedem ε > 0 existiert eine (endliche) Summe F von Kugelflächenfunktionen mit
|f (ω) − F (ω)| < ε ∀ω ∈ S d−1 .
Insbesondere ist die Menge der Kugelflächenfunktionen
total in L2 (S d−1 ).
Beweis VIII.2 Der Beweis ist eher technisch und wenig
instruktiv für den weiteren Aufbau der Theorie, weshalb
wir ihn der Mathematik überlassen. Sie können ihn in
jedem guten Werk zur Theorie der Linearen Operatoren
in Hilbert–Räumen finden.
Grob ist die Idee folgende: Sie überzeigen sich zunächst
von der Aussage, daß für jedes homogene (aber nicht notwendig harmonische) Polynom Q vom Grad l ∈ N gilt,
X
2k
Q(x) =
|x| Hl−2k ,
0≤k≤l/2
mit homogenen harmonischen Polynomen Hp vom Grad
p ∈ N.
Im Beweis dieser Aussage steckt die Hauptarbeit. Dann
nutzen Sie einen anderen berühmten Approximationssatz
— den von Weierstraß — und sind am Ziel. ∗–< [{; 0)
Beweis VIII.3 Wir zeigen hier nur (b). Ist Φ eine Kugelflächenfunktion vom Grad 0, so ist Φ konstant, also
Eigenfunktion von B zum Eigenwert 0 = 0(0 + d − 2).
Sei Φ eine Kugelflächenfunktion vom Grad l ≥ 1,
(
|x|l Φ(x/|x|) für x ∈ Rd − {0} ,
df
φ(x) =
0
für x = 0 .
Da φ ein harmonisches Polynom vom Grad l ist, gilt für
alle ω ∈ S d−1 :
0 = ∆φ(x) |x=ω = ∆ |x|l Φ(x/|x|) |x=ω
= ∆r + ∆Ω /r2 |x|l Φ(x/|x|) |x=ω
= [l(l − 1) + (d − 1)l] |x|l−2 Φ(x/|x|) |x=ω
+|x|l−2 ∆Ω Φ(x/|x|) |x=ω
= l(l + d − 2)Φ(ω) + (BΦ) (ω) ,
also gilt BΦ = −l(l + d − 2)Φ. ∗–< [{; 0)
Wir wollen uns nun einen Überblick über die Gesamtheit der Kugelflächenfunktionen verschaffen, d.h. insbesondere, daß wir die Anzahl N (l, d) der linear unabhängigen Kugelflächenfunktionen vom Grad l ∈ N in d ∈ N
Variablen auf S d−1 bestimmen. Wir wissen bereits, daß
N (0, d) = 1, N (1, d) = d ∀d, und N (l, 1) = 0 ∀l ≥ 2.
Sei zunächst A(l, d) die Anzahl linear unabhängiger homogener (nicht notwendig harmonischer) Polynome vom
Grad l ∈ N in d ∈ N Variablen. Da jedes homogene Polynom f vom Grad l > 1 ind d > 1 Variablen in der
Form
f (x1 , . . . , xd ) =
Satz VIII.2 Sei
B
der
Laplace–Beltrami–
Differentialausdruck auf S d−1 . Dann gilt
(a) B ist auf C ∞ (S d−1 ) wesentlich selbstadjungiert. Die
selbstadjungierte Vervollständigung nennen wir den
Laplace–Beltrami–Operator in L2 (S d−1 ).
(b) Jede Kugelfunktion F vom Grad l ist Eigenfunktion
von B zum Eigenwert −l(l + d − 2). Insbesondere
bilden Kugelfunktionen eine vONB.
l
X
gl−k (x1 , . . . , xd−1 ) (xd )k ,
k=0
mit homogenen Polynomen gp vom Grad p ∈ N in (d − 1)
Variablen geschrieben werden kann, gilt
A(l, d) =
l
X
A(k, d − 1) .
(141)
k=0
Mit Hilfe von A(l, 1) = 1 ∀l ≥ 0 und
p X
k
k=n
Die zentrale Bedeutung der Kugelflächenfunktionen für
die analytische Theorie des Bahndrehimpulses liegt in
folgendem
(140)
n
=
p+1
n+1
für p ≥ n ,
(142)
erhalten wir durch vollständige Induktion
l+d−1
A(l, d) =
für d ≥ 1 , l ≥ 0 .
d−1
(143)
Um damit N (l, d) zu bestimmen, wollen wir zuerst die
allgemeine Form eines homogenen harmonischen Polynoms u von Grad l ∈ N in d ∈ N Variablen ermitteln.
Zunächst gilt wieder
u(x1 , . . . , xd ) =
l
X
k=0
k
al−k (x1 , . . . , xd−1 ) (xd ) ,(144)
47
mit homogenen Polynomen ap vom Grad p ∈ N. Damit ist u genau dann harmonisch, wenn mit ∆0 :=
∆ − (∂/∂xd )2 folgendes gilt:
0 = ∆u(x) =
l−2
X
k
∆0 al−k (x1 , . . . , xd−1 ) (xd )
Für d = 3 hat B in Kugelkoordinaten S 2 3 (x, y, z) =
(sin θ cos ϕ, sin θ sin ϕ, cos θ) mit den üblichen Definitionsbereichen die Form
1 ∂2
1 ∂
∂
Bf (ϕ, θ) = 2
f (ϕ, θ) +
s(θ) f (ϕ, θ) ,
s (θ) ∂ϕ2
s(θ) ∂θ
∂θ
k=0
+
l
X
k−2
k(k − 1)al−k (x1 , . . . , xd−1 ) (xd )
,
k=2
also (k + 2)(k + 1)al−2−k = −∆0 al−k für k ∈ {0, . . . , l −
2}. Folglich können al und al−1 beliebig (aber homogen)
gewählt werden, und dann daraus der Reihe nach
al−2−k = −
1
∆0 al−k , k ∈ {0, . . . , l − 2}
(k + 2)(k + 1)
berechnen. Mit den so sukzessive bestimmten ap erhalten wir schließlich alle homogenen harmonischen Polynome vom Grad l ∈ N in x1 , . . . , xd und damit alle Kugelflächenfunktionen vom Grad l auf der Einheitskugel
S d−1 .
Die eben konstruierten homogenen harmonischen Polynome u1 , . . . , un , n ∈ N sind offenbar genau dann linear unabhängig, wenn die entsprechenden Anfangsterme {ak,l (x1 , . . . , xd−1 ) + ak,l−1 (x1 , . . . , xd−1 )xd : k ∈
{1, . . . , n}} linear unabhängig sind. Die Bezeichnungen
sind hoffentlich klar. Folglich gilt
N (l, d)
=
(143)
=
A(l, d − 1) + A(l − 1, d − 1)
l+d−2
l+d−3
+
d−2
d−2
(2l + d − 2)(l + d − 3)!
.
l!(d − 2)!
=
(145)
wobei s(θ) := sin θ Es bietet sich offenbar ein Separationsansatz in der Gleichung Bf = −l(l + 1)f an. Etwas
vornehmer heißt dies, daß B von den folgenden Teilräumen reduziert wird:
df
Tk =
exp (ikϕ)f (θ) : f ∈ L2 ((0, π))
,k ∈ Z ,
die den Hilbert–Raum L2 (S 2 ) ∼
= L2 ((0, 2π) × (0, π)) aufspannen. Die Einschränkung von B auf Tk (k ∈ Z) ist
äquivalent zu einer selbstadjungierten Realisierung von
1
τk f (θ) =
s(θ)
∂
∂θ
∂
k2
s(θ) f (θ) −
f (θ)
∂θ
s(θ)
in
L2 ((0, π)).
Dies
ist
ein
Sturm–Liouville–
Differentialausdruck. Wir bezeichnen die selbstadjungierte Realisierung ebenfalls mit τk . Aus der Theorie
des Eigenwertproblemes von Sturm–Liouville folgt dann,
daß τk nur einfache Eigenwerte besitzt.
Wie schaut nun der N (l, 3) = (2l + 1)–dimensionale
Teilraum von L2 (S 2 ) der Kugelflächenfunktionen vom
Grad l aus? Das ist ja der Eigenraum von B zum Eigenwert −l(l + 1). Da die Teilräume Tk den Operator B
reduzieren, besitzt dieser Eigenraum eine Basis der Form
Yela (ϕ, θ) = exp (ika ϕ)e
pla (θ) , für a ∈ {1, . . . , 2l + 1} ,
mit der Eigenschaft
Wir fassen zusammen:
Satz VIII.3 Für die Anzahl N (l, d) von linear unabhängigen Kugelflächenfunktionen vom Grad l auf S d−1
gilt für l ≥ 0 , d ≥ 2
N (l, d) =
(2l + d − 2)(l + d − 3)!
.
l!(d − 2)!
(146)
Speziell gilt (siehe auch Satz VI.7)
N (l, 3) = 2l + 1 .
(147)
Wir wissen bereits, daß kinematische Aspekte des
Bahndrehimpulses rein algebraisch behandelt werden
können und insbesondere die explizite Form der Kugelflächenfunktionen hierfür nicht benötigt werden. Allerdings verlangen Fragestellungen, die mit der Dynamik
eines quantenmechnischen Systems verknüpft sind, nach
einer analytischen Behandlung. Deshalb und weil wir
im nächsten Abschnitt das Wasserstoff–Atom diskutieren wollen, beschaffen wir uns noch rasch für den Fall
d = 3 die Kugelflächenfunktionen ganz explizit.
τka pela (θ) = −l(l + 1)e
pla (θ) , für a ∈ {1, . . . , 2l + 1} .
Da die τk nur einfache Eigenwerte haben, müssen die ka
paarweise verschieden sein. Für ka kommen lediglich die
(2l + 1) Werte ka ∈ {−l, −l + 1, . . . , l − 1, l} in Frage,
da andernfalls das entsprechende homogene harmonische
Polynom yla (x, y, z), dessen Einschränkung auf S 2 gleich
Yla ist, als Funktion der ersten beiden Koordinaten (x, y)
bereits ein Polynom der Ordnung > l wäre. Also lassen
sich die Kugelflächenfunktionen in der folgenden Form
darstellen: Für m ∈ {−l, −l + 1, . . . , l − 1, l} ⊂ Z ist
Ylm (ϕ, θ) = exp (imϕ)plm (θ) , ,
τm plm (θ) = −l(l + 1)plm (θ) .
Die Funktionen plm (θ) sind die sogenannten assoziierten Legendre–Polynome,
plm (θ) =
m/2 1
1 − cos θ
2l l!
2
d
d cos θ
l+m
l
(cos θ − 1) .
48
C.
Zentralpotential & Das Wasserstoff–Atom
In diesem Abschnitt behandeln wir die Quantenmechanik eines Teilchens im Zentralpotential V (r) , r ∈
R+ . Die Resultate aus dem vorherigen Abschnitt VIII B
über die analytische Theorie des Bahndrehimpulses sind
hierfür essentiell.
Die Tatsache, daß V (r) invariant unter beliebigen Drehungen um den Ursprung ist, impliziert die Verträglichkeit des Hamilton–Operators
2
~
H = − 2µ
(∆r + ∆Ω ) + V (r)
= −
~2
2µ
2 ∂
∂2
+
2
∂r
r ∂r
+
1 ab
δ La Lb + V (r)
2µr2
mit allen drei Komponenten des Bahndrehimpuls–
Operators. Da die Bahndrehimpulskomponenten nicht
untereinander verträglich sind, kann der quantenmechanische Zustand eines Teilchens im Zentralpotential durch
die simultane Angabe der möglichen Eigenwerte von
{H, La , L2 ≡ δ ab La Lb } , a ∈ {1, 2, 3} charakterisiert werden, wobei wir ohne Beschränkung der Allgemeinheit
L3 auszeichnen. Als Zustandsbezeichner wählen wir also E ∈ M(H) , m : m~ ∈ M(L3 ) , l : l(l + 1)~2 ∈ M(L2 ).
Offenbar ist zumindestens E = f (l).
Den stationären Energie–Eigenzustand geben wir also
folgendermaßen an: |E, m, li wobei die Bezeichner mit
den Spektren wie oben angegeben zusammenhängen, und
H, L3 , L2 |E, m, li = E, m~, l(l + 1)~2 |E, m, li .
Wir haben bereits im letzten Abschnitt den zu {L2 , L3 }
Satz von simultanen Eigenfunktionen ausgearbeitet. Die
Logik der Separationstheorie gebietet daher folgenden
Ansatz:
Φ(r, θ, φ) ≡ h(r, θ, φ)|E, m, li
= R(r) Ylm (θ, φ) ,
(148)
wobei der radiale Anteil R(r) der Wellenfunktion
Φ(r, θ, φ) die folgende Eigenwertgleichung erfüllt:
2
~
l(l + 1)~2
− ∆r +
+
V
(r)
R(r) = ER(r) .
2µ
2µr2
(149)
Dies ist äquivalent zu folgender Aufgabenstellung: Gegeben sei ein Teilchen, welches sich in einer räumlichen
Dimension im effektiven Potential
Veff (r) = V (r) +
l(l + 1)~2
2µr2
(150)
befindet. Eine qualitative Diskussion dieser Aufgabe kennen wir bereits aus der klassischen Mechanik für V (r) ∝
1/r, die sich dort beim reduzierten 2–Körper–Problem
stellte (µ war dort die reduzierte Masse der Relativbewegung um den Massenschwerpunkt). Für das Wasserstoff–
Atom ist V (r) = −e2 /r, wobei QP = +e die Ladung
des Protons und QE = −e die Ladung des Elektrons in
Vielfachen der Elementarladung e ist.
Da das effektive Potential Veff von der azimuthalen
Quantenzahl l : l(l + 1)~2 ∈ M(L2 ) abhängt, wird auch
der Energie–Eigenwert E ∈ M(H) hiervon abhängen.
Nun wird dieser sicherlich auch von dem Anteil der kinetischen Energie abhängen, der in die Radialbewegung
investiert wird. Das Teilchen kann im Zentralpotential
bei festgehaltener Energie, die in die Drehbewegung investiert wird, sicherlich unterschiedliche Mengen an kinetischer Energie in die Radialbewegung investieren. Daher braucht es noch eine weitere Quantenzahl, die radiale Quantenzahl k, welche bei festgehaltenem l den
radialen Bewegungszustand charakterisiert. Hierbei liegt
k ∈ I ⊂ R, wobei I a priori unbekannt ist. Wir haben
also folgende Situation:
Eigenwert Quantenzahl
Ekl
l(l + 1)~2
m~
k
l
m
Bezeichnung
radiale Quantenzahl
azimuthale Quantenzahl
magnetische Quantenzahl
Da der Hamilton–Operator von L3 ausschließlich über L2
abhängt, ist der Energie–Eigenwert mindestens (2l + 1)–
fach entartet, was gerade der Anzahl von möglichen magnetischen Quantenzahlen bei fester azimuthaler Quantenzahl l entspricht. Diese Entartung heißt essentielle
Entartung und wird von der zufälligen Entartung
unterschieden, die durch Ek0 l0 = Ekl charakterisiert ist,
und keinen fundamentalen Ursprung hat.
Zur Vereinfachung des Differentialoperators in (149)
redefinieren wir Rkl (r) =: Ukl (r)/r und finden als radiale
Zustandsgleichung:
2 2
~ d
−
+ Veff (l, r) Ukl (r) = Ekl Ukl (r) . (151)
2µ dr2
Offenbar ist es wichtig, daß wir uns Gedanken über das
Verhalten von Rkl (r) am Ursprung machen, der die Lage
einer Quelle ist, die als Ursache für das Zentralpotential
fungiert und den Ursprung übrigens überhaupt erst als
solchen auszeichnet. Wir suchen Lösungen von (151), die
am Ursprung hinreichend gutartig sind, und wagen den
Ansatz (Ckl ∈ C , k ∈ I, l : l(l + 1)~2 ∈ M(l))
lim Ukl (r) ∼ Ckl rs+1 .
r→0
(152)
Einsetzen in (151) liefert für r −→ 0 die Bedingung s(s +
1) − l(l + 1) = 0, woraus s ∈ {l, −(l + 1)} folgt, also
(
rl+1 , wenn s = l
lim Ukl (r) ∼ Ckl
r→0
r−l , wenn s = −(l + 1) .
Um den am Ursprung divergenten Lösungsast auszuschließen, setzen wir eine entsprechende Randwertbedingung, die die physikalische Lösung in Abhängigkeit von
der radialen und azimuthalen Quantenzahl eindeutig als
49
Funktion vom Abstand zum Ursprung bestimmt:
2 2
~ d
+ Veff (l, r) Ukl (r) = Ekl Ukl (r) ,
−
2µ dr2
Ukl (0) = 0 .
(153)
Wir gehen zu dimensionslosen Variablen über. Dazu
definieren wir in historischer Anlehnung folgende Größen:
~2
µe2
4
df µe
EI =
2
2~
df
a0 =
Die Randbedingung Vkl (0) = 0 und die Form der Differentialgleichung (160) motiviert einen Ansatz der Form
Vkl (ρ) ∝ ρs Pkl (ρ) , R 3 s > 0, wobei Pkl (ρ) eine Potenzreihe in ρ ist (mit Koeffizienten R 3 Cq , q ∈ N).
Einsetzen in (160) ergibt nach Ordnen nach Potenzen in
ρ:
0 =
(Bohr’scher Atomradius) ,
+
(Bohr’sche Ionisierungsenergie) . (154)
Die dimensionsbehafteten Größen drücken wir als Vielfache des Atomradius und der Ionisierungsenergie im
Bohr’schen Atommodell aus:
(155)
Bemerken Sie, daß das Minuszeichen unter der Wurzel in
(155) der Tatsache Rechnung trägt, daß wir uns für Bindungszustände interessieren, und diese wegen der Form
von Veff allesamt durch negative Energie gekennzeichnet
sind.
Mit diesen Skalierungen kann die radiale Wellengleichung folgendermaßen umgeschrieben werden:
2
d
l(l + 1) 2
2
−
+
−
λ
kl Ukl (ρ) = 0 ,
dρ2
ρ2
ρ
Ukl (0) = 0 . (156)
Wir bestimmen zunächst das asymptotische Verhalten
(ρ 1) von (156). Offenbar gilt asymptotisch
Ukl (ρ) a= exp (±ρλkl ) .
(157)
Aus Konsistenzgründen (Normierbarkeit) sind wir gezwungen, die exponentiell wachsende Asymptotik als
unphysikalisch zu verwerfen. Die physikalisch sinnvolle
Asymptotik ist also
Ukl (ρ) a= exp (−ρλkl ) .
q=0
∞
X
Cq [(q + s)(q + s − 1) − l(l + 1)] ρq+s−2 +
Cq 2 [1 − (q + s)λkl ] ρq+s−1 .
Nehmen wir an, daß C0 6= 0, so ist die niedrigste Potenz
in ρ offenbar durch den Summanden mit q = 0 gegeben.
Die Bedingung, daß dieser verschwindet ist
Ukl (ρ) = exp (−ρλkl ) · Vkl (ρ) , ρ ∈ [0, ∞) . (159)
Unsere neue Aufgabe lautet damit:
2
d
d
2 l(l + 1)
−
2λ
+
−
Vkl (ρ) = 0 ,
kl
dρ2
dρ
ρ
ρ2
Vkl (0) = 0 .
(160)
(162)
wobei s = l + 1 die einzige konsistente Lösung darstellt,
die die Randbedingung Vkl (0) = 0 respektiert. Für ein
gegebenes N 3 q 6= 0 ist die niedrigste Potenz von ρ
nun q + s − 2 = q + l − 1. Für die Koeffizienten erhalten
wir damit folgende Rekursionsbeziehung (nach geeigneter
Indexverschiebung):
q(q + 2l + 1)Cq = 2 [(q + l)λkl − 1] Cq−1 ,
N 3 q 6= 0 .
(163)
Nach Bestimmung von C0 (Normierung) folgen hieraus
rekursiv alle Koeffizienten von Pkl (ρ). Weiterhin gilt, daß
Cq /Cq−1 −→ 0 für q −→ ∞. Die Reihe konvergiert also.
Aber Vorsicht, genauer haben wir ja für diesen Grenzfall
Cq /Cq−1 −→ 2λkl /q.
Sie können sich selbst davon überzeugen, daß Cq −→
(2λkl )q /q! für q −→ ∞ gilt. Für jedes l ∈ N/2 (hier
eigentlich l ∈ N) und für jedes k ∈ I gibt es ein Q ∈ N
mit CQ = (2λkl )Q /Q!+O(ε). Damit kann die Potenzreihe
Pkl (ρ) folgendermaßen aufgespalten werden:
Pkl (ρ) = Rkl (ρ) +
∞
q
X
(2λkl ) q
ρ .
q!
(164)
q=Q
(158)
Eine schöne Eigenschaft dieser Asymptotik ist, daß sie
das Verhalten der radialen Wellenfunktion im Intervall
ρ ∈ [0, 1) nur wenig beeinflußt. Insbesondere wird das
Exponential im Limes ρ −→ 0 gerade Eins und respektiert damit auch die Randbedingung Ukl (0) = 0. Dies
motiviert folgenden Ansatz:
(161)
q=0
s(s − 1) = l(l + 1) ,
df
ρ = r/a0 ,
df p
λkl =
−Ekl /EI .
∞
X
Im Grenzfall ρ −→ ∞ finden wir daher
h
i
ρ→∞
Vkl (ρ) −→ lim ρl+1 R̃kl (ρ) + exp (2λkl ρ) , (165)
ρ→∞
PQ−1
wobei R̃kl (ρ) = Rkl (ρ) + q=0 (2λkl ρ)q /q!. Dies impliziert aber, daß Vkl (ρ) und sogar Ukl (ρ) nicht normierbar sind, da sie im Grenzfall ρ −→ ∞ divergieren, was
natürlich keinen Sinn macht. Folglich muß die Rekursion
(163) abbrechen, so daß Pkl (ρ) nur ein Polynom in ρ ist.
Bricht die Rekusion ab, gibt es keine Normierungsprobleme, da das Dämpfungsexponential in Ukl (ρ) für eine
physikalisch vernünfitge Asymptotik sorgt.
Nehmen wir an, daß die Rekursion für q = q∗ abbricht.
Dann gilt [(q∗ + l)λkl − 1]Cq∗ −1 = 0. Da C0 6= 0 ist auch
Cq∗ −1 6= 0 und wir finden: λkl = 1/(q∗ + l). Mit anderen
50
Worten, k = q∗ und die Rekursion bricht gerade für q = k
ab. Dies schränkt I ⊂ R auf I = N/{0} ein. Der Energie–
Eigenwert in Abhängigkeit von der azimuthalen und der
radialen Quantenzahl ist somit
Ekl
−EI
=
, l ∈ N , k ∈ N/{0} .
(k + l)2
(166)
Die Funktion Vkl (ρ) ist daher ein Polynom in ρ von
Ordnung l + k, wobei die niedrigste Potenz gerade l + 1
ist. Die Rekursionsbeziehung (163) wird
Cq = −
2(k − q)
Cq−1 ,
q(q + 2l + 1)(k + l)
(167)
wobei der Rekursionsabbruch offenbar implementiert ist.
Es lohnt sich in einer ruhigen Minute Cq = f (C0 ) explizit
herzuleiten.
Bsp. VIII.1 Der radiale Anteil Rk,l (r) der stationären
Wellenfunktion eines nichtrelativistischen Elektrons im
klassischen Zentralpotential eines Protons (sogenanntes Wasserstoff–Problem) ist für einige radiale und
azimuthale Quantenzahlen explizit durch folgende Ausdrücke gegeben:
R1,0 (r) = 2(a0 )−3/2 exp (−r/a0 ) ,
R2,0 (r) = 2(2a0 )−3/2 (1 − r/2a0 ) exp (−r/2a0 ) ,
R1,1 (r) = (2a0 )−3/2 3−1/2 (r/a0 ) exp (−r/2a0 ) .(168)
Für festgelegtes l ∈ N gibt es unendlich viele Energiewerte Ekl ∝ −1/(k + l)2 , da k ∈ N/{0}. Jeder dieser
Energiewerte ist wenigstens (2l + 1)–fach entartet: Diese
essentielle Entartung hat ihren Ursprung in der Tatsache, daß die Gleichung für den radialen Anteil der Wellenfunktion lediglich von l aber nicht von m abhängt.
Zusätzlich gibt es zufällige Entartung: Für Pärchen
(k1 , l1 ) , (k2 , l2 ) mit k1 +l1 = k2 +l2 gilt ja Ek1 ,l1 = Ek2 ,l2 .
Die zugehörigen Zustände sind also energetisch nicht zu
unterscheiden.
Speziell für das H–Problem ist es zweckmäßig, die sogenannte Hauptquantenzahl n := k + l einzuführen,
da Ekl nur von dieser Kombination abhängt. Also, En ≡
Ek+l := Ekl = −EI /n2 . Prinzipiell haben wir die Wahl,
entweder (k, l) oder (n, l) zu spezifizieren, um die Eigenzustände zu bestimmen. Wir folgen der üblichen Konvention und benutzen (n, l) als Quantenzahlen. Die Hauptquantenzahl n charakterisiert die sogenannte Elektronenschale.
Da k ∈ N/{0} ist, gibt es für fixiertes n nur eine endliche Anzahl von l–Werten, nämlich l ∈ {0, 1, . . . , n − 1}.
Also kann l bei fixiertem n gerade n unterschiedliche
Werte annehmen. Daher hat sich folgende Sprechweise
eingebürgert: Die mit der Hauptquantenzahl n bezeichnete Elektronenschale hat n Unterschalen, die eben
durch l ∈ {0, 1, . . . , n−1} charakterisiert sind. Schließlich
kann jeder dieser Unterschalen (2l + 1) unterschiedliche
Zustände unterbringen, die durch die (2l + 1) möglichen
Werte von m ∈ {−l, . . . , l} ⊂ Z gegeben sind bei festem
l. Die totale Entartung ν(n) einer Elektronenschale n
(Energie En ) ist somit
ν(n) =
n−1
X
(2l + 1) = n2 .
(169)
l=0
Aus historischen Gründen, die vor der Entwicklung der
Quantenmechanik ihren Ursprung haben, hat sich folgende spektroskopische Bezeichnung eingebürgert, die
auch heute noch im Gebrauch ist und ein quasi botanisches Erbe darstellt: l = 0 ↔ s , l = 1 ↔ p , l =
2 ↔ d , l = 3 ↔ f , · · · . Für N 3 l > 3 werden die
l–Quantenzahlen mit den Buchstaben nach f in der korrekten alphabetischen Reihenfolge bezeichnet. Wie oben
dargelegt werden Unterschalen durch Wertepaare (n, l)
charakterisiert, wobei in der spektroskopischen Schreibweise nl benutzt wird und l durch den entsprechenden
Buchstaben ersetzt wird.
Bsp. VIII.2 (Einige Energiestufen des H–Atoms)
Der energetisch tiefliegendste Zustand eines Elektrons im
Coulomb–Potential des Protons ist der 1s–Zustand, da
für die Hauptquantenzahl N 3 n ≥ 1 gilt. Folglich muß
die radiale Quantenzahl k = 1 sein und für die azimuthale Quantenzahl l = 0 ↔ s gelten. Der 1s–Zustand weist
hinsichtlich der magnetischen Quantenzahl keine Entartung auf und es ist m = 0.
Der energetisch nächst tiefliegende Zustand hat n = 2.
Dies ergibt für die azimuthale Quantenzahl folgende Wertemöglichkeiten: l ∈ {0, 1} ↔ {s, p}. Die möglichen
Zustände zu n = 2 korrespondieren somit zu den Unterschalen 2s und 2p. Der 2s–Zustand weist hinsichtlich der
magnetischen Quantenzahl keine Entartung auf, der 2p–
Zustand dagegen ist hinsichtlich der magnetischen Quantenzahl dreifach entartet: m ∈ {−1, 0, 1}. Die totale Entartung ist somit ν(2) = 4, was der Anzahl der möglichen
unterscheidbaren Zustände zu n = 2 entspricht.
Für n = 3 ist l ∈ {s, p, d}, die möglichen Unterschalen sind also mit 3s, 3p und 3d bezeichnet. Neu
ist die azimuthale Quantenzahl l = 2 ↔ d, für die
m ∈ {−2, −1, 0, 1, 2} ist. Zu n = 3 gibt es 1+3+5 = 9 unterscheidbare Zustände, die alle auf dem gleichen Energieniveau liegen.
Beachten Sie, daß E1 /E2 = 4 , E1 /E3 = 9 und
E2 /E3 = 9/4 ist.
Bsp. VIII.3 (Einige Wellenfunktionen) Die 1s–
Unterschale wird von einem Zustand mit folgender Wellenfunktion Φn,l,m im Ortsraum populiert:
Φ1,0,0 = √ 1
πa03
e−r/a0 .
(170)
Die Wellenfunktion im Ortsraum zum 2s–Zustand ist:
1
Φ2,0,0 = 8πa
1 − 2ar 0 e−r/2a0 .
(171)
3
0
Die 2p–Unterschale ist hinsichtlich der magnetischen
Quantenzahl dreifach entartet. Die zugehörigen Wellen-
51
funktionen sind (s(θ) := sin θ , c(θ) := cos θ):
Φ2,1,−1 =
Φ2,1,0 =
r −r/2a0
e
πao3 a0
√1
8
r −r/2a0
e
2πao3 a0
√1
4
8
c(θ) ,
r −r/2a0
e
πao3 a0
Φ2,1,1 = − √1
IX.
s(θ)e−iϕ ,
(172)
s(θ)e+iϕ .
S:
ELEMENTARE STREUTHEORIE
Streuungen sind die elementaren Bausteine vieler physikalischer Prozesse, die wir in der Natur beobachten, und
stehen zudem in direktem Zusammenhang mit den fundamentalen Wechselwirkungen, die in den Quantentheorien
der Felder formuliert und studiert werden. Aber bereits in
der Quantentheorie eines Massepunktes kann der formale Rahmen hierfür entwickelt und studiert werden, auch
wenn die Streuung dann nur an einem externen Potential stattfindet, welches bezüglich seiner quantenmechanischer Freiheitsgrade nicht aufgelöst wird und daher als
klassisch angenommen wird.
Das mag ein wenig ernüchternd sein, hat aber wichtige
Anwendungen, wann immer externe Felder von Bedeutung sind, und ist auch schon ein Fortschritt relativ zur
Klassischen Mechanik. Mit der beginnen wir übrigens,
denn hier kann eine intuitive Verankerung gelegt werden,
durch deren Abstraktion der quantenmechanische Rahmen zur Behandlung von Streuprozessen verständlicher
wird.
A.
Klassische Präliminarien
Gegeben sei ein Hamilton–System (P ∼
= R3 × R3 , H),
wobei P durch (q, p) koordinatisiert sei, mit der Bewegungsgleichung
d
Z(t) = F (Z(t)) ,
dt
(173)
wobei Z(t) = (q(t), p(t))T den mechanischen Zustandes
des Systems zur Zeit t ∈ R beschreibt. Im linearen Fall ist
die rechte Seite der Hamilton–Bewegungsgleichung (173)
durch
q(t)
p(t)/m
F p(t)
= −∇V
,
(174)
(q(t))
wobei V das Potentialfeld bezeichne und −∇V ist das
zugehörige Kraftfeld. Der Einfachheit halber nehmen wir
zunächst an, daß das Potential einen kompakten Träger
hat, und daß sich das Teilchen für t −→ −∞ und t −→
+∞ außerhalb dieses Trägers befinde. Dann gilt
lim q(t) = Qin + tPin /m ,
t→−∞
lim q(t) = Qfi + tPfi /m .
t→+∞
(Qin , Pin ≡ limt→−∞ P (t)) durch Integration der Bewegungsgleichung mit den Anfangsbedingungen q(t0 ) =
Qin +t0 Pin /m , p(t0 ) = p1 berechnet werden, wobei wir t0
so fern in der Vergangenheit wählen, daß q(t) für t < t0
außerhalbt des Trägers von V ist.
Die Streuabbildung ist dann die Abbildung
(175)
Aufgrund der Energieerhaltung gilt |Pin | = Pfi . Prinzipiell können die Größen (Qfi , Pfi ≡ limt→+∞ P (t)) aus
P −→ P ,
Qfi
Qin
−→
.
Pfi
Pin
(176)
∼ R6 definiert und
Die Streuabbildung S ist auf ganz P =
surjektiv, das heißt jeder Zustand Z ∈ P kommt als Anfangszustand Zin (initial) und als Endzustand Zfi (final) vor.
Bsp. IX.1 (Klassische Streuung an beschränktem
Potential in 1–d Konfigurationsraum) Sei P ∼
= R2
und das Potential beschränkt, V (q) ≤ E∗ := max(V ).
Für Energien E < E∗ wird das Teilchen an dem Potential reflektiert, wobei der Impuls des Teilchens zeitweise
variiert, solange der Ort des Teilchens im Träger von V
liegt, aber insgesamt wird nur das Vorzeichen des Impulses geändert. Die Streuabbildung hat also die folgende
Form:
Qfi (Qin ,Pin )
in
=
.
(177)
S Q
Pin
−Pin
Für Energien E > E∗ bewegt sich das Teilchen durch den
gesamten Träger von V , wobei innerhalb des Trägers sein
Impuls zeitlich variiert, am Ende es jedoch den gleichen
Impuls besitzt wie zu anfangs. Im Vergleich zur freien
Bewegung wird allerdings die Dynamik aufgrund der Existenz von V eine andere sein. Die Streuabbildung hat die
Form
,Pin )
in
= Qfi (QPin
.
(178)
S Q
Pin
in
Im Fall E = E∗ kommt das Teilchen am Ort q∗ : V (q∗ ) =
E∗ zur Ruhe, falls es diesen in endlicher Zeit erreichen
kann.
Hat das Potential V keinen kompakten Träger, sondern sind V und |∇V | für große |t| nur hinreichend klein
aber endlich, so wird die Bewegung auch für sehr große
|t| nicht exakt durch Qin,fi + tPin,fi /m beschrieben. Es ist
aber intuitiv zu erwarten, daß die Bewegung wenigstens
asymptotisch frei ist, also
∃ (Qin,fi , Pin,fi ) : lim |q(t) − Qin,fi + tPin,fi /m| = 0 .
t→±∞
Nun ja, es zeigt sich allerdings, daß dies viel weniger
intuitv ist, als gedacht, und zwar in folgendem Sinne:
Das Potential muß asymptotisch schon sehr klein sein,
zum Beispiel gilt asymptotische Freiheit bereits für das
Coulomb–Potential nicht.
Wir waren ein wenig engstirnig, denn eigentlich werden
nur die Impulse ausreichend vor und nach der Streuung
gemessen. Diese sollten asymptotisch konstant sein, was
52
auch für langsamer abfallende Potentiale erwartet werden darf. Die Streuabbildung ist dann nur die Abbildung
Pin −→ Pfi .
Im Folgenden passen wir unsere intuitive Beschreibung
von Streuprozessen dem formalen Rahmen an, den die
Quantenmechanik zur Beschreibung von Streuung verlangt. Der Zustand eines Teilchens sei durch Z(t) =
(q(t), p(t)) gegeben und werde zum Beispiel zur Zeit t = 0
durch Z(0) = (Q0 , P0 ) beschrieben. Wie zuvor bezeichnen wir die zugehörigen asymptotischen freien Zustände
in der fernen Vergangenheit bzw. der fernen Zukunft
durch (Qin,fi , Pin,fi ). Wir führen neue Abbildungen ein:
Win,fi : (Qin,fi , Pin,fi ) −→ (Q0 , P0 ) .
(179)
Die Komposition S := Wfi −1 ◦ Win ist dann der sogenannte Streuoperator. Dieser Operator beschreibt offenbar den Streuvorgang im Endeffekt so, daß die Streuung selbst nicht dynamisch aufgelöst wird, da wir ja
lediglich die asymptotisch freien Zustände miteinander
vergleichen. Das ist komfortabel, aber stellt uns auch
vor schwere Aufgaben, wenn wir das sogenannte inverse Problem lösen wollen, also von S auf das Potential
oder etwa die Form eines reflektierenden Körpers zurückschließen möchten. Dies ist offenbar eine der wichtigsten
Fragestellungen in der Streutheorie, aber auch eine der
schwierigsten.
B.
Ein instruktives Beispiel
Im folgenden Beispiel betrachten wir ein Paar von Evolutionsgleichungen, das so einfach ist, daß der Streuoperator explizit berechnet werden kann. Die Überlegungen
sind weitgehend unabhängig vom zu Grunde liegenden
Funktionenraum und Funktionalanalysis spielt allenfalls
im Hintergrund eine Rolle (aus diesem ist sie ohnehin nur
schwerlich wegzudenken).
Bsp. IX.2 (Konstruiertes Beispiel zur raschen
Veranschaulichung) Die Einfachheit der folgenden
Diskussion liegt an folgender Annahme: Gegeben sei ein
klassisches System im R1 mit der Dispersionsrelation
(Energie–Impuls–Beziehung für ein freies Teilchen) E =
p. Diese ist artifiziell, da sie nicht einmal approximativ aus der relativistischen folgt. Wir benutzen sie trotzdem, weil sie offenbar die schöne Eigenschaft hat, qua
Quantisierung eine Prozessgleichung zu liefern, die ausschließlich Ableitungen erster Ordnung enthält, was die
Diskussion enorm vereinfacht und eine exakte Behandlung ermöglicht.
Kanonische Quantisierung liefert für die freie Evolution der Wellenfunktion im Ortsraum die Prozessgleichung
i~∂t Ψ(t, x) = H0 Ψ(t, x) ,
(180)
wobei H0 := Op ≡ −i~∂x auf R.
Die freie Zeitentwicklung ist durch U0 (t) :=
exp (−iH0 /~) gegeben. Wegen der Form von H0 ist
U0 (t) gerade die unitäre Darstellung von räumlichen
Translationen um die Distanz t (c=1), jedenfalls im
L2 (R)–Fall. Mit anderen Worten, (180) hat die Lösung
Ψ(t, x) = U0 (t)Ψ(0, x) = Ψ(0, x − t) .
(181)
Dies gilt natürlich nur dann, wenn Ψ differenzierbar ist.
Der unitäre Operator (im L2 (R)–Fall) U0 (t) dagegen ist
auf jedem vernünftigen Funktionenraum über R wohldefiniert und stark stetig (überlegen Sie sich Beispiele),
insbesondere in L2 (R). Unitarität von U0 (t) (im L2 (R)–
Fall) impliziert U0 † (t) = U0 −1 (t) = U0 (−t).
Nun kann das Teilchen auch in den Einflußbereich
eines Potentials V (x) mit geeignetem Träger geraten,
dann wird die zeitliche Entwicklung der zugehörigen Wellenfunktion nicht mehr von H0 generiert, sondern von
H = H0 + V (x). In vielen realistischen Fällen wird V (x)
als Störung von H0 betrachtet, da die Evolution im allgemeinen nicht mehr exakt lösbar sein wird, und die exakte Evolution wird um die freie Evolution entwickelt. Das
führt uns zu weit im Moment. Die exakte Evolution der
Wellenfunktion wird also folgendermaßen beschrieben:
i~∂t Ψ(t, x) = (H0 + V (x)) Ψ(t, x) ,
(182)
wobei per Konstruktion die Anfangsbedingung mit der der
freien Evolution übereinstimmen soll.
Wie schaut der Zeittranslationsoperator U (t) in diesem
Fall explizit aus? Zunächst setzen wir
Z x
i
df
W Φ(x) = exp
dy V (y) Φ(x) . (183)
~ 0
Offenbar ist H = W −1 H0 W, das heißt HΨ(t, x) =
(W −1 H0 W)Ψ(t, x) für geeignete Wellenfunktionen, wobei wir Kompositionszeichen unterdrückt haben. Also gilt
(Zeigen Sie dies!)
Ψ(t, x) = U (t)Ψ(0, x) = W −1 U0 (t)WΨ(0, x)
Z
i x
= exp −
dy V (y) ◦
~ 0
Z x
i
◦ U0 (t) exp
dy V (y) Ψ(0, x)
~ 0
Z x−t
i
= exp
dy V (y) Ψ(0, x − t) . (184)
~ x
Sie können das ganz explizit durch Einsetzen in die Prozessgleichung (182) überprüfen oder etwas formaler folgendermaßen:
∂t U (t)Ψ(0, x) =
=
=
=
=
∂t W −1 U0 (t)WΨ(0, x)
W −1 ∂t U0 (t)WΨ(0, x)
W −1 (−iH0 /~) U0 (t)WΨ(0, x)
−(i/~)W −1 H0 WW −1 U0 (t)WΨ(0, x)
−(i/~)HU (t)Ψ(0, x) .
(185)
Der Zustand eines freien Teilchens Ψ± ist genau dann
asymptotisch gleich dem Zustand eines Teilchens, daß
53
dem Potential ausgesetzt war, wenn in der fernen Vergangenheit bzw. Zukunft folgendes gilt:
lim {U0 (t)Ψ± (0, x) − U (t)Ψ(0, x)} = 0 .
t→±∞
(186)
Dann gilt weiter
Ψ± (0, x) = lim t → ±∞ exp
Z x
i
dy V (y) Ψ(0, x) .
~ x+t
Salopp gesprochen wird die Zeitentwicklung auf der
rhs(187) vom Wechselwirkungsanteil (also vom Potential) in H betrieben statt von H0 oder ganz H. Die Grenzwerte in (187) existieren genau dann, wenn V bei ±∞
uneigentlich integrierbar ist. Dann ist
Z x
i
dy V (y) Ψ(0, x)
Ψ+ (0, x) = exp
~ ∞
Z
i ∞
= exp −
dy V (y) Ψ(0, x)
~ x
Z
i ∞
= exp −
dy V (y) ◦
~ x
Z x
i
◦ exp −
dy V (y) Ψ− (0, x)
~ −∞
Z
i +∞
= exp −
dy V (y) Ψ− (0, x) .
~ −∞
Damit haben wir ein wichtiges Resultat gefunden,
nämlich: Wenn V bei ±∞ uneigentlich integrierbar ist,
existiert also der Streuoperator S:
Ψ+ = SΨ−
Z
i +∞
= exp −
dy V (y) Ψ− .
~ −∞
(187)
Der Streuoperator ist einfach die Multiplikation mit einer
komplexen Zahl vom Betrag eins. Auf allen normierten
Funktionenräumen über R ist S somit isometrisch und
bijektiv, in L2 (R) sogar unitär.
Die Abbildungen
W± : Ψ± −→ Ψ ,
Z
i x
W± Ψ± (0, x) = exp −
dy V (y) Ψ± (0, x)
~ ±∞
heißen Wellenoperatoren, und es gilt S = W+ −1 ◦W− .
C. Das kleine ABC der
Sturm–Liouville–Operatoren
Dieser Einschub ist lediglich eine kleine Erinnerung,
Auffrischung oder Einführung in die aufregende und
für die Physik wichtige Theorie der Sturm–Liouville–
Operatoren. Je nach dem, wie sehr Ihre kleinen grauen Zellen diesen Stoff bereits verdaut haben, können Sie
diesen Abschnitt überspringen, oberflächlich durchgehen
oder tiefsinnig studieren, auch wenn er nicht so tiefsinnig
präsentiert wird.
Ein Sturm–Liouville–Differentialausdruck ist der
folgende gewöhnlicher Differentialausdruck in einem beliebigen (beschränkten oder unbeschränkten) Intervall
I = (a, b):
df
OSL Ψ(x) =
1
r(x)
{−∂x (p(x)∂x Ψ(x)) + V (x)Ψ(x)} .
(188)
mit einer als positiv vorausgesetzen Funktion r : R −→
R, die die Rolle einer Gewichtsfunktion in einem Skalarprodukt spielen wird. Solche Differentialausdrücke treten typischer Weise in der Physik auf, nach dem die
Zeitabhängigkeit eines dynamischen Systems vom zugehörigen Zustand absepariert wurde. Wichtige Beispiele
sind die schwingende Saite, die schwingende Kreismembran, oder der eindimensionale Schrödinger–
Operator, also OSL := −Op ◦ Op + V (x) in I mit
−∞ ≤ a < b ≤ ∞.
1.
Voraussetzungen und minimaler & maximaler Operator
Wir setzen dabei stets voraus:
(1) p, V, r sind meßbare reellwertige Funktionen mit
1/p, V, r ∈ L1lok (I), das heißt sie sind über jedes
kompakte Teilintervall von I integrierbar.
(2) p(x) > 0 , r(x) > 0 für fast alle x ∈ I.
Mit diesen recht allgemeinen Voraussetzungen ist es oft
technisch sehr aufwendig und langwierig, die Theorie der
Sturm–Liouville–Operatoren zu entwickeln, und es ist
dann verlockend von folgenden wesentlich stärkeren Voraussetzungen auszugehen:
(10 ) V, r sind stückweise stetige reellwertige Funktionen
auf I, p ist stetig und stückweise differenzierbar.
(20 ) Es gilt r(x) > 0 und p(x) 6= 0 für alle x ∈ I.
Die zusätzlichen Einschränkungen betreffen nur das Verhalten der Koeffizienten im Innern von I. In vielen Anwendungen sind die Koeffizienten dort hinreichend regulär und bereiten keine Probleme. Was beiden Sätzen
an Voraussetzungen gemein und damit also wichtig ist:
Es wird beliebig singuläres Verhalten am Rand von I
zugelassen.
Ist Φ : I ≡ (a, b) −→ C meßbar und z ∈ C, so
heißt eine Funktion Ψ : I −→ C eine Lösung von
(OSL − z)Ψ = Φ, wenn Ψ und p∂x Ψ absolut stetig sind
und −∂x (p∂x Ψ)(x) + (q(x) − zr(x))Ψ(x) = r(x)Φ(x) für
fast alle z ∈ I.
Wir führen folgenden Hilbert–Raum ein:
df
L2 (I, r) =
Ψ : I −→ C : Ψ meßbar , r|Ψ|2 ∈ L1 (I)
54
mit dem Skalarprodukt und der Norm
Z
df
hΨ, Φir =
dx (ΨΦr) (x) ,
I
df
kΨkr =
p
hΨ, Ψir .
(189)
Der maximale durch OSL erzeugte Operator T ist definiert durch
n
df
D(T ) = Ψ ∈ L2 (I, ∇) : Ψ und p∂x Ψ absolut stetig
o
in I , OSL Ψ ∈ L2 (I, r)
T Ψ = OSL Ψ .
Der minimale durch OSL erzeugte Operator T00 ist die
Einschränkung von T auf
n
o
df
D(T00 ) = f ∈ D(T ) : Ψ hat kompakten Träger in I .
Der minimale Operator T00 besitzt selbstadjungierte Fortsetzungen, die auch als selbstadjungierte Realisierungen von OSL bezeichnet werden.
Um dies verständlicher zu machen, benötigen wir
einen allgemeinen Existenz– und Eindeutigkeitssatz für
gewöhnliche lineare Differentialgleichungen: Gegeben sei
das Anfangswertproblem (AWP)
∂x y(x) = a(x)y(x) + h(x) , x ∈ I ,
y(x0 ) = y0 , x0 ∈ I , y0 ∈ Cn ,
(a) Die Idee zum Beweis dieser Aussage fußt auf einer
lokalen Fixpunktkonstruktion. Lokal deswegen, weil verankert um den Anfangswert es gelingt, eine Kontraktion
zu konstruieren, deren Fixpunkt das (AWP) lokal eindeutig löst. Die Konstruktion kann dann sukzessive auf
I erweitert werden.
Das Anfangswertproblem (AWP) ist äquivalent zur Integralgleichung
Z x
y(x) = y0 +
dt [a(t)y(t) + h(t)] .
(191)
x0
Sei I(x, η) := [x − η, x + η] , x ∈ I , η > 0. Wir wählen
η > 0 so, daß gilt:
Z
dt |a(t)| ≤ q < 1 .
I(x0 ,η)
Nun betrachten wir die Integralgleichung in dem Banachraum C(I(x0 , η)) mit der Maximumnorm k ◦ k∞ . In diesem Raum ist die Abbildung B mit
Z x
df
dt [a(t)y(t) + h(t)] , x ∈ I(x0 , η)
Bu(x) = y0 +
x0
eine Kontraktion, denn
Z
kBu − Bvk∞ ≤ ku − vk∞
dt |a(t)|
I(x0 ,η)
(190)
wobei y, h : I −→ Cn und a : I −→ GL(n, C), und die
üblichen Meßbarkeitsanforderungen gelten. Eine Funktion nennen wir eine Lösung von (190), wenn jede Komponente absolut stetig ist und das (AWP) für fast alle
x ∈ I erfüllt ist.
Dieses (AWP) ist gewissermaßen das Rollenmodell für
Sturm–Liouville–Probleme, was wir alsbald zeigen. Zuvor
nehmen wir diese Aussage hin als Motivation, um die
folgenden grundsätzlichen Aussagen zu studieren.
Satz IX.1 (a) Im Anfangswertproblem (AWP) seien
|a| , |h| lokal integrierbar in I Dann existiert für
jedes x0 ∈ I und jedes y0 ∈ Cn genau eine Lösung.
Sind a, h stetig, so ist y stetig differenzierbar.
(b) Seien aj : I −→ Cn×n , j ∈ {1, 2} meßbar und lokal
integrierbar. Gilt a = a1 + za2 mit z ∈ C, so ist
die Lösung yz (x) , x ∈ I von (AWP) eine ganze
Funktion von z.
(c) Gilt aj −→ a, hj −→ h in L1lok (I) und y0 j −→ y0 ,
so konvergiere die entsprechenden Lösungen yn in
I lokal gleichmäßig gegen die Lösung y.
Beweis IX.1 Sind die Koeffizienten von (AWP) stückweise stetig auf I = (a, b) und ersetzen wir in (c) die
L1lok –Konvergenz durch gleichmäßige Konvergenz, so ist
der Satz Ihnen vermutlich aus der klassischen Theorie
gewöhnlicher linearer Differentialgleichungen bekannt.
≤ qku − vk∞ .
(192)
Mit dem Fixpunktsatz von Banach folgt somit, daß B
einen eindeutig bestimmten Fixpunkt y hat, also By(x) =
y(x) , x ∈ I(x0 , η). Dieser Fixpunkt löst das Anfangswertproblem in I(x0 , η). Das Verfahren kann nun an den
Rändern von I(x0 , η) fortgesetzt werden, das heißt, das
gleiche Verfahren kann in I(x0 − η, η) und I(x0 + η, η)
vollzogen werden, usw. Da I(x0 , eta) ∩ I(x0 ± η, η) 6= {0}
und die Fixpunkte jeweils eindeutig sind, erhalten wir so
schließlich eine eindeutige Lösung in I.
Die Beweise der Aussagen (b) & (c) bleiben Ihnen beziehungsweise Ihrem Selbststudium überlassen. ∗–< [{; 0)
Es folgt nun die angepriesene verwandtschaftliche Beziehung zwischen (AWP) und dem Sturm–Liouville–
Anfangswertproblem.
Lemma IX.1 Der Sturm–Liouville Differentialausdruck
OSL erfülle die obigen Voraussetzungen {(1), (2)} oder
{(10 ), (20 )}. Ist Φ : I −→ C meßbar und rΦ ∈ L1lok (I),
so ist für beliebige z ∈ C und (y0 , y1 ) ∈ C2 das Anfangswertproblem
(OSL − z) Ψ = Φ ,
Ψ(x0 ) = y0 , (p∂x Ψ) (x0 ) = y1
(193)
eindeutig lösbar. Die Lösung Ψz (x) ist für jedes x ∈
I eine ganze Funktion von z. Letzteres gilt auch für
(p∂x Ψz )(x).
55
Der Beweis ergibt sich aus der Äquivalenz von dem Anfangswertproblem (193) mit (AWP). Die Äquivalenz ist
rasch etabliert:
!
!
!
0
y0
Ψ
,
,h =
, y(x0 ) =
y =
rΦ
y1
p∂x Ψ
!
0
1/p
a =
.
(194)
V − zr 0
Die Lösungen der homogenen GLeichung (OSL −z)U = 0
bilden einen zwei–dimensionalen Vektorraum über dem
komplexen Zahlenkörper. Zwei Lösungen U1 , U2 bilden
genau dann ein Fundamentalsystem, wenn die (modifizierte) Wronskideterminante
!
U1 (x)
U2 (x)
df
(195)
W(U1 , U2 ) = det
p∂x U1 (x) p∂x U2 (x)
nicht verschwindet. Beachten Sie, daß die Determinante
nicht von x abhängt. Zeigen Sie das ruhig.
Ist Φ : I −→ C so, daß rΦ lokal integrierbar ist, und
ist U1 , U2 ein Fundamentalsystem von (OSL −z)U = 0, so
sind alle Lösungen Ψ von (OSL −z)Ψ = Φ folgendermaßen
gegeben:
Ψ(x) = c1 U1 (x) + c2 U2 (x) +
Z x
n
1
+
U1 (x)
dt r(t)U2 (t)Φ(t) +
W(U1 , U2 )
Zc x
o
−U2 (x)
dt r(t)U1 (t)Φ(t) ,
c
(196)
(b) Ist λ ∈ R und U eine Ls̈oung von (OSL − λ)U = 0,
so gilt [U, U ]x = W(Ū , U ) = 0 genau dann, wenn
U komplexes Vielfaches einer reellen Lösung ist.
Beweis IX.2 (a) Gleichung (198) folgt direkt durch
partielle Integration. Aus (198) folgt die Existenz
der Grenzwerte in (199) und Gleichung (200) durch
Grenzübergang α −→ a+ und β −→ b−.
(b) Es ist [U, U ]x = 2i= Ū p∂x U . Dieser Wert ist genau dann Null, wenn die Funktionen U und p∂x U
in einem reellen Verhältnis stehen. Dies gilt genau
dann, wenn U bis auf einen komplexen Vorfaktor
eine reelle Lösung ist
Das war es auch schon. ∗–< [{; 0)
Es ist instruktiv, zunächst sogenannte reguläre Operatoren zu betrachten. OSL heißt regulär bei a, wenn
a > −∞ ist, und die Funktionen 1/p, V, r (neben den obigen allgemeinen Voraussetzungen) über [a, c] integrierbar
sind für ein (dann alle) c ∈ I. Der Operator OSL heißt
regulär bei b, wenn b < ∞ ist und 1/p, V, r über [c, b]
integrierbar sind für ein (dann alle) c ∈ I. OSL heißt
regulär, wenn er bei a und b regulär ist. OSL heißt singulär bei a (bzw. b) wenn er bei a (bzw. b) nicht regulär ist. OSL heißt singulär, wenn OSL nichr regulär
ist. Diese Flut von Begriffsbildungen sind der Gültigkeit
des folgenden Satzes gebührend geschuldet.
Satz IX.3 Sei OSL regulär bei a, z ∈ C, Φ : I −→ C
meßbar und rΦ über I 0 := (a, c) integrierbar für c ∈ I,
zum Beispiel Φ ∈ L2 (I 0 , r).
(a) Für jede Ls̈ung Ψ von (OSL − z)Ψ = Φ existieren die
folgenden Grenzwerte:
wobei c1 , c2 ∈ C, c ∈ I.
Def. IX.1 Seien Ψ, Φ : I ≡ (a, b) −→ C absolut stetige Funktionen, für die p∂x Ψ und p∂x Φ stetig sind. Die
Lagrange–Klammer von Ψ mit Φ für x ∈ I ist definiert
als
df
[Ψ, Φ]x = Ψ(x) (p∂x Φ) (x) − (p∂x Ψ) (x)Φ(x) .(197)
Offenbar gilt speziell für Lösungen Ψ, Φ von (OSL −z)U =
0, daß [Ψ, Φ]x = W(Ψ, Φ)(x).
Satz IX.2 (a) Sind Ψ, Φ : I = (a, b) −→ C und
p∂x Ψ, p∂x Φ absolut stetig, so gilt für J = [α, β] ⊂
I die Lagrange–Identität
Z
OSL Ψ(x)Φ(x) − Ψ(x)OSL Φ(x) r(x) =
df
Ψ(a) =
df
lim Ψ(x) , p∂x Ψ(a) = lim p∂x Ψ(x) (200)
.
x→a+
x→a+
(b) Für beliebige c0 , c1 ∈ C gibt es genau eine Lösung
von (OSL − z)Ψ = Φ mit Ψ(a) = c0 und p∂x Ψ(a) =
c1 .
(c) Ist OSL auch bei b regulär, so gilt: Für beliebige
c0 , c1 , d0 , d1 ∈ C gibt es ein (nicht eindeutig bestimmtes) Ψ ∈ D(T ) mit Ψ(a) = c0 , p∂x Ψ(a) = c1
und Ψ(b) = d0 , p∂x Ψ(b) = d1 .
(198)
Die Aussage des Satzes ist, daß für Elemente Ψ ∈ D(T )
im regulären Fall Ψ und p∂x Ψ stetig auf [a, b] fortsetzbar
sind. Die Funktion ∂x Ψ selbst kann im allgemeinen nicht
stetig in die Randpunkte fortgesetzt werden.
Sind Ψ, Φ ∈ D(T ), so existieren folgende Grenzwerte:
Beweis IX.3 (a) Ergibt sich aus Lemma IX.1, das in
diesem Fall bis zu den Randpunkten anwendbar ist.
J
β
= [Ψ, Φ]β − [Ψ, Φ]α =: [Ψ, Φ]α .
df
df
[Ψ, Φ]b = lim [Ψ, Φ]x , [Ψ, Φ]x = lim [Ψ, Φ]x(199)
,
x→b−
x→b−
(b) Ergibt sich aus Lemma IX.1, das in diesem Fall bis
zu den Randpunkten anwendbar ist.
und es gilt
b
hT Ψ, Φir − hΨ, T Φir = [Ψ, Φ]a .
(c)
Herunterladen