Allgemeine Chemie

Werbung
I
II
Allgemeine Chemie
(Physikalische Chemie 0)
Markus Reiher
Skript, April 2009
Copyright © Prof. Dr. Markus Reiher, ETH Zürich
29. Juni 2009
V
Inhaltsverzeichnis
Vorwort
1
IX
Erste Schritte zur Theorie der Chemie
1.1
1.2
1
Begriffsbildung und Naturgesetze 1
1.1.1 Die Atomidee 1
1.1.2 Das molekulare Programm und chemische Konzeptbildung 3
1.1.2.1 Ein Beispiele für Fortgeschrittene 3
1.1.2.2 Grundannahme der Theorie der Chemie 5
1.1.3 Elementare Abstraktion 6
1.1.3.1 Geschwindigkeit 6
1.1.3.2 Beschleunigung 8
1.1.3.3 Newtons Axiome 9
1.1.4 Elementare physikalische Begriffe 10
1.1.4.1 Impuls 10
1.1.4.2 Arbeit und Energie 11
1.1.4.3 Kinetische Energie 11
1.1.4.4 Potentielle Energie 14
1.1.4.5 Gesamtenergie 16
1.1.4.6 Potential und Feldstärke 17
1.1.4.7 Kugelkoordinaten 20
1.1.5 Einheiten 21
1.1.6 Ein klassisches Modell der chemischen Bindung? 24
Schlüsselexperimente 26
1.2.1 Präparation des Untersuchungsobjekts 27
1.2.2 Kathodenstrahlen und das Elektron 27
1.2.2.1 Anwendung elektrischer und magnetischer Feldern 29
1.2.3 Der Millikan-Versuch 31
1.2.4 Kanalstrahlen 32
1.2.5 Das Rutherfordsche Streuexperiment 33
1.2.6 Neutronen 34
VI
Inhaltsverzeichnis
1.2.7
1.3
2
Licht 35
1.2.7.1 Beugung und Interferenz 36
1.2.7.2 Quantennatur von Licht und der Welle–Teilchen-Dualismus
1.2.7.3 Elementarteilchen am Doppelspalt und die De Brogliesche
Materiewelle 40
1.2.7.4 Der photoelektrische Effekt 42
1.2.8 Fraunhofersche Linien und das Bohrsche Atommodell 43
Radioaktivität und Kernstruktur 46
1.3.1 Zerfallsprozesse 46
1.3.1.1
α-Strahlen 47
1.3.1.2
β-Strahlen 47
1.3.1.3
γ-Strahlen 47
1.3.2 Kinetik radioaktiver Zerfälle 47
1.3.3 Nukleare Kettenreaktion 49
Einführung in die Quantenmechanik
Postulate 51
51
2.1
2.1.1
2.1.2
2.1.3
2.1.4
2.2
2.3
3
Postulat 0: Elementarteilchen in der Chemie 52
Postulat 1: Zustandsfunktion 54
Postulat 2: Bewegungungsgleichung 55
Postulat 3: Meßwerte 57
2.1.4.1 Ortsmessung, Wahrscheinlichkeitsinterpretation und
Normierung 62
2.1.4.2 Erwartungswerte 65
2.1.5 Postulat 4: Kommutatorbeziehungen 67
Quantenmechanische Drehbewegung und Spin 69
2.2.1 Drehimpulse in der Quantenmechanik 69
2.2.2 Der Stern-Gerlach-Versuch 70
2.2.3 Spin als quantenmechanischer Drehimpuls 71
Einfache quantenmechanische Modellsysteme 72
2.3.1 Das Teilchen im Kasten 72
2.3.2 Der harmonische Oszillator 73
2.3.3 Das Wasserstoff-Atom 74
Die chemische Bindung
3.1
81
Quantenmechanik für viele Teilchen 81
3.1.1 Energieoperatoren für Vielelektronensysteme 81
3.1.2 Postulat 5: Das Pauli-Prinzip 82
3.1.3 Trennung der Elektronen- und Kernbewegung 83
3.1.4 Slater-Determinante und Orbitale 84
3.1.5 Mehrelektronenatome 87
3.1.5.1 Spezielle Form des Pauli-Prinzip 88
37
Inhaltsverzeichnis
3.2
4
3.1.5.2 Termsymbole 89
Molekülorbitaltheorie 91
3.2.1 Quantenmechanische Gleichungen für Orbitale
3.2.2 Linearkombination von Atomorbitalen 92
3.2.3 Die Roothaan-Gleichung 93
3.2.4 Die chemische Bindung im Diwasserstoff 94
Chemische Konzepte
4.1
99
Ladungsverteilung und Partialladungen 99
Anhang
A
102
Rechenregeln
A.1
A.2
A.3
91
103
Infinitesimalrechnung 103
A.1.1 Totale und partielle Ableitung 103
A.1.2 Kettenregel 104
A.1.3 Produkt- und Quotientenregel 104
A.1.4 Partielle Integration 105
Differentialgleichungen 105
A.2.1 Gewöhnliche Differentialgleichungen 105
Eine Herleitung der Wellengleichung 106
Literatur
110
VII
IX
Vorwort
Dieses Skript versucht eine ergänzende Ausformulierung des konzeptionellen
Inhalts der Vorlesung “Allgemeine Chemie (PC)”. Es entsteht seit der Veranstaltung im Herbstsemester 2008 und versucht Ideen darzustellen, die in dieser Ausführlichkeit nicht an die Tafel gebracht werden können. Dieses Skript
ersetzt weder die Vorlesung, noch die Übungen; das Skript ist lediglich als
Ergänzung gedacht. Es ist auch nicht vollständig hinsichtlich des Inhalts der
Vorlesung. Daher wird ebenfalls empfohlen, die relevanten Themen, die die
Vorlesung besprach, ggf. in Lehrbüchern der Physikalischen Chemie [1–4] gezielt nachzulesen (für eine Einführung in die Physik kann das Buch von Tipler
empfohlen werden [5]). Ferner eignet sich das sehr gute, detaillierte und maßgeschneiderte Skript von Professor F. Merkt und Mitarbeitern als ideale Vertiefung des Vorlesungsstoffs, weil sich dort eine umfangreiche Sammlung an
Tabellen und Abbildungen findet, die in dem hier vorliegenden, eher narrativen Skript nicht auch noch geliefert werden konnte.
Die hier vorliegenden Notizen sind ein Versuch eines physikochemischen
Zugangs zur Einführung in die Theorie der Chemie, der gewöhnlich unter
dem Begriff “Allgemeine Chemie” firmiert. Im Zuge der Standard-Darstellung
kommt es oft zu vielen bewußt in Kauf genommenen Ungenauigkeiten, die
auch arglos in Lehrbüchern repetiert werden und später zu großer Verwirrung führen können. Das Curriculum des Chemie-Studiums der ETH Zürich
erlaubt den hier beschrittenen Zugang. Angesichts der zeitlichen Limitierungen dieses Einführungskurses ist ein Ziel die Darstellung der essentiellen
theoretischen Grundlagen der Chemie in maximaler Kürze, ohne dabei jedoch die notwendige Präzision der Darstellung zu opfern. Allerdings wird
es mir nicht gelingen in diesem ersten Versuch eines Skripts, alle Themen in
gleicher, hinreichender Tiefe zu behandeln, trotzdem war es mir wichtig die
prinzipielle Struktur der Vorlesung abzubilden.
Falls sich Tippfehler in diesem Skript eingeschlichen haben sollten, obliegt
es den LeserInnen, diese zu bemerken.
Markus Reiher
Allgemeine Chemie.
Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008
Zürich, April 2009
1
1
Erste Schritte zur Theorie der Chemie
1.1
Begriffsbildung und Naturgesetze
Viele Erkenntnisse wurden in der Chemie durch geschicktes Experimentieren in Kombination mit einfachen, aber sehr weitreichenden Vorstellungen gewonnen. Der Ausbildungsprozeß einer tragfähigen Begrifflichkeit zur
Beschreibung der Experimente ist langwierig und seine historische Nachzeichnung nicht notwendigerweise nützlich, wie am grundlegendsten Begriff, nämlich dem des Atoms veranschaulicht werden soll. Schon Proust hatte
bei Experimenten zu chemischen Reaktionen das Gesetz der konstanten Proportionen gefunden, mit dem er den regelmäßigen Aufbau der entstandenen
chemischen Verbindungen beschrieb, ein Faktum, das wir heute durch eine
Summenformel ausdrücken, die die Zusammensetzung einer chemischen Verbindung aus Atomen angibt. Das Gesetz der konstanten Proportionen wurde
dann verallgemeinert zum Gesetz der multiplen Proportionen, weil man erkannt
hatte, dass ein gegebener Satz an Atomsorten mehr als ein Molekül bilden
kann. Schon bei der Beschreibung dieser Gesetze sind nun Grundvorstellungen über den Aufbau chemischer Verbindungen vorausgesetzt worden, die
eine Erklärung leicht machen, aber erst von Dalton um das Jahr 1803 formuliert wurden.
1.1.1
Die Atomidee
Dalton erklärte die zuvor entdeckten Gesetze über die Zusammensetzung
chemischer Verbindungen durch die Adaption der Atomidee. Er formulierte dazu drei Axiome aus denen sich die uns heute bekannte Molekülchemie
ableiten läßt:
1. Elemente bestehen aus Atomen. Alle Atome eines Elements sind (chemisch im wesentlichen) gleich, aber verschieden von denen anderer Elemente.
Allgemeine Chemie.
Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008
2
1 Erste Schritte zur Theorie der Chemie
2. Bei chemischen Reaktionen werden Atome zu chemischen Verbindungen (zu Molekülen) oder Moleküle in Atome zerlegt.
3. Eine gegebene chemische Verbindung besteht stets aus denselben Atomsorten im konstanten Mengenverhältnis.
Diese Definition ist nun noch keineswegs eine physikalische. So ist nicht klar,
ob ein Sauerstoffatom in einem Wasser-Molekül tatsächlich gleich ist zu einem Sauerstoffatom in einem Alkoholmolekül (tatsächlich ist dies nicht einmal heute ein triviales Problem). Die Anfänge der Chemie waren eher losgelöst von den Entwicklungen in der Physik. Die beiden Wissenschaften, die beide auf das Verständnis der Natur abzielten, kamen sich erst Jahrzehnte später
näher. Daltons Atom-Definition hat daher sicher mehr mit der Unteilbarkeitsidee der alten Griechen (Demokrit) zu tun, auf die der Atom-Begriff letztlich
zurückgeführt wird.
Der Begriff des Atoms, des Unteilbaren, wird Demokrit zugeschrieben. Man
sollte sich aber im klaren darüber sein, dass hier nur die Idee des Unteilbaren
formuliert wurde. Die Atomvorstellung der alten Griechen könnte nicht verschiedener sein von derjenigen, die die Physik sorgfältig aufgrund von empirischen Befunden herausgearbeitet hat. Die Atom-Idee der alten Griechen
beschreibt im wesentlichen die zwei Optionen, die man hat, wenn man beginnt, Materie immer weiter zu teilen.
Besonders eindrücklich läßt sich dies zeigen für einen Kochsalzkristall.
Kochsalz kristallisiert in großen Kuben, die man sukzessive zerkleinern kann.
Zunächst sehen die kleinen Kochsalzkristalle immer noch kubisch aus, aber
ab einer bestimmten Größe erscheinen die Kristallite eher pulverartig, so wie
man es von handelsüblichem Salz gewohnt ist. Betrachtet man diese Kristallite aber unter einem Lichtmikroskop, dann ist die kubische Kristallform immer noch erkennbar. Wenn man nun weiter zerkleinert — durch beispielsweise Mörsern oder Mahlen der Kristallite — dann stellt sich die Frage, ob stets
kleinere Kristallite entstehen oder ob man irgendwann eine kleine, nicht weiter teilbare Untereinheit vorfindet.
Experimente zeigten früh, dass letzteres der Fall ist. Man gelangt an Unterheiten, die man Moleküle und Atome nennt. Solche und ähnliche Experimente
veranlassten Proust zur Formulierung generalisierender und zusammenfassender Gesetze, wie dem Gesetz der multiplen Proportionen. Vom Standpunkt
der modernen Atomidee aus werden diese Gesetze inzwischen als überflüssig betrachtet, weil sie aus den modernen Vorstellungen des molekularen Aufbaus der Materie abgeleitet werden können. Dalton brachte diese Beobachtungen zuerst auf den kleinsten gemeinsamen Nenner in seinen drei Axiomen.
1.1 Begriffsbildung und Naturgesetze
1.1.2
Das molekulare Programm und chemische Konzeptbildung
Theoriebildung in der Chemie folgt heute dem so erfolgreichen “molekularen
Programm” und beruht letztlich auf der physikalischen Beschreibung der elementaren Bausteine der Materie. Daher werden im folgenden zunächst wichtige elementare physikalische Konzepte eingeführt, bevor einige Schlüsselexperimente diskutiert werden können, die uns die elementaren Bausteine der
Materie erkennen lassen. Schließlich wird die Theorie entwickelt, die die Dynamik dieser Elementarteilchen beschreibt und die uns letztlich in die Lage
versetzt, die chemische Bindung, chemische Reaktionen und Eigenschaften
von Molekülen zu verstehen und vorherzusagen.
Die Chemie ruht daher auf einem Teil des Theoriegebäudes der Physik. Weil
die Theorie von Vielteilchensystemen in der Physik nicht einfach zu handhaben ist, gleichzeitig aber die Chemie Wege gefunden hat, dem komplexen
molekularen Geschehen durch einfache, den physikalischen Grundprinzipien
angelehnte Begriffe näher zu kommen — typisch chemische Konzepte sind
Elektronegativität, Nukleophilität und Partialladung —, wurde oft die Frage gestellt, inwieweit die Chemie tatsächlich auf der Physik fußt. An einem Beispiel
soll demonstriert werden, wie wichtig eine klare Ausarbeitung des physikalischen Hintergrunds der Chemie für die chemische Argumentation ist. Für das
Verständnis der folgenden Paragraphen ist allerdings schon eine gute Allgemeinbildung in der Chemie Voraussetzung.
1.1.2.1 Ein Beispiele für Fortgeschrittene
Das erste Beispiel soll die moderne Biochemie und die Molekularbiologie
der Zelle liefern. Der genetische Code liegt in materieller Form als Desoxyribonukleinsäure (DNS) vor. Er kann genweise umgeschrieben (transkribiert)
werden in die Form einer Ribonukleinsäure (RNS). Jedoch kodiert nicht jeder DNS-Abschnitt für ein Protein. Manche Abschnitte erzeugen kurze RNSStränge, die für sehr komplizierte Regelungsprozesse unterschiedlichster Spezifität verantwortlich sind. Wie kann man nun die Stabilität der DNS oder
die der RNS-Anlagerungen verstehen? Hier kann nur eine Theorie der Chemie helfen. Diese muß erklären, was die DNS-Doppelhelixstruktur so stabil
macht oder wann Basenpaarung fehlerhaft sein kann. In der Regel laufen alle diese Erklärungen über energetische Größen. Ein molekulares Objekt mit
geringerem Energieinhalt wird als günstig und daher stabil im Vergleich zu
höher energetischen molekularen Anordnungen angesehen (die Thermodynamik lehrt uns, dass diese Betrachtungen eigentlich komplizierter sind, da so
eine Aussage von den thermodynamischen Randbedingungen (Druck, Temperatur, Volumen) und auch von nicht nutzbaren ‘Energiebeiträgen’, der temperaturgewichteten Entropie, abhängt).
3
4
1 Erste Schritte zur Theorie der Chemie
Lassen wir themodynamische Betrachtungen zunächst außen vor und nehmen wir an, dass wir einem Molekül eine Energie zuordnen können. Schnell
ist man bei der Hand mit einer Erklärung, die eine Energieerniedrigung aufgrund der Ausbildung bestimmter Wechselwirkungen, die die Chemie oft
Bindungen nennt, feststellen will. Im Falle der DNS wird man sagen, dass
wir seit den Arbeiten von Linus Pauling wissen, wie Wasserstoffbrückenbindungen große Biomoleküle stabilisieren können. Woher aber kennen wir eine
Bindungsenergie für eine Wasserstoffbrücke in einem DNS-Basenpaar? Diese
wird sicherlich von der genauen Anordnung der Basen zueinander abhängen,
die sich durch das Bewegungs- und Schwingungsverhalten der Doppelhelix
ändern wird. Wenn ein Basenpaar durch drei Wasserstoffbrücken zusammengehalten wird, kann man ferner kaum eine einzelne dieser Bidnungen brechen, um so auf die Bindungsenergie zu schließen. Abgesehen davon machen
wir nun implizit schon die Annahme, dass eine Wechselwirkung zweier Moleküle — zweier Basen in diesem Fall — tatsächlich auf nur die bindungsaufbauenden Atome reduziert werden kann. Tatsächlich wird diese Annahme nicht von der noch zu entwickelnden Theorie gedeckt. Die Verwendung
des Begriffs ‘Wasserstoffbrückenbindung’ ist bereits eine dramatische Vereinfachung der tatsächlich auftretenden Wechselwirkungen in einem Basenpaar.
Wir können a priori nicht einmal sagen, ob eine Wasserstoffbrücke in einem Basenpaar einzeln betrachtet werden kann oder ob in einem Basenpaar
oder im gesamten DNA-Doppelstrang viele Wasserstoffbrücken kooperativ
und daher schwer in einzelne Bindungsbeiträge zerlegbar sind.
Die genaue Analyse der Doppelhelix-Stabilität wird noch dadurch erschwert, dass es neben den Wasserstoffbrücken andere Bindungstypen gibt,
die man berücksichtigen muß (wenn wir der Einfachheit davon absehen,
dass jede solche Bindungsklassifikation zwangsläufig eine konzeptionelle Vereinfachung ist, um mit molekularen Wechselwirkungen sprachlich kompakt
umgehen zu können). Experimente zeigen nämlich, dass zum Beispiel zwei
Benzol-Moleküle oder zwei Naphthalin-Moleküle in der Gasphase einander
anziehen und Dimere bilden können. Wenn solche Beobachtungen im Experiment zuerst gemacht werden, belegt die Phänomenologie der Chemie diese
mit neuen konzeptionellen Begriffen, die oft hilfreich zur Klassifizierung des
chemischen Wissens sind, deren Bedeutung aber leicht überstrapaziert werden kann. In unserem Fall spricht man von π–π-Anziehung der π-Elektronen
der Benzolringe (selbstverständlich setzt dies voraus, dass man zunächst verstanden hat, was π-Elektronen überhaupt sein sollen). Dieses Phänomen der
π–π-Anziehung wird sich sicherlich auf die Wechselwirkung von aromatischen Purin- und Pyrimidin-Basen in der Sequenz von Paaren in der DNS
übertragen lassen. Doch in welchem Verhältnis steht dieser Stabilisierungseffekt zu dem der Wasserstoffbrückenbindungen? Die Beurteilung der Situation
wird noch weiter erschwert dadurch, dass die DNS in eine Lösungsmittel-
1.1 Begriffsbildung und Naturgesetze
umgebung eingebettet ist, die das DNS-Molekül ebenfalls beeinflußt. Wasserstoffbrückenbindungen der Basen zu Lösungsmittelmolekülen treten in
Konkurrenz zu denen der Basenpaarung. Selbst wenn die Wasserstoffbrücken
zu den Wassermolekülen energetisch schwächer als die der Basenpaare wären, könnte dies durch eine größere Zahl an Lösungsmittelmolekülen wieder
kompensiert werden.
Wie könnten wir die energetische Stabilisierung in der DNS-Doppelhelix
messen? Vielleicht gelingt es uns, einen experimentellen Aufbau zu finden,
der es uns erlaubt, die zwei Stränge auseinanderzuziehen, wobei aber sicherlich auch Energie für die Verzerrung des DNS-Rückgrats aufgewendet werden
muß. Aber selbst dann würden wir die erhaltene Energie noch nicht in eine
energetische Beziehung zu alternativen DNS-Strukturen setzen können. Hätten wir dagegen eine Theorie, die es uns erlauben würde, dem DNS-Molekül
eine Energie zuzuordnen, dann könnten wir auch anderen DNS-Strukturen eine Energie zuordnen und so besser verstehen, was die uns bekannte Doppelhelix so besonders macht. Entsprechend können wir fortfahren und schließlich besser verstehen, wie es um die Basenpaarung in der RNS steht.
1.1.2.2 Grundannahme der Theorie der Chemie
Als Ausgangspunkt unserer Betrachtung gehen wir von der Erkenntnis aus,
daß die Objekte der chemischen Forschung aus einer recht kleinen Zahl von
elementaren Teilchen aufgebaut sind, die von der Physik durch geschicktes
Experimentieren entdeckt wurden. Dieser Startpunkt ist einzig und allein
durch seinen Erfolg gerechtfertig. Es hat sich gezeigt, daß sich die Chemie
folgend dieser Maxime nicht nur verstehen, sondern sogar quantitativ berechnen und vorhersagen läßt. Dem molekularen Programm folgend können heute Reaktionswärmen, molekulare Strukturen und Eigenschaften basierend auf
physikalischer Theorie vorhergesagt werden. Der Kern dieser Theorie ist die
Annahme, dass wir lediglich das Bewegungsverhalten und die Interaktionen der
elementaren Teilchen beschreiben müssen, um die gesamte unseren Sinnen zugängliche Erfahrungswelt beschreiben und verstehen zu können. Dies ist eine
unglaublich starke Forderung, die durch unzählige Studien belegt ist:
Die physikalische Theorie der Chemie erlaubt es, sämtliche chemische Reaktionen, Strukturen und Eigenschaften
von Molekülen, sowie die chemische Bindung allein aufgrund einer Theorie des Bewegungsverhaltens von Elementarteilchen zu beschreiben.
Diese Behauptung ist gleichermaßen weitreichend wie verblüffend. Ihr
Wahrheitsgehalt und die volle Tragweite werden erst im Laufe der noch anzustellenden Diskussionen offenbar. Es ist allerdings jetzt schon klar, das nur ein
einziges Gegenbeispiel, also ein einziges chemisches Phänomen, das nicht auf
5
6
1 Erste Schritte zur Theorie der Chemie
die physikalische Theorie reduzierbar ist, ausreicht, um das Gedankengebäude ins Wanken zu bringen. Offene Fragen sind aber zunächst zum einen, was
die für die Chemie relevanten Elementarteilchen sind, und zum anderen, wie
die physikalische Theorie aussieht, die ihr dynamisches Verhalten beschreibt.
Die physikalische Theorie, die wir zur Beschreibung und zum Verständnis
der Chemie benötigen, soll nun schrittweise erarbeitet werden. Dabei werden
wir uns allerdings auf das Minimum physikalischer Begriffe beschränken, um
letzlich dem Ziel der Beschreibung der Moleküle und der Erklärung der chemischen Bindung zügig näher zu kommen. Der Physik ist es gelungen, diese
Begriffe in sehr allgemeine Theorien einzubetten, auf die wir in diesem Rahmen aber nicht eingehen können.
1.1.3
Elementare Abstraktion
Ein erster Schritt zur Theoriebildung ist die Präzisierung von Begriffen, die
aus der Umgangssprache zur Beschreibung von dynamischen Prozessen bekannt sind. Dies ist der Weg zur Formulierung einer Theorie der Bewegung,
die man klassische Mechanik nennt. Dazu ist es nützlich den Bewegungszustand eines makroskopischen Objekts, wie zum Beispiel eines Autos, quantitativ beschreiben und vorhersagen zu können. Die folgenden Betrachtungen
sind bewußt sehr einfach gehalten. Ziel der Beschreibung ist es, zu zeigen, wie
man spielerisch mit den Begriffen physikalischer Theorie in einem mathematischen Zusammenhang umgeht. Auch soll man mit möglichst wenig Vorkenntnissen auskommen können. Es geht nicht darum, eine Liste von in Stein gemeißelten Naturgesetzen herunterzubeten. Vielmehr soll explizit vorgeführt
werden, wie theoretische Begriffe und mathematisch formulierte Gesetzmäßigkeiten ersonnen werden. Nur so kann die physikochemische Formulierung
chemischer Phänomene und Gesetzmäßigkeiten als von Menschen gemachtes
Vorstellungs- und Ideengebäude verstanden und durchdrungen werden.
1.1.3.1 Geschwindigkeit
Es wird sicherlich notwendig sein, Begriffe wie “Schnelligkeit” oder “Geschwindigkeit” in mathematische Form zu gießen. Dazu bedient man sich im
ersten Schritt der eigenen Anschauung. Offensichtlich ist die Geschwindigkeit
v x mit der man von einem Ort x1 zu einem Ort x2 gelangt gleich dem Wegunterschied ∆x = x2 − x1 dividiert durch die dafür benötigte Zeit ∆t = t2 − t1 ,
∆x
(1.1)
∆t
(das Zeichen ‘≡’ soll explizit andeuten, dass es sich um eine besondere Gleichheit von linker und rechter Seite handelt, nämlich um eine Definition).
v̄ x ≡
1.1 Begriffsbildung und Naturgesetze
Auf dem Weg zum Ziel am Orte x2 kann man jedoch mal schneller, mal
langsamer gelangt sein, also beschleunigt und gebremst (negativ beschleunigt) haben. Daher ist bei langen Fahrzeiten ∆t mit obiger Gleichung bestenfalls eine mittlere Geschwindigkeit definiert, was durch den Querbalken kenntlich gemacht ist.
Hier wurde nun eine Bewegung in nur einer Richtung beschrieben, und wir
wählten die x-Richtung aus. Diese Wahl ist willkürlich und daher läßt sich eine entsprechende Gleichung für jede der anderen beiden Richtungen y und
z, die zu x orthogonal sind, formulieren. Wenn wir die Richtung allgemein α
nennen und α ∈ { x, y, z}, dann können wir allgemein für eine der drei Richtungen schreiben,
v̄α =
∆α
∆t
(1.2)
Weil eine solche Gleichung für jede Richtung unabhängig von den anderen
gilt, schreibt man diese auch kompakt in vektorieller Form
v̄ =
∆r
∆t
(1.3)
wobei der Ortsvektor definiert ist als r = (r x , ry , rz ) = ( x, y, z) und der Geschwindigkeitsvektor als v = (v x , vy , vz ). Generell werden solche mehrkomponentigen Größen hier und im folgenden durch fette Buchstaben gekennzeichnet. Der Einfachheit halber betrachten wir aber weiterhin nur eine Bewegung in x-Richtung.
Oft ist es wichtig zu wissen, was die aktuelle Geschwindigkeit, die sogenannte Momentangeschwindigkeit, ist (zum Beispiel, wenn die Polizei eine Geschwindigkeitsübertretung feststellen will). Offensichtlich reduziert sich der
Mittelungscharakter obiger Gleichung, wenn man die Weglänge in möglichst
kurzen Zeitabständen mißt, so dass Änderungen der aktuellen Geschwindigkeit durch Beschleunigungen nicht ins Gewicht fallen. Im Extremfall ist konsequenterweise der Zeitunterschied zwischen Startzeit t1 und aktueller Zeit
t2 unendlich klein zu wählen. Mathematisch können wir dies als Grenzwert
(Limes) schreiben,
v x ≡ lim
∆t →0
∆x
dx
≡
∆t
dt
(1.4)
Weil das Schreiben des Limes auf die Dauer zu umständlich wäre, werden die
mit einem griechischen ∆ markierten Orts- und Zeitunterschiede durch ein
infinitesimales “d” abgekürzt. Der elementar eingeführte Differenzenquotient
∆x/∆t ist so durch den Limesprozeß zu einem Differentialquotienten dx/dt geworden. Weil dies komponentenweise für alle x-, y- und z-Komponenten gilt,
können wir auch kompakt in vektorieller Form für alle Komponenten gleich-
7
8
1 Erste Schritte zur Theorie der Chemie
zeitig schreiben
dr
v=
dt
⇔

 

vx
dx/dt
 vy  =  dy/dt 
vz
dz/dt
(1.5)
Mathematisch gesprochen ist also die Momentangeschwindigkeit gleich der
ersten Ableitung des Ortes nach der Zeit. Ableitungen nach der Zeit werden oft durch Punkte über der abzuleitenden Funktion geschrieben, hier also
dx/dt = ẋ.
Letztlich wurde durch diese Art der Betrachtung von Newton und Leibniz die Infinitesimalrechnung, also das Rechnen mit unendlich kleinen Größen, in die Mathematik eingeführt. Sie ist auch unter dem Namen Differentialund Integralrechnung bekannt. Mathematik und Physik haben sich in der Geschichte oft gegenseitig befruchtet. Während hier die Physik die Definition der
notwendigen mathematischen Werkzeuge erforderte, gab es aber auch physikalische Entdeckung (wie die der Quantentheorie), die auf schon entwickelte
mathematische Theorien (gewöhnliche und partielle Differentialgleichungen,
Funktionenräume) zurückgreifen konnte, wie wir noch sehen werden.
Die Art, wie hier die Geschwindigkeit eingeführt wurde, haben Lindsay
und Margenau [6] elementare Abstraktion genannt. Damit soll der ‘natürliche’
Zugang zur rigorosen quantitativen Beschreibung von Prozessen in der vom
Menschen wahrgenommenen Umgebung gemeint sein. Inwieweit die reine
Präzisierung alltäglicher Beobachtungen und umgangssprachlicher Begriffsvorbildungen ausreicht zur Mathematisierung der Welt wird sich noch erweisen müssen. Allein das Vorgehen der elementaren Abstraktion setzt schon einige Grundannahmen voraus, die wir nicht explizit erklärt haben — nämlich
Vorstellungen von Raum und Zeit. Hier halten wir es zunächst mit Immanuel Kant, der glaubte, dass diese allen Menschen gemein sind (und tatsächlich
scheint die moderne Hirnforschung hierfür auch Indizien in Form spezialisierter Nervenzellen gefunden zu haben).
1.1.3.2 Beschleunigung
Wenn wir die Geschwindigkeit eines Objekts (wie das Auto im obigen Fall)
ändern wollen, dann muß eine Kraft wirken. Diese Kraft kann eine (positive oder negative) Beschleunigung hervorrufen, die schließlich zu einer Geschwindigkeitsänderung führt. Diese Geschwindigkeitsänderung wiederum
können wir im Sinne der elementaren Abstraktion ebenso gut zur Definition
der Beschleunigung a x verwenden,
a x ≡ lim
∆t →0
∆v x
dv x
=
∆t
dt
(1.6)
1.1 Begriffsbildung und Naturgesetze
oder in vektorieller Form für alle drei Raumrichtungen in einer Gleichung,
a=
dv
dt
(1.7)
wobei wir direkt die Momentanbeschleunigung an Stelle eines Mittelwerts
angeben. Damit wird die Beschleunigung zur zweiten Ableitung des Ortes
nach der Zeit,
a = v̇ =
d (dr/dt)
d2 r
= 2 = r̈
dt
dt
(1.8)
1.1.3.3 Newtons Axiome
Der Kraftbegriff wurde oben bereits im Zusammenhang mit der Beschleunigung verwendet, ein Zusammenhang der von Newton erkannt wurde und
die Basis seiner drei Axiome der klassischen Mechanik ist:
1. Existenz von Inertialsystemen (Trägheitsprinzip):
Es gibt Bezugssysteme (Koordinatensysteme), sogenannte Inertialsysteme, in denen die kraftfreie Bewegung eines (Punkt)teilchens durch eine
konstante Geschwindigkeit beschrieben wird. Die läßt sich mathematisch ausdrücken als
v = const.
=⇒
v̇ = 0
(1.9)
2. Newtonsche Bewegungsgleichung in Inertialsystemen:
Die Bewegung eines Teilchens in einem Interialsystem unter dem Einfluß einer Kraft F wird beschrieben durch die Newtonsche Bewegungsgleichung,
F = ma
(1.10)
Hier wird implizit eine Masse m (die Trägheit des Teilchens als Proportionalitätskonstante eingeführt) angenommen, die unabhängig von der
Geschwindigkeit ist und daher nicht von der Zeit abhängt. Die wirkende Kraft kann stets als vektorielle Summe aller wirkenden Einzelkräfte
F i geschrieben werden, F = ∑i F i . Aus der Bewegungsgleichung läßt
sich bei gegebenen Anfangsbedingungen, d.h. bei einem Ort r 0 ≡ r (t0 )
zu einer Zeit t0 und zugehöriger Geschwindigkeit v0 ≡ v (t0 ), jeder Ort
in der Zukunft tz (und auch in der Vergangenheit) r (tz ) berechnen. Die
zeitlich geordnete Sequenz dieser Orte r (t) nennt man Bewegungsbahn
oder auch Trajektorie.
3. Prinzip von Actio=Reactio:
Zu jeder Kraft (actio) F 12 , mit der ein (Punkt)teilchen 1 auf ein anderes
9
10
1 Erste Schritte zur Theorie der Chemie
(Punkt)teilchen 2 wirkt, gibt es eine Gegenkraft (reactio) F 21 von gleichem Betrag aber entgegengesetzter Richtung, mit der Teilchen 2 auf
Teilchen 1 wirkt,
(1.11)
F 12 = − F 21
Dieses Prinzip stellt ein generelles Prinzip der Physik und der Naturwissenschaften allgemein dar. Ohne dieses Prinzip könnte ein abgeschlossenes System von Teilchen, also eine Ansammlung von Objekten, die
nicht mit einer Umgebung wechselwirken, gesamthaft Geschwindigkeit
aufnehmen, Kräfte ausüben und Energie produzieren. Dies wird aber
experimentell nicht beobachtet.
1.1.4
Elementare physikalische Begriffe
Bevor wir Experimente diskutieren können, die uns Aufschluß über die Zusammensetzung von Atomen und Molekülen geben, müssen einige grundlegende physikalische Begriffe der Mechanik, der Elektrostatik und des Magnetismus eingeführt werden. Dazu sind zwei Dinge entscheidend: die richtige Vorstellung, die man sich von einem physikalischen Prozeß, wie etwa der
Bewegung eines Teilchens, macht, und die Formulierung der Definitionen in
Form mathematischer Gleichungen. Um letztere wird man nicht herumkommen, aber im Prinzip sind sie, wenn Schritt für Schritt erklärt, genauso leicht
oder schwierig wie eine chemische Strukturformel. Die landläufige Meinung,
daß ChemikerInnen oft nicht gut in Mathematik sind, kann nicht stimmen,
wenn man sich anschaut, mit welcher abstrakten Formelsprache man in der
Chemie arbeitet. Wahrscheinlich ist eher, dass man lediglich mehr Zeit in das
Erlernen der chemischen als in das der mathematischen Formelsprache investiert hat. Daher ist die folgende Darstellung recht explizit und nahe an dem
Material, das die Theorie der Chemie dann in späteren Kapiteln benötigt.
1.1.4.1 Impuls
An Stelle der bisher verwendeten Geschwindigkeit wird oft die massebehaftete Geschwindigkeit, der sogenannte Impuls p,
(1.12)
p ≡ mv
verwendet, weil für ihn ein Erhaltungssatz gilt. Mit obiger Definition des Impulses können wir Newtons Bewegungsgleichung auch schreiben als
F=
dp
d ( m v)
=
=
dt
dt
dm
v
dt}
| {z
=0 wenn m=const.
+m
dv
dv
=m
dt
dt
(1.13)
1.1 Begriffsbildung und Naturgesetze
1.1.4.2 Arbeit und Energie
Wenn in x-Richtung über eine Strecke ∆x = xend − xstart eine konstante Kraft
Fx wirkt, dann wurde eine Arbeit ∆W = Fx ∆x an dem Teilchen geleistet, um
seine Geschwindigkeit zu ändern. Wenn nun die Kraft über die Strecke variiert, dann muß man wiederum zu dem schon bekannten Trick greifen, um
nicht mittlere Kräfte verwenden zu müssen: Man wähle die Streckenelemente
so klein, dass die Kraft sicher als konstant angenommen werden kann, also infinitesimal klein: ∆x → dx. Wenn über eine infinitesimal kurze Strecke dx eine
Kraft Fx wirkt, können wir die verrichtete Arbeit schreiben als dW=Fx dx. Die
gesamthaft geleistete Arbeit W kann durch Integration, d.h. durch Summation
der infinitesimalen Arbeitsbeiträge dW, erhalten werden,
W=
Z x
end
xstart
dx Fx =
Z E
end
Estart
dW = Eend − Estart
(1.14)
Die skalare Größe W, die einem Teilchen zu- oder abgeführt wurde, ändert
den Wert eines Reservoirs an “Arbeit”, das man Energie nennt. Der Anfangszustand dieses Reservoirs Energie, bevor es durch die verrichtete Arbeit geändert wird, sei die Energie Estart , während der energetische Endzustand Eend
genannt sei. Energie wird oft definiert als die Fähigkeit Arbeit zu verrichten.
Kräfte, die auf ein Teilchen wirken, können seine Energie ändern.
1.1.4.3 Kinetische Energie
Für die bisher besprochenen Fälle bewegter Teilchen definiert man daher als
relevante Energiegröße die kinetische oder auch Bewegungsenergie, die man
mal als Ekin , mal als T abkürzt. Um einen Ausdruck für diese Bewegungsenergie zu erhalten, studieren wir den einfachen Fall eines ruhenden Teilchens,
der keine kinetische Energie hat. Wenn wir also ein ruhendes Teilchen mit
konstanter Kraft beschleunigen, so entspricht die dabei aufgewendete Arbeit
genau der dem Teilchen zugeführten Bewegungsenergie. Generell gilt für den
in einem Zeitintervall ∆t zurückgelegten Weg (s. Erklärung in Schema 1.1),
1
xend = xstart + v x,start∆t + a x,start (∆t)2
2
(1.15)
wobei wir um den Punkt xstart entwickelt und die Ableitungen des Ortes nach
der Zeit direkt durch die entsprechenden Ausdrücke für die Geschwindigkeit
und die Beschleunigung am Start-Ort, um den wir entwickeln, ersetzt haben.
Der obige Ausdruck vereinfacht sich für das zu Beginn ruhende Teilchen —
v x,start = 0 — zu
∆x ≡ xend − xstart =
1
astart (∆t)2
2
(1.16)
11
12
1 Erste Schritte zur Theorie der Chemie
Die Endgeschwindigkeit des Teilchens in x-Richtung errechnet sich einfach
aus der konstanten Beschleunigung a x = a x,start,
(1.10)
v x,end = a x ∆t =
W
Fx
∆t =
∆t
m
∆x m
(1.17)
woraus wir letztlich eine Gleichung für die kinetische Energie erhalten
T ≡ Ekin ≡ W = v x,end m
∆x
= m v x,end v̄ x
∆t
(1.18)
1.1 Begriffsbildung und Naturgesetze
Schema 1.1 Reihenentwicklung: Jede Funktion läßt sich als Summe von Entwicklungsparametern ak multipliziert mit der k-ten Potenz ihrer Variablen, hier x k , schreiben.
Wenn man die Existenz einer Funktion vermutet, diese aber nicht in geschlossener Form (wie z.B.
eine Exponentialfunktion y( x ) = exp x) kennt, dann kann man stets eine Potenzreihenentwicklung
ansetzen,
!
∞
∞
xk
k
y( x ) = ∑ ak x
im Falle der e −Funktion : y( x ) = ∑
k!
k =0
k =0
wobei wir um den Nullpunkt der Variable x entwickeln. Die Variable x sei eine beliebige Variable (es ist also nicht die Ortskoordinate in x-Richtung meint; x kann auch die Zeit sein, wie im
Haupttext benötigt). Im Experiment kann man die noch unbekannten Entwicklungskoeffizienten
ak durch eine Anpassung an Meßdaten erhalten — z.B. durch die Methode der kleinsten Fehlerquadrate (least-squares fit) oder Singulärwertzerlegung (singular value decomposition). Wenn
k = 1, dann spricht man von einem linearen Fit und verwendet zur Anpassung die lineare Regression, ein Verfahren, das sich aus einem least-squares Fit ableiten läßt.
Eine Potenzreihenentwicklung läßt sich noch genauer spezifizieren. Wenn die Potenzreihe am
Ursprung, x = 0, l-mal abgeleitet wird, so erhalten wir einen expliziten Ausdruck für den l-ten
Koeffizienten
!
!
!
∞
k
d l ∑∞
dl y( x )
dl x k
k =0 a k x
=
=
a
= al l!
∑ k dx l
dx l
dx l
k =0
x =0
x =0
x =0
|
{z
}
=0 wenn k 6 = l
wobei alle Ableitungen für k < l verschwinden, während für k > l die Monome x k → l!x k −l Null
werden am Ursprung, so dass nur der Term für k = l überlebt.
Mit dem Wissen, jeden Entwicklungskoeffizienten als Ableitung ausgewertet am Entwicklungspunkt schreiben zu können, können wir die Potenzreihe explizit schreiben als sogenannte TaylorReihe
!
∞
1 dk y
xk
y( x ) = ∑
k! dx k
k =0
x =0
oder entwickelt um einen beliebigen Punkt xstart ,
dy
1 d2 y
y( xend ) = y( xstart ) +
( ∆x )2 + · · ·
∆x +
dx x = xstart
2 dx2 x = xstart
angeben, wobei ∆x = xend − xstart . Diese Reihenentwicklung läßt sich auf Funktionen verallgemeinern, die von mehr als einer Variablen abhängen.
Die Taylor-Reihenentwicklung kann man sich wie folgt anschaulich vorstellen (s.a. Bild unten):
Angenommen man hat beliebige Informationen über eine Größe y an einem Punkt xstart und
kennt insbesondere ihre Steigung (erste Ableitung), Krümmung (zweite Ableitung), sowie alle
höheren Ableitungen an diesem Entwicklungspunkt, so kann man die Funktion an einem Ort
xend , an dem wir diese Informationen nicht besitzen, beliebig genau annähern (vorausgesetzt,
die Reihe konvergiert, was nicht immer garantiert werden kann).
y(x)
In
nullter
Näherung
ist
y( xstart ) ≈ y( xend ), eine Verbesserung erlaubt die Ausnutzung
der Steigung (1. Ableitung),
Funktionswert hier gesucht
die im Bild eingezeichnet ist.
x
x
y(xend ) y( start) + y’(x start ) (xend − start) Weitere Verbesserungen können durch sukzessive höhere
Ableitungen entsprechend der
x
x start xend
Taylor-Reihe erhalten werden.
an diesem Punkt seien y( x start ) sowie
sämtliche Ableitungen von y bekannt
13
14
1 Erste Schritte zur Theorie der Chemie
Weil sich die Geschwindigkeit konstant ändert durch die wirkende Kraft,
ist ∆x/∆t nicht gleich der Endgeschwindigkeit, sondern eben nur die mittlere
Geschwindigkeit. Die mittlere Geschwindigkeit ist aber leicht zu ermitteln. Da
zu Beginn die Geschwindigkeit Null ist und dann linear wächst entsprechend
Gl. (1.17) muß die mittlere Geschwindigkeit gleich der halben Endgeschwindigkeit sein,
v̄ x =
1
v
2 x,end
(1.19)
und damit ergibt sich die kinetische Energie zu
Ekin =
1
m v2x,end
2
(1.20)
Dieses Ergebnis kann man auch direkt erhalten, wenn man das Zeitinterval
in v x,end = a x ∆t [Gl. (1.17)] ersetzt durch einen Ausdruck, den man durch
Umstellen von Gl. (1.16) erhält,
s
2∆x
∆t = ±
(1.21)
ax
so dass sich ergibt
s
r
r
p
(1.10)
2∆x
2F∆x
2W
v x,end = ± a x
= ± 2a x ∆x = ±
=±
ax
m
m
(1.22)
was nach Quadrieren und Umstellen genau Gl. (1.20) ergibt.
Dieser Ausdruck läßt sich auf drei Dimensionen verallgemeinern (indem
man dieselbe Betrachtung auch für die y- und z-Richtungen anstellt, so dass
die gesamte Bewegungsenergie die Summe der Bewegungsenergien in die
drei Raumrichtungen ist,
T = Tx + Ty + Tz =
1 2 1 2 1 2
mv + mv + mv
2 x 2 y 2 z
(1.23)
die sich wiederum kompakt unter Ausnutzung der skalaren Multiplikation
von zwei Vektoren (hier Geschwindigkeit, v · v = v2 , beziehungsweise Impuls, p · p = p2 ) schreiben läßt als
T=
1 2
p2
mv =
2
2m
(1.24)
wobei man anstelle der Vektoren auch direkt die Beträge (Längen) der Vektoren verwenden darf, also v2 = v2 oder p2 = p2 .
1.1.4.4 Potentielle Energie
Die Definition einer Kraft entsprechend Gl. (1.10) oder Gl. (1.13) beschreibt
ihre Auswirkung auf ein Teilchen mit Trägheit m (d.h. die Beschleunigung
1.1 Begriffsbildung und Naturgesetze
dieses Teilchens). Es fehlen also noch Gleichungen, die die Quelle also das
“Entstehen” (und nicht die Auswirkung) von Kräften beschreiben. Dazu betrachten wir zwei Beispiele: das Gravitationsgesetz und das Coulomb-Gesetz.
Experimentell kann man mittels einer Gravitationswaage nachweisen, daß
sich zwei Massen anziehen. Um also zwei Massen m1 und m2 auf einen Abstand r12 — berechenbar aus den Positionen der beiden Massen als Betrag des
Differenzvektors r12 = |r 1 − r 2 | — zueinander zu bringen, muß eine Kraft
aufgewendet werden, die der Gravitationskraft entgegen wirkt. Dabei wird
Arbeit verrichtet, die in Form von Lageenergie gespeichert wird. Die Lageenergie, auch potentielle Energie genannt und in der Regel mit dem Symbol V belegt, hängt natürlich von der Natur der herrschenden Kraft ab. Im Falle der
Gravitationsanziehung zwischen zwei Teilchen findet man experimentell eine
Kraft, die proportional zum Produkt der Massen und invers proportional zum
Quadrat des Abstands ist. Für den Betrag der Kraft können wir also schreiben
FG = − G
m1 m2
2
r12
und dann für die Lageenergie VG = − G
m1 m2
r12
(1.25)
wobei wir berücksichtigen, dass die beim Aufeinanderzubewegen verrichtete
Arbeit zu einer Abnahme der potentiellen Energie führen muß, also
E pot = −
Z r
end
r start
drFr
(1.26)
Die Proportionalitätskonstante G heißt Gravitationskonstante und kann durch
Messung an einer Gravitationswaage experimentell bestimmt werden, G =
6, 67 · 10−11 N m2 /kg2 (s. weiter unten bzgl. der verwendeten Einheiten). Den
Abstand berechnet man, wie schon erwähnt, aus den Positionen der beiden
Massen, r 1 = ( x1 , y1 , z1 ) und r 2 = ( x2 , y2, z2 ) als
q
r12 = |r 1 − r 2 | = ( x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2
(1.27)
entsprechend den Vorschriften der Vektorrechnung.
Der in Gl. (1.25) angegebene Ausdruck für den Betrag der Kraft drückt lediglich die experimentelle Beobachtung aus, dass die Anziehungskraft (negatives Vorzeichen), die zwei Massen aufeinander ausüben, jeweils proportional
zum Betrag der Massen und umgekehrt proportional vom Quadrat ihres Abstands ist. Wir nutzen also bei dieser elementaren Abstraktion den ‘radialen’
Charakter der Gravitationskraft aus (sie hängt nur vom Abstand der Massen
und nicht von deren Orientierung im Raum ab), eine Tatsache, die wir in Abschnitt 1.1.4.7 noch genauer, d.h. durch Definition eines problemangepaßten
Koordinatensystems, ansehen werden. Wenn wir den vektoriellen Charakter
der Kraft rekonstruieren möchten, dann müssen wir durch einen Einheitsvektor die Richtung angeben. Dieser Vektor er12 der Länge Eins zeigt von einer
15
16
1 Erste Schritte zur Theorie der Chemie
Masse zur anderen und kann definiert werden als
er12 ≡
r1 − r 2
r − r2
= 1
r12
|r 1 − r 2 |
(1.28)
so dass sich die (vektorielle) Gravitationskraft schreiben läßt als
F G = −G
m1 m2
r − r2
er12 = − Gm1 m2 1
2
|r 1 − r 2 |3
r12
(1.29)
Interessanterweise findet man experimentell für zwei ruhende, miteinander
im Vakuum wechselwirkende elektrische Ladungen (elektrostatische) Gesetzmäßigkeiten, die von derselben Form wie das Newtonsche Gravitationsgesetz
sind. D.h. die elektrostatische Kraft, auch Coulomb-Kraft FC genannt, und die
elektrostatische Lageenergie sind
FC =
1 q1 q2
2
4πǫ0 r12
und
VC =
1 q1 q2
4πǫ0 r12
(1.30)
wobei anstelle der Gravitationskonstante der für die Elektrostatik gemessene
Proportionalitätsfaktor, 1/4πǫ0 , eingeführt wurde (dieser hat nur in den sogenannten SI-Einheiten diese Form, s. unten). Die Konstante ǫ0 heißt Dielektrizitätskonstante des Vakuums. Da wir zu guter letzt die Wechselwirkung
von Elementarteilchen, also den kleinsten Bestandteilen der Materie, studieren wollen, herrscht zwischen diesen zwangsläufig Vakuum, also materiefreier Raum. Eine allgemeinere Form des Kraftgesetzes, das auch für Medien, in
denen die elektrostatische Wechselwirkung dann erfolgt, gilt, wird nicht benötigt.
Es gibt noch einen wichtigen Unterschied zwischen Gravitationskraft und
elektrostatischer Kraft. Die Gravitationskraft ist stets eine anziehende Kraft,
weil Massen stets positiv sind. Es gibt aber zwei verschiedene Sorten Ladungen, die wir positiv und negativ nennen, wie sich experimentell gezeigt hat.
Entsprechend können q1 und q2 positiv oder negativ sein. Ihr Produkt ist dann
positiv, wenn beide Ladungen gleichnamig sind. In diesem Fall resultiert ein
positives Vorzeichen und die beiden Ladungen stoßen sich ab. Wenn die beiden Ladungen aber entgegengesetztes Vorzeichen haben, also nicht gleichnamig sind, dann entsteht bei Produktbildung eine negative Zahl, die zur Anziehung zwischen den beiden Ladungen führt.
1.1.4.5 Gesamtenergie
Die Gesamtenergie eines abgeschlossenen Systems von Teilchen bleibt erhalten. Anschaulich muß diese Eigenschaft aus ähnlichen Gründen gelten, die
wir bereits bei Newtons drittem Axiom aufgeführt haben. Die Energie eines
Teilchens hängt nun nicht nur von seinem Bewegungszustand ab (kinetische
Energie T), sondern auch von seiner Lage gegenüber anderen Teilchen, die
1.1 Begriffsbildung und Naturgesetze
mit ihm wechselwirken. Besteht ein System nun aus N Teilchen, so ist seine
Gesamtenergie laut der Newtonschen Mechanik die Summe der kinetischen
Energien, sowie die Summe der nicht doppelt gezählten Lageenergien,
Egesamt
= T1 + T2 + · · · + TN + V12 + V13 + · · · + V1N + V23 + V24 + · · ·
(1.31)
+V2N + V34 + V35 + · · · + V3N + · · · + V( N −1) N
N
=
∑ Ti +
i =1
N −1 N
∑ ∑ Vij
(1.32)
i =1 j > i
wobei wir nur elektrostatische Kräfte zulassen wollen und die Indices jeweils
angeben, für welche Teilchen die Ausdrücke für die kinetische und für die
potentielle Energie zu schreiben sind,
Ti =
p2i
2mi
und
Vij =
qi q j
1
4πǫ0 |r i − r j |
(1.33)
Der Ausdruck für die Gesamtenergie in Gl. (1.31) kann zu einem beliebigen
Zeitpunkt mit den dann geltenden Orten und Impulsen ausgewertet werden.
In einer viele Jahre nach Newton gefundenen Neuformulierung der klassischen Mechanik von Hamilton und Lagrange, die auf skalaren Energiegrößen
statt vektoriellen Kräften basiert, kommt der Gesamtenergie Egesamt eine besondere Bedeutung zu, weshalb sie einen weiteren Namen bekommen hat.
Man nennt sie auch Hamilton-Funktion H ≡ Egesamt .
Als Beispiel sei die Gesamtenergie eines abgeschlossenen Systems zweier
wechselwirkender elektrischer Ladungen q1 und q2 mit den zugehörigen Massen m1 und m2 gegeben,
Egesamt =
p21
p2
q1 q2
1
+ 2 +
=
2m1 2m2
4πǫ0 |r 1 − r 2 |
2
p2
1
q q2
∑ 2mi i + 4πǫ0 |r 1 1− r2 |
(1.34)
i =1
wobei die Orte und die Impulse zu einem willkürlichen Zeitpunkt bestimmt
werden können.
1.1.4.6 Potential und Feldstärke
Wenn man nur eine Ladung (oder nur eine Masse) betrachtet, dann möchte
man die Möglichkeit der Wechselwirkung mit anderen Ladungen (oder Massen) ausdrücken, ohne diese jedoch explizit zu verwenden. Letztere Ladungen (oder Massen) werden auch Probegrößen genannt, weil sie in einem Experiment eine Eigenschaft — die Ladung (oder die Masse) — unserer Ausgangsladung (oder Ausgangsmasse) proben. Es bietet sich daher eine weitere
Abstraktionsebene an. Wenn wir zum Beispiel eine Aussage über die Masse
unserer Erde hinsichtlich ihrer Anziehungskraft treffen wollen ohne ein massebehaftetes Teilchen als Probe für die Messung der potentiellen Energie oder
17
18
1 Erste Schritte zur Theorie der Chemie
der Gravitationskraft zu verwenden, dann geben wir einfach diejenigen Teile
der Gravitationsenergie oder Gravitationskraft an, die nicht von Eigenschaften einer solchen Probegröße abhängen. Wir lassen also die Probeeigenschaft
(die zweite Masse) einfach weg, d.h. wir reduzieren die Energie- und KraftGesetze um die Probegröße. Aus der potentiellen Energie wird so das Potential
und aus der Kraft so die Feldstärke.
Leider werden die Begriffe “Potential” und “potentielle Energie” oft synonym gebraucht, obwohl sie nicht dasselbe meinen. Oft geht allerdings aus
dem Zusammenhang hervor, ob die Lageenergie oder das zugehörige Potential gemeint ist.
Gravitationspotential und elektrisches Potential lauten dann
PG (r ) = − G
m1
|r − r 1 |
und
PC (r ) =
q1
1
4πǫ0 |r − r 1 |
(1.35)
wobei die ursprüngliche Position der Probegröße nun zu einem beliebigen
Ort wird, r 2 → r, an dem die Eigenschaft geprobt werden kann. Der Abstand
des Meßpunktes r vom Ort der Feldquelle, r 1 ist nun so gewählt worden, dass
man einen positiven radialen Abstand erhält, wenn man die Quellenladung
q1 in den Nullpunkt des Koordinatensystems verschieben würde, r 1 → 0, also
|r 1 − r | = |r − r 1 | → |r − 0| = |r | = r.
Man beachte die durchgängige formale Analogie dieser Gleichungen zu
Gravitation und Elektrostatik (hier: das Potential ist stets Konstante multipliziert mit Materialeigenschaft dividiert durch den Abstand des Teilchens zum
Meßpunkt). Die Feldstärken für Gravitation und Elektrostatik ergeben sich
dann als negative Ableitung der Potentialausdrücke nach den Raumkoordinaten zu
G(r ) = − Gm1
r − r1
|r − r 1 |3
und
E (r ) =
q1 r − r 1
4πǫ0 |r − r 1 |3
(1.36)
wobei vektorielle, also gerichtete Größen entstehen, weil man ja nach den drei
Raumkoordinaten ableiten muß. Die Nenner sind jedoch stets skalare Größen,
da die Beträge (Längen) von Differenzvektoren zu verwenden sind. Dies ist
konsistent mit der Tatsache, daß eine Kraft, also die Feldstärke multipliziert
mit der Probegröße, natürlich auch eine vektorielle Größe ist (vgl. Gl. (1.29).
Der Vektor der elektrischen Feldstärke E(r ) = E( x, y, z) darf nicht mit dem
nicht fett geschriebenen Buchstaben für die Energie E, die eine skalare Größe
ist, verwechselt werden.
Um zu sehen, wie man auf die beiden Gleichungen für die Feldstärke
kommt, leiten wir die Potentialausdrücke explizit ab. Diese Ableitung hat für
jede der drei kartesischen Koordinaten r = ( x, y, z) separat zu erfolgen. Allerdings wird nicht die totale Ableitung, wie im Zusammenhang mit der Geschwindigkeit für die Zeit geschrieben, sondern die partielle Ableitung benö-
1.1 Begriffsbildung und Naturgesetze
tigt (s. Anhang A.1.1). Weil in der Newtonschen Mechanik die Zeit stets unabhängig von den Raumkoordinaten ist (erst in der genaueren Einsteinschen
Mechanik wird sich dies ändern), sind partielle und totale Zeitableitung einer
mechanischen Größe gleich. Da dies unabhängig gilt von der physikalischen
Größe, die abgeleitet wird, ist es nützlich die Operation ‘Zeitableitung’ ohne
Angabe dieser Größe zu schreiben als,
d Newton ∂
=
(1.37)
dt
∂t
Diese mathematischen Objekte nennt man auch Ableitungsoperatoren. Der
Begriff Operator bezeichnet also einen Satz mathematischer Operationen, die
an einer Funktion vorzunehmen sind. Die Gleichheit von partieller und totaler
Ableitung gilt allerdings nicht für die Ortsvariablen.
Für Richtungsableitungen an einem Ort r ist es lediglich notwendig die Ableitung nach einer Richtung unter Festhalten der Variablen der anderen Richtung zu bilden. Da auch die Ortsableitungen von verschiedenen physikalischen Größen berechnet werden können, gehen wir wieder vor wie bei der
Zeitableitung und schreiben die Operationen der einzelnen partiellen Ableitungen nach den Ortskoordinaten als
∂/∂x
,
∂/∂y
,
∂/∂z
(1.38)
Die Richtungsableitung ergibt sich dann als Vektor dieser Ableitungen und
wird Gradient oder Nabla-Operator genannt,


∂/∂x
(1.39)
∇ ≡  ∂/∂y 
∂/∂z
Potential P und Feldstärke E stehen in derselben Beziehung wie potentielle
Energie E pot und Kraft F: Die Feldstärke ist der negative Gradient des Potentials.
F = −∇ E pot
und
E = −∇ P
(1.40)
Also ist wie oben bereits besprochen der Gradient, also der Vektor der Ableitungen, auf die skalare Größe Potential anzuwenden, wobei der Vektor
Feldstärke entsteht. Am Beispiel des elektrischen Potentials, rechte Seite in
Gl. (1.35), ergibt sich zunächst für die partielle Ableitung nach x durch Anwendung der Kettenregel (s. Anhang) und Berücksichtigung der Definition
des Abstands zweier Punkte im Raum, hier r 1 und r, aus Gl. (1.27),
∂
1
1
1
q1
Ex (r ) = −
−
PC (r ) = −
2( x − x )
2
∂x
4πǫ0
2 |r − r | | {z 1}
|r − r 1 |
{z
} | {z 1} ∂( x − x )2 /∂x
|
1
äußere Ableitung ∂ |r −r 1 |/∂x
q1 x − x 1
(1.41)
=
4πǫ0 |r − r 1 |3
19
20
1 Erste Schritte zur Theorie der Chemie
(und entsprechendes für die partiellen Ableitungen nach y und z), so dass sich
der Gradient schreiben läßt als


∂PC (r )/∂x
E(r ) = −∇ PC (r ) =  ∂PC (r )/∂y 
∂PC (r )/∂z


x − x1
q1
1
 y − y1  = − q1 r 1 − r (1.42)
=
3
4πǫ0 |r − r 1 |
4πǫ0 |r 1 − r |3
z − z1
Die hier angegebenen Feldstärken sind gegeben für ein kartesisches Koordinatensystem, also für einen Raum aufgespannt von den Koordinaten x, y und
z. Die beiden betrachteten Kräfte, Gravitationskraft und Coulomb-Kraft, hängen jedoch nur vom Abstand zweier Probegrößen (Massen oder Ladungen)
ab. Die Gleichungen werden daher oft vereinfacht, wenn man sogenannte problemangepaßte Koordinaten verwendet, wie wir z.B. später bei der Diskussion
des Wasserstoffatoms noch sehen werden. Die oben angegebenen Potentiale,
Gl. (1.35), nennt man auch Zentralfeldpotentiale, weil sie nur von einem skalaren Abstand abhängen, einer relativen Koordinate, die wir r nennen wollen,
also r ≡ |r − r 1 |.
1.1.4.7 Kugelkoordinaten
Die potentielle elektrostatische Energie hängt nur vom Abstand der beiden
wechselwirkenden Ladungen ab und nicht von ihrer Orientierung zueinander. Die Orientierung läßt sich durch zwei Winkel, ϑ und ϕ, exakt angeben.
Mit den neuen Koordinaten (r, ϑ, ϕ), die man Polar-, Kugel- oder sphärische
Koordinaten nennt, kann man dann jeden Punkt im Raum ansprechen, der
auch in dem kartesischen Koordinatensystem durch x, y und z adressierbar
ist: r mißt dabei den Abstand vom Ursprung und die Winkel ϑ und ϕ definieren die Richtung, in die die (radiale) Länge r abgetragen wird. Diese Situation
ist in Abb. 1.2 dargestellt. Die Koordinate r heißt auch Radialkoordinate oder
radialer Abstand.
1.1 Begriffsbildung und Naturgesetze
z
ϑ
r
y
x
= r sin ϑ cos ϕ
(1.43)
y
= r sin ϑ sin ϕ
(1.44)
z
= r cos ϑ
(1.45)
ϕ
x
Abbildung 1.2 Graphische Darstellung der Polarkoordinaten und Variablentransformationsgleichungen von Polarkoordinaten zu kartesischen Koordinaten. Die trigonometrischen Funktionen kann man räumlich interpretieren, wenn man bedenkt, dass der Radius eines Kreises
multipliziert mit dem Sinus des abgetragenen Winkels gleich der Länge der Gegenkathete ist,
während der Radius multipliziert mit dem Cosinus die Länge der Ankathete gibt. Die Katheten beziehen sich auf das Dreieck, das bei Projektion des Radius bzw. seiner Projektion in die
xy-Ebene auf die Koordinatenachsen entsteht.
Wenn wir die felderzeugende Ladung q1 in den Koordinatenursprung setzen, also r 1 ≡ 0, dann lassen sich die elektrostatische Energie, die elektrische
Feldstärke und die Coulomb-Kraft in diesen neuen Koordinaten schreiben als
Epot (r ) =
1 q1
1 q1
1 q1 q2
und Er (r ) =
und Fr (r ) =
2
4πǫ0 r
4πǫ0 r
4πǫ0 r2
(1.46)
wobei der vektorielle Charakter der letzten beiden Größen verlorengeht, weil
wir uns nur auf den radialen Abstand r beschränken. In anderen Worten, bei
einem vorgegebenen Abstand r zweier Ladungen kann man die eine um die
andere beliebig drehen, ohne daß sich die Anziehungs- oder Abstoßungskraft
ändert (ob die Ladungen sich anziehen oder abstoßen hängt nur vom Vorzeichen der beiden Ladungen ab: zwei positive oder zwei negative Ladungen
ergeben ein positives Vorzeichen, so dass sich die beiden Ladungen abstoßen).
1.1.5
Einheiten
Charakteristisch für alle bisher eingeführten mechanischen Größen ist, dass
alle Gleichungen gleichzeitig auch zur Messung dieser Größen verwendet
werden können. So kann man die Geschwindigkeit messen, indem man in
möglichst kleinen Zeitintervallen die zurückgelegte Strecke mißt und Gl. (1.1)
folgend dann die Geschwindigkeit berechnet. Um das aber tun zu können,
muß man sich auf Maßeinheiten einigen, in denen Weg und Zeit gemessen
werden.
Im sogenannten MKS-System, wobei M für das Meter [m], K für das Kilogramm [kg] (also tausend Gramm) und S für die Sekunde [s] stehen, wird
die Strecke in Metern und das Zeitinterval in Sekunden gemessen. Die Mas-
21
22
1 Erste Schritte zur Theorie der Chemie
se wird in Kilogramm angegeben werden. Ein anderes Einheitensystem ist
das cgs-System, wobei c für Zentimeter [cm] (also hundertstel Meter), g für
Gramm [g] und s für Sekunde |s] stehen. Das MKS-System wird heute im
allgemeinen verwendet. Welches Einheitensystem man verwendet hängt allerdings auch davon ab, welchen Aspekt der Natur man beschreibt. Ein fahrendes Auto ist gut im MKS-System zu beschreiben. Die Bewegung von Atomen, die extrem kleine Objekte sind, läuft jedoch auf sehr kleinen Zeit- und
Ortsskalen ab. Man hat dann zwei Möglichkeiten: Wenn man weiterhin das
MKS-System verwendet, dann muß man mit sehr kleinen Zahlen, kompakt
geschrieben als Zehnerpotenzen, leben oder man führt neue Einheiten ein,
die der Systemgröße angepaßt sind (ein Beispiel sind die sogenannten atomaren Hartree-Einheiten, in denen Ladungen als Vielfache der Elementarladung
e und Massen als Vielfache der Elektronenmasse me angegeben werden).
Um im MKS-System einfacher mit sehr großen oder sehr kleinen Zahlenwerten arbeiten zu können, werden einbuchstabige Abkürzungen eingeführt.
Diese Notation haben wir in zwei Beispielen bereits verwendet: 1000 g sind 1
kg und 1/100 m ist 1 cm. Tabelle 1.1 gibt eine Übersicht über die für Einheiten
gebräuchlichen Präfixe.
Tabelle 1.1 Liste häufig verwendeter Präfixe vor Einheiten.
Name
hekto
kilo
mega
giga
tera
peta
Abk.
Faktor
Name
Abk.
Faktor
h
k
M
G
T
P
102
dezi
zenti
milli
mikro
nano
piko
femto
atto
d
c
m
µ
n
p
f
a
10−1
10−2
10−3
10−6
10−9
10−12
10−15
10−18
103
106
109
1012
1015
Aus den elementaren Einheiten lassen sich leicht zusammengesetzte Einheiten für zusammengesetzte physikalische Größen ableiten, die oft mit eigenem Namen belegt werden, wenn die betreffende Größe hinreichend wichtig
ist. Dies soll im folgenden an zwei Beispielen demonstriert werden. Die Kraft
wird in Newton [N] gemessen, eine Einheit, die entsprechend Gl. (1.10) direkt
aus MKS-Einheiten zusammengesetzt wird und sich auch in cgs-Einheiten
schreiben läßt,
hmi
h cm i
100cm
5
1[N] = 1[kg] 2 = (1000[g])
=
10
[
g
]
(1.47)
s
s2
s2
Die Präfixe lassen sich also genauso verrechnen wie die Messwerte. Man sagt,
die Kraft hat die Dimension einer Masse multipliziert mit einer Beschleuni-
1.1 Begriffsbildung und Naturgesetze
gung und die Einheit [kg m/s2 ]. Als zweites Beispiel betrachten wir den mechanischen Druck. Diese Größe läßt sich elementar abstrahieren. Offensichtlich kann man den Druck p verstehen als eine Kraft, die auf eine bestimmte
Fläche A wirkt,
p=
F
A
(1.48)
(p darf hier nicht mit dem Betrag des Impulses verwechselt werden). Die Einheit des Drucks erhält man daher zu
N
kg m
kg
1
≡ 1[Pa]
(1.49)
=1 2 2 =1 2
m2
s m
s m
was zur Definition des Pascals [Pa] dient.
Viele Größen sind direkt auf mechanische Einheiten zurückzuführen. Arbeit und Energie haben entsprechend der bisherigen Diskussion dieselben
Einheiten. Da die Arbeit aus der Kraft multipliziert mit dem Weg berechnet wird, ist die Einheit von Arbeit und Energie [N m]. Diese zusammengesetzte Einheit wird aber auch 1 Joule [J] genannt. Manche Einheiten sind
nicht (oder nicht notwendigerweise) auf mechanische Einheiten zurückzuführen. Beispiele hierfür sind die Temperatur, die in Kelvin [K] gemessen wird,
oder die elektrische Ladung, die in Coulomb [C] gemessen wird. All diese Einheiten sind zusammengefaßt worden in einem empfohlenen StandardEinheitensystem, dem sogenannten SI-System.
Das SI-System enthält nicht nur vernünftige Einheiten. Es gibt für elektrostatische Einheiten ein anderes System, das so gewählt wurde, dass der Proportionalitätsfaktor im Coulomb-Gesetz zu Eins wird; dies sind die sogenannten Gauß-Einheiten. Anders gesagt, im Gauß-Einheitensystem nimmt die Dielektrizitätskonstante des Vakuums den Kehrwert von 4π an, ǫ0 = 1/4π, so
dass 1/4πǫ0 = 1 wird.
Manche Größen wurden früh eingeführt, ohne dass ihre Bedeutung vollständig klar war. Unter solchen Bedingungen entstehen Einheiten, die dann
später einer besseren Einheitenwahl weichen müssen. Die Einheiten der Temperatur sind hierfür ein Beispiel. Die Celsius-Skala, gemessen in Graden [◦ C],
ist eine typisch anthropogene Einheit, weil sie willkürlich den Nullpunkt der
Gradskala auf den Gefrierpunkt reinen Wassers und dann die Markierung bei
100 ◦ C dem Siedepunkt reinen Wassers zuweist, weil Wasser in unserem Leben eine große Rolle spielt. Erst später hat man festgestellt, dass es einen
absoluten Nullpunkt der Termperatur gibt, der bei −273,15 ◦ C erreicht wird.
Es ist daher vernünftig eine neue Skala zu definieren, die bei Null startet und
keine negativen Temperaturen zuläßt. Diese Skala ist die Kelvin-Skala [K]. Die
Schrittweiten sind dabei gleich denen der Celsius-Skala, d.h. eine Temperaturdifferenz von 1 ◦ C entspricht ebenfall 1 K.
23
24
1 Erste Schritte zur Theorie der Chemie
1.1.6
Ein klassisches Modell der chemischen Bindung?
Wir haben nun sämtliche mechanische Begriffe eingeführt, die es uns erlauben, einen ersten theoretischen Vorstoß zum Verständnis von Molekülen aufgebaut aus Atomen vorzunehmen. Die zentralen Fragen, die eine Theorie der
chemischen Bindung erklären können muß, sind: was hält Atome zu einem
Molekül zusammen und warum bilden nicht zwei Moleküle sofort wieder ein
neues, ein Supramolekül? Leider werden wir dabei feststellen, dass die klassische Mechanik eine nicht befriedigende Antwort liefert, obschon sie sich für
bestimmte Probleme (zum Beispiel in der Praxis der Biochemie) als sehr nützlich erweist.
Nach Dalton verbinden sich Atome zu Molekülen. Dies ist zunächst eine Idee, die es erlaubt, eine Vielzahl experimenteller Daten in einem einzigen Konzept zusammenzufassen. Es stellt sich jedoch die Frage, wie diese
‘Bindung’ der Atome physikalisch realisiert wird. Angenommen die Atome
würden durch massive “Stäbe” auf konstanter Distanz gehalten, dann könnten wir zwar fixe Bindungslängen angeben, doch könnten wir nicht erklären, was die materielle Realisierung dieser “Stäbe” sein soll — und aus welchem elementareren Material könnten schon die Stäbe gemacht sein, wenn sie
die unteilbaren Bestandteile, die Atome, zusammenhalten sollen. Sie können
schließlich nicht auch aus Atomen bestehen, weil dies die Definition des Molekülbegriffs verletzen würde (ein Wasser-Molekül besteht genau aus einem
Sauerstoffatom und zwei Wasserstoffatome und eben nicht aus weiteren Atomen). Ein weiteres Argument verbietet uns, die Stäbe aus Atomen aufgebaut
zu denken: wenn es Atome wären, dann müßten wir erklären können, wieso
es spezielle Atome gäbe, die andere Atome zusammenhalten.
Dennoch erlaubt uns das ‘Stabbild’ ein mechanisches Modell der Moleküle
zu konstruieren. Wir sprechen hier von Modell statt von Theorie, weil a priori
klar ist, dass es sich um keinen ernsthaften Ansatz zur Erklärung des Verbunds von Atomen in einem Molekül handelt, denn genau diese Tatsache
wird in das Modell hineingesteckt. Allerdings sind feste Stäbe eine zu starke Einschränkung. Man hat festgestellt — und wir werden dies später diskutieren, wenn wir uns der richtigen theoretischen Beschreibung der Moleküle
in Kapitel 2 zuwenden —, dass sich Atome um ihre Gleichgewichtslagen im
Molekül bewegen, also schwingen.
Die Vorstellung, dass Atome in Molekülen um ihre Gleichgewichtslagen
schwingen, erfordert, die starren Stäbe zwischen den Atomen durch flexible
mechanische Federn zu ersetzen. Wie stark die Schwingung der Atome ist,
hängt dann von der spezifischen Materialkonstante der Feder, der sogenannten Kraftkonstanten k, ab. Die Feder kann dann ausgelenkt werden, schwingt
zurück und beschreibt so das Schwingungsverhalten der Atome im Molekül.
Die Kraft F, die für die Auslenkung notwendig ist, sei proportional zur Aus-
1.1 Begriffsbildung und Naturgesetze
lenkung ( x − x0 ) (die Schwingung wird unter diesen Bedingungen harmonisch
genannt),
(1.50)
F = k ( x − x0 )
wobei k zur Proportionalitätskonstanten wird und x0 die Gleichgewichtslänge
der Feder beschreibt. Der Einfachheit halber wählen wir unser Koordinatensystem so, dass die Auslenkung der Feder in x-Richtung erfolgt, was uns eine
etwas kompliziertere, dreidimensionale Betrachtung unter Verwendung von
Vektoren erspart. Die zur Dehnung der Feder aufgewendete Arbeit W ergibt
sich per Integration zu
W=
Z x
x0
dx k( x − x0 ) = k
1
( x − x0 )2
2
x
x0
=
1
k ( x − x0 )2
2
(1.51)
und entspricht der potentiellen Energie, die der Feder durch Wirken der
Kraft zugeführt wird. Die potentielle Energie hat also die Form einer Parabel, weil sie quadratisch mit der Auslenkung anwächst. Die Feder selbst hat
die Tendenz, in die Gleichgewichtslage zurückzukehren. Die Kraft dazu erhält man wiederum als negativen Gradienten der potentiellen Energie, also als
−k( x − x0 ). Das negative Vorzeichen stellt dabei sicher, dass diese Rückstellkraft genau in die zur auslenkenden Kraft entgegengesetzte Richtung zeigt.
Natürlich erklärt dieses Federmodell eines Moleküls aufgebaut aus Atomen
nicht die Bindung der Atome, nicht nur, weil wir nicht sagen können, aus was
denn die Federn bestehen sollen, sondern auch, weil es Parameter enthält,
die wir geschickt wählen müssen, die das Modell selbst aber nicht erklärt. Wir
müssen also einen Wert für die Kraftkonstante k für jede Schwingung von Atomen wählen, bevor wir das Schwingungsverhalten des Federmodells studieren können. Da verschiedene Atome unterschiedlich miteinander schwingen,
sind verschiedene Kraftkonstanten für alle möglichen Schwingungstypen zu
wählen. All diese offenen Probleme zeigen bereits, dass ein Molekülmodell
auf Atombasis schlecht funktionieren kann. Es ist notwendig, den Aufbau der
Atome selbst zu studieren, um so letztendlich zu verstehen, warum und wie
Atome chemische Bindungen zur Bildung von Molekülen ausbilden.
Nichtsdestotrotz spielen diese klassischen Federmodelle in ausgereifterer
Form eine bedeutende Rolle in der Theorie der Chemie und speziell in der
Polymerchemie und in der Biochemie. Hier sind die Modelle unter dem Namen Kraftfeldmodelle bekannt und erlauben das Studium von Federmodellen
mit mehr als 100.000 Atomen, der typischen Größenordnung eines Proteins.
Solche Simulationen können nur auf Computern durchgeführt werden, wie
eine schnelle Abschätzung der Zahl der zu berücksichtigenden Federn zeigt.
Wenn wir zwischen N Atomen paarweise Federn annehmen (ohne doppelt
zu zählen und natürlich ohne Selbstwechselwirkungen von Atomen zuzulas-
25
26
1 Erste Schritte zur Theorie der Chemie
sen), dann kommen wir auf ( N 2 − N )/2 Federn, was bei hunderttausend (105 )
Atomen etwa 5×109 , also 5 Milliarden Federn ergibt.
In Kraftfeldsimulationen verzichtet man bewußt auf ein tieferes Verständnis
der chemischen Bindung zu Gunsten einer einfachen ‘Modellierbarkeit’. Das
geht genau dann gut, wenn die Moleküle, die betrachtet werden sollen, zum
einen sehr ähnlich sind und sich zum anderen durch eine geringe Zahl verschiedener chemischer Bindungen klassifizieren lassen (sonst ist die Zahl der
zu bestimmenden Kraftkonstanten zu groß — die Zahl der Federn reduziert
sich dadurch natürlich nicht). Es ist auch klar, dass chemische Reaktionen mit
diesen Modellen nicht leicht beschrieben werden können, weil dazu die Feder
brechen müßte. Dieser Fall wird bei harmonischen Schwingungen nicht eintreten, weil die Rückstellkraft mit zunehmender Auslenkung ins unendliche
wächst.
1.2
Schlüsselexperimente
Unser modernes Bild des elementaren Aufbaus der Materie wurde entscheidend in den Jahren von etwa 1800 bis 1920 geprägt und danach maßgeblich
erweitert. Wir konzentrieren uns zunächst auf die erste Periode, die einen
Zeitraum von etwa hundert Jahren umfaßt. Die vielen experimentellen und
theoretischen Arbeiten in dieser Periode werden oft auf einige Schlüsselexperimente reduziert. Dabei tritt der kollektive Charakter der wissenschaftlichen
Erkenntnis in den Hintergrund und man übersieht die vielen Diskussionen
und Beiträge unzähliger Forscher, die letztlich das moderne Bild der Physik
und Chemie geprägt haben. Bemerkenswert ist auch die rasante Geschwindigkeit, mit der die wissenschaftlichen Erkenntnisse schon im 19. Jahrhundert
gewonnen werden konnten.
Der detaillierte historische Ablauf kann hier kaum in hinreichender Tiefe
nachvollzogen werden. Lehrbücher wählen daher oft eine pseudo-historische
Auflistung von wichtigen Experimenten, die dann heute akzeptierte Fakten
über die Elementarteilchen zementieren. Diese Art der Darstellung impliziert,
dass es nur einen beschränkten Satz von elementaren Teilchen gibt, der die
gesamte materielle Welt aufbaut. Aber auch diese Annahme muß natürlich experimentell verifiziert werden. Eine riesige Zahl an Experimenten bestätigt
diese Annahme, so dass es vernünftig ist, zu glauben, dass auch ein noch nicht
durchgeführtes Experiment diese Annahme nicht widerlegen wird. Beweisbar
ist eine solche Annahme natürlich nicht.
Hier soll ein etwas anderer Weg beschritten werden. Zwar streifen wir ebenfalls die wichtigen historischen Stationen, dies aber auf einem Weg, dessen
Richtung wir selbst durch Gedankenexperimente bestimmen. Auf diese Art
und Weise sollte es möglich sein, nicht nur das zu denken, was sich letztlich
1.2 Schlüsselexperimente
als richtig erwiesen hat, sondern auch die Fragen zu stellen, die sonst der kanonischen Darstellung zum Opfer fallen.
Die Experimente, die wir diskutieren werden, kann man zum Beispiel in der
Physik-Abteilung des Deutschen Museums in München ansehen und sogar
selbst durchführen.
1.2.1
Präparation des Untersuchungsobjekts
Sowohl in der Physik, als auch in der Chemie führt man Experimente so aus,
dass das Untersuchungsziel ‘ungestört’ erreicht werden kann. In der Chemie
bedeutet das, dass man Chemikalien nicht verwendet, die verunreinigt sind.
Dasselbe gilt für physikalische Experimente, in denen man z.B. Legierungen
nur gezielt an Stelle reiner Metalle verwendet.
In der Chemie hat sich daraus ein Klassifizierungssystem entwickelt, das
aber nur beschränkt belastbar ist. Es soll hier dennoch kurz vorgestellt werden, weil es mit den experimentellen Ursprüngen der Chemie eng verwoben
ist. Zunächst unterteilt man alle Substanzen in Mischungen und in reine Stoffe.
Reine Stoffe erhält man aus den Mischungen durch physikalische Methoden.
Dies sind Methoden, die die chemische Zusammensetzung auf molekularer
Ebene nicht ändern. Mischungen kann man weiter unterteilen in homogene
und heterogene Phasen, eine Unterteilung die nur beschränkt trägt (wenn man
an Milch oder Nebel denkt), weil sie offensichtlich damit zu tun hat, wie fein
aufgelöst man die Mischung betrachten kann. Homogene Phasen können fest,
flüssig oder gasförmig sein. Und selbst auf die Eindeutigkeit dieser Klassifizierung kann man sich nicht verlassen, weil zum Beispiel stäbchenförmige
Moleküle einen Zustand zwischen flüssig und fest einnehmen können (wie
z.B. Flüssigkristalle in Anzeigen von Armbanduhren).
Reine Stoffe bestehen aus einer Ansammlung von einer Molekül- oder
Atomsorte. Diese kann man mit chemischen Methoden (Reaktionen) weiter
zerlegen. Zur Umwandlung oder Zerlegung von Molekülen ohne weitere Reaktanten reichen oft auch rein physikalische Methoden wie das starke Erhitzen oder die Bestrahlung mit Licht. Im Grenzfall erhält man bei allen Zerlegungsverfahren dann die Atome.
1.2.2
Kathodenstrahlen und das Elektron
Im 19. Jahrhundert führten viele Forscher und Gelehrte Experimente zur Elektrizität durch — unter ihnen ist besonders Michael Faraday hervorzuheben,
dessen Experimente Mitte des 19. Jahrhunderts James Clerk Maxwell zu seiner Theorie des (klassischen) Elektromagnetismus, also der Vereinigung aller
elektrischen und magnetischen Phänomene zu einer klassischen, d.h. auf die
27
28
1 Erste Schritte zur Theorie der Chemie
makroskopische Welt anwendbaren Theorie, führten. Maxwells Theorie liefert dadurch auch die erste Erklärung für das Phänomen ‘Licht’, wovon später
noch die Rede sein wird.
Mitte des 19. Jahrhunderts untersuchten verschiedene Forscher die sogenannten Kathodenstrahlen, die man beobachten kann, wenn man eine Glühkathode und eine Anode mit einer Durchtrittsöffnung in eine evakuierbare
Glasröhre einschmilzt (wie bei den alten Röhrenfernsehern). Für die entsprechenden Versuchsskizzen sei hier und im folgenden auf Ihre Vorlesungsmitschrift verwiesen! Liegt nun eine Spannung, d.h. ein elektrisches Feld E
an, so kann man auf einem der Durchtrittsöffnung gegenüberliegenden, in die
Glasröhre eingeschmolzenen Fluoreszenzschirm ein Aufleuchten beobachten.
Da der Fluoreszenzschirm einen stetig leuchtenden Fleck zeigt, werden offensichtlich Strahlen aus den Elektroden gelöst. Weil sie aus der Kathode treten und durch die elektrische Spannung zur Anode hin beschleunigt werden,
nennt man sie Kathodenstrahlen. Per Konvention bezeichnen wir die Kathode
als negativ geladen und die Anode als positiv geladen. Folglich sind die Kathodenstrahlen elektrisch negativ geladen.
Um zu untersuchen, ob es sich um einen kontinuierlichen Ladungsstrahl
handelt, dimmen wir seine Intensität, indem wir die an die aufgeheizte Kathode anliegende elektrische Spannung reduzieren und auch die Kathodentemperatur zu kontrollieren versuchen. Wäre der Ladungsstrahl kontinuierlich,
so würde der Lichtfleck auf dem Fluoreszenzschirm stetig immer schwächer
werden. Dies beobachten wir jedoch nicht. Stattdessen bemerken wir ab einer
bestimmten Intensität ein Flackern. Weiteres Dimmen erniedrigt die Intensität des aufleuchtenden Flecks nicht, sondern sorgt lediglich dafür, dass das
Zeitinterval bis zum nächsten Aufleuchten sich verlängert. Daraus schließen
wir, dass Kathodenstrahlen nicht kontinuierlich, sondern körnig sind und eben
aus kleinen Partikeln bestehen. Diese Partikel müssen auch die negative elektrische Ladung tragen und werden Elektronen genannt.
Um nun zu untersuchen, ob verschiedene Metalle dieselbe Art Ladungsträger enthalten, schmelzen wir in Glasröhren verschiedene Metalle als Kathodenmaterial ein. Eine Wiederholung des Experiments zeigt exakt dieselben
Resultate, was auch für alle noch folgenden Kathodenstrahlexperimente gilt.
Lediglich die genaue Einstellung von Spannung und Erwärmung der Kathode ist anders im Dimmexperiment, was auf besondere Materialeigenschaften
der Metalle deutet, die als Kathodenmaterial dienen.
Bevor wir unser Experiment weiter modifizieren, ist noch eine weitere Feststellung wichtig: Da wir den Versuch auf der Erde durchführen, können wir
die Erdanziehungskraft nicht abschalten. Wenn wir den Elektrodenstrahl beobachten, so können wir praktisch keinen Höhenunterschied zwischen dem
Loch in der Anode und dem Leuchtfleck auf dem Fluoreszenzschirm feststellen. Die Gravitation, die den Kathodenstrahl nach unten, d.h. in Richtung
1.2 Schlüsselexperimente
Erdmittelpunkt ablenken sollte, hat keinen nennenswerten Effekt. Nun könnte man daraus schließen, dass Elektronen keine Masse besitzen und deshalb
nicht auf eine Gravitationsanziehung reagieren. Soweit wollen wir aber nicht
gehen und nehmen daher nur an, dass die Masse eines Elektrons sehr klein
ist. Denn wenn die Elektronenmasse sehr klein ist, dann ist die Ablenkung
nicht notwendigerweise beobachtbar, weil die Präzision der Höhenmessung
des Flecks vielleicht nicht ausreichte.
1.2.2.1 Anwendung elektrischer und magnetischer Feldern
Die aus der Kathode heraustretenden Elektronen können durch Anwendung
elektrischer und magnetischer Felder beeinflußt werden, um so quantitative
Meßdaten über die elektrischen Eigenschaften der Elektronen zu erhalten. Wir
entwerfen daher ein weiteres Experiment, für das wir in die Glasröhre zwei
Kondensatorplatten, sowie eine Spule einschmelzen.
Zunächst legen wir nur eine Spannung an den Plattenkondensator an. Wir
sehen, dass der Kathodenstrahl nach unten abgelenkt wird, weil der Leuchtfleck auf dem Fluoreszenzschirm nach unten auswandert. Wenn y die Bewegungsrichtung der Elektronen und die negative z-Richtung die Auslenkungsrichtung, also auch die Richtung, in der das elektrische Feld E wirkt, ist, dann
können wir die Kraft berechnen, die auf jedes einzelne Elektron wirkt

 
 

0
0
0
F = qe E = −e  0  =  0  =  0 
Ez
− e Ez
Fz
(1.52)

 
 
0
Bx
0

F L = qe ve × B = −e  ve,y  ×  0  = 
0
e ve,y Bx
0
0
(1.53)
dessen Ladung wir als qe = −e ansetzen, wobei wir die Elementarladung e
noch zu bestimmen haben. Man beachte, dass die Kraft keine Beiträge in xund y-Richtung hat, weil wir den Versuch entsprechend fahren. Ferner muß
betont werden, dass wir die Stärke des elektrischen Feldes in z-Richtung, Ez ,
durch Anlegen einer elektrischen Spannung an den Kondensator kontrollieren und daher einstellen können.
Wenn dagegen die Spule stromdurchflossen wird, während der Kondensator nicht unter Spannung steht, wirkt auf die Elekronen eine magnetische
Kraft, die auch von der Geschwindigkeit der Elektronen ve abhängt und
Lorentz-Kraft F L genannt wird,

wobei ‘×’ ein Vektorprodukt (Kreuzprodukt) bezeichnet und B die sogenannte magnetische Kraftflußdichte ist, die im Magnetismus die Rolle einer Feldstärke spielt — analog dem E in der Elektrostatik. Die nichtverschwinden-
29
30
1 Erste Schritte zur Theorie der Chemie
den Einträge in den Vektoren sind wiederum durch den Versuchsaufbau bestimmt. Man beachte, dass die Struktur der Gleichungen stets gewahrt bleiben
muß: Die Kraft ist eine vektorielle Größe und daher muß auch auf der rechten
Seite ein Vektor enstehen (hier garantiert durch das Vektorprodukt).
Wenn wir nun die beiden Experimente mit dem elektrischen und dem magnetischen Feld vergleichen, stellen wir fest, dass beide ein Elektron in zRichtung auslenken, aber in entgegengesetzte Richtung. Das bedeutet, dass wir
beide Felder von außen so einstellen können durch Wahl von Ez und Bx , dass
sie sich exakt kompensieren und die Elektronen auf ihrer Flugbahn nicht ablenken, was wir leicht durch die Position des Leuchtflecks kontrollieren können. Mathematisch können wir für diesen Fall dann schreiben,
F gesamt = 0
⇒
!
eq
eq
Fz = 0 = −e Ez + e ve,y Bx
(1.54)
wobei wir die spezielle Wahl der Feldstärkenkomponenten mit einem hochgestellten Index ‘eq’ gekennzeichnet haben. Aus diesem Kräftegleichgewicht
erhalten wir so eine Gleichung zur Berechnung der Geschwindigkeit der Elektronen auf ihrer Bahn zum Fluoreszenzschirm,
eq
eq
e Ez = e ve,y Bx
eq
⇒
ve,y =
Ez
eq
Bx
(1.55)
beziehungsweise
 


0
0
eq
eq
ve =  ve,y  =  Ez /Bx 
0
0
(1.56)
Es stellt sich als nächstes die Frage, ob wir durch geschickte Wahl der Felder
nicht auch die Elementarladung e bestimmen können. Dazu legen wir wiederum nur das elektrische Feld Ez an. Die dadurch wirkende Kraft erzeugt nach
Newton eine Beschleunigung,
!
Fz = me az = qe Ez
⇒
az
qe =−e
= −
eEz
me
(1.57)
Die Ablenkung des Lichtflecks auf dem Fluoreszenzschirm, der sich unmittelbar hinter dem Plattenkondensator befinden muß, um diese Berechnung
zu erlauben, berechnet sich leicht aus Gl. (1.16), die hier direkt für den Fall
vz,start = 0 verwendet werden kann,
∆z =
1 2 (1.57) eEz 2
t
az t = −
2
2me
(1.58)
Die Flugszeit t durch den Kondensator errechnet sich leicht aus der konstanten Geschwindigkeit in y-Richtung,
t=
l
ve,y
(1.59)
1.2 Schlüsselexperimente
wobei die Länge des Kondensators l genannt wurde. Damit erhalten wir für
die Ablenkung in z-Richtung,
∆z = −
eEz l 2
2me v2e,y
(1.60)
Diese Gleichung enthält nun nur noch meßbare Größen, so dass wir nach den
Materialkonstanten eines Elektrons auflösen können,
2v2e,y ∆z
qe
−e
C
=
=−
= −1, 75882012(15) · 1011
me
me
kg
Ez l 2
(1.61)
Wir können also Ladung und Masse des Elektrons nicht unabhängig voneinander messen und müssen uns ein weiteres Experiment überlegen, dass uns
entweder e oder me liefert — die jeweils andere Naturkonstante kann dann
aus Gl. (1.61) berechnet werden.
1.2.3
Der Millikan-Versuch
Um 1910 fand der Amerikaner Millikan einen Weg, um die Elementarladung e
experimentell zu bestimmen. Dieser als Millikanscher Öltröpfchenversuch bekannt gewordene Versuch wird wie folgt durchgeführt: In einen Plattenkondensator werden Öltröpfchen eingespritzt, die dann aufgrund der Schwerkraft langsam nach unten (Richtung Erdmittelpunkt) sinken. Dieses Sinken
des Tröpfchen im Ölnebel zwischen den Kondensatorplatten kann man mit
einem Mikroskop beobachten. Bei dem schnellen Zerstäuben des Öls kann
es schon zu einer elektrischen Aufladung der Teilchen gekommen sein. Man
kann dieses Laden der Tröpfchen aber auch durch Röntgenstrahlung induzieren. Wenn nun der Plattenkondensator geladen wird, also ein elektrisches
Feld wirkt, steigen die Öltröpfchen wieder nach oben, wenn die elektrische
Kraft die Erdanziehung übersteigt. Wenn sie betragsmäßig gleich sind, was
wir durch ein Schweben der Tröpfchen feststellen, können wir wieder von einem Kräftegleichgewicht profitieren
q T Ez = m T g
(1.62)
wobei wir die Sinkrichtung als z-Richtung definiert haben und alle Tröpfcheneigenschaften mit dem Index ‘T’ versehen haben. Auf der rechten Seite
wurde für Newtons Ausdruck für die Kraft direkt die Erdbeschleunigung g
eingesetzt. Diese so aufgestellte Gleichung kann uns nun zur Messung der
Tröpfchenladung q T dienen,
qT =
mT g
Ez
(1.63)
31
32
1 Erste Schritte zur Theorie der Chemie
Dazu benötigen wir allerdings die Masse m T des Tröpfchens, das wir durch
das Mikroskop gerade betrachten. Wenn wir die Dichte ρ des Öls kennen,
könnten wir versuchen den Durchmesser des Tröpfchens im Mikroskop zu
vermessen, daraus das Volumen dieses Tröpfchens berechnen und dann per
ρ = m T /VT die Masse erhalten. Man kann die Massenmessung allerdings genauer vornehmen.
Die feldfrei sinkenden Tröpfchen nehmen nach einiger Zeit eine maximale Geschwindigkeit an, die durch weitere Erdanziehung nicht erhöht werden
kann. Der Grund hierfür ist die Reibung der Tröpfchen bei ihrer Bewegug
durch die Luft zwischen den Kondensatorplatten. Dieser Bremswirkung kann
man eine Kraft zuordnen, die Reibungskraft FR = f vmax , die proportional
zur Geschwindigkeit ist, wobei die Proportionalitätskonstante f Reibungskoeffizient genannt wird. Aus dem Kräftegleichgewicht des feldfreien Sinkens
erhalten wir dann
m T g = f vmax
⇒
mT =
f vmax
g
(1.64)
wobei f für Luft und g bekannt sind, während v max durch Beobachtung der
Ortsänderung im Mikroskop oder durch das sogenannte Stokesssche Reibungsgesetz FS = −6π η vr erhalten werden kann (die Stokes Formel beinhaltet die Viskosität der Luft η und die charakteristische Größe für die Form
der Teilchen (Kugeln), nämlich ihren Radius r).
Wenn man nun die Messung von q T an sehr vielen Tröpfchen durchführt
findet man folgendes allgemeines Ergebnis:
q T = n (−e)
mit n ∈ N
(1.65)
Die Ladung der negativ geladenen Tröpfchen ist also ein ganzzahliges Vielfaches (n) einer elementaren Ladung e. Aus vielen Messung von q T unterschiedlicher Tröpfchen können wir auf e extrapolieren und erhalten diese zu
e = 1, 602177 · 10−19C
(1.66)
(wobei dies der Wert ist mit einer Genauigkeit, die uns heute aus anderen Experimenten zugänglich ist). Da wir aus dem Kathodenstrahlexperiment schon
einen Wert für den Quotienten e/me erhalten haben, ergibt sich so die Elektronenmasse zu
me = 9, 10939 · 10−31kg
(1.67)
1.2.4
Kanalstrahlen
Bisher haben wir uns nur mit negativen Ladungsträgern beschäftigt und als
elementares Teilchen das Elektron identifiziert. Weil Materie nach außen elek-
1.2 Schlüsselexperimente
trisch neutral ist, muß es also zur Kompensation der negativen Ladung positive Ladungsträger geben. Die kleinsten dieser positiven Ladungesträger wurden in sogenannten Kanalstrahlen entdeckt. Kanalstrahlen können ebenfalls
in einer Glasröhre gefüllt mit Wasserstoffgas mit zwei Elektroden beobachtet werden, wenn die Kathode ebenfalls ein Loch, den Kanal, enthält. Auf die
negativ geladene Kathode werden dann positive Ladungsträger beschleunigt,
die man als Kerne von Wasserstoffatomen identifiziert hat und die man Protonen nennt. Die Kathodenstrahlen ionisieren das Diwasserstoffgas und produzieren dabei diese positiv geladene Wasserstoffatome, die man ebenfalls mit
elektrischen und magnetischen Felden untersuchen kann, wie zuvor besprochen für die Elektronen. Aus Elektroneutralitätsgründen ist die Ladung eines
Protons umgekehrt zu der eines Elektrons, also q p = +e (ein Wasserstoffatom
muß ungeladen sein, weil es nicht durch elektrische Felder beeinflußt wird).
1.2.5
Das Rutherfordsche Streuexperiment
In einem klassischen Experiment zeigte Rutherford in den Jahren 1911–1913,
dass Materie aus Atomkernen besteht, in denen die positive Ladung eines
Atoms konzentriert ist. Die Atomkerne werden von den sich bewegenden
Elektronen umgeben, die wir im Kathodenstrahlexperiment aus ihrem Verbund durch Energiezuführung herausgelöst haben.
Der Rutherford-Versuch ist ein sogenanntes Streuexperiment, bei dem ein
Strahl auf das Untersuchungsobjekt gelenkt und von diesem abgelenkt wird.
Die winkelaufgelöste Ablenkung des Strahls wird dann untersucht und muß
von einer theoretischen Modellierung korrekt reproduziert werden. Die Strahlen, die hier verwendet worden, nennt man α-Strahlen. Sie werden von verschiedenen Metallen emittiert, beispielsweise von Polonium, und können
Photoplatten durch Abscheidung elementaren Silbers aus Silbersalz in diesen
Platten schwärzen. Sie sind elektrisch positiv geladen und können daher Experimenten zur Untersuchung ihrer Eigenschaften unterworfen werden, die
wir schon am Beispiel der Kathodenstrahlen diskutiert haben. Man hat später
erkannt, dass es sich bei ihnen um Heliumatomkerne handelt. Im RutherfordVersuch ist das Untersuchungsobjekt dünn ausgewalzte Goldfolie, die etwa
0,004 mm dick ist und daher nur aus einigen 1000 Atomlagen besteht. Man
verwendet Goldfolie, weil sich diese sehr dünn auswalzen läßt, so dass die auf
sie treffenden Strahlen prinzipiell durch sie durchtreten können (ein massiver
Gold-Metallblock ist nicht durchdringbar).
Im Streuexperiment beobachtet man nun, dass ein Großteil der α-Strahlen
durch die Folie treten und detektiert werden können (durch Photopapier zum
Beispiel). Ein Teil der Strahlen wird aber auch abgelenkt und sogar direkt
zurückgeworfen. Diese streuwinkelabhängige Intensitätsverteilung (Schwär-
33
34
1 Erste Schritte zur Theorie der Chemie
zungsverteilung) muß nun durch eine Theorie beschrieben werden. Dabei
muß die Streutheorie zum Erkenntnisgewinn alle denkbaren Fälle behandeln.
Einer dieser Fälle ist die Gleichverteilung von Elektronen und positiven Ladungsträgern im Goldmetall. Ein anderer ist die Konzentration der positiven
Ladung in Teilchen, die man Atomkerne nennt. Rutherford fand nun, dass das
Streuergebnis nur unter Annahme von positiv geladenen Atomkernen richtig beschrieben werden kann. Wegen der Stärke der elektrischen Kraft ist die
Streuung der α-Strahlen ein Prozeß, der allein auf der elektrostatischen Abstoßung der beteiligten Teilchen beruht. Der Rückstoß erweist sich dabei als vernachlässigbar, was darauf hindeutet, dass sämtliche Masse eines Gold-Atoms
ebenfalls im Atomkern konzentriert ist. Aufgrund der Elektroneutralität eines
Gold-Atoms müssen 79 positive Elementarladungen im Atomkern zu finden
sein. Da sie Vielfache der Elementarladung sind, gehen wir davon aus, dass
es sich um 79 Protonen handelt.
Man beachte im besonderen, dass die α-Teilchen nicht durch direkten Stoß
an den Atomkernen gestreut werden, was aufgrund der kleinen Größe der
Atomkerne zu unwahrscheinlich wäre und die Intensität an zurückgestreuten Teilchen nicht erklären könnte, sondern am elektrischen Potential der Goldatomkerne. Daher nennt man diese Rutherford-Streuung auch Potentialstreuung. Die α-Teilchen werden aufgrund der abstoßenden elektrischen Kräfte schon in großer Entfernung vom Atomkern abgelenkt. Interessanterweise reicht es für die qualitativ richtige Beschreibung des Streuergebnisses aus,
den Atomkern sogar nur als punktförmig anzunehmen. Das bedeutet, dass
nahezu der gesamte Raum, den ein Atom einnimmt, von den Elektronen beansprucht wird. Die anziehende elektrische Wechselwirkung von Elektronen
der Goldfolie und den α-Teilchen kann vernachlässigt werden.
Es stellt sich nun noch die Frage, wieso positiv geladene Atomkerne räumlich so klar von den sie umgebenden Elektronen in Molekülen und Festkörpern getrennt sind (warum bewegen sich Elektronen und Atomkerne nicht
willkürlich durcheinander?). Auch diese Beobachtung muß (und wird) durch
die zu entwickelnde Theorie des Aufbaus der Materie erklärt werden.
1.2.6
Neutronen
Eine genaue experimentelle Untersuchung der Massen der Atomkerne zeigt,
dass die Masse nicht allein durch Vielfache der Protonenmasse erklärt werden kann. Analog zu den bisher besprochenen Experimenten können wir in
elektrischen Feldern Wasserstoffatomkerne H+ und Helium-Atomkerne He2+
hinsichtlich ihrer Masse vermessen. Dabei findet man
m H+
m He2+
= 1, 67 · 10−27kg
= 6, 645 · 10
−27
kg
(1.68)
(1.69)
1.2 Schlüsselexperimente
Wenn also die Masse des H+ der Protonenmasse entspricht, stellen wir fest,
dass die He2+ -Masse nicht das doppelte der Protonenmasse ist, wie wir aufgrund der Elektroneutralität von He-Atomen vermuten würden, sondern eher
das vierfache ist. Dies führte Rutherford 1920 zum Postulat eines weiteren
Elementarteilchens, das natürlich elektrisch ungeladen sein mußte, weil man
es sonst schon eher entdeckt hätte, und daher Neutron genannt wird. Erst
1932 gelang es Chadwick das Neutron (indirekt) durch die Ionisierung von
Gasatomen nachzuweisen. Der oben betrachtete He-Kern enthält demnach
zwei Neutronen zusätzlich zu den zwei Protonen, was man im Elementsymbol ausdrückt als 42 He2+ , oder allgemein ZA ELadung, wobei E das Elementsymbol ist, Z die Ordnungszahl, die gleich der Zahl der Protonen im Atomkern
ist, und A die Massenzahl ist, also die Summe an Protonen und Neutronen im
Kern.
Bei genauerer Untersuchung hat man dann festgestellt, dass die Atomsorten eines Elements keineswegs gleich sein müssen, obwohl sie sich chemisch
im wesentlichen gleich verhalten. Im Falle des Heliums hat man einen weiteren Atomkern entdeckt, der nur ein Neutron statt zwei besitzt und daher
als 32 He2+ bezeichnet wird. Verschiedene Sorten von Atomkernen nennt man
Isotope.
1.2.7
Licht
Mitte des 19. Jahrhunderts gelang es James Clerk Maxwell, die Beobachtungen der Elektrizitätslehre und des Magnetismus in einer gemeinsamen Theorie zu vereinigen, die seitdem Elektromagnetismus genannt wird. Maxwell fand
dadurch heraus, dass Elektrizität und Magnetismus nicht zwei verschiedene
Erscheinungen sind, sondern dass beide auf der ruhenden und bewegten elektrischen Ladung beruhen. Dazu formulierte er vier Grundgleichungen für die
Feldstärken E und B, sowie für zwei weitere Größen, die diese Felder charakterisieren. Aus diesen vier Grundgleichungen konnte Maxwell zwei Wellengleichungen (s. Anhang) für die Feldstärken ableiten
2
∂2 E
∂ E ∂2 E ∂2 E
1
1
∆E
(1.70)
=
+ 2 + 2 ≡
µ0 ǫ0 ∂x2
µ 0 ǫ0
∂t2
∂y
∂z
∂2 B
∂2 B ∂2 B ∂2 B
1
1
∆B
(1.71)
=
+ 2 + 2 ≡
2
2
µ0 ǫ0 ∂x
µ 0 ǫ0
∂t
∂y
∂z
wobei µ0 die magnetische Feldkonstante des Vakuums ist, die auch Permeabilität genannt wird. Auf der rechten Seite haben wir den sogenannten LaplaceOperator eingeführt,
∆≡
∂2
∂2
∂2
+
+
∂x2
∂y2
∂z2
(1.72)
35
36
1 Erste Schritte zur Theorie der Chemie
der es uns gestattet die Wellengleichungen sehr kompakt zu schreiben und
der als Skalarprodukt zweier Nabla-Operatoren verstanden werden kann
∆ = ∇ T · ∇ = ∇2
(1.73)
Diese Schwingungsgleichungen erlaubten es, elektromagnetische Schwingungsphänomene zu beschreiben, im speziellen z.B. von Antennen ausgesendete Radiowellen. Die Ausbreitungsgeschwindigkeit v dieser elektromagnetischen Wellen kann in einer Wellengleichung dem Vorfaktor des LaplaceOperators entnommen werden, denn dieser ist gleich v2 = v2 . Für die Ausbreitungsgeschwindigkeit der elektromagnetischen Wellen erhalten wir also
s
1
1
c2 =
⇒ c=
(1.74)
µ 0 ǫ0
µ 0 ǫ0
wobei wir den für elektromagnetischen Wellen gebräuchlichen Buchstaben c
verwendet haben. Setzt man nun die bekannten Meßwerte für µ0 und ǫ0 ein,
dann stellt man fest, dass sich die Lichtgeschwindigkeit des Vakuums ergibt.
Maxwells Theorie des Elektromagnetismus liefert so eine Interpretation von
Licht als sich ausbreitende elektromagnetische Welle!
1.2.7.1 Beugung und Interferenz
Der Wellencharakter des Lichts wird eindrücklich in Experimenten zur Beugung von Licht am Spalt und zur Interferenz am Doppelspalt deutlich (s. Abb.
1.3). Wenn Licht durch einen Spalt in einer Wand hinreichend kleiner Breite
tritt, dann kann man das Licht nicht nur in Strahlrichtung, sondern auch davon abweichend detektieren, wo es eigentlich nicht zu finden sein sollte, wenn
es sich nur geradlinig ausbreiten würde. Auch bei Wasserwellen kann man
derartige Beugungseffekte beobachten und so geht man nach Huygens davon
aus, dass der Spalt sich so verhält wie eine Lichtquelle, von der sich das Licht
als elektromagnetische Welle in alle Richtungen ausbreitet. Dabei wird jeder
Punkt im Spalt zu einer Quelle und man kann immer zwei Punkte paarweise gruppieren, deren Licht dann konstruktiv oder destruktiv, abhängig vom
Beobachtungswinkel zur Strahlrichtung, interferiert, sich also verstärkt oder
auslöscht, je nachdem ob Wellenberge beziehungsweise Wellentäler am Detektor aufeinandertreffen (die Lichtintensität ist proportional zum Quadrat
der elektrischen Feldstärke). Der Interferenzeffekt wird besonders deutlich,
wenn man zwei Lichtquellen hat, deren Licht in einer festen Phasenbeziehung
steht, man sagt kohärent ist. Während man heute solches Licht durch Laser erzeugt, konnte man es früher durch zwei Spalte in der Wand erzeugen.
1.2 Schlüsselexperimente
Spalt
Detektor
Quelle
d<λ
d>λ
d<λ
Intensität
Intensität
Intensität
Intensität
A
B
C
Abbildung 1.3 Licht das auf einen Spalt in einer Wand fällt kann hinter dem Spalt mit abnehmender Intensität auch dort detektiert werden, wo es eigentlich nicht zu finden sein sollte,
wenn es geradlinig durch den Spalt treten würde. Das Licht wird gebeugt und die gemessene Beugungsfigur kann erklärt werden, wenn man sich vorstellt, dass der Spalt selbst zu einer Lichtquelle wird, von der aus eine Kugelwelle ausgeht (A). Unter bestimmten Umständen
beobachtet man in der Beugungsfigur kleine Maxima an Lichtintensität neben dem Hauptmaximum (B). Diese Struktur in der Beugungsfigur wird verstärkt, wenn das Licht auf zwei
Spalte gleichzeitig scheint (C), so dass ein ausgeprägtes Interferenzmuster entsteht. Maxwells
Theorie des Elektromagnetismus beschreibt Licht als elektromagnetische Wellen, die sich
konstruktiv und destruktiv überlagern können (wenn in Phase, also wenn kohärent, was durch
die Spalte garantiert wird).
1.2.7.2 Quantennatur von Licht und der Welle–Teilchen-Dualismus
Wenn die elektromagnetische Theorie des Lichts richtig ist, dann kann man
die Intensität des Lichts kontinuierlich auf Null dimmen. Experimentell kann
man das durch immer stärker werdende Filtersysteme erreichen. Allerdings
wird die Intensität dann so schwach, dass dies experimentell nicht mehr leicht
beobachtbar ist. Mit modernen Methoden kann man aber auch noch sehr
schwaches Licht detektieren und verwendet dazu einen speziellen Detektor
(eine sogenannte CCD-Kamera, wobei CCD für charge-coupled device steht),
die eintreffendes Licht verstärken kann. Studiert man nun mit diesem Detektor das immer weiter abgeschwächte Licht, dann stellt man genau nicht fest,
was Maxwells Theorie voraussagt: Statt eines immer schwächer werdenden
Signals wird ab einem bestimmten Abschwächungsgrad eine konstante Intensität beobachtet, die aber zu flackern beginnt. Dimmt man das Licht noch
weiter, so flackern die vom Detektor aufgezeichneten Signale immer langsamer — aber bei konstanter Intensität.
Das Dimm-Experiment zeigt klar, dass Licht keine elektromagnetische Welle sein kann. Man ist gezwungen Licht
als ‘körnig’ zu betrachten, als quantisiert, wie man sagt.
Licht besteht also tatsächlich aus einzelnen Teilchen, die
man Photonen nennt.
An dieser Stelle sind wir nun also auf ein Paradox gestoßen: Zuerst haben
wir Licht als Welle (elektromagnetischer Felder) interpretiert und nun stellen
37
38
1 Erste Schritte zur Theorie der Chemie
wir fest, dass es partikulär ist und eben aus Lichtteilchen besteht. Diese paradoxe Situation trägt den Namen Welle–Teilchen-Dualismus. Landläufig will
man damit festhalten, dass sich Licht mal so (Welle) oder mal so (Teilchen)
verhält. Das ist aber zu naiv gedacht und die Natur der Dinge nicht wirklich
durchdrungen, wie wir noch zu diskutieren haben, denn Licht verhält sich immer wie Licht und nicht wie etwas, das wir hineininterpretieren müssen. Im
Falle des Lichts hat der Welle–Teilchen-Dualismus noch einen gewissen Charme, weil wir zuvor sogar eine Wellengleichung schreiben konnten, die beschreibt, welche orts- und zeitveränderlichen elektrischen und magnetischen
Felder von sehr vielen Photonen erzeugt werden. Das wird später schwieriger,
wenn wir dieselbe Frage für Elektronen untersuchen.
Was geschieht nun, wenn wir das Doppelspaltexperiment mit einzelnen
Photonen (also mit stark abgeschwächtem Licht) durchführen? Natürlich detektiert die CCD-Kamera dann nur einzelne Photonen und es blitzt also hinter
dem Doppelspalt nur kurz auf. Wenn dieses Experiment nun viele Male wiederholt wird und wir die Signale an der CCD-Kamera akkumulieren, dann
wuerde man erwarten, zwei überlagerte Beugungsfiguren zu sehen. Schließlich haben wir zwei Spalte und jeder Spalt wird das Licht (die Photonen) beugen, so dass pro Spalt eine Beugungsfigur wie in Abb. 1.3(A) gezeigt entsteht — schliesslich muss das Photon auf dem Weg zur CCD-Kamera entweder durch den einen oder durch den anderen Spalt geflogen sein. Wegen
der räumlichen Trennung der beiden Spalte sind die beiden Beugungsfiguren etwas versetzt und sollten sich einfach zu einem Doppelmaximumbild
der Intensität überlagern. Dies wird jedoch nicht beobachtet! Tatsächlich beobachtet man das Interferenzbild aus Abb. 1.3(C). Dieser Befund ist nun deshalb
so schwer zu erklären, weil wir Interferenz nach der Welleninterpretation nur
verstehen können, wenn Licht durch beide Spalte gleichzeitig tritt. Das aber genau würden wir aufgrund unseres Experiments eigentlich ausschließen wollen, weil wir ja wissen, dass nur einzelne Photonen auf dem Weg von Lichtquelle durch Spalt zum Detektor sind.
Wir untersuchen also nacheinander einzelne Teilchen (Photonen) und stellen fest, dass sie sich in der zeitlichen Summe verhalten wie intensives Licht,
das gleichzeitig die zwei Spalte durchtreten hat. Wir messen ein (aufsummiertes) Interferenzbild für einzelne Teilchen, obwohl wir gerade diese Eigenschaft einem Wellencharakter der Materie entsprechend des Welle–TeilchenDualismus zuordnen wollten. Die Konsequenz ist nun nicht, dass man dem
Welle–Teilchen-Dualismus einen tieferen mythischen Charakter zuschreiben
muß, sondern, dass man ihn aufgeben muß. Man erkennt hier ganz klar, dass
der Welle–Teilchen-Dualismus ein anthropogenes Konzept ist, das sich im wesentlichen nur aufgrund historisch gefaßter und heute obsolet gewordener
Annahmen und Bilder begründen läßt. Es ist der elementaren Materie schlicht
gleichgültig, welches Bild wir uns von ihr machen. Wir müssen lernen, dass
1.2 Schlüsselexperimente
wir Theorien finden müssen, die uns erklären, was wir messen (werden) und
dabei müssen wir uns davon verabschieden, erkennen zu wollen, was ein
Photon (oder Materie allgemein) ist. Diese Erkenntnis tut dem Projekt ‘Naturwissenschaft’ aber keinen Abbruch, weil es eine großartige Erkenntnis ist,
zu wissen, was die elementaren Objekte sind, die alle Materie aufbauen, und
wie sie sich bewegen und miteinander wechselwirken. Eine Theorie, die dies
leistet, haben wir aber offensichtlich noch nicht kennengelernt. Dies leistet erst
die im Kapitel 2 einzuführende (moderne) Quantenmechanik, für deren Entwicklung es entscheidend war, sich darauf zu konzentrieren, nur das zu beschreiben, was tatsächlich meßbar ist.
Mit diesen Einsichten sehen wir das Interferenzbild des Doppelspaltexperiments, das die Beschreibung des Lichts als elektromagnetische Welle zunächst
zementierte, von einer neuen Perspektive: Wenn wir das Detektorsignal, das
einzelne Photonen, die durch den Doppelspalt treten, auslösen, über die Zeit
summieren, sehen wir ein Interferenzbild. Das bedeutet doch, dass wir das
Interferenzbild auch sehen werden, wenn wir viele Photonen auf den Doppelspalt treffen lassen. Wir müssen nur nicht mehr solange warten, bis hinreichend viele Einzelsignale akkumuliert wurden. Wenn nun sehr, sehr viele
Photonen unterwegs sind, wird offensichtlich die Interferenzfigur instantan
entstehen. Und so erhalten wir also das Interferenzbild zwanglos aufgebaut
aus den Einzelsignalen der einzelnen Photonen — elektromagnetische Wellen
werden nicht mehr benötigt. Natürlich haben wir erst dann einen vollwertigen Ersatz für Maxwells Theorie, wenn wir eine Theorie des Bewegungsverhaltens der Photonen aufstellen können.
Hier zeigt sich also ein interessanter Aspekt der Theoriebildung. Maxwells
elektromagnetische Theorie erklärt Licht nur auf der makroskopischen Ebene,
wenn elektromagnetische Effekte sehr vieler Photonen beobachtet werden. Sie
bricht zusammen, wenn es um einzelne Lichtteilchen geht. Es muß also eine
grundlegendere Theorie geben, die es uns gestattet einzelne Photonen zu beschreiben und die beim Studium sehr vieler Photonen in die Theorie von Maxwell übergeht, denn diese ist experimentell sehr gut bestätigt. Die Entdeckung
der Quantenmechanik für Elektronen und Kernteilchen in den 1920er Jahren legte den Grundstein für diese allgemeinere Theorie. Sie zu formulieren
gelang jedoch erst 1949. Ihr Name ist Quantenelektrodynamik (QED) und sie
ist die fundamentale Theorie der Chemie, wenn man (zu Recht) annimmt,
dass sämtliche chemischen Prozesse dominiert sind durch ausschließlich elektromagnetische Wechselwirkungen. Die QED beschreibt die quantenmechanische Bewegung und Wechselwirkung von Elektronen und Photonen. Man
hat festgestellt, dass die elektromagnetische Wechselwirkung der Elektronen
durch Photonen vermittelt wird, eine Erkenntnis, die schon durch Maxwells
Arbeiten nahegelegt wurde, weil Elektronen elektromagnetische Kräfte aufeinander ausüben. Leider ist der Theorie-Apparat der QED sehr kompliziert.
39
40
1 Erste Schritte zur Theorie der Chemie
Glücklicherweise kommt die Theorie der Chemie im wesentlichen ohne die
QED aus. Es reicht die in den 1920er Jahren entwickelte Quantenmechanik,
die im Kapitel 2 eingeführt wird, aus. Zum einen hat man festgestellt, dass
die klassische Beschreibung des Lichts als elektromagnetisches Feld auf molekularer Ebene hinreichend ist, obwohl diese der Natur des Lichts nicht gerecht
wird. Zudem wird Licht von Materie entweder gestreut, absorbiert oder emittiert. D.h. die Wechselwirkung des Lichts mit Materie ist sehr schnell und für
die Chemie ist oft nur wichtig, was der Zustand der Materie vor und nach der
Wechselwirkung mit Licht war beziehungsweise ist. Und genau dafür reicht
die Quantenmechanik der 1920er Jahre aus.
1.2.7.3 Elementarteilchen am Doppelspalt und die De Brogliesche Materiewelle
Interessanterweise kann man das Doppelspaltexperiment auch mit den anderen bekannten Elementarteilchen durchführen. Wir haben schon am Beispiel
der Kathodenstrahlen gesehen, dass wir den Strahl aus einzelnen Elektronen
aufgebaut verstanden wollen. Wenn wir nun diesen gedimmten Elektronenstrahl auf einen Doppelspalt richten, dann werden wir exakt dieselben qualitativen Phänomene wie für einzelne Photonen beobachten und im besonderen ein Interferenzmuster! Ebenso ergeht es anderen elementaren Teilchen
und sogar Molekülen. Beugung und Interferenz sind also Erscheinungen, zu
denen alle Materie fähig ist. Allein weil dieses Konzept heute immer noch verwendet wird, kehren wir nochmals zu dem ‘Wellenbild’ zurück. Die Tatsache,
dass auch elementare Materie wie Elektronen, die lediglich historisch zuerst
als Teilchen angesehen wurden, in der Lage ist, typische Welleneigenarten (Interferenzmuster) zu zeigen, führte Louis De Broglie 1924 (zwei Jahre vor der
Formulierung der modernen Quantenmechanik) zur Postulierung der Materiewelle. De Broglie ordnet dadurch einem Teilchen eine Wellenlänge λ zu,
λ=
h
mv
(1.75)
die von der Masse m und der Geschwindigkeit v des jeweiligen Teilchens,
sowie von der Naturkonstanten h, der Planck-Konstante, abhängt. Über den
Sinn des Welle–Teilchen-Dualismus wurde bereits einiges gesagt. An dieser
Stellen kann man leicht durch weiteres Fragen den Dualisten den Teppich unter den Füßen wegziehen: Was schwingt denn da im Falle des Elektrons? Wie
sieht die zugehörige Wellengleichung aus (NB: die Schrödinger-Gleichung
der Quantenmechanik aus Kapitel 2 ist keine Wellengleichung, weil sie keine zweiten Ableitung der Zeit enthält)?
Es sollte vielleicht noch erwähnt werden, dass De Broglie den Schluß auf
die Welleneigenschaften der als Teilchen gedachten Materie aufgrund von anderen Experimenten zog, die hier nicht besprochen werden, weil der Doppelspaltversuch alle relevanten Effekte in einem Experiment vereint. Heute ar-
1.2 Schlüsselexperimente
gumentiert man oft noch mit De Broglie-Wellenlängen, weil sie letztlich eine
charakteristische Länge für materielle Objekte liefert, mit der sich qualitativ
leicht diskutieren läßt. Diese Laxheit in der Begriffsprägung findet sich oft in
den Naturwissenschaften, wenn die richtige Beschreibung zu weitschweifend
würde.
Das Doppelspaltexperiment mit einzelnen Teilchen kennt noch einen weiteren Dreh. Man könnte sich natürlich fragen, was man beobachtet, wenn man
einen Weg findet, herauszubekommen, durch welchen der Spalte die einzelnen Teilchen geflogen sind. Wird man dann auch ein Interferenzbild sehen?
Angenommen wir können experimentell nachschauen, durch welchen Spalt
das Photon fliegt — beide Spalte sind offen, aber wir messen direkt hinter den
Spalten ob ein Teilchen durchfliegt; eine Meßanordnung, die für andere Elementarteilchen leichter zu realisieren ist, weil man dann mit Licht beobachten
kann —, dann findet man akkumuliert nicht mehr das Interferenzmuster, sondern nur noch die Summe zweier etwas versetzter Beugungsfiguren wie aus
Abb. 1.3(A). Diese Beobachtung hat manche dazu veranlaßt zu erklären, dass,
nur wenn man nicht nachschaut, welcher Spalt passiert wurde, ein Photon
durch zwei Spalte gleichzeitig fliegen und mit sich selbst interferieren kann.
Aber auch diese Interpretation enthält schon zuviel Imagination: Wir messen in einer gewissen Entfernung vom Doppelspalt und imaginieren, was auf
dem Weg zum Detektor passiert ist. Genau das verbietet uns aber die ‘neue’,
noch zu entwerfende Physik. Die moderne Physik sagt nur, was wir an einem
bestimmten Ort zu einer bestimmten Zeit messen werden. Wenn wir nicht
messen, werden wir nicht wissen, was passiert ist. Speziell macht es keinen
Sinn — wie das einfache Doppelspaltexperiment elegant zeigt — zu imaginieren, was wohl vor der Messung der Fall war. Denn genau in dem Moment,
in dem wir feststellen wollen, durch welchen Spalt das Teilchen denn nun
wirklich geflogen ist (ein Experiment, das wir natürlich durchführen können,
aber dann messen wir eben an einem anderen Ort und nicht erst in größerer
Entfernung mit der CCD-Kamera), verlieren wir die Interferenzinformation
und sehen das zu erwartende Beugungsbild eines einzelnen Spalts. Genau so
haben wir das Experiment dann aufgebaut, so dass garantiert ist, dass das
Photon nur einen Spalt durchfliegt. Wir dürfen dann aber nicht darauf schließen, was das Photon macht, wenn wir an den Spalten den Durchtritt nicht experimentell bestimmen und später das Interferenzmuster akkumulieren. Wir
dürfen nicht sagen, dass das Photon durch beide Spalte gleichzeitig geflogen
ist, weil wir das genau nicht gemessen haben. Wollen wir die Information
über den Durchtrittsort, verlieren wir das Interferenzmuster. Wir müssen uns
also ‘bescheiden’ mit einer Theorie, die es uns erlaubt, das Meßergebnis für
den jeweiligen Versuchsaufbau vorherzusagen — und genau das leistet die
Quantenmechanik.
41
42
1 Erste Schritte zur Theorie der Chemie
1.2.7.4 Der photoelektrische Effekt
Im 19. Jahrhundert war ein Detektor, der so empfindlich ist wie die CCDKamera, nicht bekannt. Dennoch deuteten Physiker ab 1900 Licht als aus
Photonen aufgebaut. Den Grundstein für diese Theorie legte Max Planck,
als er versuchte, die sogenannte Schwarzkörperstrahlung mathematisch zu
beschreiben. Wenn man einen Körper aufheizt, fängt er ab einer bestimmten Temperatur an zu glühen, sendet also Licht aus (man denke nur an rotbis weisglühendes Eisen unter dem Hammer eines Schmieds). Die spektrale Verteilung des Lichts, das ein heißer Körper aussendet, wurde sehr genau
vermessen und natürlich hat man nach einer Theorie gesucht, die diese Intensitätsverteilung als Funktion der Wellenlänge (oder Frequenz) des Lichts
beschreibt. Alle Ansätze scheiterten jedoch, was mit dem Namen Ultraviolettkatastrophe belegt wurde, weil der Theoriefehler im Vergleich zum Experiment bei kurzen Wellenlängen umso größer wurde. Planck erkannte dann
1900, dass er durch einen Trick die experimentellen Intensitätskurven genau
reproduzieren konnte. Er nahm an, dass die Energie des Lichts in kleinen ‘Paketen’, den Energiequanten, von der heißen Materie ausgesendet wird. Im besonderen mußte er annehmen, dass die kleinste mögliche Energiemenge des
Lichts einer gegebenen Frequenz ν gegeben ist durch
E = hν
(1.76)
wobei die Proportionalitätskonstante uns heute bekannt ist als das Plancksche Wirkungsquantum h = 6.62606896(33) · 10−34 [Js]. Dass die Plancksche
Konstante die Einheit einer Wirkung, [J s], hat, ergibt sich direkt aus den Dimensionen der beteiligten Grö]ßen; E in [J] und ν in [1/s]. Die Energie von n
Photonen ist dementsprechend nhν.
Erst Einstein nahm Plancks Vorschlag 1905 auf und machte ihn zu einem generellen Prinzip (von Einstein im Titel seiner Arbeit aber noch ‘heuristischer
Gesichtspunkt’ genannt). Unter Verwendung der Planckschen Idee konnte
Einstein den sogenannten photoelektrischen Effekt erklären, der heute die Basis
der Photoelektronenspektroskopie darstellt. Für diese Arbeit erhielt Einstein
1921 den Nobelpreis für Physik — hauptsächlich wohl, weil die Arbeiten zur
speziellen Relativitätstheorie aus demselben Jahr 1905 und gerade die spätere
allgemeine Relativitätstheorie von 1915/1916 die Physik so sehr revolutionierten und gleichzeitig in Experimenten damals nicht leicht nachweisbar waren,
dass das Nobel-Kommitee hier sicher Sorge hatte, einem Fehler aufzusitzen).
Beim Bestrahlen von Metalloberflächen mit Licht hat man folgende Beobachtungen gemacht:
1. Unterhalb einer bestimmten Frequenz νW beobachtet man keinen Austritt von Elektronen. Im besonderen ist diese Beobachtung unabhängig
von der Intensität des Lichts, d.h. eine Erhöhung der Intensität von Licht
1.2 Schlüsselexperimente
mit einer Frequenz ν < νW führt nicht zum Herauslösen von Elektronen
aus der Metalloberfläche.
2. Oberhalb von νW beobachtet man die Freisetzung von Elektronen. Nun
hängt aber die Stromstärke, also die Menge der herausgelösten Elektronen, von der Intensität des Lichts ab: je intensiver das Licht, desto mehr
Elektronen werden freigesetzt.
3. Erhöht man nun die Frequenz des eingestrahlten Lichts weiter, dann erhöht sich die kinetische Energie Ekin der Elektronen.
Einstein konnte nun diese Beobachtungen erklären, indem er Licht als aus
Photonen bestehend betrachtete, wobei jedes Photon eine Energie hν übertragen kann zum Herauslösen von Elektronen, was einer Austrittsarbeit W bedarf, wobei überschüssige Energie in Bewegungsenergie des herausgelösten
Elektrons umgewandelt wird. Die Energiebilanz lautet dann
hν = W + Ekin
(1.77)
Die erhöhte Intensität des Lichts wird interpertiert als eine Erhöhung der
Menge an Photonen, die eingestrahlt werden. Da nur eine bestimmte Frequenz νW ein Herauslösen von Elektronen bewirkt,
W
(1.78)
h
nennen wir die Austrittsarbeit (oder die Bindungsenergie der Elektronen im
Metall) gequantelt oder quantisiert.
νW =
1.2.8
Fraunhofersche Linien und das Bohrsche Atommodell
Fraunhofer beobachtete im Licht, das von der Sonne auf die Erde fällt, charakteristische schwarze Linien, die wir heute der Absorption von Licht derjenigen
Wellenlänge, die offensichtlich im Sonnenspektrum fehlt, durch Wasserstoffatome zuschreiben. Wenn man Wasserstoffatome stark erhitzt, senden sie Licht
aus, das spektral zerlegt (zum Beispiel durch ein Prisma oder durch ein anderes dispersives Element) genau dort scharfe Linien zeigt, wo im Sonnenspektrum die schwarzen Fraunhofersche Linien zu finden sind. Da diesmal
das Licht ausgesendet wurde, spricht man vom Emissionsspektrum des Wasserstoffs.
Für diejenigen Fraunhoferschen Linien, die in dem für das menschliche Auge sichtbaren Bereich des Lichtspektrums liegen, fand Balmer 1885 Regelmässigkeiten, die er in folgender Gleichung für die Wellenzahl ν̃ des absorbierten
Lichts zusammenfasste
!
1
1
ν̃ = R H
(1.79)
− 2
22
n1
43
44
1 Erste Schritte zur Theorie der Chemie
mit der Rydberg-Konstante für Wasserstoff R H = 109677, 576 cm−1 und
n1 ≥ 3. Der Satz Fraunhoferscher Linien, der dieser Gleichung gehorcht,
wird Blamer-Serie genannt. Als die nötigen optischen Instrumente entwickelt
waren, mit denen man auch die Bereiche des Sonnenspektrums untersuchen
konnte, die vom menschlichen Auge nicht wahrgenommen werden, fand man
weitere Linien, die allgemein der Gleichung
!
1
1
ν̃ = R H
(1.80)
− 2
n22
n1
gehorchen. Nach ihren Entdeckern nennt man die Serie für n2 = 1 im ultravioletten Teil des Spektrums Lyman-Serie (1916), diejenige für n2 = 3 im
nahen Infrarot Paschen-Serie (1908), diejenige für n2 = 4 im mittleren Infrarot
Brackett-Serie (1922), und schließlich diejenige für n2 = 5 im fernen Infrarot
Pfund-Serie (1924).
Bohr formulierte 1913 zur Beschreibung dieser Beobachtungen ein ad hoc
Atommodell, mit dem er die experimentellen Beobachtungen wiedergeben,
aber nicht erklären konnte (wegen der willkürlichen Annahmen, die im Widerspruch zur klassischen Physik selbst stehen). Die Idee dabei ist, dass absorbiertes oder emittiertes Licht die Energie des Elektrons im Wasserstoffatom
ändert. Dabei wechselt das Elektron die Umlaufbahn um den Atomkern. Dazu
mußte er annehmen, dass Elektronen sich auf Kreisbahnen mit festem Radius r um den Atomkern bewegen. Nicht alle Radien sind dabei erlaubt. Diese
Annahme ist, wie wir noch sehen werden, äquivalent mit der Forderung, dass
der Betrag des Bahndrehimpulses l = |r × p| = r me v nur bestimmte Werte
annehmen kann,
l = nh̄
n∈N
(1.81)
also gequantelt ist (die fixen Radien folgen dann daraus). Für die Quantisierungsbedingung haben wir die reduzierte Planck-Konstante ‘h-quer’ verwendet, h̄ = h/2π.
Weil das Elektron seine Bahn nicht verläßt gilt Kräftegleichgewicht: Zentripetalkraft=Zentrifugalkraft,
1 Ze e
v2
= me
2
4πǫ0 r
r
(1.82)
Die Zentripetalkraft ist in diesem Fall natürlich die Coulomb-Anziehung und
der Atomkern liegt im Ursprung des Koordinatensystems, wie im Zusammenhang mit Gl. (1.46) besprochen. Aus dieser Gleichung können wir eine
Gleichung für den Radius der Kreisbahn ableiten,
r=
1 Ze2
4πǫ0 me v2
(1.83)
1.2 Schlüsselexperimente
beziehungsweise
m e v2 =
1 Ze2
4πǫ0 r
(1.84)
Aus der Drehimpulsquantelung erhalten wir einen Ausdruck für die Geschwindigkeit
l = r me v = nh̄
⇒
v=
nh̄
me r
(1.85)
so dass wir den Radius scheiben können als
r
⇒
r
=
=
1
4πǫ0
me
Ze2
2 =
nh̄
me r
1 Ze2 r2 me
4πǫ0 n2 h̄2
4πǫ0 n2 h̄2
Ze2 me
(1.86)
Für Z = 1 und n = 1 ergibt sich der sogenannte Bohr-Radius a0 ,
a0 ≡
4πǫ0 h̄2
e2 m e
(1.87)
Die Energie des Elektrons auf der Kreisbahn erhalten wir durch Addition von
kinetischer und potentieller Energie,
Egesamt = Ekin + E pot
=
(1.84)
=
(1.86)
=
1 Ze2
1
m e v2 −
2
4πǫ0 r
1 1 Ze2
1 Ze2
1 1 Ze2
−
=−
2 4πǫ0 r
4πǫ0 r
2 4πǫ0 r
2
4
1
1
Z e me
(1.88)
−
2 (4πǫ0 )2 n2 h̄2
Die Energie ist also proportional zu 1/n2 , woraus wir schließlich die Gleichung von Balmer erhalten, wenn wir zwei Energien für zwei Bahnen, zwischen denen wir mit Licht schalten, voneinander abziehen.
Abgesehen von der willkürlichen Annahme der Drehimpulsquantelung,
die Bohr in sein Modell hineinstecken mußte, sind Konsequenzen des Atommodells aus weiteren Gründen nicht konsistent mit der klassischen Physik.
Ein um den Kern umlaufendes Elektron ändert stetig seine Bewegungsrichtung zum Kern hin aufgrund der Coulomb-Anziehungskraft. Es wird also
stetig zum Kern hin beschleunigt. Beschleuingte Ladungen strahlen aber laut
Maxwells Elektrodynamik elektromagnetische Wellen ab. Dieses Licht wird
aber nicht beobachtet. Falls es Licht abstrahlen würde, müßte das Elektron
45
46
1 Erste Schritte zur Theorie der Chemie
seine Umlaufbahn langsam verlassen und würde in den Kern stürzen, was
ebenfalls nicht beobachtet wird.
1.3
Radioaktivität und Kernstruktur
Vieles ist über Atomkerne heute experimentell bekannt, doch eine vollumfänglich befriedigende Theorie konnte noch nicht aufgestellt werden. Für die
Chemie wissen wir aber, dass das experimentelle Wissen hinreichend ist. Wir
werden bei der Diskussion der Quantenmechanik sehen, dass die Chemie mit
ausreichender Genauigkeit beschrieben wird, wenn man annimmt, dass die
positive Ladung eines Atoms allein in einem ausdehnungslosen Punkt konzentriert wird.
Einige Prozesse, die im Atomkern ablaufen, müssen jedoch etwas ausführlicher diskutiert werden. Im Jahre 1938 entdeckten nach langen Vorarbeiten
Hahn, Straßmann und Meitner die Spaltung (Fission) von Atomkernen. Diese läuft bei schweren Atomkernen unter Freisetzung von Energie ab, die in
Atomreaktoren zur Erzeugung von elektrischem Strom durch Produktion von
Wasserdampf für Generatoren benutzt wird. Leichte Kerne dagegen können
unter Energiefreisetzung verschmolzen werden (Fusion), ein Prozess, der in
unserer Sonne abläuft und die Erde mit Energie, dem Sonnenlicht, versorgt.
Es ist klar, dass bei mittleren Kerngrößen besonders stabile Atomkerne zu erwarten sind, weil kleine unter Energiefreisetzung fusionieren, während sehr
grosse unter Energiefreisetzung gespalten werden können. Dies gilt zum Beispiel für Eisen, das daher auch als Endprodukt des Fusionsprozesses in den
Kernen von Planeten und Sternen (Sonnen) vorkommt.
1.3.1
Zerfallsprozesse
Radioaktive Prozesse setzen verschiedene Sorten Teilchen frei. Deren Natur
läßt sich wieder studieren bei Eintritt in elektrische Felder, so wie wir es bereits am einfachen Experiment der Kathodenstrahlen gesehen haben . Manche
Strahlen (γ-Strahlen) werden durch diese Felder nicht beeinflußt, sind also
nicht geladen, während andere zum elektrischen Pluspol (also negative geladen sind, β− -Zerfall) oder zum elektrischen Minuspol (also positiv geladen
sind, α-Strahlen) abgelenkt werden.
An den Bezeichnungen ist bereits zu erkennen, dass man die in ihrer Zusammensetzung zunächst unbekannten Strahlen einfach entsprechend dem
griechischen Alphabet durchbuchstabierte:
1.3 Radioaktivität und Kernstruktur
1.3.1.1 α-Strahlen
Viele Atomkerne zerfallen unter Freisetzung besonders stabiler 42 He2+ -Kerne,
die in Form von α-Strahlen freigesetzt werden (s.a. Rutherfordscher Streuversuch).
1.3.1.2 β-Strahlen
Andere Atomkerne sind in der Lage Elektronen aus dem Atomkern zu emittieren. Aus Gründen der Ladungserhaltung bleibt ein Proton im Kern zurück,
wodurch ein anderes Element mit einfach erhöhter Kernladung entsteht. Die
Energie des emittierten Elektrons kan dabei kontinuierliche Werte annehmen.
Aus Gründen der Energieerhaltung muß daher noch ein weiteres Teilchen entstehen, das Antineutrino.
1.3.1.3 γ-Strahlen
Angeregte Atomkerne, die etwa in einer Zerfallskette nach vorausgehendem
α-Zerfall entstehen können, gehen in einen energetisch niedrigsten Zustand
über, dem sogenannten Grundzustand des Atomkerns. Dabei wird Energie in
Form von hochenergetischem Licht, der γ-Strahlung, freigesetzt. Die Energie
dieses Lichts ist größer als die der Röntgenstrahlen. Dieses hochenergetische
Licht trägt keine elektrische Ladung passiert daher Kondensatoren unbeeinflußt.
1.3.2
Kinetik radioaktiver Zerfälle
Die chemische Kinetik beschäftigt sich mit der Veränderung von Konzentrationen oder Stoffmengen mit der Zeit. Die Änderung einer Stoffmenge mit der
Zeit wird allgemein Reaktionsgeschwindigkeit oder auch Reaktionsrate genannt.
Das entsprechende Geschwindigkeitsgesetz für Konzentrationen ergibt sich
durch konsistentes Wichten mit dem Volumen auf das die Stoffmenge zu beziehen ist, um so die Konzentration zu erhalten. Am Beispiel der Radioaktivität können wir eine der einfachsten Kinetiken studieren, die sogenannte
Kinetik erster Ordnung.
Der radioaktive Zerfall ist ein von außen nicht beeinflußbarer Prozeß, den
wir daher nur statistisch beschreiben können: Wir können nicht wissen, wann
ein einzelner Atomkern zerfallen wird, sondern können nur angeben, welcher Anteil an Atomkernen in einer großen Stoffmenge statistisch in einem
Zeitintervall zerfallen wird. Aus dieser Überlegung folgt, dass die Zerfallsgeschwindigkeit, also die Verringerung der Anzahl der Atomkerne N durch
Zerfall mit der Zeit, dN/dt, nur von der Anzahl N (t) am Meßzeitpunkt t der
47
48
1 Erste Schritte zur Theorie der Chemie
Messung abhängen kann, also proportional zur ihr ist
−
dN (t)
∝ N (t)
dt
(1.89)
Das Minuszeichen deutet die Abnahme der Atomkernmenge an. Wenn wir
nun eine Proportionalitätskonstante, die sogenannte Geschwindigkeits- oder
Raten-Konstante k einführen, dann können wir schreiben
dN (t)
= −kN (t)
dt
(1.90)
Diese Gleichung für die Zerfallsgeschwindigkeit bezeichnet man auch als (differentielles) Geschwindigkeitsgesetz des radioaktiven Zerfalls. Mathematisch
gesehen ist das Geschwindigkeitsgesetz eine Differentialgleichung erster Ordnung, weil sie (maximal) erste Ableitungen nach der Variablen, der Zeit, enthält. Weil die Stoffmenge N (t) nur linear in dieses Gesetz eingeht auf der rechten Seite, nennt man diese Kinetik eine Kinetik erster Ordnung.
Das Geschwindigkeitsgesetz ist offensichtlich ein differentielles Gesetz, das
nur infinitesimale Stoffmengenänderungen in infinitesimal kleinen Zeitintervallen beschreibt. Um daraus eine für makroskopische Zeitintervalle gültige
Gleichung zu erhalten, müssen wir es integrieren. Die Integration dieser Differentialgleichung erfolgt durch das Rezept der Variablentrennung, weil Stoffmengen und Zeiten auf die beiden Seiten der Gleichung separiert werden können, wenn wir uns erlauben, den Differentialquotienten wie einen gewöhnlichen Bruch zu behandeln
dN (t)
= −kdt
N (t)
(1.91)
Diese Gleichung integrieren wir nun unbestimmt
Z
dN (t)
=
N (t)
Z
d[ln N (t)] =
Z
−kdt = −k
Z
dt
(1.92)
und erhalten
ln N (t) = −kt + C ′
(1.93)
mit C ′ als Integrationskonstante (die beim Ableiten wieder wegfallen würde).
Durch Erheben der beiden Seiten der Gleichung zu Exponenten in der Exponentialfunktion können wir diese Gleichung nach der Lösungsfunktion der
Differentialgleichung erster Ordnung auflösen,
eln N (t)
⇒
N (t)
′
= e−kt+C = e−kt eC
= Ce
−kt
′
(1.94)
(1.95)
1.3 Radioaktivität und Kernstruktur
wobei wir C ≡ exp (C ′ ) eingeführt haben. Die Anzahl radioaktiver Atomkerne nimmt also exponentiell schnell mit der Zeit ab, wobei die genaue Abnahme durch die Materialkonstante k bestimmt wird, die für jede Atomkernsorte spezifisch ist. Die modifizierte Integrationskonstante C hängt von der
Anfangskonzentration an Atomkernen ab, wie man leicht durch bestimmte
Integration nachweisen kann.
In unserer statistischen Betrachtung des radioaktiven Zerfalls klingt die
Atomkernanzahl exponentiell ab. Zu seiner Charakterisierung würden wir
gerne charakteristische Zerfallszeiten definieren, die uns erlauben, festzuhalten, ob ein Zerfall langsam oder schnell ist. Gebräuchlich sind zwei solcher
Zeiten: die Halbwertszeit τ (oft auch durch einen Index 1/2 gekennzeichnet)
gibt an, nach welcher Zeit die Hälfte der Atomkerne zerfallen ist, während
die Lebenszeit τ ′ angibt, wieviel Zeit verstreicht, bis die Menge auf 1/e abgefallen ist,
τ=
ln 2
k
und
τ′ =
1
k
(1.96)
1.3.3
Nukleare Kettenreaktion
Kernspaltungsreaktionen lassen sich auch induzieren. Uran-Kerne spalten
unter Freisetzung von Neutronen, die mit nicht zu hohen kinetischen Energien auf andere Atomkerne treffen können und diese spalten. Im Gegensatz
zu den α-Strahlen des Rutherfordschen Streuversuchs werden die elektrisch
ungeladenen Neutronen nicht von der Coulomb-Barriere des Atomkerns abgestoßen oder abgelenkt. Die durch die Neutronen gespaltenen Kerne setzen
weitere Neutronen frei, die wiederum andere Kerne spalten. Da sich die Zahl
der Neutronen bei jeder Generation vervielfacht, kommt eine Kettenreaktion
zu Stande, die ungebremst in einer Atomexplosion abläuft, während sie in
Atomreaktoren durch Graphit-Stäbe moderiert wird, die dafür sorgen, dass
die Kettenreaktion kontrolliert werden kann.
Da der Kernzerfall von Neutronen induziert wird, ändert sich das oben aufgestellte Geschwindigkeitsgesetz. Der Kern hat nun einen Reaktionspartner
(das Neutron) und sämtliche Gleichungen des vorstehenden Abschnitts können nicht mehr angewendet werden, weil die Voraussetzung — nämlich dass
der Kern ohne äußeren Einfluß zerfällt — nicht mehr gültig ist.
49
51
2
Einführung in die Quantenmechanik
2.1
Postulate
Durch die bisherige Diskussion experimenteller Ergebnisse haben wir gesehen, dass sämtliche Materie aus räumlich wohl getrennten Objekten aufgebaut ist. Klumpen positiver Ladung, aufgebaut aus Protonen und Neutronen
mit einer Ausdehnung von einem bis einigen Femtometern (also ein Millionstel eines Millardstel Meters), werden umgeben von deutlich leichteren, umgekehrt geladenen Teilchen, den Elektronen. Es sind also fast ausschließlich
die Elektronen, die sich in dem Volumen bewegen, das wir einem Molekül
zuschreiben wollen.
Wir benötigen nun eine Theorie, die uns erklärt, wie Atome aufgebaut, was
ihre Eigenschaften sind (warum wir beispielsweise Fraunhofersche Linien beobachten können) und wie sie sich verbinden und so Moleküle bilden. Was ist
der Klebstoff der Atome im Molekül? Nach den experimentellen Ergebnissen
ist klar, dass die Klärung dieser Fragen nur folgende Ingredientien verwenden
darf: Atomkerne, Elektronen, elektromagnetische Wechselwirkungen. Daher
muß die Theorie eine mechanische Theorie sein. Sie muß uns erlauben, das
Bewegungs- und Wechselwirkungsverhalten dieser elementaren Bestandteile zu beschreiben. Die neue Theorie muß auch das erklären, was die klassische Mechanik eingangs nicht vermochte, nämlich warum es überhaupt einzelne Atome gibt und warum einzelne Moleküle. Warum gibt es nicht einfach nur Makromoleküle oder sogar ‘makroskopische’ Moleküle wie zum
Beispiel einen mit bloßem Auge beobachtbaren, kubischen NatriumchloridEinkristall.
Die Theorie, die all dies leistet und die durch sämtliche chemische Phänomene grandios bestätigt wurde, ist die Quantenmechanik, die Mitte der 1920er
Jahre von Schrödinger, Heisenberg und anderen entdeckt wurde. Man kann
sie nicht ableiten und die Entdecker der Theorie konnten sich nur durch Analogien und durch ihre Erfahrung mit physikalischen Theorien und mathematischen Gleichungen leiten lassen. Daher gehen wir hier nun genauso vor, wie
bei der Einführung der klassischen Mechanik durch Postulieren der Netwonschen Axiome: Wir formulieren eine möglichst geringe Anzahl von PostulaAllgemeine Chemie.
Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008
52
2 Einführung in die Quantenmechanik
ten, aus denen sich die gesamte Chemie dann ableiten läßt. Insgesamt werden
es sechs Postulate sein, von denen wir die Postulate 0 bis 4 im folgenden einführen, während das letzte Postulat, Postulat 5, erst im Rahmen von Vielelektronensystemen benötigt und dort eingeführt wird.
2.1.1
Postulat 0: Elementarteilchen in der Chemie
Die Physik kennt, wie wir gesehen haben, einen ganzen Zoo an Elementarteilchen. Die Komplexität der Chemie mit all ihren Molekülen und Reaktionen
resultiert dagegen nur aus einer sehr geringen Zahl an Elementarteilchen, neben den Elektronen sind dies etwas mehr als 100 Typen von Atomkernen, die
sich durch ihre Protonenzahl unterscheiden. Wir formulieren daher ein nulltes
Postulat, das die Objekte der Theorie definiert:
Postulat 0: Die Theorie der Chemie erfordert eine quantenmechanische Beschreibung des Bewegungs- und Wechselwirkungsverhaltens von Elektronen und Atomkernen. Für
die Chemie ist ausschließlich ihre Interaktion durch elektrostatische Kräfte von Bedeutung.
Einige ergänzende Eläuterungen sind noch der Vollständigkeit halber nötig.
(1) Das Postulat 0 spricht von elektrostatischen Kräften zwischen den (chemischen) Elementarteilchen und läßt magnetische Wechselwirkungen außen
vor. Die sich bewegenden Elektronen erzeugen natürlich, wie alle bewegten
Ladungen, magnetische Felder. Man hat diese magnetischen Felder, die unter
dem Namen Breit-Wechselwirkung in der Quantenmechanik bekannt sind,
untersucht und festgestellt, dass ihr Beitrag zur potentiellen Energie gegenüber der rein elektrostatischen Coulomb-Wechselwirkung in der Regel vernachlässigbar ist. Zudem ist es so, dass magnetische Felder eng mit Einsteins
spezieller Relativitätstheorie verknüpft sind und in einer nichtrelativistischen
Theorie, wie der Newtonschen Mechanik, nicht vorkommen. Eine nichtrelativistische Formulierung erlaubt einen umgehenden (d.h. sofortigen oder instantanen) Austausch von Wechselwirkungen. Tatsächlich breitet sich aber
die Wechselwirkung elektrischer Ladungen mit Lichtgeschwindigkeit c (eben
mit der Geschwindigkeit der die Wechselwirkung vermittelnden Photonen)
aus. Nun tragen aber magnetische Felder zur Wechselwirkungsenergie immer mit einem Vorfaktor 1/c im Vergleich zu der elektrostatischen CoulombWechselwirkung bei. Weil c sehr groß (in einer nichtrelativistichen Theorie unendlich groß) ist, kann man die magnetischen Wechselwirkungen erst einmal
vernachlässigen.
Allerdings gilt das Vorstehende nicht uneingeschränkt. Drehbewegungen
von Elementarteilchen erzeugen magnetische Felder, die mit anderen magne-
2.1 Postulate
tischen Feldern wechselwirken können, wie wir gerade im Zusammenhang
mit dem Spin von Elektronen und Atomkernen noch sehen werden.
(2) Alle Elementarteilchen werden beschrieben als Punktteilchen. D.h. dass
wir jedem Elementarteilchen innerhalb der Theorie eine Position im Raum, r,
zuweisen. Diese Position ist nicht zu verstehen als eine Art mittlere Position
eines ausgedehnten Objekts (wie es etwa ein Ladungs- oder Massenschwerpunkt wäre). Wir werden also das Bewegungsverhalten von punktförmigen
Teilchen in unserer neuen Mechanik beschreiben. Denkt man an die im Vergleich zu den Atomkernen drei bis vier Größenordnungen kleinere Masse des
Elektrons, dann akzeptiert man leicht, dass ein Elektron als Punktteilchen behandelt werden kann (tatsächlich sucht man noch heute experimentell nach
dem elektrischen Dipolmoment des Elektrons, um so einen Nachweis für eine
räumliche Ausdehnung der Ladung des Elektrons zu finden).
Dagegen ist experimentell bekannt, dass die Größe der Atomkerne im Femtometerbereich liegt. Das bedeutet, dass ihre positive Ladung nicht in einem
Punkt konzentriert sein wird. Nun ist aber nur wichtig zu wissen, ob die Form
des Atomkerns überhaupt einen Unterschied machen wird, wenn man die
elektrostatische Coulomb-Wechselwirkung zweier Atomkerne oder von Elektronen und Atomkernen in der Quantenmechanik studiert. In der klassischen
Mechanik und Elektrodynamik macht es einen Unterschied, ob eine Ladungsverteilung punktförmig oder ausgedehnt ist — selbst wenn der Raum der
Ausdehnung sehr, sehr klein ist. In der Quantenmechanik erhält man dann
auch unterschiedliche Energien, jedoch sind die Unterschiede der Energien
für punktförmige wenn verglichen mit ausgedehnten Atomkernen für chemische Fragestellungen fast immer vernachlässigbar. Daher wählen wir die
einfachste Darstellung, nämlich die der Punktkerne. Die Wahl des einfachsten Weges, wenn er begründet zum (nahezu) selben Ergebnis führt, wird
in der Naturphilosophie auch die Anwendung des Ockhamschen Rasiermessers
genannt, mit dem man unnötigen Balast abschneidet.
Man könnte nun einwenden, dass ein punktförmiger Atomkerne doch eigentlich einen Nachteil birgt, nämlich die Singularität in der Wechselwirkungsenergie, die man bei sehr kleinen Abständen findet — schließlich ist
diese Energie in der radialen Abstandsvariablen r proportional zu −1/r [Gl.
(1.46)], strebt also gegen minus Unendlich für r → 0. Andererseits erfordert
eine endliche Ausdehnung die Wahl einer Ladungsverteilungsfunktion, wofür aber nur Modellfunktionen zur Verfügung stehen, weil die Ladungsverteilung zur Zeit weder experimentell noch theoretisch eindeutig bestimmt werden kann. Solange die Punktkernsingularität zu keinem ernsten mathematischen Problem führt, ist das Punktkernmodell die bessere Wahl.
An dieser Stelle ist ein Vorgriff nötig, um spätere Verwirrung zu vermeiden: Zwar weisen wir jedem Elementarteilchen einen Punkt im Raum zu, dies
heißt aber nicht, dass dieser Ort dieselbe Funktion hat wie in der klassischen
53
54
2 Einführung in die Quantenmechanik
Mechanik. Diese Orte der Punktteilchen sind nicht die Positionen, an denen
wir den Aufenthaltsort der Teilchen messen können. Das liegt daran, dass die
Quantenmechanik einen speziellen Mechanismus zur Messung von beobachtbaren Größen vorschreibt. Wenn wir die Position eines Elektrons im Raum
messen wollen, können wir nicht einfach r verwenden, sondern müssen eine
genaue Vorschrift der Quantenmechanik zur Ortsmessung beachten, die wir
noch einzuführen haben (s. Postulat 3).
(3) Nachdem wir die Frage der Ausdehnung der ‘chemischen’ Elementarteilchen erörtert haben, können wir auch gleich das Problem der Isotope behandeln: Atomkerne mit gleicher Protonen aber unterschiedlicher Neutronenzahl unterscheiden sich einzig und allein durch ihre Massen, weil wir sämtliche Atomkerne als Punktteilchen behandeln. Dies ist natürlich eine Näherung,
die aber in der Regel für die Chemie ausreichend ist. In anderen Worten, Reaktionsenergien oder Bindungslängen sind durch diese Näherung fast nicht
nachweisbar betroffen. Es gibt einige spezielle experimentelle Bedingungen
unter denen man Isotopeneffekte beobachten kann. Natürlich ist dies möglich
in hochauflösenden spektroskopischen Experimenten, es gibt aber auch Effekte auf Reaktionskinetiken (Geschwindigkeitskonstanten), die sich bei leichten
Atomen über die Masse der schwingenden Atom(kern)e und bei schweren
Atomen über die unterschiedliche Ausdehnung der Atomkerne verschiedener Isotope, über die sich die positive Kernladung dann verteilt, auswirken.
2.1.2
Postulat 1: Zustandsfunktion
Die Struktur der Quantenmechanik ist völlig anders als die der klassischen
Mechanik, was die eigentlich Hürde dieser Theorie darstellt. Während eine
Gleichung der klassischen Mechanik direkt anzeigt, wie man einen experimentellen Aufbau zu entwerfen und Meßwerte einzusetzen hat — man erinnere sich nur an die Definition der Geschwindigkeit, deren Meßwert sich direkt errechnet aus dem zurückgelegten Weg geteilt durch die dafür benötigte
Zeit —, funktioniert die Quantenmechanik völlig anders. Wir postulieren:
Postulat 1: Es existiert für jedes System von Elementarteilchen eine Zustandsfunktion Ψ, die sämtliche Informationen kodiert, die wir in einem Experiment prinzipiell in Erfahrung bringen können.
Diese Zustandsfunktion wird aus historischen Gründen oft Wellenfunktion
genannt. Der Name ist allerdings äußerst verwirren, weil die Wellenfunktion
nicht die de Brogliesche Materiewelle beschreibt. Die Wellenfunktion erfüllt
nicht einmal eine Wellengleichung, wie wir bei Postulat 2 sehen werden.
Unter ‘System’ soll im folgenden eine Ansammlung von Elementarteilchen
verstanden werden. In der Praxis trifft der Mensch die Wahl, was zum Sy-
2.1 Postulate
stem zählt und was nicht. Im Prinzip ist das System der Quantenmechanik das
Universum, ganz entsprechend dem universalistischen Anspruch der Quantenmechanik. Eine sinnvolle Wahl zum Studium molekularer Objekte wird
bestimmt durch das Wissen um eine möglichst schwache Wechselwirkung
mit einer etwaigen Umgebung. Hier können ChemikerInnen von ihrem breiten experimentellen Wissen profitieren. Die Chemie hat einen experimentellen
Zugang zur Formulierung ‘sinnvoller’ Moleküle gefunden und genau dieses
Wissen erlaubt es ChemikerInnen ein sinnvolles molekulares System zu definieren. Natürlich braucht es dieses Wissen im Prinzip nicht, aber es wäre äußerst mühselig verschiedene Systemgrößen theoretisch zu untersuchen, um
dann sinnvolle Systemgrößen festzustellen. Wenn man allerdings so vorgeht,
wird man in der Regel nach der quantenmechanischen Analyse den intuitiven Vorschlag der ChemikerInnen bestätigt finden. (Dies hat damit zu tun,
dass eine chemisch sinnvolle Lewis-Struktur etwas mit dem Raten von Wellenfunktionen zu tun hat — eine Wellenfunktion, die ein System in einem ungünstigen Energiezustand beschreibt, gehört, etwas salopp gesagt, zu einer
unvernünftigen Lewis-Struktur.)
2.1.3
Postulat 2: Bewegungungsgleichung
Durch Postulat 1 haben wir die Existenz einer Funktion gefordert, die der Träger der physikalischen Information für unser System ist. Natürlich entwickelt
sich ein System mit der Zeit und damit verändert sich auch unser Informationsträger. Die Frage ist wie. Wie für jede gute mechanische Theorie gilt es also
noch eine Bewegungsgleichung zu postulieren — so wie wir in der klassischen
Mechanik die Newtonsche Bewegungsgleichung, Gl. (1.10), postulierten:
Postulat 2: Die Zustandsfunktion Ψ verändert sich mit der
Zeit, was durch die zeitabhängige Schrödinger-Gleichung
beschrieben wird
ih̄
∂
Ψ = ĤΨ
∂t
(2.1)
wobei Ĥ der sogenannte Hamilton-Operator ist.
Natürlich hilft uns diese Gleichung noch nicht weiter, solange nicht postuliert wird, wie der Hamilton-Operator aussieht. Dies ist allerdings nicht so
leicht, weil die Form von Ĥ vom System abhängt. Wir haben schon in frühreren Abschnitten Operatoren kennengelernt. Auch der Hamilton-Operator ist
eine Abkürzung für eine Anzahl an Rechenvorschriften, die auf die Wellenfunktion angewendet werden müssen. Der Name deutet schon an, dass dieser Operator das quantenmechanische Analogon zur Hamilton-Funktion —
55
56
2 Einführung in die Quantenmechanik
also zur Gesamtenergie — der klassischen Mechanik ist, die wir in Gl. (1.34)
kennengelernt haben.
Schrödinger hat gefunden, dass der Hamilton-Operator für ein Elementarteilchen, das keinen Wechselwirkungen unterliegt, sich wie folgt schreiben
läßt
h̄2
∆
(2.2)
2m
wobei ∆ der schon bekannte Laplace-Operator und m die Masse des Teilchens
ist. Die klassische Mechanik, die unsere tägliche Erfahrungswelt so gut beschreibt, muß von der Quantenmechanik, deren Gültigkeitsanspruch universell ist, umschlossen werden. Das bedeutet, dass es einen Bezug zur klassischen Mechanik geben sollte/muß. Dieser wird hergestellt durch das sogenannte Korrespondenzprinzip.
Ĥ = −
Korrespondenzprinzip: Das Finden eines mathematischen Ausdrucks für einen Operator kann sich an den
Ausdrücken der klassischen Physik orientieren. D.h. die
Form des Hamilton-Operators ist gleich der Form der
Hamilton-Funktion.
Das bedeutet, das obiger Hamilton-Operator für ein freies Teilchen dieselbe Form haben muß, wie die Hamilton-Funktion für ein freies Teilchen. Die
Hamilton-Funktion ist in diesem Fall nichts anderes als die kinetische Energie
des Teilchens,
p̂2
p2
⇒ Ĥ =
(2.3)
2m
2m
wobei wir den klassischen Impuls p durch einen entsprechenden Operator p̂
ersetzt haben. Natürlich stellt sich jetzt die Frage, wie denn der Impulsoperator genau aussieht. Dies läßt sich durch Vergleich mit Gl. (2.2) direkt ableiten:
H=
p̂ ≡ −ih̄∇
⇒
p̂2 = pp = (−ih̄∇) (−ih̄∇) = i2 h̄2 ∇2 = − h̄2 ∆
(2.4)
Oft werden Randbedingungen an die Wellenfunktion formuliert, zum Beispiel, dass eine Wellenfunktion zweimal differenzierbar (und ergo auch stetig) sein muss, weil sonst die Wirkung des Laplace-Operators im HamiltonOperator nicht definiert wäre. Wir können uns hier aber auf einen rein physikalischen an Stelle des mathematischen Standpunktes zurückziehen: Eine Funktion, die nicht zweimal differenziert werden kann, ist sicher keine
Schrödinger-Wellenfunktion, die ein physikalisches System beschreibt.
Wenn wir das Korrespondenzprinzip nun auf zwei sich bewegende und
wechselwirkende Ladungen 1 und 2 anwenden, so ergibt sich analog
Ĥ =
p̂21
p̂2
q1 q2
1
+ 2 +
2m1 2m2
4πǫ0 |r 1 − r 2 |
(2.5)
2.1 Postulate
Das Korrespondenzprinzip verlangt natürlich, dass alle Variablen der klassischen Mechanik zu Operatoren promoviert werden, nicht nur der Impuls.
Auch die Ortsvektoren r i werden zu Operatoren r̂ i . Der Kürze wegen nehmen
wir hier aber vorweg, dass Ortsoperatoren r̂ i gleich den Ortsvektoren r i sind
und kommen erst im Zusammenhang mit Postulat 4 wieder darauf zurück.
Das Konstruktionsprinzip des Hamilton-Operators ist also stets: Summiere
alle Operatoren für die kinetische Energie, p̂2i /2mi , der einzelnen Elementarteilchen i und addiere dann noch alle Wechselwirkungsenergie-Operatoren.
Man beachte, dass wir für alle doch so verschiedenen Hamilton-Operatoren
stets dasselbe Symbol, Ĥ, verwenden.
Da die Impulsoperatoren in dieser Form — man nennt sie Ortsdarstellung
— nur von den Ortsvektoren der Teilchen im System abhängen, hängt der
Hamilton-Operator nur von den Ortskoordinaten dieser Teilchen ab. Dementsprechen hängt die Wellenfunktion nur von diesen Koordinaten ab, Ψ =
Ψ({r i }, t), wobei die Koordinaten aller Teilchen durch die Mengenklammern
symbolisiert wurden.
2.1.4
Postulat 3: Meßwerte
Postulat 3: Jeder physikalischen Observablen wird ein
Operator zugewiesen. Zu diesem Operator gibt es quantenmechanische Zustandsfunktionen Ψi , aus denen bei
Anwendung des Operators, ÂΨi , der Meßwert Ai extrahiert wird, was sich mathematisch schreiben läßt als
ÂΨi = Ai Ψi
(2.6)
Eine Gleichung von so einem Typ wird in der Mathematik Eigenwertgleichung genannt. Die Funktion Ψi heißt dann Eigenfunktion und die Zahl Ai heißt
Eigenwert. Weil die Quantenmechanik von Zuständen spricht, nennt man die
Eigenfunktion auch Eigenzustand. In der Regel erfüllt mehr als ein Eigenpaar
(Ψi , Ai ) eine solche Gleichung und der Index i trägt dem Rechnung. Die verschiedenen Lösungspaare werden durch den Laufindex i unterschieden. Es
hat sich eingebürgert, einen solchen Index Quantenzahl zu nennen. In manchen Fällen — wie zum Beispiel bei dem noch zu besprechenden WasserstoffAtom — hängt der Eigenwert sogar direkt von der Quantenzahl ab, was dazu
geführt hat, dass den Quantenzahlen eine Rolle zugewiesen wird, die ihre Bedeutung übertreibt, da sie letztlich nur die Rolle eines Zählindex’ haben. Für
Moleküle beliebiger Struktur hängen auch die Eigenwerte nicht mehr von diesem Zählindex ab.
Die Eigenwertgleichung drückt also aus, dass der Operator, der in der
Quantenmechanik einer physikalischen Observablen zugeordnet ist, auf eine
57
58
2 Einführung in die Quantenmechanik
bestimmte Funktion, die Eigenfunktion, angewendet, eine reelle Zahl, Ai ∈ R,
multipliziert mit der Funktion selbst ergibt. Der Operator ist also so etwas
wie die theoretische Formulierung der Messung: Ein System sei durch die
Zustandsfunktion Ψ beschrieben, die sämtliche Information über das System
trägt, dann ermitteln wir die Information (zum Beispiel die Energie des Systems), indem wir eine Messung durchführen, hier ausgedrückt durch die Anwendung des Operators.
Das Postulat 3 ist ein unglaublich starkes Postulat, was besonders deutlich
wird durch seine Invertierung: Eine reelle Zahl, die nicht Eigenwert einer Observablen ist, kann nicht gemessen werden! Natürlich stellt sich die Frage, wie
man die Operatoren zu den Observablen kennen kann. Hier hilft bei vielen
Observablen das oben schon eingeführte Korrespondenzprinzip weiter und
wir werden später weitere Beispiele wie den Drehimpuls-Operator kennenlernen.
Wenn wir die Energie eines Systems messen wollen, müssen wir den Energieoperator auf die Zustandsfunktion wirken lassen. Der Energieoperator ist
der Hamilton-Operator und daher können wir eine Eigenwertgleichung für
die Energie wie folgt formulieren
ĤΨi = Ei Ψi
(2.7)
Diese Gleichung bestimmt, was die erlaubten Energien eines Systems sind,
denn nur die Energien Ei können gemessen werden. Wenn wir die EnergieEigenwertgleichung lösen, was später in diesem Kapitel für Modellsysteme
durchgeführt wird, erhalten wir sämtliche Energien, die unser System einnehmen kann. Das bedeutet auch, das wir in der Lage sein sollten, die Lage der
Fraunhoferschen Linien im Spektrum zu erklären, weil wir deren Lage als
die Energie verstehen, die nötig für den Wechsel zwischen zwei durch die
Quantenmechanik berechenbaren Energien — wir könne jetzt sagen: EnergieEigenzuständen — ist. Diese Situation ist in Abb. 2.1 dargestellt. Auf diese
Weise kann die Quantenmechanik durch die Energie-Eigenwerte die experimentell in der Atomspektroskopie beobachteten Termschemata erklären. Daher wird die Menge der Energie-Eigenwerte auch Spektrum genannt.
2.1 Postulate
Satz der Energie−
Eigenwerte
eines Systems:
Ε3
Ε2
Ε1
mit Licht kann man
zwischen den Energie−
hν
zuständen schalten
Ε0
Abbildung 2.1 Fundamentale Darstellung jeder Spektroskopie-Technik, bei der ein Wechsel
zwischen Energiezuständen (Energie-Eigenwerten) eines Systems durch Licht induziert wird.
Da emittiertes Licht das System verläßt und absorbiertes Licht im System nicht als einzelnes Photon vorkommt (lediglich die Energie der Elementarteilchen des Systems ändert sich),
kommt dieser Prozeß völlig ohne eine Beschreibung des austretenden/einfallenden Lichts
selbst aus — zumindest solange wir nicht an einer Intensitätstheorie interessiert sind, die basierend auf den Eigenschaften des Lichtes einem Übergang zwischen verschiedenen Energiezuständen eine Wahrscheinlichkeit zuordnet.
Eine solche Überlegung gilt selbstverständlich für jede Art Spektroskopie,
bei der Licht dazu benutzt wird, um zwischen zwei energetischen Zuständen
eines Systems zu schalten. Interessanterweise ist nach der Absorption oder
Emission von Licht das Licht als physikalisches Objekt (Photon) nicht mehr
vorhanden. So brauchen wir tatsächlich nur die möglichen Energien des Systems kennen und müssen nicht die Eigenschaften des Lichts berücksichtigen.
Man beachte aber, dass wir so nur die Lage spektroskopischer Banden, nicht
aber die Intensität einer Bande vorhersagen können. Für letzteres benötigt
es eine Intensitätstheorie, die der jeweiligen Spektroskopie-Art angepaßt sein
muß und die auch die Eigenschaften elektromagnetischer Wellen in Form von
zusätzlichen Wechselwirkungsoperatoren im Hamilton-Operator berücksichtigt. Interessanterweise benötigt die molekulare Spektroskopie keine Theorie
einzelner Photonen, sondern kann mit der Kontinuumsvorstellung von Licht,
nämlich der klassischen elektromagnetischen Welle, sehr gut arbeiten. Eine
solche Theorie heißt auch semi-klassische Theorie, weil Photonen als Quantenobjekte nicht auftreten.
Die Energie-Eigenwertgleichung, Gl. (2.7), wird auch stationäre SchrödingerGleichung genannt, wobei ‘stationär’ nur ein anderes Wort für ‘zeitunabhängig’ ist. Dieser Name deutet an, dass es eine Beziehung zu der in Po-
59
60
2 Einführung in die Quantenmechanik
stulat 2 geforderten Bewegungsgleichung, der zeitabhängigen SchrödingerGleichung geben muß. Zwar sieht man sofort, dass rechte und linke Seite
beider Gleichungen ähnlich sind (der Hamilton-Operator wirkt auf einen allgemeinen quantenmechanischen Zustand im einen Fall und auf eine EnergieEigenfunktion im anderen), aber diese Beziehung kann man rigoros ableiten.
Für das weitere Vorgehen ist diese Ableitung eigentlich nicht sehr wichtig,
sie zeigt aber einen mathematischen Trick, den wir doch öfter noch benötigen werden. Für viele Fälle ist die Bedingung der Zeitunabhängigkeit des
Hamilton-Operators erfüllt, wie wir beispielhaft an Gl. (2.5) sehen können.
Der Hamilton-Operator eines Systems, das von der Umgebung isoliert und
daher ungestört ist, hängt nicht von der Zeit ab. Man beachte, dass auch die
Ortskoordinaten r i in dem Operator nicht von der Zeit abhängen, denn das
würde einem klassischen Trajektorienbild entsprechen, das wir experimentell
wegen der Heisenbergschen Unschärferelation ausschließen müssen.
Der Operator auf der linken Seite von Gl. (2.1) hängt nur von der Zeit und
nicht von Ortskoordinaten ab. Wenn der Hamilton-Operator Ĥ nicht von der
Zeit abhängt, dann hängt die rechte Seite von Gl. (2.1) nur von Ortskoordinaten ab (auch der Impuls-Operator ist ein Operator der durch Ortskoordinaten definiert ist, was einen wichtigen Unterschied zur klassischen Mechanik
darstellt). Unter solchen Bedingungen getrennter Variablen bietet sich ein Separationsansatz für die Wellenfunktion an, der, wie der Name schon sagt, die
Variablen Zeit und Ort trennt und zwei voneinander unabhängige Funktionen einführt, von denen die eine nur von der Zeit, die andere nur von den
Ortskoordinaten der Teilchen abhängt, während ihr Produkt exakt die Zustandsfunktion liefert. Die Ableitung wird daher in Schema 2.2 vorgeführt.
2.1 Postulate
Schema 2.2 Separationsansatz für die Bewegungsgleichung: Zur Lösung der zeitabhängigen Schrödinger-Gleichung, Gl. (2.1), kann man als ersten Schritt die Zeit-Abhängigkeit
abtrennen, wenn der Hamilton-Operator nicht selbst von der Zeit abhängt.
Wir separieren Orts- und Zeitkoordinaten durch Trennung in einem Produktansatz für die Zustandsfunktion:
(2.8)
Ψ(r, t) = φ( t) ψ(r)
Der Einfachheit halber ist symbolisch nur ein Orstvektor r eingezeichnet, unabhängig davon, aus
wievielen Elementarteilchen das System, das von Ψ beschrieben wird, wirklich besteht. Diesen
Ansatz können wir nun in die Bewegungsgleichung, Gl. (2.1) einsetzen und erhalten
ih̄
∂
φ( t) ψ(r) = Ĥ φ( t) ψ(r)
∂t
(2.9)
In einer Übungsaufgabe zur Vorlesung wurde nun unter Ignorieren der Nullstellen der Funktionen durch den Produktansatz geteilt. Hier beschreiten wir einen eleganteren Weg, der ohne
diese Annahme auskommt. Dieser Weg beginnt mit zwei Schritten, der Multiplikation mit der
komplex-konjugierten Wellenfunktion, Ψ⋆ = φ⋆ ( t) ψ⋆ (r ), von links und der Integration über alle
Variablen auf beiden Seiten der Gleichung. Wegen der Operatoren, die immer nach rechts wirken,
ist es nötig, genau anzugeben, von welcher Seite — links oder rechts — man jede der beiden Seiten
einer Gleichung manipuliert, so dass die Gleichheit beider Seiten gewahrt bleibt. Wir schreiben
also nach Multiplikation mit φ⋆ ( t) ψ⋆ (r )· und Integration
ih̄
Z
dt
Z
dr φ⋆ ( t) ψ⋆ (r )
∂
φ ( t ) ψ (r) =
∂t
Z
dt
Z
dr φ⋆ ( t) ψ⋆ (r ) Ĥφ( t) ψ(r )
(2.10)
Die geschachtelten Integrationen darf man in Produkte aus Integralen trennen, weil die Variablen
nicht voneinander abhängen:
ih̄
Z
dr ψ⋆ (r ) ψ(r )
Z
dt φ⋆ ( t)
∂
φ(t) =
∂t
Z
dt φ⋆ ( t) φ( t)
Z
dr ψ⋆ (r ) Ĥψ(r )
(2.11)
Nun sortieren wir die Variablen indem wir durch die Integrale, die ja nichts anderes als Zahlen
sind, teilen
R
R
∂
φ(t)
dt φ⋆ ( t) ∂t
dr ψ⋆ (r ) Ĥψ(r )
R
=
≡E
(2.12)
ih̄ R
⋆
dt φ ( t) φ( t)
dr ψ⋆ (r ) ψ(r )
Man könnte hier einwenden, wie garantiert werden kann, dass die Zahlen endlich und nicht ‘unvernünftig’ sind. In einer formalen Einführung in die Quantenmechanik, die wir hier bewußt
nicht machen, sondern nur konzeptionell vorgehen, würde man dies garantieren durch Randbedingungen an die Wellenfunktion (vornehmlich dadurch, dass man fordert, dass eine Wellenfunktion natürlich normierbar sein muß, also ein endliches Integral besitzen muß).
Die Gleichungen, die wir nun erhalten haben, sagt aus, dass zwei Zahlen, berechnet aus je zwei
Quotienten zweier Integrale, einander gleich sein sollen. Diese Zahl haben wir oben als E eingeführt. Wir können also zwei separate Gleichungen formulieren
ih̄
Z
dt φ⋆ ( t)
∂
φ(t) = E
∂t
Z
dt φ⋆ ( t) φ( t) and
Z
dr ψ⋆ (r ) Ĥψ(r ) = E
Z
dr ψ⋆ (r ) ψ(r )
(2.13)
die sich nach Aufhebung der Integration und Rückgängigmachen der Multiplikation mit den
komplex-konjugierten Funktionen schreiben läßt als
ih̄
∂
φ( t) = Eφ( t) and Ĥψ(r ) = Eψ(r )
∂t
(2.14)
was uns die Energie-Eigenwertgleichung liefert. Die Separationskonstante E ist also die Energie.
Die zeitabhängige Differentialgleichung läßt sich leicht durch Variablenseparation integrieren,
wie wir es schon beim radioaktiven Zerfall vorgeführt haben. Dadurch läßt sich die Wellenfunktion schreiben als
Ψ(r, t) = e −iEt/h̄ ψ(r )
(2.15)
61
62
2 Einführung in die Quantenmechanik
2.1.4.1 Ortsmessung, Wahrscheinlichkeitsinterpretation und Normierung
Wenn wir den Aufenthaltsort eines Elementarteilchens, zum Beispiel eines
Elektrons, bestimmen möchten, dann müssen wir entsprechend des bisher Gesagten, den Ortsoperator auf den quantenmechanischen Zustand anwenden
und die Ortsmessung durch die Eigenfunktionen des Ortsoperators verstehen. Diese Eigenfunktionen sind allerdings recht ungewöhnlich, so dass wir
einen anderen Weg beschreiten, der völlig analog ist.
Diese alternative Darstellungsweise der Ortsmessung wurde von Born gegeben und heißt Bornsche Interpretation. Nach Born ergibt sich eine Aufenthaltswahrscheinlichkeitsverteilung eines Elementarteilchens aus seiner Zustandsfunktion, indem man mit der komplex-konjugierten Zustandsfunktion
multipliziert
ρ(r ) = Ψ⋆ (r )Ψ(r ) = |Ψ((r )|2
(2.16)
(ist die Zustandsfunktion reell-wertig, kann natürlich das Komplex-Konjugieren entfallen; da die Wellenfunktion im Prinzip komplex-wertig sein kann,
stellt man durch Komplex-Konjugieren lediglich sicher, dass die entstehende
Wahrscheinlichkeitsverteilung ρ reell-wertig ist; diese Art der Multiplikation
komplexer Funktionen läßt sich auch als Betragsquadrat schreiben, wie in der
Gleichung angegeben).
Die Aufenthaltswahrscheinlichkeitsverteilung ρ(r ) ist eine Dichteverteilung, weil sie eine Wahrscheinlichkeit pro Volumen√angibt (ergo ist auch die
Dimension der Wellenfunktion eines Teilchens [1/ Volumen]). Wenn ρ die
Verteilung eines Elektrons im Raum beschreibt, dann kann man sie mit Eigenschaften des Elektrons wichten und erhält so bei Multiplikation mit der
Ladung (−e) die Ladungsdichteverteilung und bei Multiplikations mit der
Masse me die Massenverteilung.
Weil ρ(r ) eine Dichteverteilung ist, also etwas pro Volumen angibt, kann
man aus ihr nicht direkt die Aufenthaltswahrscheinlichkeit am Ort r ablesen.
Stattdessen muß man ein Volumen definieren, in dem man die Wahrscheinlichkeit angeben möchte. Um der Wahrscheinlichkeit an einem Ort möglichst
nahe zu kommen, wählt man vernünftigerweise ein infinitesimal kleines Volumen um diesen Punkt, das wir schreiben wollen als dx dy dz ≡ d3 r. Die
Wahrscheinlichkeit ist dann einfach gegeben als ρ(r )d3 r. Wenn wir das Volumen nun immer größer machen, bis der gesamte Raum umschlossen ist, dann
würden wir fordern, das Teilchen mit Gewissheit zu finden. Die Wahrscheinlichkeit muß dann gleich Eins sein. Nun können wir aber nicht einfach ρ(r )
mit dem Volumen des gesamten Raums multiplizieren, weil ρ eine Funktion
des Ortes r ist und sich eben mit dem Ort verändert. Aber genau für eine solche Situation ist das Riemannsche Integral erfunden worden: Wir können den
gesamten Raum zerlegen in unendlich viele kleine Würfel d3 r, deren Wahr-
2.1 Postulate
scheinlichkeiten wir aufsummieren, d.h. aufintegrieren,
Z +∞
−∞
!
d3 r ρ ( r ) = 1
(2.17)
Um die Gleichung nicht unnötig kompliziert zu schreiben, begnügen wir uns
mit einerm Integrationssymbol statt mit dreien für die drei Raumrichtungen.
Das Ausrufungszeichen bedeutet, dass wir aus physikalischen Gründen fordern, dass die Wahrscheinlichkeit, das Teilchen irgendwo zu finden, gleich
Eins sein muss. Wenn wir die Aufenthaltswahrscheinlichkeit W in einem endlich großen Volumen V = ( x2 − x1 )(y2 − y1 )(z2 − z1 ) wissen wollen, müssen
wir lediglich über dieses Volumen integrieren,
W=
Z x 2 Z y 2 Z z2
x1
y1
z1
d3 r ρ ( r )
(2.18)
Aus Gl. (2.17) folgt mit der Definition von ρ in Gl. (2.16) sofort für das Betragsquadrat der Wellenfunktion
Z +∞
−∞
d3 r Ψ ⋆ ( r ) Ψ ( r ) = 1
(2.19)
Bisher haben wir eine solche Forderung nicht an die quantenmechanische Zustandsfunktion gestellt. Um die obige Gleichung zu erfüllen, muß man die
Zustandsfunktion mit einem sogenannten Normierungsfaktor N multiplizieren,
(2.20)
Ψ −→ N Ψ
Diese Multiplikation ist erlaubt, weil sie die Physik des Systems nicht ändert,
wie man sowohl an der Bewegungsgleichung, Gl. (2.1), als auch an der Eigenwertgleichung, Gl. (2.26), sehen kann. Beide Gleichung ändern sich nicht,
wenn man jeweils beide Seiten der Gleichung mit einer Zahl multipliziert.
Dies entspricht einfach der Einführung einer neuen, mit N skalierten Zustandsfunktion Ψ̃ ≡ N Ψ. Weder das dynamische Verhalten des Zustands
noch die Eigenwertspektren werden dadurch verändert.
Wir benötigen nun noch eine Vorschrift, die es uns erlaubt, den Normierungsfaktor N so zu bestimmen, dass Gl. (2.19) erfüllt werden kann. Wir
schreiben dafür
Z +∞
−∞
d3 r Ψ̃⋆ (r )Ψ̃(r )
=⇒ N
= N2
= +
Z +∞
s
−∞
d3 r Ψ ⋆ ( r ) Ψ ( r ) = 1
1
R +∞
−∞
d3 r Ψ ⋆ ( r ) Ψ ( r )
(2.21)
63
64
2 Einführung in die Quantenmechanik
wobei wir das Vorzeichen der Wurzel willkürlich auf (+) festlegen. Dies ist
reine Konvention.
Um die Diskussion der Aufenthaltswahrscheinlichkeit und Normierung abzuschliessen, müssen wir uns noch mit einer Verallgemeinerung der bisherigen Gleichungen beschäftigen. Eine Aufenthaltswahrscheinlichkeitsdichte ρ
hängt offensichtlich nur von einem Ort ab, ρ = ρ(r ). Die Wellenfunktion hängt
dagegen von allen Koordinaten der Elementarteilchen ab. Das Betragsquadrat
einer Wellenfunktion für ein System mit mehr als einem Elementarteilchen ist
dann natürlich nicht mehr gleich der Aufenthaltswahrscheinlichkeitsdichte,
weil schon die Variablenabhängigkeiten inkompatibel sind:
|Ψ(r1 , r 2 , . . . , r N )|2
inkompatibel
←→
(2.22)
ρ (r )
Entsprechend der Bornschen Interpretation errechnet sich aus dem Betragsquadrat eine Wahrscheinlichkeit W, Elementarteilchen 1 in Volumne d3 r1 , Elementarteilchen 2 in Volumne d3 r2 , und so weiter zu finden, durch Multiplikation mit diesen infinitesimal kleinen Volumina,
W = |Ψ(r1 , r 2 , . . . , r N )|2 d3 r1 d3 r2 · · · d3 r N
(2.23)
In der Regel wird uns eine solche Wahrscheinlichkeit nicht interessieren. Wir
sind eher daran interessiert zu fragen, was der Anteil an Elementarteilchen in
einem vorgegebenen Raum d3 r ist, wobei die Elementarteilchen in ihren physikalischen Eigenschaften (Ladung, Masse) ununterscheidbar sind. In einem
System gleicher Elementarteilchen, einer Ansammlung Elektronen beispielsweise, sind die einzelnen Elektronen daher nicht unterscheidbar. Daher integrieren wir N − 1 beliebige elektronische Variablen aus und erhalten so eine
Aufenthaltswahrscheinlichkeitsdichte für unser System aus N Elementarteilchen,
ρ (r1 ) ≡ N
Z +∞
−∞
d3 r 2 · · ·
Z +∞
−∞
d3 r N |Ψ(r1 , r 2 , . . . , r N )|2
(2.24)
wobei wir willkürlich die Koordinaten des ersten Elektrons ausgewählt haben, über die wir nicht integriert haben (wir hätten wegen der Ununterscheidbarkeit auch jede andere elektronische Koordinate wählen können). Man beachte auch, dass diese Elektronenverteilungsdichte ρ eine Funktion des Ortes — aber nicht des Ortes eines bestimmten Elektrons — ist. Aus all diesen
Gründen sollte man bei der Angabe der funktionalen Abhängigkeiten, dem
Ort keinen weiteren Index geben ρ(r1 ) → ρ(r ).
Wenn wir nun noch diese letzte Koordinate über den gesamten Raum ausintegrieren, müssen wir wieder die Zahl der Teilchen finden
Z +∞
−∞
d3 r 1 ρ ( r 1 ) = N
Z +∞
|
−∞
d3 r 1 . . .
Z +∞
−∞
d3 r N |Ψ(r 1 , r 2 , . . . , r N )|2 = N (2.25)
{z
}
≡1
2.1 Postulate
weshalb wir oben explizit die Teilchenzahl N in die Definition eingeführt haben. All diese Verallgemeinerungen sind kompatibel mit dem eingangs besprochenen Fall von nur einem Teilchen, N = 1, bei dem natürlich sämtliche
Integrationen über d3 r2 und weitere Variablen wegfallen, weil es sie einfach
nicht gibt. Ferner gibt es eine enge Beziehung mit der Normierungsbedingung
für eine Wellenfunktion für ein System mit mehr als einem Teilchen, wie in der
vorstehenden Gleichung durch die geschweifte Klammer angedeutet wurde.
2.1.4.2 Erwartungswerte
Erwartungswerte: Der Mittelwert Ā (oft auch h Ai geschrieben) vieler Messungen einer Observablen A an identisch
präparierten Systemen wird auch Erwartungswert genannt
und berechnet sich nach
R
R
⋆
3
3
rR 1 · · · Rr N Φ ÂΦ d r1 · · · d r N
(2.26)
Ā =
⋆
3
3
r · · · r Φ Φ d r1 · · · d r N
1
N
Die Integrationen sind über den gesamten Variablenbereich (also den gesamten Raum) druchzuführen. Wenn der quantenmechanische Zustand Φ
normiert ist, so entfällt die Division, weil das Integral im Nenner dann gleich
Eins ist. Bewußt wurde hier die Zustandsfunktion Ψ, die Eigenfunktion des
Hamilton-Operators sei, durch eine allgemeine Funktion Φ ersetzt, da wir vor
einer Messung keine Annahme über den Zustand eines Systems machen können (erst nach der Messung liegt der Zustand als Eigenfunktion zu einem vor
der Messung nicht festliegenden Eigenwert der beobachteten Größe vor). Der
Zustand Φ kann geschrieben werden als Superposition der Eigenzustände der
Observablen. Die Integration über die Variablen, von denen der quantenmechanische Zustand abhängt, ist notwendig, da ein Mittelwert eine Zahl und
selbst keine Funktion ist. Wir müssen hier also ein Mittel finden, dass es uns
erlaubt, die funkionelle Abhängigkeit zu eliminieren, und das ist genau die
Integration über diese Variablen.
Das Komplex-Konjugieren der Funktion Φ links vom Operator  ist notwendig, damit garantiert werden kann, dass alle Mittelwerte reelle Zahlen
sind. Im Prinzip ist eine quantenmechanische Zustandsfunktion komplexwertig (vgl. den imaginären Phasenfaktor der bei der Abseparation der Zeitabhängigkeit entstand). Komplexe Zahlen können aber keine Meßwerte sein.
Um garantiert stets reelle Zahlen als Mittelwerte zu erhalten, muß man eine
komplexe Funktion mit ihrer komplex-konjugierten Funktion multiplizieren.
Auf diese Weise wird garantiert, dass die Zahl, die das Ergebnis der Integration ist, nicht komplex-wertig, sondern reell ist, also Ā ∈ R. Wer nun etwas weiter überlegt, wird fragen, wie wir denn garantieren können, dass überhaupt
die Eigenwerte stets reelle Zahlen sind, denn offensichtlich multiplizieren wir
65
66
2 Einführung in die Quantenmechanik
in den Eigenwertgleichungen oben nicht mit der komplex-konjugierten Eigenfunktion. Man kann zeigen, dass die Operatoren, die den physikalischen
Observablen zugeordnet werden, eine besondere mathematische Eigenschaft,
die Hermitizität, besitzen, die garantiert, dass ihre Eigenwerte stets reelle Zahlen sind. Es würde in dieser Einführung aber zu weit führen, tiefer in die mathematischen Grundlagen des quantenmechanischen Formelapparats vorzudringen.
Eine Frage stellt sich nun aber doch noch: wie kommt man auf einen auf
den ersten Blick so ungewohnt aussehenden Ausdruck für den Mittelwert?
Zunächst stellen wir fest, dass wir den Eigenwert Ai erhalten wenn Φ in allen
Messungen stets der Eigenzustand Ψi des Operators  war,
R
R
⋆
3
3
Φ→Ψi
rR 1 · · · Rr N Ψi ÂΨi d r1 · · · d r N
Ā
=
⋆
3
3
r · · · r Ψ i Ψ i d r1 · · · d r N
1
(2.26)
=
=
R
N
R
⋆
3
3
rR1 · · · rRN Ψi Ai Ψi d r1 · · · d r N
⋆
3
3
r 1 · · · r N Ψ i Ψ i d r1 · · · d r N
R
R
· · · r N Ψ⋆i Ψi d3 r1 · · · d3 r N
r
1
R
Ai R
= Ai
⋆
3
3
r 1 · · · r N Ψ i Ψ i d r1 · · · d r N
|
{z
}
(2.27)
=1
Die Definition des Erwartungswert ist in dieser Hinsicht also konsistent mit
Postulat 3, das besagt, dass man stets den Eigenwert zur Eigenfunktion messen wird, wenn das System sich in diesem Eigenzustand befindet. Wenn  ein
Operator ist, der keine Ableitungsoperatoren wie den Nabla-Operator oder
den Laplace-Operator enthält, also bestenfalls von den Ortsoperatoren abhängt, ein sogenannter multiplikativer Operator ist, der nur an die Zustandsfunktion anmultipliziert wird, dann können wir die Kommutativität reeller
Zahlen und die Defintion der Wahrscheinlichkeitsverteilung ausnutzen
Z
r1
···
Z
rN
Φ⋆ ÂΦ d3 r1 · · · d3 r N
=
(2.24)
=
Z
Z
r1
r1
···
Z
rN
ÂΦ⋆ Φ d3 r1 · · · d3 r N
Âρ(r 1 )d3 r1
(2.28)
für einen normierten Zustand Φ. Im Falle eines multiplikativen Operators
hängt also der Mittelwert der Meßergebnisse von der Wahrscheinlichkeitsdichteverteilung ρ ab. Dies läßt sich verallgemeinern auf nicht-multiplikative
Operatoren, erfordert aber dann die Einführung von Dichtematrizen, was hier
zu weit führen würde.
2.1 Postulate
2.1.5
Postulat 4: Kommutatorbeziehungen
Das vorletzte Postulat implementiert die Heisenbergsche Unschärferelation in
die Grundmauern der Quantenmechanik. Diese besagt, dass es uns prinzipiell
nicht möglich sein wird, bestimmte Observablen beliebig genau gleichzeitig zu
messen. Weil Meßgenauigkeit in der Theorie durch ein eigenes Operatorkonstrukt definiert werden müßte, fordern wir eine Form des Unbestimmtheitsprinzips, das die ‘elementaren’ Operatoren für Ort und Impuls direkt verwendet.
Wie bereits erläutert bedeutet die Anwendung eines Operators  auf die
Zustandsfunktion Ψ die Messung dieser Observablen. Wenn wir danach eine andere Observable B messen wollen, wenden wir den Operator B̂ auf das
Ergebnis der ersten Messung also auf [ ÂΨ] an. Das Ergebnis ist B̂ ÂΨ. Wenn
dieser elementare Prozeß des Messens von zwei Observablen in der Quantenmechanik stets unabhängig voneinander sein soll, dann muß der umgekehrte
Prozeß — also die Messung von B vor A, Â B̂Ψ — dasselbe Ergebnis liefern.
Wenn wir die Meßergebnisse beider Messungen voneinander abziehen, sollte
Null das Ergebnis sein:
B̂ ÂΨ − Â B̂Ψ = B̂ Â − Â B̂ Ψ = 0
(2.29)
Diese Beziehung läßt sich auch nur als Operatorgleichung schreiben für zwei
Operatoren, die unabhängig voneinander meßbare Observablen repräsentieren,
B̂ Â − Â B̂ = 0
=⇒
B̂ Â = Â B̂
(2.30)
Die Frage nach der unabhängigen Meßbarkeit reduziert sich also auf die Frage, ob die beiden Operatoren kommutieren, weswegen der zusammengesetzte
Operator auf der linken Seite Kommutator genannt und durch ein eigenes Symbol abgekürzt,
B̂, Â ≡ B̂ Â − Â B̂
(2.31)
Wenn der Kommutator also verschwindet, werden die beiden Observablen
unabhängig voneinander meßbar sein. Umgekehrt kann die Unschärferelation nur greifen, wenn genau dies nicht gilt. Folglich müssen wir für zwei Observablen Ĉ und D̂, die nicht unabhängig voneinander meßbar sind, fordern,
dass ihr Kommutator nicht gleich Null ist,
Ĉ, D̂ 6= 0
(2.32)
67
68
2 Einführung in die Quantenmechanik
Postulat 4: Die Komponenten der Orts- und Impulsoperatoren erfüllen folgende Kommutatorbeziehungen:
p̂i r̂ j − r̂ j p̂i = 0
∀i 6 = j
(2.33)
und
p̂i r̂ j − r̂ j p̂i = −ih̄
∀i = j
(2.34)
wobei i, j ∈ { x, y, z}, also die Komponenten der vektoriellen Operatoren bezeichnen.
Dieses Postulat läßt sich elegant in einer Gleichung schreiben,
p̂i , r̂ j = −ih̄ δij
(2.35)
(mit i, j ∈ { x, y, z}) wenn wir das sogenannte Kronecker-Delta definieren
wenn i 6= j
wenn i = j
(2.36)
Ferner gilt offensichtlich
r̂i , p̂ j = − p̂i , r̂ j = ih̄ δij
(2.37)
δij =
0 ,
1 ,
Abschließend muß noch betont werden, dass auch im Zusammenhang mit
der Heisenbergschen Unschärferelation auf eine genaue Formulierung geachtet werden muß. Oft wird zu salopp gesagt, dass die Heisenbergsche Unschärferelation besagt, dass man Ort und Impuls nicht beliebig genau messen kann
(gelegentlich wird sogar der Zusatz ‘beliebig genau’ weggelassen, was eine
völlig unsinnige Aussage ergibt). Das ist falsch, weil man sehr wohl den Ort in
einer Richtung und den Impuls in eine andere Richtung beliebig genau messen können wird, weil diese Messungen voneinander unabhängig sind. Erst
wenn man diese beiden Größen versucht in ein und derselben Richtung beliebig
genau zu messen, wird dies nicht möglich sein, weil die Messung beider Größen in derselben Richtung per Postulat nicht unabhängig voneinander sein
kann.
Die Forderung, dass manche Operatoren nicht kommutieren dürfen, bedeutet natürlich eine starke Forderung an die explizite Form der Operatoren. Reelle Zahlen kommutieren. Daher werden auch Funktionen reeller Zahlen, wie
zum Beispiel die Komponenten des Ortsoperators, kommutieren. Um die postulierten Kommutatorbeziehungen zu erfüllen muß wenigstens einer der beiden Operatoren ein Differentialoperator sein, so dass Kraft der Produktregel
nicht verschwindende Terme entstehen können. Ferner muß es sich um partielle Differentialoperatoren handeln, damit eine Ableitung in x-Richtung den
2.2 Quantenmechanische Drehbewegung und Spin
Ortsoperator in x-Richtung betrifft, während die anderen Richtungen und daher die anderen Komponenten des Ortsoperators Konstanten bezüglich der
Differentiation nach x sind. Im Zusammenhang mit Postulat 2 haben wir die
explizite Form der Orts- und Impulsoperatoren bereits eingeführt. Man kann
nun leicht verifizieren, dass ihre Komponenten tatsächlich die hier geforderten Kommutator-Relationen erfüllen.
Es sei nochmals erwähnt, dass man diese Wahl der Orts- und Impulsoperatoren Ortsdarstellung nennt. Eine völlig äquivalente Darstellung der Operatoren entsteht, wenn die Impulsoperatorkomponenten multiplikativ gewählt
werden, während dann die Ortsoperatorkomponenten partielle Ableitungen
nach den Impulsvariablen sein müssen. Diese Darstellung nennt man Impulsdarstellung, sie spielt aber in der Molekülchemie eine eher untergeordnete Rolle und soll daher hier nicht weiter verfolgt werden.
2.2
Quantenmechanische Drehbewegung und Spin
2.2.1
Drehimpulse in der Quantenmechanik
Dem Korrespondenzprinzip folgend führen wir einen Operator für den Drehimpuls analog der Form des klassischen Ausdrucks ein
l =r×p
K.p.
−→
l̂ = r̂ × p̂
(2.38)
Da wir explizite Ausdrücke für die Operatoren von Ort und Impuls, r̂ und
p̂, bereits kennen, können wir durch Auswerten des Vektorprodukts l̂ komponentenweise berechnen. Soweit soll unsere Diskussion aber nicht gehen.
Vielmehr sollen uns nur die zugehörigen Eigenwertgleichungen interessieren. Wenn man das Kommutationsverhalten der Komponenten lˆx , lˆy und lˆz
untersucht, so stellt man fest, dass Eigenfunktionen einer dieser Komponente
nicht Eigenfunktionen der anderen sind. Daher kann man für Drehimpulse
nur zwei Eigenwertgleichungen mit gemeinsamen Eigenfunktionen formulieren, eine für eine der Komponenten — und wir wählen willkürlich die zKomponente, zumal wir das Koordinatensystem stets beliebig drehen können
—,
lˆz Ylm = m h̄ Ylm
(2.39)
sowie eine für das skalare Drehimpulsoperatorquadrat
2
l̂ Ylm = l (l + 1) h̄2 Ylm
(2.40)
69
70
2 Einführung in die Quantenmechanik
Ein solches Paar von Eigenwertgleichungen mit gemeinsamer Eigenfunktion
läßt sich für jeden quantenmechanischen Drehimpulsoperator schreiben. Die
Zahlen m und l sind ganzzahlig (oder unter bestimmten Bedingungen auch
halbzahlig) und werden magnetische Quantenzahl beziehungsweise Drehimpulsquantenzahl genannt. Während für eine Bahndrehimpulsquantenzahl gilt
l ∈ N0 , also l = 0, 1, 2, 3, . . . , hängt m von l ab, nämlich stets als m =
−l, −l + 1, −l + 2, . . . , +l. Da eine Eigenfunktion in zwei Eigenwertgleichungen zu den zwei Quantenzahlen m und l auftritt, wurden beide Quantenzahlen als Index verwendet, um die Eigenfunktionen voneinander zu unterscheiden. Zu einem gegebenen Wert von l kann man offensichtlich (2l + 1) ver2
schiedene m-Werte erhalten, die aber alle denselben Eigenwert von l̂ besitzen, nämlich l (l + 1) h̄2 . Man sagt, dass dieser Eigenwert daher (2l + 1)-fach
entartet ist. Die Entartung gibt an, wieviele Eigenfunktionen zum gleichen Eigenwert gefunden werden können.
Die explizite Form der Ylm folgt aus der Lösung der Eigenwertgleichungen,
für die man die Drehimpulsoperatoren explizit entsprechend dem Korrespondenzprinzip berechnen muß. Weil dabei die Komponenten des Impulsoperators verwendet werden, entstehen notwendigerweise Differentialgleichungen, deren Lösungsfunktionen die Ylm sind. Sie werden Kugelflächenfunktionen
genannt. Ihre explizite Form ist aber nicht weiter wichtig. Wir müssen lediglich wissen, dass sie obige Eigenwertgleichungen erfüllen, wenn wir das Wasserstoffatom studieren wollen, bei dem sich ein Elektron um ein Proton dreht.
2.2.2
Der Stern-Gerlach-Versuch
An der Lösung der Schrödinger-Gleichung für das Wasserstoffatom wird man
sehen (s.u.), dass ein solches Atom im Grundzustand der Energie keinen Drehimpuls besitzt: Weil die Drehimpulsquantenzahl l = 0, verschwindet auch
der Drehimpuls l (l + 1) h̄2 = 0. Dementsprechend kann kein magnetisches
Moment erzeugt werden, dass mit einem externen magnetischen Feld wechselwirken könnte.
Diese Annahme kann man versuchen zu bestätigen, indem man einen
Strahl von Wasserstoffatomen präpariert und in ein Magnetfeld einstrahlt.
Entsprechend unseren bisherigen Betrachtungen müßte der Strahl unverändert das Feld passieren. Das wird allerdings nicht beobachtet. Tatsächlich hat
das Magnetfeld einen Einfluß, der den Strahl in zwei Teile aufspaltet. Am
Detektor sehen wir nicht einen Fleck, sondern zwei.
Dementsprechend müssen die Wasserstoffatome doch ein magnetisches
Moment besitzen, dass mit dem Magnetfeld wechselwirkt. Dieses magnetische Moment kann aber nicht von der Rotationsbewegung des Elektrons
stammen, weil wir schon gesehen haben, dass das Elektron im Grundzustand
2.2 Quantenmechanische Drehbewegung und Spin
des Wasserstoffatoms keinen Bahndrehimpuls besitzt. Mangels Alternative
schlugen Goudsmit und Uhlenbeck vor, dass Elektronen einen weiteren Drehimpuls besitzen, den man klassisch nicht erklären kann. Dieser quantenmechanische Drehimpuls wird Spin genannt.
Das gerade beschriebene Experiment wurde Ende der 1920er Jahre mit einem Wasserstoffatomstrahl durchgeführt. Zu der Zeit war der Spin als in der
klassischen Welt nicht vorkommende Observable bereits vorgeschlagen und
akzeptiert. Der Vorschlag des Spins von Goudsmit und Uhlenbeck ging auf
ein Experiment von Stern und Gerlach von 1924 zurück, die einen Strahl von
Silberatomen verwendeten. Silberatome eignen sich für das Experiment besonders, weil man sie beim Auftreffen auf einen Schirm durch die mit dem
bloßen Auge sichtbare Schwärzung direkt sehen kann. Sie haben aber auch
den Nachteil, dass jedes Silberatom aus sehr vielen Elektronen besteht, die
Theorie von Vielelektronensystemen an dieser Stelle jedoch noch gar nicht
entwickelt ist. Es ist a priori gar nicht klar, warum sich die 47 Elektronen in
einem Silberatom im Magnetfeld genau so verhalten sollten wie ein einzelnes Elektron im Wasserstoffatom. Erst die Theorie von Vielelektronensystemen kann zeigen, dass sich die Spins der Elektronen im Silberatom paarweise
zu einem Spin von Null koppeln lassen, so dass der Gesamtspin eines Silberatoms durch ein ungepaartes Elektron bestimmt wird.
2.2.3
Spin als quantenmechanischer Drehimpuls
Die im Stern–Gerlach-Versuch gemachten Beobachtungen kann man quantenmechanisch durch einen Drehimpuls beschreiben, der Eigenschaft einiger Elementarteilchen ist und in der klassischen Physik so nicht vorkommt. Es handelt sich um einen Eigendrehimpuls, der Spin genannt wird. Man kann sich
diesen Eigendrehimpuls allerdings nicht als eine Drehung des Teilchens um
sich selbst im klassisch-physikalischen Sinne vorstellen.
Wichtig ist nur, dass Spin als beobachtbare Eigenschaft eines Teilchens einen
zugeordneten Operator ŝ besitzt, der Vektorcharakter hat — also drei Komponenten ŝ x , ŝy und ŝz besitzt — und die Eigenwertgleichungen eines quantenmechanischen Drehimpulses erfüllt, die wir schreiben wollen als
ŝ2 σsms
= s(s + 1) h̄2 σsms
(2.41)
ŝz σsms
= ms h̄ σsms
(2.42)
wobei σsms die gemeinsame Eigenfunktion ist mit den Spinquantenzahlen s
und ms als Indices. Während s je nach Elementarteilchen ganz- oder halbzahlig sein kann, gilt für ms jedoch stets ms = −s, −s + 1, . . . , +s.
Für Elektronen gilt s = 1/2 und daher ms = −1/2, +1/2. Die beiden Spinzustände zu den ms -Quantenzahlen werden β-Spin beziehungsweise α-Spin
71
72
2 Einführung in die Quantenmechanik
genannt. Elementarteilchen mit halbzahligen Spinquantenzahlen s heißen Fermionen, während diejenigen mit ganzzahligem Spin Bosonen genannt werden.
2.3
Einfache quantenmechanische Modellsysteme
2.3.1
Das Teilchen im Kasten
Das Modellproblem des Teilchens im Kasten wird zeigen, wie in der Quantenmechanik die Quantelung einer Observablen, hier der Energie, entstehen
kann. Die quantenmechanische Beschreibung der Bewegung eines freien Teilchens zeitigt Energieeigenwerte, die kontinuierlich sind. Ein freies Teilchen
kann also jede beliebige kinetische Energie annehmen. Um eine Quantelung
der Energie beobachten zu können, müssen wir die Bewegung des Teilchens
einschränken. Dies kann durch Einführung eines Operators für die potentielle
Energie in den Hamilton-Operator erfolgen. Das einfachste Potential, das die
Bewegung in einer Richtung x einschränkt, ist das von zwei Wänden. Eine
Bewegung in die beiden anderen Raumrichtungen lassen wir der Einfachheit
halber nicht zu.
Die Energieeigenwertgleichung, die diese Situation beschreibt, lautet dann
"
#
h̄2 d2
−
+ V̂ ( x ) Ψn ( x ) = En Ψn ( x )
(2.43)
2m dx2
mit
V̂ ( x ) =
0
+∞
für
sonst
0≤x≤L
(2.44)
so dass unendlich hohe (Potential-)Wände bei x=0 und x=L hochgezogen werden. Innerhalb des Kastens, wenn 0 ≤ x ≤ L, vereinfacht sich die Differentialgleichung zu
−
h̄2 d2
Ψ n ( x ) = En Ψ n ( x )
2m dx2
(2.45)
wobei wir nur noch fordern müssen, dass die Wellenfunktion nicht in der unendlich hohen Wand “leben”, beziehungsweise sich das Teilchen dort nicht
aufenthalten kann. Die Wellenfunktion muß daher Null werden, sobald die
Potentialwand beginnt, also Ψn (0) = Ψn ( L) = 0. Die obige Eigenwertgleichung ist vom Typ einer homogenen Differentialgleichung zweiter Ordnung
2mEn
d2
Ψn ( x ) = − 2 Ψn ( x )
dx2
h̄
(2.46)
2.3 Einfache quantenmechanische Modellsysteme
deren Lösungen bekannt sind (s. Anhang) und stets geschrieben werden können als
s
s
!
!
2mEn
2mEn
Ψn ( x ) = A sin
x + B cos
x
(2.47)
h̄2
h̄2
wobei A und B die beiden Integrationskonstanten sind. Wenn wir nun die
beiden Randbedingungen an die Wellenfunktion auswerten, zeigt sich, dass
B = 0 sein muß, weil
!
Ψn (0) = A sin (0) + B cos (0) = 0
| {z }
| {z }
=0
(2.48)
=1
Dann erhalten wir für die zweite Randbedingung
s
!
2mEn
!
L =0
Ψn ( L) = A sin
h̄2
(2.49)
Diese Gleichung kann nur erfüllt werden, wenn das Argument der SinusFunktion ein ganzzahliges Vielfaches von π ist,
s
2mEn
L = n π ∀n ∈ N0
(2.50)
h̄2
Für n = 0 erhalten wir aber Ψn ( x )=A=constant, was einer physikalisch nicht
relevanten Lösung entspricht. Daher gilt für den Index n, der die Eigenzustände eines Teilchens in einem eindimensionalen Potentialkasten zählt:
n ∈ N.
Aus Gl. (2.50), die einzig und allein aus der Randbedingung des Operators
der potentiellen Energie an die Wellenfunktion folgt, erhalten wir bereits die
Energieeigenwerte,
2mEn
h̄2
L2 = n2 π 2
⇒
En =
n2 π 2 h̄2
n2 h 2
=
2mL2
8mL2
(2.51)
die sich als gequantelt herausstellen: Nicht jeder Energiewert ist erlaubt.
2.3.2
Der harmonische Oszillator
Das nächst komplexere Modellproblem ist eine eindimensionale Schwingung,
wie wir sie schon in Abschnitt 1.1.6 in der klassischen Physik kennengelernt
haben. Dieses Modellproblem ist zentral für die quantenmechanische Deutung molekularer Schwingungen. Wir nehmen wiederum an, dass die Auslenkungskraft proportional zur Auslenkung x, also harmonisch ist (wobei der
73
74
2 Einführung in die Quantenmechanik
Gleichgewichtsabstand als Ursprung gewählt wurde, so dass x direkt die Auslenkung mißt). Aus dem Korrespondenzprinzip erhalten wir dann direkt den
Operator für die potentielle Energie aus der klassischen potentiellen Energie
dieses harmonischen Oszillators,
V (x) =
1 2
kx
2
K.p.
−→
V̂ ( x ) =
1 2
kx
2
(2.52)
Damit lautet die Schrödinger-Gleichung für dieses eindimensionale Problem
#
"
1 2
h̄2 d2
(2.53)
+ kx Ψn ( x ) = En Ψn ( x )
−
2m dx2
2
Die Lösung dieser Differentialgleichung ist nicht ganz einfach. Man erhält als
Eigenwert
1
En = hν n +
∀n ∈ N0
(2.54)
2
Die Energien des quantenmechanischen Oszillators sind also gequantelt mit
der Schwingungsquantenzahl n. Die Schwingungsfrequenz ν berechnet sich
aus den Materialkonstanten, nämlich aus der Masse des schwingenden Teilchens und der Kraftkonstante des Federpotentials,
r
k
1
(2.55)
ν=
2π m
2.3.3
Das Wasserstoff-Atom
Wir wenden uns nun der quantenmechanischen Behandlung des WasserstoffAtoms zu. Bei der Diskussion der Schlüsselexperimente in Kapitel 1 haben
wir die Fraunhoferschen Linien kennengelernt, die den Energiedifferenzen
zwischen zwei elektronischen Zuständen im Wasserstoff-Atom entsprechen.
Bohr versuchte diesen Sachverhalt in seinem Modell abzubilden, verwendete dazu aber ad hoc Annahmen, die zwar die Fraunhoferschen Linien schließlich erklären, aber ansonsten zu Widersprüchen innerhalb des Modells führen.
Die Quantenmechanik muß dieses Problem nun lösen können. Weil wir an
Energiedifferenzen interessiert sind, muß die Quantenmechanik als Eigenwerte dieselben Energien liefern, die Bohr als Energien der Bahnen festen Radius
ableitete, aber ohne irgenwelche zusätzlichen Annahmen zu machen (außer
den allgemeingültigen Postulaten der Quantenmechanik).
Daher starten wir mit der Energie-Eigenwertgleichung, in der wir für den
Hamilton-Operator des Wasserstoff-Atoms, der die kinetische Energie von
2.3 Einfache quantenmechanische Modellsysteme
Proton p und Elektron e, sowie deren potentielle Energie umfaßt, zu beschreiben haben:
ĤH−Atom = −
h̄2
e2
h̄2
1
∆p −
∆e −
2m p
2me
4πǫ0 |r e − r p |
(2.56)
h̄2
e2
1
∆e −
2me
4πǫ0 |r e − r p |
(2.57)
h̄2
1 Ze2
∆e −
2me
4πǫ0 r
(2.58)
Offensichtlich hängt dieser Operator dann aber bereits von sechs Koordinaten ab, ( xe , ye , ze ) und ( x p , y p , z p ), während wir bisher nur SchrödingerGleichungen behandelt haben, die von nur einer Koordinate, x, abhingen. Um
das Problem zu vereinfachen, nutzen wir die Tatsache aus, dass ein Proton fast
2000 mal schwerer ist als ein Elektron. Wenn wir die Protonenmasse unendlich groß wählen, verschwindet der Operator für die kinetische Energie des
Protons wegen limm p →∞ (1/m p ) = 0, so dass der Hamilton-Operator sich vereinfacht zu
ĤH−Atom = −
Nun haben wir drei Protonenkoordinaten in dem kinetischen Energieoperator
eliminiert, allerdings verbleiben sie noch in der Coulomb-Wechselwirkung.
Diese können wir aber leicht löschen, indem wir einfach den Ort des sich nicht
mehr bewegenden Protons (m p = ∞) als Koordinatenursprung wählen, r p →
0. Dann definieren wir den Abstand des Elektrons vom Ursprung als r ≡ |r e −
0| = |r e | und erhalten
ĤH−Atom = −
Man beachte, dass wir hier die Kernladungszahl Z explizit ausgeschrieben
haben, weil dann alles im folgenden Gesagte nicht nur für das WasserstoffAtom, sondern für alle wasserstoffähnlichen Atome gilt, also für alle Atome
mit nur einem Elektron, wie zum Beispiel He+ oder Hg79+ .
Die Näherung der unendlich großen Masse ist eine spezielle Form der sogenannten Born–Oppenheimer-Näherung, die wir im Kapitel 3 genauer ansehen
werden. Man muß diese Näherung allerdings nicht machen, weil man drei
Koordinaten rigoros abtrennen kann durch eine Koordinatentransformation,
die die Translation des Massenschwerpunkts von der internen Bewegung des
Elektrons relativ zum Proton abtrennt. Bei dieser Koordinatentransformation,
die neue Schwerpunktskoordinaten und Relativkoordinaten einführt, entsteht
der Abstand zwischen Proton und Elektron, der für den Coulomb-Operator
benötigt wird, in natürlicher Art und Weise. Man erhält dann fast denselben
Hamilton-Operator wie im Rahmen der Born–Oppenheimer-Näherung, ohne aber eine Näherung eingeführt zu haben. Der einzige Unterschied ist die
Masse: Statt der Elektronenmasse me entsteht die reduzierte Masse µ,
me m p
me
µ=
= me
offensichtlich gilt lim µ = lim
m p →∞
m p → ∞ m e /m p + 1
me + m p
75
76
2 Einführung in die Quantenmechanik
(2.59)
so dass der exakte Hamilton-Operator lautet
ĤH−Atom = −
1 Ze2
h̄2
∆e −
2µ
4πǫ0 r
(2.60)
Wir können also mit dem Operator in Born–Oppenheimer-Näherung fortfahren, weil wir die exakte Lösung des Wasserstoff-atoms stets erhalten, wenn
wir statt me µ schreiben.
Bevor wir uns nun die Eigenwertgleichung für diesen Operator ansehen,
sollten wir noch in ein dem Problem angepaßtes Koordinatensystem wechseln. Wir beschreiben die Bewegung eines Teilchens (des Elektrons) um ein
ruhendes Teilchen (das Proton), mit dem es wechselwirkt. Es handelt sich also
um ein Zentralfeldproblem von der Art, wie wir es schon in Abschnitt 1.1.4.7
kennengelernt haben. Daher bietet sich eine Transformation von kartesischen
zu sphärischen Koordinaten an: ( x, y, z) → (r, ϑ, ϕ). Tatsächlich verwenden
wir bereits problemangepaßte Koordinaten für den Coulomb-Operator, dadurch dass wir den (radialen) Abstand r von Elektron und Proton einführten.
Für diesen Wechselwirkungsoperator ist die Orientierung von Elektron und
Proton zueinander nicht wichtig und daher spielen die Winkel ϑ und ϕ keine
Rolle. Dies ist nicht mehr der Fall beim Operator für die kinetische Energie,
für den wir einen Ausdruck finden müssen
∆e = ∆( x, y, z) −→ ∆(r, ϑ, ϕ) =?
(2.61)
wobei wir den Index e zur Kennzeichnung der Koordinaten des Elektrons fallengelassen haben, weil die Protonenkoordinaten, von denen man unterscheiden möchte, nun nicht mehr auftreten. Einen Ausdruck für ∆(r, ϑ, ϕ) kann
man durch mühsames Anwenden der Kettenregel unter Verwendung der Zusammenhänge zwischen den beiden Koordinatensystemen, die in Abb. 1.2 gegeben wurden, finden (zum Beispiel wird diese Rechnung im Anhang des
Buchs von Wedler [4] explizit vorgeführt; eine allgemeine Behandlung von
Koordinatensystemswechseln, die alle denkbaren Fälle abdeckt, geben Margenau und Murphy [7]). Diesen mühsamen Weg gehen wir allerdings hier
nicht, sondern benutzen wieder das Korrespondenzprinzip.
Schon in der klassischen Physik stellt sich die Frage, wie man die kinetische Energie eines rotierenden Teilchens aus Gl. (1.23) ausdrücken kann durch
intuitivere (also problemangepaßte) Ausdrücke, nämlich durch die Rotationsenergie Trot und durch einen kinetischen Beitrag in radialer Richtung Tr
T ( x, y, z) =
p2
l2
p2r
−→ T (r, ϑ, ϕ) =
+
2
2m
2m
|2mr
{z } |{z}
≡ Trot
≡ Tr
(2.62)
2.3 Einfache quantenmechanische Modellsysteme
Der Impuls läßt sich also in Kugelkoordinaten schreiben als
p2 = p2r +
l2
r2
(2.63)
mit dem Drehimpuls l = l (ϑ, ϕ) = r × p. Oft führt man noch das Trägheitsmoment I ≡ mr2 ein, um im Nenner einen Ausdruck für die Drehmasse zu haben,
so dass die Struktur der Rotationsenergie derjenigen der kinetischen Energie
aus Gl. (1.23) entspricht (‘Impulsquadrat geteilt durch die doppelte Masse’).
Wenn wir nun das Korrespondenzprinzip anwenden, erhalten wir direkt
für den Operator der kinetischen Energie des Elektrons
2
p̂2
h̄2
l̂
p̂2
=−
∆e = r +
2me
2me
2me
2me r2
(2.64)
2
mit dem Drehimpulsoperator l̂ , dessen explizite Form wir nach wie vor nicht
benötigen werden, und dem Operator für den Radialimpuls
∂
1
∂
∂
1
1
p̂r = −ih̄
= −ih̄
r + 1 = −ih̄
+
r
(2.65)
∂r
r
r
∂r
r ∂r
Für das Quadrat des Radialimpulsoperators gilt dann
p̂2r = p̂r p̂r = (−ih̄)2
1 ∂2
1 ∂ 1 ∂
r
r = − h̄2
r
r ∂r r ∂r
r ∂r2
(2.66)
Damit können wir nun den Hamilton-Operator für das Wasserstoff-Atom
schreiben als,
2
ĤH−Atom
h̄2 1 ∂2
l̂
1 Ze2
=−
r
+
−
2me r ∂r2
4πǫ0 r
2me r2
und erhalten die zugehörige Schrödinger-Gleichung als
"
#
2
h̄2 1 ∂2
l̂
1 Ze2
−
Ψi (r, ϑ, ϕ) = Ei Ψi (r, ϑ, ϕ)
r+
−
2me r ∂r2
4πǫ0 r
2me r2
(2.67)
(2.68)
Dies ist eine partielle Differentialgleichung zweiter Ordnung, die wir so nicht
lösen können, weil sie von drei Koordinaten (r, ϑ, ϕ) abhängt. Die Form des
Hamilton-Operators in radialen Koordinaten erlaubt es uns aber, einen Ansatz für die Wellenfunktion Ψi zu wählen, der die radiale Koordinate von den
Winkelkoordinaten trennt,
Ψi (r, ϑ, ϕ) = Ni Ri (r ) Yi (ϑ, ϕ)
(2.69)
mit Ni als Normierungsfaktor. Während wir die Funktion, die nur von der radialen Koordinate r abhängt, die sogenannte Radialfunktion Ri (r ), nicht kennen, sei die Winkelfunktion Yi (ϑ, ϕ) identisch zu den Eigenfunktionen des
77
78
2 Einführung in die Quantenmechanik
2
Drehimpulsoperatorquadrats l̂ , also den Kugelflächenfunktionen Ylm (ϑ, ϕ)
aus Gl. (2.40), gewählt. Diese Wahl für die winkelabhängigen Funktionen bie2
tet sich an, weil in obiger Gleichung nur noch l̂ von den Winkeln abhängt.
Sie erlaubt uns schließlich beide Winkelabhängigkeiten aus der Gleichung
zu eliminieren, so dass eine gewöhnliche Differentialgleichung in r entsteht,
die exakt lösbar ist (s. Anhang). Um dies zu sehen, multiplizieren wir die
⋆ ( ϑ, ϕ ) und integrieSchrödinger-Gleichung für das H-Atom von links mit Ylm
ren die Winkelabhängigkeit aus,
−
h̄2 1 ∂2
rR (r )
2me r ∂r2 i
+
Z π
1
Ri (r )
2me r2
−
|
0
Z 2π
sin ϑ dϑ
0
{z
=1
Z π
|0
sin ϑ dϑ
Z 2π
⋆
dϕYlm
Ylm
}
2
⋆
dϕYlm
l̂ Ylm
0
{z
}
=l ( l +1) h̄2
1 Ze2
R (r )
4πǫ0 r i
Z π
|
0
sin ϑ dϑ
Z 2π
0
{z
=1
= Ei R i ( r )
Z π
|
0
sin ϑ dϑ
⋆
dϕYlm
Ylm
}
Z 2π
0
{z
=1
⋆
dϕYlm
Ylm
}
(2.70)
(man beachte, dass alle radialen Abhängigkeiten als Konstanten bei der Integration behandelt und daher vor das Integral gezogen werden können).
Glücklicherweise müssen wir keines der Integrale wirklich berechnen, weil
wir wissen, dass die meisten Integrale ergeben einfach Eins wegen der Normierung der Kugelflächenfunktionen,
Z π
0
sin ϑ dϑ
Z 2π
0
!
⋆
dϕ Ylm
(ϑ, ϕ) Ylm (ϑ, ϕ) = 1
(2.71)
während wir im Falle des Erwartungswertes über das Quadrat des Drehimpulsoperators sofort mit Gl. (2.40) schreiben können,
Z π
0
sin ϑ dϑ
Z 2π
0
(2.40)
2
⋆
dϕYlm
l̂ Ylm =
2
= l (l + 1) h̄
Z π
0
Z π
0
sin ϑ dϑ
sin ϑ dϑ
Z 2π
0
Z 2π
0
⋆
dϕYlm
l (l + 1) h̄2 Ylm
(2.71)
⋆
dϕYlm
Ylm = l (l + 1) h̄2
(2.72)
Nachdem wir so die Winkel vollständig ausintegriert haben, verbleibt die Radialgleichung
−
h̄2 1 d2
l (l + 1) h̄2
1 Ze2
R ( r ) = Ei R i ( r )
rR
(
r
)
+
Ri (r ) −
i
2
2
2me r dr
4πǫ0 r i
2me r
(2.73)
2.3 Einfache quantenmechanische Modellsysteme
die als gewöhnliche Differentialgleichung nur noch von r abhängt, weshalb
wir nun explizit gewöhnliche an Stelle der partiellen Ableitungen schreiben
können. Der zweite Term auf der linken Seite heißt auch Zentrifugalpotential.
Wenn wir diese Gleichung mit r multiplizieren erhalten wir
−
h̄2 d2
l (l + 1) h̄2
1 Ze2
rRi (r ) = Ei rRi (r )
rR
(
r
)
+
rR
(
r
)
−
i
i
2me dr2
4πǫ0 r
2me r2
(2.74)
so dass es sich anbietet, eine neue Radialfunktion zu definieren als Pi (r ) ≡
rRi (r ) mit der wir schließlich erhalten
−
h̄2 d2
l (l + 1) h̄2
1 Ze2
P (r ) = Ei Pi (r )
Pi (r ) +
Pi (r ) −
2
2
2me dr
4πǫ0 r i
2me r
(2.75)
Die neue Radialfunktion Pi bietet sich auch an bei der Berechnung von Erwartungswerten, weil zum Beispiel für das Normierungsintegral gilt
Z +∞
−∞
d3 r Ψ⋆i (r )Ψi (r )
(2.69)
=
=
Z ∞
0
Z ∞
0
r2 drR2i (r )
drPi2 (r )
Z π
0
sin ϑ dϑ
Z 2π
0
⋆
dϕYlm
Ylm
(2.76)
(hier wurde ohne Beschränkung der Allgemeinheit angenommen, dass die
Radialfunktionen reell sind). Man nennt das Quadrat von Pi auch radiale Elektronendichte
ρi (r ) = r2 R2i (r ) = Pi2 (r )
(2.77)
des i-ten Zustands des Elektrons im Wasserstoff-Atom.
Obige gewöhnliche Differentialgleichung, Gl. (2.75), kann durch einen Potenzreihenansatz für Pi (r ) (s. Anhang) exakt gelöst werden. Der dabei erhaltene analytische Ausdruck für Pi (r ) (beziehungsweise Ri (r )) hängt von
der Bahndrehimpulsquantenzahl l und einer weiteren Quantenzahl n zur
Nummerierung der Zustände, die auch Hauptquantenzahl genannt wird, ab:
Pi (r ) → Pni li (r ), wobei wir im folgenden der Einfachheit halber den Index i
fallenlassen, wenn wir die Quantenzahlen n, l und m angeben. Entsprechend
der historisch älteren Notation für die Energiezustände im Wasserstoff-Atom
nennt man die Zustände ohne Bahndrehimpuls (l=0) auch s-Zustände für s ≡
sharp, diejenigen mit Bahndrehimpuls l=1 p-Zustände für p ≡ principal, diejenigen mit Bahndrehimpuls l=2 d-Zustände für d ≡ diffuse, diejenigen mit
Bahndrehimpuls l=3 f -Zustände für f ≡ fundamental,, und alle höheren Drehimpulsezustände werden ab dann alphabetisch benannt g für l=4, h für l=5
und so weiter. Also sagt man für R10 auch 1s-Zustand, für R20 2s-Zustand, für
R21 2p-Zustand, für R30 3s-Zustand, für R31 3p-Zustand, für R32 3d-Zustand,
etc.
79
80
2 Einführung in die Quantenmechanik
Bei der Lösung der Differentialgleichung muß die Normierbarkeit der Radialfunktion gewährleistet sein und man erhält dann automatisch einen Ausdruck für den Energieeigenwert (hier nicht vorgeführt)
Ei → Enlm = En = −
1
m e e4 Z 2
(4πǫ0 )2 2h̄2 n2
(2.78)
der nur noch von der Hauptquantenzahl n abhängt. Dies bedeutet, dass die
Energie nicht von den Bahndrehimpulsquantenzahlen abhängt, sondern nur
von der Hauptquantenzahl. Daher sind im Wasserstoff-Atom zum Beispiel
die 3s-, 3p- und 3d-Schalen energieentartet, was man auch zufällige Entartung
nennt. Diese Entartung wird erst in Vielelektronenatomen durch die Elektron–
Elektron-Wechselwirkung aufgehoben (vgl. Kapitel 3).
Mit Gl. (2.78) haben wir unser Ziel erreicht: die Ableitung des Bohrschen
Energieausdrucks, mit dem wir die Balmer-Serie und die anderen Serien der
Atomspektroskopie erklären können, aus der modernen Quantenmechanik,
also ohne willkürliche zusätzliche Annahmen.
81
3
Die chemische Bindung
3.1
Quantenmechanik für viele Teilchen
Während Kapitel 1 die Grundlagen für die Theorieentwicklung in der Chemie
gelegt und auf die Quantenmechanik vorbereitet hat, führte Kapitel 2 schließlich in diese Theorie ein. Wie die Quantenmechanik funktioniert, wurde im
Kapitel 2 an einfachen Beispielen gezeigt. All diesen Beispielen ist gemein,
dass sie nur ein einziges Teilchen betrachten und daher für die Beschreibung
von Molekülen nicht ausreichend sind. Nur das einfachste, chemisch relevante System, das Wasserstoff-Atom, konnte beschrieben werden — und auch
nur, weil sich dieses Zweiteilchensystem (Elektron und Proton) auf ein Einteilchensystem reduzieren ließ. Dieser Abschnitt beschäftigt sich nun mit der Einführung in die Quantenmechanik von Vielteilchensystemen, die aus N Elektronen und M Atomkernen bestehen.
3.1.1
Energieoperatoren für Vielelektronensysteme
Um zu verstehen, wie man die Operatoren für ein Vielteilchensystem, also
für ein Atom oder Molekül, erhält, können wir uns des Korrespondenzprinzips bedienen. In der klassischen Physik berechnet man die Gesamtenergie
eines Vielteilchensystems als Summe der kinetischen Energien der Einzelteilchen und addiert dazu, wenn es sich um Punktteilchen handelt, die potentiellen Energien aller wechselwirkenden Paare. Dem Korrespondenzprinzip
entsprechend werden diese einzelnen Terme nun zu Operatoren promoviert
und bilden den Hamilton-Operator Ĥ für das Vielteilchensystem
N
Ĥ
=
i =1
N
M
∑
t̂i
|{z}
+
Ekin Elek. i
N
+∑
N
∑
i =1 j = i +1
∑
I =1
t̂ I
|{z}
+∑
Ekin Kern I
1
qe qe
4πǫ0 |r i − r j |
{z
}
|
M
∑
i =1 I =1
Epot Elektron i/Elektron j
1
qe q I
4πǫ0 |r i − R I |
|
{z
}
Epot Kern I/Elektron i
M
+
N
qI qJ
1
(3.1)
4πǫ0 | R I − R J |
I =1 J = I +1 |
{z
}
∑ ∑
Allgemeine Chemie.
Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008
Epot Kern I/Kern J
82
3 Die chemische Bindung
wobei sich die einzelnen Terme für die Bewegungs- und Lageenergieoperatoren entsprechend der Ausführungen im Kapitel 2 auflösen lassen zu
h̄2
N
Ĥ
=
M
h̄2
1
Z I e2
4πǫ0 |r i − R I |
i =1 I =1
N
M
∑ − 2me ∆i + ∑ − 2m I ∆ I − ∑ ∑
I =1
i =1
N
M
Z I Z J e2
1
e2
1
+∑ ∑
4πǫ0 |r i − r j | I =1 J = I +1 4πǫ0 | R I − R J |
i =1 j = i +1
N
+∑
N
∑
(3.2)
wobei für die Bewegungsenergieoperatoren ti = p̂2 /2mi = − h̄2 ∆i /2mi und
für die Ladungen qe = −e und q I = Z I e eingesetzt wurde. Hierbei ist ∆i wie
zuvor der Laplace-Operator für die Koordinaten des i-ten Teilchens,
∆i =
∂2
∂2
∂2
+ 2+ 2
2
∂xi
∂y i
∂zi
(3.3)
(Ein Kommentar zur Konsistenz von Gleichungen: Ein Index der links auftritt, muß natürlich auch rechts vom Gleichheitszeichen eine Größe indizieren — hier die Orstkoordinaten des Teilchens i.) Entsprechend der bisherigen
Notation wurden zur besseren Lesbarkeit für Atomkerne großbuchstabige Indices verwendet, während elektronische Operatoren kleinbuchstabige Indices
tragen.
Wie man sieht, hängt der Hamilton-Operator hier nur von den Ortsvariablen (Koordinaten) der Elementarteilchen des Systems ab (nicht auch noch
von ihren Impulsvariablen, wie in der klassischen Mechanik). Der Operator
ist also in Ortsdarstellung angegeben (die Impulsdarstellung wird in der Chemie selten benötigt). Formal können wir diese Abhängigkeiten des HamiltonOperators schreiben als Ĥ = Ĥ ({r i }, { R I }). Dementsprechend muß die Vielteilchenwellenfunktion nun von all diesen Koordinaten abhängen, also Ψ =
Ψ({r i }, { R I }). Diese Zustandsfunktion, die wir durch Lösen der SchrödingerGleichung erhalten müssen, um molekulare Systeme beschreiben zu können,
stellt sich also als sehr komplizierte mathematische Funktion heraus, die von
(3M + 3N ) Variablen abhängt. Sie ist also umso komplizierter, je mehr Elektronen und Atomkerne das zu studierende Molekül aufbauen.
3.1.2
Postulat 5: Das Pauli-Prinzip
Die Quantenmechanik der Vielteilchensysteme erfordert zunächst noch die
Einführung eines Sysmmetrieprinzip. Dieses Symmetrieprinzip wurde von
Wolfgang Pauli im Rahmen einer grundlegenderen Theorie abgeleitet. Diese
grundlegendere Theorie ist die Quantenelektrodynamik, die auch die Photonen explizit als Quanten und nicht als elektromagnetische Felder beschreibt —
also im Gegensatz zu der hier vorgestellten Quantentheorie (man denke an die
3.1 Quantenmechanik für viele Teilchen
Coulomb-Operatoren für die Wechselwirkung der geladenen Elementarteilchen, die der klassischen Elektrodynamik nach Maxwell entlehnt sind (Korrespondenzprinzip) und natürlich nicht den expliziten Austausch von Photonen als Überträger der Coulomb-Kraft beschreiben). In unserer Darstellung
der Quantentheorie bleibt uns daher nur, die von Pauli gefundene Symmetrie
zu fordern:
Postulat 5: Bei einer Vertauschung (Permutation) der dynamischen Variablen (räumliche Koordinaten und Spin)
von zwei beliebigen Elementarteilchen in einer Vielteilchenwellenfunktion, muß diese das Vorzeichen wechseln,
wenn es sich um zwei Fermionen handelt. Werden die Koordinaten von zwei Bosonen (z.B. zwei 42 He2+ -Kerne) vertauscht, so muß ohne Vorzeichenwechsel dieselbe Wellenfunktion erhalten werden.
Die Wellenfunktion eines Systems von N Elektronen (also Fermionen), Ψ =
Ψ(r1 , . . . , r N ) muß daher folgende Eigenschaft besitzen, wenn man die Koordinaten zweier beliebiger Elektronen i und j vertauscht, wobei diese Vertauschungsoperation durch den Operator P̂ij ausgedrückt wird:
P̂ij Ψ(r1 , . . . , r i , . . . , r j , . . . , r N )
= Ψ (r 1 , . . . , r j , . . . , r i , . . . , r N )
!
= −Ψ (r 1 , . . . , r i , . . . , r j , . . . , r N )
(3.4)
Hier definiert das erste Gleichheitszeichen die Wirkungsweise des Vertauschungsoperators P̂ij , während das zweite Gleichheitszeichen die Forderung
nach der Erfüllung des Pauli-Prinzips widerspiegelt.
3.1.3
Trennung der Elektronen- und Kernbewegung
Wie im Fall des Wasserstoffatoms, müssen wir nun versuchen, die Zustandsfunktion für ein molekulares System, Ψ = Ψ({r i }, { R I }), bestehend aus N
Elektronen und M Atomkernen berechnen. Wie bereits erwähnt, ist zu erwarten, dass dies eine sehr komplizierte Funktion ist wegen der großen Zahl an
Variablen. In Kapitel 2 haben wir schon einen mathematischen Trick kennengelernt, um einfache Funktionsansätze zu erhalten: den Produktansatz zur
Trennung der Variablen. Dazu würde man zunächst gerne die zwei Typen an
Koordinaten trennen, die der Kerne von denen der Elektronen:
Ψ({r i }, { R I }) ≈ Ψel ({r i }) · ΨKerne({ R I })
(3.5)
Diese Trennung der beiden Koordinatensätze ist aber mathematisch nicht
erlaubt, weil im Hamilton-Operator Ĥ die Koordinaten der beiden Sorten Teilchen durch die Operatoren der elektrostatischen Wechselwirkung,
83
84
3 Die chemische Bindung
−(4πǫ0 )−1 Z I e2 /|r i − R I |, aneinander gekoppelt sind. Den obigen Produktansatz dennoch zu machen bedeutet also, eine Näherung einzuführen. Man
nennt diese die Born–Oppenheimer-Näherung zur Separation der Elektronenvon der Kernbewegung.
Für die beiden Teilwellenfunktionen, Ψel und ΨKerne, lassen sich zwei
Schrödinger-Gleichungen mit entsprechenden Hamilton-Operatoren herleiten. Eine von ihnen ist die sogenannte Kern-Schrödingergleichung, die das
quantenmechanische Bewegungsverhalten der Atomkerne beschreibt. Die
Bewegung der Atomkerne erweist sich beim Studium dieser Gleichung als
kollektiv. D.h. es ist sinnvoll (und mathematisch möglich) nicht die Bewegung einzelner Atomkerne zu betrachten, sondern kollektive Bewegungsmoden zu finden, so dass Translationen und Rotationen des Kerngerüsts eines
Moleküls, sowie interne Bewegungen unter Erhalt des Schwerpunkts, also
Schwingungen, eingeführt werden können. Tatsächlich stellt der bereits in
Kapitel 2 angesprochene harmonische Oszillator die einfachste Form einer
Kern-Schrödingergleichung dar und ist daher das Modellquantensystem zum
Studium von molekularen Schwingungen.
Die zweite Schrödinger-Gleichung ist die elektronische Schrödingergleichung, die Ψel zur Lösung hat und das dynamische Bewegungsverhalten der
Elektronen im Molekül beschreibt. Sie ist die zentrale quantenmechanische
Gleichung für die Chemie, da aus ihr die Erklärung der chemischen Bindung,
sowie das Reaktionsverhalten der Moleküle folgt.
3.1.4
Slater-Determinante und Orbitale
Es stellt sich als nächstes die Frage, wie die elektronische Wellenfunktion
Ψel = Ψel ({r i }) berechnet werden kann. Obwohl die Atomkernkoordinaten
in ihr nicht mehr als Variablen vorkommen, hängt sie noch von 3N elektronischen Positionsvariablen ab. Daher müssen wir uns nun der Frage zuwenden,
ob wir die Koordinaten der einzelnen Teilchen je einer Funktion zuordnen
können, etwa in der Form ψi (r i ), aus deren Produkt dann die elektronische
Zustandsfunktion Ψel entsteht,
?
Ψel ({r i }) = ψ1 (r 1 )ψ2 (r 2 ) · · · ψN (r N )
(3.6)
Auch hier wissen wir entsprechend der im letzten Abschnitt geführten Diskussion, dass diese Trennung der einzelnen Elektronenkoordinaten nicht erlaubt sein wird, weil im Hamilton-Operator die Koordinaten paarweise gekoppelt auftreten, nämlich in den Elektron-Elektron-Abstoßungsoperatoren,
(4πǫ0 )−1 e2 /|r i − r j |. Ergo wäre ein Produktansatz wie in Gl. (3.6) zwangsläufig eine Näherung. Die Funktionen, die in dieser Näherung auftreten, sind
reine Hilfsfunktionen; man nennt sie Orbitale.
3.1 Quantenmechanik für viele Teilchen
Weil dieser Ansatz nur für Teilchen gilt, die nicht miteinander wechselwirken, heißt er auch das Modell unabhängiger Teilchen (auf Englisch: independent particle model), weil genau die Wechselwirkung der Teilchen im Ansatz
für die Wellenfunktion nicht berücksichtigt wird. Der Ansatz wäre nur exakt,
wenn die Elektronen nicht wechselwirken würden, wovon in einem realen
System natürlich nicht die Rede sein kann. Es ist aber unbedingt darauf zu
achten, dass die Wahl eines Modells unabhängiger Teilchen zur Näherung
der exakten quantenmechanischen Zustandsfunktion eine Wahl unsererseits
ist. Sie führt dazu, dass diese oft “Orbitalmodell” genannte Wahl zu Unstimmigkeiten und Unklarheiten führt, die aber der exakten Wellenfunktion völlig
abgehen.
Die Tatsache, dass für Atome und Moleküle mit nur einem Elektron, das
Orbital exakt gleich der elektronischen Wellenfunktion ist, dann also keine
Näherung darstellt, hat in der Chemie zu einer undenkbar großen Verwirrung
geführt.
Man kann allerdings zeigen, dass eine elektronische Wellenfunktion vom
obigen Produkttyp eine Elektronendichte ρ el hat, die sich aus den Betragsquadraten der Orbitale berechnen läßt
ρel (r )
(2.24)
=
(3.6)
−→
N
Z
d3 r 2 · · ·
Z
d3 r N |Ψel (r, r 2 , . . . r N )|2
|ψ1 (r )|2 + |ψ2 (r )|2 + + . . . |ψN (r )|2 =
N
∑ |ψi (r )|2
(3.7)
i =1
Die Elektronendichte beschreibt auch in diesem Fall die räumliche Verteilung
der Elektronen, wie bereits in Kapitel 2 diskutiert, und kann also im Rahmen
des Modells unabhängiger Teilchen aus den Orbitalquadraten berechnet werden.
Wenn wir uns nun auf das “Orbitalmodell”, also auf den Ansatz unabhängiger Teilchen als Modellfunktion für die exakte elektronische Wellenfunktion, einlassen, dann müssen wir fordern, dass sich mit diesem Funktionsansatz in jedem Fall die Postulate der Quantenmechanik erfüllen lassen. Doch
hier macht genau Postulat 5 Schwierigkeiten, wie wir leicht am Beispiel eines
Zweielektronensystems (ob Atom oder Molekül ist dabei gleichgültig) sehen
können.
Für zwei Elektronen, die sich im elektrischen Feld von Atomkernen bewegen, nähern wir die elektronische Zustandsfunktion durch einen Produktansatz
Ψel (r 1 , r 2 ) ≈ ψ1 (r1 )ψ2 (r 2 )
(3.8)
entsprechend des Modells unabhängiger Teilchen. Nun fordert das PauliPrinzip, dass dieser Ansatz das Vorzeichen wechselt, wenn man die beiden
85
86
3 Die chemische Bindung
Koordinaten vertauscht, was wir leicht untersuchen können:
P̂12 [ψ1 (r 1 )ψ2 (r2 )] = [ψ1 (r 2 )ψ2 (r 1 )] 6= −[ψ1 (r 1 )ψ2 (r 2 )]
(3.9)
Das Pauli-Prinzip wird also klar nicht erfüllt. Um aber den einfachen Produktansatz für die Wellenfunktion zu retten, implementieren wir das PauliPrinzip in den Ansatz und ziehen das koordinatenvertauschte Produkt vom
Ausgangsprodukt ab:
Ψel (r 1 , r 2 ) ≈ [ψ1 (r 1 )ψ2 (r 2 ) − ψ1 (r 2 )ψ2 (r 1 )]
(3.10)
Für diesen Ansatz kann man nun leicht zeigen, dass er das Pauli-Prinzip erfüllt
P̂12 [ψ1 (r 1 )ψ2 (r 2 ) − ψ1 (r 2 )ψ2 (r 1 )]
= [ψ1 (r 2 )ψ2 (r 1 ) − ψ1 (r 1 )ψ2 (r 2 )]
= −[ψ1 (r 1 )ψ2 (r 2 ) − ψ1 (r 2 )ψ2 (r 1 )] (3.11)
Man beachte, dass man den Ansatz in Gl. (3.10) als Determinante schreiben
kann,
ψ (r ) ψ2 (r 1 ) (3.12)
[ψ1 (r 1 )ψ2 (r 2 ) − ψ1 (r 2 )ψ2 (r 1 )] = 1 1
ψ1 (r2 ) ψ2 (r 2 ) Wenn wir nun diese Ideen verallgemeinern für ein N-Elektronensystem, wenn
wir also alle ungeradzahligen Paarvertauschungen mit negativem Vorzeichen
vom Ausgangsprodukt abziehen, während wir alle geradzahligen hinzu addieren, dann kann man auch diese Pauli-Prinzip-konsistente Näherung unabhängiger Teilchen als Determinante schreiben,
ψ1 (r 1 ) ψ2 (r 1 ) · · · ψN (r 1 ) ψ1 (r 2 ) ψ2 (r 2 ) · · · ψN (r 2 ) Ψel (r 1 , r 2 , . . . , r N ) ≈ (3.13)
..
..
..
..
.
.
.
.
ψ (r ) ψ (r ) · · · ψ (r ) 1
N
2
N
N
N
die daher einen eigenen Namen bekommt. Man nennt sie Slater-Determinante.
Orbitale sind also Einelektronenfunktionen, die in der Slater-Determinante vorkommen. Gebräuchlicher als der Begriff Slater-Determinante ist oft der Begriff Elektronenkonfiguration. Diejenigen Orbitale, die in der Slater-Determinanten vorkommen, stellen die Elektronenkonfiguration des Atoms oder Moleküls dar.
Der Slater-Determinantenansatz zur Näherung der elektronischen Wellenfunktion ist der einfachste, den machen kann. Interessanterweise führt also
die Erfüllung des Pauli-Prinzips dazu, dass jedes Elektron (durch seine Koordinate) in jedem Orbital vorkommt. In der Chemie spricht man oft von “Elektronen
in Orbitalen”, meint aber eigentlich die Orbitale selbst, die keineswegs als eine
Art Container für Elektronen zu verstehen sind.
3.1 Quantenmechanik für viele Teilchen
3.1.5
Mehrelektronenatome
Man übersieht oft, dass schon das Helium-Atom ein Zweielektronensystem
ist, für das die elektronische Wellenfunktion nicht so aussieht, wie die des
Wasserstoffatoms, sondern für das man mindestens einen Ansatz der Form in
Gl. (3.13) machen muß (für N = 2 natürlich, also wie in Gl. (3.12)). Wegen der
radialen Symmetrie der Atome, kann man aber ebenso wie im Fall des Wasserstoffatoms jedes einzelne Orbital in ein Produkt aus Radialteil und Winkelteil
aufspalten,
ψi (r ) ≡ ψni li mi ms(i) (r ) = Rni li (r ) Yli mi (ϑ, ϕ) σsims(i)
(3.14)
(der Einfachheit halber wurde der Normierungsfaktor weggelassen). Es ist
aber zu beachten, dass diese Aufteilung die Kugelsymmetrie eines Atoms voraussetzt, weil sonst eine Klassifizierung nach Drehimpulsquantenzahlen nicht
möglich wäre. Man beachte ferner die explizite Berücksichtigung des Spins
des Elektron in Form der Spinfunktion σsms (mit s = 1/2 und ms = ±1/2), die
eine der beiden Spineigenfunktionen sein muß, also σsi ms(i) → σ1/2,+1/2 = α
oder σsi ms(i) → σ1/2,−1/2 = β. Tatsächlich tragen die Orbitale in der SlaterDeterminanten also auch Spininformation und werden daher auch Spinorbitale genannt.
In diesem Ansatz sind die Kugelflächenfunktionen Yli mi (ϑ, ϕ) bekannt,
während die Radialfunktionen zunächst unbekannt sind (es läßt sich für sie
nämlich keine radiale Differentialgleichung ableiten, die analytisch (also geschlossen) lösbar wäre — ganz im Gegensatz zum Wasserstoffatom, für das
im Kapitel 2 eine solche Gleichung abgeleitet angegeben wurde).
Wir haben bisher eine recht einfache Indizierung für die Orbitale in der
Slater-Determinante verwendet. Oft versucht man diesen Indices mehr Information über die Orbitale und schließlich auch über die Gesamtzustandsfunktion Ψel aufzuprägen. Diese Information wird bestimmten Eigenschaften
(Symmetrien) der Orbitale entnommen. Die dabei gewählten Mehrfachindices
werden auch Quantenzahlen genannt. Sie spielen primär aber nur eine Rolle
bei der Nummerierung der Orbitale und sekundär bei der Bestimmung von
Symmetrieinformation für den gesamten Zustand, also für das gesamte NElektronensystem. Tatsächlich haben wir für das Atomorbital in Gl. (3.14) bereits eine solche symmetrietragende Mehrfachindizierung benutzt. An Stelle
des zusammengesetzten Index i verwenden wir wegen der Struktur des Produktansatze die Drehimpulsindices (li , mi ), sowie den Spinindex ms(i) und
den einfachen Laufindex ni , der in Analogie zum Wasserstoffatom auch hier
Hauptquantenzahl genannt wird.
Im atomaren Fall können wir also eine Slater-Determinante als Näherung für
die elektronische Wellenfunktion finden, die aus Atomorbitalen aufgebaut ist
87
88
3 Die chemische Bindung
und deren Indices die Quantenzahlen (ni , li , mi , ms(i)) sind,
ΨAtom
el
ψn1 ,l1 ,m1 ,m (r 1 )
s (1 )
ψ
n1 ,l1 ,m1 ,ms(1) (r 2 )
≈ ..
.
ψn ,l ,m ,m (r N )
1 1 1 s (1 )
ψn2 ,l2,m2 ,ms(2) (r 1 )
ψn2 ,l2,m2 ,ms(2) (r 2 )
..
.
ψn2 ,l2 ,m2 ,ms(2) (r N )
· · · ψn N ,l N ,m N ,ms( N) (r 1 )
· · · ψn N ,l N ,m N ,ms( N) (r 2 )
..
..
.
.
· · · ψn N ,l N ,m N ,ms( N) (r N )
(3.15)
Man beachte aber, dass für diese Funktionen — im Gegensatz zum Wasserstoffatom — keine analytischen Aussrücke bekannt sind, weil eben die Radialfunktionen nicht analytisch durch Lösen einer Differentialgleichung bestimmt
werden können (dies geht nur approximativ und benötigt computergestützte
Lösungsverfahren).
3.1.5.1 Spezielle Form des Pauli-Prinzip
Basierend auf den bisherigen Ausführungen können wir uns nun einer Version des Pauli-Prinzips widmen, die in der Chemie große Verbreitung gefunden
hat. Diese “Variante” besagt, dass sich zwei Elektronen in mindestens einer von
vier Quantenzahlen, (ni , li , mi , ms(i)), unterscheiden müssen. Durch den Bezug auf
die Quantenzahlen eines Atoms ist sofort offensichtlich, dass dies keine allgemeine Formulierung des Pauli-Prinzips sein kann. Moleküle haben keine Rotationssymmetrie und folglich lassen sich die Elektronen in Molekülen nicht
mehr nach der Drehimpulsquantenzahl l klassifizieren. Man sagt dann, dass
l keine gute Quantenzahl ist, und meint damit, dass die elektronische Wellenfunktion des Moleküls keine Eigenfunktion des Quadrats des Drehimpulsoperators mehr ist. Sie ist nur noch Eigenfunktion vom Quadrat des Spinoperators. Wenn man also von diesen vier Quantenzahlen spricht, bezieht man
sich zwangsläufig nur auf Atome.
Um nun zu verstehen, woher die Variante des Pauli-Prinzips kommt,
schauen wir uns die elektronische Wellenfunktion in Slater-DeterminantenNäherung an, Gl. (3.16), und studieren den gegenteiligen Fall, nämlich das
Auftreten von zwei gleichen Sätzen an Quantenzahlen, (nk , lk , mk , ms(k)) und
(nk , lk , mk , ms(k) ), wobei wir der kompakten Schreibweise wegen, nur den Gesamtindex k schreiben:
ψ (r )
· · · ψk ( r 1 )
ψk ( r 1 )
· · · ψN (r 1 ) 1 1
..
..
..
..
.
.
.
.
ψ
(
r
)
·
·
·
ψ
(
r
)
ψ
(
r
)
·
·
·
ψ
(
r
)
N k −1 1 k −1
k k −1
k k −1
ΨAtom
≈
= 0 (3.16)
el
· · · ψk ( r k )
ψk ( r k )
· · · ψ N (r k ) ψ1 (r k )
..
..
..
..
.
.
.
.
ψ1 (r N ) · · · ψk (r N )
ψk ( r N ) · · · ψ N ( r N ) 3.1 Quantenmechanik für viele Teilchen
Die Determinante enthält dann zwei gleiche Spalten und verschwindet entsprechend der Rechenregeln für Determinanten. Das Pauli-Prinzip war der
Grund für die Einführung einer Determinante an Stelle eines gewöhnlichen
Produkts aus Orbitalen zur Näherung der Wellenfunktion. Nun erkennen wir,
dass wir nicht zweimal dasselbe Spinorbital in der Determinante verwenden
können, weil diese sonst zu Null wird und dann natürlich keine physikalisch
sinnvolle Näherung an die elektronische Wellenfunktion darstellt. Weil wir
die Orbitale durch ihre Indizierung unterscheiden und im Atomfall diese Indices durch die Quantenzahlen ersetzt werden, hat sich die in diesem Abschnitt
angegebene Form des Pauli-Prinzips festgesetzt. Da es sich aber nicht um die
allgemeine Formulierung des Prinzips, die in Postulat 5 gegeben wurde, handelt, sondern nur um eine Folgerung, die auch nur für den speziellen Fall der
Atome gilt, ist die Formulierung von Postulat 5 zu bevorzugen.
3.1.5.2 Termsymbole
Im Fall eines Mehrelektronenatoms haben wir im vorstehenden Abschnitt gesehen, dass die Atomorbitale mit den gleichen Quantenzahlen klassifiziert
werden können, die schon beim Wasserstoffatom zur Bezeichnung eines Zustands verwendet wurden. Während die Hauptquantenzahl n lediglich Zustände entsprechend der aufsteigenden Gesamtenergie nummeriert und daher als Symmetrielabel nicht interessant ist, sagen li und si etwas über die
Drehimpulssymmetrien des Atomorbital i aus, weil die Atomorbitale Eigen2
funktionen der Operatoren l̂ und ŝ2 sind.
Es stellt sich dann die Frage, was der Gesamtdrehimpuls und der Gesamtspin von vielen Elektronen in einem Atom ist. Hier können wir uns wieder
des Korrespondenzprinzips bedienen. In der klassischen Physik ist der Gesamtdrehimpuls L gleich der vektoriellen Addition der Drehimpulsvektoren
der Einzelteilchen, l i ,
N
L=
∑ li
(3.17)
i =1
weshalb wie für die entsprechenden Bahndrehimpulsoperatoren in der Quantenmechanik schreiben
N
L̂ =
∑ l̂ i
(3.18)
i =1
und für den (nichtklassischen) Spin der Elektronen
N
Ŝ =
∑ ŝi
i =1
(3.19)
89
90
3 Die chemische Bindung
Weil die elektronische Gesamtwellenfunktion Ψel eines Atoms alle physikalische und daher auch die Drehimpuls-Information trägt, muß sie die Eigenwertgleichungen dieser Drehimpulsoperatoren erfüllen,
2
L̂ Ψel = L( L + 1) h̄2 Ψel
2
Ŝ Ψel = S(S + 1) h̄2 Ψel
und
L̂z Ψel = M L h̄ Ψel
(3.20)
und
Ŝz Ψel = MS h̄ Ψel
(3.21)
wobei die Quantenzahlen des Gesamtzustands folgende Werte annehmen
können: L = 0, 1, 2, . . . , sowie S = 0, 0.5, 1, 1.5, 2, 2.5, . . . , und M L = − L, − L +
1, . . . , + L, sowie MS = −S, −S + 1, . . . , +S in völliger Analogie zum Einelektronenatom, das im Kapitel 2 besprochen wurde.
Wenn wir den elektronischen Zustand eines Atoms durch eine Slaterdeterminante nähern, dann muß natürlich auch die Slaterdeterminante diese Drehimpulssymmetrien efüllen, d.h. Eigenfunktion der Gesamtdrehimpulsoperatoren sein. Wenn nun die Atomorbitale in der Determinante die Drehimpulssymmetrien der einzelnen Elektronen beschreiben, dann sollte deren Kopplung die Gesamtdrehimpulssymmetrien ergeben. In der Quantenmechanik
kann das aber nicht wie in der klassischen Physik, Gl. (3.17), erfolgen, weil die
Eigenfunktionen die Information tragen. Drehimpulskopplung in der Quantenmechanik bedeutet also, dass man eine Eigenfunktion zu den Operatoren,
L̂ und Ŝ finden muß, so dass Gln. (3.20) und (3.21) erfüllt sind. Diese Eigenfunktionen sind aus den Einteilchenfunktionen, den Orbitalen, zu konstruieren. Für dieses Programm der quantenmechanischen Drehimpulskopplung gibt
es eine rezeptartige Vorgehensweise, deren Diskussion an dieser Stelle jedoch
zu weit führen würde.
Hier ist vielmehr wichtig, dass der elektronische Gesamtzustand entsprechend der Gesamtbahndrehimpuls- und der Gesamtspinquantenzahlen, L,
M L , S und MS , klassifiziert werden kann. Für jeden elektronischen Eigenzustand einer Anzahl Elektronen in einem Atom kann man für diese Zahlen einen Wert angeben, um einen Eigenzustand von dem anderen zu unterscheiden. Wenn man nun beachtet, dass man mit Licht zwischen diesen
Eigenzuständen wechseln kann, also Spektroskopie betreiben kann, so verwundert es nicht, dass eine Klassifizierung der Zustände schon vor der Entwicklung der Quantenmechanik in die Atomspektroskopie eingeführt wurde.
Diese Klassifizierung verwendet die Gesamtzustandsquantenzahlen zur Spezifizierung eines Zustands. An Stelle der Wellenfunktion wird dann ein sogenanntes Termsymbol angegeben,
Ψel
−→
(2S+1)
LJ
(3.22)
das aus den Quantenzahlen L und S zusammengesetzt wird. Drehimpuls und
Spin kann man noch zu einem Gesamtdrehimpuls koppeln, der denselben Regeln, wie soeben besprochen, folgt und mit einer Quantenzahl J belegt wird.
3.2 Molekülorbitaltheorie
Die Zahl (2S + 1) wird Multiplizität genannt, weil sie angibt, in wieviele verschiedene Linien eine Linie im Spektrum aufspaltet, wenn man ein magnetisches Feld anlegt (Stern–Gerlach-Versuch). Dieser Beobachtung entspricht ein
im feldfreien Raum entarteter quantenmechanischer Zustand, der in (2S + 1)
energetisch verschiedene Zustände aufspaltet, wenn ein magnetisches Feld
angelegt wird (Zeeman-Effekt).
Für die Gesamtbahndrehimpulszahl gibt man nicht eine Zahl, sondern
einen Buchstaben an, der sich an der für Einelektronenatome bereits eingeführten Notation s, p, d, etc. orientiert. Da es sich aber nun um Gesamtsymmetrien handelt, werden Großbuchstaben verwendet, wie in Tab. 3.1 gezeigt.
Auch die Multiplizität (2S + 1) wird mit einer besonderen Notation belegt, die
an Stelle des numerischen Werts tritt. Die Zuordnung dieser Namen orientiert
sich an der Zahl der Linien nach Aufspaltung in einem magnetischen Feld
und ist ebenfalls in Tab. 3.1 gezeigt. Die Verwendung von Termsymbolen sei
an zwei Beispielen illustriert: Der Grundzustand des Helium-Atoms hat eine
S = 0 Spin- und eine L = 0 Bahndrehimpulssymmetrie. Das Termsymbol für
den Grundzustand ist daher 1 S0 (sprich: ‘Singulett-S’). Der Grundzustand des
Kohlenstoffatoms ist entsprechend Experiment und quantenmechanischer Behandlung dreifach spinentartet, (2S + 1) = 3 also S = 1, und hat einen ebenfalls nicht verschwindenden Bahndrehimpuls, L = 1; das zugeordnete Termsymbol ist also 3 P (sprich: ‘Triplett-P’), wobei wir den Gesamtdrehimpuls J
nicht angegeben haben.
Tabelle 3.1 Zur Benennung der Termsymbole.
L
Symbol
S
(2S + 1)
0
1
2
3
4
S
P
D
F
G
0
0.5
1
1.5
2
1
2
3
4
5
Name
Singulett
Doublett
Triplett
Quartett
Quintett
3.2
Molekülorbitaltheorie
3.2.1
Quantenmechanische Gleichungen für Orbitale
Wir haben nun Orbitale als Bestandteile der Slater-Determinante eingeführt,
jedoch mit keinem Wort erwähnt, wie wir diese Funktionen erhalten können.
Entsprechend unserer Diskussion des Wasserstoffatoms würde man erwarten,
91
92
3 Die chemische Bindung
dass sich eine Differentialgleichung formulieren läßt, deren Lösungsfunktionen die Orbitale sind. Im Fall eines Einelektronenatoms muß diese Gleichung
exakt in die Schrödingerggleichung für H-ähnliche Atome übergehen! In der
Tat kann man eine solche Gleichung allgemein ableiten (eine Ableitung, die
wir an dieser Stelle überspringen, um die Prinzipien in den Vordergrund zu
stellen statt technischer Details):
(3.23)
t̂ + V̂nuc + v̂ee ψi = ǫi ψi
Diese Gleichung gilt exakt für Einelektronenzustände, wie Dirac zeigte (die
Diracsche Gleichung ist zwar von dieser Form, weicht aber ansonsten essentiell von der Schrödingerschen Gleichung ab, die aber der Grenzfall jener für
unendlich große Lichtgeschwindigkeit ist).
Einige Operatoren in der Gleichung haben ihre übliche Bedeutung: t̂ bezeichnet den kinetische Energieoperator für ein Elektron, während V̂nuc der
Operator für die Anziehung eines Elektrons von allen Kernen im System ist.
Lediglich der Operator v̂ee besitzt eine äußerst komplizierte Form, die eigentlich auf Arbeiten von Breit zurückgeht und in modernen computerchemischen
Verfahren auf vielfältige Art und Weise angenähert wird. Die energetische
Größe ǫi wird Orbitalenergie genannt. Der gesamte Operator heißt auch FockOperator und läßt sich explizit schreiben als
M
h̄2
1
Z I e2
fˆ ≡ −
∆− ∑
+ v̂ee
2me
4πǫ0 |r − R I |
I =1
(3.24)
Für uns ist hier nur wichtig, dass die zugeordnete zeitabhängige Gleichung
im Prinzip exakt ist, dass der Operator für die kinetische Energie wegen des
in ihm vorkommenden Laplace-Operators die Gleichung zu einer partiellen
Differentialgleichung zweiter Ordnung macht (genau wie im Fall des Wasserstoffatoms) und dass der Operator v̂ee zu kompliziert ist, als dass wir ihn mit
Papier und Bleistift annähern könnten. Kurz gesagt, Gl. (3.23) ist viel zu kompliziert, als dass wir uns ihrer Lösung ohne entsprechendes Handwerkszeug
zuwenden könnten. Leider setzt uns das auch enge Grenzen für das Verständnis der chemischen Bindung. Während die exakte Lösung obiger Gleichung
die beliebig genaue Beschreibung der chemischen Bindung erlaubt, was allerdings nur mittels spezieller Computerprogramme möglich ist, suchen wir
ein approximatives Verfahren, das uns erlaubt, die ‘Essenz’ der chemischen
Bindung zu erfassen.
3.2.2
Linearkombination von Atomorbitalen
Glücklicherweise können wir einen Trick verwenden, den wir bereits im vorigen Kapitel eingesetzt hatten. Der Schlüssel dabei ist die Einführung von
3.2 Molekülorbitaltheorie
Funktionen, die man bereits kennt, um so die unbekannten Funktionen, die
Molekülorbitale, anzunähern. Wir nehmen an, wir kennen die Orbitale φµ aller Atome im Molekül — keine triviale Annahme, da wir obige Gleichung
auch für Atome mit mehr als einem Elektron erst einmal lösen müßten — und
konstruieren die Orbitale ψi des Moleküls durch Überlagerung dieser Atomorbitale
ψi ( r ) =
∑ ciµ φµ (r )
(3.25)
µ
Nun sind die Unbekannten, die das Wesen des i-ten Molekülorbitals bestimmen, die Entwicklungsparameter ciµ , die man Molekülorbitalkoeffizienten
oder kurz MO-Koeffizienten nennt. Die Menge aller Entwicklungsparameter
eines Orbitals können wir in einem Vektor zusammenfassen, ci ≡ {ciµ }. Die
Entwicklung selbst heißt LCAO-Entwicklung nach linear combination of atomic
orbitals.
3.2.3
Die Roothaan-Gleichung
Um die MO-Koeffizienten zu bestimmen, verwenden wir Gl. (3.23), die von
dem LCAO-Ansatz in Gl. (3.25) erfüllt werden muß,
t̂ + V̂nuc + v̂ee ∑ ciµ φµ (r ) = ǫi ∑ ciµ φµ (r )
(3.26)
µ
µ
Um aus dieser Gleichung eine Bestimmungsgleichung für die Koeffizienten
zu machen, gehen wir vor wie schon bei der Lösung des Wasserstoffatoms in
Kapitel 2. Dazu multiplizieren wir Gl. (3.26) von links mit einem komplexkonjugierten Atomorbital φν⋆ (r ) und integrieren über die Koordinaten r,
Z +∞
−∞
Z
d3 r φν⋆ (r ) t̂ + V̂nuc + v̂ee ∑ ciµ φµ (r ) =
µ
+∞
−∞
d3 r φν⋆ (r )ǫi ∑ ciµ φµ (r )
µ
(3.27)
und schreiben die erhaltene Gleichung durch Vertauschen von Summation
und Integration um
∑ ciµ
µ
Z +∞
−∞
Z
d3 r φν⋆ (r ) t̂ + V̂nuc + v̂ee φµ (r ) = ǫi ∑ ciµ
µ
+∞
−∞
d3 r φν⋆ (r )φµ (r )
(3.28)
Die Integrale könnten wir nur berechnen, wenn wir die explizite analytische
Form der Atomorbitale kennen würden. Heutzutage kann man sie mit Computern berechnen. In den 1930-1950er Jahren war dies noch nicht möglich.
93
94
3 Die chemische Bindung
Um dennoch dem Verständnis der chemischen Bindung näher zu kommen,
hat man sich eines Tricks bedient. Zwar können wir die Integrale nicht auf
einem Blatt Papier berechnen, wir wissen aber, dass es reelle Zahlen sind, die
wir wie folgt abkürzen wollen,
f νµ
Sνµ
≡
≡
Z +∞
−∞
Z +∞
−∞
d3 r φν⋆ (r ) t̂ + V̂nuc + v̂ee φµ (r )
d3 r φµ⋆ (r )φν (r )
(3.29)
(3.30)
so dass wir Gl. (3.28) kompakt schreiben können als
∑ f νµ ciµ = ǫi ∑ Sνµ ciµ
µ
(3.31)
µ
Die Summation kann man als Skalarprodukt zweier Vektoren f ν ≡ { f νµ } und
ci beziehungsweise Sν ≡ {Sνµ } und ci schreiben,
(3.32)
f ν · c i = ǫi S ν · c i
Eine solche Gleichung können wir nun für jedes beliebige Atomorbital φν erhalten. Wenn wir daher alle so gewonnenen Vektoren f ν und Sν als Zeilenvektoren in Matrizen f = { f νµ } und S = {Sνµ } auffassen, können alle diese
Möglichkeiten in Form einer Matrix-Gleichung geschrieben werden, die man
Roothaan-Gleichung nennt,
(3.33)
f · c i = ǫi S · c i
Die nichttriviale Lösung dieser Gleichung erhält man durch Nullsetzen der
Determinante
[ f − ǫi S ] · c i = 0
=⇒
!
det [ f − ǫi S] = 0
(3.34)
wobei wir an Stelle der senkrechten Striche zur Kennzeichnung der Determinanten diesmal explizit ‘det’ geschrieben haben (die triviale Lösung wäre
ci = 0, was aber natürlich keine chemisch relevante Lösung ist, weil dann das
Molekülorbital ψi (r ) entsprechend Gl. (3.25) überall im Raum Null wäre).
3.2.4
Die chemische Bindung im Diwasserstoff
Die Lösung der Roothaan-Gleichung führt man am besten am Beispiel des einfachsten chemischen Moleküls vor, also für das Wasserstoffmolekül. Für die
LCAO-Entwicklung in Gl. (3.25) verwenden wir zwei 1s-Atomorbitale, 1s1 (r )
und 1s2 (r ), wobei die Indices 1 und 2 die beiden Wasserstoffatome bezeichnen, H(1) –H (2) . Die zu lösende Gl. (3.34) lautet dann
f 11 − ǫi S11 f 12 − ǫi S12 !
!
=0
det [ f − ǫi S] = 0 =⇒ (3.35)
f 21 − ǫi S21 f 22 − ǫi S22 3.2 Molekülorbitaltheorie
wobei i ∈ {1, 2}. Aus Symmetriegründen muß gelten f 11 = f 22 und f 12 = f 21 ,
sowie analog S11 = S22 und S12 = S21 — die beiden Wasserstoffatome sind
symmetrieäquivalent, d.h. sie können vertauscht werden, ohne dass sich die
Chemie des H2 -Moleküls ändert. Der Einfachheit halber führen wir noch ein
f ≡ f 11 = f 22 und S ≡ S12 und nehmen an, dass die Atomorbitale normiert
seien, S11 = S22 = 1. Damit können wir die zu lösende Gleichung schreiben
als
f − ǫi
f 12 − ǫi S !
=0
(3.36)
f 12 − ǫ S
f − ǫi i
Die Auflösung der 2×2-Determinante ergibt
⇔
2
( f − ǫi )2 − ( f 12 − ǫi S)2
2
( f − ǫi ) = ( f 12 − ǫi S) ⇒
f − ǫi
= 0
(3.37)
= ±( f 12 − ǫi S)
(3.38)
was wir nach der gesuchten Orbitalenergie ǫi auflösen und so zwei mögliche
Lösungen für zwei Molekülorbitale erhalten
ǫ∓ =
f ∓ f 12
f
f
=
∓ 12
1∓S
1∓S 1∓S
(3.39)
Wenn der Überlapp S bei großen Abständen der Wasserstoffatomkerne gegen
Null geht, erhalten wir
ǫ∓ = f ∓ f 12
(3.40)
Orbitalenergien hängen also von der molekularen Struktur ab und ändern
sich daher auch bei chemischen Reaktionen! Entsprechendes gilt für die Molekülorbitale selbst.
Bei sehr großen Abständen entstehen aus H2 zwei einzelne Wasserstoffatome. Aufgrund der dann verschwindenden Wechselwirkung der beiden Protonen, der beiden Elektronen, sowie eines Elektrons eines H-Atoms mit dem
Proton des anderen erkennen wir,
"
#
Z +∞
2
2
2
h̄
1
Z
e
I
f =
d3 r φ1s (r ) −
∆− ∑
+ v̂ee φ1s (r )
2me
4πǫ0 |r − R I |
−∞
I =1
#
"
Z +∞
e2
1
h̄2
3
φ1s (r ) = E1s (3.41)
∆−
d r φ1s (r ) −
≈
2me
4πǫ0 |r − R1 |
−∞
Dementsprechend kann f durch den Eigenwert des Wasserstoffatomgrundzustands genähert werden. Wenn wir nun beachten, dass der Überlapp von
zwei 1s-Orbitalen S stets positiv ist, so gilt für die Aufspaltung um den Energieschwerpunkt E1s : ∆ǫ− > ∆ǫ+ . Das Molekülorbital ψ+ wird dann in der
95
96
3 Die chemische Bindung
Energie abgesenkt gegenüber den Atomorbitalenergien E1s , währen ψ− energetisch angehoben wird. Ersteres nennt man deshalb ein bindendes Molekülorbital und letzteres ein antibindendes Molekülorbital. Die Ausbildung der chemischen Bindung ist demnach energetisch begünstigt und die Reaktionsenergie kann genähert werden durch
∆Eel = 2ǫ+ − 2E1s
(3.42)
Die erhaltenen Lösungen kann man in ein Diagramm, in das sogenannte
MO-Diagramm, einzeichnen (s. Abb. 3.1), dem man sofort entnehmen kann,
dass die Bildung einer chemischen Bindung zwischen zwei Wasserstoffatomen zu einer Energieerniedrigung und damit zu einem stabileren Zustand
führt. Es ist an dieser Stelle wichtig zu betonen, dass man MO-Diagramme
nicht raten kann, wie oft der Eindruck in Lehrbüchern der Allgemeinen Chemie erweckt wird, sondern immer durch Lösen einer Roothaan-artigen Gleichung berechnen muß. Offensichtlich wird dieses Lösen immer schwieriger, je
mehr Atomorbitale berücksichtigt werden müssen, also je größer und zahlreicher die Atome im Molekül sind. Schon für die homonuklearen zweiatomigen
Moleküle der zweiten Periode (also z.B. O2 , N2 und F2 ) ist schon eine aufwendige Berechnung nötig, die auch nur noch mit Computern ausgeführt werden
kann, wenn man die Integrale f νµ und Sνµ explizit berechnen will/muß.
εi
ε
E 1s
ε+
H
H2
H
Abbildung 3.1 Molekülorbitaldiagramm zur Bildung von H2 aus zwei H-Atomen. In die Mitte zeichnet man die Orbitalenergien des bindenden und des antibindenden Molekülorbitals,
sowie links und rechts davon die Atomorbitalenergien.
Aus der Lösung der Roothaan-Gl. (3.33) erhält man auch die MO-Koeffizienten, mit deren Hilfe wir schließlich die MOs graphisch darstellen können.
Das MO zur niedrigsten Energie wird bindendes MO genannt, während das
MO mit einer Energie höher als dem Energieschwerpunkt — der hier identisch ist mit der Energie der AOs — antibindendes MO genannt wird, weil
3.2 Molekülorbitaltheorie
eine “Besetzung” dieses MO die Bindung schwächen würde. Wenn die Energie eines Molekülorbitals dagegen gleich dem Energieschwerpunkt sein wird,
dann nennt man dieses MO nichtbindend.
97
99
4
Chemische Konzepte
Mit der Quantenmechanik haben wir die Theorie in den Händen, mit der wir
das dynamische Verhalten der Elektronen und Atomkerne beschreiben können. Mit ihr können wir sämtliche Eigenschaften von Molekülen, molekularen
Aggregaten, Festkörpern etc. vorhersagen und beschreiben. Offensichtlich ist
die Theorie aber recht kompliziert und erlaubt ohne vorherige Berechnung
kaum Aussagen, was die “Alltagstauglichkeit” der Theorie sehr einschränkt.
Kurz, die Theorie ist nicht handlich und wir benötigen in der Chemie weitere, zwangsläufig approximative Werkzeuge, die es uns gestatten, soweit wie
möglich konsistent mit den Prinzipien der Quantenmechanik eine Begrifflichkeit zu schaffen, die flexibel und ad hoc anwendbar ist. Die chemischen Konzepte
erfüllen diese Aufgabe und das erste zu besprechende Konzept ist das der Partialladungen. Für das qualitative Verständnis molekularer Prozesse und Reaktionen sind diese Konzepte unverzichtbar. Sobald chemische Zusammenhänge in groben Zügen (qualitativ) verstanden sind, kommen dann genauere,
quantitative Berechnungen basierend auf der Quantenmechanik, sogenannte
quantenchemische Berechnungen, zum Einsatz.
4.1
Ladungsverteilung und Partialladungen
Sehr viele in der Chemie geführte deskriptiv-qualitative Diskussionen über
Moleküle und ihr chemisches Verhalten werden mit rein elektrostatischen Begriffen geführt. Daher ist die zentrale physikalische Größe in all diesen Diskussionen die Ladungsverteilung der Elektronen im Molekül. Diese Größe
haben wir bereits in Kapitel 2 eingeführt. Es ist die Ladungsdichteverteilung
ρC (r ) ≡ qe ρ(r ) = −eρ(r ), also die elementarladungsgewichtete Elektronendichteverteilung aus Gl. (2.24).
Um allgemein mit ‘elektrostatischer Anziehung’ oder ‘elektrostatischer Abstoßung’ argumentieren zu können wird es nötig sein, zu bestimmen, an welchen Orten im Raum ein Ladungsunterschuß beziehungsweise -überschuß zu
finden ist. Es wird sicherlich nicht einfach sein, derartige Informationen zu
erhalten, weil man eine Referenzladungsverteilung definieren müßte, bezügAllgemeine Chemie.
Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008
100
4 Chemische Konzepte
lich derer dann eine Ladungserniedrigung oder -erhöhung angegeben werden
kann.
Auf den ersten Blick vereinfacht sich diese Situation, wenn wir die Ladung
der Atome in einem Molekül bestimmen könnten und mit der Ladung eines
isolierten, elektrisch neutralen Atoms vergleichen, also das Konzept der Partialladungen einführen. Bei genauerer Betrachtung erweist sich dies aber als
schwierig, weil wir in der Quantenmechanik der Moleküle gar nicht über Atome in Molekülen sprechen, sondern über Elektronen und Atomkerne. Atome
kamen in der Molekülbeschreibung in den Kapiteln 2 und 3 nicht vor, ergo
wird es schwierig sein, Atome in Molekülen zu definieren. Diese Situation
läßt sich durch ein sehr einfaches Gedankenexperiment verdeutlichen: Angenommen wir wandern durch die Elektronendichte ρ A− B (r ) von einem Atomkern A zu einem anderen Atomkern B in einem Molekül A − B, dann werden
wir nicht an einem Grenzposten vorbeikommen, der uns sagen würde, dass
nun Atom A aufhört und Atom B beginnt, so dass wir ρ A− B (r ) auf die beiden
Atomen eindeutig aufteilen könnten
ρ A − B (r ) = ρ A (r ) + ρ B (r )
(4.1)
Aus genau so einer Aufteilung könnten wir aber leicht die Zahl der Elektronen
durch Integration der Einzeldichten berechnen
N
=
Z +∞
=
Z
−∞
3
d rρ
A−B
(r ) =
Z +∞
−∞
3
A
d r ρ (r ) +
Z
Z +∞
−∞
d3 r ρ B ( r )
d3 r ρ A ( r ) +
d3 r ρ B (r ) = NA + NB
Atom A
Atom B
|
{z
} |
{z
}
(4.2)
≡ ( Z A − NA ) e
(4.3)
≡ NA
≡ NB
die wir den Atomen zuordnen wollen, also NA und NB . Mit diesen Elektronenzahlen können wir Partialladungen der Atome, q A und q B , durch Differenzbildung mit der Elektronenzahl der neutralen, isolierten Atome, die wir
aus den Kernladungszahlen berechnen können, erhalten
qA
qB
≡ ( ZB − NB )e
(4.4)
Der Schlüssel zu diesen Größen liegt aber, wie bereits eingangs gesagt, in der
Definition des Raumbereichs, der von einem Atom im Molekül eingenommen
wird. Es wurden verschiedene Definitionen vorgeschlagen, um Atome in Molekülen wieder zu finden. Die Wahl ist anthropogen und daher kann keine
Definition von Partialladungen eindeutig sein. Anders gesagt: verschiedene
Protkolle zur Berechnung von Partialladungen wurden vorgeschlagen, die alle nützlich sind, aber auf keinen Fall vermischt werden dürfen.
4.1 Ladungsverteilung und Partialladungen
Paulings Einführung des Begriffs der Elektronegativität versucht das Problem der Definition eines Raumbereichs für ein Atom in einem Molekül zur
Berechnung von Partialladungen durch Verwendung und Mittelung beobachtbarer Größen zu umgehen. Zunächst definiert er Elektronegativität als
die Fähigkeit eines Atoms in einem Molekül, Elektronen an sich zu ziehen.
Dadurch versucht er anzugeben, wo im Molekül negative Ladung angehäuft
werden kann, während an anderen Orten im Molekül entsprechend Elektronendichte fehlt, also eine positive Partialladung zurückbleibt. Die Elektronegativität muß aus Meßgrößen berechnet werden. Auch hier hat man viele Optionen, die sämtlich zu verschiedenen, miteinander nicht kompatiblem Elektronegativitätsdefinitionen geführt haben. Pauling verwendete thermodynamische Daten, namentlich Bindungsenergien von Molekülen, hauptsächlich
weil diese damals in ausreichender Menge zur Verfügung standen. Konzeptionell wäre es offensichtlicher gewesen, Energien zu verwenden, die mit dem
Entfernen und dem Hinzufügen eines Elektrons verknüpft sind, also mit Ionisierungsenergien und Elektronenaffinitäten. Gemessene Elektronenaffinitäten
hatte Pauling damals aber nicht zur Verfügung.
Atome in Molekülen wieder zu finden ist also nicht so leicht, wie man dies
vielleicht erwartet hätte. Das bedeutet aber natürlich nicht, dass es keine Atome gibt. Wir können leicht Reaktionen definieren, bei dem zwei Atome ein
Molekül bilden oder ein Molekül in ein Atom und ein weiteres Fragment
entfällt. Ferner enthalten Moleküle die Zentren der Atome, die Atomkerne.
Lediglich die Vorstellung eines Atoms, das einen wohl definierten Raumbereich einnimmt, führt zu Schwierigkeiten, wenn man dies in einem Molekül
versucht. Für isolierte Atome, das heißt für Atome, die hinreichend weit von
anderen Atomen oder Molekülen entfernt sind, ist dies einfacher, weil sie kugelsymmetrisch sind und die atomare Elektronendichte exponentiell abfällt
(folgend dem exponentiellen Abfall der Wellenfunktion und der Orbitale aus
denen sie berechnet wird).
101
Anhang
103
A
Rechenregeln
Im folgenden seien einige oft benötigte Rechenregeln zusammengefaßt. Dabei
wird der Kürze halber recht wenig Wert auf mathematische Präzision und
Rigorosität gelegt.
A.1
Infinitesimalrechnung
A.1.1
Totale und partielle Ableitung
Eine partielle Ableitung wird genauso gebildet wie die totale, nur werden alle
Variablen bis auf diejenige, nach der abgeleitet wird, als konstant angesehen.
Um diese beiden Ableitungen zu unterscheiden, wird das Differential dx der
totalen Ableitungen zu einem ∂x für die partielle Ableitung. Wenn wir also
zum Beispiel eine Funktion von zwei Variablen x und y
f ( x, y) = yx 2 + y
(A.1)
studieren, dann ergibt sich die partielle Ableitung nach x (also unter Konstanthalten der Variablen y ausgedrückt durch den Index an der Klammer)
als
∂ f ( x, y)
= 2yx
(A.2)
∂x
y
Eine totale Ableitung, die die Annahme nicht macht, dass y bezüglich der
Ableitung konstant zu halten ist, wird dagegen allgemein geschrieben als
∂ f ( x, y)
∂ f ( x, y)
dx
dy
d f ( x, y)
+
=
(A.3)
dx
∂x
dx
∂y
dx
y |{z}
x
=1
Allgemeine Chemie.
Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008
104
A Rechenregeln
wenn die Funktion f nur von zwei Variablen abhängt. Diese Ableitung erhält
man aus dem sogenannten totalen Differential d f der Funktion,
∂ f ( x, y)
∂ f ( x, y)
d f ( x, y) =
dy
(A.4)
dx +
∂x
∂y
y
x
Totale Differentiale spielen eine entscheidende Rolle in der Thermodynamik
und können auch geometrisch interpretiert werden.
Für das spezielle Beispiel in Gl. (A.1) erhalten wir dann
d f ( x, y)
dy
= (2yx ) + ( x2 + 1)
dx
dx
(A.5)
A.1.2
Kettenregel
Bei vielen Ableitungen physikalischer Größen muß man beachten, dass Ableitungen Schritt für Schritt vorzunehmen sind. Allgemein kann man schreiben
d f [ g( x )]
d f dg
=
dx
dg dx
(A.6)
(wobei diese Regel für totale und partielle Ableitungen gleichermaßen gilt).
Man beachte als Merkregel, dass die Ableitung auf der linken Seite entsteht,
wenn man rechts dg ‘kürzt’.
√
Als Beispiel leiten wir die Funktion f ( x ) = (1/ x )2 ab, wobei offensicht√
lich g = x zu wählen ist
√ −3 1 −1/2
1
d f (x)
x
= −2
x
= − x −4/2 = − 2
dx
x
|
{z
} |2 {z }
d f /dg
(A.7)
dg/dx
was sicherlich richtig ist, da wir die Funktion auch hätten vereinfachen kön√
nen zu f ( x ) = (1/ x)2 = 1/x, so dass sich direkt die Ableitung nach x zu
f ′ ( x ) = −1/x2 ergibt.
A.1.3
Produkt- und Quotientenregel
Leitet man ein Produkt von zwei Funktionen u und v, die je nur von einer
Variablen abängen sollen, ab, dann muß man die sogenannte Produktregel beachten:
(uv)′ = u′ v + v′ u
(A.8)
Mit dieser Regel läßt sich auch sofort der Quotient zweier Funkionen ableiten
als
′
u ′ 1 ′
u′
v′
1
′1
=u +
u=
= u
+ − 2 u
(A.9)
v
v
v
v
v
v
A.2 Differentialgleichungen
wobei die Kettenregel bei der Ableitung von 1/v zu beachten ist, da v selbst
noch von der Variablen abhängt, nach der man ableitet. Die rechte Seite läßt
sich kompakt auf einen Hauptnenner bringen
u ′
v
=
u′ v − v ′ u
v2
(A.10)
und ergibt einen Ausdruck der Quotientenregel genannt wird.
A.1.4
Partielle Integration
Bei der Integration von einem Produkt zweier Funktionen ist die ‘umgekehrte
Produktregel’ zu beachten. Wenn wir also die Ableitungen in Gl. (A.8) integrieren, so ergibt sich
Z
(uv)′ =
Z
u′ v +
Z
v′ u
(A.11)
was wir schreiben können als
[uv] =
Z
′
u v+
Z
v′ u
(A.12)
wobei die Grenzen der Stammfunktion, [uv], auf der linken Seite weggelassen
wurden. Obige Gleichung ist in der Form
Z
u′ v = [uv] −
Z
v′ u
(A.13)
als partielle Integration bekannt.
A.2
Differentialgleichungen
In der Chemie und Physik kommen Differentialgleichungen ubiquitär vor
(beispielsweise in der Kinetik oder in der Quantenmechanik). Beim Lösen einer Differentialgleichung wird die Lösungsfunktion bestimmt.
A.2.1
Gewöhnliche Differentialgleichungen
Hängt die Lösungsfunktion nur von einer Variablen ab, so spricht man von
einer gewöhnlichen Differentialgleichung. Die mathematische Theorie gewöhnlicher Differentialgleichungen ist abgeschlossen. Das bedeutet, dass jede gewöhnlich Differentialgleichung gelöst werden kann.
105
106
A Rechenregeln
Die Lösung kann auf zwei Arten erfolgen. Zum einen existiert ein ganzer
Satz von Regeln, die auf bestimmte Typen von Differentialgleichungen angewendet werden können. Ein Beispiel haben wir kennengelernt beim radioaktiven Zerfall, bei dem wir die Differentialgleichung, die die Veränderung der
Stoffmenge beschreibt, durch Variablenseparation lösen konnten. Eine gute
Übersicht über alle diese “Lösungsrezepte” bieter Kreyszig [8].
Es gibt allerdings ein Rezept, das bei jeder gewöhnlichen Differentialgleichung zum Ziel führt. Dies ist ein Potenzreihenansatz für die Lösungsfunktion,
∞
y( x ) =
∑ ak x k
(A.14)
k =0
Die Entwicklungskoeffizienten ak werden bestimmt, indem man den Ansatz
in die entsprechende Differentialgleichung einsetzt und versucht, eine Rekursionsbeziehung für die Koeffizienten zu finden, so dass alle Koeffizienten bekannt sind, wenn man erst einmal den ersten festgelegt hat.
A.3
Eine Herleitung der Wellengleichung
Im folgenden soll die sogenannte Wellengleichung zur Beschreibung des
räumlichen und zeitlichen Verhaltens einer Auslenkung u = u( x, t) hergeleitet werden. Die präsentierte Ableitung stellt eine mögliche Ableitung dar,
andere sind denkbar. Der Einfachheit halber betrachten wir die Ausbreitung
dieser Auslenkung nur in einer Raumrichtung (in x-Richtung). Die Auslenkung u kann zum Beispiel die Auslenkung einer Saite sein; s. Abb. 1. Um die
Saite auszulenken, muß Arbeit verrichtet werden, was die potentielle Energie
erhöht.
u
t
Propagation in x mit der Zeit t
u
i−1 ui
x x
1
2
x x
i−1 i
xN
x
Abb. 1: Ausbreitung einer Auslenkung in Zeit und Raum.
A.3 Eine Herleitung der Wellengleichung
Schreiben wir die potentielle Energie als Produkt aus auslenkender Kraft
F mal Dehnung der Saite exemplarisch für den in Abb. 1 eingezeichneten
schwarzen Bogen, so erhalten wir
(A.15)
E pot = F · ∆l
wobei ∆l die Verlängerung der elastischen Saite im dargestellten Bogen ist,
also den Unterschied zwischen neuer Länge des Bogens lneu und der zugehörigen relaxierten Bogenlänge l alt angibt. Wenn wir die Strecke in x-Richtung,
über die sich der Bogen der ausgelenkten Saite ausdehnt, in N Abschnitte gleicher Breite ∆x unterteilen (markiert durch die grünen xi in Abb. 1), so ergibt
sich die relaxierte Länge der Saite in dem betrachteten Bogen zu
(A.16)
l alt = N · ∆x
In jedem Intervall xi−1 bis xi kann nun die Länge der Saite nach dem Satz von
Pythagoras berechnet werden als,
q
q
l ( xi ) − l ( xi−1 ) = ( x i − xi−1 )2 + (ui − ui−1 )2 = ∆x2 + (ui − ui−1 )2 (A.17)
wobei ui = u( xi ) und ui−1 = u( xi−1 ).
Die (Gesamt-)Längenänderung der Saite in dem betrachteten Bogen ergibt
sich nun durch Aufsummation der einzelnen Teillängen zu
N q
N
( A.17)
∆l
=
∑ [l (xi ) − l (xi−1)] − l = ∑ ∆x2 + (ui − ui−1)2 − l
i =1
i =1
( A.16)
=
=
∆x
∆x


N
s
i∑
=1
s
N 
∑
i =1
1+
1+
u i − u i −1
∆x
2
−N
u i − u i −1
∆x
2
−1





(A.18)

Damit läßt sich die potentielle Energie aus Gl. (A.15) schreiben als
s

2

N 
u i − u i −1
1+
−1
E pot = F · ∆x ∑


∆x
i =1
(A.19)
u − u i −1
< 1, so dass die WurFür kleine Auslenkungen gilt für die Steigung i
∆x
zel in eine Taylor-Reihe entwickelt werden kann,
("
#
)
N
1 u i − u i −1 2
1+
E pot = F · ∆x ∑
+··· −1
(A.20)
2
∆x
i =1
N u i − u i −1 2
1
(A.21)
F · ∆x ∑
≈
2
∆x
i =1
107
108
A Rechenregeln
Wir betrachten nun ein Stück der Saite im Bogen an einem Ort xi . Bei der
Auslenkung wirkt eine Kraft senkrecht zur x-Richtung,
Fi = −
∂E pot
∂ui
(A.22)
Mit Gl. (A.21) können wir die partielle Ableitung per Kettenregel auswerten,
∂E pot
1
1
= F · ∆x
[2(ui − ui−1 ) − 2(ui+1 − ui )]
∂ui
2
(∆x )2
(A.23)
wobei man beachten muß, dass ein ui in zwei Summanden von Gl. (A.21)
auftritt (weil bei der partiellen Differentiation alle u j 6= ui als Konstanten zu
behandeln sind, fallen alle Summanden, die nicht ui enthalten, als Konstanten
weg und die Summe kollabiert zu zwei Termen). So erhalten wir für die Kraft
Fi , die auf das i-te Saitenstück wirkt, nach Gl. (A.22),
Fi = − F · ∆x
1
[2ui − ui−1 − ui+1 ]
(∆x )2
(A.24)
Die rechte Seite dieser Gleichungen können wir umschreiben unter Verwendung der Taylor-Entwicklungen,
1
ui±1 = u( xi ± ∆x ) = u( xi ) ± u′ ( xi )∆x + u′′ ( xi )(∆x )2 + · · ·
2
(A.25)
die sich kombinieren lassen zu
i
h
2ui − ui−1 − ui+1 = −(∆x )2 u′′ ( xi ) + O (∆x )3 ≈ −(∆x )2 u′′ ( xi )
(A.26)
Fi = F · ∆xu′′ ( xi )
(A.27)
Damit erhalten wir für die Kraft in Gl. (A.24),
Nun kann aber Fi nach Newton geschrieben werden als
Fi = mai = m
d2 u i
d2 u
= ρ · ∆x 2i
2
dt
dt
(A.28)
wobei m die Masse des Saitenstücks am Orte xi ist, die wir ausdrücken können
durch eine (eindimensionale) Dichte ρ (mit Einheit Masse pro Länge) als m =
ρ · ∆x.
Setzen wir Gln. (A.27) und (A.28) gleich, so erhalten wir eine Differentialgleichung für ui ,
ρ · ∆x
d2 u i
= F · ∆x u′′ ( xi )
dt2
(A.29)
A.3 Eine Herleitung der Wellengleichung
Diese Gleichung können wir auf beiden Seiten durch ∆x teilen. Ferner bemerken wir, dass die Gleichung für jeden beliebigen Ort xi gilt, so dass wir den
Index i fallenlassen können. Hier zeigt sich nun auch, warum es egal ist, welchen Bogen der Welle wir für unsere Betrachtungen auswählen. Es ergibt sich
eine partielle Differentialgleichung zweiter Ordnung,
ρ
d2 u
= Fu′′ ( x )
dt2
(A.30)
Wenn wir die Parameter F und ρ auf eine Seite bringen, bemerken wir, dass
der Quotient F/ρ von der Dimension her einem Geschwindigkeitsquadrat
p
entspricht. Mit der Defintition der Ausbreitungsgeschwindigkeit v ≡ F/ρ
erhalten wir schließlich
2
d2 u( x, t)
2 d u( x, t )
=
v
dt2
dx2
(A.31)
die Wellengleichung, die uns die Veränderung der Auslenkung u mit dem Ort
und der Zeit beschreibt.
109
110
Literatur
Literatur
1 Peter W. Atkins, Julio De Paula. Physikalische Chemie. Wiley-VCH, Weinheim, 4. ed.,
2006.
2 Donald A. McQuarrie, John D. Simon.
3 R. Stephen Berry, Stuart A. Rice, John
Ross. Physical Chemistry. Oxford University Press, Oxford, 2. ed., 2000.
4 Gerd Wedler. Lehrbuch der Physikalischen
Chemie. Wiley-VCH, Weinheim, 5. ed.,
2004.
5 Paul A. Tipler, Gene Mosca. Physik: Für
Wissenschaftler und Ingenieure. Spektrum
Akademischer Verlag, Weinheim, 2. ed.,
2006.
6 Robert Bruce Lindsay, Henry Margenau.
Foundations of Physics. Ox Bow Press,
Woodbridge, 1981.
7 Henry Margenau, George Moseley Murphy. Die Mathematik für Physik und Chemie
I. Verlag Harri Deutsch, Frankfurt, 1965.
8 Erwin Kreyszig. Advanced Engineering Mathematics. John Wiley & Sons, New York,
7. ed., 1993.
111
Index
α-Strahlen 47
α-Teilchen 33
β-Strahlen 47
γ-Strahlen 47
Öltröpfchenversuch 31
Ableitung
– partiell, 18, 103
– total, 18, 103
Absorption 43
actio 10
antibindendes Molekülorbital 97
Arbeit 11
Atom 1
Atomkern 33
Aufenthaltswahrscheinlichkeit 62
Balmer-Serie 43
Beschleunigung 8
Bewegungsbahn 9
Bewegungsenergie 11
bindendes Molekülorbital 97
Bohr
– Atommodell, 43
– Radius, 45
Born Interpretation 62
Born–Oppenheimer-Näherung
75, 84
Bosonen 72
Brackett-Serie 44
Coulomb-Kraft 16
Dalton 1
Dichte
– Aufenthaltswahrscheinlichkeit,
62
– Ladung, 99
– radial, 79
Differentialgleichung 105
– 1. Ordnung, 48
diffuse 79
Dimension 22
Drehimpuls
– Definition, 69
– Quantenzahl, 70
Druck 23
Effekt
– photoelektrischer, 42
Eigenfunktion 57
Eigenwert 57
Eigenwertgleichung 57
Einheiten 21
Elektromagnetismus 35
Elektron 28
Elektronegativität 101
Elektronendichte 99
– radial, 79
Elektronenkonfiguration 86
Elektrostatik 16
Elementare Abstraktion 8
Emission 43
Energie 11
Allgemeine Chemie.
Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008
112
Index
– gesamt, 16
– kinetische, 11
– klassische Mechanik, 16
– potentielle, 14
Energiequanten 42
Entartung 70
– zufällige, 80
Erwartungswert 65
Feder 24
Feldstärke 18
Fermionen 72
Fock-Operator 92
Fraunhofersche Linien 43
fundamental 79
Gesamtenergie 16
Geschwindigkeit 6
Geschwindigkeitsgesetz 48
Geschwindigkeitskonstante 48
gewöhnliche Differentialgleichung 105
Gravitationsgesetz 15
Grenzwert 7
Halbwertszeit 49
Hamilton
– Funktion, 17
– Operator, 55
harmonische Schwingung 25
harmonischer Oszillator 73
Hauptquantenzahl 79
Heisenberg
– Unschärfe, 67
Impulsdarstellung 69
Infinitesimalrechnung 103
Isotop 34
Isotopeneffekte 54
Kanalstrahlen 32
Kathodenstrahlen 28
Kernzerfall 46
Kettenregel 19, 104
Kinetik 47
– 1. Ordnung, 48
kinetische Energie 11
klassische Mechanik 6
Kommutator 67
Konzepte 99
Korrespondenzprinzip 56
Kraft 9
Kraftfeld 24
Kraftflußdichte 29
Kraftkonstante 24
Kronecker-Delta 68
Kugelflächenfunktionen 70, 78
Kugelkoordinaten 20
Ladungsdichte 99
Lageenergie 14
Laplace-Operator 35
LCAO 93
Lebenszeit 49
Licht 35
Lichtgeschwindigkeit 35
Limes 7
Linearkombination
– Atomorbitale, 93
Lorentz-Kraft 29
Lyman-Serie 44
Masse
– reduzierte, 75
Massenzahl 34
Materiewelle 40
Maxwell 35
Mechanik
– klassische, 6
Millikan 31
Mischungen 27
Mittelwert 65
MO-Diagramm 96
MO-Koeffizienten 93
Molekülorbital
Index
– antibindend, 96, 97
– bindend, 96, 97
– nichtbindend, 97
Molekülorbitalkoeffizienten 93
Multiplizität 91
Neutron 34
Newton 16
– Axiome, 9
– Bewegungsgleichung, 9
– Gravitationsgesetz, 15
Ockhamsches Rasiermesser 53
Operator 19
– Hamilton, 55
Orbitale 84
Orbitalenergie 92
Ordnungszahl 34
Ortsdarstellung 57, 69, 82
Partialladung 100
partielle Ableitung 18, 103
partielle Integration 105
Paschen-Serie 44
Pauli-Prinzip 83, 88
Pauling, Linus 101
Permeabilität 35
Pfund-Serie 44
photoelektrischer Effekt 42
Photon 37
Polarkoordinaten 20
Potential 18
potentielle Energie 14
Potenzreihe 13, 106
principal 79
Produktregel 104
Proton 32
Quantelung 43
Quanten 42
quantenchemische Berechnungen
99
Quantenzahl 57, 87
– Drehimpuls, 70
– Haupt-, 79
– magnetische, 70
– Schwingungs-, 74
– Spin, 71
Quotientenregel 105
radiale Dichte 79
Radialfunktion 77
Ratenkonstante 48
reactio 10
Reaktionsgeschwindigkeit 47
Reaktionsrate 47
reduzierte Masse 75
Reibungsgesetz 32
Reinstoffe 27
Roothaan-Gleichung 94
Rotationsenergie 76
Rutherford 33
Schrödinger-Gleichung 55
– stationär, 59
Schwingung
– harmonische, 25
Separationsansatz 60
– zeitabhängige SchrödingerGleichung, 61
sharp 79
Slater-Determinante 86
Spin 71
Spinorbitale 87
Stokes 32
Streuexperiment 33
Taylor-Reihe 13
Teilchen
– im Kasten, 72
Teilchendichte 64
Teilchenverteilung 64
Termschema 58
Termsymbol 89, 90
totale Ableitung 18, 103
113
114
Index
Trägheitsmoment 77
Trajektorie 9
Welle–Teilchen-Dualismus 38
Wellenfunktion 54
Ultraviolettkatastrophe 42
Unschärfe-Relation 67
Zentrifugalpotential 79
Zerfallsprozesse 46
zufällige Entartung 80
Zustandsfunktion 54
Variablentrennung 48
Wasserstoff-Atom 74
Herunterladen