I II Allgemeine Chemie (Physikalische Chemie 0) Markus Reiher Skript, April 2009 Copyright © Prof. Dr. Markus Reiher, ETH Zürich 29. Juni 2009 V Inhaltsverzeichnis Vorwort 1 IX Erste Schritte zur Theorie der Chemie 1.1 1.2 1 Begriffsbildung und Naturgesetze 1 1.1.1 Die Atomidee 1 1.1.2 Das molekulare Programm und chemische Konzeptbildung 3 1.1.2.1 Ein Beispiele für Fortgeschrittene 3 1.1.2.2 Grundannahme der Theorie der Chemie 5 1.1.3 Elementare Abstraktion 6 1.1.3.1 Geschwindigkeit 6 1.1.3.2 Beschleunigung 8 1.1.3.3 Newtons Axiome 9 1.1.4 Elementare physikalische Begriffe 10 1.1.4.1 Impuls 10 1.1.4.2 Arbeit und Energie 11 1.1.4.3 Kinetische Energie 11 1.1.4.4 Potentielle Energie 14 1.1.4.5 Gesamtenergie 16 1.1.4.6 Potential und Feldstärke 17 1.1.4.7 Kugelkoordinaten 20 1.1.5 Einheiten 21 1.1.6 Ein klassisches Modell der chemischen Bindung? 24 Schlüsselexperimente 26 1.2.1 Präparation des Untersuchungsobjekts 27 1.2.2 Kathodenstrahlen und das Elektron 27 1.2.2.1 Anwendung elektrischer und magnetischer Feldern 29 1.2.3 Der Millikan-Versuch 31 1.2.4 Kanalstrahlen 32 1.2.5 Das Rutherfordsche Streuexperiment 33 1.2.6 Neutronen 34 VI Inhaltsverzeichnis 1.2.7 1.3 2 Licht 35 1.2.7.1 Beugung und Interferenz 36 1.2.7.2 Quantennatur von Licht und der Welle–Teilchen-Dualismus 1.2.7.3 Elementarteilchen am Doppelspalt und die De Brogliesche Materiewelle 40 1.2.7.4 Der photoelektrische Effekt 42 1.2.8 Fraunhofersche Linien und das Bohrsche Atommodell 43 Radioaktivität und Kernstruktur 46 1.3.1 Zerfallsprozesse 46 1.3.1.1 α-Strahlen 47 1.3.1.2 β-Strahlen 47 1.3.1.3 γ-Strahlen 47 1.3.2 Kinetik radioaktiver Zerfälle 47 1.3.3 Nukleare Kettenreaktion 49 Einführung in die Quantenmechanik Postulate 51 51 2.1 2.1.1 2.1.2 2.1.3 2.1.4 2.2 2.3 3 Postulat 0: Elementarteilchen in der Chemie 52 Postulat 1: Zustandsfunktion 54 Postulat 2: Bewegungungsgleichung 55 Postulat 3: Meßwerte 57 2.1.4.1 Ortsmessung, Wahrscheinlichkeitsinterpretation und Normierung 62 2.1.4.2 Erwartungswerte 65 2.1.5 Postulat 4: Kommutatorbeziehungen 67 Quantenmechanische Drehbewegung und Spin 69 2.2.1 Drehimpulse in der Quantenmechanik 69 2.2.2 Der Stern-Gerlach-Versuch 70 2.2.3 Spin als quantenmechanischer Drehimpuls 71 Einfache quantenmechanische Modellsysteme 72 2.3.1 Das Teilchen im Kasten 72 2.3.2 Der harmonische Oszillator 73 2.3.3 Das Wasserstoff-Atom 74 Die chemische Bindung 3.1 81 Quantenmechanik für viele Teilchen 81 3.1.1 Energieoperatoren für Vielelektronensysteme 81 3.1.2 Postulat 5: Das Pauli-Prinzip 82 3.1.3 Trennung der Elektronen- und Kernbewegung 83 3.1.4 Slater-Determinante und Orbitale 84 3.1.5 Mehrelektronenatome 87 3.1.5.1 Spezielle Form des Pauli-Prinzip 88 37 Inhaltsverzeichnis 3.2 4 3.1.5.2 Termsymbole 89 Molekülorbitaltheorie 91 3.2.1 Quantenmechanische Gleichungen für Orbitale 3.2.2 Linearkombination von Atomorbitalen 92 3.2.3 Die Roothaan-Gleichung 93 3.2.4 Die chemische Bindung im Diwasserstoff 94 Chemische Konzepte 4.1 99 Ladungsverteilung und Partialladungen 99 Anhang A 102 Rechenregeln A.1 A.2 A.3 91 103 Infinitesimalrechnung 103 A.1.1 Totale und partielle Ableitung 103 A.1.2 Kettenregel 104 A.1.3 Produkt- und Quotientenregel 104 A.1.4 Partielle Integration 105 Differentialgleichungen 105 A.2.1 Gewöhnliche Differentialgleichungen 105 Eine Herleitung der Wellengleichung 106 Literatur 110 VII IX Vorwort Dieses Skript versucht eine ergänzende Ausformulierung des konzeptionellen Inhalts der Vorlesung “Allgemeine Chemie (PC)”. Es entsteht seit der Veranstaltung im Herbstsemester 2008 und versucht Ideen darzustellen, die in dieser Ausführlichkeit nicht an die Tafel gebracht werden können. Dieses Skript ersetzt weder die Vorlesung, noch die Übungen; das Skript ist lediglich als Ergänzung gedacht. Es ist auch nicht vollständig hinsichtlich des Inhalts der Vorlesung. Daher wird ebenfalls empfohlen, die relevanten Themen, die die Vorlesung besprach, ggf. in Lehrbüchern der Physikalischen Chemie [1–4] gezielt nachzulesen (für eine Einführung in die Physik kann das Buch von Tipler empfohlen werden [5]). Ferner eignet sich das sehr gute, detaillierte und maßgeschneiderte Skript von Professor F. Merkt und Mitarbeitern als ideale Vertiefung des Vorlesungsstoffs, weil sich dort eine umfangreiche Sammlung an Tabellen und Abbildungen findet, die in dem hier vorliegenden, eher narrativen Skript nicht auch noch geliefert werden konnte. Die hier vorliegenden Notizen sind ein Versuch eines physikochemischen Zugangs zur Einführung in die Theorie der Chemie, der gewöhnlich unter dem Begriff “Allgemeine Chemie” firmiert. Im Zuge der Standard-Darstellung kommt es oft zu vielen bewußt in Kauf genommenen Ungenauigkeiten, die auch arglos in Lehrbüchern repetiert werden und später zu großer Verwirrung führen können. Das Curriculum des Chemie-Studiums der ETH Zürich erlaubt den hier beschrittenen Zugang. Angesichts der zeitlichen Limitierungen dieses Einführungskurses ist ein Ziel die Darstellung der essentiellen theoretischen Grundlagen der Chemie in maximaler Kürze, ohne dabei jedoch die notwendige Präzision der Darstellung zu opfern. Allerdings wird es mir nicht gelingen in diesem ersten Versuch eines Skripts, alle Themen in gleicher, hinreichender Tiefe zu behandeln, trotzdem war es mir wichtig die prinzipielle Struktur der Vorlesung abzubilden. Falls sich Tippfehler in diesem Skript eingeschlichen haben sollten, obliegt es den LeserInnen, diese zu bemerken. Markus Reiher Allgemeine Chemie. Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008 Zürich, April 2009 1 1 Erste Schritte zur Theorie der Chemie 1.1 Begriffsbildung und Naturgesetze Viele Erkenntnisse wurden in der Chemie durch geschicktes Experimentieren in Kombination mit einfachen, aber sehr weitreichenden Vorstellungen gewonnen. Der Ausbildungsprozeß einer tragfähigen Begrifflichkeit zur Beschreibung der Experimente ist langwierig und seine historische Nachzeichnung nicht notwendigerweise nützlich, wie am grundlegendsten Begriff, nämlich dem des Atoms veranschaulicht werden soll. Schon Proust hatte bei Experimenten zu chemischen Reaktionen das Gesetz der konstanten Proportionen gefunden, mit dem er den regelmäßigen Aufbau der entstandenen chemischen Verbindungen beschrieb, ein Faktum, das wir heute durch eine Summenformel ausdrücken, die die Zusammensetzung einer chemischen Verbindung aus Atomen angibt. Das Gesetz der konstanten Proportionen wurde dann verallgemeinert zum Gesetz der multiplen Proportionen, weil man erkannt hatte, dass ein gegebener Satz an Atomsorten mehr als ein Molekül bilden kann. Schon bei der Beschreibung dieser Gesetze sind nun Grundvorstellungen über den Aufbau chemischer Verbindungen vorausgesetzt worden, die eine Erklärung leicht machen, aber erst von Dalton um das Jahr 1803 formuliert wurden. 1.1.1 Die Atomidee Dalton erklärte die zuvor entdeckten Gesetze über die Zusammensetzung chemischer Verbindungen durch die Adaption der Atomidee. Er formulierte dazu drei Axiome aus denen sich die uns heute bekannte Molekülchemie ableiten läßt: 1. Elemente bestehen aus Atomen. Alle Atome eines Elements sind (chemisch im wesentlichen) gleich, aber verschieden von denen anderer Elemente. Allgemeine Chemie. Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008 2 1 Erste Schritte zur Theorie der Chemie 2. Bei chemischen Reaktionen werden Atome zu chemischen Verbindungen (zu Molekülen) oder Moleküle in Atome zerlegt. 3. Eine gegebene chemische Verbindung besteht stets aus denselben Atomsorten im konstanten Mengenverhältnis. Diese Definition ist nun noch keineswegs eine physikalische. So ist nicht klar, ob ein Sauerstoffatom in einem Wasser-Molekül tatsächlich gleich ist zu einem Sauerstoffatom in einem Alkoholmolekül (tatsächlich ist dies nicht einmal heute ein triviales Problem). Die Anfänge der Chemie waren eher losgelöst von den Entwicklungen in der Physik. Die beiden Wissenschaften, die beide auf das Verständnis der Natur abzielten, kamen sich erst Jahrzehnte später näher. Daltons Atom-Definition hat daher sicher mehr mit der Unteilbarkeitsidee der alten Griechen (Demokrit) zu tun, auf die der Atom-Begriff letztlich zurückgeführt wird. Der Begriff des Atoms, des Unteilbaren, wird Demokrit zugeschrieben. Man sollte sich aber im klaren darüber sein, dass hier nur die Idee des Unteilbaren formuliert wurde. Die Atomvorstellung der alten Griechen könnte nicht verschiedener sein von derjenigen, die die Physik sorgfältig aufgrund von empirischen Befunden herausgearbeitet hat. Die Atom-Idee der alten Griechen beschreibt im wesentlichen die zwei Optionen, die man hat, wenn man beginnt, Materie immer weiter zu teilen. Besonders eindrücklich läßt sich dies zeigen für einen Kochsalzkristall. Kochsalz kristallisiert in großen Kuben, die man sukzessive zerkleinern kann. Zunächst sehen die kleinen Kochsalzkristalle immer noch kubisch aus, aber ab einer bestimmten Größe erscheinen die Kristallite eher pulverartig, so wie man es von handelsüblichem Salz gewohnt ist. Betrachtet man diese Kristallite aber unter einem Lichtmikroskop, dann ist die kubische Kristallform immer noch erkennbar. Wenn man nun weiter zerkleinert — durch beispielsweise Mörsern oder Mahlen der Kristallite — dann stellt sich die Frage, ob stets kleinere Kristallite entstehen oder ob man irgendwann eine kleine, nicht weiter teilbare Untereinheit vorfindet. Experimente zeigten früh, dass letzteres der Fall ist. Man gelangt an Unterheiten, die man Moleküle und Atome nennt. Solche und ähnliche Experimente veranlassten Proust zur Formulierung generalisierender und zusammenfassender Gesetze, wie dem Gesetz der multiplen Proportionen. Vom Standpunkt der modernen Atomidee aus werden diese Gesetze inzwischen als überflüssig betrachtet, weil sie aus den modernen Vorstellungen des molekularen Aufbaus der Materie abgeleitet werden können. Dalton brachte diese Beobachtungen zuerst auf den kleinsten gemeinsamen Nenner in seinen drei Axiomen. 1.1 Begriffsbildung und Naturgesetze 1.1.2 Das molekulare Programm und chemische Konzeptbildung Theoriebildung in der Chemie folgt heute dem so erfolgreichen “molekularen Programm” und beruht letztlich auf der physikalischen Beschreibung der elementaren Bausteine der Materie. Daher werden im folgenden zunächst wichtige elementare physikalische Konzepte eingeführt, bevor einige Schlüsselexperimente diskutiert werden können, die uns die elementaren Bausteine der Materie erkennen lassen. Schließlich wird die Theorie entwickelt, die die Dynamik dieser Elementarteilchen beschreibt und die uns letztlich in die Lage versetzt, die chemische Bindung, chemische Reaktionen und Eigenschaften von Molekülen zu verstehen und vorherzusagen. Die Chemie ruht daher auf einem Teil des Theoriegebäudes der Physik. Weil die Theorie von Vielteilchensystemen in der Physik nicht einfach zu handhaben ist, gleichzeitig aber die Chemie Wege gefunden hat, dem komplexen molekularen Geschehen durch einfache, den physikalischen Grundprinzipien angelehnte Begriffe näher zu kommen — typisch chemische Konzepte sind Elektronegativität, Nukleophilität und Partialladung —, wurde oft die Frage gestellt, inwieweit die Chemie tatsächlich auf der Physik fußt. An einem Beispiel soll demonstriert werden, wie wichtig eine klare Ausarbeitung des physikalischen Hintergrunds der Chemie für die chemische Argumentation ist. Für das Verständnis der folgenden Paragraphen ist allerdings schon eine gute Allgemeinbildung in der Chemie Voraussetzung. 1.1.2.1 Ein Beispiele für Fortgeschrittene Das erste Beispiel soll die moderne Biochemie und die Molekularbiologie der Zelle liefern. Der genetische Code liegt in materieller Form als Desoxyribonukleinsäure (DNS) vor. Er kann genweise umgeschrieben (transkribiert) werden in die Form einer Ribonukleinsäure (RNS). Jedoch kodiert nicht jeder DNS-Abschnitt für ein Protein. Manche Abschnitte erzeugen kurze RNSStränge, die für sehr komplizierte Regelungsprozesse unterschiedlichster Spezifität verantwortlich sind. Wie kann man nun die Stabilität der DNS oder die der RNS-Anlagerungen verstehen? Hier kann nur eine Theorie der Chemie helfen. Diese muß erklären, was die DNS-Doppelhelixstruktur so stabil macht oder wann Basenpaarung fehlerhaft sein kann. In der Regel laufen alle diese Erklärungen über energetische Größen. Ein molekulares Objekt mit geringerem Energieinhalt wird als günstig und daher stabil im Vergleich zu höher energetischen molekularen Anordnungen angesehen (die Thermodynamik lehrt uns, dass diese Betrachtungen eigentlich komplizierter sind, da so eine Aussage von den thermodynamischen Randbedingungen (Druck, Temperatur, Volumen) und auch von nicht nutzbaren ‘Energiebeiträgen’, der temperaturgewichteten Entropie, abhängt). 3 4 1 Erste Schritte zur Theorie der Chemie Lassen wir themodynamische Betrachtungen zunächst außen vor und nehmen wir an, dass wir einem Molekül eine Energie zuordnen können. Schnell ist man bei der Hand mit einer Erklärung, die eine Energieerniedrigung aufgrund der Ausbildung bestimmter Wechselwirkungen, die die Chemie oft Bindungen nennt, feststellen will. Im Falle der DNS wird man sagen, dass wir seit den Arbeiten von Linus Pauling wissen, wie Wasserstoffbrückenbindungen große Biomoleküle stabilisieren können. Woher aber kennen wir eine Bindungsenergie für eine Wasserstoffbrücke in einem DNS-Basenpaar? Diese wird sicherlich von der genauen Anordnung der Basen zueinander abhängen, die sich durch das Bewegungs- und Schwingungsverhalten der Doppelhelix ändern wird. Wenn ein Basenpaar durch drei Wasserstoffbrücken zusammengehalten wird, kann man ferner kaum eine einzelne dieser Bidnungen brechen, um so auf die Bindungsenergie zu schließen. Abgesehen davon machen wir nun implizit schon die Annahme, dass eine Wechselwirkung zweier Moleküle — zweier Basen in diesem Fall — tatsächlich auf nur die bindungsaufbauenden Atome reduziert werden kann. Tatsächlich wird diese Annahme nicht von der noch zu entwickelnden Theorie gedeckt. Die Verwendung des Begriffs ‘Wasserstoffbrückenbindung’ ist bereits eine dramatische Vereinfachung der tatsächlich auftretenden Wechselwirkungen in einem Basenpaar. Wir können a priori nicht einmal sagen, ob eine Wasserstoffbrücke in einem Basenpaar einzeln betrachtet werden kann oder ob in einem Basenpaar oder im gesamten DNA-Doppelstrang viele Wasserstoffbrücken kooperativ und daher schwer in einzelne Bindungsbeiträge zerlegbar sind. Die genaue Analyse der Doppelhelix-Stabilität wird noch dadurch erschwert, dass es neben den Wasserstoffbrücken andere Bindungstypen gibt, die man berücksichtigen muß (wenn wir der Einfachheit davon absehen, dass jede solche Bindungsklassifikation zwangsläufig eine konzeptionelle Vereinfachung ist, um mit molekularen Wechselwirkungen sprachlich kompakt umgehen zu können). Experimente zeigen nämlich, dass zum Beispiel zwei Benzol-Moleküle oder zwei Naphthalin-Moleküle in der Gasphase einander anziehen und Dimere bilden können. Wenn solche Beobachtungen im Experiment zuerst gemacht werden, belegt die Phänomenologie der Chemie diese mit neuen konzeptionellen Begriffen, die oft hilfreich zur Klassifizierung des chemischen Wissens sind, deren Bedeutung aber leicht überstrapaziert werden kann. In unserem Fall spricht man von π–π-Anziehung der π-Elektronen der Benzolringe (selbstverständlich setzt dies voraus, dass man zunächst verstanden hat, was π-Elektronen überhaupt sein sollen). Dieses Phänomen der π–π-Anziehung wird sich sicherlich auf die Wechselwirkung von aromatischen Purin- und Pyrimidin-Basen in der Sequenz von Paaren in der DNS übertragen lassen. Doch in welchem Verhältnis steht dieser Stabilisierungseffekt zu dem der Wasserstoffbrückenbindungen? Die Beurteilung der Situation wird noch weiter erschwert dadurch, dass die DNS in eine Lösungsmittel- 1.1 Begriffsbildung und Naturgesetze umgebung eingebettet ist, die das DNS-Molekül ebenfalls beeinflußt. Wasserstoffbrückenbindungen der Basen zu Lösungsmittelmolekülen treten in Konkurrenz zu denen der Basenpaarung. Selbst wenn die Wasserstoffbrücken zu den Wassermolekülen energetisch schwächer als die der Basenpaare wären, könnte dies durch eine größere Zahl an Lösungsmittelmolekülen wieder kompensiert werden. Wie könnten wir die energetische Stabilisierung in der DNS-Doppelhelix messen? Vielleicht gelingt es uns, einen experimentellen Aufbau zu finden, der es uns erlaubt, die zwei Stränge auseinanderzuziehen, wobei aber sicherlich auch Energie für die Verzerrung des DNS-Rückgrats aufgewendet werden muß. Aber selbst dann würden wir die erhaltene Energie noch nicht in eine energetische Beziehung zu alternativen DNS-Strukturen setzen können. Hätten wir dagegen eine Theorie, die es uns erlauben würde, dem DNS-Molekül eine Energie zuzuordnen, dann könnten wir auch anderen DNS-Strukturen eine Energie zuordnen und so besser verstehen, was die uns bekannte Doppelhelix so besonders macht. Entsprechend können wir fortfahren und schließlich besser verstehen, wie es um die Basenpaarung in der RNS steht. 1.1.2.2 Grundannahme der Theorie der Chemie Als Ausgangspunkt unserer Betrachtung gehen wir von der Erkenntnis aus, daß die Objekte der chemischen Forschung aus einer recht kleinen Zahl von elementaren Teilchen aufgebaut sind, die von der Physik durch geschicktes Experimentieren entdeckt wurden. Dieser Startpunkt ist einzig und allein durch seinen Erfolg gerechtfertig. Es hat sich gezeigt, daß sich die Chemie folgend dieser Maxime nicht nur verstehen, sondern sogar quantitativ berechnen und vorhersagen läßt. Dem molekularen Programm folgend können heute Reaktionswärmen, molekulare Strukturen und Eigenschaften basierend auf physikalischer Theorie vorhergesagt werden. Der Kern dieser Theorie ist die Annahme, dass wir lediglich das Bewegungsverhalten und die Interaktionen der elementaren Teilchen beschreiben müssen, um die gesamte unseren Sinnen zugängliche Erfahrungswelt beschreiben und verstehen zu können. Dies ist eine unglaublich starke Forderung, die durch unzählige Studien belegt ist: Die physikalische Theorie der Chemie erlaubt es, sämtliche chemische Reaktionen, Strukturen und Eigenschaften von Molekülen, sowie die chemische Bindung allein aufgrund einer Theorie des Bewegungsverhaltens von Elementarteilchen zu beschreiben. Diese Behauptung ist gleichermaßen weitreichend wie verblüffend. Ihr Wahrheitsgehalt und die volle Tragweite werden erst im Laufe der noch anzustellenden Diskussionen offenbar. Es ist allerdings jetzt schon klar, das nur ein einziges Gegenbeispiel, also ein einziges chemisches Phänomen, das nicht auf 5 6 1 Erste Schritte zur Theorie der Chemie die physikalische Theorie reduzierbar ist, ausreicht, um das Gedankengebäude ins Wanken zu bringen. Offene Fragen sind aber zunächst zum einen, was die für die Chemie relevanten Elementarteilchen sind, und zum anderen, wie die physikalische Theorie aussieht, die ihr dynamisches Verhalten beschreibt. Die physikalische Theorie, die wir zur Beschreibung und zum Verständnis der Chemie benötigen, soll nun schrittweise erarbeitet werden. Dabei werden wir uns allerdings auf das Minimum physikalischer Begriffe beschränken, um letzlich dem Ziel der Beschreibung der Moleküle und der Erklärung der chemischen Bindung zügig näher zu kommen. Der Physik ist es gelungen, diese Begriffe in sehr allgemeine Theorien einzubetten, auf die wir in diesem Rahmen aber nicht eingehen können. 1.1.3 Elementare Abstraktion Ein erster Schritt zur Theoriebildung ist die Präzisierung von Begriffen, die aus der Umgangssprache zur Beschreibung von dynamischen Prozessen bekannt sind. Dies ist der Weg zur Formulierung einer Theorie der Bewegung, die man klassische Mechanik nennt. Dazu ist es nützlich den Bewegungszustand eines makroskopischen Objekts, wie zum Beispiel eines Autos, quantitativ beschreiben und vorhersagen zu können. Die folgenden Betrachtungen sind bewußt sehr einfach gehalten. Ziel der Beschreibung ist es, zu zeigen, wie man spielerisch mit den Begriffen physikalischer Theorie in einem mathematischen Zusammenhang umgeht. Auch soll man mit möglichst wenig Vorkenntnissen auskommen können. Es geht nicht darum, eine Liste von in Stein gemeißelten Naturgesetzen herunterzubeten. Vielmehr soll explizit vorgeführt werden, wie theoretische Begriffe und mathematisch formulierte Gesetzmäßigkeiten ersonnen werden. Nur so kann die physikochemische Formulierung chemischer Phänomene und Gesetzmäßigkeiten als von Menschen gemachtes Vorstellungs- und Ideengebäude verstanden und durchdrungen werden. 1.1.3.1 Geschwindigkeit Es wird sicherlich notwendig sein, Begriffe wie “Schnelligkeit” oder “Geschwindigkeit” in mathematische Form zu gießen. Dazu bedient man sich im ersten Schritt der eigenen Anschauung. Offensichtlich ist die Geschwindigkeit v x mit der man von einem Ort x1 zu einem Ort x2 gelangt gleich dem Wegunterschied ∆x = x2 − x1 dividiert durch die dafür benötigte Zeit ∆t = t2 − t1 , ∆x (1.1) ∆t (das Zeichen ‘≡’ soll explizit andeuten, dass es sich um eine besondere Gleichheit von linker und rechter Seite handelt, nämlich um eine Definition). v̄ x ≡ 1.1 Begriffsbildung und Naturgesetze Auf dem Weg zum Ziel am Orte x2 kann man jedoch mal schneller, mal langsamer gelangt sein, also beschleunigt und gebremst (negativ beschleunigt) haben. Daher ist bei langen Fahrzeiten ∆t mit obiger Gleichung bestenfalls eine mittlere Geschwindigkeit definiert, was durch den Querbalken kenntlich gemacht ist. Hier wurde nun eine Bewegung in nur einer Richtung beschrieben, und wir wählten die x-Richtung aus. Diese Wahl ist willkürlich und daher läßt sich eine entsprechende Gleichung für jede der anderen beiden Richtungen y und z, die zu x orthogonal sind, formulieren. Wenn wir die Richtung allgemein α nennen und α ∈ { x, y, z}, dann können wir allgemein für eine der drei Richtungen schreiben, v̄α = ∆α ∆t (1.2) Weil eine solche Gleichung für jede Richtung unabhängig von den anderen gilt, schreibt man diese auch kompakt in vektorieller Form v̄ = ∆r ∆t (1.3) wobei der Ortsvektor definiert ist als r = (r x , ry , rz ) = ( x, y, z) und der Geschwindigkeitsvektor als v = (v x , vy , vz ). Generell werden solche mehrkomponentigen Größen hier und im folgenden durch fette Buchstaben gekennzeichnet. Der Einfachheit halber betrachten wir aber weiterhin nur eine Bewegung in x-Richtung. Oft ist es wichtig zu wissen, was die aktuelle Geschwindigkeit, die sogenannte Momentangeschwindigkeit, ist (zum Beispiel, wenn die Polizei eine Geschwindigkeitsübertretung feststellen will). Offensichtlich reduziert sich der Mittelungscharakter obiger Gleichung, wenn man die Weglänge in möglichst kurzen Zeitabständen mißt, so dass Änderungen der aktuellen Geschwindigkeit durch Beschleunigungen nicht ins Gewicht fallen. Im Extremfall ist konsequenterweise der Zeitunterschied zwischen Startzeit t1 und aktueller Zeit t2 unendlich klein zu wählen. Mathematisch können wir dies als Grenzwert (Limes) schreiben, v x ≡ lim ∆t →0 ∆x dx ≡ ∆t dt (1.4) Weil das Schreiben des Limes auf die Dauer zu umständlich wäre, werden die mit einem griechischen ∆ markierten Orts- und Zeitunterschiede durch ein infinitesimales “d” abgekürzt. Der elementar eingeführte Differenzenquotient ∆x/∆t ist so durch den Limesprozeß zu einem Differentialquotienten dx/dt geworden. Weil dies komponentenweise für alle x-, y- und z-Komponenten gilt, können wir auch kompakt in vektorieller Form für alle Komponenten gleich- 7 8 1 Erste Schritte zur Theorie der Chemie zeitig schreiben dr v= dt ⇔ vx dx/dt vy = dy/dt vz dz/dt (1.5) Mathematisch gesprochen ist also die Momentangeschwindigkeit gleich der ersten Ableitung des Ortes nach der Zeit. Ableitungen nach der Zeit werden oft durch Punkte über der abzuleitenden Funktion geschrieben, hier also dx/dt = ẋ. Letztlich wurde durch diese Art der Betrachtung von Newton und Leibniz die Infinitesimalrechnung, also das Rechnen mit unendlich kleinen Größen, in die Mathematik eingeführt. Sie ist auch unter dem Namen Differentialund Integralrechnung bekannt. Mathematik und Physik haben sich in der Geschichte oft gegenseitig befruchtet. Während hier die Physik die Definition der notwendigen mathematischen Werkzeuge erforderte, gab es aber auch physikalische Entdeckung (wie die der Quantentheorie), die auf schon entwickelte mathematische Theorien (gewöhnliche und partielle Differentialgleichungen, Funktionenräume) zurückgreifen konnte, wie wir noch sehen werden. Die Art, wie hier die Geschwindigkeit eingeführt wurde, haben Lindsay und Margenau [6] elementare Abstraktion genannt. Damit soll der ‘natürliche’ Zugang zur rigorosen quantitativen Beschreibung von Prozessen in der vom Menschen wahrgenommenen Umgebung gemeint sein. Inwieweit die reine Präzisierung alltäglicher Beobachtungen und umgangssprachlicher Begriffsvorbildungen ausreicht zur Mathematisierung der Welt wird sich noch erweisen müssen. Allein das Vorgehen der elementaren Abstraktion setzt schon einige Grundannahmen voraus, die wir nicht explizit erklärt haben — nämlich Vorstellungen von Raum und Zeit. Hier halten wir es zunächst mit Immanuel Kant, der glaubte, dass diese allen Menschen gemein sind (und tatsächlich scheint die moderne Hirnforschung hierfür auch Indizien in Form spezialisierter Nervenzellen gefunden zu haben). 1.1.3.2 Beschleunigung Wenn wir die Geschwindigkeit eines Objekts (wie das Auto im obigen Fall) ändern wollen, dann muß eine Kraft wirken. Diese Kraft kann eine (positive oder negative) Beschleunigung hervorrufen, die schließlich zu einer Geschwindigkeitsänderung führt. Diese Geschwindigkeitsänderung wiederum können wir im Sinne der elementaren Abstraktion ebenso gut zur Definition der Beschleunigung a x verwenden, a x ≡ lim ∆t →0 ∆v x dv x = ∆t dt (1.6) 1.1 Begriffsbildung und Naturgesetze oder in vektorieller Form für alle drei Raumrichtungen in einer Gleichung, a= dv dt (1.7) wobei wir direkt die Momentanbeschleunigung an Stelle eines Mittelwerts angeben. Damit wird die Beschleunigung zur zweiten Ableitung des Ortes nach der Zeit, a = v̇ = d (dr/dt) d2 r = 2 = r̈ dt dt (1.8) 1.1.3.3 Newtons Axiome Der Kraftbegriff wurde oben bereits im Zusammenhang mit der Beschleunigung verwendet, ein Zusammenhang der von Newton erkannt wurde und die Basis seiner drei Axiome der klassischen Mechanik ist: 1. Existenz von Inertialsystemen (Trägheitsprinzip): Es gibt Bezugssysteme (Koordinatensysteme), sogenannte Inertialsysteme, in denen die kraftfreie Bewegung eines (Punkt)teilchens durch eine konstante Geschwindigkeit beschrieben wird. Die läßt sich mathematisch ausdrücken als v = const. =⇒ v̇ = 0 (1.9) 2. Newtonsche Bewegungsgleichung in Inertialsystemen: Die Bewegung eines Teilchens in einem Interialsystem unter dem Einfluß einer Kraft F wird beschrieben durch die Newtonsche Bewegungsgleichung, F = ma (1.10) Hier wird implizit eine Masse m (die Trägheit des Teilchens als Proportionalitätskonstante eingeführt) angenommen, die unabhängig von der Geschwindigkeit ist und daher nicht von der Zeit abhängt. Die wirkende Kraft kann stets als vektorielle Summe aller wirkenden Einzelkräfte F i geschrieben werden, F = ∑i F i . Aus der Bewegungsgleichung läßt sich bei gegebenen Anfangsbedingungen, d.h. bei einem Ort r 0 ≡ r (t0 ) zu einer Zeit t0 und zugehöriger Geschwindigkeit v0 ≡ v (t0 ), jeder Ort in der Zukunft tz (und auch in der Vergangenheit) r (tz ) berechnen. Die zeitlich geordnete Sequenz dieser Orte r (t) nennt man Bewegungsbahn oder auch Trajektorie. 3. Prinzip von Actio=Reactio: Zu jeder Kraft (actio) F 12 , mit der ein (Punkt)teilchen 1 auf ein anderes 9 10 1 Erste Schritte zur Theorie der Chemie (Punkt)teilchen 2 wirkt, gibt es eine Gegenkraft (reactio) F 21 von gleichem Betrag aber entgegengesetzter Richtung, mit der Teilchen 2 auf Teilchen 1 wirkt, (1.11) F 12 = − F 21 Dieses Prinzip stellt ein generelles Prinzip der Physik und der Naturwissenschaften allgemein dar. Ohne dieses Prinzip könnte ein abgeschlossenes System von Teilchen, also eine Ansammlung von Objekten, die nicht mit einer Umgebung wechselwirken, gesamthaft Geschwindigkeit aufnehmen, Kräfte ausüben und Energie produzieren. Dies wird aber experimentell nicht beobachtet. 1.1.4 Elementare physikalische Begriffe Bevor wir Experimente diskutieren können, die uns Aufschluß über die Zusammensetzung von Atomen und Molekülen geben, müssen einige grundlegende physikalische Begriffe der Mechanik, der Elektrostatik und des Magnetismus eingeführt werden. Dazu sind zwei Dinge entscheidend: die richtige Vorstellung, die man sich von einem physikalischen Prozeß, wie etwa der Bewegung eines Teilchens, macht, und die Formulierung der Definitionen in Form mathematischer Gleichungen. Um letztere wird man nicht herumkommen, aber im Prinzip sind sie, wenn Schritt für Schritt erklärt, genauso leicht oder schwierig wie eine chemische Strukturformel. Die landläufige Meinung, daß ChemikerInnen oft nicht gut in Mathematik sind, kann nicht stimmen, wenn man sich anschaut, mit welcher abstrakten Formelsprache man in der Chemie arbeitet. Wahrscheinlich ist eher, dass man lediglich mehr Zeit in das Erlernen der chemischen als in das der mathematischen Formelsprache investiert hat. Daher ist die folgende Darstellung recht explizit und nahe an dem Material, das die Theorie der Chemie dann in späteren Kapiteln benötigt. 1.1.4.1 Impuls An Stelle der bisher verwendeten Geschwindigkeit wird oft die massebehaftete Geschwindigkeit, der sogenannte Impuls p, (1.12) p ≡ mv verwendet, weil für ihn ein Erhaltungssatz gilt. Mit obiger Definition des Impulses können wir Newtons Bewegungsgleichung auch schreiben als F= dp d ( m v) = = dt dt dm v dt} | {z =0 wenn m=const. +m dv dv =m dt dt (1.13) 1.1 Begriffsbildung und Naturgesetze 1.1.4.2 Arbeit und Energie Wenn in x-Richtung über eine Strecke ∆x = xend − xstart eine konstante Kraft Fx wirkt, dann wurde eine Arbeit ∆W = Fx ∆x an dem Teilchen geleistet, um seine Geschwindigkeit zu ändern. Wenn nun die Kraft über die Strecke variiert, dann muß man wiederum zu dem schon bekannten Trick greifen, um nicht mittlere Kräfte verwenden zu müssen: Man wähle die Streckenelemente so klein, dass die Kraft sicher als konstant angenommen werden kann, also infinitesimal klein: ∆x → dx. Wenn über eine infinitesimal kurze Strecke dx eine Kraft Fx wirkt, können wir die verrichtete Arbeit schreiben als dW=Fx dx. Die gesamthaft geleistete Arbeit W kann durch Integration, d.h. durch Summation der infinitesimalen Arbeitsbeiträge dW, erhalten werden, W= Z x end xstart dx Fx = Z E end Estart dW = Eend − Estart (1.14) Die skalare Größe W, die einem Teilchen zu- oder abgeführt wurde, ändert den Wert eines Reservoirs an “Arbeit”, das man Energie nennt. Der Anfangszustand dieses Reservoirs Energie, bevor es durch die verrichtete Arbeit geändert wird, sei die Energie Estart , während der energetische Endzustand Eend genannt sei. Energie wird oft definiert als die Fähigkeit Arbeit zu verrichten. Kräfte, die auf ein Teilchen wirken, können seine Energie ändern. 1.1.4.3 Kinetische Energie Für die bisher besprochenen Fälle bewegter Teilchen definiert man daher als relevante Energiegröße die kinetische oder auch Bewegungsenergie, die man mal als Ekin , mal als T abkürzt. Um einen Ausdruck für diese Bewegungsenergie zu erhalten, studieren wir den einfachen Fall eines ruhenden Teilchens, der keine kinetische Energie hat. Wenn wir also ein ruhendes Teilchen mit konstanter Kraft beschleunigen, so entspricht die dabei aufgewendete Arbeit genau der dem Teilchen zugeführten Bewegungsenergie. Generell gilt für den in einem Zeitintervall ∆t zurückgelegten Weg (s. Erklärung in Schema 1.1), 1 xend = xstart + v x,start∆t + a x,start (∆t)2 2 (1.15) wobei wir um den Punkt xstart entwickelt und die Ableitungen des Ortes nach der Zeit direkt durch die entsprechenden Ausdrücke für die Geschwindigkeit und die Beschleunigung am Start-Ort, um den wir entwickeln, ersetzt haben. Der obige Ausdruck vereinfacht sich für das zu Beginn ruhende Teilchen — v x,start = 0 — zu ∆x ≡ xend − xstart = 1 astart (∆t)2 2 (1.16) 11 12 1 Erste Schritte zur Theorie der Chemie Die Endgeschwindigkeit des Teilchens in x-Richtung errechnet sich einfach aus der konstanten Beschleunigung a x = a x,start, (1.10) v x,end = a x ∆t = W Fx ∆t = ∆t m ∆x m (1.17) woraus wir letztlich eine Gleichung für die kinetische Energie erhalten T ≡ Ekin ≡ W = v x,end m ∆x = m v x,end v̄ x ∆t (1.18) 1.1 Begriffsbildung und Naturgesetze Schema 1.1 Reihenentwicklung: Jede Funktion läßt sich als Summe von Entwicklungsparametern ak multipliziert mit der k-ten Potenz ihrer Variablen, hier x k , schreiben. Wenn man die Existenz einer Funktion vermutet, diese aber nicht in geschlossener Form (wie z.B. eine Exponentialfunktion y( x ) = exp x) kennt, dann kann man stets eine Potenzreihenentwicklung ansetzen, ! ∞ ∞ xk k y( x ) = ∑ ak x im Falle der e −Funktion : y( x ) = ∑ k! k =0 k =0 wobei wir um den Nullpunkt der Variable x entwickeln. Die Variable x sei eine beliebige Variable (es ist also nicht die Ortskoordinate in x-Richtung meint; x kann auch die Zeit sein, wie im Haupttext benötigt). Im Experiment kann man die noch unbekannten Entwicklungskoeffizienten ak durch eine Anpassung an Meßdaten erhalten — z.B. durch die Methode der kleinsten Fehlerquadrate (least-squares fit) oder Singulärwertzerlegung (singular value decomposition). Wenn k = 1, dann spricht man von einem linearen Fit und verwendet zur Anpassung die lineare Regression, ein Verfahren, das sich aus einem least-squares Fit ableiten läßt. Eine Potenzreihenentwicklung läßt sich noch genauer spezifizieren. Wenn die Potenzreihe am Ursprung, x = 0, l-mal abgeleitet wird, so erhalten wir einen expliziten Ausdruck für den l-ten Koeffizienten ! ! ! ∞ k d l ∑∞ dl y( x ) dl x k k =0 a k x = = a = al l! ∑ k dx l dx l dx l k =0 x =0 x =0 x =0 | {z } =0 wenn k 6 = l wobei alle Ableitungen für k < l verschwinden, während für k > l die Monome x k → l!x k −l Null werden am Ursprung, so dass nur der Term für k = l überlebt. Mit dem Wissen, jeden Entwicklungskoeffizienten als Ableitung ausgewertet am Entwicklungspunkt schreiben zu können, können wir die Potenzreihe explizit schreiben als sogenannte TaylorReihe ! ∞ 1 dk y xk y( x ) = ∑ k! dx k k =0 x =0 oder entwickelt um einen beliebigen Punkt xstart , dy 1 d2 y y( xend ) = y( xstart ) + ( ∆x )2 + · · · ∆x + dx x = xstart 2 dx2 x = xstart angeben, wobei ∆x = xend − xstart . Diese Reihenentwicklung läßt sich auf Funktionen verallgemeinern, die von mehr als einer Variablen abhängen. Die Taylor-Reihenentwicklung kann man sich wie folgt anschaulich vorstellen (s.a. Bild unten): Angenommen man hat beliebige Informationen über eine Größe y an einem Punkt xstart und kennt insbesondere ihre Steigung (erste Ableitung), Krümmung (zweite Ableitung), sowie alle höheren Ableitungen an diesem Entwicklungspunkt, so kann man die Funktion an einem Ort xend , an dem wir diese Informationen nicht besitzen, beliebig genau annähern (vorausgesetzt, die Reihe konvergiert, was nicht immer garantiert werden kann). y(x) In nullter Näherung ist y( xstart ) ≈ y( xend ), eine Verbesserung erlaubt die Ausnutzung der Steigung (1. Ableitung), Funktionswert hier gesucht die im Bild eingezeichnet ist. x x y(xend ) y( start) + y’(x start ) (xend − start) Weitere Verbesserungen können durch sukzessive höhere Ableitungen entsprechend der x x start xend Taylor-Reihe erhalten werden. an diesem Punkt seien y( x start ) sowie sämtliche Ableitungen von y bekannt 13 14 1 Erste Schritte zur Theorie der Chemie Weil sich die Geschwindigkeit konstant ändert durch die wirkende Kraft, ist ∆x/∆t nicht gleich der Endgeschwindigkeit, sondern eben nur die mittlere Geschwindigkeit. Die mittlere Geschwindigkeit ist aber leicht zu ermitteln. Da zu Beginn die Geschwindigkeit Null ist und dann linear wächst entsprechend Gl. (1.17) muß die mittlere Geschwindigkeit gleich der halben Endgeschwindigkeit sein, v̄ x = 1 v 2 x,end (1.19) und damit ergibt sich die kinetische Energie zu Ekin = 1 m v2x,end 2 (1.20) Dieses Ergebnis kann man auch direkt erhalten, wenn man das Zeitinterval in v x,end = a x ∆t [Gl. (1.17)] ersetzt durch einen Ausdruck, den man durch Umstellen von Gl. (1.16) erhält, s 2∆x ∆t = ± (1.21) ax so dass sich ergibt s r r p (1.10) 2∆x 2F∆x 2W v x,end = ± a x = ± 2a x ∆x = ± =± ax m m (1.22) was nach Quadrieren und Umstellen genau Gl. (1.20) ergibt. Dieser Ausdruck läßt sich auf drei Dimensionen verallgemeinern (indem man dieselbe Betrachtung auch für die y- und z-Richtungen anstellt, so dass die gesamte Bewegungsenergie die Summe der Bewegungsenergien in die drei Raumrichtungen ist, T = Tx + Ty + Tz = 1 2 1 2 1 2 mv + mv + mv 2 x 2 y 2 z (1.23) die sich wiederum kompakt unter Ausnutzung der skalaren Multiplikation von zwei Vektoren (hier Geschwindigkeit, v · v = v2 , beziehungsweise Impuls, p · p = p2 ) schreiben läßt als T= 1 2 p2 mv = 2 2m (1.24) wobei man anstelle der Vektoren auch direkt die Beträge (Längen) der Vektoren verwenden darf, also v2 = v2 oder p2 = p2 . 1.1.4.4 Potentielle Energie Die Definition einer Kraft entsprechend Gl. (1.10) oder Gl. (1.13) beschreibt ihre Auswirkung auf ein Teilchen mit Trägheit m (d.h. die Beschleunigung 1.1 Begriffsbildung und Naturgesetze dieses Teilchens). Es fehlen also noch Gleichungen, die die Quelle also das “Entstehen” (und nicht die Auswirkung) von Kräften beschreiben. Dazu betrachten wir zwei Beispiele: das Gravitationsgesetz und das Coulomb-Gesetz. Experimentell kann man mittels einer Gravitationswaage nachweisen, daß sich zwei Massen anziehen. Um also zwei Massen m1 und m2 auf einen Abstand r12 — berechenbar aus den Positionen der beiden Massen als Betrag des Differenzvektors r12 = |r 1 − r 2 | — zueinander zu bringen, muß eine Kraft aufgewendet werden, die der Gravitationskraft entgegen wirkt. Dabei wird Arbeit verrichtet, die in Form von Lageenergie gespeichert wird. Die Lageenergie, auch potentielle Energie genannt und in der Regel mit dem Symbol V belegt, hängt natürlich von der Natur der herrschenden Kraft ab. Im Falle der Gravitationsanziehung zwischen zwei Teilchen findet man experimentell eine Kraft, die proportional zum Produkt der Massen und invers proportional zum Quadrat des Abstands ist. Für den Betrag der Kraft können wir also schreiben FG = − G m1 m2 2 r12 und dann für die Lageenergie VG = − G m1 m2 r12 (1.25) wobei wir berücksichtigen, dass die beim Aufeinanderzubewegen verrichtete Arbeit zu einer Abnahme der potentiellen Energie führen muß, also E pot = − Z r end r start drFr (1.26) Die Proportionalitätskonstante G heißt Gravitationskonstante und kann durch Messung an einer Gravitationswaage experimentell bestimmt werden, G = 6, 67 · 10−11 N m2 /kg2 (s. weiter unten bzgl. der verwendeten Einheiten). Den Abstand berechnet man, wie schon erwähnt, aus den Positionen der beiden Massen, r 1 = ( x1 , y1 , z1 ) und r 2 = ( x2 , y2, z2 ) als q r12 = |r 1 − r 2 | = ( x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 (1.27) entsprechend den Vorschriften der Vektorrechnung. Der in Gl. (1.25) angegebene Ausdruck für den Betrag der Kraft drückt lediglich die experimentelle Beobachtung aus, dass die Anziehungskraft (negatives Vorzeichen), die zwei Massen aufeinander ausüben, jeweils proportional zum Betrag der Massen und umgekehrt proportional vom Quadrat ihres Abstands ist. Wir nutzen also bei dieser elementaren Abstraktion den ‘radialen’ Charakter der Gravitationskraft aus (sie hängt nur vom Abstand der Massen und nicht von deren Orientierung im Raum ab), eine Tatsache, die wir in Abschnitt 1.1.4.7 noch genauer, d.h. durch Definition eines problemangepaßten Koordinatensystems, ansehen werden. Wenn wir den vektoriellen Charakter der Kraft rekonstruieren möchten, dann müssen wir durch einen Einheitsvektor die Richtung angeben. Dieser Vektor er12 der Länge Eins zeigt von einer 15 16 1 Erste Schritte zur Theorie der Chemie Masse zur anderen und kann definiert werden als er12 ≡ r1 − r 2 r − r2 = 1 r12 |r 1 − r 2 | (1.28) so dass sich die (vektorielle) Gravitationskraft schreiben läßt als F G = −G m1 m2 r − r2 er12 = − Gm1 m2 1 2 |r 1 − r 2 |3 r12 (1.29) Interessanterweise findet man experimentell für zwei ruhende, miteinander im Vakuum wechselwirkende elektrische Ladungen (elektrostatische) Gesetzmäßigkeiten, die von derselben Form wie das Newtonsche Gravitationsgesetz sind. D.h. die elektrostatische Kraft, auch Coulomb-Kraft FC genannt, und die elektrostatische Lageenergie sind FC = 1 q1 q2 2 4πǫ0 r12 und VC = 1 q1 q2 4πǫ0 r12 (1.30) wobei anstelle der Gravitationskonstante der für die Elektrostatik gemessene Proportionalitätsfaktor, 1/4πǫ0 , eingeführt wurde (dieser hat nur in den sogenannten SI-Einheiten diese Form, s. unten). Die Konstante ǫ0 heißt Dielektrizitätskonstante des Vakuums. Da wir zu guter letzt die Wechselwirkung von Elementarteilchen, also den kleinsten Bestandteilen der Materie, studieren wollen, herrscht zwischen diesen zwangsläufig Vakuum, also materiefreier Raum. Eine allgemeinere Form des Kraftgesetzes, das auch für Medien, in denen die elektrostatische Wechselwirkung dann erfolgt, gilt, wird nicht benötigt. Es gibt noch einen wichtigen Unterschied zwischen Gravitationskraft und elektrostatischer Kraft. Die Gravitationskraft ist stets eine anziehende Kraft, weil Massen stets positiv sind. Es gibt aber zwei verschiedene Sorten Ladungen, die wir positiv und negativ nennen, wie sich experimentell gezeigt hat. Entsprechend können q1 und q2 positiv oder negativ sein. Ihr Produkt ist dann positiv, wenn beide Ladungen gleichnamig sind. In diesem Fall resultiert ein positives Vorzeichen und die beiden Ladungen stoßen sich ab. Wenn die beiden Ladungen aber entgegengesetztes Vorzeichen haben, also nicht gleichnamig sind, dann entsteht bei Produktbildung eine negative Zahl, die zur Anziehung zwischen den beiden Ladungen führt. 1.1.4.5 Gesamtenergie Die Gesamtenergie eines abgeschlossenen Systems von Teilchen bleibt erhalten. Anschaulich muß diese Eigenschaft aus ähnlichen Gründen gelten, die wir bereits bei Newtons drittem Axiom aufgeführt haben. Die Energie eines Teilchens hängt nun nicht nur von seinem Bewegungszustand ab (kinetische Energie T), sondern auch von seiner Lage gegenüber anderen Teilchen, die 1.1 Begriffsbildung und Naturgesetze mit ihm wechselwirken. Besteht ein System nun aus N Teilchen, so ist seine Gesamtenergie laut der Newtonschen Mechanik die Summe der kinetischen Energien, sowie die Summe der nicht doppelt gezählten Lageenergien, Egesamt = T1 + T2 + · · · + TN + V12 + V13 + · · · + V1N + V23 + V24 + · · · (1.31) +V2N + V34 + V35 + · · · + V3N + · · · + V( N −1) N N = ∑ Ti + i =1 N −1 N ∑ ∑ Vij (1.32) i =1 j > i wobei wir nur elektrostatische Kräfte zulassen wollen und die Indices jeweils angeben, für welche Teilchen die Ausdrücke für die kinetische und für die potentielle Energie zu schreiben sind, Ti = p2i 2mi und Vij = qi q j 1 4πǫ0 |r i − r j | (1.33) Der Ausdruck für die Gesamtenergie in Gl. (1.31) kann zu einem beliebigen Zeitpunkt mit den dann geltenden Orten und Impulsen ausgewertet werden. In einer viele Jahre nach Newton gefundenen Neuformulierung der klassischen Mechanik von Hamilton und Lagrange, die auf skalaren Energiegrößen statt vektoriellen Kräften basiert, kommt der Gesamtenergie Egesamt eine besondere Bedeutung zu, weshalb sie einen weiteren Namen bekommen hat. Man nennt sie auch Hamilton-Funktion H ≡ Egesamt . Als Beispiel sei die Gesamtenergie eines abgeschlossenen Systems zweier wechselwirkender elektrischer Ladungen q1 und q2 mit den zugehörigen Massen m1 und m2 gegeben, Egesamt = p21 p2 q1 q2 1 + 2 + = 2m1 2m2 4πǫ0 |r 1 − r 2 | 2 p2 1 q q2 ∑ 2mi i + 4πǫ0 |r 1 1− r2 | (1.34) i =1 wobei die Orte und die Impulse zu einem willkürlichen Zeitpunkt bestimmt werden können. 1.1.4.6 Potential und Feldstärke Wenn man nur eine Ladung (oder nur eine Masse) betrachtet, dann möchte man die Möglichkeit der Wechselwirkung mit anderen Ladungen (oder Massen) ausdrücken, ohne diese jedoch explizit zu verwenden. Letztere Ladungen (oder Massen) werden auch Probegrößen genannt, weil sie in einem Experiment eine Eigenschaft — die Ladung (oder die Masse) — unserer Ausgangsladung (oder Ausgangsmasse) proben. Es bietet sich daher eine weitere Abstraktionsebene an. Wenn wir zum Beispiel eine Aussage über die Masse unserer Erde hinsichtlich ihrer Anziehungskraft treffen wollen ohne ein massebehaftetes Teilchen als Probe für die Messung der potentiellen Energie oder 17 18 1 Erste Schritte zur Theorie der Chemie der Gravitationskraft zu verwenden, dann geben wir einfach diejenigen Teile der Gravitationsenergie oder Gravitationskraft an, die nicht von Eigenschaften einer solchen Probegröße abhängen. Wir lassen also die Probeeigenschaft (die zweite Masse) einfach weg, d.h. wir reduzieren die Energie- und KraftGesetze um die Probegröße. Aus der potentiellen Energie wird so das Potential und aus der Kraft so die Feldstärke. Leider werden die Begriffe “Potential” und “potentielle Energie” oft synonym gebraucht, obwohl sie nicht dasselbe meinen. Oft geht allerdings aus dem Zusammenhang hervor, ob die Lageenergie oder das zugehörige Potential gemeint ist. Gravitationspotential und elektrisches Potential lauten dann PG (r ) = − G m1 |r − r 1 | und PC (r ) = q1 1 4πǫ0 |r − r 1 | (1.35) wobei die ursprüngliche Position der Probegröße nun zu einem beliebigen Ort wird, r 2 → r, an dem die Eigenschaft geprobt werden kann. Der Abstand des Meßpunktes r vom Ort der Feldquelle, r 1 ist nun so gewählt worden, dass man einen positiven radialen Abstand erhält, wenn man die Quellenladung q1 in den Nullpunkt des Koordinatensystems verschieben würde, r 1 → 0, also |r 1 − r | = |r − r 1 | → |r − 0| = |r | = r. Man beachte die durchgängige formale Analogie dieser Gleichungen zu Gravitation und Elektrostatik (hier: das Potential ist stets Konstante multipliziert mit Materialeigenschaft dividiert durch den Abstand des Teilchens zum Meßpunkt). Die Feldstärken für Gravitation und Elektrostatik ergeben sich dann als negative Ableitung der Potentialausdrücke nach den Raumkoordinaten zu G(r ) = − Gm1 r − r1 |r − r 1 |3 und E (r ) = q1 r − r 1 4πǫ0 |r − r 1 |3 (1.36) wobei vektorielle, also gerichtete Größen entstehen, weil man ja nach den drei Raumkoordinaten ableiten muß. Die Nenner sind jedoch stets skalare Größen, da die Beträge (Längen) von Differenzvektoren zu verwenden sind. Dies ist konsistent mit der Tatsache, daß eine Kraft, also die Feldstärke multipliziert mit der Probegröße, natürlich auch eine vektorielle Größe ist (vgl. Gl. (1.29). Der Vektor der elektrischen Feldstärke E(r ) = E( x, y, z) darf nicht mit dem nicht fett geschriebenen Buchstaben für die Energie E, die eine skalare Größe ist, verwechselt werden. Um zu sehen, wie man auf die beiden Gleichungen für die Feldstärke kommt, leiten wir die Potentialausdrücke explizit ab. Diese Ableitung hat für jede der drei kartesischen Koordinaten r = ( x, y, z) separat zu erfolgen. Allerdings wird nicht die totale Ableitung, wie im Zusammenhang mit der Geschwindigkeit für die Zeit geschrieben, sondern die partielle Ableitung benö- 1.1 Begriffsbildung und Naturgesetze tigt (s. Anhang A.1.1). Weil in der Newtonschen Mechanik die Zeit stets unabhängig von den Raumkoordinaten ist (erst in der genaueren Einsteinschen Mechanik wird sich dies ändern), sind partielle und totale Zeitableitung einer mechanischen Größe gleich. Da dies unabhängig gilt von der physikalischen Größe, die abgeleitet wird, ist es nützlich die Operation ‘Zeitableitung’ ohne Angabe dieser Größe zu schreiben als, d Newton ∂ = (1.37) dt ∂t Diese mathematischen Objekte nennt man auch Ableitungsoperatoren. Der Begriff Operator bezeichnet also einen Satz mathematischer Operationen, die an einer Funktion vorzunehmen sind. Die Gleichheit von partieller und totaler Ableitung gilt allerdings nicht für die Ortsvariablen. Für Richtungsableitungen an einem Ort r ist es lediglich notwendig die Ableitung nach einer Richtung unter Festhalten der Variablen der anderen Richtung zu bilden. Da auch die Ortsableitungen von verschiedenen physikalischen Größen berechnet werden können, gehen wir wieder vor wie bei der Zeitableitung und schreiben die Operationen der einzelnen partiellen Ableitungen nach den Ortskoordinaten als ∂/∂x , ∂/∂y , ∂/∂z (1.38) Die Richtungsableitung ergibt sich dann als Vektor dieser Ableitungen und wird Gradient oder Nabla-Operator genannt, ∂/∂x (1.39) ∇ ≡ ∂/∂y ∂/∂z Potential P und Feldstärke E stehen in derselben Beziehung wie potentielle Energie E pot und Kraft F: Die Feldstärke ist der negative Gradient des Potentials. F = −∇ E pot und E = −∇ P (1.40) Also ist wie oben bereits besprochen der Gradient, also der Vektor der Ableitungen, auf die skalare Größe Potential anzuwenden, wobei der Vektor Feldstärke entsteht. Am Beispiel des elektrischen Potentials, rechte Seite in Gl. (1.35), ergibt sich zunächst für die partielle Ableitung nach x durch Anwendung der Kettenregel (s. Anhang) und Berücksichtigung der Definition des Abstands zweier Punkte im Raum, hier r 1 und r, aus Gl. (1.27), ∂ 1 1 1 q1 Ex (r ) = − − PC (r ) = − 2( x − x ) 2 ∂x 4πǫ0 2 |r − r | | {z 1} |r − r 1 | {z } | {z 1} ∂( x − x )2 /∂x | 1 äußere Ableitung ∂ |r −r 1 |/∂x q1 x − x 1 (1.41) = 4πǫ0 |r − r 1 |3 19 20 1 Erste Schritte zur Theorie der Chemie (und entsprechendes für die partiellen Ableitungen nach y und z), so dass sich der Gradient schreiben läßt als ∂PC (r )/∂x E(r ) = −∇ PC (r ) = ∂PC (r )/∂y ∂PC (r )/∂z x − x1 q1 1 y − y1 = − q1 r 1 − r (1.42) = 3 4πǫ0 |r − r 1 | 4πǫ0 |r 1 − r |3 z − z1 Die hier angegebenen Feldstärken sind gegeben für ein kartesisches Koordinatensystem, also für einen Raum aufgespannt von den Koordinaten x, y und z. Die beiden betrachteten Kräfte, Gravitationskraft und Coulomb-Kraft, hängen jedoch nur vom Abstand zweier Probegrößen (Massen oder Ladungen) ab. Die Gleichungen werden daher oft vereinfacht, wenn man sogenannte problemangepaßte Koordinaten verwendet, wie wir z.B. später bei der Diskussion des Wasserstoffatoms noch sehen werden. Die oben angegebenen Potentiale, Gl. (1.35), nennt man auch Zentralfeldpotentiale, weil sie nur von einem skalaren Abstand abhängen, einer relativen Koordinate, die wir r nennen wollen, also r ≡ |r − r 1 |. 1.1.4.7 Kugelkoordinaten Die potentielle elektrostatische Energie hängt nur vom Abstand der beiden wechselwirkenden Ladungen ab und nicht von ihrer Orientierung zueinander. Die Orientierung läßt sich durch zwei Winkel, ϑ und ϕ, exakt angeben. Mit den neuen Koordinaten (r, ϑ, ϕ), die man Polar-, Kugel- oder sphärische Koordinaten nennt, kann man dann jeden Punkt im Raum ansprechen, der auch in dem kartesischen Koordinatensystem durch x, y und z adressierbar ist: r mißt dabei den Abstand vom Ursprung und die Winkel ϑ und ϕ definieren die Richtung, in die die (radiale) Länge r abgetragen wird. Diese Situation ist in Abb. 1.2 dargestellt. Die Koordinate r heißt auch Radialkoordinate oder radialer Abstand. 1.1 Begriffsbildung und Naturgesetze z ϑ r y x = r sin ϑ cos ϕ (1.43) y = r sin ϑ sin ϕ (1.44) z = r cos ϑ (1.45) ϕ x Abbildung 1.2 Graphische Darstellung der Polarkoordinaten und Variablentransformationsgleichungen von Polarkoordinaten zu kartesischen Koordinaten. Die trigonometrischen Funktionen kann man räumlich interpretieren, wenn man bedenkt, dass der Radius eines Kreises multipliziert mit dem Sinus des abgetragenen Winkels gleich der Länge der Gegenkathete ist, während der Radius multipliziert mit dem Cosinus die Länge der Ankathete gibt. Die Katheten beziehen sich auf das Dreieck, das bei Projektion des Radius bzw. seiner Projektion in die xy-Ebene auf die Koordinatenachsen entsteht. Wenn wir die felderzeugende Ladung q1 in den Koordinatenursprung setzen, also r 1 ≡ 0, dann lassen sich die elektrostatische Energie, die elektrische Feldstärke und die Coulomb-Kraft in diesen neuen Koordinaten schreiben als Epot (r ) = 1 q1 1 q1 1 q1 q2 und Er (r ) = und Fr (r ) = 2 4πǫ0 r 4πǫ0 r 4πǫ0 r2 (1.46) wobei der vektorielle Charakter der letzten beiden Größen verlorengeht, weil wir uns nur auf den radialen Abstand r beschränken. In anderen Worten, bei einem vorgegebenen Abstand r zweier Ladungen kann man die eine um die andere beliebig drehen, ohne daß sich die Anziehungs- oder Abstoßungskraft ändert (ob die Ladungen sich anziehen oder abstoßen hängt nur vom Vorzeichen der beiden Ladungen ab: zwei positive oder zwei negative Ladungen ergeben ein positives Vorzeichen, so dass sich die beiden Ladungen abstoßen). 1.1.5 Einheiten Charakteristisch für alle bisher eingeführten mechanischen Größen ist, dass alle Gleichungen gleichzeitig auch zur Messung dieser Größen verwendet werden können. So kann man die Geschwindigkeit messen, indem man in möglichst kleinen Zeitintervallen die zurückgelegte Strecke mißt und Gl. (1.1) folgend dann die Geschwindigkeit berechnet. Um das aber tun zu können, muß man sich auf Maßeinheiten einigen, in denen Weg und Zeit gemessen werden. Im sogenannten MKS-System, wobei M für das Meter [m], K für das Kilogramm [kg] (also tausend Gramm) und S für die Sekunde [s] stehen, wird die Strecke in Metern und das Zeitinterval in Sekunden gemessen. Die Mas- 21 22 1 Erste Schritte zur Theorie der Chemie se wird in Kilogramm angegeben werden. Ein anderes Einheitensystem ist das cgs-System, wobei c für Zentimeter [cm] (also hundertstel Meter), g für Gramm [g] und s für Sekunde |s] stehen. Das MKS-System wird heute im allgemeinen verwendet. Welches Einheitensystem man verwendet hängt allerdings auch davon ab, welchen Aspekt der Natur man beschreibt. Ein fahrendes Auto ist gut im MKS-System zu beschreiben. Die Bewegung von Atomen, die extrem kleine Objekte sind, läuft jedoch auf sehr kleinen Zeit- und Ortsskalen ab. Man hat dann zwei Möglichkeiten: Wenn man weiterhin das MKS-System verwendet, dann muß man mit sehr kleinen Zahlen, kompakt geschrieben als Zehnerpotenzen, leben oder man führt neue Einheiten ein, die der Systemgröße angepaßt sind (ein Beispiel sind die sogenannten atomaren Hartree-Einheiten, in denen Ladungen als Vielfache der Elementarladung e und Massen als Vielfache der Elektronenmasse me angegeben werden). Um im MKS-System einfacher mit sehr großen oder sehr kleinen Zahlenwerten arbeiten zu können, werden einbuchstabige Abkürzungen eingeführt. Diese Notation haben wir in zwei Beispielen bereits verwendet: 1000 g sind 1 kg und 1/100 m ist 1 cm. Tabelle 1.1 gibt eine Übersicht über die für Einheiten gebräuchlichen Präfixe. Tabelle 1.1 Liste häufig verwendeter Präfixe vor Einheiten. Name hekto kilo mega giga tera peta Abk. Faktor Name Abk. Faktor h k M G T P 102 dezi zenti milli mikro nano piko femto atto d c m µ n p f a 10−1 10−2 10−3 10−6 10−9 10−12 10−15 10−18 103 106 109 1012 1015 Aus den elementaren Einheiten lassen sich leicht zusammengesetzte Einheiten für zusammengesetzte physikalische Größen ableiten, die oft mit eigenem Namen belegt werden, wenn die betreffende Größe hinreichend wichtig ist. Dies soll im folgenden an zwei Beispielen demonstriert werden. Die Kraft wird in Newton [N] gemessen, eine Einheit, die entsprechend Gl. (1.10) direkt aus MKS-Einheiten zusammengesetzt wird und sich auch in cgs-Einheiten schreiben läßt, hmi h cm i 100cm 5 1[N] = 1[kg] 2 = (1000[g]) = 10 [ g ] (1.47) s s2 s2 Die Präfixe lassen sich also genauso verrechnen wie die Messwerte. Man sagt, die Kraft hat die Dimension einer Masse multipliziert mit einer Beschleuni- 1.1 Begriffsbildung und Naturgesetze gung und die Einheit [kg m/s2 ]. Als zweites Beispiel betrachten wir den mechanischen Druck. Diese Größe läßt sich elementar abstrahieren. Offensichtlich kann man den Druck p verstehen als eine Kraft, die auf eine bestimmte Fläche A wirkt, p= F A (1.48) (p darf hier nicht mit dem Betrag des Impulses verwechselt werden). Die Einheit des Drucks erhält man daher zu N kg m kg 1 ≡ 1[Pa] (1.49) =1 2 2 =1 2 m2 s m s m was zur Definition des Pascals [Pa] dient. Viele Größen sind direkt auf mechanische Einheiten zurückzuführen. Arbeit und Energie haben entsprechend der bisherigen Diskussion dieselben Einheiten. Da die Arbeit aus der Kraft multipliziert mit dem Weg berechnet wird, ist die Einheit von Arbeit und Energie [N m]. Diese zusammengesetzte Einheit wird aber auch 1 Joule [J] genannt. Manche Einheiten sind nicht (oder nicht notwendigerweise) auf mechanische Einheiten zurückzuführen. Beispiele hierfür sind die Temperatur, die in Kelvin [K] gemessen wird, oder die elektrische Ladung, die in Coulomb [C] gemessen wird. All diese Einheiten sind zusammengefaßt worden in einem empfohlenen StandardEinheitensystem, dem sogenannten SI-System. Das SI-System enthält nicht nur vernünftige Einheiten. Es gibt für elektrostatische Einheiten ein anderes System, das so gewählt wurde, dass der Proportionalitätsfaktor im Coulomb-Gesetz zu Eins wird; dies sind die sogenannten Gauß-Einheiten. Anders gesagt, im Gauß-Einheitensystem nimmt die Dielektrizitätskonstante des Vakuums den Kehrwert von 4π an, ǫ0 = 1/4π, so dass 1/4πǫ0 = 1 wird. Manche Größen wurden früh eingeführt, ohne dass ihre Bedeutung vollständig klar war. Unter solchen Bedingungen entstehen Einheiten, die dann später einer besseren Einheitenwahl weichen müssen. Die Einheiten der Temperatur sind hierfür ein Beispiel. Die Celsius-Skala, gemessen in Graden [◦ C], ist eine typisch anthropogene Einheit, weil sie willkürlich den Nullpunkt der Gradskala auf den Gefrierpunkt reinen Wassers und dann die Markierung bei 100 ◦ C dem Siedepunkt reinen Wassers zuweist, weil Wasser in unserem Leben eine große Rolle spielt. Erst später hat man festgestellt, dass es einen absoluten Nullpunkt der Termperatur gibt, der bei −273,15 ◦ C erreicht wird. Es ist daher vernünftig eine neue Skala zu definieren, die bei Null startet und keine negativen Temperaturen zuläßt. Diese Skala ist die Kelvin-Skala [K]. Die Schrittweiten sind dabei gleich denen der Celsius-Skala, d.h. eine Temperaturdifferenz von 1 ◦ C entspricht ebenfall 1 K. 23 24 1 Erste Schritte zur Theorie der Chemie 1.1.6 Ein klassisches Modell der chemischen Bindung? Wir haben nun sämtliche mechanische Begriffe eingeführt, die es uns erlauben, einen ersten theoretischen Vorstoß zum Verständnis von Molekülen aufgebaut aus Atomen vorzunehmen. Die zentralen Fragen, die eine Theorie der chemischen Bindung erklären können muß, sind: was hält Atome zu einem Molekül zusammen und warum bilden nicht zwei Moleküle sofort wieder ein neues, ein Supramolekül? Leider werden wir dabei feststellen, dass die klassische Mechanik eine nicht befriedigende Antwort liefert, obschon sie sich für bestimmte Probleme (zum Beispiel in der Praxis der Biochemie) als sehr nützlich erweist. Nach Dalton verbinden sich Atome zu Molekülen. Dies ist zunächst eine Idee, die es erlaubt, eine Vielzahl experimenteller Daten in einem einzigen Konzept zusammenzufassen. Es stellt sich jedoch die Frage, wie diese ‘Bindung’ der Atome physikalisch realisiert wird. Angenommen die Atome würden durch massive “Stäbe” auf konstanter Distanz gehalten, dann könnten wir zwar fixe Bindungslängen angeben, doch könnten wir nicht erklären, was die materielle Realisierung dieser “Stäbe” sein soll — und aus welchem elementareren Material könnten schon die Stäbe gemacht sein, wenn sie die unteilbaren Bestandteile, die Atome, zusammenhalten sollen. Sie können schließlich nicht auch aus Atomen bestehen, weil dies die Definition des Molekülbegriffs verletzen würde (ein Wasser-Molekül besteht genau aus einem Sauerstoffatom und zwei Wasserstoffatome und eben nicht aus weiteren Atomen). Ein weiteres Argument verbietet uns, die Stäbe aus Atomen aufgebaut zu denken: wenn es Atome wären, dann müßten wir erklären können, wieso es spezielle Atome gäbe, die andere Atome zusammenhalten. Dennoch erlaubt uns das ‘Stabbild’ ein mechanisches Modell der Moleküle zu konstruieren. Wir sprechen hier von Modell statt von Theorie, weil a priori klar ist, dass es sich um keinen ernsthaften Ansatz zur Erklärung des Verbunds von Atomen in einem Molekül handelt, denn genau diese Tatsache wird in das Modell hineingesteckt. Allerdings sind feste Stäbe eine zu starke Einschränkung. Man hat festgestellt — und wir werden dies später diskutieren, wenn wir uns der richtigen theoretischen Beschreibung der Moleküle in Kapitel 2 zuwenden —, dass sich Atome um ihre Gleichgewichtslagen im Molekül bewegen, also schwingen. Die Vorstellung, dass Atome in Molekülen um ihre Gleichgewichtslagen schwingen, erfordert, die starren Stäbe zwischen den Atomen durch flexible mechanische Federn zu ersetzen. Wie stark die Schwingung der Atome ist, hängt dann von der spezifischen Materialkonstante der Feder, der sogenannten Kraftkonstanten k, ab. Die Feder kann dann ausgelenkt werden, schwingt zurück und beschreibt so das Schwingungsverhalten der Atome im Molekül. Die Kraft F, die für die Auslenkung notwendig ist, sei proportional zur Aus- 1.1 Begriffsbildung und Naturgesetze lenkung ( x − x0 ) (die Schwingung wird unter diesen Bedingungen harmonisch genannt), (1.50) F = k ( x − x0 ) wobei k zur Proportionalitätskonstanten wird und x0 die Gleichgewichtslänge der Feder beschreibt. Der Einfachheit halber wählen wir unser Koordinatensystem so, dass die Auslenkung der Feder in x-Richtung erfolgt, was uns eine etwas kompliziertere, dreidimensionale Betrachtung unter Verwendung von Vektoren erspart. Die zur Dehnung der Feder aufgewendete Arbeit W ergibt sich per Integration zu W= Z x x0 dx k( x − x0 ) = k 1 ( x − x0 )2 2 x x0 = 1 k ( x − x0 )2 2 (1.51) und entspricht der potentiellen Energie, die der Feder durch Wirken der Kraft zugeführt wird. Die potentielle Energie hat also die Form einer Parabel, weil sie quadratisch mit der Auslenkung anwächst. Die Feder selbst hat die Tendenz, in die Gleichgewichtslage zurückzukehren. Die Kraft dazu erhält man wiederum als negativen Gradienten der potentiellen Energie, also als −k( x − x0 ). Das negative Vorzeichen stellt dabei sicher, dass diese Rückstellkraft genau in die zur auslenkenden Kraft entgegengesetzte Richtung zeigt. Natürlich erklärt dieses Federmodell eines Moleküls aufgebaut aus Atomen nicht die Bindung der Atome, nicht nur, weil wir nicht sagen können, aus was denn die Federn bestehen sollen, sondern auch, weil es Parameter enthält, die wir geschickt wählen müssen, die das Modell selbst aber nicht erklärt. Wir müssen also einen Wert für die Kraftkonstante k für jede Schwingung von Atomen wählen, bevor wir das Schwingungsverhalten des Federmodells studieren können. Da verschiedene Atome unterschiedlich miteinander schwingen, sind verschiedene Kraftkonstanten für alle möglichen Schwingungstypen zu wählen. All diese offenen Probleme zeigen bereits, dass ein Molekülmodell auf Atombasis schlecht funktionieren kann. Es ist notwendig, den Aufbau der Atome selbst zu studieren, um so letztendlich zu verstehen, warum und wie Atome chemische Bindungen zur Bildung von Molekülen ausbilden. Nichtsdestotrotz spielen diese klassischen Federmodelle in ausgereifterer Form eine bedeutende Rolle in der Theorie der Chemie und speziell in der Polymerchemie und in der Biochemie. Hier sind die Modelle unter dem Namen Kraftfeldmodelle bekannt und erlauben das Studium von Federmodellen mit mehr als 100.000 Atomen, der typischen Größenordnung eines Proteins. Solche Simulationen können nur auf Computern durchgeführt werden, wie eine schnelle Abschätzung der Zahl der zu berücksichtigenden Federn zeigt. Wenn wir zwischen N Atomen paarweise Federn annehmen (ohne doppelt zu zählen und natürlich ohne Selbstwechselwirkungen von Atomen zuzulas- 25 26 1 Erste Schritte zur Theorie der Chemie sen), dann kommen wir auf ( N 2 − N )/2 Federn, was bei hunderttausend (105 ) Atomen etwa 5×109 , also 5 Milliarden Federn ergibt. In Kraftfeldsimulationen verzichtet man bewußt auf ein tieferes Verständnis der chemischen Bindung zu Gunsten einer einfachen ‘Modellierbarkeit’. Das geht genau dann gut, wenn die Moleküle, die betrachtet werden sollen, zum einen sehr ähnlich sind und sich zum anderen durch eine geringe Zahl verschiedener chemischer Bindungen klassifizieren lassen (sonst ist die Zahl der zu bestimmenden Kraftkonstanten zu groß — die Zahl der Federn reduziert sich dadurch natürlich nicht). Es ist auch klar, dass chemische Reaktionen mit diesen Modellen nicht leicht beschrieben werden können, weil dazu die Feder brechen müßte. Dieser Fall wird bei harmonischen Schwingungen nicht eintreten, weil die Rückstellkraft mit zunehmender Auslenkung ins unendliche wächst. 1.2 Schlüsselexperimente Unser modernes Bild des elementaren Aufbaus der Materie wurde entscheidend in den Jahren von etwa 1800 bis 1920 geprägt und danach maßgeblich erweitert. Wir konzentrieren uns zunächst auf die erste Periode, die einen Zeitraum von etwa hundert Jahren umfaßt. Die vielen experimentellen und theoretischen Arbeiten in dieser Periode werden oft auf einige Schlüsselexperimente reduziert. Dabei tritt der kollektive Charakter der wissenschaftlichen Erkenntnis in den Hintergrund und man übersieht die vielen Diskussionen und Beiträge unzähliger Forscher, die letztlich das moderne Bild der Physik und Chemie geprägt haben. Bemerkenswert ist auch die rasante Geschwindigkeit, mit der die wissenschaftlichen Erkenntnisse schon im 19. Jahrhundert gewonnen werden konnten. Der detaillierte historische Ablauf kann hier kaum in hinreichender Tiefe nachvollzogen werden. Lehrbücher wählen daher oft eine pseudo-historische Auflistung von wichtigen Experimenten, die dann heute akzeptierte Fakten über die Elementarteilchen zementieren. Diese Art der Darstellung impliziert, dass es nur einen beschränkten Satz von elementaren Teilchen gibt, der die gesamte materielle Welt aufbaut. Aber auch diese Annahme muß natürlich experimentell verifiziert werden. Eine riesige Zahl an Experimenten bestätigt diese Annahme, so dass es vernünftig ist, zu glauben, dass auch ein noch nicht durchgeführtes Experiment diese Annahme nicht widerlegen wird. Beweisbar ist eine solche Annahme natürlich nicht. Hier soll ein etwas anderer Weg beschritten werden. Zwar streifen wir ebenfalls die wichtigen historischen Stationen, dies aber auf einem Weg, dessen Richtung wir selbst durch Gedankenexperimente bestimmen. Auf diese Art und Weise sollte es möglich sein, nicht nur das zu denken, was sich letztlich 1.2 Schlüsselexperimente als richtig erwiesen hat, sondern auch die Fragen zu stellen, die sonst der kanonischen Darstellung zum Opfer fallen. Die Experimente, die wir diskutieren werden, kann man zum Beispiel in der Physik-Abteilung des Deutschen Museums in München ansehen und sogar selbst durchführen. 1.2.1 Präparation des Untersuchungsobjekts Sowohl in der Physik, als auch in der Chemie führt man Experimente so aus, dass das Untersuchungsziel ‘ungestört’ erreicht werden kann. In der Chemie bedeutet das, dass man Chemikalien nicht verwendet, die verunreinigt sind. Dasselbe gilt für physikalische Experimente, in denen man z.B. Legierungen nur gezielt an Stelle reiner Metalle verwendet. In der Chemie hat sich daraus ein Klassifizierungssystem entwickelt, das aber nur beschränkt belastbar ist. Es soll hier dennoch kurz vorgestellt werden, weil es mit den experimentellen Ursprüngen der Chemie eng verwoben ist. Zunächst unterteilt man alle Substanzen in Mischungen und in reine Stoffe. Reine Stoffe erhält man aus den Mischungen durch physikalische Methoden. Dies sind Methoden, die die chemische Zusammensetzung auf molekularer Ebene nicht ändern. Mischungen kann man weiter unterteilen in homogene und heterogene Phasen, eine Unterteilung die nur beschränkt trägt (wenn man an Milch oder Nebel denkt), weil sie offensichtlich damit zu tun hat, wie fein aufgelöst man die Mischung betrachten kann. Homogene Phasen können fest, flüssig oder gasförmig sein. Und selbst auf die Eindeutigkeit dieser Klassifizierung kann man sich nicht verlassen, weil zum Beispiel stäbchenförmige Moleküle einen Zustand zwischen flüssig und fest einnehmen können (wie z.B. Flüssigkristalle in Anzeigen von Armbanduhren). Reine Stoffe bestehen aus einer Ansammlung von einer Molekül- oder Atomsorte. Diese kann man mit chemischen Methoden (Reaktionen) weiter zerlegen. Zur Umwandlung oder Zerlegung von Molekülen ohne weitere Reaktanten reichen oft auch rein physikalische Methoden wie das starke Erhitzen oder die Bestrahlung mit Licht. Im Grenzfall erhält man bei allen Zerlegungsverfahren dann die Atome. 1.2.2 Kathodenstrahlen und das Elektron Im 19. Jahrhundert führten viele Forscher und Gelehrte Experimente zur Elektrizität durch — unter ihnen ist besonders Michael Faraday hervorzuheben, dessen Experimente Mitte des 19. Jahrhunderts James Clerk Maxwell zu seiner Theorie des (klassischen) Elektromagnetismus, also der Vereinigung aller elektrischen und magnetischen Phänomene zu einer klassischen, d.h. auf die 27 28 1 Erste Schritte zur Theorie der Chemie makroskopische Welt anwendbaren Theorie, führten. Maxwells Theorie liefert dadurch auch die erste Erklärung für das Phänomen ‘Licht’, wovon später noch die Rede sein wird. Mitte des 19. Jahrhunderts untersuchten verschiedene Forscher die sogenannten Kathodenstrahlen, die man beobachten kann, wenn man eine Glühkathode und eine Anode mit einer Durchtrittsöffnung in eine evakuierbare Glasröhre einschmilzt (wie bei den alten Röhrenfernsehern). Für die entsprechenden Versuchsskizzen sei hier und im folgenden auf Ihre Vorlesungsmitschrift verwiesen! Liegt nun eine Spannung, d.h. ein elektrisches Feld E an, so kann man auf einem der Durchtrittsöffnung gegenüberliegenden, in die Glasröhre eingeschmolzenen Fluoreszenzschirm ein Aufleuchten beobachten. Da der Fluoreszenzschirm einen stetig leuchtenden Fleck zeigt, werden offensichtlich Strahlen aus den Elektroden gelöst. Weil sie aus der Kathode treten und durch die elektrische Spannung zur Anode hin beschleunigt werden, nennt man sie Kathodenstrahlen. Per Konvention bezeichnen wir die Kathode als negativ geladen und die Anode als positiv geladen. Folglich sind die Kathodenstrahlen elektrisch negativ geladen. Um zu untersuchen, ob es sich um einen kontinuierlichen Ladungsstrahl handelt, dimmen wir seine Intensität, indem wir die an die aufgeheizte Kathode anliegende elektrische Spannung reduzieren und auch die Kathodentemperatur zu kontrollieren versuchen. Wäre der Ladungsstrahl kontinuierlich, so würde der Lichtfleck auf dem Fluoreszenzschirm stetig immer schwächer werden. Dies beobachten wir jedoch nicht. Stattdessen bemerken wir ab einer bestimmten Intensität ein Flackern. Weiteres Dimmen erniedrigt die Intensität des aufleuchtenden Flecks nicht, sondern sorgt lediglich dafür, dass das Zeitinterval bis zum nächsten Aufleuchten sich verlängert. Daraus schließen wir, dass Kathodenstrahlen nicht kontinuierlich, sondern körnig sind und eben aus kleinen Partikeln bestehen. Diese Partikel müssen auch die negative elektrische Ladung tragen und werden Elektronen genannt. Um nun zu untersuchen, ob verschiedene Metalle dieselbe Art Ladungsträger enthalten, schmelzen wir in Glasröhren verschiedene Metalle als Kathodenmaterial ein. Eine Wiederholung des Experiments zeigt exakt dieselben Resultate, was auch für alle noch folgenden Kathodenstrahlexperimente gilt. Lediglich die genaue Einstellung von Spannung und Erwärmung der Kathode ist anders im Dimmexperiment, was auf besondere Materialeigenschaften der Metalle deutet, die als Kathodenmaterial dienen. Bevor wir unser Experiment weiter modifizieren, ist noch eine weitere Feststellung wichtig: Da wir den Versuch auf der Erde durchführen, können wir die Erdanziehungskraft nicht abschalten. Wenn wir den Elektrodenstrahl beobachten, so können wir praktisch keinen Höhenunterschied zwischen dem Loch in der Anode und dem Leuchtfleck auf dem Fluoreszenzschirm feststellen. Die Gravitation, die den Kathodenstrahl nach unten, d.h. in Richtung 1.2 Schlüsselexperimente Erdmittelpunkt ablenken sollte, hat keinen nennenswerten Effekt. Nun könnte man daraus schließen, dass Elektronen keine Masse besitzen und deshalb nicht auf eine Gravitationsanziehung reagieren. Soweit wollen wir aber nicht gehen und nehmen daher nur an, dass die Masse eines Elektrons sehr klein ist. Denn wenn die Elektronenmasse sehr klein ist, dann ist die Ablenkung nicht notwendigerweise beobachtbar, weil die Präzision der Höhenmessung des Flecks vielleicht nicht ausreichte. 1.2.2.1 Anwendung elektrischer und magnetischer Feldern Die aus der Kathode heraustretenden Elektronen können durch Anwendung elektrischer und magnetischer Felder beeinflußt werden, um so quantitative Meßdaten über die elektrischen Eigenschaften der Elektronen zu erhalten. Wir entwerfen daher ein weiteres Experiment, für das wir in die Glasröhre zwei Kondensatorplatten, sowie eine Spule einschmelzen. Zunächst legen wir nur eine Spannung an den Plattenkondensator an. Wir sehen, dass der Kathodenstrahl nach unten abgelenkt wird, weil der Leuchtfleck auf dem Fluoreszenzschirm nach unten auswandert. Wenn y die Bewegungsrichtung der Elektronen und die negative z-Richtung die Auslenkungsrichtung, also auch die Richtung, in der das elektrische Feld E wirkt, ist, dann können wir die Kraft berechnen, die auf jedes einzelne Elektron wirkt 0 0 0 F = qe E = −e 0 = 0 = 0 Ez − e Ez Fz (1.52) 0 Bx 0 F L = qe ve × B = −e ve,y × 0 = 0 e ve,y Bx 0 0 (1.53) dessen Ladung wir als qe = −e ansetzen, wobei wir die Elementarladung e noch zu bestimmen haben. Man beachte, dass die Kraft keine Beiträge in xund y-Richtung hat, weil wir den Versuch entsprechend fahren. Ferner muß betont werden, dass wir die Stärke des elektrischen Feldes in z-Richtung, Ez , durch Anlegen einer elektrischen Spannung an den Kondensator kontrollieren und daher einstellen können. Wenn dagegen die Spule stromdurchflossen wird, während der Kondensator nicht unter Spannung steht, wirkt auf die Elekronen eine magnetische Kraft, die auch von der Geschwindigkeit der Elektronen ve abhängt und Lorentz-Kraft F L genannt wird, wobei ‘×’ ein Vektorprodukt (Kreuzprodukt) bezeichnet und B die sogenannte magnetische Kraftflußdichte ist, die im Magnetismus die Rolle einer Feldstärke spielt — analog dem E in der Elektrostatik. Die nichtverschwinden- 29 30 1 Erste Schritte zur Theorie der Chemie den Einträge in den Vektoren sind wiederum durch den Versuchsaufbau bestimmt. Man beachte, dass die Struktur der Gleichungen stets gewahrt bleiben muß: Die Kraft ist eine vektorielle Größe und daher muß auch auf der rechten Seite ein Vektor enstehen (hier garantiert durch das Vektorprodukt). Wenn wir nun die beiden Experimente mit dem elektrischen und dem magnetischen Feld vergleichen, stellen wir fest, dass beide ein Elektron in zRichtung auslenken, aber in entgegengesetzte Richtung. Das bedeutet, dass wir beide Felder von außen so einstellen können durch Wahl von Ez und Bx , dass sie sich exakt kompensieren und die Elektronen auf ihrer Flugbahn nicht ablenken, was wir leicht durch die Position des Leuchtflecks kontrollieren können. Mathematisch können wir für diesen Fall dann schreiben, F gesamt = 0 ⇒ ! eq eq Fz = 0 = −e Ez + e ve,y Bx (1.54) wobei wir die spezielle Wahl der Feldstärkenkomponenten mit einem hochgestellten Index ‘eq’ gekennzeichnet haben. Aus diesem Kräftegleichgewicht erhalten wir so eine Gleichung zur Berechnung der Geschwindigkeit der Elektronen auf ihrer Bahn zum Fluoreszenzschirm, eq eq e Ez = e ve,y Bx eq ⇒ ve,y = Ez eq Bx (1.55) beziehungsweise 0 0 eq eq ve = ve,y = Ez /Bx 0 0 (1.56) Es stellt sich als nächstes die Frage, ob wir durch geschickte Wahl der Felder nicht auch die Elementarladung e bestimmen können. Dazu legen wir wiederum nur das elektrische Feld Ez an. Die dadurch wirkende Kraft erzeugt nach Newton eine Beschleunigung, ! Fz = me az = qe Ez ⇒ az qe =−e = − eEz me (1.57) Die Ablenkung des Lichtflecks auf dem Fluoreszenzschirm, der sich unmittelbar hinter dem Plattenkondensator befinden muß, um diese Berechnung zu erlauben, berechnet sich leicht aus Gl. (1.16), die hier direkt für den Fall vz,start = 0 verwendet werden kann, ∆z = 1 2 (1.57) eEz 2 t az t = − 2 2me (1.58) Die Flugszeit t durch den Kondensator errechnet sich leicht aus der konstanten Geschwindigkeit in y-Richtung, t= l ve,y (1.59) 1.2 Schlüsselexperimente wobei die Länge des Kondensators l genannt wurde. Damit erhalten wir für die Ablenkung in z-Richtung, ∆z = − eEz l 2 2me v2e,y (1.60) Diese Gleichung enthält nun nur noch meßbare Größen, so dass wir nach den Materialkonstanten eines Elektrons auflösen können, 2v2e,y ∆z qe −e C = =− = −1, 75882012(15) · 1011 me me kg Ez l 2 (1.61) Wir können also Ladung und Masse des Elektrons nicht unabhängig voneinander messen und müssen uns ein weiteres Experiment überlegen, dass uns entweder e oder me liefert — die jeweils andere Naturkonstante kann dann aus Gl. (1.61) berechnet werden. 1.2.3 Der Millikan-Versuch Um 1910 fand der Amerikaner Millikan einen Weg, um die Elementarladung e experimentell zu bestimmen. Dieser als Millikanscher Öltröpfchenversuch bekannt gewordene Versuch wird wie folgt durchgeführt: In einen Plattenkondensator werden Öltröpfchen eingespritzt, die dann aufgrund der Schwerkraft langsam nach unten (Richtung Erdmittelpunkt) sinken. Dieses Sinken des Tröpfchen im Ölnebel zwischen den Kondensatorplatten kann man mit einem Mikroskop beobachten. Bei dem schnellen Zerstäuben des Öls kann es schon zu einer elektrischen Aufladung der Teilchen gekommen sein. Man kann dieses Laden der Tröpfchen aber auch durch Röntgenstrahlung induzieren. Wenn nun der Plattenkondensator geladen wird, also ein elektrisches Feld wirkt, steigen die Öltröpfchen wieder nach oben, wenn die elektrische Kraft die Erdanziehung übersteigt. Wenn sie betragsmäßig gleich sind, was wir durch ein Schweben der Tröpfchen feststellen, können wir wieder von einem Kräftegleichgewicht profitieren q T Ez = m T g (1.62) wobei wir die Sinkrichtung als z-Richtung definiert haben und alle Tröpfcheneigenschaften mit dem Index ‘T’ versehen haben. Auf der rechten Seite wurde für Newtons Ausdruck für die Kraft direkt die Erdbeschleunigung g eingesetzt. Diese so aufgestellte Gleichung kann uns nun zur Messung der Tröpfchenladung q T dienen, qT = mT g Ez (1.63) 31 32 1 Erste Schritte zur Theorie der Chemie Dazu benötigen wir allerdings die Masse m T des Tröpfchens, das wir durch das Mikroskop gerade betrachten. Wenn wir die Dichte ρ des Öls kennen, könnten wir versuchen den Durchmesser des Tröpfchens im Mikroskop zu vermessen, daraus das Volumen dieses Tröpfchens berechnen und dann per ρ = m T /VT die Masse erhalten. Man kann die Massenmessung allerdings genauer vornehmen. Die feldfrei sinkenden Tröpfchen nehmen nach einiger Zeit eine maximale Geschwindigkeit an, die durch weitere Erdanziehung nicht erhöht werden kann. Der Grund hierfür ist die Reibung der Tröpfchen bei ihrer Bewegug durch die Luft zwischen den Kondensatorplatten. Dieser Bremswirkung kann man eine Kraft zuordnen, die Reibungskraft FR = f vmax , die proportional zur Geschwindigkeit ist, wobei die Proportionalitätskonstante f Reibungskoeffizient genannt wird. Aus dem Kräftegleichgewicht des feldfreien Sinkens erhalten wir dann m T g = f vmax ⇒ mT = f vmax g (1.64) wobei f für Luft und g bekannt sind, während v max durch Beobachtung der Ortsänderung im Mikroskop oder durch das sogenannte Stokesssche Reibungsgesetz FS = −6π η vr erhalten werden kann (die Stokes Formel beinhaltet die Viskosität der Luft η und die charakteristische Größe für die Form der Teilchen (Kugeln), nämlich ihren Radius r). Wenn man nun die Messung von q T an sehr vielen Tröpfchen durchführt findet man folgendes allgemeines Ergebnis: q T = n (−e) mit n ∈ N (1.65) Die Ladung der negativ geladenen Tröpfchen ist also ein ganzzahliges Vielfaches (n) einer elementaren Ladung e. Aus vielen Messung von q T unterschiedlicher Tröpfchen können wir auf e extrapolieren und erhalten diese zu e = 1, 602177 · 10−19C (1.66) (wobei dies der Wert ist mit einer Genauigkeit, die uns heute aus anderen Experimenten zugänglich ist). Da wir aus dem Kathodenstrahlexperiment schon einen Wert für den Quotienten e/me erhalten haben, ergibt sich so die Elektronenmasse zu me = 9, 10939 · 10−31kg (1.67) 1.2.4 Kanalstrahlen Bisher haben wir uns nur mit negativen Ladungsträgern beschäftigt und als elementares Teilchen das Elektron identifiziert. Weil Materie nach außen elek- 1.2 Schlüsselexperimente trisch neutral ist, muß es also zur Kompensation der negativen Ladung positive Ladungsträger geben. Die kleinsten dieser positiven Ladungesträger wurden in sogenannten Kanalstrahlen entdeckt. Kanalstrahlen können ebenfalls in einer Glasröhre gefüllt mit Wasserstoffgas mit zwei Elektroden beobachtet werden, wenn die Kathode ebenfalls ein Loch, den Kanal, enthält. Auf die negativ geladene Kathode werden dann positive Ladungsträger beschleunigt, die man als Kerne von Wasserstoffatomen identifiziert hat und die man Protonen nennt. Die Kathodenstrahlen ionisieren das Diwasserstoffgas und produzieren dabei diese positiv geladene Wasserstoffatome, die man ebenfalls mit elektrischen und magnetischen Felden untersuchen kann, wie zuvor besprochen für die Elektronen. Aus Elektroneutralitätsgründen ist die Ladung eines Protons umgekehrt zu der eines Elektrons, also q p = +e (ein Wasserstoffatom muß ungeladen sein, weil es nicht durch elektrische Felder beeinflußt wird). 1.2.5 Das Rutherfordsche Streuexperiment In einem klassischen Experiment zeigte Rutherford in den Jahren 1911–1913, dass Materie aus Atomkernen besteht, in denen die positive Ladung eines Atoms konzentriert ist. Die Atomkerne werden von den sich bewegenden Elektronen umgeben, die wir im Kathodenstrahlexperiment aus ihrem Verbund durch Energiezuführung herausgelöst haben. Der Rutherford-Versuch ist ein sogenanntes Streuexperiment, bei dem ein Strahl auf das Untersuchungsobjekt gelenkt und von diesem abgelenkt wird. Die winkelaufgelöste Ablenkung des Strahls wird dann untersucht und muß von einer theoretischen Modellierung korrekt reproduziert werden. Die Strahlen, die hier verwendet worden, nennt man α-Strahlen. Sie werden von verschiedenen Metallen emittiert, beispielsweise von Polonium, und können Photoplatten durch Abscheidung elementaren Silbers aus Silbersalz in diesen Platten schwärzen. Sie sind elektrisch positiv geladen und können daher Experimenten zur Untersuchung ihrer Eigenschaften unterworfen werden, die wir schon am Beispiel der Kathodenstrahlen diskutiert haben. Man hat später erkannt, dass es sich bei ihnen um Heliumatomkerne handelt. Im RutherfordVersuch ist das Untersuchungsobjekt dünn ausgewalzte Goldfolie, die etwa 0,004 mm dick ist und daher nur aus einigen 1000 Atomlagen besteht. Man verwendet Goldfolie, weil sich diese sehr dünn auswalzen läßt, so dass die auf sie treffenden Strahlen prinzipiell durch sie durchtreten können (ein massiver Gold-Metallblock ist nicht durchdringbar). Im Streuexperiment beobachtet man nun, dass ein Großteil der α-Strahlen durch die Folie treten und detektiert werden können (durch Photopapier zum Beispiel). Ein Teil der Strahlen wird aber auch abgelenkt und sogar direkt zurückgeworfen. Diese streuwinkelabhängige Intensitätsverteilung (Schwär- 33 34 1 Erste Schritte zur Theorie der Chemie zungsverteilung) muß nun durch eine Theorie beschrieben werden. Dabei muß die Streutheorie zum Erkenntnisgewinn alle denkbaren Fälle behandeln. Einer dieser Fälle ist die Gleichverteilung von Elektronen und positiven Ladungsträgern im Goldmetall. Ein anderer ist die Konzentration der positiven Ladung in Teilchen, die man Atomkerne nennt. Rutherford fand nun, dass das Streuergebnis nur unter Annahme von positiv geladenen Atomkernen richtig beschrieben werden kann. Wegen der Stärke der elektrischen Kraft ist die Streuung der α-Strahlen ein Prozeß, der allein auf der elektrostatischen Abstoßung der beteiligten Teilchen beruht. Der Rückstoß erweist sich dabei als vernachlässigbar, was darauf hindeutet, dass sämtliche Masse eines Gold-Atoms ebenfalls im Atomkern konzentriert ist. Aufgrund der Elektroneutralität eines Gold-Atoms müssen 79 positive Elementarladungen im Atomkern zu finden sein. Da sie Vielfache der Elementarladung sind, gehen wir davon aus, dass es sich um 79 Protonen handelt. Man beachte im besonderen, dass die α-Teilchen nicht durch direkten Stoß an den Atomkernen gestreut werden, was aufgrund der kleinen Größe der Atomkerne zu unwahrscheinlich wäre und die Intensität an zurückgestreuten Teilchen nicht erklären könnte, sondern am elektrischen Potential der Goldatomkerne. Daher nennt man diese Rutherford-Streuung auch Potentialstreuung. Die α-Teilchen werden aufgrund der abstoßenden elektrischen Kräfte schon in großer Entfernung vom Atomkern abgelenkt. Interessanterweise reicht es für die qualitativ richtige Beschreibung des Streuergebnisses aus, den Atomkern sogar nur als punktförmig anzunehmen. Das bedeutet, dass nahezu der gesamte Raum, den ein Atom einnimmt, von den Elektronen beansprucht wird. Die anziehende elektrische Wechselwirkung von Elektronen der Goldfolie und den α-Teilchen kann vernachlässigt werden. Es stellt sich nun noch die Frage, wieso positiv geladene Atomkerne räumlich so klar von den sie umgebenden Elektronen in Molekülen und Festkörpern getrennt sind (warum bewegen sich Elektronen und Atomkerne nicht willkürlich durcheinander?). Auch diese Beobachtung muß (und wird) durch die zu entwickelnde Theorie des Aufbaus der Materie erklärt werden. 1.2.6 Neutronen Eine genaue experimentelle Untersuchung der Massen der Atomkerne zeigt, dass die Masse nicht allein durch Vielfache der Protonenmasse erklärt werden kann. Analog zu den bisher besprochenen Experimenten können wir in elektrischen Feldern Wasserstoffatomkerne H+ und Helium-Atomkerne He2+ hinsichtlich ihrer Masse vermessen. Dabei findet man m H+ m He2+ = 1, 67 · 10−27kg = 6, 645 · 10 −27 kg (1.68) (1.69) 1.2 Schlüsselexperimente Wenn also die Masse des H+ der Protonenmasse entspricht, stellen wir fest, dass die He2+ -Masse nicht das doppelte der Protonenmasse ist, wie wir aufgrund der Elektroneutralität von He-Atomen vermuten würden, sondern eher das vierfache ist. Dies führte Rutherford 1920 zum Postulat eines weiteren Elementarteilchens, das natürlich elektrisch ungeladen sein mußte, weil man es sonst schon eher entdeckt hätte, und daher Neutron genannt wird. Erst 1932 gelang es Chadwick das Neutron (indirekt) durch die Ionisierung von Gasatomen nachzuweisen. Der oben betrachtete He-Kern enthält demnach zwei Neutronen zusätzlich zu den zwei Protonen, was man im Elementsymbol ausdrückt als 42 He2+ , oder allgemein ZA ELadung, wobei E das Elementsymbol ist, Z die Ordnungszahl, die gleich der Zahl der Protonen im Atomkern ist, und A die Massenzahl ist, also die Summe an Protonen und Neutronen im Kern. Bei genauerer Untersuchung hat man dann festgestellt, dass die Atomsorten eines Elements keineswegs gleich sein müssen, obwohl sie sich chemisch im wesentlichen gleich verhalten. Im Falle des Heliums hat man einen weiteren Atomkern entdeckt, der nur ein Neutron statt zwei besitzt und daher als 32 He2+ bezeichnet wird. Verschiedene Sorten von Atomkernen nennt man Isotope. 1.2.7 Licht Mitte des 19. Jahrhunderts gelang es James Clerk Maxwell, die Beobachtungen der Elektrizitätslehre und des Magnetismus in einer gemeinsamen Theorie zu vereinigen, die seitdem Elektromagnetismus genannt wird. Maxwell fand dadurch heraus, dass Elektrizität und Magnetismus nicht zwei verschiedene Erscheinungen sind, sondern dass beide auf der ruhenden und bewegten elektrischen Ladung beruhen. Dazu formulierte er vier Grundgleichungen für die Feldstärken E und B, sowie für zwei weitere Größen, die diese Felder charakterisieren. Aus diesen vier Grundgleichungen konnte Maxwell zwei Wellengleichungen (s. Anhang) für die Feldstärken ableiten 2 ∂2 E ∂ E ∂2 E ∂2 E 1 1 ∆E (1.70) = + 2 + 2 ≡ µ0 ǫ0 ∂x2 µ 0 ǫ0 ∂t2 ∂y ∂z ∂2 B ∂2 B ∂2 B ∂2 B 1 1 ∆B (1.71) = + 2 + 2 ≡ 2 2 µ0 ǫ0 ∂x µ 0 ǫ0 ∂t ∂y ∂z wobei µ0 die magnetische Feldkonstante des Vakuums ist, die auch Permeabilität genannt wird. Auf der rechten Seite haben wir den sogenannten LaplaceOperator eingeführt, ∆≡ ∂2 ∂2 ∂2 + + ∂x2 ∂y2 ∂z2 (1.72) 35 36 1 Erste Schritte zur Theorie der Chemie der es uns gestattet die Wellengleichungen sehr kompakt zu schreiben und der als Skalarprodukt zweier Nabla-Operatoren verstanden werden kann ∆ = ∇ T · ∇ = ∇2 (1.73) Diese Schwingungsgleichungen erlaubten es, elektromagnetische Schwingungsphänomene zu beschreiben, im speziellen z.B. von Antennen ausgesendete Radiowellen. Die Ausbreitungsgeschwindigkeit v dieser elektromagnetischen Wellen kann in einer Wellengleichung dem Vorfaktor des LaplaceOperators entnommen werden, denn dieser ist gleich v2 = v2 . Für die Ausbreitungsgeschwindigkeit der elektromagnetischen Wellen erhalten wir also s 1 1 c2 = ⇒ c= (1.74) µ 0 ǫ0 µ 0 ǫ0 wobei wir den für elektromagnetischen Wellen gebräuchlichen Buchstaben c verwendet haben. Setzt man nun die bekannten Meßwerte für µ0 und ǫ0 ein, dann stellt man fest, dass sich die Lichtgeschwindigkeit des Vakuums ergibt. Maxwells Theorie des Elektromagnetismus liefert so eine Interpretation von Licht als sich ausbreitende elektromagnetische Welle! 1.2.7.1 Beugung und Interferenz Der Wellencharakter des Lichts wird eindrücklich in Experimenten zur Beugung von Licht am Spalt und zur Interferenz am Doppelspalt deutlich (s. Abb. 1.3). Wenn Licht durch einen Spalt in einer Wand hinreichend kleiner Breite tritt, dann kann man das Licht nicht nur in Strahlrichtung, sondern auch davon abweichend detektieren, wo es eigentlich nicht zu finden sein sollte, wenn es sich nur geradlinig ausbreiten würde. Auch bei Wasserwellen kann man derartige Beugungseffekte beobachten und so geht man nach Huygens davon aus, dass der Spalt sich so verhält wie eine Lichtquelle, von der sich das Licht als elektromagnetische Welle in alle Richtungen ausbreitet. Dabei wird jeder Punkt im Spalt zu einer Quelle und man kann immer zwei Punkte paarweise gruppieren, deren Licht dann konstruktiv oder destruktiv, abhängig vom Beobachtungswinkel zur Strahlrichtung, interferiert, sich also verstärkt oder auslöscht, je nachdem ob Wellenberge beziehungsweise Wellentäler am Detektor aufeinandertreffen (die Lichtintensität ist proportional zum Quadrat der elektrischen Feldstärke). Der Interferenzeffekt wird besonders deutlich, wenn man zwei Lichtquellen hat, deren Licht in einer festen Phasenbeziehung steht, man sagt kohärent ist. Während man heute solches Licht durch Laser erzeugt, konnte man es früher durch zwei Spalte in der Wand erzeugen. 1.2 Schlüsselexperimente Spalt Detektor Quelle d<λ d>λ d<λ Intensität Intensität Intensität Intensität A B C Abbildung 1.3 Licht das auf einen Spalt in einer Wand fällt kann hinter dem Spalt mit abnehmender Intensität auch dort detektiert werden, wo es eigentlich nicht zu finden sein sollte, wenn es geradlinig durch den Spalt treten würde. Das Licht wird gebeugt und die gemessene Beugungsfigur kann erklärt werden, wenn man sich vorstellt, dass der Spalt selbst zu einer Lichtquelle wird, von der aus eine Kugelwelle ausgeht (A). Unter bestimmten Umständen beobachtet man in der Beugungsfigur kleine Maxima an Lichtintensität neben dem Hauptmaximum (B). Diese Struktur in der Beugungsfigur wird verstärkt, wenn das Licht auf zwei Spalte gleichzeitig scheint (C), so dass ein ausgeprägtes Interferenzmuster entsteht. Maxwells Theorie des Elektromagnetismus beschreibt Licht als elektromagnetische Wellen, die sich konstruktiv und destruktiv überlagern können (wenn in Phase, also wenn kohärent, was durch die Spalte garantiert wird). 1.2.7.2 Quantennatur von Licht und der Welle–Teilchen-Dualismus Wenn die elektromagnetische Theorie des Lichts richtig ist, dann kann man die Intensität des Lichts kontinuierlich auf Null dimmen. Experimentell kann man das durch immer stärker werdende Filtersysteme erreichen. Allerdings wird die Intensität dann so schwach, dass dies experimentell nicht mehr leicht beobachtbar ist. Mit modernen Methoden kann man aber auch noch sehr schwaches Licht detektieren und verwendet dazu einen speziellen Detektor (eine sogenannte CCD-Kamera, wobei CCD für charge-coupled device steht), die eintreffendes Licht verstärken kann. Studiert man nun mit diesem Detektor das immer weiter abgeschwächte Licht, dann stellt man genau nicht fest, was Maxwells Theorie voraussagt: Statt eines immer schwächer werdenden Signals wird ab einem bestimmten Abschwächungsgrad eine konstante Intensität beobachtet, die aber zu flackern beginnt. Dimmt man das Licht noch weiter, so flackern die vom Detektor aufgezeichneten Signale immer langsamer — aber bei konstanter Intensität. Das Dimm-Experiment zeigt klar, dass Licht keine elektromagnetische Welle sein kann. Man ist gezwungen Licht als ‘körnig’ zu betrachten, als quantisiert, wie man sagt. Licht besteht also tatsächlich aus einzelnen Teilchen, die man Photonen nennt. An dieser Stelle sind wir nun also auf ein Paradox gestoßen: Zuerst haben wir Licht als Welle (elektromagnetischer Felder) interpretiert und nun stellen 37 38 1 Erste Schritte zur Theorie der Chemie wir fest, dass es partikulär ist und eben aus Lichtteilchen besteht. Diese paradoxe Situation trägt den Namen Welle–Teilchen-Dualismus. Landläufig will man damit festhalten, dass sich Licht mal so (Welle) oder mal so (Teilchen) verhält. Das ist aber zu naiv gedacht und die Natur der Dinge nicht wirklich durchdrungen, wie wir noch zu diskutieren haben, denn Licht verhält sich immer wie Licht und nicht wie etwas, das wir hineininterpretieren müssen. Im Falle des Lichts hat der Welle–Teilchen-Dualismus noch einen gewissen Charme, weil wir zuvor sogar eine Wellengleichung schreiben konnten, die beschreibt, welche orts- und zeitveränderlichen elektrischen und magnetischen Felder von sehr vielen Photonen erzeugt werden. Das wird später schwieriger, wenn wir dieselbe Frage für Elektronen untersuchen. Was geschieht nun, wenn wir das Doppelspaltexperiment mit einzelnen Photonen (also mit stark abgeschwächtem Licht) durchführen? Natürlich detektiert die CCD-Kamera dann nur einzelne Photonen und es blitzt also hinter dem Doppelspalt nur kurz auf. Wenn dieses Experiment nun viele Male wiederholt wird und wir die Signale an der CCD-Kamera akkumulieren, dann wuerde man erwarten, zwei überlagerte Beugungsfiguren zu sehen. Schließlich haben wir zwei Spalte und jeder Spalt wird das Licht (die Photonen) beugen, so dass pro Spalt eine Beugungsfigur wie in Abb. 1.3(A) gezeigt entsteht — schliesslich muss das Photon auf dem Weg zur CCD-Kamera entweder durch den einen oder durch den anderen Spalt geflogen sein. Wegen der räumlichen Trennung der beiden Spalte sind die beiden Beugungsfiguren etwas versetzt und sollten sich einfach zu einem Doppelmaximumbild der Intensität überlagern. Dies wird jedoch nicht beobachtet! Tatsächlich beobachtet man das Interferenzbild aus Abb. 1.3(C). Dieser Befund ist nun deshalb so schwer zu erklären, weil wir Interferenz nach der Welleninterpretation nur verstehen können, wenn Licht durch beide Spalte gleichzeitig tritt. Das aber genau würden wir aufgrund unseres Experiments eigentlich ausschließen wollen, weil wir ja wissen, dass nur einzelne Photonen auf dem Weg von Lichtquelle durch Spalt zum Detektor sind. Wir untersuchen also nacheinander einzelne Teilchen (Photonen) und stellen fest, dass sie sich in der zeitlichen Summe verhalten wie intensives Licht, das gleichzeitig die zwei Spalte durchtreten hat. Wir messen ein (aufsummiertes) Interferenzbild für einzelne Teilchen, obwohl wir gerade diese Eigenschaft einem Wellencharakter der Materie entsprechend des Welle–TeilchenDualismus zuordnen wollten. Die Konsequenz ist nun nicht, dass man dem Welle–Teilchen-Dualismus einen tieferen mythischen Charakter zuschreiben muß, sondern, dass man ihn aufgeben muß. Man erkennt hier ganz klar, dass der Welle–Teilchen-Dualismus ein anthropogenes Konzept ist, das sich im wesentlichen nur aufgrund historisch gefaßter und heute obsolet gewordener Annahmen und Bilder begründen läßt. Es ist der elementaren Materie schlicht gleichgültig, welches Bild wir uns von ihr machen. Wir müssen lernen, dass 1.2 Schlüsselexperimente wir Theorien finden müssen, die uns erklären, was wir messen (werden) und dabei müssen wir uns davon verabschieden, erkennen zu wollen, was ein Photon (oder Materie allgemein) ist. Diese Erkenntnis tut dem Projekt ‘Naturwissenschaft’ aber keinen Abbruch, weil es eine großartige Erkenntnis ist, zu wissen, was die elementaren Objekte sind, die alle Materie aufbauen, und wie sie sich bewegen und miteinander wechselwirken. Eine Theorie, die dies leistet, haben wir aber offensichtlich noch nicht kennengelernt. Dies leistet erst die im Kapitel 2 einzuführende (moderne) Quantenmechanik, für deren Entwicklung es entscheidend war, sich darauf zu konzentrieren, nur das zu beschreiben, was tatsächlich meßbar ist. Mit diesen Einsichten sehen wir das Interferenzbild des Doppelspaltexperiments, das die Beschreibung des Lichts als elektromagnetische Welle zunächst zementierte, von einer neuen Perspektive: Wenn wir das Detektorsignal, das einzelne Photonen, die durch den Doppelspalt treten, auslösen, über die Zeit summieren, sehen wir ein Interferenzbild. Das bedeutet doch, dass wir das Interferenzbild auch sehen werden, wenn wir viele Photonen auf den Doppelspalt treffen lassen. Wir müssen nur nicht mehr solange warten, bis hinreichend viele Einzelsignale akkumuliert wurden. Wenn nun sehr, sehr viele Photonen unterwegs sind, wird offensichtlich die Interferenzfigur instantan entstehen. Und so erhalten wir also das Interferenzbild zwanglos aufgebaut aus den Einzelsignalen der einzelnen Photonen — elektromagnetische Wellen werden nicht mehr benötigt. Natürlich haben wir erst dann einen vollwertigen Ersatz für Maxwells Theorie, wenn wir eine Theorie des Bewegungsverhaltens der Photonen aufstellen können. Hier zeigt sich also ein interessanter Aspekt der Theoriebildung. Maxwells elektromagnetische Theorie erklärt Licht nur auf der makroskopischen Ebene, wenn elektromagnetische Effekte sehr vieler Photonen beobachtet werden. Sie bricht zusammen, wenn es um einzelne Lichtteilchen geht. Es muß also eine grundlegendere Theorie geben, die es uns gestattet einzelne Photonen zu beschreiben und die beim Studium sehr vieler Photonen in die Theorie von Maxwell übergeht, denn diese ist experimentell sehr gut bestätigt. Die Entdeckung der Quantenmechanik für Elektronen und Kernteilchen in den 1920er Jahren legte den Grundstein für diese allgemeinere Theorie. Sie zu formulieren gelang jedoch erst 1949. Ihr Name ist Quantenelektrodynamik (QED) und sie ist die fundamentale Theorie der Chemie, wenn man (zu Recht) annimmt, dass sämtliche chemischen Prozesse dominiert sind durch ausschließlich elektromagnetische Wechselwirkungen. Die QED beschreibt die quantenmechanische Bewegung und Wechselwirkung von Elektronen und Photonen. Man hat festgestellt, dass die elektromagnetische Wechselwirkung der Elektronen durch Photonen vermittelt wird, eine Erkenntnis, die schon durch Maxwells Arbeiten nahegelegt wurde, weil Elektronen elektromagnetische Kräfte aufeinander ausüben. Leider ist der Theorie-Apparat der QED sehr kompliziert. 39 40 1 Erste Schritte zur Theorie der Chemie Glücklicherweise kommt die Theorie der Chemie im wesentlichen ohne die QED aus. Es reicht die in den 1920er Jahren entwickelte Quantenmechanik, die im Kapitel 2 eingeführt wird, aus. Zum einen hat man festgestellt, dass die klassische Beschreibung des Lichts als elektromagnetisches Feld auf molekularer Ebene hinreichend ist, obwohl diese der Natur des Lichts nicht gerecht wird. Zudem wird Licht von Materie entweder gestreut, absorbiert oder emittiert. D.h. die Wechselwirkung des Lichts mit Materie ist sehr schnell und für die Chemie ist oft nur wichtig, was der Zustand der Materie vor und nach der Wechselwirkung mit Licht war beziehungsweise ist. Und genau dafür reicht die Quantenmechanik der 1920er Jahre aus. 1.2.7.3 Elementarteilchen am Doppelspalt und die De Brogliesche Materiewelle Interessanterweise kann man das Doppelspaltexperiment auch mit den anderen bekannten Elementarteilchen durchführen. Wir haben schon am Beispiel der Kathodenstrahlen gesehen, dass wir den Strahl aus einzelnen Elektronen aufgebaut verstanden wollen. Wenn wir nun diesen gedimmten Elektronenstrahl auf einen Doppelspalt richten, dann werden wir exakt dieselben qualitativen Phänomene wie für einzelne Photonen beobachten und im besonderen ein Interferenzmuster! Ebenso ergeht es anderen elementaren Teilchen und sogar Molekülen. Beugung und Interferenz sind also Erscheinungen, zu denen alle Materie fähig ist. Allein weil dieses Konzept heute immer noch verwendet wird, kehren wir nochmals zu dem ‘Wellenbild’ zurück. Die Tatsache, dass auch elementare Materie wie Elektronen, die lediglich historisch zuerst als Teilchen angesehen wurden, in der Lage ist, typische Welleneigenarten (Interferenzmuster) zu zeigen, führte Louis De Broglie 1924 (zwei Jahre vor der Formulierung der modernen Quantenmechanik) zur Postulierung der Materiewelle. De Broglie ordnet dadurch einem Teilchen eine Wellenlänge λ zu, λ= h mv (1.75) die von der Masse m und der Geschwindigkeit v des jeweiligen Teilchens, sowie von der Naturkonstanten h, der Planck-Konstante, abhängt. Über den Sinn des Welle–Teilchen-Dualismus wurde bereits einiges gesagt. An dieser Stellen kann man leicht durch weiteres Fragen den Dualisten den Teppich unter den Füßen wegziehen: Was schwingt denn da im Falle des Elektrons? Wie sieht die zugehörige Wellengleichung aus (NB: die Schrödinger-Gleichung der Quantenmechanik aus Kapitel 2 ist keine Wellengleichung, weil sie keine zweiten Ableitung der Zeit enthält)? Es sollte vielleicht noch erwähnt werden, dass De Broglie den Schluß auf die Welleneigenschaften der als Teilchen gedachten Materie aufgrund von anderen Experimenten zog, die hier nicht besprochen werden, weil der Doppelspaltversuch alle relevanten Effekte in einem Experiment vereint. Heute ar- 1.2 Schlüsselexperimente gumentiert man oft noch mit De Broglie-Wellenlängen, weil sie letztlich eine charakteristische Länge für materielle Objekte liefert, mit der sich qualitativ leicht diskutieren läßt. Diese Laxheit in der Begriffsprägung findet sich oft in den Naturwissenschaften, wenn die richtige Beschreibung zu weitschweifend würde. Das Doppelspaltexperiment mit einzelnen Teilchen kennt noch einen weiteren Dreh. Man könnte sich natürlich fragen, was man beobachtet, wenn man einen Weg findet, herauszubekommen, durch welchen der Spalte die einzelnen Teilchen geflogen sind. Wird man dann auch ein Interferenzbild sehen? Angenommen wir können experimentell nachschauen, durch welchen Spalt das Photon fliegt — beide Spalte sind offen, aber wir messen direkt hinter den Spalten ob ein Teilchen durchfliegt; eine Meßanordnung, die für andere Elementarteilchen leichter zu realisieren ist, weil man dann mit Licht beobachten kann —, dann findet man akkumuliert nicht mehr das Interferenzmuster, sondern nur noch die Summe zweier etwas versetzter Beugungsfiguren wie aus Abb. 1.3(A). Diese Beobachtung hat manche dazu veranlaßt zu erklären, dass, nur wenn man nicht nachschaut, welcher Spalt passiert wurde, ein Photon durch zwei Spalte gleichzeitig fliegen und mit sich selbst interferieren kann. Aber auch diese Interpretation enthält schon zuviel Imagination: Wir messen in einer gewissen Entfernung vom Doppelspalt und imaginieren, was auf dem Weg zum Detektor passiert ist. Genau das verbietet uns aber die ‘neue’, noch zu entwerfende Physik. Die moderne Physik sagt nur, was wir an einem bestimmten Ort zu einer bestimmten Zeit messen werden. Wenn wir nicht messen, werden wir nicht wissen, was passiert ist. Speziell macht es keinen Sinn — wie das einfache Doppelspaltexperiment elegant zeigt — zu imaginieren, was wohl vor der Messung der Fall war. Denn genau in dem Moment, in dem wir feststellen wollen, durch welchen Spalt das Teilchen denn nun wirklich geflogen ist (ein Experiment, das wir natürlich durchführen können, aber dann messen wir eben an einem anderen Ort und nicht erst in größerer Entfernung mit der CCD-Kamera), verlieren wir die Interferenzinformation und sehen das zu erwartende Beugungsbild eines einzelnen Spalts. Genau so haben wir das Experiment dann aufgebaut, so dass garantiert ist, dass das Photon nur einen Spalt durchfliegt. Wir dürfen dann aber nicht darauf schließen, was das Photon macht, wenn wir an den Spalten den Durchtritt nicht experimentell bestimmen und später das Interferenzmuster akkumulieren. Wir dürfen nicht sagen, dass das Photon durch beide Spalte gleichzeitig geflogen ist, weil wir das genau nicht gemessen haben. Wollen wir die Information über den Durchtrittsort, verlieren wir das Interferenzmuster. Wir müssen uns also ‘bescheiden’ mit einer Theorie, die es uns erlaubt, das Meßergebnis für den jeweiligen Versuchsaufbau vorherzusagen — und genau das leistet die Quantenmechanik. 41 42 1 Erste Schritte zur Theorie der Chemie 1.2.7.4 Der photoelektrische Effekt Im 19. Jahrhundert war ein Detektor, der so empfindlich ist wie die CCDKamera, nicht bekannt. Dennoch deuteten Physiker ab 1900 Licht als aus Photonen aufgebaut. Den Grundstein für diese Theorie legte Max Planck, als er versuchte, die sogenannte Schwarzkörperstrahlung mathematisch zu beschreiben. Wenn man einen Körper aufheizt, fängt er ab einer bestimmten Temperatur an zu glühen, sendet also Licht aus (man denke nur an rotbis weisglühendes Eisen unter dem Hammer eines Schmieds). Die spektrale Verteilung des Lichts, das ein heißer Körper aussendet, wurde sehr genau vermessen und natürlich hat man nach einer Theorie gesucht, die diese Intensitätsverteilung als Funktion der Wellenlänge (oder Frequenz) des Lichts beschreibt. Alle Ansätze scheiterten jedoch, was mit dem Namen Ultraviolettkatastrophe belegt wurde, weil der Theoriefehler im Vergleich zum Experiment bei kurzen Wellenlängen umso größer wurde. Planck erkannte dann 1900, dass er durch einen Trick die experimentellen Intensitätskurven genau reproduzieren konnte. Er nahm an, dass die Energie des Lichts in kleinen ‘Paketen’, den Energiequanten, von der heißen Materie ausgesendet wird. Im besonderen mußte er annehmen, dass die kleinste mögliche Energiemenge des Lichts einer gegebenen Frequenz ν gegeben ist durch E = hν (1.76) wobei die Proportionalitätskonstante uns heute bekannt ist als das Plancksche Wirkungsquantum h = 6.62606896(33) · 10−34 [Js]. Dass die Plancksche Konstante die Einheit einer Wirkung, [J s], hat, ergibt sich direkt aus den Dimensionen der beteiligten Grö]ßen; E in [J] und ν in [1/s]. Die Energie von n Photonen ist dementsprechend nhν. Erst Einstein nahm Plancks Vorschlag 1905 auf und machte ihn zu einem generellen Prinzip (von Einstein im Titel seiner Arbeit aber noch ‘heuristischer Gesichtspunkt’ genannt). Unter Verwendung der Planckschen Idee konnte Einstein den sogenannten photoelektrischen Effekt erklären, der heute die Basis der Photoelektronenspektroskopie darstellt. Für diese Arbeit erhielt Einstein 1921 den Nobelpreis für Physik — hauptsächlich wohl, weil die Arbeiten zur speziellen Relativitätstheorie aus demselben Jahr 1905 und gerade die spätere allgemeine Relativitätstheorie von 1915/1916 die Physik so sehr revolutionierten und gleichzeitig in Experimenten damals nicht leicht nachweisbar waren, dass das Nobel-Kommitee hier sicher Sorge hatte, einem Fehler aufzusitzen). Beim Bestrahlen von Metalloberflächen mit Licht hat man folgende Beobachtungen gemacht: 1. Unterhalb einer bestimmten Frequenz νW beobachtet man keinen Austritt von Elektronen. Im besonderen ist diese Beobachtung unabhängig von der Intensität des Lichts, d.h. eine Erhöhung der Intensität von Licht 1.2 Schlüsselexperimente mit einer Frequenz ν < νW führt nicht zum Herauslösen von Elektronen aus der Metalloberfläche. 2. Oberhalb von νW beobachtet man die Freisetzung von Elektronen. Nun hängt aber die Stromstärke, also die Menge der herausgelösten Elektronen, von der Intensität des Lichts ab: je intensiver das Licht, desto mehr Elektronen werden freigesetzt. 3. Erhöht man nun die Frequenz des eingestrahlten Lichts weiter, dann erhöht sich die kinetische Energie Ekin der Elektronen. Einstein konnte nun diese Beobachtungen erklären, indem er Licht als aus Photonen bestehend betrachtete, wobei jedes Photon eine Energie hν übertragen kann zum Herauslösen von Elektronen, was einer Austrittsarbeit W bedarf, wobei überschüssige Energie in Bewegungsenergie des herausgelösten Elektrons umgewandelt wird. Die Energiebilanz lautet dann hν = W + Ekin (1.77) Die erhöhte Intensität des Lichts wird interpertiert als eine Erhöhung der Menge an Photonen, die eingestrahlt werden. Da nur eine bestimmte Frequenz νW ein Herauslösen von Elektronen bewirkt, W (1.78) h nennen wir die Austrittsarbeit (oder die Bindungsenergie der Elektronen im Metall) gequantelt oder quantisiert. νW = 1.2.8 Fraunhofersche Linien und das Bohrsche Atommodell Fraunhofer beobachtete im Licht, das von der Sonne auf die Erde fällt, charakteristische schwarze Linien, die wir heute der Absorption von Licht derjenigen Wellenlänge, die offensichtlich im Sonnenspektrum fehlt, durch Wasserstoffatome zuschreiben. Wenn man Wasserstoffatome stark erhitzt, senden sie Licht aus, das spektral zerlegt (zum Beispiel durch ein Prisma oder durch ein anderes dispersives Element) genau dort scharfe Linien zeigt, wo im Sonnenspektrum die schwarzen Fraunhofersche Linien zu finden sind. Da diesmal das Licht ausgesendet wurde, spricht man vom Emissionsspektrum des Wasserstoffs. Für diejenigen Fraunhoferschen Linien, die in dem für das menschliche Auge sichtbaren Bereich des Lichtspektrums liegen, fand Balmer 1885 Regelmässigkeiten, die er in folgender Gleichung für die Wellenzahl ν̃ des absorbierten Lichts zusammenfasste ! 1 1 ν̃ = R H (1.79) − 2 22 n1 43 44 1 Erste Schritte zur Theorie der Chemie mit der Rydberg-Konstante für Wasserstoff R H = 109677, 576 cm−1 und n1 ≥ 3. Der Satz Fraunhoferscher Linien, der dieser Gleichung gehorcht, wird Blamer-Serie genannt. Als die nötigen optischen Instrumente entwickelt waren, mit denen man auch die Bereiche des Sonnenspektrums untersuchen konnte, die vom menschlichen Auge nicht wahrgenommen werden, fand man weitere Linien, die allgemein der Gleichung ! 1 1 ν̃ = R H (1.80) − 2 n22 n1 gehorchen. Nach ihren Entdeckern nennt man die Serie für n2 = 1 im ultravioletten Teil des Spektrums Lyman-Serie (1916), diejenige für n2 = 3 im nahen Infrarot Paschen-Serie (1908), diejenige für n2 = 4 im mittleren Infrarot Brackett-Serie (1922), und schließlich diejenige für n2 = 5 im fernen Infrarot Pfund-Serie (1924). Bohr formulierte 1913 zur Beschreibung dieser Beobachtungen ein ad hoc Atommodell, mit dem er die experimentellen Beobachtungen wiedergeben, aber nicht erklären konnte (wegen der willkürlichen Annahmen, die im Widerspruch zur klassischen Physik selbst stehen). Die Idee dabei ist, dass absorbiertes oder emittiertes Licht die Energie des Elektrons im Wasserstoffatom ändert. Dabei wechselt das Elektron die Umlaufbahn um den Atomkern. Dazu mußte er annehmen, dass Elektronen sich auf Kreisbahnen mit festem Radius r um den Atomkern bewegen. Nicht alle Radien sind dabei erlaubt. Diese Annahme ist, wie wir noch sehen werden, äquivalent mit der Forderung, dass der Betrag des Bahndrehimpulses l = |r × p| = r me v nur bestimmte Werte annehmen kann, l = nh̄ n∈N (1.81) also gequantelt ist (die fixen Radien folgen dann daraus). Für die Quantisierungsbedingung haben wir die reduzierte Planck-Konstante ‘h-quer’ verwendet, h̄ = h/2π. Weil das Elektron seine Bahn nicht verläßt gilt Kräftegleichgewicht: Zentripetalkraft=Zentrifugalkraft, 1 Ze e v2 = me 2 4πǫ0 r r (1.82) Die Zentripetalkraft ist in diesem Fall natürlich die Coulomb-Anziehung und der Atomkern liegt im Ursprung des Koordinatensystems, wie im Zusammenhang mit Gl. (1.46) besprochen. Aus dieser Gleichung können wir eine Gleichung für den Radius der Kreisbahn ableiten, r= 1 Ze2 4πǫ0 me v2 (1.83) 1.2 Schlüsselexperimente beziehungsweise m e v2 = 1 Ze2 4πǫ0 r (1.84) Aus der Drehimpulsquantelung erhalten wir einen Ausdruck für die Geschwindigkeit l = r me v = nh̄ ⇒ v= nh̄ me r (1.85) so dass wir den Radius scheiben können als r ⇒ r = = 1 4πǫ0 me Ze2 2 = nh̄ me r 1 Ze2 r2 me 4πǫ0 n2 h̄2 4πǫ0 n2 h̄2 Ze2 me (1.86) Für Z = 1 und n = 1 ergibt sich der sogenannte Bohr-Radius a0 , a0 ≡ 4πǫ0 h̄2 e2 m e (1.87) Die Energie des Elektrons auf der Kreisbahn erhalten wir durch Addition von kinetischer und potentieller Energie, Egesamt = Ekin + E pot = (1.84) = (1.86) = 1 Ze2 1 m e v2 − 2 4πǫ0 r 1 1 Ze2 1 Ze2 1 1 Ze2 − =− 2 4πǫ0 r 4πǫ0 r 2 4πǫ0 r 2 4 1 1 Z e me (1.88) − 2 (4πǫ0 )2 n2 h̄2 Die Energie ist also proportional zu 1/n2 , woraus wir schließlich die Gleichung von Balmer erhalten, wenn wir zwei Energien für zwei Bahnen, zwischen denen wir mit Licht schalten, voneinander abziehen. Abgesehen von der willkürlichen Annahme der Drehimpulsquantelung, die Bohr in sein Modell hineinstecken mußte, sind Konsequenzen des Atommodells aus weiteren Gründen nicht konsistent mit der klassischen Physik. Ein um den Kern umlaufendes Elektron ändert stetig seine Bewegungsrichtung zum Kern hin aufgrund der Coulomb-Anziehungskraft. Es wird also stetig zum Kern hin beschleunigt. Beschleuingte Ladungen strahlen aber laut Maxwells Elektrodynamik elektromagnetische Wellen ab. Dieses Licht wird aber nicht beobachtet. Falls es Licht abstrahlen würde, müßte das Elektron 45 46 1 Erste Schritte zur Theorie der Chemie seine Umlaufbahn langsam verlassen und würde in den Kern stürzen, was ebenfalls nicht beobachtet wird. 1.3 Radioaktivität und Kernstruktur Vieles ist über Atomkerne heute experimentell bekannt, doch eine vollumfänglich befriedigende Theorie konnte noch nicht aufgestellt werden. Für die Chemie wissen wir aber, dass das experimentelle Wissen hinreichend ist. Wir werden bei der Diskussion der Quantenmechanik sehen, dass die Chemie mit ausreichender Genauigkeit beschrieben wird, wenn man annimmt, dass die positive Ladung eines Atoms allein in einem ausdehnungslosen Punkt konzentriert wird. Einige Prozesse, die im Atomkern ablaufen, müssen jedoch etwas ausführlicher diskutiert werden. Im Jahre 1938 entdeckten nach langen Vorarbeiten Hahn, Straßmann und Meitner die Spaltung (Fission) von Atomkernen. Diese läuft bei schweren Atomkernen unter Freisetzung von Energie ab, die in Atomreaktoren zur Erzeugung von elektrischem Strom durch Produktion von Wasserdampf für Generatoren benutzt wird. Leichte Kerne dagegen können unter Energiefreisetzung verschmolzen werden (Fusion), ein Prozess, der in unserer Sonne abläuft und die Erde mit Energie, dem Sonnenlicht, versorgt. Es ist klar, dass bei mittleren Kerngrößen besonders stabile Atomkerne zu erwarten sind, weil kleine unter Energiefreisetzung fusionieren, während sehr grosse unter Energiefreisetzung gespalten werden können. Dies gilt zum Beispiel für Eisen, das daher auch als Endprodukt des Fusionsprozesses in den Kernen von Planeten und Sternen (Sonnen) vorkommt. 1.3.1 Zerfallsprozesse Radioaktive Prozesse setzen verschiedene Sorten Teilchen frei. Deren Natur läßt sich wieder studieren bei Eintritt in elektrische Felder, so wie wir es bereits am einfachen Experiment der Kathodenstrahlen gesehen haben . Manche Strahlen (γ-Strahlen) werden durch diese Felder nicht beeinflußt, sind also nicht geladen, während andere zum elektrischen Pluspol (also negative geladen sind, β− -Zerfall) oder zum elektrischen Minuspol (also positiv geladen sind, α-Strahlen) abgelenkt werden. An den Bezeichnungen ist bereits zu erkennen, dass man die in ihrer Zusammensetzung zunächst unbekannten Strahlen einfach entsprechend dem griechischen Alphabet durchbuchstabierte: 1.3 Radioaktivität und Kernstruktur 1.3.1.1 α-Strahlen Viele Atomkerne zerfallen unter Freisetzung besonders stabiler 42 He2+ -Kerne, die in Form von α-Strahlen freigesetzt werden (s.a. Rutherfordscher Streuversuch). 1.3.1.2 β-Strahlen Andere Atomkerne sind in der Lage Elektronen aus dem Atomkern zu emittieren. Aus Gründen der Ladungserhaltung bleibt ein Proton im Kern zurück, wodurch ein anderes Element mit einfach erhöhter Kernladung entsteht. Die Energie des emittierten Elektrons kan dabei kontinuierliche Werte annehmen. Aus Gründen der Energieerhaltung muß daher noch ein weiteres Teilchen entstehen, das Antineutrino. 1.3.1.3 γ-Strahlen Angeregte Atomkerne, die etwa in einer Zerfallskette nach vorausgehendem α-Zerfall entstehen können, gehen in einen energetisch niedrigsten Zustand über, dem sogenannten Grundzustand des Atomkerns. Dabei wird Energie in Form von hochenergetischem Licht, der γ-Strahlung, freigesetzt. Die Energie dieses Lichts ist größer als die der Röntgenstrahlen. Dieses hochenergetische Licht trägt keine elektrische Ladung passiert daher Kondensatoren unbeeinflußt. 1.3.2 Kinetik radioaktiver Zerfälle Die chemische Kinetik beschäftigt sich mit der Veränderung von Konzentrationen oder Stoffmengen mit der Zeit. Die Änderung einer Stoffmenge mit der Zeit wird allgemein Reaktionsgeschwindigkeit oder auch Reaktionsrate genannt. Das entsprechende Geschwindigkeitsgesetz für Konzentrationen ergibt sich durch konsistentes Wichten mit dem Volumen auf das die Stoffmenge zu beziehen ist, um so die Konzentration zu erhalten. Am Beispiel der Radioaktivität können wir eine der einfachsten Kinetiken studieren, die sogenannte Kinetik erster Ordnung. Der radioaktive Zerfall ist ein von außen nicht beeinflußbarer Prozeß, den wir daher nur statistisch beschreiben können: Wir können nicht wissen, wann ein einzelner Atomkern zerfallen wird, sondern können nur angeben, welcher Anteil an Atomkernen in einer großen Stoffmenge statistisch in einem Zeitintervall zerfallen wird. Aus dieser Überlegung folgt, dass die Zerfallsgeschwindigkeit, also die Verringerung der Anzahl der Atomkerne N durch Zerfall mit der Zeit, dN/dt, nur von der Anzahl N (t) am Meßzeitpunkt t der 47 48 1 Erste Schritte zur Theorie der Chemie Messung abhängen kann, also proportional zur ihr ist − dN (t) ∝ N (t) dt (1.89) Das Minuszeichen deutet die Abnahme der Atomkernmenge an. Wenn wir nun eine Proportionalitätskonstante, die sogenannte Geschwindigkeits- oder Raten-Konstante k einführen, dann können wir schreiben dN (t) = −kN (t) dt (1.90) Diese Gleichung für die Zerfallsgeschwindigkeit bezeichnet man auch als (differentielles) Geschwindigkeitsgesetz des radioaktiven Zerfalls. Mathematisch gesehen ist das Geschwindigkeitsgesetz eine Differentialgleichung erster Ordnung, weil sie (maximal) erste Ableitungen nach der Variablen, der Zeit, enthält. Weil die Stoffmenge N (t) nur linear in dieses Gesetz eingeht auf der rechten Seite, nennt man diese Kinetik eine Kinetik erster Ordnung. Das Geschwindigkeitsgesetz ist offensichtlich ein differentielles Gesetz, das nur infinitesimale Stoffmengenänderungen in infinitesimal kleinen Zeitintervallen beschreibt. Um daraus eine für makroskopische Zeitintervalle gültige Gleichung zu erhalten, müssen wir es integrieren. Die Integration dieser Differentialgleichung erfolgt durch das Rezept der Variablentrennung, weil Stoffmengen und Zeiten auf die beiden Seiten der Gleichung separiert werden können, wenn wir uns erlauben, den Differentialquotienten wie einen gewöhnlichen Bruch zu behandeln dN (t) = −kdt N (t) (1.91) Diese Gleichung integrieren wir nun unbestimmt Z dN (t) = N (t) Z d[ln N (t)] = Z −kdt = −k Z dt (1.92) und erhalten ln N (t) = −kt + C ′ (1.93) mit C ′ als Integrationskonstante (die beim Ableiten wieder wegfallen würde). Durch Erheben der beiden Seiten der Gleichung zu Exponenten in der Exponentialfunktion können wir diese Gleichung nach der Lösungsfunktion der Differentialgleichung erster Ordnung auflösen, eln N (t) ⇒ N (t) ′ = e−kt+C = e−kt eC = Ce −kt ′ (1.94) (1.95) 1.3 Radioaktivität und Kernstruktur wobei wir C ≡ exp (C ′ ) eingeführt haben. Die Anzahl radioaktiver Atomkerne nimmt also exponentiell schnell mit der Zeit ab, wobei die genaue Abnahme durch die Materialkonstante k bestimmt wird, die für jede Atomkernsorte spezifisch ist. Die modifizierte Integrationskonstante C hängt von der Anfangskonzentration an Atomkernen ab, wie man leicht durch bestimmte Integration nachweisen kann. In unserer statistischen Betrachtung des radioaktiven Zerfalls klingt die Atomkernanzahl exponentiell ab. Zu seiner Charakterisierung würden wir gerne charakteristische Zerfallszeiten definieren, die uns erlauben, festzuhalten, ob ein Zerfall langsam oder schnell ist. Gebräuchlich sind zwei solcher Zeiten: die Halbwertszeit τ (oft auch durch einen Index 1/2 gekennzeichnet) gibt an, nach welcher Zeit die Hälfte der Atomkerne zerfallen ist, während die Lebenszeit τ ′ angibt, wieviel Zeit verstreicht, bis die Menge auf 1/e abgefallen ist, τ= ln 2 k und τ′ = 1 k (1.96) 1.3.3 Nukleare Kettenreaktion Kernspaltungsreaktionen lassen sich auch induzieren. Uran-Kerne spalten unter Freisetzung von Neutronen, die mit nicht zu hohen kinetischen Energien auf andere Atomkerne treffen können und diese spalten. Im Gegensatz zu den α-Strahlen des Rutherfordschen Streuversuchs werden die elektrisch ungeladenen Neutronen nicht von der Coulomb-Barriere des Atomkerns abgestoßen oder abgelenkt. Die durch die Neutronen gespaltenen Kerne setzen weitere Neutronen frei, die wiederum andere Kerne spalten. Da sich die Zahl der Neutronen bei jeder Generation vervielfacht, kommt eine Kettenreaktion zu Stande, die ungebremst in einer Atomexplosion abläuft, während sie in Atomreaktoren durch Graphit-Stäbe moderiert wird, die dafür sorgen, dass die Kettenreaktion kontrolliert werden kann. Da der Kernzerfall von Neutronen induziert wird, ändert sich das oben aufgestellte Geschwindigkeitsgesetz. Der Kern hat nun einen Reaktionspartner (das Neutron) und sämtliche Gleichungen des vorstehenden Abschnitts können nicht mehr angewendet werden, weil die Voraussetzung — nämlich dass der Kern ohne äußeren Einfluß zerfällt — nicht mehr gültig ist. 49 51 2 Einführung in die Quantenmechanik 2.1 Postulate Durch die bisherige Diskussion experimenteller Ergebnisse haben wir gesehen, dass sämtliche Materie aus räumlich wohl getrennten Objekten aufgebaut ist. Klumpen positiver Ladung, aufgebaut aus Protonen und Neutronen mit einer Ausdehnung von einem bis einigen Femtometern (also ein Millionstel eines Millardstel Meters), werden umgeben von deutlich leichteren, umgekehrt geladenen Teilchen, den Elektronen. Es sind also fast ausschließlich die Elektronen, die sich in dem Volumen bewegen, das wir einem Molekül zuschreiben wollen. Wir benötigen nun eine Theorie, die uns erklärt, wie Atome aufgebaut, was ihre Eigenschaften sind (warum wir beispielsweise Fraunhofersche Linien beobachten können) und wie sie sich verbinden und so Moleküle bilden. Was ist der Klebstoff der Atome im Molekül? Nach den experimentellen Ergebnissen ist klar, dass die Klärung dieser Fragen nur folgende Ingredientien verwenden darf: Atomkerne, Elektronen, elektromagnetische Wechselwirkungen. Daher muß die Theorie eine mechanische Theorie sein. Sie muß uns erlauben, das Bewegungs- und Wechselwirkungsverhalten dieser elementaren Bestandteile zu beschreiben. Die neue Theorie muß auch das erklären, was die klassische Mechanik eingangs nicht vermochte, nämlich warum es überhaupt einzelne Atome gibt und warum einzelne Moleküle. Warum gibt es nicht einfach nur Makromoleküle oder sogar ‘makroskopische’ Moleküle wie zum Beispiel einen mit bloßem Auge beobachtbaren, kubischen NatriumchloridEinkristall. Die Theorie, die all dies leistet und die durch sämtliche chemische Phänomene grandios bestätigt wurde, ist die Quantenmechanik, die Mitte der 1920er Jahre von Schrödinger, Heisenberg und anderen entdeckt wurde. Man kann sie nicht ableiten und die Entdecker der Theorie konnten sich nur durch Analogien und durch ihre Erfahrung mit physikalischen Theorien und mathematischen Gleichungen leiten lassen. Daher gehen wir hier nun genauso vor, wie bei der Einführung der klassischen Mechanik durch Postulieren der Netwonschen Axiome: Wir formulieren eine möglichst geringe Anzahl von PostulaAllgemeine Chemie. Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008 52 2 Einführung in die Quantenmechanik ten, aus denen sich die gesamte Chemie dann ableiten läßt. Insgesamt werden es sechs Postulate sein, von denen wir die Postulate 0 bis 4 im folgenden einführen, während das letzte Postulat, Postulat 5, erst im Rahmen von Vielelektronensystemen benötigt und dort eingeführt wird. 2.1.1 Postulat 0: Elementarteilchen in der Chemie Die Physik kennt, wie wir gesehen haben, einen ganzen Zoo an Elementarteilchen. Die Komplexität der Chemie mit all ihren Molekülen und Reaktionen resultiert dagegen nur aus einer sehr geringen Zahl an Elementarteilchen, neben den Elektronen sind dies etwas mehr als 100 Typen von Atomkernen, die sich durch ihre Protonenzahl unterscheiden. Wir formulieren daher ein nulltes Postulat, das die Objekte der Theorie definiert: Postulat 0: Die Theorie der Chemie erfordert eine quantenmechanische Beschreibung des Bewegungs- und Wechselwirkungsverhaltens von Elektronen und Atomkernen. Für die Chemie ist ausschließlich ihre Interaktion durch elektrostatische Kräfte von Bedeutung. Einige ergänzende Eläuterungen sind noch der Vollständigkeit halber nötig. (1) Das Postulat 0 spricht von elektrostatischen Kräften zwischen den (chemischen) Elementarteilchen und läßt magnetische Wechselwirkungen außen vor. Die sich bewegenden Elektronen erzeugen natürlich, wie alle bewegten Ladungen, magnetische Felder. Man hat diese magnetischen Felder, die unter dem Namen Breit-Wechselwirkung in der Quantenmechanik bekannt sind, untersucht und festgestellt, dass ihr Beitrag zur potentiellen Energie gegenüber der rein elektrostatischen Coulomb-Wechselwirkung in der Regel vernachlässigbar ist. Zudem ist es so, dass magnetische Felder eng mit Einsteins spezieller Relativitätstheorie verknüpft sind und in einer nichtrelativistischen Theorie, wie der Newtonschen Mechanik, nicht vorkommen. Eine nichtrelativistische Formulierung erlaubt einen umgehenden (d.h. sofortigen oder instantanen) Austausch von Wechselwirkungen. Tatsächlich breitet sich aber die Wechselwirkung elektrischer Ladungen mit Lichtgeschwindigkeit c (eben mit der Geschwindigkeit der die Wechselwirkung vermittelnden Photonen) aus. Nun tragen aber magnetische Felder zur Wechselwirkungsenergie immer mit einem Vorfaktor 1/c im Vergleich zu der elektrostatischen CoulombWechselwirkung bei. Weil c sehr groß (in einer nichtrelativistichen Theorie unendlich groß) ist, kann man die magnetischen Wechselwirkungen erst einmal vernachlässigen. Allerdings gilt das Vorstehende nicht uneingeschränkt. Drehbewegungen von Elementarteilchen erzeugen magnetische Felder, die mit anderen magne- 2.1 Postulate tischen Feldern wechselwirken können, wie wir gerade im Zusammenhang mit dem Spin von Elektronen und Atomkernen noch sehen werden. (2) Alle Elementarteilchen werden beschrieben als Punktteilchen. D.h. dass wir jedem Elementarteilchen innerhalb der Theorie eine Position im Raum, r, zuweisen. Diese Position ist nicht zu verstehen als eine Art mittlere Position eines ausgedehnten Objekts (wie es etwa ein Ladungs- oder Massenschwerpunkt wäre). Wir werden also das Bewegungsverhalten von punktförmigen Teilchen in unserer neuen Mechanik beschreiben. Denkt man an die im Vergleich zu den Atomkernen drei bis vier Größenordnungen kleinere Masse des Elektrons, dann akzeptiert man leicht, dass ein Elektron als Punktteilchen behandelt werden kann (tatsächlich sucht man noch heute experimentell nach dem elektrischen Dipolmoment des Elektrons, um so einen Nachweis für eine räumliche Ausdehnung der Ladung des Elektrons zu finden). Dagegen ist experimentell bekannt, dass die Größe der Atomkerne im Femtometerbereich liegt. Das bedeutet, dass ihre positive Ladung nicht in einem Punkt konzentriert sein wird. Nun ist aber nur wichtig zu wissen, ob die Form des Atomkerns überhaupt einen Unterschied machen wird, wenn man die elektrostatische Coulomb-Wechselwirkung zweier Atomkerne oder von Elektronen und Atomkernen in der Quantenmechanik studiert. In der klassischen Mechanik und Elektrodynamik macht es einen Unterschied, ob eine Ladungsverteilung punktförmig oder ausgedehnt ist — selbst wenn der Raum der Ausdehnung sehr, sehr klein ist. In der Quantenmechanik erhält man dann auch unterschiedliche Energien, jedoch sind die Unterschiede der Energien für punktförmige wenn verglichen mit ausgedehnten Atomkernen für chemische Fragestellungen fast immer vernachlässigbar. Daher wählen wir die einfachste Darstellung, nämlich die der Punktkerne. Die Wahl des einfachsten Weges, wenn er begründet zum (nahezu) selben Ergebnis führt, wird in der Naturphilosophie auch die Anwendung des Ockhamschen Rasiermessers genannt, mit dem man unnötigen Balast abschneidet. Man könnte nun einwenden, dass ein punktförmiger Atomkerne doch eigentlich einen Nachteil birgt, nämlich die Singularität in der Wechselwirkungsenergie, die man bei sehr kleinen Abständen findet — schließlich ist diese Energie in der radialen Abstandsvariablen r proportional zu −1/r [Gl. (1.46)], strebt also gegen minus Unendlich für r → 0. Andererseits erfordert eine endliche Ausdehnung die Wahl einer Ladungsverteilungsfunktion, wofür aber nur Modellfunktionen zur Verfügung stehen, weil die Ladungsverteilung zur Zeit weder experimentell noch theoretisch eindeutig bestimmt werden kann. Solange die Punktkernsingularität zu keinem ernsten mathematischen Problem führt, ist das Punktkernmodell die bessere Wahl. An dieser Stelle ist ein Vorgriff nötig, um spätere Verwirrung zu vermeiden: Zwar weisen wir jedem Elementarteilchen einen Punkt im Raum zu, dies heißt aber nicht, dass dieser Ort dieselbe Funktion hat wie in der klassischen 53 54 2 Einführung in die Quantenmechanik Mechanik. Diese Orte der Punktteilchen sind nicht die Positionen, an denen wir den Aufenthaltsort der Teilchen messen können. Das liegt daran, dass die Quantenmechanik einen speziellen Mechanismus zur Messung von beobachtbaren Größen vorschreibt. Wenn wir die Position eines Elektrons im Raum messen wollen, können wir nicht einfach r verwenden, sondern müssen eine genaue Vorschrift der Quantenmechanik zur Ortsmessung beachten, die wir noch einzuführen haben (s. Postulat 3). (3) Nachdem wir die Frage der Ausdehnung der ‘chemischen’ Elementarteilchen erörtert haben, können wir auch gleich das Problem der Isotope behandeln: Atomkerne mit gleicher Protonen aber unterschiedlicher Neutronenzahl unterscheiden sich einzig und allein durch ihre Massen, weil wir sämtliche Atomkerne als Punktteilchen behandeln. Dies ist natürlich eine Näherung, die aber in der Regel für die Chemie ausreichend ist. In anderen Worten, Reaktionsenergien oder Bindungslängen sind durch diese Näherung fast nicht nachweisbar betroffen. Es gibt einige spezielle experimentelle Bedingungen unter denen man Isotopeneffekte beobachten kann. Natürlich ist dies möglich in hochauflösenden spektroskopischen Experimenten, es gibt aber auch Effekte auf Reaktionskinetiken (Geschwindigkeitskonstanten), die sich bei leichten Atomen über die Masse der schwingenden Atom(kern)e und bei schweren Atomen über die unterschiedliche Ausdehnung der Atomkerne verschiedener Isotope, über die sich die positive Kernladung dann verteilt, auswirken. 2.1.2 Postulat 1: Zustandsfunktion Die Struktur der Quantenmechanik ist völlig anders als die der klassischen Mechanik, was die eigentlich Hürde dieser Theorie darstellt. Während eine Gleichung der klassischen Mechanik direkt anzeigt, wie man einen experimentellen Aufbau zu entwerfen und Meßwerte einzusetzen hat — man erinnere sich nur an die Definition der Geschwindigkeit, deren Meßwert sich direkt errechnet aus dem zurückgelegten Weg geteilt durch die dafür benötigte Zeit —, funktioniert die Quantenmechanik völlig anders. Wir postulieren: Postulat 1: Es existiert für jedes System von Elementarteilchen eine Zustandsfunktion Ψ, die sämtliche Informationen kodiert, die wir in einem Experiment prinzipiell in Erfahrung bringen können. Diese Zustandsfunktion wird aus historischen Gründen oft Wellenfunktion genannt. Der Name ist allerdings äußerst verwirren, weil die Wellenfunktion nicht die de Brogliesche Materiewelle beschreibt. Die Wellenfunktion erfüllt nicht einmal eine Wellengleichung, wie wir bei Postulat 2 sehen werden. Unter ‘System’ soll im folgenden eine Ansammlung von Elementarteilchen verstanden werden. In der Praxis trifft der Mensch die Wahl, was zum Sy- 2.1 Postulate stem zählt und was nicht. Im Prinzip ist das System der Quantenmechanik das Universum, ganz entsprechend dem universalistischen Anspruch der Quantenmechanik. Eine sinnvolle Wahl zum Studium molekularer Objekte wird bestimmt durch das Wissen um eine möglichst schwache Wechselwirkung mit einer etwaigen Umgebung. Hier können ChemikerInnen von ihrem breiten experimentellen Wissen profitieren. Die Chemie hat einen experimentellen Zugang zur Formulierung ‘sinnvoller’ Moleküle gefunden und genau dieses Wissen erlaubt es ChemikerInnen ein sinnvolles molekulares System zu definieren. Natürlich braucht es dieses Wissen im Prinzip nicht, aber es wäre äußerst mühselig verschiedene Systemgrößen theoretisch zu untersuchen, um dann sinnvolle Systemgrößen festzustellen. Wenn man allerdings so vorgeht, wird man in der Regel nach der quantenmechanischen Analyse den intuitiven Vorschlag der ChemikerInnen bestätigt finden. (Dies hat damit zu tun, dass eine chemisch sinnvolle Lewis-Struktur etwas mit dem Raten von Wellenfunktionen zu tun hat — eine Wellenfunktion, die ein System in einem ungünstigen Energiezustand beschreibt, gehört, etwas salopp gesagt, zu einer unvernünftigen Lewis-Struktur.) 2.1.3 Postulat 2: Bewegungungsgleichung Durch Postulat 1 haben wir die Existenz einer Funktion gefordert, die der Träger der physikalischen Information für unser System ist. Natürlich entwickelt sich ein System mit der Zeit und damit verändert sich auch unser Informationsträger. Die Frage ist wie. Wie für jede gute mechanische Theorie gilt es also noch eine Bewegungsgleichung zu postulieren — so wie wir in der klassischen Mechanik die Newtonsche Bewegungsgleichung, Gl. (1.10), postulierten: Postulat 2: Die Zustandsfunktion Ψ verändert sich mit der Zeit, was durch die zeitabhängige Schrödinger-Gleichung beschrieben wird ih̄ ∂ Ψ = ĤΨ ∂t (2.1) wobei Ĥ der sogenannte Hamilton-Operator ist. Natürlich hilft uns diese Gleichung noch nicht weiter, solange nicht postuliert wird, wie der Hamilton-Operator aussieht. Dies ist allerdings nicht so leicht, weil die Form von Ĥ vom System abhängt. Wir haben schon in frühreren Abschnitten Operatoren kennengelernt. Auch der Hamilton-Operator ist eine Abkürzung für eine Anzahl an Rechenvorschriften, die auf die Wellenfunktion angewendet werden müssen. Der Name deutet schon an, dass dieser Operator das quantenmechanische Analogon zur Hamilton-Funktion — 55 56 2 Einführung in die Quantenmechanik also zur Gesamtenergie — der klassischen Mechanik ist, die wir in Gl. (1.34) kennengelernt haben. Schrödinger hat gefunden, dass der Hamilton-Operator für ein Elementarteilchen, das keinen Wechselwirkungen unterliegt, sich wie folgt schreiben läßt h̄2 ∆ (2.2) 2m wobei ∆ der schon bekannte Laplace-Operator und m die Masse des Teilchens ist. Die klassische Mechanik, die unsere tägliche Erfahrungswelt so gut beschreibt, muß von der Quantenmechanik, deren Gültigkeitsanspruch universell ist, umschlossen werden. Das bedeutet, dass es einen Bezug zur klassischen Mechanik geben sollte/muß. Dieser wird hergestellt durch das sogenannte Korrespondenzprinzip. Ĥ = − Korrespondenzprinzip: Das Finden eines mathematischen Ausdrucks für einen Operator kann sich an den Ausdrücken der klassischen Physik orientieren. D.h. die Form des Hamilton-Operators ist gleich der Form der Hamilton-Funktion. Das bedeutet, das obiger Hamilton-Operator für ein freies Teilchen dieselbe Form haben muß, wie die Hamilton-Funktion für ein freies Teilchen. Die Hamilton-Funktion ist in diesem Fall nichts anderes als die kinetische Energie des Teilchens, p̂2 p2 ⇒ Ĥ = (2.3) 2m 2m wobei wir den klassischen Impuls p durch einen entsprechenden Operator p̂ ersetzt haben. Natürlich stellt sich jetzt die Frage, wie denn der Impulsoperator genau aussieht. Dies läßt sich durch Vergleich mit Gl. (2.2) direkt ableiten: H= p̂ ≡ −ih̄∇ ⇒ p̂2 = pp = (−ih̄∇) (−ih̄∇) = i2 h̄2 ∇2 = − h̄2 ∆ (2.4) Oft werden Randbedingungen an die Wellenfunktion formuliert, zum Beispiel, dass eine Wellenfunktion zweimal differenzierbar (und ergo auch stetig) sein muss, weil sonst die Wirkung des Laplace-Operators im HamiltonOperator nicht definiert wäre. Wir können uns hier aber auf einen rein physikalischen an Stelle des mathematischen Standpunktes zurückziehen: Eine Funktion, die nicht zweimal differenziert werden kann, ist sicher keine Schrödinger-Wellenfunktion, die ein physikalisches System beschreibt. Wenn wir das Korrespondenzprinzip nun auf zwei sich bewegende und wechselwirkende Ladungen 1 und 2 anwenden, so ergibt sich analog Ĥ = p̂21 p̂2 q1 q2 1 + 2 + 2m1 2m2 4πǫ0 |r 1 − r 2 | (2.5) 2.1 Postulate Das Korrespondenzprinzip verlangt natürlich, dass alle Variablen der klassischen Mechanik zu Operatoren promoviert werden, nicht nur der Impuls. Auch die Ortsvektoren r i werden zu Operatoren r̂ i . Der Kürze wegen nehmen wir hier aber vorweg, dass Ortsoperatoren r̂ i gleich den Ortsvektoren r i sind und kommen erst im Zusammenhang mit Postulat 4 wieder darauf zurück. Das Konstruktionsprinzip des Hamilton-Operators ist also stets: Summiere alle Operatoren für die kinetische Energie, p̂2i /2mi , der einzelnen Elementarteilchen i und addiere dann noch alle Wechselwirkungsenergie-Operatoren. Man beachte, dass wir für alle doch so verschiedenen Hamilton-Operatoren stets dasselbe Symbol, Ĥ, verwenden. Da die Impulsoperatoren in dieser Form — man nennt sie Ortsdarstellung — nur von den Ortsvektoren der Teilchen im System abhängen, hängt der Hamilton-Operator nur von den Ortskoordinaten dieser Teilchen ab. Dementsprechen hängt die Wellenfunktion nur von diesen Koordinaten ab, Ψ = Ψ({r i }, t), wobei die Koordinaten aller Teilchen durch die Mengenklammern symbolisiert wurden. 2.1.4 Postulat 3: Meßwerte Postulat 3: Jeder physikalischen Observablen wird ein Operator zugewiesen. Zu diesem Operator gibt es quantenmechanische Zustandsfunktionen Ψi , aus denen bei Anwendung des Operators, ÂΨi , der Meßwert Ai extrahiert wird, was sich mathematisch schreiben läßt als ÂΨi = Ai Ψi (2.6) Eine Gleichung von so einem Typ wird in der Mathematik Eigenwertgleichung genannt. Die Funktion Ψi heißt dann Eigenfunktion und die Zahl Ai heißt Eigenwert. Weil die Quantenmechanik von Zuständen spricht, nennt man die Eigenfunktion auch Eigenzustand. In der Regel erfüllt mehr als ein Eigenpaar (Ψi , Ai ) eine solche Gleichung und der Index i trägt dem Rechnung. Die verschiedenen Lösungspaare werden durch den Laufindex i unterschieden. Es hat sich eingebürgert, einen solchen Index Quantenzahl zu nennen. In manchen Fällen — wie zum Beispiel bei dem noch zu besprechenden WasserstoffAtom — hängt der Eigenwert sogar direkt von der Quantenzahl ab, was dazu geführt hat, dass den Quantenzahlen eine Rolle zugewiesen wird, die ihre Bedeutung übertreibt, da sie letztlich nur die Rolle eines Zählindex’ haben. Für Moleküle beliebiger Struktur hängen auch die Eigenwerte nicht mehr von diesem Zählindex ab. Die Eigenwertgleichung drückt also aus, dass der Operator, der in der Quantenmechanik einer physikalischen Observablen zugeordnet ist, auf eine 57 58 2 Einführung in die Quantenmechanik bestimmte Funktion, die Eigenfunktion, angewendet, eine reelle Zahl, Ai ∈ R, multipliziert mit der Funktion selbst ergibt. Der Operator ist also so etwas wie die theoretische Formulierung der Messung: Ein System sei durch die Zustandsfunktion Ψ beschrieben, die sämtliche Information über das System trägt, dann ermitteln wir die Information (zum Beispiel die Energie des Systems), indem wir eine Messung durchführen, hier ausgedrückt durch die Anwendung des Operators. Das Postulat 3 ist ein unglaublich starkes Postulat, was besonders deutlich wird durch seine Invertierung: Eine reelle Zahl, die nicht Eigenwert einer Observablen ist, kann nicht gemessen werden! Natürlich stellt sich die Frage, wie man die Operatoren zu den Observablen kennen kann. Hier hilft bei vielen Observablen das oben schon eingeführte Korrespondenzprinzip weiter und wir werden später weitere Beispiele wie den Drehimpuls-Operator kennenlernen. Wenn wir die Energie eines Systems messen wollen, müssen wir den Energieoperator auf die Zustandsfunktion wirken lassen. Der Energieoperator ist der Hamilton-Operator und daher können wir eine Eigenwertgleichung für die Energie wie folgt formulieren ĤΨi = Ei Ψi (2.7) Diese Gleichung bestimmt, was die erlaubten Energien eines Systems sind, denn nur die Energien Ei können gemessen werden. Wenn wir die EnergieEigenwertgleichung lösen, was später in diesem Kapitel für Modellsysteme durchgeführt wird, erhalten wir sämtliche Energien, die unser System einnehmen kann. Das bedeutet auch, das wir in der Lage sein sollten, die Lage der Fraunhoferschen Linien im Spektrum zu erklären, weil wir deren Lage als die Energie verstehen, die nötig für den Wechsel zwischen zwei durch die Quantenmechanik berechenbaren Energien — wir könne jetzt sagen: EnergieEigenzuständen — ist. Diese Situation ist in Abb. 2.1 dargestellt. Auf diese Weise kann die Quantenmechanik durch die Energie-Eigenwerte die experimentell in der Atomspektroskopie beobachteten Termschemata erklären. Daher wird die Menge der Energie-Eigenwerte auch Spektrum genannt. 2.1 Postulate Satz der Energie− Eigenwerte eines Systems: Ε3 Ε2 Ε1 mit Licht kann man zwischen den Energie− hν zuständen schalten Ε0 Abbildung 2.1 Fundamentale Darstellung jeder Spektroskopie-Technik, bei der ein Wechsel zwischen Energiezuständen (Energie-Eigenwerten) eines Systems durch Licht induziert wird. Da emittiertes Licht das System verläßt und absorbiertes Licht im System nicht als einzelnes Photon vorkommt (lediglich die Energie der Elementarteilchen des Systems ändert sich), kommt dieser Prozeß völlig ohne eine Beschreibung des austretenden/einfallenden Lichts selbst aus — zumindest solange wir nicht an einer Intensitätstheorie interessiert sind, die basierend auf den Eigenschaften des Lichtes einem Übergang zwischen verschiedenen Energiezuständen eine Wahrscheinlichkeit zuordnet. Eine solche Überlegung gilt selbstverständlich für jede Art Spektroskopie, bei der Licht dazu benutzt wird, um zwischen zwei energetischen Zuständen eines Systems zu schalten. Interessanterweise ist nach der Absorption oder Emission von Licht das Licht als physikalisches Objekt (Photon) nicht mehr vorhanden. So brauchen wir tatsächlich nur die möglichen Energien des Systems kennen und müssen nicht die Eigenschaften des Lichts berücksichtigen. Man beachte aber, dass wir so nur die Lage spektroskopischer Banden, nicht aber die Intensität einer Bande vorhersagen können. Für letzteres benötigt es eine Intensitätstheorie, die der jeweiligen Spektroskopie-Art angepaßt sein muß und die auch die Eigenschaften elektromagnetischer Wellen in Form von zusätzlichen Wechselwirkungsoperatoren im Hamilton-Operator berücksichtigt. Interessanterweise benötigt die molekulare Spektroskopie keine Theorie einzelner Photonen, sondern kann mit der Kontinuumsvorstellung von Licht, nämlich der klassischen elektromagnetischen Welle, sehr gut arbeiten. Eine solche Theorie heißt auch semi-klassische Theorie, weil Photonen als Quantenobjekte nicht auftreten. Die Energie-Eigenwertgleichung, Gl. (2.7), wird auch stationäre SchrödingerGleichung genannt, wobei ‘stationär’ nur ein anderes Wort für ‘zeitunabhängig’ ist. Dieser Name deutet an, dass es eine Beziehung zu der in Po- 59 60 2 Einführung in die Quantenmechanik stulat 2 geforderten Bewegungsgleichung, der zeitabhängigen SchrödingerGleichung geben muß. Zwar sieht man sofort, dass rechte und linke Seite beider Gleichungen ähnlich sind (der Hamilton-Operator wirkt auf einen allgemeinen quantenmechanischen Zustand im einen Fall und auf eine EnergieEigenfunktion im anderen), aber diese Beziehung kann man rigoros ableiten. Für das weitere Vorgehen ist diese Ableitung eigentlich nicht sehr wichtig, sie zeigt aber einen mathematischen Trick, den wir doch öfter noch benötigen werden. Für viele Fälle ist die Bedingung der Zeitunabhängigkeit des Hamilton-Operators erfüllt, wie wir beispielhaft an Gl. (2.5) sehen können. Der Hamilton-Operator eines Systems, das von der Umgebung isoliert und daher ungestört ist, hängt nicht von der Zeit ab. Man beachte, dass auch die Ortskoordinaten r i in dem Operator nicht von der Zeit abhängen, denn das würde einem klassischen Trajektorienbild entsprechen, das wir experimentell wegen der Heisenbergschen Unschärferelation ausschließen müssen. Der Operator auf der linken Seite von Gl. (2.1) hängt nur von der Zeit und nicht von Ortskoordinaten ab. Wenn der Hamilton-Operator Ĥ nicht von der Zeit abhängt, dann hängt die rechte Seite von Gl. (2.1) nur von Ortskoordinaten ab (auch der Impuls-Operator ist ein Operator der durch Ortskoordinaten definiert ist, was einen wichtigen Unterschied zur klassischen Mechanik darstellt). Unter solchen Bedingungen getrennter Variablen bietet sich ein Separationsansatz für die Wellenfunktion an, der, wie der Name schon sagt, die Variablen Zeit und Ort trennt und zwei voneinander unabhängige Funktionen einführt, von denen die eine nur von der Zeit, die andere nur von den Ortskoordinaten der Teilchen abhängt, während ihr Produkt exakt die Zustandsfunktion liefert. Die Ableitung wird daher in Schema 2.2 vorgeführt. 2.1 Postulate Schema 2.2 Separationsansatz für die Bewegungsgleichung: Zur Lösung der zeitabhängigen Schrödinger-Gleichung, Gl. (2.1), kann man als ersten Schritt die Zeit-Abhängigkeit abtrennen, wenn der Hamilton-Operator nicht selbst von der Zeit abhängt. Wir separieren Orts- und Zeitkoordinaten durch Trennung in einem Produktansatz für die Zustandsfunktion: (2.8) Ψ(r, t) = φ( t) ψ(r) Der Einfachheit halber ist symbolisch nur ein Orstvektor r eingezeichnet, unabhängig davon, aus wievielen Elementarteilchen das System, das von Ψ beschrieben wird, wirklich besteht. Diesen Ansatz können wir nun in die Bewegungsgleichung, Gl. (2.1) einsetzen und erhalten ih̄ ∂ φ( t) ψ(r) = Ĥ φ( t) ψ(r) ∂t (2.9) In einer Übungsaufgabe zur Vorlesung wurde nun unter Ignorieren der Nullstellen der Funktionen durch den Produktansatz geteilt. Hier beschreiten wir einen eleganteren Weg, der ohne diese Annahme auskommt. Dieser Weg beginnt mit zwei Schritten, der Multiplikation mit der komplex-konjugierten Wellenfunktion, Ψ⋆ = φ⋆ ( t) ψ⋆ (r ), von links und der Integration über alle Variablen auf beiden Seiten der Gleichung. Wegen der Operatoren, die immer nach rechts wirken, ist es nötig, genau anzugeben, von welcher Seite — links oder rechts — man jede der beiden Seiten einer Gleichung manipuliert, so dass die Gleichheit beider Seiten gewahrt bleibt. Wir schreiben also nach Multiplikation mit φ⋆ ( t) ψ⋆ (r )· und Integration ih̄ Z dt Z dr φ⋆ ( t) ψ⋆ (r ) ∂ φ ( t ) ψ (r) = ∂t Z dt Z dr φ⋆ ( t) ψ⋆ (r ) Ĥφ( t) ψ(r ) (2.10) Die geschachtelten Integrationen darf man in Produkte aus Integralen trennen, weil die Variablen nicht voneinander abhängen: ih̄ Z dr ψ⋆ (r ) ψ(r ) Z dt φ⋆ ( t) ∂ φ(t) = ∂t Z dt φ⋆ ( t) φ( t) Z dr ψ⋆ (r ) Ĥψ(r ) (2.11) Nun sortieren wir die Variablen indem wir durch die Integrale, die ja nichts anderes als Zahlen sind, teilen R R ∂ φ(t) dt φ⋆ ( t) ∂t dr ψ⋆ (r ) Ĥψ(r ) R = ≡E (2.12) ih̄ R ⋆ dt φ ( t) φ( t) dr ψ⋆ (r ) ψ(r ) Man könnte hier einwenden, wie garantiert werden kann, dass die Zahlen endlich und nicht ‘unvernünftig’ sind. In einer formalen Einführung in die Quantenmechanik, die wir hier bewußt nicht machen, sondern nur konzeptionell vorgehen, würde man dies garantieren durch Randbedingungen an die Wellenfunktion (vornehmlich dadurch, dass man fordert, dass eine Wellenfunktion natürlich normierbar sein muß, also ein endliches Integral besitzen muß). Die Gleichungen, die wir nun erhalten haben, sagt aus, dass zwei Zahlen, berechnet aus je zwei Quotienten zweier Integrale, einander gleich sein sollen. Diese Zahl haben wir oben als E eingeführt. Wir können also zwei separate Gleichungen formulieren ih̄ Z dt φ⋆ ( t) ∂ φ(t) = E ∂t Z dt φ⋆ ( t) φ( t) and Z dr ψ⋆ (r ) Ĥψ(r ) = E Z dr ψ⋆ (r ) ψ(r ) (2.13) die sich nach Aufhebung der Integration und Rückgängigmachen der Multiplikation mit den komplex-konjugierten Funktionen schreiben läßt als ih̄ ∂ φ( t) = Eφ( t) and Ĥψ(r ) = Eψ(r ) ∂t (2.14) was uns die Energie-Eigenwertgleichung liefert. Die Separationskonstante E ist also die Energie. Die zeitabhängige Differentialgleichung läßt sich leicht durch Variablenseparation integrieren, wie wir es schon beim radioaktiven Zerfall vorgeführt haben. Dadurch läßt sich die Wellenfunktion schreiben als Ψ(r, t) = e −iEt/h̄ ψ(r ) (2.15) 61 62 2 Einführung in die Quantenmechanik 2.1.4.1 Ortsmessung, Wahrscheinlichkeitsinterpretation und Normierung Wenn wir den Aufenthaltsort eines Elementarteilchens, zum Beispiel eines Elektrons, bestimmen möchten, dann müssen wir entsprechend des bisher Gesagten, den Ortsoperator auf den quantenmechanischen Zustand anwenden und die Ortsmessung durch die Eigenfunktionen des Ortsoperators verstehen. Diese Eigenfunktionen sind allerdings recht ungewöhnlich, so dass wir einen anderen Weg beschreiten, der völlig analog ist. Diese alternative Darstellungsweise der Ortsmessung wurde von Born gegeben und heißt Bornsche Interpretation. Nach Born ergibt sich eine Aufenthaltswahrscheinlichkeitsverteilung eines Elementarteilchens aus seiner Zustandsfunktion, indem man mit der komplex-konjugierten Zustandsfunktion multipliziert ρ(r ) = Ψ⋆ (r )Ψ(r ) = |Ψ((r )|2 (2.16) (ist die Zustandsfunktion reell-wertig, kann natürlich das Komplex-Konjugieren entfallen; da die Wellenfunktion im Prinzip komplex-wertig sein kann, stellt man durch Komplex-Konjugieren lediglich sicher, dass die entstehende Wahrscheinlichkeitsverteilung ρ reell-wertig ist; diese Art der Multiplikation komplexer Funktionen läßt sich auch als Betragsquadrat schreiben, wie in der Gleichung angegeben). Die Aufenthaltswahrscheinlichkeitsverteilung ρ(r ) ist eine Dichteverteilung, weil sie eine Wahrscheinlichkeit pro Volumen√angibt (ergo ist auch die Dimension der Wellenfunktion eines Teilchens [1/ Volumen]). Wenn ρ die Verteilung eines Elektrons im Raum beschreibt, dann kann man sie mit Eigenschaften des Elektrons wichten und erhält so bei Multiplikation mit der Ladung (−e) die Ladungsdichteverteilung und bei Multiplikations mit der Masse me die Massenverteilung. Weil ρ(r ) eine Dichteverteilung ist, also etwas pro Volumen angibt, kann man aus ihr nicht direkt die Aufenthaltswahrscheinlichkeit am Ort r ablesen. Stattdessen muß man ein Volumen definieren, in dem man die Wahrscheinlichkeit angeben möchte. Um der Wahrscheinlichkeit an einem Ort möglichst nahe zu kommen, wählt man vernünftigerweise ein infinitesimal kleines Volumen um diesen Punkt, das wir schreiben wollen als dx dy dz ≡ d3 r. Die Wahrscheinlichkeit ist dann einfach gegeben als ρ(r )d3 r. Wenn wir das Volumen nun immer größer machen, bis der gesamte Raum umschlossen ist, dann würden wir fordern, das Teilchen mit Gewissheit zu finden. Die Wahrscheinlichkeit muß dann gleich Eins sein. Nun können wir aber nicht einfach ρ(r ) mit dem Volumen des gesamten Raums multiplizieren, weil ρ eine Funktion des Ortes r ist und sich eben mit dem Ort verändert. Aber genau für eine solche Situation ist das Riemannsche Integral erfunden worden: Wir können den gesamten Raum zerlegen in unendlich viele kleine Würfel d3 r, deren Wahr- 2.1 Postulate scheinlichkeiten wir aufsummieren, d.h. aufintegrieren, Z +∞ −∞ ! d3 r ρ ( r ) = 1 (2.17) Um die Gleichung nicht unnötig kompliziert zu schreiben, begnügen wir uns mit einerm Integrationssymbol statt mit dreien für die drei Raumrichtungen. Das Ausrufungszeichen bedeutet, dass wir aus physikalischen Gründen fordern, dass die Wahrscheinlichkeit, das Teilchen irgendwo zu finden, gleich Eins sein muss. Wenn wir die Aufenthaltswahrscheinlichkeit W in einem endlich großen Volumen V = ( x2 − x1 )(y2 − y1 )(z2 − z1 ) wissen wollen, müssen wir lediglich über dieses Volumen integrieren, W= Z x 2 Z y 2 Z z2 x1 y1 z1 d3 r ρ ( r ) (2.18) Aus Gl. (2.17) folgt mit der Definition von ρ in Gl. (2.16) sofort für das Betragsquadrat der Wellenfunktion Z +∞ −∞ d3 r Ψ ⋆ ( r ) Ψ ( r ) = 1 (2.19) Bisher haben wir eine solche Forderung nicht an die quantenmechanische Zustandsfunktion gestellt. Um die obige Gleichung zu erfüllen, muß man die Zustandsfunktion mit einem sogenannten Normierungsfaktor N multiplizieren, (2.20) Ψ −→ N Ψ Diese Multiplikation ist erlaubt, weil sie die Physik des Systems nicht ändert, wie man sowohl an der Bewegungsgleichung, Gl. (2.1), als auch an der Eigenwertgleichung, Gl. (2.26), sehen kann. Beide Gleichung ändern sich nicht, wenn man jeweils beide Seiten der Gleichung mit einer Zahl multipliziert. Dies entspricht einfach der Einführung einer neuen, mit N skalierten Zustandsfunktion Ψ̃ ≡ N Ψ. Weder das dynamische Verhalten des Zustands noch die Eigenwertspektren werden dadurch verändert. Wir benötigen nun noch eine Vorschrift, die es uns erlaubt, den Normierungsfaktor N so zu bestimmen, dass Gl. (2.19) erfüllt werden kann. Wir schreiben dafür Z +∞ −∞ d3 r Ψ̃⋆ (r )Ψ̃(r ) =⇒ N = N2 = + Z +∞ s −∞ d3 r Ψ ⋆ ( r ) Ψ ( r ) = 1 1 R +∞ −∞ d3 r Ψ ⋆ ( r ) Ψ ( r ) (2.21) 63 64 2 Einführung in die Quantenmechanik wobei wir das Vorzeichen der Wurzel willkürlich auf (+) festlegen. Dies ist reine Konvention. Um die Diskussion der Aufenthaltswahrscheinlichkeit und Normierung abzuschliessen, müssen wir uns noch mit einer Verallgemeinerung der bisherigen Gleichungen beschäftigen. Eine Aufenthaltswahrscheinlichkeitsdichte ρ hängt offensichtlich nur von einem Ort ab, ρ = ρ(r ). Die Wellenfunktion hängt dagegen von allen Koordinaten der Elementarteilchen ab. Das Betragsquadrat einer Wellenfunktion für ein System mit mehr als einem Elementarteilchen ist dann natürlich nicht mehr gleich der Aufenthaltswahrscheinlichkeitsdichte, weil schon die Variablenabhängigkeiten inkompatibel sind: |Ψ(r1 , r 2 , . . . , r N )|2 inkompatibel ←→ (2.22) ρ (r ) Entsprechend der Bornschen Interpretation errechnet sich aus dem Betragsquadrat eine Wahrscheinlichkeit W, Elementarteilchen 1 in Volumne d3 r1 , Elementarteilchen 2 in Volumne d3 r2 , und so weiter zu finden, durch Multiplikation mit diesen infinitesimal kleinen Volumina, W = |Ψ(r1 , r 2 , . . . , r N )|2 d3 r1 d3 r2 · · · d3 r N (2.23) In der Regel wird uns eine solche Wahrscheinlichkeit nicht interessieren. Wir sind eher daran interessiert zu fragen, was der Anteil an Elementarteilchen in einem vorgegebenen Raum d3 r ist, wobei die Elementarteilchen in ihren physikalischen Eigenschaften (Ladung, Masse) ununterscheidbar sind. In einem System gleicher Elementarteilchen, einer Ansammlung Elektronen beispielsweise, sind die einzelnen Elektronen daher nicht unterscheidbar. Daher integrieren wir N − 1 beliebige elektronische Variablen aus und erhalten so eine Aufenthaltswahrscheinlichkeitsdichte für unser System aus N Elementarteilchen, ρ (r1 ) ≡ N Z +∞ −∞ d3 r 2 · · · Z +∞ −∞ d3 r N |Ψ(r1 , r 2 , . . . , r N )|2 (2.24) wobei wir willkürlich die Koordinaten des ersten Elektrons ausgewählt haben, über die wir nicht integriert haben (wir hätten wegen der Ununterscheidbarkeit auch jede andere elektronische Koordinate wählen können). Man beachte auch, dass diese Elektronenverteilungsdichte ρ eine Funktion des Ortes — aber nicht des Ortes eines bestimmten Elektrons — ist. Aus all diesen Gründen sollte man bei der Angabe der funktionalen Abhängigkeiten, dem Ort keinen weiteren Index geben ρ(r1 ) → ρ(r ). Wenn wir nun noch diese letzte Koordinate über den gesamten Raum ausintegrieren, müssen wir wieder die Zahl der Teilchen finden Z +∞ −∞ d3 r 1 ρ ( r 1 ) = N Z +∞ | −∞ d3 r 1 . . . Z +∞ −∞ d3 r N |Ψ(r 1 , r 2 , . . . , r N )|2 = N (2.25) {z } ≡1 2.1 Postulate weshalb wir oben explizit die Teilchenzahl N in die Definition eingeführt haben. All diese Verallgemeinerungen sind kompatibel mit dem eingangs besprochenen Fall von nur einem Teilchen, N = 1, bei dem natürlich sämtliche Integrationen über d3 r2 und weitere Variablen wegfallen, weil es sie einfach nicht gibt. Ferner gibt es eine enge Beziehung mit der Normierungsbedingung für eine Wellenfunktion für ein System mit mehr als einem Teilchen, wie in der vorstehenden Gleichung durch die geschweifte Klammer angedeutet wurde. 2.1.4.2 Erwartungswerte Erwartungswerte: Der Mittelwert Ā (oft auch h Ai geschrieben) vieler Messungen einer Observablen A an identisch präparierten Systemen wird auch Erwartungswert genannt und berechnet sich nach R R ⋆ 3 3 rR 1 · · · Rr N Φ ÂΦ d r1 · · · d r N (2.26) Ā = ⋆ 3 3 r · · · r Φ Φ d r1 · · · d r N 1 N Die Integrationen sind über den gesamten Variablenbereich (also den gesamten Raum) druchzuführen. Wenn der quantenmechanische Zustand Φ normiert ist, so entfällt die Division, weil das Integral im Nenner dann gleich Eins ist. Bewußt wurde hier die Zustandsfunktion Ψ, die Eigenfunktion des Hamilton-Operators sei, durch eine allgemeine Funktion Φ ersetzt, da wir vor einer Messung keine Annahme über den Zustand eines Systems machen können (erst nach der Messung liegt der Zustand als Eigenfunktion zu einem vor der Messung nicht festliegenden Eigenwert der beobachteten Größe vor). Der Zustand Φ kann geschrieben werden als Superposition der Eigenzustände der Observablen. Die Integration über die Variablen, von denen der quantenmechanische Zustand abhängt, ist notwendig, da ein Mittelwert eine Zahl und selbst keine Funktion ist. Wir müssen hier also ein Mittel finden, dass es uns erlaubt, die funkionelle Abhängigkeit zu eliminieren, und das ist genau die Integration über diese Variablen. Das Komplex-Konjugieren der Funktion Φ links vom Operator  ist notwendig, damit garantiert werden kann, dass alle Mittelwerte reelle Zahlen sind. Im Prinzip ist eine quantenmechanische Zustandsfunktion komplexwertig (vgl. den imaginären Phasenfaktor der bei der Abseparation der Zeitabhängigkeit entstand). Komplexe Zahlen können aber keine Meßwerte sein. Um garantiert stets reelle Zahlen als Mittelwerte zu erhalten, muß man eine komplexe Funktion mit ihrer komplex-konjugierten Funktion multiplizieren. Auf diese Weise wird garantiert, dass die Zahl, die das Ergebnis der Integration ist, nicht komplex-wertig, sondern reell ist, also Ā ∈ R. Wer nun etwas weiter überlegt, wird fragen, wie wir denn garantieren können, dass überhaupt die Eigenwerte stets reelle Zahlen sind, denn offensichtlich multiplizieren wir 65 66 2 Einführung in die Quantenmechanik in den Eigenwertgleichungen oben nicht mit der komplex-konjugierten Eigenfunktion. Man kann zeigen, dass die Operatoren, die den physikalischen Observablen zugeordnet werden, eine besondere mathematische Eigenschaft, die Hermitizität, besitzen, die garantiert, dass ihre Eigenwerte stets reelle Zahlen sind. Es würde in dieser Einführung aber zu weit führen, tiefer in die mathematischen Grundlagen des quantenmechanischen Formelapparats vorzudringen. Eine Frage stellt sich nun aber doch noch: wie kommt man auf einen auf den ersten Blick so ungewohnt aussehenden Ausdruck für den Mittelwert? Zunächst stellen wir fest, dass wir den Eigenwert Ai erhalten wenn Φ in allen Messungen stets der Eigenzustand Ψi des Operators  war, R R ⋆ 3 3 Φ→Ψi rR 1 · · · Rr N Ψi ÂΨi d r1 · · · d r N Ā = ⋆ 3 3 r · · · r Ψ i Ψ i d r1 · · · d r N 1 (2.26) = = R N R ⋆ 3 3 rR1 · · · rRN Ψi Ai Ψi d r1 · · · d r N ⋆ 3 3 r 1 · · · r N Ψ i Ψ i d r1 · · · d r N R R · · · r N Ψ⋆i Ψi d3 r1 · · · d3 r N r 1 R Ai R = Ai ⋆ 3 3 r 1 · · · r N Ψ i Ψ i d r1 · · · d r N | {z } (2.27) =1 Die Definition des Erwartungswert ist in dieser Hinsicht also konsistent mit Postulat 3, das besagt, dass man stets den Eigenwert zur Eigenfunktion messen wird, wenn das System sich in diesem Eigenzustand befindet. Wenn  ein Operator ist, der keine Ableitungsoperatoren wie den Nabla-Operator oder den Laplace-Operator enthält, also bestenfalls von den Ortsoperatoren abhängt, ein sogenannter multiplikativer Operator ist, der nur an die Zustandsfunktion anmultipliziert wird, dann können wir die Kommutativität reeller Zahlen und die Defintion der Wahrscheinlichkeitsverteilung ausnutzen Z r1 ··· Z rN Φ⋆ ÂΦ d3 r1 · · · d3 r N = (2.24) = Z Z r1 r1 ··· Z rN ÂΦ⋆ Φ d3 r1 · · · d3 r N Âρ(r 1 )d3 r1 (2.28) für einen normierten Zustand Φ. Im Falle eines multiplikativen Operators hängt also der Mittelwert der Meßergebnisse von der Wahrscheinlichkeitsdichteverteilung ρ ab. Dies läßt sich verallgemeinern auf nicht-multiplikative Operatoren, erfordert aber dann die Einführung von Dichtematrizen, was hier zu weit führen würde. 2.1 Postulate 2.1.5 Postulat 4: Kommutatorbeziehungen Das vorletzte Postulat implementiert die Heisenbergsche Unschärferelation in die Grundmauern der Quantenmechanik. Diese besagt, dass es uns prinzipiell nicht möglich sein wird, bestimmte Observablen beliebig genau gleichzeitig zu messen. Weil Meßgenauigkeit in der Theorie durch ein eigenes Operatorkonstrukt definiert werden müßte, fordern wir eine Form des Unbestimmtheitsprinzips, das die ‘elementaren’ Operatoren für Ort und Impuls direkt verwendet. Wie bereits erläutert bedeutet die Anwendung eines Operators  auf die Zustandsfunktion Ψ die Messung dieser Observablen. Wenn wir danach eine andere Observable B messen wollen, wenden wir den Operator B̂ auf das Ergebnis der ersten Messung also auf [ ÂΨ] an. Das Ergebnis ist B̂ ÂΨ. Wenn dieser elementare Prozeß des Messens von zwei Observablen in der Quantenmechanik stets unabhängig voneinander sein soll, dann muß der umgekehrte Prozeß — also die Messung von B vor A,  B̂Ψ — dasselbe Ergebnis liefern. Wenn wir die Meßergebnisse beider Messungen voneinander abziehen, sollte Null das Ergebnis sein: B̂ ÂΨ −  B̂Ψ = B̂  −  B̂ Ψ = 0 (2.29) Diese Beziehung läßt sich auch nur als Operatorgleichung schreiben für zwei Operatoren, die unabhängig voneinander meßbare Observablen repräsentieren, B̂  −  B̂ = 0 =⇒ B̂  =  B̂ (2.30) Die Frage nach der unabhängigen Meßbarkeit reduziert sich also auf die Frage, ob die beiden Operatoren kommutieren, weswegen der zusammengesetzte Operator auf der linken Seite Kommutator genannt und durch ein eigenes Symbol abgekürzt, B̂,  ≡ B̂  −  B̂ (2.31) Wenn der Kommutator also verschwindet, werden die beiden Observablen unabhängig voneinander meßbar sein. Umgekehrt kann die Unschärferelation nur greifen, wenn genau dies nicht gilt. Folglich müssen wir für zwei Observablen Ĉ und D̂, die nicht unabhängig voneinander meßbar sind, fordern, dass ihr Kommutator nicht gleich Null ist, Ĉ, D̂ 6= 0 (2.32) 67 68 2 Einführung in die Quantenmechanik Postulat 4: Die Komponenten der Orts- und Impulsoperatoren erfüllen folgende Kommutatorbeziehungen: p̂i r̂ j − r̂ j p̂i = 0 ∀i 6 = j (2.33) und p̂i r̂ j − r̂ j p̂i = −ih̄ ∀i = j (2.34) wobei i, j ∈ { x, y, z}, also die Komponenten der vektoriellen Operatoren bezeichnen. Dieses Postulat läßt sich elegant in einer Gleichung schreiben, p̂i , r̂ j = −ih̄ δij (2.35) (mit i, j ∈ { x, y, z}) wenn wir das sogenannte Kronecker-Delta definieren wenn i 6= j wenn i = j (2.36) Ferner gilt offensichtlich r̂i , p̂ j = − p̂i , r̂ j = ih̄ δij (2.37) δij = 0 , 1 , Abschließend muß noch betont werden, dass auch im Zusammenhang mit der Heisenbergschen Unschärferelation auf eine genaue Formulierung geachtet werden muß. Oft wird zu salopp gesagt, dass die Heisenbergsche Unschärferelation besagt, dass man Ort und Impuls nicht beliebig genau messen kann (gelegentlich wird sogar der Zusatz ‘beliebig genau’ weggelassen, was eine völlig unsinnige Aussage ergibt). Das ist falsch, weil man sehr wohl den Ort in einer Richtung und den Impuls in eine andere Richtung beliebig genau messen können wird, weil diese Messungen voneinander unabhängig sind. Erst wenn man diese beiden Größen versucht in ein und derselben Richtung beliebig genau zu messen, wird dies nicht möglich sein, weil die Messung beider Größen in derselben Richtung per Postulat nicht unabhängig voneinander sein kann. Die Forderung, dass manche Operatoren nicht kommutieren dürfen, bedeutet natürlich eine starke Forderung an die explizite Form der Operatoren. Reelle Zahlen kommutieren. Daher werden auch Funktionen reeller Zahlen, wie zum Beispiel die Komponenten des Ortsoperators, kommutieren. Um die postulierten Kommutatorbeziehungen zu erfüllen muß wenigstens einer der beiden Operatoren ein Differentialoperator sein, so dass Kraft der Produktregel nicht verschwindende Terme entstehen können. Ferner muß es sich um partielle Differentialoperatoren handeln, damit eine Ableitung in x-Richtung den 2.2 Quantenmechanische Drehbewegung und Spin Ortsoperator in x-Richtung betrifft, während die anderen Richtungen und daher die anderen Komponenten des Ortsoperators Konstanten bezüglich der Differentiation nach x sind. Im Zusammenhang mit Postulat 2 haben wir die explizite Form der Orts- und Impulsoperatoren bereits eingeführt. Man kann nun leicht verifizieren, dass ihre Komponenten tatsächlich die hier geforderten Kommutator-Relationen erfüllen. Es sei nochmals erwähnt, dass man diese Wahl der Orts- und Impulsoperatoren Ortsdarstellung nennt. Eine völlig äquivalente Darstellung der Operatoren entsteht, wenn die Impulsoperatorkomponenten multiplikativ gewählt werden, während dann die Ortsoperatorkomponenten partielle Ableitungen nach den Impulsvariablen sein müssen. Diese Darstellung nennt man Impulsdarstellung, sie spielt aber in der Molekülchemie eine eher untergeordnete Rolle und soll daher hier nicht weiter verfolgt werden. 2.2 Quantenmechanische Drehbewegung und Spin 2.2.1 Drehimpulse in der Quantenmechanik Dem Korrespondenzprinzip folgend führen wir einen Operator für den Drehimpuls analog der Form des klassischen Ausdrucks ein l =r×p K.p. −→ l̂ = r̂ × p̂ (2.38) Da wir explizite Ausdrücke für die Operatoren von Ort und Impuls, r̂ und p̂, bereits kennen, können wir durch Auswerten des Vektorprodukts l̂ komponentenweise berechnen. Soweit soll unsere Diskussion aber nicht gehen. Vielmehr sollen uns nur die zugehörigen Eigenwertgleichungen interessieren. Wenn man das Kommutationsverhalten der Komponenten lˆx , lˆy und lˆz untersucht, so stellt man fest, dass Eigenfunktionen einer dieser Komponente nicht Eigenfunktionen der anderen sind. Daher kann man für Drehimpulse nur zwei Eigenwertgleichungen mit gemeinsamen Eigenfunktionen formulieren, eine für eine der Komponenten — und wir wählen willkürlich die zKomponente, zumal wir das Koordinatensystem stets beliebig drehen können —, lˆz Ylm = m h̄ Ylm (2.39) sowie eine für das skalare Drehimpulsoperatorquadrat 2 l̂ Ylm = l (l + 1) h̄2 Ylm (2.40) 69 70 2 Einführung in die Quantenmechanik Ein solches Paar von Eigenwertgleichungen mit gemeinsamer Eigenfunktion läßt sich für jeden quantenmechanischen Drehimpulsoperator schreiben. Die Zahlen m und l sind ganzzahlig (oder unter bestimmten Bedingungen auch halbzahlig) und werden magnetische Quantenzahl beziehungsweise Drehimpulsquantenzahl genannt. Während für eine Bahndrehimpulsquantenzahl gilt l ∈ N0 , also l = 0, 1, 2, 3, . . . , hängt m von l ab, nämlich stets als m = −l, −l + 1, −l + 2, . . . , +l. Da eine Eigenfunktion in zwei Eigenwertgleichungen zu den zwei Quantenzahlen m und l auftritt, wurden beide Quantenzahlen als Index verwendet, um die Eigenfunktionen voneinander zu unterscheiden. Zu einem gegebenen Wert von l kann man offensichtlich (2l + 1) ver2 schiedene m-Werte erhalten, die aber alle denselben Eigenwert von l̂ besitzen, nämlich l (l + 1) h̄2 . Man sagt, dass dieser Eigenwert daher (2l + 1)-fach entartet ist. Die Entartung gibt an, wieviele Eigenfunktionen zum gleichen Eigenwert gefunden werden können. Die explizite Form der Ylm folgt aus der Lösung der Eigenwertgleichungen, für die man die Drehimpulsoperatoren explizit entsprechend dem Korrespondenzprinzip berechnen muß. Weil dabei die Komponenten des Impulsoperators verwendet werden, entstehen notwendigerweise Differentialgleichungen, deren Lösungsfunktionen die Ylm sind. Sie werden Kugelflächenfunktionen genannt. Ihre explizite Form ist aber nicht weiter wichtig. Wir müssen lediglich wissen, dass sie obige Eigenwertgleichungen erfüllen, wenn wir das Wasserstoffatom studieren wollen, bei dem sich ein Elektron um ein Proton dreht. 2.2.2 Der Stern-Gerlach-Versuch An der Lösung der Schrödinger-Gleichung für das Wasserstoffatom wird man sehen (s.u.), dass ein solches Atom im Grundzustand der Energie keinen Drehimpuls besitzt: Weil die Drehimpulsquantenzahl l = 0, verschwindet auch der Drehimpuls l (l + 1) h̄2 = 0. Dementsprechend kann kein magnetisches Moment erzeugt werden, dass mit einem externen magnetischen Feld wechselwirken könnte. Diese Annahme kann man versuchen zu bestätigen, indem man einen Strahl von Wasserstoffatomen präpariert und in ein Magnetfeld einstrahlt. Entsprechend unseren bisherigen Betrachtungen müßte der Strahl unverändert das Feld passieren. Das wird allerdings nicht beobachtet. Tatsächlich hat das Magnetfeld einen Einfluß, der den Strahl in zwei Teile aufspaltet. Am Detektor sehen wir nicht einen Fleck, sondern zwei. Dementsprechend müssen die Wasserstoffatome doch ein magnetisches Moment besitzen, dass mit dem Magnetfeld wechselwirkt. Dieses magnetische Moment kann aber nicht von der Rotationsbewegung des Elektrons stammen, weil wir schon gesehen haben, dass das Elektron im Grundzustand 2.2 Quantenmechanische Drehbewegung und Spin des Wasserstoffatoms keinen Bahndrehimpuls besitzt. Mangels Alternative schlugen Goudsmit und Uhlenbeck vor, dass Elektronen einen weiteren Drehimpuls besitzen, den man klassisch nicht erklären kann. Dieser quantenmechanische Drehimpuls wird Spin genannt. Das gerade beschriebene Experiment wurde Ende der 1920er Jahre mit einem Wasserstoffatomstrahl durchgeführt. Zu der Zeit war der Spin als in der klassischen Welt nicht vorkommende Observable bereits vorgeschlagen und akzeptiert. Der Vorschlag des Spins von Goudsmit und Uhlenbeck ging auf ein Experiment von Stern und Gerlach von 1924 zurück, die einen Strahl von Silberatomen verwendeten. Silberatome eignen sich für das Experiment besonders, weil man sie beim Auftreffen auf einen Schirm durch die mit dem bloßen Auge sichtbare Schwärzung direkt sehen kann. Sie haben aber auch den Nachteil, dass jedes Silberatom aus sehr vielen Elektronen besteht, die Theorie von Vielelektronensystemen an dieser Stelle jedoch noch gar nicht entwickelt ist. Es ist a priori gar nicht klar, warum sich die 47 Elektronen in einem Silberatom im Magnetfeld genau so verhalten sollten wie ein einzelnes Elektron im Wasserstoffatom. Erst die Theorie von Vielelektronensystemen kann zeigen, dass sich die Spins der Elektronen im Silberatom paarweise zu einem Spin von Null koppeln lassen, so dass der Gesamtspin eines Silberatoms durch ein ungepaartes Elektron bestimmt wird. 2.2.3 Spin als quantenmechanischer Drehimpuls Die im Stern–Gerlach-Versuch gemachten Beobachtungen kann man quantenmechanisch durch einen Drehimpuls beschreiben, der Eigenschaft einiger Elementarteilchen ist und in der klassischen Physik so nicht vorkommt. Es handelt sich um einen Eigendrehimpuls, der Spin genannt wird. Man kann sich diesen Eigendrehimpuls allerdings nicht als eine Drehung des Teilchens um sich selbst im klassisch-physikalischen Sinne vorstellen. Wichtig ist nur, dass Spin als beobachtbare Eigenschaft eines Teilchens einen zugeordneten Operator ŝ besitzt, der Vektorcharakter hat — also drei Komponenten ŝ x , ŝy und ŝz besitzt — und die Eigenwertgleichungen eines quantenmechanischen Drehimpulses erfüllt, die wir schreiben wollen als ŝ2 σsms = s(s + 1) h̄2 σsms (2.41) ŝz σsms = ms h̄ σsms (2.42) wobei σsms die gemeinsame Eigenfunktion ist mit den Spinquantenzahlen s und ms als Indices. Während s je nach Elementarteilchen ganz- oder halbzahlig sein kann, gilt für ms jedoch stets ms = −s, −s + 1, . . . , +s. Für Elektronen gilt s = 1/2 und daher ms = −1/2, +1/2. Die beiden Spinzustände zu den ms -Quantenzahlen werden β-Spin beziehungsweise α-Spin 71 72 2 Einführung in die Quantenmechanik genannt. Elementarteilchen mit halbzahligen Spinquantenzahlen s heißen Fermionen, während diejenigen mit ganzzahligem Spin Bosonen genannt werden. 2.3 Einfache quantenmechanische Modellsysteme 2.3.1 Das Teilchen im Kasten Das Modellproblem des Teilchens im Kasten wird zeigen, wie in der Quantenmechanik die Quantelung einer Observablen, hier der Energie, entstehen kann. Die quantenmechanische Beschreibung der Bewegung eines freien Teilchens zeitigt Energieeigenwerte, die kontinuierlich sind. Ein freies Teilchen kann also jede beliebige kinetische Energie annehmen. Um eine Quantelung der Energie beobachten zu können, müssen wir die Bewegung des Teilchens einschränken. Dies kann durch Einführung eines Operators für die potentielle Energie in den Hamilton-Operator erfolgen. Das einfachste Potential, das die Bewegung in einer Richtung x einschränkt, ist das von zwei Wänden. Eine Bewegung in die beiden anderen Raumrichtungen lassen wir der Einfachheit halber nicht zu. Die Energieeigenwertgleichung, die diese Situation beschreibt, lautet dann " # h̄2 d2 − + V̂ ( x ) Ψn ( x ) = En Ψn ( x ) (2.43) 2m dx2 mit V̂ ( x ) = 0 +∞ für sonst 0≤x≤L (2.44) so dass unendlich hohe (Potential-)Wände bei x=0 und x=L hochgezogen werden. Innerhalb des Kastens, wenn 0 ≤ x ≤ L, vereinfacht sich die Differentialgleichung zu − h̄2 d2 Ψ n ( x ) = En Ψ n ( x ) 2m dx2 (2.45) wobei wir nur noch fordern müssen, dass die Wellenfunktion nicht in der unendlich hohen Wand “leben”, beziehungsweise sich das Teilchen dort nicht aufenthalten kann. Die Wellenfunktion muß daher Null werden, sobald die Potentialwand beginnt, also Ψn (0) = Ψn ( L) = 0. Die obige Eigenwertgleichung ist vom Typ einer homogenen Differentialgleichung zweiter Ordnung 2mEn d2 Ψn ( x ) = − 2 Ψn ( x ) dx2 h̄ (2.46) 2.3 Einfache quantenmechanische Modellsysteme deren Lösungen bekannt sind (s. Anhang) und stets geschrieben werden können als s s ! ! 2mEn 2mEn Ψn ( x ) = A sin x + B cos x (2.47) h̄2 h̄2 wobei A und B die beiden Integrationskonstanten sind. Wenn wir nun die beiden Randbedingungen an die Wellenfunktion auswerten, zeigt sich, dass B = 0 sein muß, weil ! Ψn (0) = A sin (0) + B cos (0) = 0 | {z } | {z } =0 (2.48) =1 Dann erhalten wir für die zweite Randbedingung s ! 2mEn ! L =0 Ψn ( L) = A sin h̄2 (2.49) Diese Gleichung kann nur erfüllt werden, wenn das Argument der SinusFunktion ein ganzzahliges Vielfaches von π ist, s 2mEn L = n π ∀n ∈ N0 (2.50) h̄2 Für n = 0 erhalten wir aber Ψn ( x )=A=constant, was einer physikalisch nicht relevanten Lösung entspricht. Daher gilt für den Index n, der die Eigenzustände eines Teilchens in einem eindimensionalen Potentialkasten zählt: n ∈ N. Aus Gl. (2.50), die einzig und allein aus der Randbedingung des Operators der potentiellen Energie an die Wellenfunktion folgt, erhalten wir bereits die Energieeigenwerte, 2mEn h̄2 L2 = n2 π 2 ⇒ En = n2 π 2 h̄2 n2 h 2 = 2mL2 8mL2 (2.51) die sich als gequantelt herausstellen: Nicht jeder Energiewert ist erlaubt. 2.3.2 Der harmonische Oszillator Das nächst komplexere Modellproblem ist eine eindimensionale Schwingung, wie wir sie schon in Abschnitt 1.1.6 in der klassischen Physik kennengelernt haben. Dieses Modellproblem ist zentral für die quantenmechanische Deutung molekularer Schwingungen. Wir nehmen wiederum an, dass die Auslenkungskraft proportional zur Auslenkung x, also harmonisch ist (wobei der 73 74 2 Einführung in die Quantenmechanik Gleichgewichtsabstand als Ursprung gewählt wurde, so dass x direkt die Auslenkung mißt). Aus dem Korrespondenzprinzip erhalten wir dann direkt den Operator für die potentielle Energie aus der klassischen potentiellen Energie dieses harmonischen Oszillators, V (x) = 1 2 kx 2 K.p. −→ V̂ ( x ) = 1 2 kx 2 (2.52) Damit lautet die Schrödinger-Gleichung für dieses eindimensionale Problem # " 1 2 h̄2 d2 (2.53) + kx Ψn ( x ) = En Ψn ( x ) − 2m dx2 2 Die Lösung dieser Differentialgleichung ist nicht ganz einfach. Man erhält als Eigenwert 1 En = hν n + ∀n ∈ N0 (2.54) 2 Die Energien des quantenmechanischen Oszillators sind also gequantelt mit der Schwingungsquantenzahl n. Die Schwingungsfrequenz ν berechnet sich aus den Materialkonstanten, nämlich aus der Masse des schwingenden Teilchens und der Kraftkonstante des Federpotentials, r k 1 (2.55) ν= 2π m 2.3.3 Das Wasserstoff-Atom Wir wenden uns nun der quantenmechanischen Behandlung des WasserstoffAtoms zu. Bei der Diskussion der Schlüsselexperimente in Kapitel 1 haben wir die Fraunhoferschen Linien kennengelernt, die den Energiedifferenzen zwischen zwei elektronischen Zuständen im Wasserstoff-Atom entsprechen. Bohr versuchte diesen Sachverhalt in seinem Modell abzubilden, verwendete dazu aber ad hoc Annahmen, die zwar die Fraunhoferschen Linien schließlich erklären, aber ansonsten zu Widersprüchen innerhalb des Modells führen. Die Quantenmechanik muß dieses Problem nun lösen können. Weil wir an Energiedifferenzen interessiert sind, muß die Quantenmechanik als Eigenwerte dieselben Energien liefern, die Bohr als Energien der Bahnen festen Radius ableitete, aber ohne irgenwelche zusätzlichen Annahmen zu machen (außer den allgemeingültigen Postulaten der Quantenmechanik). Daher starten wir mit der Energie-Eigenwertgleichung, in der wir für den Hamilton-Operator des Wasserstoff-Atoms, der die kinetische Energie von 2.3 Einfache quantenmechanische Modellsysteme Proton p und Elektron e, sowie deren potentielle Energie umfaßt, zu beschreiben haben: ĤH−Atom = − h̄2 e2 h̄2 1 ∆p − ∆e − 2m p 2me 4πǫ0 |r e − r p | (2.56) h̄2 e2 1 ∆e − 2me 4πǫ0 |r e − r p | (2.57) h̄2 1 Ze2 ∆e − 2me 4πǫ0 r (2.58) Offensichtlich hängt dieser Operator dann aber bereits von sechs Koordinaten ab, ( xe , ye , ze ) und ( x p , y p , z p ), während wir bisher nur SchrödingerGleichungen behandelt haben, die von nur einer Koordinate, x, abhingen. Um das Problem zu vereinfachen, nutzen wir die Tatsache aus, dass ein Proton fast 2000 mal schwerer ist als ein Elektron. Wenn wir die Protonenmasse unendlich groß wählen, verschwindet der Operator für die kinetische Energie des Protons wegen limm p →∞ (1/m p ) = 0, so dass der Hamilton-Operator sich vereinfacht zu ĤH−Atom = − Nun haben wir drei Protonenkoordinaten in dem kinetischen Energieoperator eliminiert, allerdings verbleiben sie noch in der Coulomb-Wechselwirkung. Diese können wir aber leicht löschen, indem wir einfach den Ort des sich nicht mehr bewegenden Protons (m p = ∞) als Koordinatenursprung wählen, r p → 0. Dann definieren wir den Abstand des Elektrons vom Ursprung als r ≡ |r e − 0| = |r e | und erhalten ĤH−Atom = − Man beachte, dass wir hier die Kernladungszahl Z explizit ausgeschrieben haben, weil dann alles im folgenden Gesagte nicht nur für das WasserstoffAtom, sondern für alle wasserstoffähnlichen Atome gilt, also für alle Atome mit nur einem Elektron, wie zum Beispiel He+ oder Hg79+ . Die Näherung der unendlich großen Masse ist eine spezielle Form der sogenannten Born–Oppenheimer-Näherung, die wir im Kapitel 3 genauer ansehen werden. Man muß diese Näherung allerdings nicht machen, weil man drei Koordinaten rigoros abtrennen kann durch eine Koordinatentransformation, die die Translation des Massenschwerpunkts von der internen Bewegung des Elektrons relativ zum Proton abtrennt. Bei dieser Koordinatentransformation, die neue Schwerpunktskoordinaten und Relativkoordinaten einführt, entsteht der Abstand zwischen Proton und Elektron, der für den Coulomb-Operator benötigt wird, in natürlicher Art und Weise. Man erhält dann fast denselben Hamilton-Operator wie im Rahmen der Born–Oppenheimer-Näherung, ohne aber eine Näherung eingeführt zu haben. Der einzige Unterschied ist die Masse: Statt der Elektronenmasse me entsteht die reduzierte Masse µ, me m p me µ= = me offensichtlich gilt lim µ = lim m p →∞ m p → ∞ m e /m p + 1 me + m p 75 76 2 Einführung in die Quantenmechanik (2.59) so dass der exakte Hamilton-Operator lautet ĤH−Atom = − 1 Ze2 h̄2 ∆e − 2µ 4πǫ0 r (2.60) Wir können also mit dem Operator in Born–Oppenheimer-Näherung fortfahren, weil wir die exakte Lösung des Wasserstoff-atoms stets erhalten, wenn wir statt me µ schreiben. Bevor wir uns nun die Eigenwertgleichung für diesen Operator ansehen, sollten wir noch in ein dem Problem angepaßtes Koordinatensystem wechseln. Wir beschreiben die Bewegung eines Teilchens (des Elektrons) um ein ruhendes Teilchen (das Proton), mit dem es wechselwirkt. Es handelt sich also um ein Zentralfeldproblem von der Art, wie wir es schon in Abschnitt 1.1.4.7 kennengelernt haben. Daher bietet sich eine Transformation von kartesischen zu sphärischen Koordinaten an: ( x, y, z) → (r, ϑ, ϕ). Tatsächlich verwenden wir bereits problemangepaßte Koordinaten für den Coulomb-Operator, dadurch dass wir den (radialen) Abstand r von Elektron und Proton einführten. Für diesen Wechselwirkungsoperator ist die Orientierung von Elektron und Proton zueinander nicht wichtig und daher spielen die Winkel ϑ und ϕ keine Rolle. Dies ist nicht mehr der Fall beim Operator für die kinetische Energie, für den wir einen Ausdruck finden müssen ∆e = ∆( x, y, z) −→ ∆(r, ϑ, ϕ) =? (2.61) wobei wir den Index e zur Kennzeichnung der Koordinaten des Elektrons fallengelassen haben, weil die Protonenkoordinaten, von denen man unterscheiden möchte, nun nicht mehr auftreten. Einen Ausdruck für ∆(r, ϑ, ϕ) kann man durch mühsames Anwenden der Kettenregel unter Verwendung der Zusammenhänge zwischen den beiden Koordinatensystemen, die in Abb. 1.2 gegeben wurden, finden (zum Beispiel wird diese Rechnung im Anhang des Buchs von Wedler [4] explizit vorgeführt; eine allgemeine Behandlung von Koordinatensystemswechseln, die alle denkbaren Fälle abdeckt, geben Margenau und Murphy [7]). Diesen mühsamen Weg gehen wir allerdings hier nicht, sondern benutzen wieder das Korrespondenzprinzip. Schon in der klassischen Physik stellt sich die Frage, wie man die kinetische Energie eines rotierenden Teilchens aus Gl. (1.23) ausdrücken kann durch intuitivere (also problemangepaßte) Ausdrücke, nämlich durch die Rotationsenergie Trot und durch einen kinetischen Beitrag in radialer Richtung Tr T ( x, y, z) = p2 l2 p2r −→ T (r, ϑ, ϕ) = + 2 2m 2m |2mr {z } |{z} ≡ Trot ≡ Tr (2.62) 2.3 Einfache quantenmechanische Modellsysteme Der Impuls läßt sich also in Kugelkoordinaten schreiben als p2 = p2r + l2 r2 (2.63) mit dem Drehimpuls l = l (ϑ, ϕ) = r × p. Oft führt man noch das Trägheitsmoment I ≡ mr2 ein, um im Nenner einen Ausdruck für die Drehmasse zu haben, so dass die Struktur der Rotationsenergie derjenigen der kinetischen Energie aus Gl. (1.23) entspricht (‘Impulsquadrat geteilt durch die doppelte Masse’). Wenn wir nun das Korrespondenzprinzip anwenden, erhalten wir direkt für den Operator der kinetischen Energie des Elektrons 2 p̂2 h̄2 l̂ p̂2 =− ∆e = r + 2me 2me 2me 2me r2 (2.64) 2 mit dem Drehimpulsoperator l̂ , dessen explizite Form wir nach wie vor nicht benötigen werden, und dem Operator für den Radialimpuls ∂ 1 ∂ ∂ 1 1 p̂r = −ih̄ = −ih̄ r + 1 = −ih̄ + r (2.65) ∂r r r ∂r r ∂r Für das Quadrat des Radialimpulsoperators gilt dann p̂2r = p̂r p̂r = (−ih̄)2 1 ∂2 1 ∂ 1 ∂ r r = − h̄2 r r ∂r r ∂r r ∂r2 (2.66) Damit können wir nun den Hamilton-Operator für das Wasserstoff-Atom schreiben als, 2 ĤH−Atom h̄2 1 ∂2 l̂ 1 Ze2 =− r + − 2me r ∂r2 4πǫ0 r 2me r2 und erhalten die zugehörige Schrödinger-Gleichung als " # 2 h̄2 1 ∂2 l̂ 1 Ze2 − Ψi (r, ϑ, ϕ) = Ei Ψi (r, ϑ, ϕ) r+ − 2me r ∂r2 4πǫ0 r 2me r2 (2.67) (2.68) Dies ist eine partielle Differentialgleichung zweiter Ordnung, die wir so nicht lösen können, weil sie von drei Koordinaten (r, ϑ, ϕ) abhängt. Die Form des Hamilton-Operators in radialen Koordinaten erlaubt es uns aber, einen Ansatz für die Wellenfunktion Ψi zu wählen, der die radiale Koordinate von den Winkelkoordinaten trennt, Ψi (r, ϑ, ϕ) = Ni Ri (r ) Yi (ϑ, ϕ) (2.69) mit Ni als Normierungsfaktor. Während wir die Funktion, die nur von der radialen Koordinate r abhängt, die sogenannte Radialfunktion Ri (r ), nicht kennen, sei die Winkelfunktion Yi (ϑ, ϕ) identisch zu den Eigenfunktionen des 77 78 2 Einführung in die Quantenmechanik 2 Drehimpulsoperatorquadrats l̂ , also den Kugelflächenfunktionen Ylm (ϑ, ϕ) aus Gl. (2.40), gewählt. Diese Wahl für die winkelabhängigen Funktionen bie2 tet sich an, weil in obiger Gleichung nur noch l̂ von den Winkeln abhängt. Sie erlaubt uns schließlich beide Winkelabhängigkeiten aus der Gleichung zu eliminieren, so dass eine gewöhnliche Differentialgleichung in r entsteht, die exakt lösbar ist (s. Anhang). Um dies zu sehen, multiplizieren wir die ⋆ ( ϑ, ϕ ) und integrieSchrödinger-Gleichung für das H-Atom von links mit Ylm ren die Winkelabhängigkeit aus, − h̄2 1 ∂2 rR (r ) 2me r ∂r2 i + Z π 1 Ri (r ) 2me r2 − | 0 Z 2π sin ϑ dϑ 0 {z =1 Z π |0 sin ϑ dϑ Z 2π ⋆ dϕYlm Ylm } 2 ⋆ dϕYlm l̂ Ylm 0 {z } =l ( l +1) h̄2 1 Ze2 R (r ) 4πǫ0 r i Z π | 0 sin ϑ dϑ Z 2π 0 {z =1 = Ei R i ( r ) Z π | 0 sin ϑ dϑ ⋆ dϕYlm Ylm } Z 2π 0 {z =1 ⋆ dϕYlm Ylm } (2.70) (man beachte, dass alle radialen Abhängigkeiten als Konstanten bei der Integration behandelt und daher vor das Integral gezogen werden können). Glücklicherweise müssen wir keines der Integrale wirklich berechnen, weil wir wissen, dass die meisten Integrale ergeben einfach Eins wegen der Normierung der Kugelflächenfunktionen, Z π 0 sin ϑ dϑ Z 2π 0 ! ⋆ dϕ Ylm (ϑ, ϕ) Ylm (ϑ, ϕ) = 1 (2.71) während wir im Falle des Erwartungswertes über das Quadrat des Drehimpulsoperators sofort mit Gl. (2.40) schreiben können, Z π 0 sin ϑ dϑ Z 2π 0 (2.40) 2 ⋆ dϕYlm l̂ Ylm = 2 = l (l + 1) h̄ Z π 0 Z π 0 sin ϑ dϑ sin ϑ dϑ Z 2π 0 Z 2π 0 ⋆ dϕYlm l (l + 1) h̄2 Ylm (2.71) ⋆ dϕYlm Ylm = l (l + 1) h̄2 (2.72) Nachdem wir so die Winkel vollständig ausintegriert haben, verbleibt die Radialgleichung − h̄2 1 d2 l (l + 1) h̄2 1 Ze2 R ( r ) = Ei R i ( r ) rR ( r ) + Ri (r ) − i 2 2 2me r dr 4πǫ0 r i 2me r (2.73) 2.3 Einfache quantenmechanische Modellsysteme die als gewöhnliche Differentialgleichung nur noch von r abhängt, weshalb wir nun explizit gewöhnliche an Stelle der partiellen Ableitungen schreiben können. Der zweite Term auf der linken Seite heißt auch Zentrifugalpotential. Wenn wir diese Gleichung mit r multiplizieren erhalten wir − h̄2 d2 l (l + 1) h̄2 1 Ze2 rRi (r ) = Ei rRi (r ) rR ( r ) + rR ( r ) − i i 2me dr2 4πǫ0 r 2me r2 (2.74) so dass es sich anbietet, eine neue Radialfunktion zu definieren als Pi (r ) ≡ rRi (r ) mit der wir schließlich erhalten − h̄2 d2 l (l + 1) h̄2 1 Ze2 P (r ) = Ei Pi (r ) Pi (r ) + Pi (r ) − 2 2 2me dr 4πǫ0 r i 2me r (2.75) Die neue Radialfunktion Pi bietet sich auch an bei der Berechnung von Erwartungswerten, weil zum Beispiel für das Normierungsintegral gilt Z +∞ −∞ d3 r Ψ⋆i (r )Ψi (r ) (2.69) = = Z ∞ 0 Z ∞ 0 r2 drR2i (r ) drPi2 (r ) Z π 0 sin ϑ dϑ Z 2π 0 ⋆ dϕYlm Ylm (2.76) (hier wurde ohne Beschränkung der Allgemeinheit angenommen, dass die Radialfunktionen reell sind). Man nennt das Quadrat von Pi auch radiale Elektronendichte ρi (r ) = r2 R2i (r ) = Pi2 (r ) (2.77) des i-ten Zustands des Elektrons im Wasserstoff-Atom. Obige gewöhnliche Differentialgleichung, Gl. (2.75), kann durch einen Potenzreihenansatz für Pi (r ) (s. Anhang) exakt gelöst werden. Der dabei erhaltene analytische Ausdruck für Pi (r ) (beziehungsweise Ri (r )) hängt von der Bahndrehimpulsquantenzahl l und einer weiteren Quantenzahl n zur Nummerierung der Zustände, die auch Hauptquantenzahl genannt wird, ab: Pi (r ) → Pni li (r ), wobei wir im folgenden der Einfachheit halber den Index i fallenlassen, wenn wir die Quantenzahlen n, l und m angeben. Entsprechend der historisch älteren Notation für die Energiezustände im Wasserstoff-Atom nennt man die Zustände ohne Bahndrehimpuls (l=0) auch s-Zustände für s ≡ sharp, diejenigen mit Bahndrehimpuls l=1 p-Zustände für p ≡ principal, diejenigen mit Bahndrehimpuls l=2 d-Zustände für d ≡ diffuse, diejenigen mit Bahndrehimpuls l=3 f -Zustände für f ≡ fundamental,, und alle höheren Drehimpulsezustände werden ab dann alphabetisch benannt g für l=4, h für l=5 und so weiter. Also sagt man für R10 auch 1s-Zustand, für R20 2s-Zustand, für R21 2p-Zustand, für R30 3s-Zustand, für R31 3p-Zustand, für R32 3d-Zustand, etc. 79 80 2 Einführung in die Quantenmechanik Bei der Lösung der Differentialgleichung muß die Normierbarkeit der Radialfunktion gewährleistet sein und man erhält dann automatisch einen Ausdruck für den Energieeigenwert (hier nicht vorgeführt) Ei → Enlm = En = − 1 m e e4 Z 2 (4πǫ0 )2 2h̄2 n2 (2.78) der nur noch von der Hauptquantenzahl n abhängt. Dies bedeutet, dass die Energie nicht von den Bahndrehimpulsquantenzahlen abhängt, sondern nur von der Hauptquantenzahl. Daher sind im Wasserstoff-Atom zum Beispiel die 3s-, 3p- und 3d-Schalen energieentartet, was man auch zufällige Entartung nennt. Diese Entartung wird erst in Vielelektronenatomen durch die Elektron– Elektron-Wechselwirkung aufgehoben (vgl. Kapitel 3). Mit Gl. (2.78) haben wir unser Ziel erreicht: die Ableitung des Bohrschen Energieausdrucks, mit dem wir die Balmer-Serie und die anderen Serien der Atomspektroskopie erklären können, aus der modernen Quantenmechanik, also ohne willkürliche zusätzliche Annahmen. 81 3 Die chemische Bindung 3.1 Quantenmechanik für viele Teilchen Während Kapitel 1 die Grundlagen für die Theorieentwicklung in der Chemie gelegt und auf die Quantenmechanik vorbereitet hat, führte Kapitel 2 schließlich in diese Theorie ein. Wie die Quantenmechanik funktioniert, wurde im Kapitel 2 an einfachen Beispielen gezeigt. All diesen Beispielen ist gemein, dass sie nur ein einziges Teilchen betrachten und daher für die Beschreibung von Molekülen nicht ausreichend sind. Nur das einfachste, chemisch relevante System, das Wasserstoff-Atom, konnte beschrieben werden — und auch nur, weil sich dieses Zweiteilchensystem (Elektron und Proton) auf ein Einteilchensystem reduzieren ließ. Dieser Abschnitt beschäftigt sich nun mit der Einführung in die Quantenmechanik von Vielteilchensystemen, die aus N Elektronen und M Atomkernen bestehen. 3.1.1 Energieoperatoren für Vielelektronensysteme Um zu verstehen, wie man die Operatoren für ein Vielteilchensystem, also für ein Atom oder Molekül, erhält, können wir uns des Korrespondenzprinzips bedienen. In der klassischen Physik berechnet man die Gesamtenergie eines Vielteilchensystems als Summe der kinetischen Energien der Einzelteilchen und addiert dazu, wenn es sich um Punktteilchen handelt, die potentiellen Energien aller wechselwirkenden Paare. Dem Korrespondenzprinzip entsprechend werden diese einzelnen Terme nun zu Operatoren promoviert und bilden den Hamilton-Operator Ĥ für das Vielteilchensystem N Ĥ = i =1 N M ∑ t̂i |{z} + Ekin Elek. i N +∑ N ∑ i =1 j = i +1 ∑ I =1 t̂ I |{z} +∑ Ekin Kern I 1 qe qe 4πǫ0 |r i − r j | {z } | M ∑ i =1 I =1 Epot Elektron i/Elektron j 1 qe q I 4πǫ0 |r i − R I | | {z } Epot Kern I/Elektron i M + N qI qJ 1 (3.1) 4πǫ0 | R I − R J | I =1 J = I +1 | {z } ∑ ∑ Allgemeine Chemie. Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008 Epot Kern I/Kern J 82 3 Die chemische Bindung wobei sich die einzelnen Terme für die Bewegungs- und Lageenergieoperatoren entsprechend der Ausführungen im Kapitel 2 auflösen lassen zu h̄2 N Ĥ = M h̄2 1 Z I e2 4πǫ0 |r i − R I | i =1 I =1 N M ∑ − 2me ∆i + ∑ − 2m I ∆ I − ∑ ∑ I =1 i =1 N M Z I Z J e2 1 e2 1 +∑ ∑ 4πǫ0 |r i − r j | I =1 J = I +1 4πǫ0 | R I − R J | i =1 j = i +1 N +∑ N ∑ (3.2) wobei für die Bewegungsenergieoperatoren ti = p̂2 /2mi = − h̄2 ∆i /2mi und für die Ladungen qe = −e und q I = Z I e eingesetzt wurde. Hierbei ist ∆i wie zuvor der Laplace-Operator für die Koordinaten des i-ten Teilchens, ∆i = ∂2 ∂2 ∂2 + 2+ 2 2 ∂xi ∂y i ∂zi (3.3) (Ein Kommentar zur Konsistenz von Gleichungen: Ein Index der links auftritt, muß natürlich auch rechts vom Gleichheitszeichen eine Größe indizieren — hier die Orstkoordinaten des Teilchens i.) Entsprechend der bisherigen Notation wurden zur besseren Lesbarkeit für Atomkerne großbuchstabige Indices verwendet, während elektronische Operatoren kleinbuchstabige Indices tragen. Wie man sieht, hängt der Hamilton-Operator hier nur von den Ortsvariablen (Koordinaten) der Elementarteilchen des Systems ab (nicht auch noch von ihren Impulsvariablen, wie in der klassischen Mechanik). Der Operator ist also in Ortsdarstellung angegeben (die Impulsdarstellung wird in der Chemie selten benötigt). Formal können wir diese Abhängigkeiten des HamiltonOperators schreiben als Ĥ = Ĥ ({r i }, { R I }). Dementsprechend muß die Vielteilchenwellenfunktion nun von all diesen Koordinaten abhängen, also Ψ = Ψ({r i }, { R I }). Diese Zustandsfunktion, die wir durch Lösen der SchrödingerGleichung erhalten müssen, um molekulare Systeme beschreiben zu können, stellt sich also als sehr komplizierte mathematische Funktion heraus, die von (3M + 3N ) Variablen abhängt. Sie ist also umso komplizierter, je mehr Elektronen und Atomkerne das zu studierende Molekül aufbauen. 3.1.2 Postulat 5: Das Pauli-Prinzip Die Quantenmechanik der Vielteilchensysteme erfordert zunächst noch die Einführung eines Sysmmetrieprinzip. Dieses Symmetrieprinzip wurde von Wolfgang Pauli im Rahmen einer grundlegenderen Theorie abgeleitet. Diese grundlegendere Theorie ist die Quantenelektrodynamik, die auch die Photonen explizit als Quanten und nicht als elektromagnetische Felder beschreibt — also im Gegensatz zu der hier vorgestellten Quantentheorie (man denke an die 3.1 Quantenmechanik für viele Teilchen Coulomb-Operatoren für die Wechselwirkung der geladenen Elementarteilchen, die der klassischen Elektrodynamik nach Maxwell entlehnt sind (Korrespondenzprinzip) und natürlich nicht den expliziten Austausch von Photonen als Überträger der Coulomb-Kraft beschreiben). In unserer Darstellung der Quantentheorie bleibt uns daher nur, die von Pauli gefundene Symmetrie zu fordern: Postulat 5: Bei einer Vertauschung (Permutation) der dynamischen Variablen (räumliche Koordinaten und Spin) von zwei beliebigen Elementarteilchen in einer Vielteilchenwellenfunktion, muß diese das Vorzeichen wechseln, wenn es sich um zwei Fermionen handelt. Werden die Koordinaten von zwei Bosonen (z.B. zwei 42 He2+ -Kerne) vertauscht, so muß ohne Vorzeichenwechsel dieselbe Wellenfunktion erhalten werden. Die Wellenfunktion eines Systems von N Elektronen (also Fermionen), Ψ = Ψ(r1 , . . . , r N ) muß daher folgende Eigenschaft besitzen, wenn man die Koordinaten zweier beliebiger Elektronen i und j vertauscht, wobei diese Vertauschungsoperation durch den Operator P̂ij ausgedrückt wird: P̂ij Ψ(r1 , . . . , r i , . . . , r j , . . . , r N ) = Ψ (r 1 , . . . , r j , . . . , r i , . . . , r N ) ! = −Ψ (r 1 , . . . , r i , . . . , r j , . . . , r N ) (3.4) Hier definiert das erste Gleichheitszeichen die Wirkungsweise des Vertauschungsoperators P̂ij , während das zweite Gleichheitszeichen die Forderung nach der Erfüllung des Pauli-Prinzips widerspiegelt. 3.1.3 Trennung der Elektronen- und Kernbewegung Wie im Fall des Wasserstoffatoms, müssen wir nun versuchen, die Zustandsfunktion für ein molekulares System, Ψ = Ψ({r i }, { R I }), bestehend aus N Elektronen und M Atomkernen berechnen. Wie bereits erwähnt, ist zu erwarten, dass dies eine sehr komplizierte Funktion ist wegen der großen Zahl an Variablen. In Kapitel 2 haben wir schon einen mathematischen Trick kennengelernt, um einfache Funktionsansätze zu erhalten: den Produktansatz zur Trennung der Variablen. Dazu würde man zunächst gerne die zwei Typen an Koordinaten trennen, die der Kerne von denen der Elektronen: Ψ({r i }, { R I }) ≈ Ψel ({r i }) · ΨKerne({ R I }) (3.5) Diese Trennung der beiden Koordinatensätze ist aber mathematisch nicht erlaubt, weil im Hamilton-Operator Ĥ die Koordinaten der beiden Sorten Teilchen durch die Operatoren der elektrostatischen Wechselwirkung, 83 84 3 Die chemische Bindung −(4πǫ0 )−1 Z I e2 /|r i − R I |, aneinander gekoppelt sind. Den obigen Produktansatz dennoch zu machen bedeutet also, eine Näherung einzuführen. Man nennt diese die Born–Oppenheimer-Näherung zur Separation der Elektronenvon der Kernbewegung. Für die beiden Teilwellenfunktionen, Ψel und ΨKerne, lassen sich zwei Schrödinger-Gleichungen mit entsprechenden Hamilton-Operatoren herleiten. Eine von ihnen ist die sogenannte Kern-Schrödingergleichung, die das quantenmechanische Bewegungsverhalten der Atomkerne beschreibt. Die Bewegung der Atomkerne erweist sich beim Studium dieser Gleichung als kollektiv. D.h. es ist sinnvoll (und mathematisch möglich) nicht die Bewegung einzelner Atomkerne zu betrachten, sondern kollektive Bewegungsmoden zu finden, so dass Translationen und Rotationen des Kerngerüsts eines Moleküls, sowie interne Bewegungen unter Erhalt des Schwerpunkts, also Schwingungen, eingeführt werden können. Tatsächlich stellt der bereits in Kapitel 2 angesprochene harmonische Oszillator die einfachste Form einer Kern-Schrödingergleichung dar und ist daher das Modellquantensystem zum Studium von molekularen Schwingungen. Die zweite Schrödinger-Gleichung ist die elektronische Schrödingergleichung, die Ψel zur Lösung hat und das dynamische Bewegungsverhalten der Elektronen im Molekül beschreibt. Sie ist die zentrale quantenmechanische Gleichung für die Chemie, da aus ihr die Erklärung der chemischen Bindung, sowie das Reaktionsverhalten der Moleküle folgt. 3.1.4 Slater-Determinante und Orbitale Es stellt sich als nächstes die Frage, wie die elektronische Wellenfunktion Ψel = Ψel ({r i }) berechnet werden kann. Obwohl die Atomkernkoordinaten in ihr nicht mehr als Variablen vorkommen, hängt sie noch von 3N elektronischen Positionsvariablen ab. Daher müssen wir uns nun der Frage zuwenden, ob wir die Koordinaten der einzelnen Teilchen je einer Funktion zuordnen können, etwa in der Form ψi (r i ), aus deren Produkt dann die elektronische Zustandsfunktion Ψel entsteht, ? Ψel ({r i }) = ψ1 (r 1 )ψ2 (r 2 ) · · · ψN (r N ) (3.6) Auch hier wissen wir entsprechend der im letzten Abschnitt geführten Diskussion, dass diese Trennung der einzelnen Elektronenkoordinaten nicht erlaubt sein wird, weil im Hamilton-Operator die Koordinaten paarweise gekoppelt auftreten, nämlich in den Elektron-Elektron-Abstoßungsoperatoren, (4πǫ0 )−1 e2 /|r i − r j |. Ergo wäre ein Produktansatz wie in Gl. (3.6) zwangsläufig eine Näherung. Die Funktionen, die in dieser Näherung auftreten, sind reine Hilfsfunktionen; man nennt sie Orbitale. 3.1 Quantenmechanik für viele Teilchen Weil dieser Ansatz nur für Teilchen gilt, die nicht miteinander wechselwirken, heißt er auch das Modell unabhängiger Teilchen (auf Englisch: independent particle model), weil genau die Wechselwirkung der Teilchen im Ansatz für die Wellenfunktion nicht berücksichtigt wird. Der Ansatz wäre nur exakt, wenn die Elektronen nicht wechselwirken würden, wovon in einem realen System natürlich nicht die Rede sein kann. Es ist aber unbedingt darauf zu achten, dass die Wahl eines Modells unabhängiger Teilchen zur Näherung der exakten quantenmechanischen Zustandsfunktion eine Wahl unsererseits ist. Sie führt dazu, dass diese oft “Orbitalmodell” genannte Wahl zu Unstimmigkeiten und Unklarheiten führt, die aber der exakten Wellenfunktion völlig abgehen. Die Tatsache, dass für Atome und Moleküle mit nur einem Elektron, das Orbital exakt gleich der elektronischen Wellenfunktion ist, dann also keine Näherung darstellt, hat in der Chemie zu einer undenkbar großen Verwirrung geführt. Man kann allerdings zeigen, dass eine elektronische Wellenfunktion vom obigen Produkttyp eine Elektronendichte ρ el hat, die sich aus den Betragsquadraten der Orbitale berechnen läßt ρel (r ) (2.24) = (3.6) −→ N Z d3 r 2 · · · Z d3 r N |Ψel (r, r 2 , . . . r N )|2 |ψ1 (r )|2 + |ψ2 (r )|2 + + . . . |ψN (r )|2 = N ∑ |ψi (r )|2 (3.7) i =1 Die Elektronendichte beschreibt auch in diesem Fall die räumliche Verteilung der Elektronen, wie bereits in Kapitel 2 diskutiert, und kann also im Rahmen des Modells unabhängiger Teilchen aus den Orbitalquadraten berechnet werden. Wenn wir uns nun auf das “Orbitalmodell”, also auf den Ansatz unabhängiger Teilchen als Modellfunktion für die exakte elektronische Wellenfunktion, einlassen, dann müssen wir fordern, dass sich mit diesem Funktionsansatz in jedem Fall die Postulate der Quantenmechanik erfüllen lassen. Doch hier macht genau Postulat 5 Schwierigkeiten, wie wir leicht am Beispiel eines Zweielektronensystems (ob Atom oder Molekül ist dabei gleichgültig) sehen können. Für zwei Elektronen, die sich im elektrischen Feld von Atomkernen bewegen, nähern wir die elektronische Zustandsfunktion durch einen Produktansatz Ψel (r 1 , r 2 ) ≈ ψ1 (r1 )ψ2 (r 2 ) (3.8) entsprechend des Modells unabhängiger Teilchen. Nun fordert das PauliPrinzip, dass dieser Ansatz das Vorzeichen wechselt, wenn man die beiden 85 86 3 Die chemische Bindung Koordinaten vertauscht, was wir leicht untersuchen können: P̂12 [ψ1 (r 1 )ψ2 (r2 )] = [ψ1 (r 2 )ψ2 (r 1 )] 6= −[ψ1 (r 1 )ψ2 (r 2 )] (3.9) Das Pauli-Prinzip wird also klar nicht erfüllt. Um aber den einfachen Produktansatz für die Wellenfunktion zu retten, implementieren wir das PauliPrinzip in den Ansatz und ziehen das koordinatenvertauschte Produkt vom Ausgangsprodukt ab: Ψel (r 1 , r 2 ) ≈ [ψ1 (r 1 )ψ2 (r 2 ) − ψ1 (r 2 )ψ2 (r 1 )] (3.10) Für diesen Ansatz kann man nun leicht zeigen, dass er das Pauli-Prinzip erfüllt P̂12 [ψ1 (r 1 )ψ2 (r 2 ) − ψ1 (r 2 )ψ2 (r 1 )] = [ψ1 (r 2 )ψ2 (r 1 ) − ψ1 (r 1 )ψ2 (r 2 )] = −[ψ1 (r 1 )ψ2 (r 2 ) − ψ1 (r 2 )ψ2 (r 1 )] (3.11) Man beachte, dass man den Ansatz in Gl. (3.10) als Determinante schreiben kann, ψ (r ) ψ2 (r 1 ) (3.12) [ψ1 (r 1 )ψ2 (r 2 ) − ψ1 (r 2 )ψ2 (r 1 )] = 1 1 ψ1 (r2 ) ψ2 (r 2 ) Wenn wir nun diese Ideen verallgemeinern für ein N-Elektronensystem, wenn wir also alle ungeradzahligen Paarvertauschungen mit negativem Vorzeichen vom Ausgangsprodukt abziehen, während wir alle geradzahligen hinzu addieren, dann kann man auch diese Pauli-Prinzip-konsistente Näherung unabhängiger Teilchen als Determinante schreiben, ψ1 (r 1 ) ψ2 (r 1 ) · · · ψN (r 1 ) ψ1 (r 2 ) ψ2 (r 2 ) · · · ψN (r 2 ) Ψel (r 1 , r 2 , . . . , r N ) ≈ (3.13) .. .. .. .. . . . . ψ (r ) ψ (r ) · · · ψ (r ) 1 N 2 N N N die daher einen eigenen Namen bekommt. Man nennt sie Slater-Determinante. Orbitale sind also Einelektronenfunktionen, die in der Slater-Determinante vorkommen. Gebräuchlicher als der Begriff Slater-Determinante ist oft der Begriff Elektronenkonfiguration. Diejenigen Orbitale, die in der Slater-Determinanten vorkommen, stellen die Elektronenkonfiguration des Atoms oder Moleküls dar. Der Slater-Determinantenansatz zur Näherung der elektronischen Wellenfunktion ist der einfachste, den machen kann. Interessanterweise führt also die Erfüllung des Pauli-Prinzips dazu, dass jedes Elektron (durch seine Koordinate) in jedem Orbital vorkommt. In der Chemie spricht man oft von “Elektronen in Orbitalen”, meint aber eigentlich die Orbitale selbst, die keineswegs als eine Art Container für Elektronen zu verstehen sind. 3.1 Quantenmechanik für viele Teilchen 3.1.5 Mehrelektronenatome Man übersieht oft, dass schon das Helium-Atom ein Zweielektronensystem ist, für das die elektronische Wellenfunktion nicht so aussieht, wie die des Wasserstoffatoms, sondern für das man mindestens einen Ansatz der Form in Gl. (3.13) machen muß (für N = 2 natürlich, also wie in Gl. (3.12)). Wegen der radialen Symmetrie der Atome, kann man aber ebenso wie im Fall des Wasserstoffatoms jedes einzelne Orbital in ein Produkt aus Radialteil und Winkelteil aufspalten, ψi (r ) ≡ ψni li mi ms(i) (r ) = Rni li (r ) Yli mi (ϑ, ϕ) σsims(i) (3.14) (der Einfachheit halber wurde der Normierungsfaktor weggelassen). Es ist aber zu beachten, dass diese Aufteilung die Kugelsymmetrie eines Atoms voraussetzt, weil sonst eine Klassifizierung nach Drehimpulsquantenzahlen nicht möglich wäre. Man beachte ferner die explizite Berücksichtigung des Spins des Elektron in Form der Spinfunktion σsms (mit s = 1/2 und ms = ±1/2), die eine der beiden Spineigenfunktionen sein muß, also σsi ms(i) → σ1/2,+1/2 = α oder σsi ms(i) → σ1/2,−1/2 = β. Tatsächlich tragen die Orbitale in der SlaterDeterminanten also auch Spininformation und werden daher auch Spinorbitale genannt. In diesem Ansatz sind die Kugelflächenfunktionen Yli mi (ϑ, ϕ) bekannt, während die Radialfunktionen zunächst unbekannt sind (es läßt sich für sie nämlich keine radiale Differentialgleichung ableiten, die analytisch (also geschlossen) lösbar wäre — ganz im Gegensatz zum Wasserstoffatom, für das im Kapitel 2 eine solche Gleichung abgeleitet angegeben wurde). Wir haben bisher eine recht einfache Indizierung für die Orbitale in der Slater-Determinante verwendet. Oft versucht man diesen Indices mehr Information über die Orbitale und schließlich auch über die Gesamtzustandsfunktion Ψel aufzuprägen. Diese Information wird bestimmten Eigenschaften (Symmetrien) der Orbitale entnommen. Die dabei gewählten Mehrfachindices werden auch Quantenzahlen genannt. Sie spielen primär aber nur eine Rolle bei der Nummerierung der Orbitale und sekundär bei der Bestimmung von Symmetrieinformation für den gesamten Zustand, also für das gesamte NElektronensystem. Tatsächlich haben wir für das Atomorbital in Gl. (3.14) bereits eine solche symmetrietragende Mehrfachindizierung benutzt. An Stelle des zusammengesetzten Index i verwenden wir wegen der Struktur des Produktansatze die Drehimpulsindices (li , mi ), sowie den Spinindex ms(i) und den einfachen Laufindex ni , der in Analogie zum Wasserstoffatom auch hier Hauptquantenzahl genannt wird. Im atomaren Fall können wir also eine Slater-Determinante als Näherung für die elektronische Wellenfunktion finden, die aus Atomorbitalen aufgebaut ist 87 88 3 Die chemische Bindung und deren Indices die Quantenzahlen (ni , li , mi , ms(i)) sind, ΨAtom el ψn1 ,l1 ,m1 ,m (r 1 ) s (1 ) ψ n1 ,l1 ,m1 ,ms(1) (r 2 ) ≈ .. . ψn ,l ,m ,m (r N ) 1 1 1 s (1 ) ψn2 ,l2,m2 ,ms(2) (r 1 ) ψn2 ,l2,m2 ,ms(2) (r 2 ) .. . ψn2 ,l2 ,m2 ,ms(2) (r N ) · · · ψn N ,l N ,m N ,ms( N) (r 1 ) · · · ψn N ,l N ,m N ,ms( N) (r 2 ) .. .. . . · · · ψn N ,l N ,m N ,ms( N) (r N ) (3.15) Man beachte aber, dass für diese Funktionen — im Gegensatz zum Wasserstoffatom — keine analytischen Aussrücke bekannt sind, weil eben die Radialfunktionen nicht analytisch durch Lösen einer Differentialgleichung bestimmt werden können (dies geht nur approximativ und benötigt computergestützte Lösungsverfahren). 3.1.5.1 Spezielle Form des Pauli-Prinzip Basierend auf den bisherigen Ausführungen können wir uns nun einer Version des Pauli-Prinzips widmen, die in der Chemie große Verbreitung gefunden hat. Diese “Variante” besagt, dass sich zwei Elektronen in mindestens einer von vier Quantenzahlen, (ni , li , mi , ms(i)), unterscheiden müssen. Durch den Bezug auf die Quantenzahlen eines Atoms ist sofort offensichtlich, dass dies keine allgemeine Formulierung des Pauli-Prinzips sein kann. Moleküle haben keine Rotationssymmetrie und folglich lassen sich die Elektronen in Molekülen nicht mehr nach der Drehimpulsquantenzahl l klassifizieren. Man sagt dann, dass l keine gute Quantenzahl ist, und meint damit, dass die elektronische Wellenfunktion des Moleküls keine Eigenfunktion des Quadrats des Drehimpulsoperators mehr ist. Sie ist nur noch Eigenfunktion vom Quadrat des Spinoperators. Wenn man also von diesen vier Quantenzahlen spricht, bezieht man sich zwangsläufig nur auf Atome. Um nun zu verstehen, woher die Variante des Pauli-Prinzips kommt, schauen wir uns die elektronische Wellenfunktion in Slater-DeterminantenNäherung an, Gl. (3.16), und studieren den gegenteiligen Fall, nämlich das Auftreten von zwei gleichen Sätzen an Quantenzahlen, (nk , lk , mk , ms(k)) und (nk , lk , mk , ms(k) ), wobei wir der kompakten Schreibweise wegen, nur den Gesamtindex k schreiben: ψ (r ) · · · ψk ( r 1 ) ψk ( r 1 ) · · · ψN (r 1 ) 1 1 .. .. .. .. . . . . ψ ( r ) · · · ψ ( r ) ψ ( r ) · · · ψ ( r ) N k −1 1 k −1 k k −1 k k −1 ΨAtom ≈ = 0 (3.16) el · · · ψk ( r k ) ψk ( r k ) · · · ψ N (r k ) ψ1 (r k ) .. .. .. .. . . . . ψ1 (r N ) · · · ψk (r N ) ψk ( r N ) · · · ψ N ( r N ) 3.1 Quantenmechanik für viele Teilchen Die Determinante enthält dann zwei gleiche Spalten und verschwindet entsprechend der Rechenregeln für Determinanten. Das Pauli-Prinzip war der Grund für die Einführung einer Determinante an Stelle eines gewöhnlichen Produkts aus Orbitalen zur Näherung der Wellenfunktion. Nun erkennen wir, dass wir nicht zweimal dasselbe Spinorbital in der Determinante verwenden können, weil diese sonst zu Null wird und dann natürlich keine physikalisch sinnvolle Näherung an die elektronische Wellenfunktion darstellt. Weil wir die Orbitale durch ihre Indizierung unterscheiden und im Atomfall diese Indices durch die Quantenzahlen ersetzt werden, hat sich die in diesem Abschnitt angegebene Form des Pauli-Prinzips festgesetzt. Da es sich aber nicht um die allgemeine Formulierung des Prinzips, die in Postulat 5 gegeben wurde, handelt, sondern nur um eine Folgerung, die auch nur für den speziellen Fall der Atome gilt, ist die Formulierung von Postulat 5 zu bevorzugen. 3.1.5.2 Termsymbole Im Fall eines Mehrelektronenatoms haben wir im vorstehenden Abschnitt gesehen, dass die Atomorbitale mit den gleichen Quantenzahlen klassifiziert werden können, die schon beim Wasserstoffatom zur Bezeichnung eines Zustands verwendet wurden. Während die Hauptquantenzahl n lediglich Zustände entsprechend der aufsteigenden Gesamtenergie nummeriert und daher als Symmetrielabel nicht interessant ist, sagen li und si etwas über die Drehimpulssymmetrien des Atomorbital i aus, weil die Atomorbitale Eigen2 funktionen der Operatoren l̂ und ŝ2 sind. Es stellt sich dann die Frage, was der Gesamtdrehimpuls und der Gesamtspin von vielen Elektronen in einem Atom ist. Hier können wir uns wieder des Korrespondenzprinzips bedienen. In der klassischen Physik ist der Gesamtdrehimpuls L gleich der vektoriellen Addition der Drehimpulsvektoren der Einzelteilchen, l i , N L= ∑ li (3.17) i =1 weshalb wie für die entsprechenden Bahndrehimpulsoperatoren in der Quantenmechanik schreiben N L̂ = ∑ l̂ i (3.18) i =1 und für den (nichtklassischen) Spin der Elektronen N Ŝ = ∑ ŝi i =1 (3.19) 89 90 3 Die chemische Bindung Weil die elektronische Gesamtwellenfunktion Ψel eines Atoms alle physikalische und daher auch die Drehimpuls-Information trägt, muß sie die Eigenwertgleichungen dieser Drehimpulsoperatoren erfüllen, 2 L̂ Ψel = L( L + 1) h̄2 Ψel 2 Ŝ Ψel = S(S + 1) h̄2 Ψel und L̂z Ψel = M L h̄ Ψel (3.20) und Ŝz Ψel = MS h̄ Ψel (3.21) wobei die Quantenzahlen des Gesamtzustands folgende Werte annehmen können: L = 0, 1, 2, . . . , sowie S = 0, 0.5, 1, 1.5, 2, 2.5, . . . , und M L = − L, − L + 1, . . . , + L, sowie MS = −S, −S + 1, . . . , +S in völliger Analogie zum Einelektronenatom, das im Kapitel 2 besprochen wurde. Wenn wir den elektronischen Zustand eines Atoms durch eine Slaterdeterminante nähern, dann muß natürlich auch die Slaterdeterminante diese Drehimpulssymmetrien efüllen, d.h. Eigenfunktion der Gesamtdrehimpulsoperatoren sein. Wenn nun die Atomorbitale in der Determinante die Drehimpulssymmetrien der einzelnen Elektronen beschreiben, dann sollte deren Kopplung die Gesamtdrehimpulssymmetrien ergeben. In der Quantenmechanik kann das aber nicht wie in der klassischen Physik, Gl. (3.17), erfolgen, weil die Eigenfunktionen die Information tragen. Drehimpulskopplung in der Quantenmechanik bedeutet also, dass man eine Eigenfunktion zu den Operatoren, L̂ und Ŝ finden muß, so dass Gln. (3.20) und (3.21) erfüllt sind. Diese Eigenfunktionen sind aus den Einteilchenfunktionen, den Orbitalen, zu konstruieren. Für dieses Programm der quantenmechanischen Drehimpulskopplung gibt es eine rezeptartige Vorgehensweise, deren Diskussion an dieser Stelle jedoch zu weit führen würde. Hier ist vielmehr wichtig, dass der elektronische Gesamtzustand entsprechend der Gesamtbahndrehimpuls- und der Gesamtspinquantenzahlen, L, M L , S und MS , klassifiziert werden kann. Für jeden elektronischen Eigenzustand einer Anzahl Elektronen in einem Atom kann man für diese Zahlen einen Wert angeben, um einen Eigenzustand von dem anderen zu unterscheiden. Wenn man nun beachtet, dass man mit Licht zwischen diesen Eigenzuständen wechseln kann, also Spektroskopie betreiben kann, so verwundert es nicht, dass eine Klassifizierung der Zustände schon vor der Entwicklung der Quantenmechanik in die Atomspektroskopie eingeführt wurde. Diese Klassifizierung verwendet die Gesamtzustandsquantenzahlen zur Spezifizierung eines Zustands. An Stelle der Wellenfunktion wird dann ein sogenanntes Termsymbol angegeben, Ψel −→ (2S+1) LJ (3.22) das aus den Quantenzahlen L und S zusammengesetzt wird. Drehimpuls und Spin kann man noch zu einem Gesamtdrehimpuls koppeln, der denselben Regeln, wie soeben besprochen, folgt und mit einer Quantenzahl J belegt wird. 3.2 Molekülorbitaltheorie Die Zahl (2S + 1) wird Multiplizität genannt, weil sie angibt, in wieviele verschiedene Linien eine Linie im Spektrum aufspaltet, wenn man ein magnetisches Feld anlegt (Stern–Gerlach-Versuch). Dieser Beobachtung entspricht ein im feldfreien Raum entarteter quantenmechanischer Zustand, der in (2S + 1) energetisch verschiedene Zustände aufspaltet, wenn ein magnetisches Feld angelegt wird (Zeeman-Effekt). Für die Gesamtbahndrehimpulszahl gibt man nicht eine Zahl, sondern einen Buchstaben an, der sich an der für Einelektronenatome bereits eingeführten Notation s, p, d, etc. orientiert. Da es sich aber nun um Gesamtsymmetrien handelt, werden Großbuchstaben verwendet, wie in Tab. 3.1 gezeigt. Auch die Multiplizität (2S + 1) wird mit einer besonderen Notation belegt, die an Stelle des numerischen Werts tritt. Die Zuordnung dieser Namen orientiert sich an der Zahl der Linien nach Aufspaltung in einem magnetischen Feld und ist ebenfalls in Tab. 3.1 gezeigt. Die Verwendung von Termsymbolen sei an zwei Beispielen illustriert: Der Grundzustand des Helium-Atoms hat eine S = 0 Spin- und eine L = 0 Bahndrehimpulssymmetrie. Das Termsymbol für den Grundzustand ist daher 1 S0 (sprich: ‘Singulett-S’). Der Grundzustand des Kohlenstoffatoms ist entsprechend Experiment und quantenmechanischer Behandlung dreifach spinentartet, (2S + 1) = 3 also S = 1, und hat einen ebenfalls nicht verschwindenden Bahndrehimpuls, L = 1; das zugeordnete Termsymbol ist also 3 P (sprich: ‘Triplett-P’), wobei wir den Gesamtdrehimpuls J nicht angegeben haben. Tabelle 3.1 Zur Benennung der Termsymbole. L Symbol S (2S + 1) 0 1 2 3 4 S P D F G 0 0.5 1 1.5 2 1 2 3 4 5 Name Singulett Doublett Triplett Quartett Quintett 3.2 Molekülorbitaltheorie 3.2.1 Quantenmechanische Gleichungen für Orbitale Wir haben nun Orbitale als Bestandteile der Slater-Determinante eingeführt, jedoch mit keinem Wort erwähnt, wie wir diese Funktionen erhalten können. Entsprechend unserer Diskussion des Wasserstoffatoms würde man erwarten, 91 92 3 Die chemische Bindung dass sich eine Differentialgleichung formulieren läßt, deren Lösungsfunktionen die Orbitale sind. Im Fall eines Einelektronenatoms muß diese Gleichung exakt in die Schrödingerggleichung für H-ähnliche Atome übergehen! In der Tat kann man eine solche Gleichung allgemein ableiten (eine Ableitung, die wir an dieser Stelle überspringen, um die Prinzipien in den Vordergrund zu stellen statt technischer Details): (3.23) t̂ + V̂nuc + v̂ee ψi = ǫi ψi Diese Gleichung gilt exakt für Einelektronenzustände, wie Dirac zeigte (die Diracsche Gleichung ist zwar von dieser Form, weicht aber ansonsten essentiell von der Schrödingerschen Gleichung ab, die aber der Grenzfall jener für unendlich große Lichtgeschwindigkeit ist). Einige Operatoren in der Gleichung haben ihre übliche Bedeutung: t̂ bezeichnet den kinetische Energieoperator für ein Elektron, während V̂nuc der Operator für die Anziehung eines Elektrons von allen Kernen im System ist. Lediglich der Operator v̂ee besitzt eine äußerst komplizierte Form, die eigentlich auf Arbeiten von Breit zurückgeht und in modernen computerchemischen Verfahren auf vielfältige Art und Weise angenähert wird. Die energetische Größe ǫi wird Orbitalenergie genannt. Der gesamte Operator heißt auch FockOperator und läßt sich explizit schreiben als M h̄2 1 Z I e2 fˆ ≡ − ∆− ∑ + v̂ee 2me 4πǫ0 |r − R I | I =1 (3.24) Für uns ist hier nur wichtig, dass die zugeordnete zeitabhängige Gleichung im Prinzip exakt ist, dass der Operator für die kinetische Energie wegen des in ihm vorkommenden Laplace-Operators die Gleichung zu einer partiellen Differentialgleichung zweiter Ordnung macht (genau wie im Fall des Wasserstoffatoms) und dass der Operator v̂ee zu kompliziert ist, als dass wir ihn mit Papier und Bleistift annähern könnten. Kurz gesagt, Gl. (3.23) ist viel zu kompliziert, als dass wir uns ihrer Lösung ohne entsprechendes Handwerkszeug zuwenden könnten. Leider setzt uns das auch enge Grenzen für das Verständnis der chemischen Bindung. Während die exakte Lösung obiger Gleichung die beliebig genaue Beschreibung der chemischen Bindung erlaubt, was allerdings nur mittels spezieller Computerprogramme möglich ist, suchen wir ein approximatives Verfahren, das uns erlaubt, die ‘Essenz’ der chemischen Bindung zu erfassen. 3.2.2 Linearkombination von Atomorbitalen Glücklicherweise können wir einen Trick verwenden, den wir bereits im vorigen Kapitel eingesetzt hatten. Der Schlüssel dabei ist die Einführung von 3.2 Molekülorbitaltheorie Funktionen, die man bereits kennt, um so die unbekannten Funktionen, die Molekülorbitale, anzunähern. Wir nehmen an, wir kennen die Orbitale φµ aller Atome im Molekül — keine triviale Annahme, da wir obige Gleichung auch für Atome mit mehr als einem Elektron erst einmal lösen müßten — und konstruieren die Orbitale ψi des Moleküls durch Überlagerung dieser Atomorbitale ψi ( r ) = ∑ ciµ φµ (r ) (3.25) µ Nun sind die Unbekannten, die das Wesen des i-ten Molekülorbitals bestimmen, die Entwicklungsparameter ciµ , die man Molekülorbitalkoeffizienten oder kurz MO-Koeffizienten nennt. Die Menge aller Entwicklungsparameter eines Orbitals können wir in einem Vektor zusammenfassen, ci ≡ {ciµ }. Die Entwicklung selbst heißt LCAO-Entwicklung nach linear combination of atomic orbitals. 3.2.3 Die Roothaan-Gleichung Um die MO-Koeffizienten zu bestimmen, verwenden wir Gl. (3.23), die von dem LCAO-Ansatz in Gl. (3.25) erfüllt werden muß, t̂ + V̂nuc + v̂ee ∑ ciµ φµ (r ) = ǫi ∑ ciµ φµ (r ) (3.26) µ µ Um aus dieser Gleichung eine Bestimmungsgleichung für die Koeffizienten zu machen, gehen wir vor wie schon bei der Lösung des Wasserstoffatoms in Kapitel 2. Dazu multiplizieren wir Gl. (3.26) von links mit einem komplexkonjugierten Atomorbital φν⋆ (r ) und integrieren über die Koordinaten r, Z +∞ −∞ Z d3 r φν⋆ (r ) t̂ + V̂nuc + v̂ee ∑ ciµ φµ (r ) = µ +∞ −∞ d3 r φν⋆ (r )ǫi ∑ ciµ φµ (r ) µ (3.27) und schreiben die erhaltene Gleichung durch Vertauschen von Summation und Integration um ∑ ciµ µ Z +∞ −∞ Z d3 r φν⋆ (r ) t̂ + V̂nuc + v̂ee φµ (r ) = ǫi ∑ ciµ µ +∞ −∞ d3 r φν⋆ (r )φµ (r ) (3.28) Die Integrale könnten wir nur berechnen, wenn wir die explizite analytische Form der Atomorbitale kennen würden. Heutzutage kann man sie mit Computern berechnen. In den 1930-1950er Jahren war dies noch nicht möglich. 93 94 3 Die chemische Bindung Um dennoch dem Verständnis der chemischen Bindung näher zu kommen, hat man sich eines Tricks bedient. Zwar können wir die Integrale nicht auf einem Blatt Papier berechnen, wir wissen aber, dass es reelle Zahlen sind, die wir wie folgt abkürzen wollen, f νµ Sνµ ≡ ≡ Z +∞ −∞ Z +∞ −∞ d3 r φν⋆ (r ) t̂ + V̂nuc + v̂ee φµ (r ) d3 r φµ⋆ (r )φν (r ) (3.29) (3.30) so dass wir Gl. (3.28) kompakt schreiben können als ∑ f νµ ciµ = ǫi ∑ Sνµ ciµ µ (3.31) µ Die Summation kann man als Skalarprodukt zweier Vektoren f ν ≡ { f νµ } und ci beziehungsweise Sν ≡ {Sνµ } und ci schreiben, (3.32) f ν · c i = ǫi S ν · c i Eine solche Gleichung können wir nun für jedes beliebige Atomorbital φν erhalten. Wenn wir daher alle so gewonnenen Vektoren f ν und Sν als Zeilenvektoren in Matrizen f = { f νµ } und S = {Sνµ } auffassen, können alle diese Möglichkeiten in Form einer Matrix-Gleichung geschrieben werden, die man Roothaan-Gleichung nennt, (3.33) f · c i = ǫi S · c i Die nichttriviale Lösung dieser Gleichung erhält man durch Nullsetzen der Determinante [ f − ǫi S ] · c i = 0 =⇒ ! det [ f − ǫi S] = 0 (3.34) wobei wir an Stelle der senkrechten Striche zur Kennzeichnung der Determinanten diesmal explizit ‘det’ geschrieben haben (die triviale Lösung wäre ci = 0, was aber natürlich keine chemisch relevante Lösung ist, weil dann das Molekülorbital ψi (r ) entsprechend Gl. (3.25) überall im Raum Null wäre). 3.2.4 Die chemische Bindung im Diwasserstoff Die Lösung der Roothaan-Gleichung führt man am besten am Beispiel des einfachsten chemischen Moleküls vor, also für das Wasserstoffmolekül. Für die LCAO-Entwicklung in Gl. (3.25) verwenden wir zwei 1s-Atomorbitale, 1s1 (r ) und 1s2 (r ), wobei die Indices 1 und 2 die beiden Wasserstoffatome bezeichnen, H(1) –H (2) . Die zu lösende Gl. (3.34) lautet dann f 11 − ǫi S11 f 12 − ǫi S12 ! ! =0 det [ f − ǫi S] = 0 =⇒ (3.35) f 21 − ǫi S21 f 22 − ǫi S22 3.2 Molekülorbitaltheorie wobei i ∈ {1, 2}. Aus Symmetriegründen muß gelten f 11 = f 22 und f 12 = f 21 , sowie analog S11 = S22 und S12 = S21 — die beiden Wasserstoffatome sind symmetrieäquivalent, d.h. sie können vertauscht werden, ohne dass sich die Chemie des H2 -Moleküls ändert. Der Einfachheit halber führen wir noch ein f ≡ f 11 = f 22 und S ≡ S12 und nehmen an, dass die Atomorbitale normiert seien, S11 = S22 = 1. Damit können wir die zu lösende Gleichung schreiben als f − ǫi f 12 − ǫi S ! =0 (3.36) f 12 − ǫ S f − ǫi i Die Auflösung der 2×2-Determinante ergibt ⇔ 2 ( f − ǫi )2 − ( f 12 − ǫi S)2 2 ( f − ǫi ) = ( f 12 − ǫi S) ⇒ f − ǫi = 0 (3.37) = ±( f 12 − ǫi S) (3.38) was wir nach der gesuchten Orbitalenergie ǫi auflösen und so zwei mögliche Lösungen für zwei Molekülorbitale erhalten ǫ∓ = f ∓ f 12 f f = ∓ 12 1∓S 1∓S 1∓S (3.39) Wenn der Überlapp S bei großen Abständen der Wasserstoffatomkerne gegen Null geht, erhalten wir ǫ∓ = f ∓ f 12 (3.40) Orbitalenergien hängen also von der molekularen Struktur ab und ändern sich daher auch bei chemischen Reaktionen! Entsprechendes gilt für die Molekülorbitale selbst. Bei sehr großen Abständen entstehen aus H2 zwei einzelne Wasserstoffatome. Aufgrund der dann verschwindenden Wechselwirkung der beiden Protonen, der beiden Elektronen, sowie eines Elektrons eines H-Atoms mit dem Proton des anderen erkennen wir, " # Z +∞ 2 2 2 h̄ 1 Z e I f = d3 r φ1s (r ) − ∆− ∑ + v̂ee φ1s (r ) 2me 4πǫ0 |r − R I | −∞ I =1 # " Z +∞ e2 1 h̄2 3 φ1s (r ) = E1s (3.41) ∆− d r φ1s (r ) − ≈ 2me 4πǫ0 |r − R1 | −∞ Dementsprechend kann f durch den Eigenwert des Wasserstoffatomgrundzustands genähert werden. Wenn wir nun beachten, dass der Überlapp von zwei 1s-Orbitalen S stets positiv ist, so gilt für die Aufspaltung um den Energieschwerpunkt E1s : ∆ǫ− > ∆ǫ+ . Das Molekülorbital ψ+ wird dann in der 95 96 3 Die chemische Bindung Energie abgesenkt gegenüber den Atomorbitalenergien E1s , währen ψ− energetisch angehoben wird. Ersteres nennt man deshalb ein bindendes Molekülorbital und letzteres ein antibindendes Molekülorbital. Die Ausbildung der chemischen Bindung ist demnach energetisch begünstigt und die Reaktionsenergie kann genähert werden durch ∆Eel = 2ǫ+ − 2E1s (3.42) Die erhaltenen Lösungen kann man in ein Diagramm, in das sogenannte MO-Diagramm, einzeichnen (s. Abb. 3.1), dem man sofort entnehmen kann, dass die Bildung einer chemischen Bindung zwischen zwei Wasserstoffatomen zu einer Energieerniedrigung und damit zu einem stabileren Zustand führt. Es ist an dieser Stelle wichtig zu betonen, dass man MO-Diagramme nicht raten kann, wie oft der Eindruck in Lehrbüchern der Allgemeinen Chemie erweckt wird, sondern immer durch Lösen einer Roothaan-artigen Gleichung berechnen muß. Offensichtlich wird dieses Lösen immer schwieriger, je mehr Atomorbitale berücksichtigt werden müssen, also je größer und zahlreicher die Atome im Molekül sind. Schon für die homonuklearen zweiatomigen Moleküle der zweiten Periode (also z.B. O2 , N2 und F2 ) ist schon eine aufwendige Berechnung nötig, die auch nur noch mit Computern ausgeführt werden kann, wenn man die Integrale f νµ und Sνµ explizit berechnen will/muß. εi ε E 1s ε+ H H2 H Abbildung 3.1 Molekülorbitaldiagramm zur Bildung von H2 aus zwei H-Atomen. In die Mitte zeichnet man die Orbitalenergien des bindenden und des antibindenden Molekülorbitals, sowie links und rechts davon die Atomorbitalenergien. Aus der Lösung der Roothaan-Gl. (3.33) erhält man auch die MO-Koeffizienten, mit deren Hilfe wir schließlich die MOs graphisch darstellen können. Das MO zur niedrigsten Energie wird bindendes MO genannt, während das MO mit einer Energie höher als dem Energieschwerpunkt — der hier identisch ist mit der Energie der AOs — antibindendes MO genannt wird, weil 3.2 Molekülorbitaltheorie eine “Besetzung” dieses MO die Bindung schwächen würde. Wenn die Energie eines Molekülorbitals dagegen gleich dem Energieschwerpunkt sein wird, dann nennt man dieses MO nichtbindend. 97 99 4 Chemische Konzepte Mit der Quantenmechanik haben wir die Theorie in den Händen, mit der wir das dynamische Verhalten der Elektronen und Atomkerne beschreiben können. Mit ihr können wir sämtliche Eigenschaften von Molekülen, molekularen Aggregaten, Festkörpern etc. vorhersagen und beschreiben. Offensichtlich ist die Theorie aber recht kompliziert und erlaubt ohne vorherige Berechnung kaum Aussagen, was die “Alltagstauglichkeit” der Theorie sehr einschränkt. Kurz, die Theorie ist nicht handlich und wir benötigen in der Chemie weitere, zwangsläufig approximative Werkzeuge, die es uns gestatten, soweit wie möglich konsistent mit den Prinzipien der Quantenmechanik eine Begrifflichkeit zu schaffen, die flexibel und ad hoc anwendbar ist. Die chemischen Konzepte erfüllen diese Aufgabe und das erste zu besprechende Konzept ist das der Partialladungen. Für das qualitative Verständnis molekularer Prozesse und Reaktionen sind diese Konzepte unverzichtbar. Sobald chemische Zusammenhänge in groben Zügen (qualitativ) verstanden sind, kommen dann genauere, quantitative Berechnungen basierend auf der Quantenmechanik, sogenannte quantenchemische Berechnungen, zum Einsatz. 4.1 Ladungsverteilung und Partialladungen Sehr viele in der Chemie geführte deskriptiv-qualitative Diskussionen über Moleküle und ihr chemisches Verhalten werden mit rein elektrostatischen Begriffen geführt. Daher ist die zentrale physikalische Größe in all diesen Diskussionen die Ladungsverteilung der Elektronen im Molekül. Diese Größe haben wir bereits in Kapitel 2 eingeführt. Es ist die Ladungsdichteverteilung ρC (r ) ≡ qe ρ(r ) = −eρ(r ), also die elementarladungsgewichtete Elektronendichteverteilung aus Gl. (2.24). Um allgemein mit ‘elektrostatischer Anziehung’ oder ‘elektrostatischer Abstoßung’ argumentieren zu können wird es nötig sein, zu bestimmen, an welchen Orten im Raum ein Ladungsunterschuß beziehungsweise -überschuß zu finden ist. Es wird sicherlich nicht einfach sein, derartige Informationen zu erhalten, weil man eine Referenzladungsverteilung definieren müßte, bezügAllgemeine Chemie. Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008 100 4 Chemische Konzepte lich derer dann eine Ladungserniedrigung oder -erhöhung angegeben werden kann. Auf den ersten Blick vereinfacht sich diese Situation, wenn wir die Ladung der Atome in einem Molekül bestimmen könnten und mit der Ladung eines isolierten, elektrisch neutralen Atoms vergleichen, also das Konzept der Partialladungen einführen. Bei genauerer Betrachtung erweist sich dies aber als schwierig, weil wir in der Quantenmechanik der Moleküle gar nicht über Atome in Molekülen sprechen, sondern über Elektronen und Atomkerne. Atome kamen in der Molekülbeschreibung in den Kapiteln 2 und 3 nicht vor, ergo wird es schwierig sein, Atome in Molekülen zu definieren. Diese Situation läßt sich durch ein sehr einfaches Gedankenexperiment verdeutlichen: Angenommen wir wandern durch die Elektronendichte ρ A− B (r ) von einem Atomkern A zu einem anderen Atomkern B in einem Molekül A − B, dann werden wir nicht an einem Grenzposten vorbeikommen, der uns sagen würde, dass nun Atom A aufhört und Atom B beginnt, so dass wir ρ A− B (r ) auf die beiden Atomen eindeutig aufteilen könnten ρ A − B (r ) = ρ A (r ) + ρ B (r ) (4.1) Aus genau so einer Aufteilung könnten wir aber leicht die Zahl der Elektronen durch Integration der Einzeldichten berechnen N = Z +∞ = Z −∞ 3 d rρ A−B (r ) = Z +∞ −∞ 3 A d r ρ (r ) + Z Z +∞ −∞ d3 r ρ B ( r ) d3 r ρ A ( r ) + d3 r ρ B (r ) = NA + NB Atom A Atom B | {z } | {z } (4.2) ≡ ( Z A − NA ) e (4.3) ≡ NA ≡ NB die wir den Atomen zuordnen wollen, also NA und NB . Mit diesen Elektronenzahlen können wir Partialladungen der Atome, q A und q B , durch Differenzbildung mit der Elektronenzahl der neutralen, isolierten Atome, die wir aus den Kernladungszahlen berechnen können, erhalten qA qB ≡ ( ZB − NB )e (4.4) Der Schlüssel zu diesen Größen liegt aber, wie bereits eingangs gesagt, in der Definition des Raumbereichs, der von einem Atom im Molekül eingenommen wird. Es wurden verschiedene Definitionen vorgeschlagen, um Atome in Molekülen wieder zu finden. Die Wahl ist anthropogen und daher kann keine Definition von Partialladungen eindeutig sein. Anders gesagt: verschiedene Protkolle zur Berechnung von Partialladungen wurden vorgeschlagen, die alle nützlich sind, aber auf keinen Fall vermischt werden dürfen. 4.1 Ladungsverteilung und Partialladungen Paulings Einführung des Begriffs der Elektronegativität versucht das Problem der Definition eines Raumbereichs für ein Atom in einem Molekül zur Berechnung von Partialladungen durch Verwendung und Mittelung beobachtbarer Größen zu umgehen. Zunächst definiert er Elektronegativität als die Fähigkeit eines Atoms in einem Molekül, Elektronen an sich zu ziehen. Dadurch versucht er anzugeben, wo im Molekül negative Ladung angehäuft werden kann, während an anderen Orten im Molekül entsprechend Elektronendichte fehlt, also eine positive Partialladung zurückbleibt. Die Elektronegativität muß aus Meßgrößen berechnet werden. Auch hier hat man viele Optionen, die sämtlich zu verschiedenen, miteinander nicht kompatiblem Elektronegativitätsdefinitionen geführt haben. Pauling verwendete thermodynamische Daten, namentlich Bindungsenergien von Molekülen, hauptsächlich weil diese damals in ausreichender Menge zur Verfügung standen. Konzeptionell wäre es offensichtlicher gewesen, Energien zu verwenden, die mit dem Entfernen und dem Hinzufügen eines Elektrons verknüpft sind, also mit Ionisierungsenergien und Elektronenaffinitäten. Gemessene Elektronenaffinitäten hatte Pauling damals aber nicht zur Verfügung. Atome in Molekülen wieder zu finden ist also nicht so leicht, wie man dies vielleicht erwartet hätte. Das bedeutet aber natürlich nicht, dass es keine Atome gibt. Wir können leicht Reaktionen definieren, bei dem zwei Atome ein Molekül bilden oder ein Molekül in ein Atom und ein weiteres Fragment entfällt. Ferner enthalten Moleküle die Zentren der Atome, die Atomkerne. Lediglich die Vorstellung eines Atoms, das einen wohl definierten Raumbereich einnimmt, führt zu Schwierigkeiten, wenn man dies in einem Molekül versucht. Für isolierte Atome, das heißt für Atome, die hinreichend weit von anderen Atomen oder Molekülen entfernt sind, ist dies einfacher, weil sie kugelsymmetrisch sind und die atomare Elektronendichte exponentiell abfällt (folgend dem exponentiellen Abfall der Wellenfunktion und der Orbitale aus denen sie berechnet wird). 101 Anhang 103 A Rechenregeln Im folgenden seien einige oft benötigte Rechenregeln zusammengefaßt. Dabei wird der Kürze halber recht wenig Wert auf mathematische Präzision und Rigorosität gelegt. A.1 Infinitesimalrechnung A.1.1 Totale und partielle Ableitung Eine partielle Ableitung wird genauso gebildet wie die totale, nur werden alle Variablen bis auf diejenige, nach der abgeleitet wird, als konstant angesehen. Um diese beiden Ableitungen zu unterscheiden, wird das Differential dx der totalen Ableitungen zu einem ∂x für die partielle Ableitung. Wenn wir also zum Beispiel eine Funktion von zwei Variablen x und y f ( x, y) = yx 2 + y (A.1) studieren, dann ergibt sich die partielle Ableitung nach x (also unter Konstanthalten der Variablen y ausgedrückt durch den Index an der Klammer) als ∂ f ( x, y) = 2yx (A.2) ∂x y Eine totale Ableitung, die die Annahme nicht macht, dass y bezüglich der Ableitung konstant zu halten ist, wird dagegen allgemein geschrieben als ∂ f ( x, y) ∂ f ( x, y) dx dy d f ( x, y) + = (A.3) dx ∂x dx ∂y dx y |{z} x =1 Allgemeine Chemie. Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008 104 A Rechenregeln wenn die Funktion f nur von zwei Variablen abhängt. Diese Ableitung erhält man aus dem sogenannten totalen Differential d f der Funktion, ∂ f ( x, y) ∂ f ( x, y) d f ( x, y) = dy (A.4) dx + ∂x ∂y y x Totale Differentiale spielen eine entscheidende Rolle in der Thermodynamik und können auch geometrisch interpretiert werden. Für das spezielle Beispiel in Gl. (A.1) erhalten wir dann d f ( x, y) dy = (2yx ) + ( x2 + 1) dx dx (A.5) A.1.2 Kettenregel Bei vielen Ableitungen physikalischer Größen muß man beachten, dass Ableitungen Schritt für Schritt vorzunehmen sind. Allgemein kann man schreiben d f [ g( x )] d f dg = dx dg dx (A.6) (wobei diese Regel für totale und partielle Ableitungen gleichermaßen gilt). Man beachte als Merkregel, dass die Ableitung auf der linken Seite entsteht, wenn man rechts dg ‘kürzt’. √ Als Beispiel leiten wir die Funktion f ( x ) = (1/ x )2 ab, wobei offensicht√ lich g = x zu wählen ist √ −3 1 −1/2 1 d f (x) x = −2 x = − x −4/2 = − 2 dx x | {z } |2 {z } d f /dg (A.7) dg/dx was sicherlich richtig ist, da wir die Funktion auch hätten vereinfachen kön√ nen zu f ( x ) = (1/ x)2 = 1/x, so dass sich direkt die Ableitung nach x zu f ′ ( x ) = −1/x2 ergibt. A.1.3 Produkt- und Quotientenregel Leitet man ein Produkt von zwei Funktionen u und v, die je nur von einer Variablen abängen sollen, ab, dann muß man die sogenannte Produktregel beachten: (uv)′ = u′ v + v′ u (A.8) Mit dieser Regel läßt sich auch sofort der Quotient zweier Funkionen ableiten als ′ u ′ 1 ′ u′ v′ 1 ′1 =u + u= = u + − 2 u (A.9) v v v v v v A.2 Differentialgleichungen wobei die Kettenregel bei der Ableitung von 1/v zu beachten ist, da v selbst noch von der Variablen abhängt, nach der man ableitet. Die rechte Seite läßt sich kompakt auf einen Hauptnenner bringen u ′ v = u′ v − v ′ u v2 (A.10) und ergibt einen Ausdruck der Quotientenregel genannt wird. A.1.4 Partielle Integration Bei der Integration von einem Produkt zweier Funktionen ist die ‘umgekehrte Produktregel’ zu beachten. Wenn wir also die Ableitungen in Gl. (A.8) integrieren, so ergibt sich Z (uv)′ = Z u′ v + Z v′ u (A.11) was wir schreiben können als [uv] = Z ′ u v+ Z v′ u (A.12) wobei die Grenzen der Stammfunktion, [uv], auf der linken Seite weggelassen wurden. Obige Gleichung ist in der Form Z u′ v = [uv] − Z v′ u (A.13) als partielle Integration bekannt. A.2 Differentialgleichungen In der Chemie und Physik kommen Differentialgleichungen ubiquitär vor (beispielsweise in der Kinetik oder in der Quantenmechanik). Beim Lösen einer Differentialgleichung wird die Lösungsfunktion bestimmt. A.2.1 Gewöhnliche Differentialgleichungen Hängt die Lösungsfunktion nur von einer Variablen ab, so spricht man von einer gewöhnlichen Differentialgleichung. Die mathematische Theorie gewöhnlicher Differentialgleichungen ist abgeschlossen. Das bedeutet, dass jede gewöhnlich Differentialgleichung gelöst werden kann. 105 106 A Rechenregeln Die Lösung kann auf zwei Arten erfolgen. Zum einen existiert ein ganzer Satz von Regeln, die auf bestimmte Typen von Differentialgleichungen angewendet werden können. Ein Beispiel haben wir kennengelernt beim radioaktiven Zerfall, bei dem wir die Differentialgleichung, die die Veränderung der Stoffmenge beschreibt, durch Variablenseparation lösen konnten. Eine gute Übersicht über alle diese “Lösungsrezepte” bieter Kreyszig [8]. Es gibt allerdings ein Rezept, das bei jeder gewöhnlichen Differentialgleichung zum Ziel führt. Dies ist ein Potenzreihenansatz für die Lösungsfunktion, ∞ y( x ) = ∑ ak x k (A.14) k =0 Die Entwicklungskoeffizienten ak werden bestimmt, indem man den Ansatz in die entsprechende Differentialgleichung einsetzt und versucht, eine Rekursionsbeziehung für die Koeffizienten zu finden, so dass alle Koeffizienten bekannt sind, wenn man erst einmal den ersten festgelegt hat. A.3 Eine Herleitung der Wellengleichung Im folgenden soll die sogenannte Wellengleichung zur Beschreibung des räumlichen und zeitlichen Verhaltens einer Auslenkung u = u( x, t) hergeleitet werden. Die präsentierte Ableitung stellt eine mögliche Ableitung dar, andere sind denkbar. Der Einfachheit halber betrachten wir die Ausbreitung dieser Auslenkung nur in einer Raumrichtung (in x-Richtung). Die Auslenkung u kann zum Beispiel die Auslenkung einer Saite sein; s. Abb. 1. Um die Saite auszulenken, muß Arbeit verrichtet werden, was die potentielle Energie erhöht. u t Propagation in x mit der Zeit t u i−1 ui x x 1 2 x x i−1 i xN x Abb. 1: Ausbreitung einer Auslenkung in Zeit und Raum. A.3 Eine Herleitung der Wellengleichung Schreiben wir die potentielle Energie als Produkt aus auslenkender Kraft F mal Dehnung der Saite exemplarisch für den in Abb. 1 eingezeichneten schwarzen Bogen, so erhalten wir (A.15) E pot = F · ∆l wobei ∆l die Verlängerung der elastischen Saite im dargestellten Bogen ist, also den Unterschied zwischen neuer Länge des Bogens lneu und der zugehörigen relaxierten Bogenlänge l alt angibt. Wenn wir die Strecke in x-Richtung, über die sich der Bogen der ausgelenkten Saite ausdehnt, in N Abschnitte gleicher Breite ∆x unterteilen (markiert durch die grünen xi in Abb. 1), so ergibt sich die relaxierte Länge der Saite in dem betrachteten Bogen zu (A.16) l alt = N · ∆x In jedem Intervall xi−1 bis xi kann nun die Länge der Saite nach dem Satz von Pythagoras berechnet werden als, q q l ( xi ) − l ( xi−1 ) = ( x i − xi−1 )2 + (ui − ui−1 )2 = ∆x2 + (ui − ui−1 )2 (A.17) wobei ui = u( xi ) und ui−1 = u( xi−1 ). Die (Gesamt-)Längenänderung der Saite in dem betrachteten Bogen ergibt sich nun durch Aufsummation der einzelnen Teillängen zu N q N ( A.17) ∆l = ∑ [l (xi ) − l (xi−1)] − l = ∑ ∆x2 + (ui − ui−1)2 − l i =1 i =1 ( A.16) = = ∆x ∆x N s i∑ =1 s N ∑ i =1 1+ 1+ u i − u i −1 ∆x 2 −N u i − u i −1 ∆x 2 −1 (A.18) Damit läßt sich die potentielle Energie aus Gl. (A.15) schreiben als s 2 N u i − u i −1 1+ −1 E pot = F · ∆x ∑ ∆x i =1 (A.19) u − u i −1 < 1, so dass die WurFür kleine Auslenkungen gilt für die Steigung i ∆x zel in eine Taylor-Reihe entwickelt werden kann, (" # ) N 1 u i − u i −1 2 1+ E pot = F · ∆x ∑ +··· −1 (A.20) 2 ∆x i =1 N u i − u i −1 2 1 (A.21) F · ∆x ∑ ≈ 2 ∆x i =1 107 108 A Rechenregeln Wir betrachten nun ein Stück der Saite im Bogen an einem Ort xi . Bei der Auslenkung wirkt eine Kraft senkrecht zur x-Richtung, Fi = − ∂E pot ∂ui (A.22) Mit Gl. (A.21) können wir die partielle Ableitung per Kettenregel auswerten, ∂E pot 1 1 = F · ∆x [2(ui − ui−1 ) − 2(ui+1 − ui )] ∂ui 2 (∆x )2 (A.23) wobei man beachten muß, dass ein ui in zwei Summanden von Gl. (A.21) auftritt (weil bei der partiellen Differentiation alle u j 6= ui als Konstanten zu behandeln sind, fallen alle Summanden, die nicht ui enthalten, als Konstanten weg und die Summe kollabiert zu zwei Termen). So erhalten wir für die Kraft Fi , die auf das i-te Saitenstück wirkt, nach Gl. (A.22), Fi = − F · ∆x 1 [2ui − ui−1 − ui+1 ] (∆x )2 (A.24) Die rechte Seite dieser Gleichungen können wir umschreiben unter Verwendung der Taylor-Entwicklungen, 1 ui±1 = u( xi ± ∆x ) = u( xi ) ± u′ ( xi )∆x + u′′ ( xi )(∆x )2 + · · · 2 (A.25) die sich kombinieren lassen zu i h 2ui − ui−1 − ui+1 = −(∆x )2 u′′ ( xi ) + O (∆x )3 ≈ −(∆x )2 u′′ ( xi ) (A.26) Fi = F · ∆xu′′ ( xi ) (A.27) Damit erhalten wir für die Kraft in Gl. (A.24), Nun kann aber Fi nach Newton geschrieben werden als Fi = mai = m d2 u i d2 u = ρ · ∆x 2i 2 dt dt (A.28) wobei m die Masse des Saitenstücks am Orte xi ist, die wir ausdrücken können durch eine (eindimensionale) Dichte ρ (mit Einheit Masse pro Länge) als m = ρ · ∆x. Setzen wir Gln. (A.27) und (A.28) gleich, so erhalten wir eine Differentialgleichung für ui , ρ · ∆x d2 u i = F · ∆x u′′ ( xi ) dt2 (A.29) A.3 Eine Herleitung der Wellengleichung Diese Gleichung können wir auf beiden Seiten durch ∆x teilen. Ferner bemerken wir, dass die Gleichung für jeden beliebigen Ort xi gilt, so dass wir den Index i fallenlassen können. Hier zeigt sich nun auch, warum es egal ist, welchen Bogen der Welle wir für unsere Betrachtungen auswählen. Es ergibt sich eine partielle Differentialgleichung zweiter Ordnung, ρ d2 u = Fu′′ ( x ) dt2 (A.30) Wenn wir die Parameter F und ρ auf eine Seite bringen, bemerken wir, dass der Quotient F/ρ von der Dimension her einem Geschwindigkeitsquadrat p entspricht. Mit der Defintition der Ausbreitungsgeschwindigkeit v ≡ F/ρ erhalten wir schließlich 2 d2 u( x, t) 2 d u( x, t ) = v dt2 dx2 (A.31) die Wellengleichung, die uns die Veränderung der Auslenkung u mit dem Ort und der Zeit beschreibt. 109 110 Literatur Literatur 1 Peter W. Atkins, Julio De Paula. Physikalische Chemie. Wiley-VCH, Weinheim, 4. ed., 2006. 2 Donald A. McQuarrie, John D. Simon. 3 R. Stephen Berry, Stuart A. Rice, John Ross. Physical Chemistry. Oxford University Press, Oxford, 2. ed., 2000. 4 Gerd Wedler. Lehrbuch der Physikalischen Chemie. Wiley-VCH, Weinheim, 5. ed., 2004. 5 Paul A. Tipler, Gene Mosca. Physik: Für Wissenschaftler und Ingenieure. Spektrum Akademischer Verlag, Weinheim, 2. ed., 2006. 6 Robert Bruce Lindsay, Henry Margenau. Foundations of Physics. Ox Bow Press, Woodbridge, 1981. 7 Henry Margenau, George Moseley Murphy. Die Mathematik für Physik und Chemie I. Verlag Harri Deutsch, Frankfurt, 1965. 8 Erwin Kreyszig. Advanced Engineering Mathematics. John Wiley & Sons, New York, 7. ed., 1993. 111 Index α-Strahlen 47 α-Teilchen 33 β-Strahlen 47 γ-Strahlen 47 Öltröpfchenversuch 31 Ableitung – partiell, 18, 103 – total, 18, 103 Absorption 43 actio 10 antibindendes Molekülorbital 97 Arbeit 11 Atom 1 Atomkern 33 Aufenthaltswahrscheinlichkeit 62 Balmer-Serie 43 Beschleunigung 8 Bewegungsbahn 9 Bewegungsenergie 11 bindendes Molekülorbital 97 Bohr – Atommodell, 43 – Radius, 45 Born Interpretation 62 Born–Oppenheimer-Näherung 75, 84 Bosonen 72 Brackett-Serie 44 Coulomb-Kraft 16 Dalton 1 Dichte – Aufenthaltswahrscheinlichkeit, 62 – Ladung, 99 – radial, 79 Differentialgleichung 105 – 1. Ordnung, 48 diffuse 79 Dimension 22 Drehimpuls – Definition, 69 – Quantenzahl, 70 Druck 23 Effekt – photoelektrischer, 42 Eigenfunktion 57 Eigenwert 57 Eigenwertgleichung 57 Einheiten 21 Elektromagnetismus 35 Elektron 28 Elektronegativität 101 Elektronendichte 99 – radial, 79 Elektronenkonfiguration 86 Elektrostatik 16 Elementare Abstraktion 8 Emission 43 Energie 11 Allgemeine Chemie. Copyright © Prof. Dr. Markus Reiher, ETH Zürich, HS 2008 112 Index – gesamt, 16 – kinetische, 11 – klassische Mechanik, 16 – potentielle, 14 Energiequanten 42 Entartung 70 – zufällige, 80 Erwartungswert 65 Feder 24 Feldstärke 18 Fermionen 72 Fock-Operator 92 Fraunhofersche Linien 43 fundamental 79 Gesamtenergie 16 Geschwindigkeit 6 Geschwindigkeitsgesetz 48 Geschwindigkeitskonstante 48 gewöhnliche Differentialgleichung 105 Gravitationsgesetz 15 Grenzwert 7 Halbwertszeit 49 Hamilton – Funktion, 17 – Operator, 55 harmonische Schwingung 25 harmonischer Oszillator 73 Hauptquantenzahl 79 Heisenberg – Unschärfe, 67 Impulsdarstellung 69 Infinitesimalrechnung 103 Isotop 34 Isotopeneffekte 54 Kanalstrahlen 32 Kathodenstrahlen 28 Kernzerfall 46 Kettenregel 19, 104 Kinetik 47 – 1. Ordnung, 48 kinetische Energie 11 klassische Mechanik 6 Kommutator 67 Konzepte 99 Korrespondenzprinzip 56 Kraft 9 Kraftfeld 24 Kraftflußdichte 29 Kraftkonstante 24 Kronecker-Delta 68 Kugelflächenfunktionen 70, 78 Kugelkoordinaten 20 Ladungsdichte 99 Lageenergie 14 Laplace-Operator 35 LCAO 93 Lebenszeit 49 Licht 35 Lichtgeschwindigkeit 35 Limes 7 Linearkombination – Atomorbitale, 93 Lorentz-Kraft 29 Lyman-Serie 44 Masse – reduzierte, 75 Massenzahl 34 Materiewelle 40 Maxwell 35 Mechanik – klassische, 6 Millikan 31 Mischungen 27 Mittelwert 65 MO-Diagramm 96 MO-Koeffizienten 93 Molekülorbital Index – antibindend, 96, 97 – bindend, 96, 97 – nichtbindend, 97 Molekülorbitalkoeffizienten 93 Multiplizität 91 Neutron 34 Newton 16 – Axiome, 9 – Bewegungsgleichung, 9 – Gravitationsgesetz, 15 Ockhamsches Rasiermesser 53 Operator 19 – Hamilton, 55 Orbitale 84 Orbitalenergie 92 Ordnungszahl 34 Ortsdarstellung 57, 69, 82 Partialladung 100 partielle Ableitung 18, 103 partielle Integration 105 Paschen-Serie 44 Pauli-Prinzip 83, 88 Pauling, Linus 101 Permeabilität 35 Pfund-Serie 44 photoelektrischer Effekt 42 Photon 37 Polarkoordinaten 20 Potential 18 potentielle Energie 14 Potenzreihe 13, 106 principal 79 Produktregel 104 Proton 32 Quantelung 43 Quanten 42 quantenchemische Berechnungen 99 Quantenzahl 57, 87 – Drehimpuls, 70 – Haupt-, 79 – magnetische, 70 – Schwingungs-, 74 – Spin, 71 Quotientenregel 105 radiale Dichte 79 Radialfunktion 77 Ratenkonstante 48 reactio 10 Reaktionsgeschwindigkeit 47 Reaktionsrate 47 reduzierte Masse 75 Reibungsgesetz 32 Reinstoffe 27 Roothaan-Gleichung 94 Rotationsenergie 76 Rutherford 33 Schrödinger-Gleichung 55 – stationär, 59 Schwingung – harmonische, 25 Separationsansatz 60 – zeitabhängige SchrödingerGleichung, 61 sharp 79 Slater-Determinante 86 Spin 71 Spinorbitale 87 Stokes 32 Streuexperiment 33 Taylor-Reihe 13 Teilchen – im Kasten, 72 Teilchendichte 64 Teilchenverteilung 64 Termschema 58 Termsymbol 89, 90 totale Ableitung 18, 103 113 114 Index Trägheitsmoment 77 Trajektorie 9 Welle–Teilchen-Dualismus 38 Wellenfunktion 54 Ultraviolettkatastrophe 42 Unschärfe-Relation 67 Zentrifugalpotential 79 Zerfallsprozesse 46 zufällige Entartung 80 Zustandsfunktion 54 Variablentrennung 48 Wasserstoff-Atom 74