Institut für Physik der Kondensierten Materie Skript zur Vorlesung: Physik 2 für Elektrotechniker: Optik, Atom- und Kernphysik Priv.-Doz. Dr. Dirk Menzel Inhaltsverzeichnis 1 Licht als elektromagnetische Welle 1 1.1 Die Wellengleichung für das Vakuum 1 1.2 Die Ausbreitung des Lichts 5 1.2.1 Huygens’sches und Fermat’sches Prinzip 5 1.2.2 Das Reflexionsgesetz 5 1.2.3 Lichtbrechung 6 1.2.4 Die Totalreflexion 7 1.2.5 Ausbreitung des Lichts in Materie 7 1.2.6 Polarisation 10 1.2.7 Die Fresnel'schen Formeln 13 2 Optische Abbildungen 2.1 2.2 2.3 Abbildungen an Spiegeln 17 2.1.1 Ebene Spiegel 17 2.1.2 Sphärische Spiegel 18 Abbildungen durch Linsen 19 2.2.1 Erzeugung von Bildern durch Brechung 19 2.2.2 Dünne Linsen 20 2.2.3 Dicke Linsen 21 2.2.4 Abbildungsfehler 22 Optische Instrumente 22 2.3.1 Das Auge 22 2.3.2 Die Lupe 23 2.3.3 Das Mikroskop 24 2.3.4 Das Teleskop 25 3 Interferenz und Beugung 3.1 17 Interferenz 27 27 3.2 3.3 3.1.1 Superposition von Wellen 27 3.1.2 Interferenz an dünnen Schichten 28 3.1.3 Kohärenz 30 3.1.4 Interferometer 30 Beugung 3.2.1 Beugung am Einzelspalt 31 3.2.2 Auflösungsvermögen optischer Instrumente 33 3.2.3 Das Theorem von Babinet 34 3.2.4 Beugung am Gitter 34 3.2.5 Beugung am Doppelspalt 35 3.2.6 Abbildungstheorie von Abbé und Auflösungsvermögen beim Mikroskop 36 Holographie 4 Welle/Teilchen-Dualismus 4.1 4.2 30 Der Teilchencharakter des Lichts 37 39 39 4.1.1 Der Photoeffekt und die Bestimmung von h 39 4.1.2 Der Impuls der Photonen 41 4.1.3 Der Compton-Effekt 43 Der Wellencharakter der Materie 45 4.2.1 Elektronen und Materiewellen 45 4.2.2 Die Bedeutung der Wellenfunktion 48 4.2.3 Die Heisenberg'sche Unschärferelation 49 5 Atomphysik 53 5.1 Die Atomistik der Materie 53 5.2 Einfache Atommodelle 55 5.3 5.2.1 Das Rutherford'sche Atommodell 56 5.2.2 Das Bohr'sche Atommodell 57 5.2.3 Die Anwendung der de-Broglie-Wellen auf das Atom 59 Quantentheorie der Atome 5.3.1 Die Schrödinger-Gleichung für das Wasserstoffatom 60 60 5.4 5.5 5.3.2 Der Radialteil und die Hauptquantenzahl n 62 5.3.3 Der Bahndrehimpuls und die Quantenzahlen l und ml 64 5.3.4 Quantenzahlen und Atomorbitale 65 5.3.5 Die vierte Quantenzahl – der Spin 67 Mehrelektronen-Atome 5.4.1 Das Pauli-Prinzip 68 5.4.2 Das Periodensystem der Elemente 69 Röntgenspektren 6.2 72 5.5.1 Röntgenbremsstrahlung 72 5.5.2 Röntgenlinienspektrum 73 6 Strahlungsquellen 6.1 68 Laser 74 74 6.1.1 Stimulierte Emission 74 6.1.2 Funktionsweise eines He-Ne-Lasers 76 Wärmestrahlung 76 6.2.1 Strahlung schwarzer Körper 76 6.2.2 Das Planck'sche Strahlungsgesetz 77 6.2.3 Das Wien’sche Verschiebungsgesetz 80 6.2.4 Das Gesetz von Stefan-Boltzmann 81 7 Kernphysik 82 7.1 Struktur des Atomkerns 82 7.2 Bindungsenergie und Kernkräfte 83 7.3 Radioaktivität 85 7.4 7.3.1 Alpha-Zerfall 85 7.3.2 Beta-Zerfall 86 7.3.3 Gamma-Zerfall 88 7.3.4 Zerfallsgesetz und Halbwertszeit 88 7.3.5 Anwendung: Die Radiokarbon-Methode 90 Kernreaktionen 91 7.5 7.6 7.4.1 Kernspaltung 92 7.4.2 Kernfusion 94 Radiometrie und medizinische Anwendungen 96 7.5.1 Dosimetrie und Strahlentherapie 96 7.5.2 Medizinische Diagnostik: CT, PET und MRT 97 Elementarteilchen und das Standardmodell 97 Teil I: Optik Optik: Ausbreitung des Lichts im Vakuum und in Medien Geometrische Optik Darstellung des Lichtweges durch Geraden Wellenoptik Licht als elektromagnetische Welle Dimensionen sind groß gegenüber der Wellenlänge des Lichts Dimensionen können in die Größenordnung der Wellenlänge des Lichts kommen Hinreichend für Brechung, Reflexion, Abbildungen (einfache empirische Darstellung) Notwendig für Polarisationseffekte, Beugung, Interferenz, Auflösungsvermögen optischer Instrumente Nicht erklärbar: Photoeffekt, Strahlung schwarzer Körper (→ Teilchenbild (Photon), „Welle-Teilchen-Dualismus“) Am Anfang beschäftigen wir uns mit der Frage: Was ist Licht überhaupt, und welche Eigenschaften hat es ? 1. Licht als elektromagnetische Welle Optik im klassischen Sinne beschäftigt sich mit dem sichtbaren Spektrum Sichtbares Spektrum: Wellenlängen: λ = 380 nm bis violett ν = 790 THz bis Frequenzen: λ = 780 nm rot ν = 380 THz Zwischen Wellenlänge und Frequenz besteht der Zusammenhang: c = λ ⋅ν c : Lichtgeschwindigkeit Im Vakuum beträgt die Lichtgeschwindigkeit: c0 = 2,99792458·108 m/s (definiert) Wir wollen uns jetzt ansehen, wie sich Licht im Vakuum ausbreitet. 1.1 Die Wellengleichung für das Vakuum Bei einer elektromagnetischen Welle hat man es mit sich schnell verändernden elektrischen und magnetischen Feldern zu tun. Diese gehorchen den Gesetzen der Elektrodynamik. James Clerk Maxwell (1831-1879) hat empirisch in seinen Maxwell’schen Gleichungen die r r Zusammenhänge zwischen den E - und B -Feldern formuliert. 1 Maxwell’sche Gleichungen: 1. r r r ∂E rot B = µ0 j + µ0ε 0 ∂t „Durchflutungsgesetz“ µ0 = 4π ⋅ 10−7 Vs Vs ≈ 1, 2566 ⋅ 10−6 Am Am „magnetische Feldkonstante“ ε 0 ≈ 8,8542 ⋅ 10−12 As „elektrische Feldkonstante“ Vm Jedes sich zeitlich verändernde elektrische Feld erzeugt ein magnetisches Wirbelfeld. 2. r r ∂B rot E = − ∂t „Induktionsgesetz“ Jedes sich zeitlich verändernde magnetische Feld erzeugt ein elektrisches Wirbelfeld. 3. 4. r ρ div E = „elektrische Quellen“ ( ρ = r div B = 0 „magnetische Quellen“ ε0 Elektrische Ladungen sind Quellen elektrischer Felder. q Ladungsdichte) V Magnetische Felder sind immer Wirbelfelder (geschlossene Feldlinien). Es gibt keine magnetischen Ladungen bzw. Quellen. ⇒ Im Vakuum: keine Ladungen r r ∂E ⇒ rot B = µ0ε 0 ∂t r j = 0, ρ = 0 . r div E = 0 und ↓ nach t differenzieren r r ∂ ∂2 E ⇒ rot B = µ0ε 0 2 ∂t ∂t Rotation des Induktionsgesetz bilden: r r r ∂B ∂ rot rot E = − rot = − rot B ∂t ∂t Das nach t differenzierte Durchflutungsgesetz einsetzen: r r ∂2 E ⇒ − rot rot E = µ0ε 0 2 ∂t rot rot= grad div -div grad 1 424 3 1 424 3 r = 0, da div E = 0 | = ∆: „Laplace-Operator“ 2 r r ∂2 E ∆E = µ0ε 0 2 ∂t ⇒ r Wellengleichung für E analog: r r r ∂ ∂2 B rot rot B = µ0ε 0 rot E = − µ0ε 0 2 ∂t ∂t r r ∂2 B ∆B = µ 0 ε 0 2 ∂t ⇒ Die Ausbreitungsgeschwindigkeit beträgt c = r Wellengleichung für B 1 µ 0ε 0 = c0 . Wellengleichung wird gelöst durch ebene Wellen: rr r r r E (r , t ) = E0 ⋅ ei (ωt − k ⋅r ) rr r r r B (r , t ) = B0 ⋅ ei (ωt − k ⋅r ) ω = 2π ⋅ν r 2π ω k = = λ c Kreisfrequenz Wellenvektor Aus den verbleibenden beiden Maxwell’schen Gleichungen ergibt sich: rr r r r r r r r div E = −i E0 ⋅ k e i (ωt −k ⋅r ) = 0 ⇒ E ⋅ k = 0 ⇒ E ⊥ k rr r r r r r r r div B = −i B0 ⋅ k e i (ωt −k ⋅r ) = 0 ⇒ B ⋅ k = 0 ⇒ B ⊥ k r r Sowohl E als auch B stehen senkrecht zur Ausbreitungsrichtung, d. h. Licht ist eine transversale Welle. Ohne Einschränkung der Allgemeinheit legen wir fest: sowie: r r ∂E rot B = µ0ε 0 ∂t r ∂Bz rot B = x ∂y { ( = µ 0ε 0 ∂By ∂E x ∂E ⇒ = − µ0ε 0 x = −iωµ0ε 0 Ex ∂t ∂z ∂t dz = − iωµ0ε 0 E x dz = −iω 1 µ 0ε 0 E x = c µ 0ε 0 E x = µ 0ε 0 E x = E x −ik z c ) − ∂By r k = (0, 0, k z ) r E = ( E x , 0, 0) . ∂z r r Bz = 0,da B ⊥ k By = ∫ ∂B y ∂z ∫ r r ⇒ E und B stehen senkrecht zueinander und sind in Phase. 3 r Man nennt den Ausbreitungsvektor S = 1 r r E × B den Poynting-Vektor, der ein Maß für die µ0 1 c Intensität des Lichts ist. Da By = Ex ist, hat der Poynting-Vektor nur eine Komponente in z-Richtung: S z = 1 µ0 Ex ⋅ By = 1 µ0 c Ex 2 = c µ0 By 2 . Die Intensität der elektromagnetischen Welle ist also proportional zum Quadrat der Feldstärke. Messung der Lichtgeschwindigkeit: nach Fizeau (1849) (rotierendes Zahnrad): nach Foucault (1851) (mit Drehspiegel): nach Michelson (1879): dto. (1926) heute: c0 = 315 300 km s km s km c0 = (299 910 ± 50) s km c0 = (299 796 ± 4) s km c0 = 299 792, 458 s c0 = (298 000 ± 500) Experiment: Messung der Lichtgeschwindigkeit Messprinzip: Laufzeitmessung des Lichtes für eine bekannte Strecke. Licht einer Leuchtdiode wird moduliert: I 0 = A0 ⋅ sin (ω0t ) . Am Empfänger ist das Signal durch die Laufzeit phasenverschoben: I1 = A0 ⋅ sin (ω0 t + ϕ ) ω Die Modulationsfrequenz beträgt: f 0 = 0 = 50,0 MHz 2π Gemessen wird die Änderung der Phasenverschiebung bei Änderung der optischen Weglänge. Da 50 MHz mit herkömmlichen Oszilloskopen nicht darstellbar sind, wird diese Frequenz mit einer Frequenz von f m = Damit erhält man: ωm = 50,05 MHz gemischt, also multipliziert. 2π I m, 0 = I 0 ⋅ I m = A0 ⋅ sin (2π f 0t ) ⋅ Am ⋅ sin (2π f m t ) I m,1 = I1 ⋅ I m = A0 ⋅ sin (2π f 0t + ϕ ) ⋅ Am ⋅ sin (2π f m t ) . Das Mischsignal Im enthält die Frequenzen f0 + fm und f0 – fm (Schwebung). Die Signale Im,0 und Im,1 mit der Differenzfrequenz werden liegen im 50 kHz-Bereich, was man mit einem Oszilloskop gut darstellen kann. Um nun die Lichtgeschwindigkeit zu messen wird der Lichtweg verlängert um ∆l = 2 ⋅ ∆x . Für eine Phasenverschiebung von 360° = 2π vergeht die Zeit einer Periodendauer, also 1 1 . Somit vergeht für eine Phasenverschiebung von 180° = π eine Zeit von: ∆t = . f0 2 f0 ∆l Die Geschwindigkeit des Lichtes ist also c0 = = 4 f 0 ⋅ ∆x . ∆t T= 4 1.2 Die Ausbreitung des Lichts 1.2.1 Huygens’sches und Fermat’sches Prinzip Schon lange vor Maxwell wurde über die Ausbreitung des Lichts nachgedacht. Christiaan Huygens (1629-1695): Kugelförmige Elementarwellen ausgehend von einer Punktquelle, Wellenfront: geometrischer Ort aller Punkte mit gleicher Phase Huygens’sches Prinzip: Pierre de Fermat (1608-1665): Jeder Punkt einer Wellenfront ist Ausgangspunkt einer neuen kugelförmigen Elementarwelle, die sich mit derselben Geschwindigkeit und Frequenz ausbreitet wie die ursprüngliche Wellenfront im betreffenden Medium. Die Einhüllende aller Elementarwellen ergibt die Wellenfront zu einem späteren Zeitpunkt. Variationsprinzip Fermat’sches Prinzip: Der Weg, den das Licht von einem Punkt zum anderen nimmt, ist stets derjenige, bei dem die dafür benötigte Zeitspanne minimal ist. Sowohl mit dem Huygens’schen als auch mit dem Fermat’schen Prinzip lassen sich ganz elementare Gesetzmäßigkeiten herleiten, die im Folgenden besprochen werden sollen. 1.2.2 Das Reflexionsgesetz Was passiert, wenn eine ebene Wellenfront auf einen Spiegel trifft. Nach dem Huygens’schen Prinzip: - - - - Winkel φ1 zwischen Spiegel und Wellenfront ist gleich der Einfallswinkel θ1. Jeder Punkt der Wellenfront ist Ausgangspunkt einer Elementarwelle. AA': ursprüngliche Wellenfront Position der Wellenfront nach der Zeit t durch Konstruktion einer Elementarwelle mit Radius c ⋅ t und Mittelpunkt auf AA'. BB' wird durch Elementarwellen gebildet, die den Spiegel noch nicht erreicht haben. BB'' wird durch Elementarwellen gebildet, die vom Spiegel reflektiert wurden. Elementarwelle von P erreicht B nach der Zeit t, ebenso die Elementarwelle von A den Punkt B'. Elementarwellen bilden neue (reflektierte) Wellenfront B''B Dreiecke ABP und ABB'' sind rechtwinklig, haben AB gemeinsam und gleich lange Seiten AB'' = BP = c·t. → ABP und ABB'' sind kongruent, also φ1 = φ1 ' und damit θ1 = θ1 ' (Schenkel stehen paarweise zueinander senkrecht). Reflexionsgesetz: Einfallswinkel = Ausfallswinkel 5 Nach dem Fermat'schen Prinzip: - - - 1.2.3 Strahl muss den Punkt B in möglichst kurzer Zeit erreichen. Medium ist dasselbe, deshalb ist Laufzeit minimal, wenn durchlaufene Strecke minimal ist. Verschiebung von P nach rechts → Weg ist minimal, wenn A', P und B auf einer Geraden liegen. Dann θ1 = θ1 ' . Lichtbrechung Im Vakuum breitet sich Licht mit der Vakuum-Lichtgeschwindigkeit c0 aus. In einem Medium ist die Lichtgeschwindigkeit cMed von c0 verschieden (in der Regel kleiner). Das Verhältnis beider Lichtgeschwindigkeiten nennt man Brechungsindex n: n= c0 cMed nWasser = 1,33 nGlas = 1,50 ... 1,66 je nach Glassorte nDiamant = 2,4 nLuft = 1,0003 ≈ 1 Anm.: c ist eine Phasengeschwindigkeit ( c = ω k ), die in bestimmten Materialien bei bestimm- ten Frequenzen auch größer als c0 sein kann. Informationen kann man jedoch nur mit ∂ω der Gruppengeschwindigkeit vGr = transportieren, und die ist immer < c0. ∂k Brechung des Lichts nach dem Huygens'schen Prinzip: - Ebene Welle trifft auf Grenzfläche Luft-Glas. AP: Wellenfront in Luft, tritt ins Glas ein unter dem Winkel φ1 . Elementarwelle von P aus legt in der Zeit t die Strecke cMed 1 ⋅ t zurück und erreicht B. - In derselben Zeit legt die Elementarwelle von A aus die kürzere Strecke cMed 2 ⋅ t zurück - und erreicht B'. B'B ist nicht parallel zu AP, weil cMed 1 ≠ cMed 2 . - Im Dreieck ABP gilt: sin φ1 = - Im Dreieck ABB' gilt: sin φ2 = - ⇒ cMed 1 ⋅ t ⇒ sin θ1 = cMed 1 ⋅ t AB cMed 2 ⋅ t cMed 2 ⋅ t sin θ 2 AB , ⇔ AB = cMed 1 ⋅ t ⇔ AB = sin φ1 cMed 2 ⋅ t n1 = n1 ⋅ sin θ1 = n2 ⋅ sin θ 2 = sin φ2 c0 cMed 1 , cMed 1 ⋅ t sin θ1 = , weil φ1 = θ1 . cMed 2 ⋅ t sin θ 2 n2 = , weil φ2 = θ 2 . c0 cMed 2 Snellius'sches Brechungsgesetz 6 Brechung des Lichts nach dem Fermat'schen Prinzip: - Kompromiss zwischen langer, aber schneller Strecke in Luft und kurzer, aber langsamer Strecke im Medium. Ermitteln der geringsten Gesamtlaufzeit (Extremalaufgabe!) - Gesamtzeit, um von A nach B zu kommen: t = - t durch den Abstand x ausdrücken: l12 = a 2 + x 2 und l22 = b 2 + (d − x) 2 . - Minimierung von t: - l1 = a 2 + x 2 , - l2 = b 2 + (d − x) 2 , dl2 −2d + 2 x d−x = =− = − sin θ 2 . dx 2 b 2 + (d − x)2 l2 - Ableitung 0 setzen: dt 1 = ( n1 ⋅ sin θ1 − n2 ⋅ sin θ 2 ) dx c0 - cMed 1 + l2 cMed 2 = l1 l n ⋅l n ⋅l + 2 = 1 1+ 2 2. c0 c0 c0 c0 n1 n2 dl dt ! dt 1 dl1 =0 ⇒ = n1 + n2 2 dx dx c0 dx dx dl1 2x 2x x = = = = sin θ1 . 2 2 dx 2 a + x 2l1 l1 ⇒ 1.2.4 l1 n1 ⋅ sin θ1 = n2 ⋅ sin θ 2 Die Totalreflexion Ein Lichtstrahl verläuft aus im Glas schrägt zur Oberfläche. Der Strahl wird vom Lot weg gebrochen. Zunahme des Brechungswinkels mit wachsendem Einfallswinkel, bis der Brechungswinkel 90° beträgt. → Dieser Einfallswinkel ist θK. Ist der Einfallswinkel > θK, dann tritt Totalreflexion auf. Der kritische Winkel θK ist abhängig von den Brechungsindizes der beiden Medien. n1 ⋅ sin θ K = n2 ⋅ sin 90° ⇔ sin θ K = n2 n1 Grenzwinkel zur Totalreflexion Totalreflexion tritt nur dann auf, wenn das Licht vom optisch dichten ins optisch dünne Medium übertritt. Experiment: Totalreflexion 1.2.5 Ausbreitung des Lichts in Materie 1. Dispersion: r Bisher nur Wellenausbreitung im Vakuum ( j = 0, ρ = 0 ). r In Materie: E -Feld verursacht Ausbildung von Dipolen → Dielektrizitätskonstante ε. r B -Feld verursacht eine magnetische Polarisation → Permeabilität µ. 7 ⇒ In den Maxwell'schen Gleichungen ist µ 0ε0 durch µµ 0εε0 zu ersetzen. ⇒ Neue Phasengeschwindigkeit im Medium: cMed = 1 µµ0εε 0 = c0 µε = c0 n Da ε und µ im allgemeinen frequenz- bzw. wellenlängenabhängig sind, ist auch der Brechungsindex n frequenz- bzw. wellenlängenabhängig → Dispersion. Anm.: Für optische Frequenzen ist µ ≈ 1 , kann also hier in der Regel vernachlässigt werden. Experiment: Dispersion am Prisma. 2. Absorption Medien, die eine endliche Leitfähigkeit σ besitzen, führen zu einer neuen Erscheinung, der Absorption. r r Im Durchflutungsgesetz ist jetzt j = σ E ≠ 0. r r r ∂E ⇒ rot B = µµ0 σ E + εε 0 . ∂t Bei transversalen Wellen treten jedoch keine Ladungsanhäufungen auf, weshalb immer r noch gilt: ρ = 0 ⇒ div E = 0. r r ∂B Weiterhin gilt noch das Induktionsgesetz: rot E = − . ∂t Jetzt wie im Kap. 1.1 die Herleitung der Wellengleichung, diesmal in Materie: r r r ∂E rot B = µµ0 σ E + εε 0 ∂t r r r ∂E ∂B ∂2 E Nach t differenzieren: rot = µµ0 σ + εε 0 2 ∂t ∂t ∂t r r r r r ∂E ∂B ∂2 E Einsetzen rot E = − : − rot rot 1 4 24 3 E = µµ0 σ ∂t + εε 0 2 ∂t ∂t ∆ r r 2 r ∂E ∂ E ⇒ ∆E = µµ0 σ + µµ0εε 0 2 { 123 ∂t ∂t 1 = ⇒ 2 cMed 2 cMed εε 0 = 1 2 cMed r r r ∂ 2 E σ ∂E ⋅ ∆E = 2 + εε 0 ∂t ∂t Wellengleichung in Materie r Lösung sind bekanntlich ebene Wellen: E ~ eiωt r r r ∂E i ∂2 E = iω E = − ∂t ω ∂t 2 ⇒ 2r r 2 ∂ E = −ω 2 Er ⇔ Er = − 1 ∂ E ∂t 2 ω 2 ∂t 2 8 r r i σ ∂2 E ⇒ ⋅ ∆E = 1 − 2 ω εε 0 ∂t r r c02 ∂2 E ⇒ = ∆E 2 ∂t i σ µε 1 − ω εε 0 2 = cMed 2 cMed σ ⇒ n% 2 = µε 1 − i ωεε 0 µε 2 =: ( n − ik ) n% = n − ik Also c02 komplexer Brechungsindex (k : Absorptionsindex, r nicht verwechseln mit k : Wellenvektor!) Bei optischen Frequenzen ist µ = 1. ⇒ n% 2 = ε − i σ =: ε1 − iε 2 = ε% ωε 0 ε% = ε1 − iε 2 Also Koeffizientenvergleich liefert: komplexe Dielektrizitätskonstante ε1 = n 2 − k 2 ε 2 = 2nk und Mit dem komplexen Brechungsindex lautet nun die ebene Welle: ω ω r r i (ωt − n% c x ) r i (ωt −( n −ik ) c x ) 0 0 E ( x, t ) = E0 ⋅ e = E0 ⋅ e ω ω −k x i (ω t − n x ) r r c0 c0 ⇒ E ( x, t ) = E0 ⋅ e1424 3 ⋅ e{ periodischer Term Dämpfung Intensität einer elektromagnetischen Welle ist proportional zum Amplitudenquadrat: ω −2 k x r I ~ E 2 ~ e c0 . Lambert-Beer'sches Gesetz: I = I 0 ⋅ e − K ⋅d → mit der Absorptionskonstante K = 2k ω = 4π k . [ K ] = m −1 . λ Den Kehrwert von K bezeichnet man als Eindringtiefe. c0 Beispiele: - - 1 λ ≈ 100 m . Bei λ = 600 nm ist k = K = 4,8 ⋅ 10−10 . K 4π 1 Glas für Glasfasern: ≈ 10 000 m → k = 4,8 ⋅ 10 −12 K Wasser: 9 - Metalle: hohe Leitfähigkeiten oft bis ins Sichtbare → starke Absorption 1 λ z. B. = 21 nm bei λ = 1300 nm in Kupfer → k = K ≈5. K 4π Wegen c 1 = 0 nimmt die Eindringtiefe mit wachsender K 2ω k Frequenz stetig ab → "Skineffekt" bei Hochfrequenzströmen Im komplexen Brechungsindex n% = n − ik bezeichnet man n als dispersive Größe und k als absorptive Größe. Ebenso ist in der komplexen Dielektrizitätskonstante ε1 die dispersive und ε2 die absorptive Größe. 1.2.6 Polarisation In vielen Lichtquellen wird die elektromagnetische Welle durch schwingende Elektronen erzeugt → Dipolstrahlung. In Glühlampen beispielsweise schwingen diese Elektronen aber r völlig regellos durcheinander, so dass der E -Feldvektor in verschiedenen Wellenzügen solch einer Lampe völlig regellos variiert. Sind die Feldvektoren in allen Wellenzügen jedoch in einer Richtung orientiert, so ist das Licht polarisiert. Polarisation ist ein Kennzeichen von transversalen Wellen. Longitudinale Wellen (z.B. Schall) kann man nicht polarisieren. r Die Achse, entlang der E schwingt, nennt man Polarisationsachse. r r Die Ebene, die von E und k aufgespannt wird, nennt man Polarisationsebene; das Licht in diesem Beispiel ist linear polarisiert. Lässt man linear polarisiertes Licht auf einen weiteren linearen Polarisator fallen, so lässt r dieser nur die Projektion des E -Feldes auf seine Durchlassrichtung durch. Betrachtet man die r durchgelassene Intensität, so gilt wegen I ~ E 2 : I = I 0 ⋅ cos 2 φ . Gesetz von Malus φ : Winkel zwischen ursprünglicher Polarisationsachse und Durchlassrichtung des zweiten Polarisators. Herstellung von linear polarisiertem Licht: a) Polarisation durch Absorption: Beispiel: Polarisationsfolie Kunststofffolie aus langkettigen Kohlenwasserstoff-Molekülen Dehnung der Folie in eine Richtung während der Herstellung → dadurch parallele Ausrichtung der Molekül-Ketten An die Ketten werden leitfähige Iod-Verbindungen angelagert 10 r Fall 1: E ist parallel zu den leitfähigen Ketten: Ströme werden entlang der Ketten induziert, die die Lichtenergie absorbieren → keine Intensität hinter dem Polarisator r Fall 2: E ist senkrecht zu den leitfähigen Ketten: Es können keine Ströme entlang der Ketten induziert und damit keine Energie absorbiert werden → Durchlassrichtung; Intensität hinter dem Polarisator D. h. die Absorption ist eine Funktion der Polarisationsrichtung → Dichroismus b) Polarisation durch Reflexion Unpolarisiertes Licht trifft auf die Grenzfläche zu einem nicht-absorbierenden Medium. → Licht wird zu einem Großteil in das Medium hinein gebrochen. Ein kleiner Anteil wird jedoch reflektiert. Tritt das Licht unter dem sog. Brewster-Winkel in das Medium ein, so stehen der gebrochene und der reflektierte Lichtstrahl senkrecht aufeinander. In diesem Fall ist das reflektierte Licht vollständig polarisiert. n1 ⋅ sin α B = n2 ⋅ sin θ 2 . Hierbei soll α B der Einfallswinkel (= Brewster-Winkel) sein, und θ 2 der Brechungswinkel. Da Einfallswinkel = Reflexionswinkel = α B , gilt: Damit: θ 2 = 90° − α B . n1 ⋅ sin α B = n2 ⋅ sin ( 90° − α B ) = n2 ⋅ cos α B ⇒ tan α B = n2 n1 Brewster-Winkel Das gebrochene Licht ist nur teilweise polarisiert. r Grund für die Polarisation: Gebundene Elektronen im Medium werden durch das E Feld zum Schwingen angeregt → Hertz'scher Dipol. Die Abstrahlcharakteristik sorgt dafür, dass nur senkrecht zur Bewegung des Elektrons eine elektromagnetische Welle ausgesandt wird (transversale Welle!). Anm.: Sonnenbrillen haben häufig einen Polarisationsfilter, damit Licht, das z.B. an Wasseroberflächen reflektiert wird, gefiltert werden. 11 c) Polarisation durch Doppelbrechung Doppelbrechung beobachtet man an optisch anisotropen Kristallen, also an kristallinen Stoffen, deren Kristallstruktur nicht kubisch ist. Glas ist amorph und deshalb optisch isotrop, d. h. das Licht breitet sich in alle Richtungen gleich schnell aus → isotroper Brechungsindex Nicht-kubische Kristalle sind optisch anisotrop. In ihnen hängt die Ausbreitungsgeschwindigkeit von der Ausbreitungs- und auch von der Polarisationsrichtung ab. → Aufspaltung in ordentlichen und außerordentlichen Strahl. Richtung, in der ord. und außerord. Strahl dieselbe Geschwindigkeit haben, nennt man optische Achse. Bsp.: Kalkspat (CaCO3). Eine Anwendung findet man in der sog. Spannungsdoppelbrechung. Es gibt neben der linearen Polarisation noch andere Arten, nämlich die zirkulare und die elliptische Polarisation. r Zur Erklärung zerlegt man den E -Feldvektor in zwei aufeinander senkrecht stehende r r Komponenten E x und E y . Nun kann man drei Fälle unterscheiden: r r r r Fall 1: Ex und E y sind in Phase: linear polarisiertes Licht r r Fall 2: Ex und E y haben eine Phasenverschiebung von 90° und E x = E y : zirkular polarisiertes Licht r r Fall 3: E x und E y haben eine beliebige Phasenverschiebung und beliebige Beträge: elliptisch polarisiertes Licht Herstellung von zirkular (oder elliptisch) polarisiertem Licht: λ/4-Plättchen. Dicke des Plättchens: n⊥ ⋅ d − n|| ⋅ d = λ 4 ⇔ d= λ 4(n⊥ − n|| ) . Phasenverschiebung ist wellenlängenabhängig. Anwendung von zirkular polarisiertem Licht: 3D-Brillen im Kino. 12 1.2.7 Die Fresnel'schen Formeln Bis jetzt haben wir mehr oder weniger empirisch Sonderfälle für die Brechung, Reflexion und Polarisation besprochen. Mit dem jetzigen Rüstzeug können wir endlich allgemeine Aussagen zum Verhalten von elektromagnetischen Wellen an Grenzflächen machen. Licht trifft innerhalb der x-y-Ebene (Einfallsebene) im Winkel α auf eine Grenzfläche. Ein Teil wird im Winkel α' reflektiert, ein anderer Teil unter dem Winkel β gebrochen. r Eine beliebige Polarisation lässt sich in einen E -Feld-Vektor in der x-y-Ebene und einen Vektor senkrecht dazu (in z-Richtung) zerlegen. Hier soll ausführlich der Fall "senkrecht" (in z-Richtung) behandelt werden. Der andere geht analog dazu. Es fallen ebene Wellen ein. Die Zeitabhängigkeit, die überall gleich ist, lassen wir gleich weg. E z ,e = E0,e ⋅ e − ik1 ( x sin α − y cosα ) E z ,b = E0,b ⋅ e −ik2 ( x sin β − y cos β ) E z ,r = E0,r ⋅ e − ik1 ( x sin α '+ y cosα ') Bei y = 0 muss der Übergang der elektrischen Felder stetig sein: E ,e + E z , r = 1z4 243 positive Halbebene ⇒ E0,e ⋅ e − ik1 ⋅ x sin α + E0,r ⋅ e − ik1 ⋅ x sin α ' = E0,b ⋅ e − ik2 ⋅ x sin β E z ,b { . negative Halbebene (y = 0) Wegen der gemeinsamen x-Abhängigkeit ist die Gleichung nur zu erfüllen, wenn der Exponentialterm in allen Teilwellen gleich ist. Daraus folgt sofort das Reflexionsgesetz: α =α ' und das Brechungsgesetz: k1 ⋅ sin α = k2 ⋅ sin β . ω Mit ki = n%i folgt daraus bekanntermaßen: c0 n%1 ⋅ sin α = n%2 ⋅ sin β Snellius'sches Brechungsgesetz. Für die Amplituden muss gelten: E0,e + E0,r = E0,b . Man kennt natürlich zunächst nur E0,e , d.h. man hat eine Gleichung mit zwei Unbekannten. Es muss also noch eine weitere Bestimmungsgleichung gefunden werden. Die erhält man aus r r dem B -Feld. Dabei ist zu beachten, dass die Richtung von B aus der Bedingung: r r r 1 r r S= E × B (wenn man E rechtsherum in Richtung von B dreht, dann muss der Poynting- µµ0 r Vektor S herauskommen): 13 n%1 cos α ⋅ E0,e ⋅ e − ik1 ( x sin α − y cosα ) c0 n% = − 2 cos β ⋅ E0,b ⋅ e −ik2 ( x sin β − y cos β ) c0 n% = + 1 cos α '⋅ E0,r ⋅ e −ik1 ( x sin α '+ y cosα ') c0 Bx , e = − Bx , b Bx , r Wieder muss das Feld stetig am Übergang y = 0 sein, und man erhält nach Multiplikation mit c0: − n%1 cos α ⋅ E0,e ⋅ e − ik1 ⋅ x sin α + n%1 cos α '⋅ E0, r ⋅ e − ik1 ⋅ x sin α ' = −n%2 cos β ⋅ E0,b ⋅ e− ik2 ⋅ x sin β Aus der Gleichheit der Exponenten folgen wieder Reflexions- und Brechungsgesetz. Für die Amplituden gilt: n%1 cos α ( E0,r − E0,e ) = −n%2 cos β ⋅ E0,b ⇒ E0,r − E0,e = − n%2 cos β E0,b n%1 cos α . Außerdem gilt ja noch: E0,e + E0,r = E0,b . Die Addition und Subtraktion der Amplitudengleichungen liefert: n% cos β sin α cos β 2 E0,r = 1 − 2 E0,b = 1 − n%1 cos α sin β cos α E0,b n% cos β sin α cos β 2 E0,e = 1 + 2 E0,b = 1 + n%1 cos α sin β cos α E0,b Mit Hilfe der Additionstheoreme bekommt man nun den ersten Satz der Fresnel'schen Gleichungen: E0,r = E0,e sin ( β − α ) sin ( β + α ) E0,b = 2 E0,e r für E⊥ . sin β cos α sin ( β + α ) r r Ganz analog geht man in dem Fall vor, in dem E parallel und B senkrecht zur Einfallsebene liegt. Man erhält so den zweiten Satz Fresnel'scher Gleichungen: E0,r = E0,e tan (α − β ) tan (α + β ) E0,b = 2 E0,e cos α sin β sin (α + β ) cos (α − β ) r für E|| . Viel wichtiger als die Fresnel'schen Gleichungen selbst, sind die Beziehungen, die man daraus ableiten kann. 14 Zunächst definieren wir den Reflexionskoeffizienten: ρ⊥ = E0,r ρ|| = E0,r E0,e E0,e r für E⊥ r für E|| . Analog wird der Transmissionskoeffizient definiert: τ⊥ = E0,b τ || = E0,b E0,e E0,e r für E⊥ r für E|| . Wir betrachten zunächst kleine Einfallswinkel, die also nahe an der senkrechten Inzidenz α n%2 liegen, d. h. α ≈ 0 und damit sin α ≈ α . Dann gilt nach Snellius: = =: n% (relativer β n%1 Brechungsindex). Mit den Fresnel'schen Formeln gilt dann: α 1− sin ( β − α ) β − α n% − 1 β ρ ⊥ (α ≈ 0) = ≈ = =− sin ( β + α ) β + α 1 + α n% + 1 β α −1 tan (α − β ) α − β β n% − 1 ρ|| (α ≈ 0) = ≈ = = tan (α + β ) α + β α + 1 n% + 1 β Zu bemerken ist jedoch, dass im Grenzfall senkrechter Inzidenz (α = 0) die senkrechte und die r parallele Polarisation des E -Feldvektors nicht zu unterscheiden ist. Das negative Vorzeichen bei ρ ⊥ bedeutet, dass das Licht bei der Reflexion am optisch dichten Medium einen r Phasensprung von 180° macht, da E⊥ bei auf der einfallenden und reflektierten Seite in r dieselbe Richtung zeigen. E|| hingegen zeigt nach der Reflexion am dichten Medium immer in die Gegenrichtung, so dass ein positives Vorzeichen von ρ|| ebenfalls einen Phasensprung r von E|| um 180° bedeutet. → Am optischen dichten Medium (nahe der senkrechten Inzidenz) findet die Reflexion r immer mit einem Phasensprung des E -Feldvektors um 180° statt. r Das Reflexionsvermögen bezeichnet das Verhältnis der Intensitäten und ist wegen I ~ E 2 gleich dem Quadrat des Reflexionskoeffizienten und deshalb (nur für senkrechte Inzidenz!) für beide Polarisationsrichtungen identisch: R (α ≈ 0 ) = 2 2 I r E0,r n% − 1 = 2 = ρ ⊥2 = ρ||2 = I e E0,e n% + 1 r r für E⊥ und E|| 15 Beispiel Glas: Glas hat im Sichtbaren einen Brechungsindex von ca. 1,5. Die Absorption ist klein und kann hier vernachlässigt werden. 2 2 1,5 − 1 0,5 Damit wird bei senkrechter Inzidenz R = = = 0,04 = 4% . 1,5 + 1 2,5 Geht man von senkrechter Inzidenz weg, dann werden ρ ⊥ und ρ|| natürlich vom Einfallswinkel α abhängig, und ρ|| wechselt das Vorzeichen beim Brewster-Winkel. Bisher haben wir immer so getan, als kämen wir vom optisch dünnen ins optisch dichte Medium. Für Brechung in umgekehrter Richtung gelten im Prinzip genau dieselben Bedingungen, jedoch ist wegen n1 < n2 ist sin α < sin β, also α < β. Daher ist n% < 1 , so dass n% − 1 >0 n% + 1 n% − 1 ρ|| (α ≈ 0) = <0 n% + 1 ρ ⊥ (α ≈ 0) = − bei der Reflexion am optisch dünnen Medium. r Diesmal ist ρ ⊥ positiv, d. h. es findet bei der Reflexion kein Phasensprung von E⊥ statt. Da r E|| hingegen nach der Reflexion wieder in die Gegenrichtung zeigt, ρ|| allerdings auch negar tiv ist, gibt es bei E|| während der Reflexion am dünnen Medium auch keinen Phasensprung. → Am optischen dünnen Medium (nahe der senkrechten Inzidenz) findet die Reflexion r ohne Phasensprung des E -Feldvektors statt. Solange wir für β nur reelle Winkel zulassen, kann β nicht größer als 90° werden, d. h. sin α K = n%2 sin 90° = n%1 n%2 = n% . n%1 Bei Glas liegt αK bei ca. 41,8°. Bei der Totalreflexion tritt kein Licht in das dünnere Medium ein, was aber inkompatibel mit den Stetigkeitsbedingungen ist, denn hierbei braucht man auf beiden Seiten der Grenzfläche Feldstärken. Man kann dieses Problem durch die Einführung eines komplexen Winkels β% = β '+ i ⋅ β '' = 90° + i ⋅ β '' lösen. Dann nämlich gilt: sin β% = sin ( 90° + i ⋅ β '') = cosh β '' cos β% = − sin ( i ⋅ β '') = −i ⋅ sinh β '' Damit ist die gebrochene Welle im dünnen Medium für senkrechte Polarisation: k2 y sinh β '' − ik2 x cosh β '' E z ,b = E0,b ⋅ e1 424 3 ⋅ e14243 . Dämpfung ( y < 0) periodisch Dieses ist eine sog. quergedämpfte Welle, die sich längs der Grenzfläche (in x-Richtung) periodisch ausbreitet, in –y-Richtung jedoch gedämpft ist (Oberflächenwelle). Wieder gibt es einen Vorzeichenwechsel von ρ|| beim Brewster-Winkel. 16 2. Optische Abbildungen Nachdem wir die Eigenschaften des Lichts jetzt im Wesentlichen kennen gelernt haben, werden wir im Folgenden uns mit der sog. geometrischen Optik beschäftigen, die mit geradlinigen Lichtstrahlen, die senkrecht zu den Wellenfronten stehen, arbeitet. Dabei ist entscheidend, dass die Lichtwellenlänge kleiner ist als die Dimensionen der Hindernisse bzw. Öffnungen. 2.1 Abbildungen an Spiegeln 2.1.1 Ebene Spiegel Wir kennen alle Spiegelbilder, und wissen, dass die Hände zum Beispiel spiegelbildlich sind, d. h. an der einen Hand ist der Daumen auf der linken, an der anderen auf der rechten Seite. Wenn wir eine Hand in einem Spiegel spiegeln, so ist das Spiegelbild identisch mit der anderen Hand. Daher hat man den Eindruck, dass ein Spiegel eben links und rechts vertauscht. Schaut man es sich einmal genauer an, dann stellt man fest, dass ein Spiegel in Wirklichkeit links und rechts beibehält, ebenso oben und unten. Tatsächlich vertauscht ein Spiegel vorn und hinten. Konstruktion eines Punktes bei Abbildung am ebenen Spiegel: Vom Punkt P geht ein Lichtstrahlenbündel aus und wird am Spiegel reflektiert. Nach der Reflexion gehen die Strahlen so auseinander, als würden sie von einem Punkt P' hinter dem Spiegel ausgesandt werden. P' nennt man das Bild des Gegenstandes P. Das Auge (besser: Gehirn) kann nicht unterscheiden, ob die Lichtstrahlen von P oder von P' ausgehen. Da von P' nicht wirklich Lichtstrahlen ausgehen, nennt man P' ein virtuelles Bild. - - - Größen- und Längenverhältnisse bei der Reflexion am ebenen Spiegel: - Bildgröße B ist gleich der Gegenstandsgröße G Bild steht aufrecht Bildweite b ist gleich der Gegenstandsweite g Mehrfachabbildungen entstehen, wenn mehrere Spiegel gegeneinander geneigt sind. - - - Von der Punktquelle P werden Lichtstrahlen an Spiegel 1 reflektiert. Virtuelles Bild ist hierzu P1'. Ebenso werden Lichtstrahlen am Spiegel 2 reflektiert mit virtuellem Bild P2'. Nun kann es auch Mehrfachreflexionen geben, bei denen das virtuelle Bild P1' zum Gegenstand bei der zweiten Reflexion wird. Es entsteht ein weiteres virtuelles Bild P1,2''. Anzahl der Mehrfachbilder hängt vom Winkel der Spiegel und der Position des Beobachters ab. 17 2.1.2 Sphärische Spiegel Von einem Punkt P geht ein Strahlenbündel aus parallel zur optischen Achse A auf einen kugelförmigen (=sphärischen Spiegel). Die Strahlen treffen sich nach der Reflexion in einem Brennpunkt P’ und breiten sich von dort aus weiter aus, als würden sie von dem Punkt P’ ausgehen. Der Punkt P’ ist demnach ein reelles Bild. Fügt man zu diesen achsennahen Strahlen noch weiter außenliegende dazu, dann sieht man, dass die Strahlen desto weiter vom Punkt P’ abweichen, je weiter sie von der Achse A entfernt sind. Sie machen das Bild unscharf. Diesen Abbildungsfehler nennt man sphärische Aberration. Man kann sie beheben, indem man die Randstrahlen durch Blenden ausblendet. Konstruktion des Bildpunktes: − Ein Strahl läuft durch den Krümmungsmittelpunkt M des Spiegels − Ein Strahl läuft einen beliebigen Weg und wird nach dem Reflexionsgesetz reflektiert. − Der Schnittpunkt der beiden Strahlen bildet den Bildpunkt P’. − β ist Außenwinkel im Dreieck PMA, deshalb ist β = α + θ. − Im Dreieck PP’A ist γ = α + 2θ . − Einsetzen von θ liefert: α + γ = 2β. d d d − Annahme: Achsennahe Strahlen: α ≈ , β ≈ und γ ≈ . g r b − Damit erhält man einen Zusammenhang zwischen Gegenstandsweite, Bildweite und 1 1 2 Krümmungsradius: + = . g b r − d und damit A ist in der Gleichung nicht mehr enthalten, so dass die Gleichung für beliebige achsennahe Punkte A gilt. Größenverhältnisse: − Reflexion am Scheitelpunkt (A war ja beliebig). − Es entstehen zwei ähnliche Dreiecke wegen Reflexionsgesetz. B b − Damit gilt: = − = Vlateral . (Minuszeichen, weil Bild auf dem Kopf steht). G g Ist g >> r, dann fallen die Strahlen parallel auf den sphärischen Spiegel. In diesem Fall gilt: 1 2 r << , weswegen der Term vernachlässigt werden kann. Für g → ∞ gilt also: b = . g r 2 Dieser Abstand wird Brennweite f des Spiegels genannt. Die Ebene, in der parallel einlaufende Strahlen fokussiert werden, heißt Brennebene. Der Schnittpunkt mit der optischen Achse heißt Brennpunkt F. r Die Brennweite ist also gegeben durch: f = 2 Damit ergibt sich die Abbildungsgleichung für sphärische Spiegel: 1 1 1 + = g b f 18 Konstruktion des Bildes am sphärischen Spiegel: Man verwendet besonders ausgezeichnete Strahlen, die sog. Hauptstrahlen: − Der achsenparallele Strahl wird in den Brennpunkt reflektiert. − Der Brennpunktstrahl wird achsenparallel reflektiert. − Der Mittelpunktstrahl wird in sich selber reflektiert. 2.2 Abbildungen durch Linsen 2.2.1 Erzeugung von Bildern durch Brechung Konvexe, sphärische Oberfläche am Ende eines langen, durchsichtigen Zylinders. Gesucht: Zusammenhang zwischen Gegenstandsweite g, Bildweite b und Krümmungsradius r. Näherung: Kleine Einfallswinkel, so dass sin θ1 ≈ θ1 und sin θ 2 ≈ θ 2 . Snellius’sches Brechungsgesetz: n1 ⋅ sin θ1 = n2 ⋅ sin θ 2 ⇔ Im Dreieck AMP’ gilt für den Außenwinkel β = θ 2 + γ = n1θ1 = n2θ 2 . n1 θ1 + γ . n2 Im Dreieck PMA ist θ 1 = α + β . Einsetzen liefert: n1α + n1 β + n2γ = n2 β ⇔ n1α + n2γ = (n2 − n1 )β . Näherung kleiner Winkel: α ≈ ⇒ d d d , β = ,γ = . g r b n1 n2 n2 − n1 + = . g b r Zur Ermittlung der Vergrößerung: G −B ≈ θ1 , tan θ 2 = ≈ θ2 g b B wird hier wieder negativ angesetzt, weil das Bild auf dem Kopf steht. tan θ1 = Snellius’sches Brechungsgesetz: n1θ1 = n2θ 2 G −B = n2 g b nb B ⇒ V = =− 1 G n2 g ⇒ n1 19 2.2.2 Dünne Linsen Eine sehr wichtige Anwendung ist die Abbildung durch dünne Linsen. Auch hier sollen die Zusammenhänge der relevanten Abstände und Größenverhältnisse erläutert werden. Wir betrachten eine dünne Linse mit Brechungsindex n die auf beiden Seiten von Luft umgeben ist. Die Linse hat vom Gegenstand den Abstand g (und damit auch die Oberfläche, weil die Linse dünn ist). Der Krümmungsradius der ersten Oberfläche ist r1 , der der zweiten Oberfläche r2 . Mit dem obigen Ausdruck erhält man an der ersten sphärischen Oberfläche: nLuft n n − nLuft , und man bekommt ein virtuelles Bild P1 ' . + = g b1 r1 Das Licht wird nun an der zweiten Oberfläche erneut gebrochen. Die Lichtstrahlen verlaufen nun aber so, als würden sie von dem virtuellen Bild P1 ' ausgehen. Es dient quasi als virtueller Gegenstand für die Brechung an der zweiten Oberfläche. Gegenstandsweiten auf der Einfallsseite sind positiv, Bildweiten auf der Gegenstandsseite (also auf der "falschen" Seite) sind negativ. Deshalb ist g1 = −b1 . Es ergibt sich für das Endbild: n n −n n . + Luft = Luft −b1 b r2 Addition der beiden Ausdrücke liefert: 1 1 1 1 n + = − 1 − g b nLuft r1 r2 . In dieser Gleichung werden Gegenstands- und Bildweite mit den beiden Krümmungsradien verknüpft. Genau wie bei den sphärischen Spiegeln kann man eine Brennweite f definieren, wenn man parallele Lichtstrahlen von einem unendlich weit entfernten Gegenstand einstrahlt: g → ∞ : b = f , womit einfach gilt: 1 1 1 n = − 1 − . f nLuft r1 r2 Genauso gibt es eine Brennebene, in der alle parallel einfallenden Strahlen fokussiert werden und einen Brennpunkt F als Schnittpunkt der Brennebene mit der optischen Achse. Eingesetzt in die obige Gleichung ergibt sich die Abbildungsgleichung für dünne Linsen oder auch Linsengleichung: 1 1 1 + = g b f Sie gleicht formal der Abbildungsgleichung für sphärische Spiegel. Zu beachten ist aber die Vorzeichenkonvention: Bei Linsen ... ist die Bildweite b positiv, wenn das Bild auf der Transmissionsseite liegt. ... ist der Krümmungsradius r positiv, wenn der Krümmungsmittelpunkt auf der Transmissionsseite liegt. 20 Bei Spiegeln ... ist die Bildweite b positiv, wenn das Bild auf der Reflexionsseite liegt. ... ist der Krümmungsradius r positiv, wenn der Krümmungsmittelpunkt auf der Reflexionsseite liegt. Achtung! Bei bikonvexen Linsen ist der Mittelpunkt zur Fläche 2 auf der Gegenstandsseite und damit r2 negativ! Den Kehrwert der Brennweite f einer Linse nennt man Brechkraft D, die in Dioptrien ( = 1 ) m angegeben wird: D= 1 . f Je kürzer die Brennweite ist, desto höher die Brechkraft. Bei Sammellinsen ist die Brechkraft positiv, bei Zerstreuungslinsen ist sie negativ. Konstruktion des Bildes am dünnen Linsen: Man verwendet genau wie beim sphärischen Spiegel wieder besonders ausgezeichnete Strahlen, die sog. Hauptstrahlen: − Der achsenparallele Strahl wird so gebrochen, dass er durch den zweiten Brennpunkt verläuft. − Der Brennpunktstrahl verläuft durch den ersten Brennpunkt und tritt achsenparallel aus. − Der Mittelpunktstrahl verläuft durch den Mittelpunkt der Linse und wird nicht gebrochen. Durch eine Sammellinse laufen die drei Hauptstrahlen im Bildpunkt zusammen. Das Bild ist reell und umgekehrt. Die Vergrößerung geht aus der Abbildung hervor: tan θ = ⇒ V= G −B = g b B −b = . G g Das negative Vorzeichen zeigt, dass das Bild auf dem Kopf steht. 2.2.3 Dicke Linsen Bei dünnen Linsen ist die brechende Oberfläche dicht an der Hauptebene der Linse, so dass man die Brechung an beiden Oberflächen durch eine einzige an der Hauptebene ersetzen konnte. Bei dicken Linsen ist diese Näherung aber nicht mehr zulässig. Man muss stattdessen mit zwei Hauptebenen arbeiten. Für eine symmetrische dicke Linse gilt die Linsengleichung unverändert, aber man muss die Gegenstands-, Bild- und Brennweite auf die jeweils nächstgelegene Hauptebene beziehen. 21 2.2.4 Abbildungsfehler Wir haben bereits bei sphärischen Spiegeln gesehen, dass nicht alle von einem Punkt ausgehenden Strahlen in genau einem Punkt fokussiert werden, insbesondere dann nicht, wenn die einfallenden Lichtstrahlen weit von der optischen Achse entfernt sind. Man spricht dann von Abbildungsfehlern, insbesondere hier von einer sphärischen Aberration. Das Bild eines Gegenstandspunktes ist dann nicht punktförmig, sondern erscheint als kreisförmige Scheibe. Gleiches hat man auch bei Linsen. Man kann den Unschärfekreis verkleinern, indem man die achsenfernen Strahlen ausblendet. Nachteil: Bild wird lichtschwächer. Der Grund für die sphärische Aberration ist nicht die Imperfektion der Spiegel/Linsen, sondern die Näherung für kleine Winkel. Die sphärische Aberration kann beseitigt werden durch parabolische Spiegel bzw. Linsen. (Anwendung bei Teleskopspiegeln, Satellitenschüsseln oder Suchscheinwerfern). Nachteil: aufwändig und daher teuer in der Herstellung. Ein weiterer Abbildungsfehler ist der Astigmatismus schiefer Bündel: Er tritt auf, wenn die Strahlen schräg zur optischen Achse einfallen und zu den Rändern hin unscharf abgebildet werden (→ "Verzeichnung"). Ein häufiger Abbildungsfehler ist die chromatische Aberration. Sie rührt von der Dispersion, also der Abhängigkeit des Brechungsindex von der Frequenz her (blaues Licht wird stärker gebrochen als rotes Licht). Man bekommt einen Farbsaum an den Rändern der Bilder. Abhilfe schaffen Linsensysteme aus Sammel- und Zerstreuungslinsen, die diesen Effekt gerade kompensieren (achromatische Systeme). 2.3 Optische Instrumente 2.3.1 Das Auge Das wichtigste optische Instrument ist das Auge. Licht fällt durch die Pupille ein (Apertur variabel je nach Lichtintensität). System Hornhaut-Linse fokussiert das Licht auf die Netzhaut. Netzhaut besteht aus Stäbchen und Zäpfchen (= lichtempfindliche Nervenzellen). Sinnesreize werden über den Sehnerv an das Gehirn weitergeleitet. Linse kann durch Ziliarmuskel verformt werden: Fokussierung auf weit entfernten Gegenstand: Ziliarmuskel entspannt (fmax ca. 2.5 cm) Fokussierung auf nahen Gegenstand: Ziliarmuskel angespannt (f verringert sich) -> Akkomodation Gegenstand zu nahe am Auge: Linse kann das Licht nicht mehr auf der Netzhaut bündeln, das Bild wird unscharf. 22 Nahpunkt: Bild wird gerade noch scharf auf der Netzhaut abgebildet (= deutliche Sehweite). Er ändert sich im Laufe des Lebens (10-jähriger: ca. 7 cm, 65-jähriger: bis zu 200 cm!) Standardwert der deutlichen Sehweite: s0 = 25 cm. Linsensystem zu schwach: Bild liegt hinter der Netzhaut: Weitsichtigkeit (entfernte Gegenstände werden gut erkannt, nahe Gegenstände nicht.) Die Weitsichtigkeit kann mit einer Sammellinse (konvex) korrigiert werden. Licht wird zu stark fokussiert: Bild liegt vor der Netzhaut: Kurzsichtigkeit (nahe Gegenstände werden scharf abgebildet, entfernte Gegenstände nicht.) Kurzsichtigkeit wird mit einer Zerstreuungslinse (konkav) korrigiert. Linsensystem nicht rotationssymmetrisch: Astigmatismus (durch Hornhautverkrümmung) (punktförmige Gegenstände werden als kurze Linie abgebildet) Korrektur durch zylinderförmige Linsen. Die Größe, in der uns ein Bild erscheint, ist die Bildgröße auf der Netzhaut. Nahe Objekte ergeben ein großes Bild auf der Netzhaut, weit entfernte Objekte ein kleines Bild. Die Bildgröße hängt vom Sehwinkel ε ab, unter dem der Gegenstand dem Auge erscheint: tan φ ≈ sin φ ≈ φ ≈ B B = b 2,5 cm tan ε ≈ sin ε ≈ ε ≈ G g Nach dem Brechungsgesetz gilt: nLuft ⋅ sin ε = nLinse ⋅ sin φ Also gilt: ⇔ sin ε = nLinse ⋅ sin φ ⇒ ε ≈ nLinse ⋅ φ G B 2,5 cm G . ≈ nLinse und damit B ≈ g 2,5 cm nLinse g Die Bildhöhe ist umgekehrt proportional zur Entfernung des Gegenstandes. Je näher der Gegenstand ist, desto größer ist das Bild. Der minimale Abstand ist der Nahpunkt, also die deutliche Sehweite. 2.3.2 Die Lupe Angenommen, ein Gegenstand ist sehr klein, so dass man ihn nahe an das Auge heranbringen muss, um ihn zu erkennen. Wenn man aber unter dem Nahpunkt des Auges kommt, kann man nicht mehr akkomodieren, d. h. das Bild des Gegenstandes auf der Netzhaut ist zwar groß, aber unscharf. Mit einer Lupe kann man die scheinbare Größe eines Objektes vergrößern. Der Gegenstand befindet sich innerhalb der Brennweite einer Sammellinse. Dann erzeugt die Lupe ein virtuelles Bild auf Gegenstandsseite (Bildweite ist hier negativ!). 23 Der Betrag der Bildweite ist dabei deutlich größer als die Gegenstandsweite, so dass das virtuelle Bild mindestens am Nahpunkt, wenn nicht so gar weiter entfernt entsteht. Vlateral = Die Lateralvergrößerung ist wieder: B b =− . G g Der Winkel β, unter dem das virtuelle Bild gesehen wird, ist jedoch genau derselbe, unter dem der Gegenstand ohne Lupe gesehen würde. Der Unterschied ist aber, dass man mit dem Auge nicht mehr auf den nahen Gegenstand akkomodieren muss, sondern auf das etwas weiter entfernte Bild. Die Lupe vergrößert jedoch den scheinbaren Sehwinkel, unter dem das Auge den Gegenstand sähe, wenn es genauso weit entfernt wäre wie das Bild. Die Winkelvergrößerung (= Angularvergrößerung) ist dann: Vangular B tan β b B = = = = Vlateral tan α G G b Ein kleiner Gegenstand soll sich genau im Nahpunkt vor dem Auge befinden, d. h. der Winkel, unter den man den Gegenstand ohne Lupe sieht, beträgt: tan α = G . s0 Eine Lupe soll nun eine Brennweite f haben, die kleiner ist als s0, und der Gegenstand soll genau in dem Brennpunkt liegen (also näher am Auge als der Nahpunkt). Dann entsteht das virtuelle Bild im Unendlichen. Entsprechend muss das Auge auf unendlich akkomodiert sein. Die parallelen Lichtstrahlen werden von der entspannten Linse auf der Netzhaut fokussiert. Der Gegenstand mit Lupe erscheint im Unendlichen unter dem Winkel tan β = G f Für diesen Fall bezeichnet man die Angularvergrößerung als Normalvergrößerung: Vangular G s tan β f = = = 0 =: Vnormal tan α G f s0 2.3.3 Das Mikroskop Ein Mikroskop besteht im einfachsten Fall aus zwei Sammellinsen. Die dem Gegenstand zugewandte Linse ist das Objektiv, die dem Auge zugewandte Linse das Okular. Das Objektiv erzeugt ein reelles, vergrößertes Zwischenbild innerhalb der Brennweite des Okulars. Das Okular dient als Lupe und vergrößert den Sehwinkel, so dass ein virtuelles Bild des Zwischenbildes entsteht. 24 Die Vergrößerung ist das Produkt aus den Einzelvergrößerungen der beiden Linsen: VMikroskop = VOkular ⋅ VObjektiv = B −B ' B ⋅ =− (negativ, da B auf dem Kopf steht). B' G G Oftmals lässt man das Zwischenbild direkt am Brennpunkt des Okulars entstehen, so dass das Bild durch die Lupe "im Unendlichen" entsteht. So entsteht also das Zwischenbild bei f1 + d . Ferner gilt: tan β = G −B ' . = f1 d Die Vergrößerung des Objektivs ist damit: VObjektiv = Die Normalvergrößerung des Okulars ist: VOkular = B' d =− G f1 s0 . f2 Damit ist Vergrößerung des Mikroskops das Produkt aus beiden Vergrößerungen: VMikroskop = VOkular ⋅ VObjektiv = − d ⋅ s0 f1 ⋅ f 2 2.3.4 Das Teleskop Mit dem Teleskop werden Dinge betrachtet, die in der Regel weit weg, aber dennoch groß sind. Die Wirkung eines Teleskops besteht darin, ein reelles Bild eines Gegenstandes zu erzeugen, das dem Betrachter näher erscheint als der Gegenstand in Wirklichkeit ist. Da der Gegenstand weit entfernt ist, fallen dessen Lichtstrahlen quasi parallel in die Objektivlinse, so dass das Zwischenbild in der Brennebene des Objektivs entsteht. Die Bildweite ist also gleich der Brennweite f1. Im Gegensatz zum Mikroskop ist das Zwischenbild also nicht größer, sondern kleiner. Das Zwischenbild ist dem Betrachter aber näher und kann nun mit dem Okular als Lupe betrachtet werden. Das Okular ist jetzt so angeordnet, dass dessen Brennpunkt mit demjenigen des Objektivs zusammenfällt. Wieder erscheint das Endbild im Unendlichen. Der Abstand Objektiv-Okular beträgt also f1 + f 2 . Die Angularvergrößerung beträgt also: VTeleskop B' B' f f f tan β = = 2 = 2 =− 1 tan α G − B ' f2 g f1 Man erhält also bei Teleskopen eine starke Vergrößerung, wenn das Objektiv eine große und das Okular eine kleine Brennweite besitzt. Beispiel: Yerkes-40 inch-Refraktor: Durchmesser: 1,02 m, f1 = 19,5 m, ⇒ VTeleskop = − f1 = −195 f2 f2 = 10 cm 25 Bei den astronomischen Teleskopen ist es in der Regel nicht so entscheidend, wie hoch die Vergrößerung ist, sondern die Lichtstärke, die von der Apertur abhängig ist. So große Linsen sind in hoher Qualität aber nur schwer herzustellen. Daher sind die großen Teleskope fast immer Spiegelteleskope mit Konkavspiegeln als Objektiv. Diese sind leichter als vergleichbare Linsen und auf der ganzen Auflagefläche unterstützbar. Weiterer Vorteil: Keine chromatische Aberration! Neuere Entwicklungen: Mehrere kleinere Spiegel, die individuell verstellbar sind, um Verzerrungen, thermische Verspannungen und sogar atmosphärische Turbulenzen auszugleichen. 26 3. Interferenz und Beugung Interferenz und Beugung sind zwei wichtige Phänomene, durch die sich Wellen und Teilchen voneinander unterscheiden. Interferenz entsteht aus der Überlagerung von Wellen und resultiert in Intensitätsmustern. Wie man diese Interferenzmuster bestimmt, werden wir in diesem Kapitel diskutieren. Dabei spielt auch Beugung eine ganz wesentliche Rolle, so dass beides kaum voneinander getrennt betrachtet werden kann. 3.1 Interferenz 3.1.1 Superposition von Wellen Wir betrachten zwei ebene Wellen, die sich in längs der z-Achse mit derselben Frequenz und demselben Wellenvektor ausbreiten: r r r r E1 ( z , t ) = E0,1 ⋅ ei ( kz −ωt +δ1 ) und E2 ( z, t ) = E0,2 ⋅ ei ( kz −ωt +δ 2 ) . δ1 und δ2 sind die Phasen der beiden Wellen. Dann ist die resultierende Wellenfunktion: r r r r r E ( z , t ) = E1 ( z , t ) + E2 ( z , t ) = E0,1 ⋅ ei ( kz −ωt +δ1 ) + E0,2 ⋅ ei ( kz −ωt +δ 2 ) . r r = E0,1 ⋅ eiδ1 + E0,2 ⋅ eiδ 2 ⋅ ei ( kz −ωt ) ( ) Die Intensität einer elektromagnetischen Welle skaliert bekanntlich mit dem Quadrat der Feldstärke: ( )( ) r r r r I = E0,1 ⋅ eiδ1 + E0,2 ⋅ eiδ 2 ⋅ E0,1 ⋅ e −iδ1 + E0,2 ⋅ e −iδ 2 r2 r2 r r r r = E0,1 + E0,2 + E0,1 E0,2 ⋅ ei (δ1 −δ 2 ) + E0,1 E0,2 ⋅ ei (δ 2 −δ1 ) r2 r2 r r = E0,1 + E0,2 + E0,1 E0,2 ⋅ ei (δ1 −δ 2 ) + e −i (δ1 −δ 2 ) 14442444 3 ( ) = 2cos(δ1 −δ 2 ) ⇒ I = I1 + I 2 + 2 I1 I 2 cos δ mit δ = δ1 − δ 2 . Den dritten Summanden nennet man Interferenzterm. Man sieht, dass er Null ist, wenn r r E1 ⊥ E2 . Da der Kosinus eine gerade Funktion ist, kann man ebenso gut δ2−δ1 schreiben können, und man bezeichnet δ schlichtweg als die Phasendifferenz zwischen den beiden Wellen. r r Sind jedoch E1 || E2 , dann liegt die Gesamtintensität I zwischen den Extremwerten I min = ( I1 − I 2 ) 2 und I max = ( ) 2 I1 + I 2 . r r Betrachten wir nun den Sonderfall E0,1 = E0,2 . Dann ist auch I1 = I 2 =: I 0 und man erhält: I = 2 I 0 + 2 I 0 cos δ = 2 I 0 (1 + cos δ ) . 27 Fall 1: Beide Wellen sind in Phase, d. h. δ = 0: Dann ist cos δ = 1 , und man erhält: I = 2 I 0 ⋅ (1 + 1) = 4 I 0 Dieses ist der Fall der maximalen Verstärkung und heißt konstruktive Interferenz. Fall 2: Beide Wellen sind in Gegenphase, d. h. δ = π = 180°: Dann ist cos δ = −1 , und man erhält: I = 2 I 0 ⋅ (1 − 1) = 0 Dieses ist der Fall der maximalen Auslöschung und heißt destruktive Interferenz. 3.1.2 Interferenz an dünnen Schichten Man kennt die schillernden Farben an einer Seifenblase oder an einem Ölfilm auf einer Pfütze. Ursache der Farben sind Interferenzeffekte bei der Reflexion: - - - Licht fällt auf die Grenzfläche Luft-Wasserfilm. Ein Teil des Lichtes wird am optisch dichteren Wasser mit Phasensprung von 180° reflektiert (s. Fresnel'sche Formeln). Der andere Teil dringt in das Wasser ein und wird an der zweiten Grenzfläche am optisch dünnen Medium ohne Phasensprung reflektiert. Das Licht tritt aus und interferiert mit dem an der oberen Grenzfläche reflektierten Strahl. Das Licht legt durch das Wasser die optische Weglänge von 2nd zurück, wobei d die Schichtdicke ist und n der Brechungsindex des Wassers. Da es an der oberen Grenzfläche zu einem Phasensprung von 180° kommt, erhält man - destruktive Interferenz, wenn die optische Weglänge einem ganzzahligen Vielfachen der Wellenlänge entspricht. ⇒ 2nd = j ⋅ λ , - j = 1, 2, 3,... konstruktive Interferenz, wenn die optische Weglänge einem ungeraden Vielfachen der halben Wellenlänge entspricht. ⇒ 2nd = (2 j + 1) ⋅ λ 2 , j = 0,1, 2, 3,.... Da es bei konstanter Schichtdicke von der Wellenlänge des Lichtes abhängig ist, ob es zu konstruktiver oder destruktiver (oder beliebiger) Interferenz kommt, sieht man verschiedene Farben. Hierbei spielt auch noch der Einfallswinkel eine entscheidende Rolle. 28 Dann ist die optische Weglänge durch das Glas: 2nd cos β Der Reflektierte Strahl hat zusätzlich noch den Gangunterschied s = x ⋅ sin α = 2d tan β sin α zurückzulegen. Die gesamte Wegdifferenz ∆ beträgt dann: ∆= n 2nd sin β 2d 2nd − 2d tan β sin α = 2d − sin α = n − n ⋅ sin 2 β = 1 − sin 2 β = 2nd cos β cos β cos β cos β cos β cos β ( cos 2 β = 1 − sin 2 β = 1 − ) ( ) sin 2 α sin 2 α ⇔ n cos β = n 1 − = n 2 − sin 2 α 2 2 n n ⇒ ∆ = 2nd cos β = 2d n 2 − sin 2 α . Deshalb erhält man an zwei planparallelen Oberflächen: - destruktive Interferenz, wenn die Wegdifferenz einem ungeraden Vielfachen der halben Wellenlänge entspricht: ⇒∆+ ⇔ - λ 2 = 2d n 2 − sin 2 α + 2d n 2 − sin 2 α = j ⋅ λ , λ 2 = (2 j + 1) ⋅ λ 2 , j = 0,1, 2, 3,.... j = 1, 2, 3, ... konstruktive Interferenz, wenn die optische Weglänge einem ganzzahligen Vielfachen der Wellenlänge entspricht: λ λ ⇒ ∆ + = 2d n 2 − sin 2 α + = j ⋅ λ , j = 1, 2, 3, ... 2 ⇔ 2 2d n 2 − sin 2 α = (2 j + 1) ⋅ λ 2 , j = 0,1, 2, 3,... Hier ist jetzt die Interferenz sowohl von der Wellenlänge als auch vom Einfallswinkel α abhängig, was zu den bunten Erscheinungen bei der Reflexion an dünnen Schichten führt. Weil bei fester Wellenlänge diese Interferenzerscheinungen bei einem bestimmten Einfallsbzw. Neigungswinkel α zu sehen sind, nennt man sie Interferenzen gleicher Neigung. Ein ähnliches Phänomen sind die sog. Newton'schen Ringe. Hier werden Lichtstrahlen an den Grenzflächen reflektiert und es kommt durch den Gangunterschied wieder zu Interferenzen. Hier sind die Interferenzerscheinungen bei festem Betrachtungswinkel jedoch von der Dicke d abhängig, so dass man sie Interferenzen gleicher Dicke nennt. In der Mitte hat man ein dunkles Zentrum. Hier ist die Dicke d etwa Null, und die destruktive Interferenz kommt nur durch den 180°-Phasensprung durch die Reflexion am dichteren Medium zustande. 29 3.1.3 Kohärenz Gewöhnliche Lichtquellen (Glühlampe, Sonne, Leuchtstoffröhre etc.): Licht wird durch Atome ausgesendet, die durch unkoordinierte Stöße angeregt werden. Der Beginn dieser Abstrahlung ist daher beliebig (spontan), und der Zeitraum τ der Abstrahlung nur sehr kurz. Das Licht besteht also aus "abgehackten" Wellenzügen mit der Länge c ⋅ τ , die mit den anderen Wellenzügen völlig unzusammenhängend sind. Solches Licht nennt man daher inkohärent. LASER = Light Amplification by Stimulated Emission of Radiation Licht aus LASERn wird zwar auch von Atomen durch Stoßprozesse ausgesandt, die aber zeitlich aufeinander abgestimmt sind. Die Atomen emittieren das Licht also in Phase, und man bekommt damit sehr lange, zusammenhängende Wellenzüge: Das Licht ist kohärent. Die Länge, über die ein Wellenzug derart phasenstabil ist, nennt man Kohärenzlänge. Die Zeitspanne, in der der Wellenzug einen Punkt im Raum passiert, heißt Kohärenzzeit. Stabile Laser haben Kohärenzlängen von mehreren Kilometern, Gasentladungslampen, die monochromatisches (=einfarbiges) Licht aussenden, nur von wenigen Millimetern. Die Kohärenzlänge von Glühlampen beträgt sogar nur etwa 1 µm. 3.1.4 Interferometer Interferometer sind Messapparate, die auf Interferenz beruhen. Wellenzug wird in der Regel aufgespalten, durchlaufen zwei unterschiedlich lange Wege und werden anschließend wieder zusammengeführt. Ist die Differenz der optischen Weglänge gerade ein ganzzahliges Vielfache der Wellenlänge, dann tritt konstruktive Interferenz auf, ist sie ein ungeradzahliges Vielfache der halben Wellenlänge, dann hat man destruktive Interferenz. Mit Interferometern lassen sich kleinste Dicken messen, aber auch unterschiedliche Dauern zur Zurücklegung desselben Weges, und wegen der n-Abhängigkeit der optischen Weglänge auch Brechungsindizes. Beispiel: Michelson-Interferometer. Hierbei muss man auf die Kohärenzlänge achten! 3.2 Beugung Unter Beugung versteht man die Abweichung der Wellenausbreitung von der geraden, geometrischen Stahlrichtung. Sie fällt insbesondere dann ins Gewicht, wenn die räumlichen Dimensionen in die Größenordnung der Lichtwellenlänge kommen. Eine ebene Wellenfront fällt auf eine kleine Spaltöffnung. Hinter der Öffnung hat man ein kreisförmiges Wellenbild, das man mit dem Huygens'schen Prinzip der Elementarwellen beschreiben kann. Ist die Spaltöffnung groß verglichen mit der Wellenlänge, dann spielen die Beugungseffekte eine immer geringere Rolle. 30 3.2.1 Beugung am Einzelspalt Ein Spalt der Breite b wird mit Licht beleuchtet. Hinter dem Spalt werden durch eine Linse alle Stahlen, die unter einem gleichen Winkel φ zur Normalen der Spaltebene laufen, gebündelt. Ein ähnlicher Effekt entsteht, wenn der Abstand zum Spalt sehr groß gegen die Spaltöffnung ist. Uns interessiert jetzt die Intensitätsverteilung hinter dem Spalt. Dabei bedienen wir uns erneut dem Huygens'schen Prinzip, nach dem jedes Spaltelement dy der Ausgangspunkt einer Elementarwelle ist. Da eine ebene Welle auf den Spalt fällt, sind alle Elementarwellen in Phase (=synchron). Wir setzen eine ebene Welle an: E ( z , t ) = E0 ⋅ ei ( kz −ωt ) . Von der Stelle y liefert ein Spaltenelement dy in der Ebene A einen Beitrag: dE A = E0 ⋅ b i ( k ⋅ sin φ −ωt ) dy dy i k y⋅sin φ + 2 ⋅sin φ −ωt ⋅e = E0 ⋅ e 2 ⋅ ⋅ eiky⋅sin φ . b b b Den Beitrag des gesamten Spaltes erhält man durch Aufsummieren aller Spaltelemente: + b i ( k sin φ −ωt ) ⋅e 2 1 E A (t ) = E0 ⋅ 1442443 b B = B⋅ b ik ⋅sin φ e 2 b 2 ∫e iky ⋅sin φ dy b − 2 b − ik ⋅sin φ −e 2 , eix − e− ix = 2i ⋅ sin x ikb ⋅ sin φ b sin k sin φ 2 = B⋅ b k sin φ 2 Von der Ebene A bis zum Brennpunkt F brauchen alle Teilwellen dieselbe Zeit, was mit dem Phasenfaktor eiδ berücksichtigt wird. Deshalb beträgt im Brennpunkt die Feldstärke: b sin k ⋅ sin φ 2 . EF (t ) = B ⋅ eiδ ⋅ b k ⋅ sin φ 2 Die Intensität im Brennpunkt ist proportional zu EF 2 = EF ⋅ EF* : b sin 2 k ⋅ sin φ 2 2 ~ sin X mit X = k b ⋅ sin φ . I (φ ) ~ 2 2 X2 b k ⋅ sin φ 2 Die Nullstellen von sin 2 X X2 liegen bei X = n ⋅ π mit n = 1, 2, 3, ... b 2 Die n-te Nullstelle liegt demnach bei: X = k ⋅ sin φ = 2π b ⋅ sin φ = n ⋅ π mit n = 1, 2, 3, ... λ 2 31 Damit erhält die Beugungsbedingung für die Intensitätsminima am Einzelspalt: b ⋅ sin φ = n ⋅ λ mit n = 1, 2, 3, ... Minima am Einzelspalt n = 0 selbst liefert keine Nullstelle, weil hier der Nenner auch Null wird. Man kann hier sin X sin X X2 sin X X2 in eine Potenzreihe entwickeln: =1− + ... , d. h. lim = lim 1 − + ... = 1 . X →0 X X →0 X X 3 3 Bei φ = 0 , also auf der optischen Achse des Spaltes, befindet sich das Hauptmaximum. 3 2 Das erste Nebenmaximum ist bei X ≈ π (nicht exakt). Der Nenner X 2 ist damit um den Faktor X 2 ≈ 22 größer und damit die Intensität um den Faktor 22 kleiner. Allgemein gilt für die Nebenmaxima annähernd die Beugungsbedingung: b ⋅ sin φ ≈ (2n + 1) ⋅ Wenn λ b = λ 2 mit n = 1, 2, 3, ... Nebenmaxima am Einzelspalt (nicht exakt) sin φ << 1 , dann ist n sehr groß und man sieht extrem viele ganz dicht benachbarte n Nebenmaxima, die nicht mehr auflösbar sind. Hier spielen Beugungseffekte keine Rolle mehr. Die geometrische Optik entspricht daher dem Fall ganz kleiner Wellenlängen oder großen Aperturen. λ sin φ Für = >> 1 , dann ist n sehr klein, und man beobachtet nur noch das Hauptmaximum. b n Nicht nur ein dünner Spalt führt zu Beugungsbildern, sondern auch jegliche Form einer Öffnung. Die Beugung an einer kreisförmigen Apertur ist von besonderem Interesse, weil sie das Auflösungsvermögen von optischen Geräten begrenzt. Man könnte jetzt wieder genau wie beim Einzelspalt vorgehen, indem man die Welle in der Öffnung in kleine Elementarwellen zerteilt, dann die Amplitude und Phase an einem beliebigen Punkt P errechnet und anschließend über die gesamte Apertur integriert. In der Praxis ergibt dies Ausdrücke, die sich nicht mehr so einfach lösen lassen, sondern man erhält die Minima und Maxima als Nullstellen der sog. "Bessel"-Funktion, was hier im Einzelnen nicht durchgeführt werden soll. Die Beugungsbedingung für das n-te Minimum ergibt sich als: sin θ min,1 = 1, 22 λ D , sin θ min,2 = 2,23 λ D , sin θ min,3 = 3,24 λ D Entsprechend lauten die Beugungsbedingungen für die Nebenmaxima: sin θ max,1 = 1,63 λ D , sin θ max,2 = 2,68 λ D , sin θ max,3 = 3,70 λ D 32 3.2.2 Auflösungsvermögen optischer Instrumente Zwei Lichtpunkte strahlen unter einem Winkel α auf eine kreisförmige Öffnung mit dem Durchmesser D. Man sieht, dass sich die Beugungsmuster der beiden Lichtquellen auf dem Schirm überlagern. Wenn α immer kleiner wird, dann schieben sich auch die Beugungsmuster immer mehr zusammen, so dass es immer schwieriger wird, beide Objekte von einander zu trennen. Es gibt einen kritischen Winkel αK, unter dem es gerade noch möglich ist, zwei Objekte als getrennte Lichtquellen zu unterscheiden. In diesem Fall fällt das Hauptmaximum des einen Objektes in das erste Nebenminimum des anderen Objektes, also: sin α K ≈ α K = 1, 22 ⋅ λ D Rayleigh'sches Auflösungskriterium Beispiele: a) Das menschliche Auge: D ≈ 2 mm = 2 ⋅ 10−3 m λmittel = 0,5 µm = 5 ⋅ 10−7 m ⇒ α K = 3 ⋅ 10−4 rad ≈ 0,017° b) Spiegelteleskop auf dem Mt. Palomar D≈5m λmittel = 0,5 µm = 5 ⋅ 10−7 m ⇒ α K = 10−7 rad ≈ 5,7 ⋅ 10−6 ° Bemerkung: Eine Vergrößerung der Apertur verbessert nicht nur das Auflösungsvermögen, sondern führt auch noch zu einer Vergrößerung der Helligkeit. Verdopplung des Durchmessers → Vervierfachung der Lichtmenge Faktor 4 kleinere Fläche des Beugungsscheibchens, d. h. Faktor 16 in der Lichtmenge pro Fläche. → Lichtstromdichte geht mit der 4. Potenz des Spiegeldurchmessers Die Vergrößerung des Bildes durch Beugung führt dazu, dass ein Richtstrahl λ nicht mehr streng parallel ist, sondern unter dem Winkel α K = 1, 22 ⋅ auseinD anderläuft. Ein Lichtpunkt im Brennpunkt eines 5m-Teleskopspiegels hat auf dem Mond nur aufgrund der Beugung einen Durchmesser von ca. 40 m. 33 3.2.3 Das Theorem von Babinet Bei der Beugung an einem Hindernis ist die Intensitätsverteilung dieselbe wie bei der Beugung an der komplementären Öffnung. Anders: Das Beugungsbild eines Drahtes der Dicke d ist dasselbe wie das eines Spaltes der Breite d. Amplituden bei der Beugung sind entgegengesetzt gleich. Da die Intensitäten mit dem Quadrat der Feldstärken gehen, ist die Intensitätsverteilung für beide Fälle dieselbe. Achtung: Das gilt nur für die gebeugten Wellen außerhalb des Bereiches der geometrischen Optik. 3.2.4 Beugung am Gitter Ein optisches Gitter ist eine Anordnung von N äquidistanten parallelen Einzelspalten der Breite d und der Periode g (Abstand zweier benachbarter Spalte = Gitterkonstante). Zwischen der Ebene A und dem Brennpunkt F benötigen alle Teilwellen gleich viel Zeit. In der Gitterebene schwinge die Welle E ( z , t ) = E0 ⋅ ei ( kz −ωt ) . Der Beitrag des m-ten Spaltes in F ist dann gegeben durch: EF , m = S (φ ) ⋅ ei ( kmg ⋅sin φ −ωt ) , wobei S(φ) die Feldverteilung des Einzelspaltes ist, also d sin k sin φ 2 . S (φ ) ~ d k sin φ 2 Die Gesamtwelle in F ist die Superposition der Wellenamplituden jeder der N Spalte: N −1 EF ~ ∑ S (φ ) ⋅ e i ( kmg⋅sin φ −ωt ) = S (φ ) ⋅ e −iωt ⋅ m =0 N −1 ∑e ikmg ⋅sin φ m =0 N −1 Das ist eine geometrische Reihe, deren Summe bekanntlich lautet: ∑ m=0 N −1 Daher ist ∑ m=0 eikmg ⋅sin φ = am = aN −1 . a −1 eikNg ⋅sin φ − 1 . eikg ⋅sin φ − 1 Die Berechnung der Intensität geht wieder über EF ⋅ EF* . α Es gilt: ( eiα − 1)( e −iα − 1) = 2 ⋅ (1 − cos α ) = 4sin 2 , somit folgt: 2 d 1 sin 2 k sin φ sin 2 kNg ⋅ sin φ 2 ⋅ 2 . I~ 2 1 d sin 2 kg ⋅ sin φ k sin φ 2 42444 2 3 144 3 144244 2 S 2 (φ ) G (φ ) 34 Der erste Faktor ist proportional zu S 2 (φ ) , also der Intensität der Einzelspalte. Der zweite Faktor ist proportional zu G 2 (φ ) , das die Intensität durch die periodische Anordnung von N Spalten repräsentiert. Die Hauptmaxima sind durch die Nullstellen des Nenners gegeben. Für diese gilt: 1 π λ kg ⋅ sin φ = g ⋅ sin φ = n ⋅ π , d. h. die Hauptmaxima liegen bei sin φ = n ⋅ . 2 λ g Damit lautet die Beugungsbedingung n ⋅ λ = g ⋅ sin φ mit n = 0, 1, 2, 3, ... für die Hauptmaxima beim Gitter. Der Parameter n heißt Beugungsordnung. Die Nebenminima und –maxima ergeben sich durch den Zähler: sin φ = sin φ = j ⋅λ N ⋅g mit j = 1, 2, 3, ... (2 j + 1) ⋅ λ 2⋅ N ⋅ g Die Breite der Hauptmaxima ist gegeben durch ∆ = Nebenminima mit j = 1, 2, 3, ... Nebenmaxima 2λ , d. h. je mehr Spalte vorhanden sind, Ng desto schmaler sind die Hauptmaxima. Je kleiner die Gitterkonstante g wird, desto weiter sind die voneinander entfernt. 3.2.5 Beugung am Doppelspalt Das einfachste Gitter ist ein Doppelspalt und noch dazu von gewisser historischer Bedeutung, wie wir im weiteren Verlauf dieser Vorlesung noch sehen werden. Hier ist natürlich N = 2, so dass sich der Faktor G 2 umformen lässt zu: G 2 (φ ) ~ sin 2 (k ⋅ g ⋅ sin φ ) 1 = 4 cos 2 k ⋅ g ⋅ sin φ . 1 2 sin 2 k ⋅ g ⋅ sin φ 2 Dieser Ausdruck ergibt Null für 1 π π k ⋅ g ⋅ sin φ = g ⋅ sin φ = ( 2l + 1) mit l ∈ N . Damit: λ 2 2 g ⋅ sin φn = 2l + 1 λ 2 mit l ∈ N Minima am Doppelspalt Die Intensitätsverteilung des Einzelspaltes S 2 ist Null für sin φn = n ⋅ λ d (n = 1, 2, 3,...). Da natürlich d < g sein muss, ist der Abstand der durch G 2 generierten Minima kleiner als der Abstand der durch die Einzelspalt-Intensitätsverteilung S 2 hervorgerufenen Minima. 35 Die Zahl der zusätzlichen Minima im zentralen Maximum des Einzelspaltes der Breite ist gegeben durch 2λ d λ g = 2λ d 2g . Wenn die Spaltöffnungen deutlich kleiner sind als die d Stegbreite, dann bekommt man viele zusätzliche Streifen. Beispiel: Gitterspektrometer werden zur Untersuchung von Spektren oder zur Erzeugung monochromatischen Lichtes verwendet. Typische Werte von optischen Gittern im Sichtbaren: N = 2 ⋅ 104 Gitterstriche g = 1,5 ⋅ 10−6 m (Gitterkonstante) Bestrahlt man ein solches Gitter mit einem HeNe-Laser ( λ = 0,6328 ⋅ 10−6 m), so ergibt sich für die Breite des Hauptmaximums: 2λ 2 ⋅ 0,6328 ⋅ 10−6 m = = 4, 2 ⋅ 10−5 ⇒ ∆ = 2, 4 ⋅ 10−3 ° . sin ∆ = 4 −6 Ng 2 ⋅ 10 ⋅ 1,5 ⋅ 10 m Die weiteren Hauptmaxima der Funktion G 2 liegen in Abständen von λ g auf beiden Seiten 0. Beugungsordnung. λ 0,6328 ⋅ 106 m sin ∆ = g = 1,5 ⋅ 10−6 m = 0, 42 ⇒ ∆ = 24,8° . Damit ist die 0. Beugungsordnung um dem Faktor 10000 schmaler als der Abstand zwischen der 0. und der 1. Beugungsordnung. λ Die Nebenmaxima befinden sich in den sin φ-Abständen von von den Ng Hauptmaxima und sind praktisch nicht auflösbar. Bei verschiedenen Wellenlängen treten die Beugungsordnungen bei unterschiedlichen Winkeln auf, und zwar größere λ unter größerem Winkel. Auf diese Weise werden die Spektralfarben voneinander getrennt. 3.2.6 Abbildungstheorie von Abbé und Auflösungsvermögen beim Mikroskop Wie groß ist der minimal Abstand zweier Objekte, damit sie im Mikroskop noch voneinander als getrennte Objekte wahrgenommen werden können? Objekt: Gitter mit Spaltabstand g und N Perioden wird von unten mit parallelem Licht beleuchtet. In der Brennebene des Objektivs entsteht ein Beugungsbild, wie wir es ja gerade eben hergeleitet haben. Die Apertur des Objektivs begrenzt aber die Anzahl der Beugungsordnungen, die in das Objektiv eindringen können. Ernst Abbé (1840-1905) hat gezeigt, dass für eine Abbildung des Gittermusters mindestens die 0. und die 1. Beugungsordnung in das Objektiv gelangen müssen. 36 Tritt nur die 0. Beugungsordnung ein, so hat das zentrale Hauptmaximum die Breite 2λ 2λ , also die gleiche Breite wie bei einem Einfachspalt der Breite l. Man sieht sin ∆ = = Ng l also nichts von den Stegen. Damit die erste Ordnung eintreten kann, muss der Aperturwinkel α größer als φ1, der Winkel λ des ersten Maximums, sein. Damit folgt sin α > sin φ1 = , also g g≥ λ sin α . Um das Auflösungsvermögen groß zu machen, muss man also für eine große Apertur sorgen. Man auch zusätzlich das Objekt in eine Immersionsflüssigkeit mit Brechungsindex n legen. Dann ist nämlich: λ g≥ n ⋅ sin α Der Brechungsindex n > 1 sorgt für eine Verringerung der gerade noch auflösbaren Abstände. Eine andere Möglichkeit ist es, das Objekt mit kleinerer Wellenlänge zu betrachten. Das ist die Idee des Elektronenmikroskops. Elektronen können auch als Welle interpretiert werden, und die Wellenlänge ist extrem klein. Dass das tatsächlich der Fall ist, wird im Folgenden gezeigt werden. Dies ist bereits der Brückenschlag zur Atomphysik und dem Dualismus von Teilchen und Welle. 3.3 Holographie Eine der interessantesten Anwendungen des Lasers ist die Erzeugung dreidimensionaler Bilder, die man als Hologramme bezeichnet. Normales Foto: nur Intensität -> zweidimensionales Abbild Hologramm: durch Interferenz Erzeugung dreidimensionaler Abbilder Erzeugung eines Hologramms: - - - - Zerlegung eines aufgeweiteten Laserstrahls mit Hilfe eines halbdurchlässigen Spiegels in zwei Teile Ein Teil gelangt direkt zum Film, der andere Teil erst nach der Reflexion am Objekt. Durch Interferenz wird nicht nur die Amplitude, sondern auch die relative Phase zwischen beiden Strahlen festgehalten. Wichtig ist hier wieder eine hinreichende Kohärenzlänge, die man nur mit einem Laser erreicht. Entwickelter Film wird in einen divergenten Laserstrahl gehalten Es entsteht ein dreidimensionales virtuelles Bild 37 Zur Bildentstehung betrachten wir einen einzelnen Objektpunkt O: - - - - OA und OB sind zwei von dem Punkt O reflektierte Strahlen. CA und DB kommen direkt vom Laser und interferieren mit OA und OB an den Punkten A und B auf dem Film. Es entstehen bei konstruktiver Interferenz Streifen. Der Abstand der Streifen ändert sich mit dem Einfallswinkel Man erhält quasi ein Beugungsgitter mit sich ändernder Gitterkonstante. Bei der Beleuchtung des entwickelten Filmes erscheinen die gebeugten Strahlen erster Ordnung unter etwas verschiedenen Winkeln. Es entsteht durch die divergierenden Strahlen auf der Einfalls-Seite ein virtuelles Bild. Auf der Transmissionsseite konvergieren die nach unten gerichteten Strahlen und formen ein reelles Bild. Da das Objekt aus beliebig vielen Punkten besteht, ist das Hologramm ein sehr komplexes Interferenzmuster. 38 4. Welle/Teilchen-Dualismus Wellen Beugung an Kanten und Öffnungen (Abweichung von der geradlinigen Ausbreitung) Wellen können mit einander interferieren (Interferenzmuster) Isaak Newton (1643-1727): Teilchen Teilchen bewegen sich immer geradlinig, solange keine Kraft auf sie wirkt. Bei Zusammentreffen ändern sie ggf. die Richtung und Geschwindigkeit, fliegen dann aber geradlinig weiter. (Niemals Interferenzmuster) "Licht ist ein Teilchenstrahl" Aber: Brechungsgesetz nur erklärbar, wenn Ausbreitungsgeschwindigkeit im Medium größer als im Vakuum. Lehnte Wellennatur des Lichts strikt ab: "Licht breitet sich immer geradlinig aus" (Beugung noch nicht beobachtet). Thomas Young (1773-1829): Doppelspaltversuch (1801) -> Interferenzmuster Beweis: Licht ist eine Welle. Auguste Fresnel (1788-1827): Geradlinige Ausbreitung des Lichts ist eine Folge der sehr kleinen Wellenlänge. James Clerk Maxwell (1831-1879): Wellengleichung für elektromagnetische Wellen. Annahme (Beginn des 20. Jahrhunderts): - Licht und andere elektromagnetische Strahlung sind Wellen. Elektronen, Protonen, Atome und andere Bausteine der Materie sind Teilchen. In den ersten 30 Jahren des 20. Jh. stellte sich heraus, dass Licht seine Energie immer nur portionsweise in sog. "Quanten" abgibt und sich ähnlich wie Teilchen verhält. 4.1 Der Teilchencharakter des Lichts 4.1.1 Der Photoeffekt und die Bestimmung von h Hallwachs-Versuch: - - - Die Zinkplatte wird positiv geladen und anschließend mit Licht bestrahlt: Das Elektroskop behält seine Ladung. Die Zinkplatte wird negativ geladen und anschließend mit Licht bestrahlt: Das Elektroskop entlädt sich. Zwischen Lampe und Zinkplatte wird eine Glasscheibe gestellt. Die Zinkplatte wird negativ geladen und anschließend mit Licht bestrahlt: Das Elektroskop behält wieder seine Ladung. Ergebnis: Licht löst Elektronen aus der Zinkplatte heraus. Intensität bestimmt nicht, ob Elektronen herausgelöst werden oder nicht. 39 Das Ergebnis des Hallwachs-Experimentes eröffnet nun den Einstieg in die traditionelle Untersuchung des Photoeffekts mit Photozelle und Gegenfeldmethode. Experiment mit Photozelle: - - Licht trifft auf die Photokathode. Elektronen werden herausgeschlagen und treffen auf die Ringanode → elektrischer Strom. Durch Erhöhen einer Gegenspannung an der Anode werden die Elektronen abgebremst. Wenn Strom Null ist, hat man die kinetische Energie der Elektronen: Ekin = e ⋅ U . Klassische Interpretation: Die kin. Energie der Elektronen sollte abhängig von der Intensität sein. Beobachtet wird aber: Ekin ist unabhängig von der Lichtintensität. Die Lichtintensität bestimmt lediglich den Photostrom, also die Zahl der ausgelösten Elektronen, jedoch nicht deren Energie. Albert Einstein interpretierte diese Beobachtung als erster richtig, indem er folgerte, dass die Lichtenergie quantisiert ist, also nur in kleinen Energiepaketen, den sog. Photonen, auftritt. Dafür bekam er 1922 den Nobelpreis für Physik. Für die Energie des Photons gilt: E = h ⋅ν = h⋅c λ ν: Frequenz des Lichtes h: Planck'sches Wirkungsquantum, h = 6,6260693 ⋅ 10−34 J ⋅ s = 4,135701 ⋅ 10−15 eV ⋅ s Das heißt, dass die Lichtwellenlänge bzw. die Frequenz des Lichtes für die Energie der ausgelösten Photoelektronen verantwortlich ist. Wechselwirkungsmechanismus bei Photoeffekt ist der Stoß der Photonen mit den Elektronen in der Metalloberfläche. Die Energie des Photons wird absorbiert und in kinetische Energie der Elektronen umgewandelt. Die maximale Energie der Elektronen, die durch Licht aus der Kathode herausgeschlagen werden, beträgt: 1 Ekin,max = mv 2 = hν − WAus 2 max Dabei ist WAus die Austrittsarbeit, die mindestens aufgebracht werden muss, damit das Elektron das Metall verlassen kann. Ihr Betrag ist charakteristisch für das jeweilige Metall. Ist die Photonenenergie kleiner als die Austrittsarbeit, so bleiben die Elektronen in dem Metall. Um das Planck’sche Wirkungsquantum experimentell zu bestimmen, beleuchtet man eine Vakuumphotozelle mit monochromatischem Licht. Man misst dann einen Photostrom. Durch Anlegen einer Gegenspannung UGeg an die Photozelle wird der Photostrom gerade kompen40 siert, d.h. auf Null geregelt. Die Energie der aus der Photozelle austretenden Elektronen ist dann genauso groß wie die elektrische Energie e·UGeg durch die Gegenspannung: e ⋅ U Geg = hν − WAus h U Geg = ν − U Aus e ⇔ Trägt man also UGeg über ν auf, so erhält man eine Gerade mit der Steigung h/e und dem Spannungs-Achsenabschnitt UAus = WAus/e. 4.1.2 Der Impuls der Photonen Wenn ein Lichtstrom also nichts anderes sein soll, als ein Hagel von Photonen, stellt sich natürlich auch die Frage, ob Licht einen Impuls hat. Man kann sogar bereits mit der klassischen Maxwell'schen Theorie den Lichtdruck auf eine reflektierende Oberfläche ausrechnen. Wir betrachten dazu eine elektromagnetische Welle, die auf einen Spiegel fällt und dort reflektiert wird. Für die einfallende Welle schreiben wir: E x einf = E0 ⋅ ei ( kz −ωt ) By einf = B0 ⋅ ei ( kz −ωt ) . E x refl = − E0 ⋅ ei ( − kz −ωt ) Für die reflektierte Welle gilt also: By refl = B0 ⋅ ei ( − kz −ωt ) . B hat hier kein Minuszeichen, weil die reflektierte Welle in –x-Richtung läuft. Anders als das r r E -Feld verschwindet das resultierende B -Feld By res = By einf + By refl in der Spiegelebene nicht. r r Man bekommt also einen Schwingungsknoten für E und einen Bauch für B . Es fließt also nach dem Durchflutungsgesetz in einer Oberflächenschicht von der Dicke der Eindringtiefe des Lichts ein Strom: r r r ∂E rot B = µ0 j + µ0ε 0 ∂t r Der zweite Summand (Verschiebungsstrom) ist Null, da ja das E -Feld hier gerade verr r schwindet. Da B nur von z abhängt und nur eine y-Komponente hat, besitzt rot B = − ∂B y ∂z nur eine x-Komponente, so dass: jx = − 1 ∂By . µ0 ∂z Ein Strom im Magnetfeld erfährt nach dem Biot-Savart'schen Gesetz aber eine Kraft. r ( r r ) Das Biot-Savart'sche Gesetz lautet: dF = I ⋅ dl × B . 41 Wir betrachten die Kraft auf ein infinitesimales Quaderelement dx dy dz . Der Strom durch die schraffierte Fläche ist jx dy dz . Die Kraft auf das Quaderelement wird damit dFz = jx dx dy dz By . Die Gesamtkraft erhält man, indem man über die xy-Ebene und die ganze Länge z integriert: Fz = − 1 µ0 ∫∫ z =∞ dx dy ∞ ∫ ∂B y z =0 By dz = − ∂z A 2µ0 By 2 z =∞ z =0 Da das Wellenfeld nur ganz wenig in den Spiegel eindringt, verschwindet By für z → ∞, und man erhält: ( Fz 1 1 = By 2 ( z = 0) = Byeinf ( z = 0) + Byrefl ( z = 0) A 2 µ0 2 µ0 = 1 2 µ0 ( 2B e ) − iωt 0 2 = 2 µ0 ) 2 = 1 2 µ0 ( 2B einf y ( z = 0) ) 2 B0 2 cos 2 ωt 1 2 Das zeitliche Mittel von cos 2 ωt ist , so dass im Zeitmittel gilt: Fz B0 2 = . A µ0 Diese Kraft pro Spiegelfläche nennt man den Strahlungsdruck. r Man kann ihn auch mit Hilfe des Poynting-Vektors S = ( r 1 r einf r einf 1 einf c S einf = E ×B = Ex ⋅ B y einf = By einf µ0 µ0 Im Zeitmittel ergibt sich wieder: µ0 S einf = ) 2 = c µ0 1 r r E × B ausdrücken: µ0 B0 2 ⋅ cos 2 ( kz − ωt ) . c B0 2 . 2µ0 Fz 2 S einf = A c Damit ergibt sich für das Zeitmittel der Kraft auf den Spiegel: r Jetzt stellen wir uns vor, dass jedes Lichtquant einen Impuls p hat. Da ein Photon ja keine r r Masse besitzt, kann man nicht einfach definieren: p = m ⋅ v . Stattdessen bedienen wir uns dem r ∂pr 2. Newton'schen Axiom, dass besagt: F = . ∂t Wenn das einfallende Photon den Impuls pz hat, dann hat das reflektierte Photon den Impuls r ∂p -pz. Der Impulsübertrag beträgt also 2pz. ∂t Ist N die Zahl der Photonen pro Zeit, die auf eine Flächeneinheit A auftreffen, dann ist das Zeitmittel des Strahlungsdrucks: Fz = 2 pz N . A Andererseits ergibt sich die Strahlungsleistung S aus der Zahl N der Photonen pro Zeiteinheit mit der Energie hν : S einf = N ⋅ hν . 42 Damit: Fz 2 S einf 2 N ⋅ hν = = = 2 pz N A c c Der Impuls eines Photons ist also: pz = hν h = . c λ Abschätzung der Größenordnung: Annahme: λ = 500 nm ⇒ ν = 6 ⋅ 1014 s −1 ⇒ hν = 3,8 ⋅ 10−19 J . ⇒ p = 1,3 ⋅ 10−27 kg m s −1 (eines einzelnen Photons) Sonne: S = 103 Wm −2 ⇒ N = 2,6 ⋅ 1021 m −2s −1 ⇒ F 2 ⋅ 103 Wm −2 = = 6,7 ⋅ 10−6 Nm −2 = 6,7 ⋅ 10−11 bar 8 A 3 ⋅ 10 ms Bei einem Luftdruck von 1 bar ist dieses für eine Sonnenturbine nicht geeignet. Im Weltall bewirkt der Strahlungsdruck der Sonne, dass ein Kometenschweif stets von der Sonne abgewandt ist. 4.1.3 Der Compton-Effekt Beim Photoeffekt wurde davon ausgegangen, dass die Energie eines Photons vollständig auf das Elektron abgegeben wird. Das ist aber nicht immer der Fall. Arthur Holly Compton zog 1923 die Teilchennatur des Lichtes heran, um die Ergebnisse zu erklären, die er bei der Streuung von Röntgenstrahlen an Elektronen in Graphit gemacht hat. Ein Photon (mit Energie im Röntgenbereich) trifft auf ein freies Elektron im Graphit. Dabei wird das Elektron angestoßen und nimmt Energie auf. Diese Energie fehlt dem Photon nach dem Stoß und hat daher eine geringere Frequenz bzw. eine größere Wellenlänge. Compton wandte nun die Gesetze des elastischen Stoßes aus der klassischen Mechanik auf sein Problem an: Energieerhaltung: hc hc 1 +0 = + me v 2 λ λ2 2 1123 14243 vor dem Stoß Impulserhaltung: nach dem Stoß h +0= x-Komponente: λ1 y-Komponente: 0+0=− h λ2 h λ2 cosθ + me v cos φ sin θ + me vsin φ 43 ⇔ h λ1 h − cos θ = me v cos φ λ2 quadrieren h λ2 ⇔ h2 λ 2 1 + h2 h2 λ2 λ1λ2 cos 2 θ − 2 2 h2 λ2 2 ⇔ h2 λ 2 1 + sin θ = me vsin φ cosθ = me 2 v 2 cos 2 φ beide Gleichungen addieren sin θ = me v sin φ 2 2 2 h2 h2 λ2 λ1λ2 (cos 2 θ + sin 2 θ ) − 2 2 ⇔ h2 λ 2 1 + h2 λ2 2 −2 Mit dem Ausdruck für die Energieerhaltung ⇒ 1 λ1 − 1 λ2 2 = h2 λ1λ2 hc λ1 = cosθ = me 2 v 2 (cos 2 φ + sin 2 φ ) cos θ = me 2 v 2 hc 1 + me v 2 λ2 2 ⇔ 1 1 me v 2 = 2hc − λ1 λ2 h 1 1 2 cosθ 2+ 2− 2me c λ1 λ2 λ1λ2 ⇔ λ2 − λ1 h 1 1 2 = cos θ 2+ 2− 2me c λ1 λ1λ2 λ2 λ1λ2 ⇔ λ2 − λ1 = h λ2 λ1 − 2cosθ + 2me c λ1 λ2 ⇔ λ2 − λ1 = h h ( 2 − 2cosθ ) = (1 − cosθ ) me c 2me c ⋅ λ1λ2 da λ1 ≈ λ2 , gilt λ2 λ1 + ≈2 λ1 λ2 Die Änderung der Wellenlänge des Photons ∆λ = λ2 − λ2 ist abhängig vom Streuwinkel, aber nicht abhängig von der einfallenden Wellenlänge. ∆λ = Der Term h (1 − cosθ ) me c h heißt Compton-Wellenlänge und beträgt: me c λCompton = h = 2, 426 ⋅ 10−12 m me c Weil die Compton-Wellenlänge so klein ist, beobachtet man nur eine merkliche Änderung, λ −λ wenn die einfallende Wellenlänge λ1 so klein ist, dass 2 1 hinreichend groß ist. λ1 Mit sichtbarem Licht ( ≈ 5 ⋅ 10−7 m ) ist dieser Effekt zu klein, um beobachtet zu werden. Compton bediente sich Röntgenstrahlung der Wellenlänge 71,1 pm = 7,11 ⋅ 10−11 m . 44 4.2 Der Wellencharakter der Materie 4.2.1 Elektronen und Materiewellen Nach unserem bisherigen Verständnis handelt es sich bei Elektronen zunächst einmal um Teilchen. Bekanntermaßen haben Elektronen eine Ladung. Die Bestimmung der Ladung wurde zum ersten Mal mit hoher Präzision von Robert Andrew Millikan 1910 durchgeführt, der 1923 dafür den Nobelpreis bekam. Man sprüht Öltröpfchen in einen Kondensator. Mit Hilfe von Gamma-Strahlung lädt man die Öltröpfchen auf. Ohne angelegtes Feld sinken die Tröpfchen langsam nach unten und erreichen wegen des Luftwiderstandes sehr rasch eine konstante Fallgeschwindigkeit v0. Kugelförmige Körper erfahren in viskosen Medien eine Reibung, die sog. Stokes-Reibung: FReib = 6πη rv 0 . η ist die Viskosität des Mediums, also der Luft ( ηLuft = 17,1µPa ⋅ s ), r ist der Radius des Öltröpfchens. Die auf die Öltröpfchen wirkende Gravitationskraft Fg beträgt: 4 Fg = mg = π r 3 ( ρÖl − ρ Luft ) ⋅ g . 14243 3 berücksichtigt Auftrieb Im Gleichgewichtsfall ist die Reibungskraft gleich der Gravitationskraft: η v0 4 9 . 6πη rv0 = π r 3 ( ρ Öl − ρ Luft ) ⋅ g ⇔ r= 14243 3 2 g ( ρ Öl − ρ Luft ) berücksichtigt Auftrieb Man legt man nun eine Spannung an, so dass ein elektrisches Feld E entsteht, das gerade so groß ist, dass einzelne Tröpfchen gerade schweben. qE = mg mg 4 9 2π π r 3 ( ρÖl − ρ Luft ) ⋅ g = ⇒ q= = 14243 E 3E E berücksichtigt Auftrieb 3 (η v0 ) 2 g ⋅ ( ρÖl − ρ Luft ) Nach dem Ausmessen etlicher Tröpfchen erkannte Millikan, dass die Ladung q nur in ganzzahligen Vielfachen der sog. Elementarladung e vorkommt: q = −n ⋅ e, n ∈ N mit e = 1,60217653 ⋅ 10−19 C Um die Masse des Elektrons zu bestimmen, könnte man das Elektron in einem elektrischen Feld beschleunigen und über die Trägheit zu dem gewünschten Ergebnis kommen. Elektronen werden von der Glühkathode ins Vakuum emittiert und durch die Anodenspannung beschleunigt. Das elektrische Feld leistet nun die Arbeit, die in kinetische Energie des Elektrons 1 2 umgewandelt wird: eU = me v0 2 . 45 Durch zwei Kondensatorplatten werden die Elektronen nun von ihrer Bahn abgelenkt. Zum Durchfliegen der Kondensatorlänge l benötigen die Elektronen die Zeit t: t= l v0 r r In dieser Zeit erfahren sie eine Beschleunigung a senkrecht zu v0 von der Größe: r r r F eE a= =− me me In der Zeit t werden sie um die Strecke s gegen die Feldrichtung abgelenkt: r 1 2 e E l2 s = at = 2 2m e v0 2 2eU , d.h. die Masse kürzt sich heraus: me r r e E l2 E l2 s= = . 2m e v 0 2 4 U Jetzt ist aber v02 aber gerade Nur mit einem elektrischen Feld lässt sich die Elektronenmasse also nicht bestimmen. Stattdessen benötigt man ein homogenes magnetisches Feld, das senkrecht zur Geschwindigr keit v0 sein soll. Dann wirkt auf die Elektronen die Lorentz-Kraft FL = −e ⋅ ( v × B ) . Da die Lorentz-Kraft r r r r r immer senkrecht zur Geschwindigkeit ist, verschwindet die Leistung FL ⋅ v , d. h. der Betrag der Geschwindigkeit bleibt konstant. Deshalb werden die Elektronen auf eine Kreisbahn gezwungen. Auf dieser Kreisbahn sind Zentrifugal- und Lorentzkraft gerade im Gleichgewicht. FZ = FL ⇒ me v0 2 = e⋅v⋅ B . r Die Geschwindigkeit der Elektronen ist bereits bekannt: v0 = me und damit gilt: 2eU me r 2eU , me = e⋅B ⇒ e 2U = 2 2 me r B Durch ein Magnetfeld bekommt immer nur das Verhältnis von Ladung zu Masse heraus. Man findet: e C . Mit der Kenntnis von e aus dem Millikan-Versuch erhält man = 1,7588201 ⋅ 1011 me kg also die Elektronenmasse: me = 9,1093826 ⋅ 10−31 kg 46 Nachdem uns die wichtigsten Teilcheneigenschaften des Elektrons bekannt sind, wenden wir uns einem Experiment zu, das zu einer völlig neuen Betrachtungsweise der Materie geführt hat: Davisson und Germer in den Jahren 1923-27: - - Elektronenstrahlen auf einen Nickel-Kristall (wollten wissen, wie Elektronenstrahlen Sekundärelektronen aus Festkörpern herausschlagen – interessant für Röhrentechnologie) Bei einem vorgegebenen Winkel ϕ = 50° fand man als Funktion der Beschleunigungsspannung der Elektronen ein Intensitätsmaximum bei U = 54 V. Interpretieren lässt sich die anhand der Netzebenen des Nickel, die wie ein Beugungsgitter für Elektronen fungieren. Da das Nickel die Elektronen allerdings nicht durchlässt, hat man die Beugung in Reflexion. Beugungsmaximum unter der Bedingung: n ⋅ λ = d ⋅ sin ϕ , n = 1, 2, 3,... Nickel hat einen Netzebenenabstand von d = 0, 215 nm = 2,15 ⋅ 10−10 m . Das beobachtete Maximum war das erste mit zunehmender Spannung, also n = 1. ⇒ λ = d ⋅ sin ϕ = 2,15 ⋅ 10−10 m ⋅ sin 50° = 1,65 ⋅ 10−10 m Von den Photonen wissen wir, dass der Impuls p = Der Impuls der Elektronen: eU = h λ ist. 1 p2 me v 2 = ⇔ p = 2me eU . 2 2me Das heißt, die Wellenlänge wäre dann: λ = h h = = 1,67 ⋅ 10−10 m für U = 54 V. p 2me eU Also kann man den Elektronen auf dieselbe Weise eine Wellenlänge zuordnen wie den Photonen. Genau das hat Louis de Broglie (1892-1989) bereits in seiner Doktorarbeit 1924 vermutet. Auch Materie-Teilchen kann man eine Wellenlänge zuordnen, die sog. de-Broglie-Wellenlänge: λ= h p Ebenso gibt es einen Zusammenhang zwischen Energie und Frequenz: E = h ⋅ν 47 Für Lichtwellen hatten wir immer geschrieben: E ( x, t ) = E0 ⋅ ei ( kx −ωt ) . Jetzt kann man für den Wellenvektor k auch schreiben: k = Dabei ist h = 2π λ = 2π p p p= = . h h h 2π h = 1,0545887 ⋅ 10−34 J ⋅ s . 2π Weiter gilt: E = h ⋅ν = h ω = hω 2π ⇔ ω= E . h So kommt man zu einer Wellenfunktion allgemeiner Art: i ψ ( x, t ) = A ⋅ e h ( px − Et ) 4.2.2 Die Bedeutung der Wellenfunktion Die Wellenfunktion einer Saite: Auslenkung als Funktion des Ortes und der Zeit Die Wellenfunktion des Lichts: Elektrischer bzw. magnetischer Feldvektor Was ist aber die Wellenfunktion des Elektrons (oder eines Materie-Teilchens im allg.) ? Eine Antwort kann man bereits aus dem Gelernten beim Licht erhalten: Was man makroskopisch beim Licht wahrnimmt bzw. messen kann, ist die Intensität, und die ist proportional zum Quadrat der Feldstärke, also der Amplitude der Wellenfunktion. Andersherum ausgedrückt ist das Quadrat der Wellenfunktion von Licht proportional zur Anzahl der Photonen pro Volumeneinheit. Da man im Teilchenbild in einem hinreichend kleinen Volumenelement entweder ein Photon finden kann oder nicht, gibt das Quadrat der Wellenfunktion die Wahrscheinlichkeit an, ein Photon in irgendeiner Volumeneinheit zu finden. Analog muss demnach das Quadrat der Materie-Teilchen-Wellenfunktion ebenfalls die Wahrscheinlichkeit angeben, das Teilchen in einem Volumenelement zu finden. Man nennt das Quadrat der Wellenfunktion Wahrscheinlichkeitsdichte oder Aufenthaltswahrscheinlichkeitsdichte r r r r P (r ) = ψ 2 (r ) = ψ * (r ) ⋅ψ (r ) . 48 Diese Wahrscheinlichkeit ist natürlich proportional zum Volumenelement, das man betrachtet. Deshalb beträgt die Wahrscheinlichkeit, ein Teilchen tatsächlich in einem Volumenelement dV vorzufinden: r r W = P (r ) ⋅ dV = ψ 2 (r ) ⋅ dV Wenn das Teilchen überhaupt vorhanden ist, dann muss die Wahrscheinlichkeit, es irgendwo zu finden, Eins sein. Deshalb formuliert man eine Normierungsbedingung: ∫∫∫ψ 2 r (r ) ⋅ dV = 1 V r Eine Bedingung dafür ist natürlich, dass die Wellenfunktion für r → ∞ gegen Null konvergiert, sonst kann das Integral nicht endlich (und schon gar nicht 1) sein. Man nennt deshalb die physikalisch sinnvollen Wellenfunktionen quadratintegrierbar. Das lässt sich realisieren, indem man mehrere harmonische Wellen mit verschiedenen Wellenlängen bzw. Wellenvektoren in der Nähe von k0 ( k0 − dk ≤ k0 ≤ k0 + dk ) überlagert. Man erhält so ein Wellenpaket oder auch Wellengruppe. Während die Phasengeschwindigkeit der Wellenfunktion vPhase = gerade vPhase = ω ( k0 ) digkeit vGruppe = k0 dω dk ω ( k0 ) k0 ist (beim Licht war ja = c0 ), so bewegt sich die Wellengruppe mit der sog. Gruppengeschwin- aus. Es kann vorkommen, dass die Phasengeschwindigkeit größer als k0 die Vakuumlichtgeschindigkeit wird (z. B. für n < 1). Mit ihr allein lässt sich aber keine Information übertragen. Das geht nur mit der Gruppengeschwindigkeit, und die ist immer kleiner als c0. 4.2.3 Die Heisenberg'sche Unschärferelation Um das Teilchen im Wellenbild so einigermaßen lokalisieren zu können, haben wir dem r r Teilchen eine gewisse Breite an Wellenvektoren (d. h. an Impulsen p = hk ) und damit auch Energien gegeben. Das deutet schon darauf hin, dass Ort, Impuls und Energie im Gegensatz zur klassischen Mechanik nicht mehr scharf sind. Dazu kann man ein Gedankenexperiment machen, wie es Niels Bohr bereits 1928 gemacht hat: - x-Koordinate eines Elektrons soll bestimmt werden, dass Licht auf das Elektron fällt und man mit Hilfe eines Mikroskops feststellt, woher die vom Elektron zurückgestreute Lichtwelle kommt. - Unschärfe der Ortsbestimmung ist gegeben durch das Auflösungsvermögen des λ Mikroskops (Abbé'sche Theorie): ∆x ≥ . n ⋅ sin α 49 - - Im Vakuum ist n = 1, und das gestreute Licht hat die Wellenlänge λ', die ja wegen des Compton-Effekts verschieden sein kann von der einfallenden Wellenlänge λ. λ' ∆x ≥ n ⋅ sin α Das Elektron soll frei sein; also gilt Impulserhaltung für das System Photon-Elektron. Fällt das Licht längs der x-Achse ein, dann gilt für die x-Komponente des Impulses: h λ - +0= h λ' sin ϕ + px . Die Größe des Winkels ϕ ist nicht genau bekannt. Wir können nur sagen, dass das Licht ja irgendwie in das Objektiv gefallen sein muss, also: ϕ ≤ α . Man erhält also folgende Grenzfälle: h λ = h λ' sin α + px und h λ =− h λ' sin α + px - Die Unbestimmtheit von px ist damit: ∆px = 2 - Da ∆x ≥ λ' , gilt also: sin α h λ' sin α ⇒ ∆px ⋅ λ' = 2h . sin α ∆x ⋅ ∆px ≥ 2h In diese Beziehung geht weder die Masse des Teilchens, noch die Qualität des Mikroskops ein, sondern sie gilt ganz allgemein und nennt sich Heisenberg'sche Unschärferelation: Wenn man die Koordinate eine Teilchens auf ∆x genau misst, stört man das Teilchen so, dass der Impuls entlang dieser Koordinate ∆p x unscharf ist. Diese Betrachtung beruht auf einigen Vereinfachungen. Verwendet man eine Gauß'sche Verteilung der Impulse, kann man zeigen, dass die untere Grenze für die Unschärfe etwas kleiner ist, so dass prinzipiell gilt: ∆x ⋅ ∆p x ≥ h 2 Bemerkung: Die Unschärferelation gilt nur für gleiche Koordinaten. So ist z. B. ∆y ⋅ ∆px ≥ 0 . Ein weiteres Beispiel: Messung der Energie von Photonen: Durch die Beziehung E = hω kann man durch ein hochauflösendes Spektrometer eine Messung der Frequenz vornehmen. Auch wenn dieses ein beliebig gutes Auflösungsvermögen hätte, ginge es nicht in beliebig kurzer Zeit. - - Annahme: Licht fällt während der Verschlusszeit ∆t in das Spektrometer. Mit ein bisschen Glück überlappt dieses Zeitintervall mit dem Durchgang eines Wellenzuges. 50 - Wenn der Wellenzug zeitlich länger ist als ∆t , dann fällt günstigerweise eine abgehackte Cosinus-Funktion cos ω0t f (t ) = 0 für −τ ≤ t ≤ τ für t >τ in das Spektrometer. - Die Fourier-Transformierte von f (t ) lautet: A(ω ) = = - - - 1 2π 1 2π ∞ ∫ 1 2π f (t ) ⋅ e −iωt dt = −∞ τ ∫ ( ) 1 iω0t e + e −iω0t e −iωt dt = 2 −τ sin[(ω0 − ω )τ ] sin[(ω0 + ω )τ ] + ω0 − ω ω0 + ω Das ∆ω = ω0 ± ω = 2π τ = 1 2π τ ∫τ 2 (e 1 i (ω0 −ω )t ) + e −i (ω0 +ω )t dt − 4π kann man als Unschärfe der Frequenzmessung betrachten. ∆t Mit E = hω ist ∆E = h∆ω und ∆E ⋅ ∆t = 4π h = 2h . Das entspricht dem günstigsten Fall, dass während der ganzen Zeit ∆t ein Wellenzug ins Spektrometer fällt, deshalb: ∆E ⋅ ∆t ≥ 2h . Wieder ergibt eine genauere Betrachtung: ∆E ⋅ ∆t ≥ h 2 Heisenberg'sche Unschärferelation Wenn man die Energie eines Teilchens genau messen will, braucht man eine minimale Zeit ∆t , die gegeben ist durch ∆E ⋅ ∆t ≥ h . 2 Bem.: Paare, die der Heisenberg'schen Unschärferelation unterliegen, sind gerade die Produktterme im Argument der Wellenfunktion! Größenordnungen aus der Heisenberg'schen Unschärferelation: Beispiel: Wie genau lässt sich die Geschwindigkeit eines Elektrons bestimmen, das am Ort eines Atoms lokalisiert ist? m = 9,1 ⋅ 10−31 kg, ∆x = 10−10 m. ∆v x ≥ h m km = 5,6 ⋅ 105 = 2 ⋅ 106 2m∆x s h 51 Um solch eine Geschwindigkeit zu erreichen, muss das Elektron die Potenzialdifferenz 1 V durchlaufen. Bisher: Licht als Welle und ein Elektron als Teilchen. Jetzt: De-Broglie-Welle: Beugung von Materiewellen an einem Spalt. - - Vor dem Spalt weiß man nichts über die x-Koordinate des Teilchens. Dafür ist der Impuls genau bekannt, nämlich Null: ∆x = ∞, ∆px = 0 Hinter dem Spalt: ∆x = b (b: Spaltbreite) Die meiste Intensität fällt in das Hauptmaximum, d. h. in den Winkelbereich: λ λ − < sin ϕ < ∆x ∆x ∆px λ h = ⇒ ∆x ⋅ ∆px = λ ⋅ p = h, da λ = . p ∆x p - sin ϕ = - Da auch außerhalb des Hauptmaximums Intensität auftritt, gilt: ∆x ⋅ ∆px > h . Die Heisenberg'sche Unschärferelation ist mit den de-Broglie-Wellen automatisch erfüllt. Wenn man jetzt das Teilchen etwas genauer lokalisiert, indem man ein Wellenpaket betrachtet, dann lautet dessen Beschreibung: ψ ( x) = 2π k0 + κ ∫κ A(k ) ⋅ eikx dk = 2π k0 − ∞ ∫ A(k ) ⋅ e ikx dk . −∞ Die Integralgrenzen können auf Unendlich erweitert werden, weil die Amplitude außerhalb der k-Grenzen Null sind. Diese Wellenfunktion lässt sich als Fourier-Integral der ortsabhängigen Funktion ψ(x) auffassen mit dem Impulsspektrum A(k): A(k ) = 1 2π ∞ ∫ ψ ( x) ⋅ e − ikx dx . −∞ Das Teilchen soll sich z. B. mit gleicher Wahrscheinlichkeit irgendwo zwischen –a und a aufhalten. Dann ist die Fouriertransformierte: A(k ) = ψ0 2π a ∫e − ikx dx = −a Die Wellenzahlunschärfe beträgt also womit ∆x ⋅ ∆p = 2a h 2π = 2h , 2π a ψ0 −ik (e 2π − ika ) − e ika = 2ψ 0 sin ka . 2π k 2π 2π , die Impulsunschärfe damit ∆p = h∆k = h , a a und das ist wieder bis auf den numerischen Vorfaktor die Heisenberg'sche Unschärferelation 52 5. Atomphysik 5.1 Die Atomistik der Materie Das Wort Atom kommt aus dem Griechischen und heißt: "Das Unzerschneidbare" oder "Das Unteilbare". Begriff geprägt von Demokrit (460 – 370 v. Chr.), Platon (429 – 348 v. Chr.) und Aristoteles (384 – 322 v. Chr.). Die Atomistik der Materie setzte sich nacheinander in den folgenden Bereichen durch: 1. Chemische Untersuchungen: Gesetz der konstanten und multiplen Proportionen (1799 Proust, 1803 Dalton) z. B. 14 g Stickstoff + 16 g Sauerstoff ergeben 30 g Stickstoffmonoxid (NO). 14 g Stickstoff + 32 g Sauerstoff ergeben 46 g Stickstoffdioxid (NO2). 28 g Stickstoff + 16 g Sauerstoff ergeben 44 g Distickstoffmonoxid (N2O). Auch wenn man die Endformel nicht kennt: Stickstoff und Sauerstoff reagieren nur in ganz bestimmen Mengenverhältnissen miteinander, und zwar in den multiplen Proportionen 14:16. Hypothese: Atomgewichte von N zu O verhalten sich wie 14:16, und nur ganze Atome können miteinander reagieren. 1808 Gay-Lussac: Auch die Volumina von Gasen verhalten sich bei Reaktionen im Verhältnis kleiner ganzer Zahlen: 1 Volumen N2 + 1 Volumen O2 ergeben 2 Volumina NO 1 Volumen N2 + 2 Volumina O2 ergeben 2 Volumina NO2 1811 Avogadro'sche Hypothese: Gleiche Volumina verschiedener Gase enthalten bei gleicher Temperatur und gleichem Druck die gleiche Anzahl von Molekülen. 2. Kinetische Gastheorie: Clausius und Boltzmann (1870): Zur Erklärung des Wärmeinhalts und des Transports (Austausch) wurden die Bewegung der Atome und Stöße unter ihnen postuliert. 3. Elektrizität: Faraday'sche Gesetze (Michael Faraday 1833) bei der Elektrolyse: 1. Die abgeschiedene Menge eines Elementes ist der transportierten Ladungsmenge proportional. 2. Verschiedene Elemente werden von der gleichen Elektrizitätsmenge in äquivalenten Gewichten abgeschieden. 53 Die Interpretation dieser Gesetze: Es gibt diskrete Teilchen in der Elektrizität, d. h. Individuen mit Ladungseinheit (Elektronen, Ionen) Aus dem Gesetz der konstanten und multiplen Proportionen und der Avogadro-Hypothese lassen sich relative Atommassen, die sog. Atomgewichte einführen: Arel (N) = 14 Arel (O) = 16 Arel (C) = 12 Arel (U) = 238 Diese relativen Atommassen sind ungefähr ganzzahlige Vielfache der Atommasse des Wasserstoffs. Die atomare Masseneinheit ist 1 u oder 1 amu (atomic mass unit). Früher: Bezug auf Sauerstoff, wobei die Chemiker die natürlich Isotopenverteilung, die Physiker 16O nahmen. Seit 1961: Bezug auf 12C, das definiert wird: Arel (C) = 12,00000 u. 1 u ist also der 12. Teil der Masse eines neutralen C Atoms des Kohlenstoffisotops 12C. Wenn man von den relativen Massenzahlen weg will, dann braucht man den Begriff des Mols: 1 Mol eines Stoffes sind so viel Gramm, wie das relative Atomgewicht angibt. Also sind 1 Mol 12C 12 g. Bei Molekülen gilt das relative Molekülgewicht, d.h. 1 Mol Sauerstoff O2 sind 2 x 16 g = 32 g. 1 Mol einer Substanz enthält immer dieselbe Anzahl von Atomen bzw. Molekülen. Diese Zahl nennt man Avogadro-Konstante (manchmal auch Loschmidt-Zahl) und beträgt: N A = 6,0221415 ⋅ 1023 mol−1 Für die absolute Masse eines 12C-Atoms ergibt sich damit: m12 C = 12 ⋅ 10−3 kg/mol = 1,9926467 ⋅ 10−26 kg 23 −1 6,0221415 ⋅ 10 mol Die atomare Masseneinheit hat damit den Wert: 1 u = 1,66053886 ⋅ 10−27 kg . 54 5.2 Einfache Atommodelle Die Erkenntnisse über den Atomaufbau gehen im Wesentlichen auf Analysen optischer Spektren zurück. Dabei spielt das Spektrum von Wasserstoff eine große Rolle, da es sich um das einfachste Atom handelt und ein Teil des Spektrums im sichtbaren Spektralbereich liegt. Versuch: Balmer-Serie des Wasserstoffs Johann Jakob Balmer fand 1885, dass die Wellenlängen der Linien obiger Serie durch die empirische Formel wiedergegeben werden können: λ = 364,6 nm ⋅ n2 , n2 − 4 n = 3, 4, 5,... Durch Bildung des Kehrwertes erhält man: ν := 1 λ = 1 4 1 − 2 364,6 nm n 4 1 1 = 2− 2 n 364,6 nm 2 , n = 3, 4, 5,... (ν ist die Wellenzahl.) Balmer vermutete, dass dieses ein Spezialfall eines allgemeineren Gesetzes war, das auch auf die Spektren anderer Elemente anwendbar sein sollte. Dieses Gesetz wurde von Johannes R. Rydberg und Walter Ritz formuliert: 1 1 − 2 , 2 n1 n2 ν = R ⋅ n1 > n2 . Das ist die heute übliche Schreibweise. R nennt man Rydberg-Konstante. Sie hat für alle Spektralserien eines Elementes denselben Wert, der sich von Element zu Element in systematischer Weise ändert. Für Wasserstoff hat R den Wert: RH = 1,09677581 ⋅ 107 m −1 Man kann die Rydberg-Konstante auch als Energie angeben: RH (eV) = hc ⋅ RH (m −1 ) = 13,6 eV Nach Balmer wurden weitere Serien für n2 = 1, 3, 4 und 5 von Lyman (1906), Paschen (1908), Brackett (1922) und Pfund (1924) entdeckt, die sich alle mit der obigen Serienformel darstellen lassen. 55 5.2.1 Das Rutherford'sche Atommodell Streuversuche von Mitarbeitern aus der Gruppe von Ernest Rutherford. Alpha-Teilchen aus Radon auf Goldfolie geschossen. Alpha-Teilchen wurden von den Goldatomen gestreut. Anhand des Streubildes kam man zu folgendem Schluss: - Das Atom hat einen Kern (R ~ 10-15 m), der praktisch die gesamte Masse des Atoms enthält. Der Kern hat eine positive Ladung Ze. - Der positive Kern ist von einem Coulomb-Feld umgeben: ECoul. = - r Ze r r. 4πε 0 r 2 1 Im Rutherford'schen Atommodell wird nun angenommen, dass die Elektronen wie in einem Planetensystem den Kern auf Kreisbahnen durchlaufen. Im dynamischen Gleichgewicht muss dann aber die Coulomb-Kraft vom Betrag her gleich der Zentrifugalkraft sein. Im Falle von Wasserstoff (Z = 1) e2 4πε 0 r 2 = me rω 2 , ω= v r Die Energie dieses Systems setzt sich zusammen aus der kinetischen Energie der Elektronen: Ekin = 1 1 me v 2 = me r 2ω 2 2 2 und der potentiellen Energie, die am größten ist, wenn sich das Elektron im Unendlichen befindet. Diesen Wert setzen wir Null, und die potentielle Energie ist eine Bindungsenergie und damit negativ: r E pot = e2 ∫ 4πε r ' ∞ 2 dr ' = − 0 e2 4πε 0 r . Die Gesamtenergie ist dann: E ges = Ekin + E pot = 1 e2 . me r 2ω 2 − 2 4πε 0 r Aus der Gleichgewichtsbedingung folgt: E ges = e2 8πε 0 r − e2 4πε 0 r =− e2 8πε 0 r . Die Energie ist also eine Funktion des Radius der Elektronenbahn. Dieses Modell der klassischen Elektrodynamik kann zwar die Rutherford'schen Streuversuche erklären, aber nicht die Atomspektren: - Warum gibt es diskrete Emissions- und Absorptionslinien und nicht ein kontinuierliches Spektrum ? 56 - Warum strahlt das Atom nicht ständig ? Eine auf einer Kreisbahn bewegte Ladung ist ein rotierender Hertz'scher Dipol, der Energie in Form von elektromagnetischer Strahlung aussendet. Dieser ständige Energieverlust müsste dazu führen, dass der Radius immer kleiner wird und das Elektron auf einer Spiralbahn in den Kern stürzt. Diese Schwierigkeit umging Niels Bohr, der in der Gruppe von Sommerfeld arbeitete, 1912 mit seinem Atommodell. 5.2.2 Das Bohr'sche Atommodell Bohr postulierte, dass nur ganz bestimmte Elektronenbahnen erlaubt sind, auf denen das Elektron beim Umlauf um den Kern nicht strahlt. Dieses seien stationäre Zustände des Atoms. Es kann nur dann Energie absorbiert oder emittiert werden beim Übergang von einem stationären Zustand in einen anderen: Das Elektron im Wasserstoffatom kann sich strahlungslos nur auf bestimmten, kreisförmigen Umlaufbahnen (in stationären Zuständen) bewegen. Erstes Bohr'sches Postulat Das zweite Postulat sagt etwas über die Frequenz der Strahlung beim Übergang zwischen zwei stationären Zuständen aus: hν = EA − EE Zweites Bohr'sches Postulat Damit bleibt bei der Emission oder Absorption die Gesamtenergie erhalten. Das bedeutet für die Frequenzen am Wasserstoffatom: ν= E1 − E2 e2 e2 1 e2 1 1 =− − = − . h 8πε 0 hr1 8πε 0 hr2 8πε 0 h r2 r1 Damit die Frequenzen der Serienformel entsprechen, müssen also die Radien der stabilen Umlaufbahnen proportional zu den Quadraten ganzer Zahlen sein. Daher postulierte Bohr: r r r Der Betrag des Drehimpulses l = r × p = me vn rn ist gleich einem ganzzahligen Vielfachen von h : me vn rn = nh = nh 2π Drittes Bohr'sches Postulat Aus der Gleichgewichtsbedingung erhält man: e2 4πε 0 rn 2 = me rnω 2 = me ⇔ v n2 = vn 2 rn e2 4πε 0 me rn 1 Aus dem dritten Bohr’schen Postulat gilt aber auch: vn 2 = n 2 h2 . me 2 rn 2 57 Gleichsetzen beider Ausdrücke ergibt: n2 h2 1 e2 = me 2 rn 2 4πε 0 me rn ⇔ rn = 4πε 0 ε 0h2 h2 2 n = ⋅ n2 me e 2 π me e 2 Den Faktor vor dem n² nennet man „erster Bohr'scher Radius“ a0. Er beträgt: a0 = 4πε 0 ε 0h2 h2 = = 5, 29 ⋅ 10−11 m 2 2 me e π me e Wenn man den Radius der n-ten Bahn in den Ausdruck für die Frequenz beim Übergang 1 e2 1 1 − einsetzt und diesen Ausdruck mit der Serienformel vergleicht, bekommt 8πε 0 h r2 r1 man mit ν = c ⋅ν : π me e 2 1 e 2 π me e 2 − ν = 8πε 0 hc ε 0 h 2 n2 2 ε 0 h 2 n12 ν= 1 e 2 π me e 2 1 − 2 2 2 8πε 0 hc ε 0 h n2 n1 me e4 1 1 = − 2 2 3 2 8ε 0 h c n2 n1 = 1 Damit bekommt man für die Rydberg-Konstante des Wasserstoffs: me e 4 R∞ = . 8ε 0 2 h3c Dieser Wert R∞ weicht von dem beobachteten Wert RH um ca. 0,5% ab. Der Grund dafür ist, dass bei der obigen Betrachtung der Kern in Ruhe ist, im realen System Kern und Elektron um einen gemeinsamen Schwerpunkt kreisen. Daher muss die Masse me durch die reduzierte Masse mred = me ⋅ mKern ersetzt werden: me + mKern RH = R∞ ⋅ mKern me + mKern Die Gesamtenergie des Elektrons im Wasserstoff hängt ja auch von seinem Radius ab. Setzt man in die Energie die quantisierten Radien ein, so erhält man: En = − e2 8πε 0 rn =− me e 4 E e2 = − = − 20 . 2 2 2 2 8πε 0 a0 n 8ε 0 h n n 58 Die Energie der Bahnen ist damit wie folgt quantisiert: En = − Da ν = E0 n2 mit E0 = me e 4 = 13,6 eV 8ε 0 2 h 2 n = 1, 2, 3,... E2 − E1 ist, entstehen im Atomspektrum diskrete Linien und kein Kontinuum. h Die Energie im Grundzustand n = 1 beträgt E1 = E0 = –13,6 eV. Für n → ∞ , also wenn das Elektron ganz vom Atom entfernt wird, wird E = 0. Daher ist die Rydberg-Konstante gleichzeitig die Ionisierungsenergie bzw. die Bindungsenergie des Atoms. Trotz seiner Stärken gibt das Bohr'sche Atommodell die Wirklichkeit nicht allumfassend wieder. Es gibt zum Beispiel weder eine Erklärung, warum der Drehimpuls quantisiert sein soll, noch warum es stabile, nicht strahlende Zustände gibt. 5.2.3 Die Anwendung der de-Broglie-Wellen auf das Atom 1922, also 10 Jahre nach den Postulaten Bohrs konnte de-Broglie eine Begründung für die Impulsquantisierung angeben. Dieses war eine von de-Broglies ursprünglichen Argumenten, dass Teilchen auch Wellencharakter haben und man ihnen über ihre Wellenlänge einen Impuls zuordnen kann. Nach de-Broglie hat ein Teilchen mit dem Impuls p eine Wellenlänge von λ = h . p Er behauptete, dass die Materiewelle der Elektronen auf den stabilen Bohr'schen Bahnen eine stehende Welle bildet. Wäre das nicht der Fall, so würden die Wellen mit sich selbst weginterferieren. Stehende Wellen sind also stabil, und deshalb strahlt ein Elektron mit einer stehenden Elektronenwelle keine Energie nach außen ab. Daher sind die einzig möglichen Bahnen diejenigen, deren Umfang ein ganzzahliges Vielfache der Wellenlänge ist: 2π rn = n ⋅ λ , Mit λ = h h ergibt sich: = p me v me vn rn = nh = n h, 2π n = 1, 2, 3,... n = 1, 2, 3,... , und das ist gerade die von Bohr postulierte Impulsquantisierung. Der Welle-Teilchen-Dualismus ist damit der Schlüssel zur Struktur der Atome. Die Bohr'sche Theorie lieferte für Wasserstoff und Ionen mit nur einem Elektron eine recht gute Übereinstimmung mit den experimentellen Beobachtungen. Wenn es aber um Elemente mit mehr als einem Elektron geht, dann versagt die Bohr-Rutherford'sche Vorstellung der planetenhaften Beschreibung des Atoms. Bereits beim Helium kann man noch nicht einmal die Spektrallinien richtig vorhersagen. Abhilfe schaffte erst die komplett quantenmechanische Beschreibung mit Hilfe der sog. Schrödinger-Gleichung. 59 5.3 Quantentheorie der Atome In der Quantentheorie wird ein Elektron durch eine Wellenfunktion ψ beschrieben. Das Betragsquadrat ψ dieser Wellenfunktion liefert die Aufenthaltswahrscheinlichkeitsdichte, die multipliziert mit dem Volumenelement dV die Wahrscheinlichkeit angibt, das Elektron in genau diesem Volumenelement zu finden. Die Randbedingungen (z. B. stehende Welle auf dem Bahnumfang o.ä.) führen zu einer Quantisierung der Wellenlängen und damit auch der Energie. 2 5.3.1 Die Schrödinger-Gleichung für das Wasserstoffatom Genau wie für die Lichtwellen die Wellengleichung Auskunft über die zeitliche und räumliche Entwicklung von elektromagnetischen Wellen gibt, so gibt es ebenfalls eine Gleichung, durch die man die Materiewellen beschreiben kann. Erwin Schrödinger hat 1926 die sog. Schrödinger-Gleichung empirisch formuliert, für die er 1933 den Nobelpreis bekommen hat. In einer Dimension laute die zeitabhängige Schrödinger-Gleichung: − h 2 ∂ 2ψ ( x, t ) ∂ψ ( x, t ) + E pot ⋅ψ ( x, t ) = ih 2 2m ∂x ∂t Sie ist genau wie die Wellengleichung eine partielle Differentialgleichung. Im Gegensatz zur klassischen Wellengleichung verknüpft sie aber die zweite Ableitung nach dem Ort mit der ersten Ableitung nach der Zeit. Ferner ist sie durch das i imaginär. Das liegt unter anderem daran, dass die Wellenfunktion ψ allein nicht messbar ist, sondern nur die Aufenthaltswahrscheinlichkeit ψ dV. Und das Betragsquadrat der komplexen Wellenfunktion ist reell. 2 In drei Dimensionen wird die zweite räumliche Ableitung zum Laplace-Operator und die Schrödinger-Gleichung zu: r h2 r r ∂ψ (r , t ) − ∆ψ (r , t ) + E pot ⋅ψ (r , t ) = ih . 2m ∂t In der Mechanik spielen oft Lösungen der Wellengleichung für stehende Wellen eine große Rolle. Auch im Atom haben wir gesehen, dass sich die stabilen Bohr'schen Bahnen durch stehende Materiewellen definieren. Das heißt, dass sich der Ort mit der Zeit nicht mehr ändert, sondern nur die Amplitude. Die Wellenfunktion für einen solchen Fall lautet also: ψ% ( x, t ) = ψ ( x) ⋅ e − iωt . Setzt man diese Wellenfunktion in die rechte Seite der Schrödinger-Gleichung ein, dann erhält man: ih ∂ψ% ( x, t ) = ih(−iω ) ⋅ψ ( x) ⋅ e − iωt = hω ⋅ψ ( x) ⋅ e −iωt = E ⋅ψ ( x) ⋅ e −iωt . ∂t 60 Da auf der linken Seite nur nach dem Ort differenziert wird, bleibt der Faktor e− iωt dort stehen. Er kann deshalb auf beiden Seiten gekürzt werden. Damit erhält man für stationäre Zustände die sog. zeitunabhängige Schrödinger-Gleichung: − h 2 ∂ 2ψ ( x) + E pot ⋅ψ ( x) = E ⋅ψ ( x) 2m ∂x 2 − h2 r r r ∆ψ (r ) + E pot ⋅ψ (r ) = E ⋅ψ (r ) 2m oder in drei Dimensionen: Im Atom ist die potentielle Energie gegeben durch die Coulomb-Energie, die wir beim Rutherford'schen Atommodell schon kennen gelernt haben: r E pot = e2 ∫ 4πε r ' ∞ 0 2 dr ' = − e2 4πε 0 r . Damit wird die Schrödinger-Gleichung beim Wasserstoffatom: − e2 h2 r r r ∆ψ (r ) − ⋅ψ (r ) = E ⋅ψ (r ) 2m 4πε 0 r Bei einem einzelnen isolierten Atom hat man er mit einem radial-symmetrischen Problem zu tun, das heißt, dass die potentielle Energie Epot nur vom radialen Abstand r = x 2 + y 2 + z 2 abhängt. Bei solchen Problemen bieten sich in der Regel Kugelkoordinaten r , θ , φ an, weil sie dieselbe Symmetrie repräsentieren. Sie hängen mit den üblichen kartesischen Koordinaten wie folgt zusammen: x = r ⋅ sin θ ⋅ cos φ y = r ⋅ sin θ ⋅ sin φ z = r ⋅ cosθ Man muss nun also den Laplace-Operator, der in kartesischen Koordinaten lautet: ∆= ∂2 ∂2 ∂2 , + + ∂x 2 ∂y 2 ∂z 2 umschreiben in Kugelkoordinaten. Das ist im Prinzip nicht sehr schwierig, aber aufwändig. Er lautet: ∆= ∂2 2 ∂ 1 ∂ ∂ 1 ∂2 + + sin θ + ∂θ r 2 sin 2 θ ∂φ 2 ∂r 2 r ∂r r 2 sin θ ∂θ Wie man sich vorstellen kann, wird die Differentialgleichung immer unübersichtlicher. Man kann die Wellenfunktion jedoch separieren, d. h. darstellen als Faktoren, die jeweils von nur einer einzigen Koordinate abhängen: ψ n,l ,ml (r ,θ , φ ) = Rn,l (r ) ⋅ Θl ,ml (θ ) ⋅ Φ ml (φ ) 61 5.3.2 Der Radialteil und die Hauptquantenzahl n Man betrachtet zunächst nur den Radialteil der Wellenfunktion ohne Berücksichtigung der − r ψ 1,0,0 = R1,0,0 (r ) = e a . Winkelabhängigkeit und macht einen einfachen Ansatz: Einsetzen in die Schrödinger-Gleichung unter der Vereinfachung, dass R nicht von θ und φ abhängig ist. r r − − h 2 ∂ 2 e a 2 ∂e a − + 2me ∂r 2 r ∂r r r − e2 − a a − 4πε r e = E1 ⋅ e 0 Da man ständig die Ableitungen der Funktion braucht, stellen wir sie uns bereit: ∂ −a 1 − e =− e a ∂r a r ∂2 − a 1 − a e = 2e ∂r 2 a r r r Damit bekommt man: ⇔ r r 1 −r 2 −r − e2 − a e = E1 ⋅ e a 2 e a − e a− ar a 4πε 0 r − h2 2me − h2 e2 h2 E − + − 1 2me a 2 me a 4πε 0 1 =0 r Damit die rechte Seite identisch Null ist, setzt man zunächst den Faktor vor dem h2 e2 = me a 4πε 0 ⇔ a= 1 Null: r 4πε 0 h 2 = a0 me e2 Nullsetzen der konstanten Terme und Einsetzen von a liefert die Energie: E1 = − h 2 me 2 e 4 m e e4 me e 4 h2 = − = − = − = −13,6 eV 2me a 2 2me (4πε 0 h 2 ) 2 32π 2ε 0 2 h 2 8ε 0 2 h 2 Das Ergebnis ist gerade die Bindungsenergie der ersten Bohr'schen Bahn mit einem a, das dem ersten Bohr'schen Radius a0 entspricht. Die Wellenfunktion ψ (r ) = Rn,l ,ml (r ) = e − r a besitzt keine Knoten und ist damit die Welle mit dem kleinsten n, also n = 1. Deshalb ist das dazugehörige E auch E1. Die nächste Funktion, die die Schrödinger-Gleichung löst, ist mit einem Knoten: ψ 2,0,0 = R2,0,0 (r ) = 1 − r r − 2a e . 2a Wieder bestimmen wir die Ableitungen: ∂ r − 2a 1 r − = − + 2 e 2a 1 − e ∂r 2a a 4a r r ∂2 r − 2a 3 r − 2a 1 − e = − e 2 ∂r 2 2a 8a 3 4a r r 62 Einsetzen in die Schrödinger-Gleichung: h2 3 r 2 2 e2 r + 2 + E2 + 1 − 2− 3− =0 2me 4a 4πε 0 r 2a ar 4a 8a 4πε 0 h 2 1 Nullsetzen des Faktors vor dem liefert wieder: a = = a0 r me e 2 Nullsetzen des Faktors vor r ergibt: 2me 1 =− E2 3 8a 2a h 2 ⇔ E2 = − me e 4 1 1 = E1 = − E0 2 2 4 4 32ε 0 h Als letztes die dritte Funktion mit zwei Knoten, die die Schrödinger-Gleichung löst: ψ 3,0,0 (r ) = R3,0,0 (r ) = 1 − 2r 2r 2 + 3a 27 a 2 Auch hier erhält man auf demselben Wege wieder: a = und: E3 = − − 3ra e . 4πε 0 h 2 = a0 me e 2 me e 4 1 1 = E1 = − E0 2 2 9 9 72ε 0 h Verallgemeinert findet man genau wie im Bohr'schen Modell: En = − me e4 1 E = − 20 2 2 2 8ε 0 h n n mit n = 1, 2, 3,... Das sind die Energiezustände des Wasserstoffatoms für die Elektronenschale n (mit l = 0 und ml = 0). Die Zahl n, die die Schale festlegt, nennt man die Hauptquantenzahl: n = 1, 2, 3,... Die Wellenfunktion allein hat, wie wir schon gesehen haben, keine physikalische Bedeutung. Eine messbare Eigenschaft wird erst dem Betragsquadrat in Form einer Aufenthaltswahrscheinlichkeitsdichte zuteil. Da sich das Elektron irgendwo im Raum aufhalten muss, gilt folgende Normierungsbedingung: * ∫∫∫ψ (r ) ⋅ψ (r ) dV = 1 . V Das Volumenelement in Polarkoordinaten lautet: dV = r 2 sin φ dr dθ dφ . Damit: ∞ π 2π ∫∫ ∫ ψ * (r ) ⋅ψ (r ) ⋅ r 2 sin φ dr dθ dφ . 0 0 0 Für den Radialteil allein beträgt die Aufenthaltswahrscheinlichkeitsdichte also ψ r 2 . Die Schalen für l = 0 und ml = 0 sind demnach kugelsymmetrisch und haben n – 1 Knoten. 2 63 5.3.3 Der Bahndrehimpuls und die Quantenzahlen l und ml Bisher haben wir den Winkelanteil einfach weggelassen. Um aber stehende Wellen im dreidimensionalen Raum vollständig zu beschreiben, benötigt man neben der Hauptquantenzahl n noch zwei weitere Quantenzahlen, nämlich l und ml. Dazu machen wir folgende Überlegung: r r - Ein Wellenpaket mit Wellenzahl k bewege sich auf einem Kreis mir Radius r . Das Koordinatensystem legen wir so, dass die Kreisbahn in der x-y-Ebene liegt. r r r Drehimpuls in z-Richtung ist dann Lz = r × p = r ⋅ hk . - Wellenfunktion: ψ = ψ 0 ⋅ ei ( ks −ωt ) = ψ 0 ⋅ ei ( krφ −ωt ) . - Da sich eine stehende Welle auf dem gesamten Kreis bildet, gelten die Randbedingungen: ψ (φ = 0) = ψ (φ = 2π ) ; außerdem fällt die Zeitabhängigkeit weg, so dass gelten muss: eikr ⋅2π = eikr ⋅0 = 1 . Das ist nur erfüllt, wenn kr eine ganze Zahl ist, die wir ml nennen. Deshalb ist der z-Komponente des Bahndrehimpulses des Elektrons: r Lz = r ⋅ hk = ml ⋅ h, ml ∈ Z. Man kann tatsächlich zeigen, dass die Funktion Φ ml (φ ) in der separierten Darstellung unserer Wellenfunktion tatsächlich von der Form Φ ml (φ ) = eimlφ ist. Bleibt noch die Funktion Θl ,ml (θ ) . Sie ist die komplizierteste von den dreien und lässt sich darstellen als Θl ,ml (θ ) = (2l + 1) ⋅ (l − ml )! ml ⋅ Pl (cos θ ) , 4π ⋅ (l + ml )! wobei Pl ml (cos θ ) die sog. zugeordneten Legendre-Polynome sind: Pl ml ( x) = (−1) ml 1 − x2 2l ⋅ l ! ( ) ml 2 l d l + ml x2 − 1 . l + ml dx ( ) Die Quantenzahl l wird als Nebenquantenzahl bezeichnet und gibt die Größe des Bahndrehimpulses an: r2 L = l ⋅ (l + 1) ⋅ h 2 ⇒ r L = l ⋅ (l + 1) ⋅ h Im Zustand mit n = 1 ist der Bahndrehimpuls Null. Die Nebenquantenzahl l darf nur ganzzahlige Werte von 0 bis n – 1 annehmen: l = 0, ..., n − 1, l ganzzahlig 64 r Die z-Komponente Lz des Bahndrehimpulses, die wir schon kennen gelernt haben, darf r natürlich nicht größer sein als der maximal erlaubte Bahndrehimpuls L . Daher gilt als Einschränkung für die sog. magnetische Quantenzahl ml: ml = 0, ± 1, ± 2, ..., ± l r Daher kann L niemals in die z-Achse fallen, sondern beschreibt Kegelflächen um die zr Achse. Der Betrag von L gibt den Radius der Kugel an. Der gesamte Winkel-Anteil der separierten Wellenfunktion Θl ,ml (θ ) ⋅ Φ ml (φ ) wird dargestellt als sog. Kugelflächenfunktion: Yl ,ml (θ ,φ ) = (2l + 1) ⋅ (l − ml )! ml ⋅ Pl (cos θ ) ⋅ eimlφ 4π ⋅ (l + ml )! Auch den Radialteil muss man natürlich normieren: l Rn ,l (r ) = mit Lsk ( x) = 5.3.4 ( d s x d k k −x e x e dx s dx k ) r 2 2r 2l +1 2r − na Ln + l ⋅ e n 2 na na (zugeordnetes Laguerre-Polynom). Quantenzahlen und Atomorbitale Zusammenfassend haben wir bisher 3 Quantenzahlen kennen gelernt: Hauptquantenzahl n = 1, 2, 3,.. Elektronen-Schale Nebenquantenzahl l = 0, 1, 2, ..., n − 1 maximaler Bahndrehimpuls Magnetische Quantenzahl ml = 0, ± 1, ± 2, ..., ± l z-Komponente des Bahndrehimpulses 1. Schale: n=1 l kann nur 0 sein. ml kann auch nur Null sein. → Es gibt ein Orbital 1s-Orbital l = 0 : s-Orbital 65 2. Schale: n=2 l kann nur 0 und 1 sein. ml = 0 für l = 0 → Es gibt ein 2s-Orbital ml = -1, 0, +1 für l = 1 → Es gibt drei 2p-Orbitale (px, py, pz) l = 1 : p-Orbital 3. Schale: n=3 l kann nur 0, 1 und 2 sein. 4. Schale: ml = 0 für l = 0 → Es gibt ein 3s-Orbital ml = -1, 0, +1 für l = 1 → Es gibt drei 3p-Orbitale (px, py, pz) ml = -2, -1, 0, +1, +2 für l = 2 → Es gibt fünf 3d-Orbitale (dxz, dyz, dxy, dx²-y², dz²) ml = 0 für l = 0 → Es gibt ein 4s-Orbital ml = -1, 0, +1 für l = 1 → Es gibt drei 4p-Orbitale (px, py, pz) ml = -2, -1, 0, +1, +2 für l = 2 → Es gibt fünf 4d-Orbitale (dxz, dyz, dxy, dx²-y², dz²) ml = -3, -2, -1, 0, +1, +2, +3 für l = 3 → Es gibt sieben 4f-Orbitale n=4 l kann nur 0, 1, 2 und 3 sein. Nomenklatur: l = 0: l = 1: l = 2: l = 3: s-Orbital p-Orbital d-Orbital f-Orbital (sharp) (principle) (diffuse) (fundamental) 66 5.3.5 Die vierte Quantenzahl – der Spin Während man das Spektrum des Wasserstoffs sehr schön durch die Schrödinger-Gleichung beschreiben kann, trifft das für kompliziertere Atome nicht mehr zu. So findet man zum Beispiel bereits bei Natrium eine gelbe Linie, die bei größerer Auflösung aus 2 Linien besteht. λ1 = 589, 6 nm λ2 = 589,0 nm Diese Aufspaltung der Linien und damit auch der Energieniveaus nennt man Feinstruktur. Der Grund ist, dass das Elektron noch eine weitere Eigenschaft hat, die man zu seiner vollständigen Beschreibung benötigt, nämlich den sog. Spin. Der Spin ist ein Eigendrehimpuls des Elektrons, dessen z-Komponente die Werte 1 Sz = ± h 2 annehmen kann. Man nennt die Quantenzahl ms = ± 1 daher auch die Spinquantenzahl. 2 Der Spindrehimpuls beträgt analog zum Bahndrehimpuls: S = s ⋅ ( s + 1) ⋅ h = 3 h mit s = ½ 2 (entsprechend dem l). Doch wie kommt es jetzt zu dieser Aufspaltung ? - Wir betrachten ein Teilchen der Masse m und der Ladung q, das sich mit der Geschwindigkeit v auf einer Kreisbahn mit dem Radius r bewegt. Der Bahndrehimpuls ist gleich L = mvr . Das kreisende Teilchen hat als Kreisstrom ein magnetisches Moment µ = I ⋅ A = I ⋅ π r 2 . q 2π r Der Strom ist gerade I = mit t = : Umlaufzeit. - Das magnetische Moment ist dann: µ = I ⋅ A = - - - t v q⋅v 1 q π r = qvr = L. 2π r 2 2m r q r Für eine positive Ladung haben µ und L die gleiche Richtung: µ = L 2m Da der Bahndrehimpuls gequantelt ist, kann man das magnetische Moment in Einheiten des r r L r qh L Drehimpulsquants ausdrücken: µ = . h 2m h r r eh L L = −µB Für ein Elektron ( m = me , q = −e ) ergibt sich dann: µl = − 2me h h r Darin ist µ B das Bohr'sche Magneton mit µ B = eh = 9, 274 ⋅ 10−24 Am 2 . 2me Das oben gesagte gilt aber bloß für Bahndrehimpulse. 67 Beim Spin misst man ein magnetisches Moment, das doppelt so groß ist, wie es sich aufgrund des Spindrehimpulses ergeben müsste. Diesen Faktor 2 nennt man gyromagnetisches Verhältnis ge = 2 und drückt aus, dass man sich den Spin eben nicht als Eigenrotation einer geladenen Kugel vorstellen darf. Deshalb ist das magnetische Moment, das vom Spin herrührt: r r r eh S eh S S µs = − ge ⋅ = −2 ⋅ = −2 µ B 2me h 2me h h r Ein Elektron in einem Atom hat also sowohl ein Bahnmoment als auch ein Spinmoment. Entsprechend der klassischen Mechanik kann man die beiden Drehimpulse zu einem Gesamtdrehimpuls addieren: r r r J =L+S Für den Fall l = 1 gibt es damit für Elektronen unterschiedlichen Spins auch zwei verschiedene Gesamtdrehimpulse j = l + s = 1 + 1 3 1 1 = sowie j = 1 − = . Elektronen im Atom mit 2 2 2 2 gleichem n und l, aber unterschiedlichen j haben leicht unterschiedliche Energie. Man kann sich das leicht vorstellen, weil einmal das Spinmoment in Richtung des Bahnmoments steht und einmal entgegengesetzt. Ein Umklappen des Spins zieht also eine Energieänderung nach sich. Dieser Effekt heißt Spin-Bahn-Kopplung und ist verantwortlich für die Feinstrukturaufspaltung der Spektrallinien. Das bedeutet, dass der 2p-Zustand aufspaltet in einen 2p3/2 und einen 2p1/2 Zustand. Ein sZustand spaltet nicht auf, denn hier ist ja L = 0, weswegen es auch kein Bahnmoment gibt, mit dem der Spin des Elektron koppeln könnte. 5.4 Mehrelektronen-Atome 5.4.1 Das Pauli-Prinzip Bisher haben wir nur das Wasserstoffatom gerechnet, was besonders einfach ist, weil es sich um ein Zwei-Teilchenproblem handelt, das man noch ganz gut analytisch lösen kann. Natürlich wurden auch über die Emissionsspektren die Energieniveaus von Atomen mit mehr als nur einem Elektron angeschaut. Diese Niveaus sind nicht dieselben wie beim Wasserstoff, denn die Elektronen wechselwirken nicht nur mit dem Kern (Bindungsenergie), sondern auch untereinander (Coulomb-Abstoßung). Man beobachtet: Die Energieniveaus hängen nicht wie beim Wasserstoff nur von n ab, sondern auch von l. Leider ist die Schrödinger-Gleichung für Mehrelektronensysteme nicht mehr analytisch, sondern nur noch mit Näherungsverfahren lösbar. Die einfachste Herangehensweise ist diejenige, indem man sagt, dass jedes Elektron im Atom einen Zustand besetzt, den man durch die 4 Quantenzahlen n, l, ml und ms charakterisieren kann. 68 Um jedoch die Besetzung der Elektronenzustände in einem Atom verstehen zu können braucht man ein weiteres Prinzip, das Pauli-Prinzip: In einem Atom können zwei Elektronen nicht gleichzeitig denselben Quantenzustand besetzen. Das bedeutet, dass zwei Elektronen in einem Atom niemals in allen 4 Quantenzahlen übereinstimmen dürfen. Das Pauli-Prinzip gilt für identische Teilchen mit halbzahliger Spin-Quantenzahl 1 3 2 2 ( ms = , ,... ), also für Elektronen, Neutronen, Protonen (kurz: die Teilchen, die die Materie ausmachen). Man nennt sie Fermionen (nach Enrico Fermi). Das Pauli-Prinzip gilt nicht für Teilchen mit ganzzahligem Spin ( ms = 0, 1,... ), wie z. B. das Photon oder das π-Meson. Diese Teilchen nennt man Bosonen (nach S. N. Bose), und diese Teilchen vermitteln die Wechselwirkungen (Kräfte) zwischen den Materie-Teilchen. Das Pauli-Prinzip bildet die Grundlage für das Verständnis nicht nur von komplexen Atomen, sondern auch für Molekülbindungen, Festkörpern usw. 5.4.2 Das Periodensystem der Elemente Alle Elektronen müssen insgesamt unterschiedliche Quantenzahlen haben. Wie viele Elektronen passen dann in eine Schale (mit gleichen n) ? Zu jeder Hauptquantenzahl n gibt es n verschiedene Werte von l, nämlich l = 0, 1, 2,... n – 1. Zu jedem l existieren (2l + 1) Werte für ml, nämlich ml = 0, ±1, ±2, ..., ±l. D. h. die Gesamtzahl der möglichen Zustände beträgt (ohne Spin): n −1 n ∑ (2l + 1) = 1 + 3 + 5 + ... + 2n − 5 + 2n − 3 + 2n − 1 = 2n 2 = n 2 . l =0 Jeder dieser n² Zustände kann von zwei Elektronen mit unterschiedlichem Spins 1 1 2 2 gleich 2n 2 ist. ( ms = − , + ) besetzt werden, so dass die maximale Anzahl von Elektronen in der Schale n Die Angabe der Quantenzahlen n, l, ml und ms für jedes Elektron in dem Atom nennt man Elektronenkonfiguration. Man schreibt die Nebenquantenzahl l meist nicht als Zahl, sondern den schon erwähnten Kleinbuchstaben: Bezeichnung: Wert von l: s 0 p 1 d 2 f 3 g 4 h 5 69 Die Hauptquantenzahl n wird oft auch als Großbuchstabe geschrieben, allerdings weniger bei der Elektronenkonfiguration, sondern eher, wenn es um Röntgenlinien geht. Bezeichnung: Wert von n: K 1 L 2 M 3 N 4 O 5 P 6 Das Atom des leichtesten Elements Wasserstoff haben wir schon besprochen: Es hat ein Elektron, das im Grundzustand natürlich in das tiefstmögliche Niveau geht, nämlich n = 1. Also: n=1 l=0 ml = 0 ms = ½ Der Spin könnte im Prinzip auch -1/2 sein, aber der Grundzustand eines Mehrelektronenatoms wird durch die sog. Hund'schen Regeln bestimmt, von denen es 3 gibt, die in der angegebenen Reihenfolge abgearbeitet werden: 1. Hund'sche Regel: Der Gesamtspin ist zu maximieren. 2. Hund'sche Regel: Der Gesamtbahndrehimpuls ist zu maximieren. 3. Hund'sche Regel: Ist die Schale weniger als halbvoll, gilt: J = L − S Ist die Schale mehr als halbvoll, gilt: J = L + S Wegen der ersten Hund'schen Regel ist also ms beim Wasserstoffelektron +1/2 und nicht -1/2. Die Elektronenkonfiguration des Wasserstoffs lautet also: 1s1. Auf den Wasserstoff folgt nun das Helium mit zwei Elektronen mit den Quantenzahlen: n=1 n=1 l=0 l=0 s s ml = 0 ml = 0 ms = ½ ms = – ½ Wegen des Pauli-Prinzips muss das zweite Elektron den Spin – ½ haben. Der Gesamt-Spindrehimpuls ist damit S = ½ – ½ = 0. Damit lautet die Elektronenkonfiguration des Heliums: 1s2. Da für die erste Schale l und ml Null sein müssen, passt nun kein weiteres Elektron mehr in die 1. Schale hinein. Ein Element mit einer vollen Schale hat die sog. Edelgaskonfiguration. Solche Elemente sind besonders stabil und damit chemisch inaktiv. Die Bindungs- und damit Ionisierungsenergie für das erste Elektron beträgt 24,6 eV Das nächste Element ist Lithium mit drei Elektronen. Da das dritte Elektron nicht mehr in die erste Schale passt, muss es in die nächst höhere L-Schale (n = 2) eingebaut werden. Dieses hat jetzt seine maximale Aufenthaltswahrscheinlichkeit beim zweiten Bohr'schen Radius, also einen deutlich größeren Abstand vom Kern wie die beiden ersten Elektronen in der K-Schale. 70 Die positive Kernladung wird jetzt allerdings von den inneren beiden Elektronen abgeschirmt. Die effektive Kernladung wäre damit also +1e. Allerdings gibt es auch eine gewisse Aufenthaltswahrscheinlichkeit in Kernnähe, so dass man eine effektive Kernladung hat, die etwas größer als 1e ist. Diese Durchdringung der ersten Schale ist für l = 0 größer als für l = 1, so dass die Bindungsenergie für ein s-Elektron vom Betrag größer ist als für ein p-Elektron. Daher werden erst die Zustände mit l = 0 besetzt und dann erst diejenigen mit l = 1. n=1 n=1 n=2 l=0 l=0 l=0 s s s ml = 0 ml = 0 ml = 0 ms = ½ ms = – ½ ms = ½ Damit hat Lithium die Elektronenkonfiguration: 1s22s1. Die Bindungsenergie des äußeren Elektrons beträgt nur 5,39 eV. Daher kann es relativ leicht ionisiert werden, was Lithium chemisch sehr reaktiv macht. Es verhält sich beinahe wie ein 1Elektronen-Atom. Beim Beryllium kommt ein weiteres Elektron dazu, das wie beim Helium mit umgekehrten Spin in den s-Zustand (l = 0) geht. Die Elektronenkonfiguration ist hier: 1s22s2. Beim Bor muss das fünfte Elektron nun einen Zustand besetzen mit l = 1. Damit wird die pUnterschale aufgemacht. Das Elektron muss nach den Hund'schen Regeln Spin- und Bahnmoment maximieren, so dass es in den Zustand ml = +1 und ms = + ½ geht. n=1 n=1 n=2 n=2 n=2 l=0 l=0 l=0 l=0 l=1 s s s s p ml = 0 ml = 0 ml = 0 ml = 0 ml = 1 ms = ½ ms = –½ ms = ½ ms = –½ ms = ½ Damit hat Bor die Elektronenkonfiguration: 1s22s22p1. Bis zum Neon werden also die p-Zustände aufgefüllt, und zwar nach den Hund'schen Regeln: n=2 n=2 n=2 n=2 n=2 n=2 l=1 l=1 l=1 l=1 l=1 l=1 p p p p p p ml = 1 ml = 0 ml = -1 ml = 1 ml = 0 ml = -1 ms = ½ ms = ½ ms = ½ ms = –½ ms = –½ ms = –½ Die p-Unterschale kann also 6 Elektronen aufnehmen. Neon hat damit: 1s22s22p6 und wieder eine volle 2. Schale, also Edelgaskonfiguration. Das nächste Element Natrium muss also wieder eine neue Schale eröffnen, die M-Schale (n = 3). Mit derselben Argumentation wie beim Lithium hat Natrium wieder eine geringe Bindungsenergie von 5,14 eV und ist wieder recht reaktiv. Das gilt für die gesamte Gruppe, man nenn sie Alkalimetalle. Es werden also erneut zunächst die s- und dann die p-Elektronen aufgefüllt. 71 Die dritte Schale darf aber auch noch l = 2 haben, also die sog. d-Elektronen. Doch weil die Durchdringung der inneren Schalen inzwischen so stark ist, werden erst die s-Elektronen der 4. Schale besetzt (K und Ca). Dann erst beginnt das Auffüllen der 3d-Schale, die 5 Orbitale (dz², dx²-y², dxy, dxz, dyz) mit jeweils 2 Elektronen besitzt, also insgesamt 10 Elektronen beherbergen kann. Die Elemente, die die inneren 3d-Schalen auffüllen nennt man Nebengruppen-Elemente (oder auch Übergangsmetalle) im Gegensatz zu den Hauptgruppen-Elementen, die die sund p-Niveaus besetzen. So setzt sich das Auffüllen weiter fort, bis endlich in der 6. Periode die f-Elektronen (l = 3) der eigentlich 4. Schale gefüllt werden. 5.5 Röntgenspektren Sowohl in den Naturwissenschaften als auch in der Technik bzw. Medizin spielen Röntgenstrahlen eine große Rolle. Man erzeugt sie durch Beschuss einer Metallanode (auch Antikathode genannt) mit Elektronen. Üblich sind Röntgenröhren mit Wasserkühlung und drehbarer Antikathode. Röntgenstrahlung ist elektromagnetische Strahlung mit hohen Energien zwischen 1 und 100 keV, d. h. Wellenlängen zwischen 1,2 nm und 12 pm. 5.5.1 Röntgenbremsstrahlung Die Elektronen, die aus der Kathode austreten, werden durch eine Beschleunigungsspannung UA auf die kinetische Energie eUA beschleunigt. Elektronen werden bei Auftreffen auf die Anode abgebremst. Eine abgebremste Ladung strahlt nach den Regeln der klassischen Elektrodynamik elektromagnetische Strahlung ab, die sog. Bremsstrahlung. Bei einer Abbremsung auf 0 wird die ganze kinetische Energie eUA in Strahlungsenergie umgewandelt. Die maximale Frequenz bzw. Wellenlänge der Röntgenstrahlung ist also: hν max = eU A bzw. λmax = hc . eU A Das Elektron kann aber auch seine Energie in mehreren Abbremsvorgängen abgeben, wodurch kleinere Frequenzen entstehen. Da bei den freien Elektronen die Energie nicht gequantelt ist, entsteht ein kontinuierliches "weißes" Spektrum. 72 5.5.2 Röntgenlinienspektrum Neben der weißen Röntgenbremsstrahlung findet man charakteristische Linien. Sie entstehen dadurch, dass die hochenergetischen Elektronen aus den inneren Schalen des Atoms der Antikathode Elektronen herausschlagen. Das Atom wird also ionisiert. Die innere Lücke wird wieder geschlossen, indem aus den höheren Schalen Elektronen herunterfallen. Übergänge in die n = 1 Schale nennt man wie die Schale selbst K-Linien. Entsprechend gibt es für die Schalen mit n = 2, 3, 4,... die Bezeichnungen L, M, N,...-Linien. Die nachgestellten griechischen Buchstaben geben an, von welcher höheren Schale die Emission ausgeht: α bedeutet von n + 1 β bedeutet von n + 2 γ bedeutet von n + 3, usw. Die Anregungsenergie, d. h. die kinetische Energie des ankommenden Elektrons, muss größer oder gleich der Bindungsenergie des herauszuschlagenden Elektrons sein. Dann können aus den höheren Schalen Elektronen nachrücken, die eine Serie bilden (K-Serie, L-Serie, usw.) Die maximale Energie wird Kante der Serie genannt (K-Kante, L-Kante, usw.) Die Energien der Linien folgen dem Mosley'sches Gesetz: (Henry Mosley (1887 – 1915)) 1 1 hν n→m = RH ( Z − σ ) 2 2 − 2 n m Dabei ist Z die Ordnungszahl des Elements des Antikathode, RH die Rydberg-Konstante des Wasserstoffs. Der Wert von σ gibt die Abschirmung der Kernladung durch innere Elektronenschalen an und hat für jeden Übergang einen anderen Wert: Für Kα ist σ = 1, Für Kβ ist σ = 1, für Lα ist σ = 7,4... Trägt man also die Wurzel der Frequenz einer Linie (z.B. Kα) von verschiedenen Elementen über der Ordnungszahl auf (= Mosely-Plot), so ergibt sich eine Gerade. Auf diese Art wurde von vielen Elementen die Ordnungszahl bestimmt. 73 6. Strahlungsquellen 6.1 Laser Der Begriff LASER ist ein Kunstwort und setzt sich zusammen aus: Light Amplification by Stimulated Emission of Radiation, also Lichtverstärkung durch stimulierte Emission. Ein Laser hat ganz besondere Eigenschaften, die ihn als Lichtquelle attraktiv machen: - Monochromatisches (einfarbiges) Licht Kohärentes Licht Starke Parallelität des Lichtbündels Hohe Lichtintensität Anwendungsmöglichkeiten reichen vom einfachen Laserpointer über Interferometrie, Laserschweißen, Medizin usw. Es gibt verschieden Typen von Lasern: - Gaslaser (HeNe-Laser, Ar-Ionen, CO2-Laser) Farbstofflaser (mit Fluoreszenzfarbstoffen, von außen zum Leuchten angeregt) Festkörperlaser (YAG-Laser, Rubin-Laser, Titan-Saphir-Laser) Halbleiterlaser (Laser-Dioden) Freie-Elektronen-Laser (Synchrotronstrahlung aus Elektronenstrahl) All diesen Lasertypen gemein ist der Mechanismus der Lichterzeugung, nämlich die stimulierte Emission. 6.1.1 Stimulierte Emission Wir haben im letzten Kapitel gesehen, dass ein Übergang von einem Energieniveau der Elektronenhülle auf ein anderes mit Lichtemission erfolgen kann. Die Frequenz der emittierten Strahlung war ja bekanntermaßen: ν= E2 − E1 . h Ludwig Boltzmann zeigt im Jahr 1872, dass im thermischen Gleichgewicht das Verhältnis der Zahl der Atome in diesen beiden Niveaus mit der Energiedifferenz der Niveaus verknüpft ist: − N2 =e N1 E2 − E1 k BT Da E2 > E1 und T > 0, folgt N2 < N1, d. h. die Zahl der Atome im höheren Niveau ist immer kleiner als die im niedrigeren. 74 Es gibt nun drei Arten von Übergängen: 1. spontane Emission: Das Elektron fällt spontan von E2 auf E1 und emittiert dabei ein Photon. Die spontane Emission ist stark von Kollisionen zwischen Atomen beeinflusst und ist unterliegt damit sehr der Wahrscheinlichkeit. Daher sind die emittierten Wellenzüge durch die spontane Emission, wie sie in Glühlampen, der Sonne und Gasentladungslampen vorkommt, unkorreliert und damit nicht kohärent. 2. induzierte Absorption: Trifft ein Photon der Frequenz ν = E2 − E1 auf ein Atom, so wird die Energie h absorbiert, wodurch das Elektron vom Niveau 1 auf das höhere Niveau 2 übergeht. Die elektromagnetische Welle wird dadurch in der Intensität gedämpft. 3. stimulierte Emission: Ein Photon der Frequenz ν = E2 − E1 trifft auf ein Atom, das im angeregten Zustand h (Elektron auf Niveau 2) ist. Es stimuliert die Emission eines Photons mit genau derselben Frequenz, wodurch das Elektron in das Niveau 1 übergeht. Die so emittierten Wellenzüge sind derart mit dem stimulierenden Photon korreliert, dass beide Wellenzüge kohärent sind. Die Wahrscheinlichkeiten für die Absorption und die stimulierte Emission sind, wie Einstein 1917 nachweisen konnte, gleich. Im thermodynamischen Gleichgewicht befinden sich bei nicht allzu großen Temperaturen die meisten Elektronen im Grundzustand, so dass die Absorption unter normalen Bedingungen der vorherrschende Prozess ist. Möchte man nun Lichtverstärkung durch die stimulierte Emission bekommen, muss man dafür sorgen, dass mehr Elektronen im angeregten Zustand E2 sind als im Zustand E1. Diesen Besetzungszustand nennt man Inversion. Um das näher zu beleuchten, betrachten wir eine elektromagnetische Welle der Intensität I0 und der Frequenz ν, die sich in z-Richtung in einem Medium mit Zwei-Niveau-Atomen ausbreitet. Die Intensität hat dann die Form: I ( z ) = I 0 ⋅ e− K ⋅ z (Lambert-Beer’sches Gesetz). Man kann zeigen, dass die Absorptionskonstante K proportional ist zu N1 – N2 ist. Unter normalen Bedingungen ist N1 – N2 > 0. Bei Besetzungsinversion ist aber N1 – N2 < 0, so dass das Lambert'sche Gesetz zu einer Verstärkung der Intensität führt (K formal negativ!). 75 6.1.2 Funktionsweise eines He-Ne-Lasers In einem Laserrohr befindet sich Helium und Neon in einem Mengenverhältnis von ca. 7 : 1. - - - - - - - 6.2 Spiegel an den Enden (einer lässt ein wenig Intensität nach außen) Gasentladung wird gezündet -> freie Elektronen He durch Elektronenstoß (1. Art: Übernahme von kinetischer Energie) in einen angeregten Zustand gebracht. Die Lebensdauer dieses Zustands ist lang, weil der optische Übergang von s nach s verboten ist. Grund: Photon hat einen Drehimpuls |l| = 1. Daher müssen die beim optischen Übergang beteiligten Orbitale auch eine Drehimpulsdifferenz von ∆l = ±1 haben. Den langlebigen Zustand nennt man metastabil. Das angeregte He-Atom stößt nun mit Neon-Atomen. Dabei wird Anregungsenergie auf die Ne-Atome übertragen (Stoß 2. Art). -> 1 Elektron geht nach 5s. Stimulierte Emission durch Photon (3 Linien, 2 im IR, eine bei 632,8 nm). Lebensdauer von s-Niveaus länger als von p-Niveaus, dadurch Besetzungsinversion. Spontane Emission auf die langlebigen s-Niveaus, von dort Rückgang in den Grundzustand durch Stöße mit der Wand. Laserrohr ist Resonator (Länge ist ein Vielfaches der halben gewünschten Wellenlänge). Dadurch stehende Lichtwelle, unpassende Wellenlängen interferieren weg. Mengenverhältnis deshalb, damit möglichst jedes Ne-Atom auch getroffen wird. Wärmestrahlung Bisher haben wir die Quantenphysik immer mit Linienspektren in Verbindung gebracht, weil ja in den Atomen die Energieniveaus quantisiert sind. Aber auch die elektromagnetische Strahlung, die von heißen Körpern emittiert wird und ein kontinuierliches Spektrum aufweist, war gegen Ende des 18. Jahrhunderts noch nicht verstanden. Erst Max Planck hat durch seine Quantenhypothese Licht in die Strahlung sog. schwarzer Körper gebracht. 6.2.1 Strahlung schwarzer Körper Man kann beobachten, dass die Farbe von glühenden Körpern von deren Temperatur abhängt (bis 700°C rötlich, darüber hinaus sogar gelb oder weiß). Auch von nicht glühenden Körpern bemerken wir aber eine unsichtbare Wärmestrahlung, die im Infraroten liegt. Natürlich strahlt ein Körper nicht nur ab, sondern er absorbiert auch Strahlung. Der Anteil der absorbierten zur einfallenden Strahlung heißt Absorptionskoeffizient α, der natürlich auch von der Wellenlänge abhängen kann. 76 Einen Köper, der bei allen Wellenlängen einen Absorptions-Koeffizienten von 1 hat, nennt man schwarz. Zwei Platten auf der Temperatur T strahlen in einen Raum, der von idealen Spiegeln umgeben ist. Platte 1 hat einen Abs.-Koeff. von 1, Platte 2 einen von < 1. Platte 1 stahlt aufgrund der Temperatur die Strahlungsleistung P1 aus, die von Platte 2 absorbiert wird. Die absorbierte Leistung ist α 2 ⋅ P1 . Genauso strahlt P2 dieselbe Leistung wegen derselben Temperatur aus, die von Platte 1 absorbiert wird. Die absorbierte Leistung ist α1 ⋅ P2 > α 2 ⋅ P1 , da α1 > α 2 . Beide absorbierten Leistungen müssen aber gleich sein, sonst würde sich die Platte 1 von selbst immer weiter aufheizen, was ein Perpetuum mobile 2. Art wäre. Deshalb müssen die absorbierten Leitungen gleich sein: P α α1 ⋅ P2 = α 2 ⋅ P1 ⇔ 1 = 1 . P2 α 2 Die abgestrahlte Leistung ist also proportional zum Absorptionskoeffizienten. Der Anteil der abgestrahlten Leistung wird durch den Emissionskoeffizienten ε bestimmt. Daher gilt: α1 ε 1 = α2 ε2 ⇒ α ~ε Das ist das Kirchhoff'sche Strahlungsgesetz: Was gut absorbiert, emittiert auch gut. Deshalb ist ein idealer Strahler ein sog. schwarzer Körper. Das beste Schwarz ist ein Loch in einer Kiste, in der ein Lichtstrahl so oft hin- und her reflektiert wird, dass er immer mehr Intensität verliert und sich tot läuft. Licht, das also einmal in das Loch eingedrungen ist, kommt nie wieder aus dem Loch heraus. Nach dem Kirchhoffschen Strahlungsgesetz absorbiert der Hohlraumstrahler aber genauso viel, wie er emittiert. 6.2.2 Das Planck'sche Strahlungsgesetz Die Größe, die uns interessiert, ist die spektrale Energiedichte ρ (ω , T ) . Die Energie, die im Frequenzbereich ω + d ω emittiert wird, ist dann ρ (ω , T ) ⋅ d ω . Als Hohlraum nehmen wir einen Würfel mit der Kantenlänge d. In ihm können elektromagnetische Eigenschwingungen existieren, die man als stehende Wellen darstellen kann. An den Wänden muss die Amplitude verschwinden, also muss jede Raumrichtung ein ganzzahliges Vielfaches der halben Wellenlänge enthalten. 77 Sind α, β und γ die Winkel der Wellenfrontnormalen zu den Koordinatenachsen, dann muss gelten: λ λ nx ⇔ cos α = nx 2cos α 2d λ λ d= n y ⇔ cos β = ny 2cos β 2d λ λ d= nz ⇔ cos γ = nz 2cos γ 2d d= 2 λ 2 2 2 1 = cos 2 α + cos 2 β + cos 2 γ = nx + n y + nz . 2 d bzw.: ( ) Also sind nur solche Wellenlängen existent, für die in beliebiger Kombination der (nur positiven!) ni gilt: ( ) 2d nx2 + n y2 + nz2 = λ 2 . λ ⇔ ( nx 2 + n y 2 + nz 2 ) ⋅ = d 2 2 2 Mit λ 2 = πc gilt: ω π 2 2 2 ( nx + n y + nz ) . d 2 ω n2 n n = c 2 x y z Um nun die spektrale Energiedichte bestimmen zu können, braucht man die Anzahl der Eigenschwingungen im Frequenzbereich zwischen ω und ω + d ω . Um diese Zahl bestimmen zu können, betrachten wir den (+++)-Oktanten des dreidimensionalen Quantenzahlraums. Zustände, deren Frequenz kleiner ist als ein beliebiger Wert ω, liegen im (+++)-Oktanten innerhalb einer Kugel vom Radius r = nx 2 + n y 2 + nz 2 . Die Zahl dieser Zustände in diesem Oktanten ist 1 1 4π des Volumens der gesamten Kugel, also ⋅ r 3 . 8 8 3 Die Zahl der Zustände mit einer Frequenz kleiner als ω ist noch mit dem Faktor 2 zu multiplizieren, da man bei einer transversalen elektromagnetischen Welle zwei Polarisationen zulassen muss. Also ist die Gesamtzahl: 1 4π 3 π 2 Z (ω ) = 2 ⋅ ⋅ r = r 8 3 3 ( ) 3 2 Mit r 2 = ( nx 2 + n y 2 + nz 2 ) = ω2 d c2 π 2 folgt: π ω3 d V ω3 = . 3 c3 π 3π 2 c 3 3 Z (ω ) = Pro Frequenzintervall bedeutet dies: 78 dZ (ω ) V ω2 dω = 2 3 dω . dω π c Das heißt, wir haben jetzt eine Eigenschwingungsdichte. Um aber die Energiedichte zu bekommen, müssen wir noch wissen, wie die Energie der elektromagnetischen Wellen als Funktion der Temperatur und Frequenz verteilt ist. Diese kann man sich einfach herleiten, indem man der Emission eines Lichtquants der Energie hω einen energetischen Übergang zwischen den diskreten Energieniveaus E1 und E2 > E1 zuordnet, so dass hν = E2 − E1 . Sei N1 die Anzahl der nicht-angeregten und N2 diejenige der angeregten Atome. Im thermischen Gleichgewicht ist das Verhältnis beider Zahlen gegeben durch die BoltzmannVerteilung: − N2 =e N1 E2 − E1 k BT =e − hω k BT . Nun betrachten wir wie beim Laser die möglichen Energieaustauschprozesse: 1. spontane Emission: Teilchen emittieren Strahlung vom Betrag hω . Die Häufigkeit solcher Prozesse ist proportional zur Anzahl der Atome im angeregten Zustand. Anzahl spontaner Emissionen: β ⋅ N 2 . 2. induzierte Absorption: Teilchen absorbieren Strahlung vom Betrag hω . Die Häufigkeit solcher Prozesse ist proportional zur Anzahl der Atome im nicht-angeregten Zustand und zur Intensität des Strahlungsfeldes ρ(ω, T ) d ω . Anzahl induzierter Absorptionen: γ ⋅ ρ(ω, T ) ⋅ N1 ⋅ d ω . 3. stimulierte Emission: Da die stimulierte Emission der Umkehrprozess der induzierten Absorption ist, ist auch der kinetische Faktor γ derselbe. Die Häufigkeit solcher Prozesse ist proportional zur Anzahl der Atome im angeregten Zustand und zur Intensität des Strahlungsfeldes ρ(ω, T ) d ω . Anzahl induzierter Absorptionen: γ ⋅ ρ(ω, T ) ⋅ N 2 ⋅ d ω . Im Gleichgewicht muss die Häufigkeit der Absorptionen gleich sein der Häufigkeit der Emissionen, also: γ ⋅ ρ(ω, T ) ⋅ N1 ⋅ d ω = β ⋅ N 2 + γ ⋅ ρ(ω, T ) ⋅ N 2 ⋅ d ω = β ⋅ N1 ⋅ e − hω k BT + γ ⋅ ρ(ω, T ) ⋅ N1 ⋅ e − hω k BT dω Die Teilchenkonzentration n1 kürzt sich raus, denn das Strahlungsgesetz darf ja auch nicht von der Teilchenzahl abhängen. Man erhält: ρ (ω , T ) dω = β ⋅e − γ 1 − e hω k BT hω − k BT = β γ 1 e hω k BT 1 ~ −1 e hω k BT −1 79 1 Der Faktor e hω k BT gibt die Energieverteilung der Photonen im Hohlraum an. Man nennt −1 diese Verteilung Bose-Einstein-Verteilung, und sie ist zuständig für Teilchen mit ganzzahligem Spin. 1 Die Bose-Einstein-Verteilung bestimmt also die mittlere Energie E = hω ⋅ e hω k BT . −1 Damit erhält man also für die Energiedichte im Frequenzintervall ω bis ω + dω: dZ (ω) V ω2 ⋅ E ⋅ dω = 2 3 ⋅ dω πc hω hω k BT ⋅ dω . e −1 Die gesuchte spektrale Energiedichte pro Volumen ρ(ω, T ) ergibt sich durch einfache Division durch V: ρ(ω, T ) d ω = ω2 π2 c3 hω e hω k BT dω Planck’sches Strahlungsgesetz −1 Man kann es auch als Funktion der Wellenlänge ausdrücken. Dabei ist zu berücksichtigen: λ= 2πc dλ 2πc ⇒ =− 2 ω dω ω ⇒ dω = ω2 dλ . 2πc ρ(λ, T ) d λ = 8πhc λ5 1 e hc λk B T dλ −1 ρ(ω, T ) d ω bzw. ρ(λ, T ) d λ geben die Energie des schwarzen Strahlers pro Volumen und pro Frequenzintervall an. 6.2.3 Das Wien’sche Verschiebungsgesetz Wir wollen nun aus dem Planck’schen Strahlungsgesetz herleiten, bei welcher Wellenlänge am meisten Energie abgestrahlt wird. Das Maximum bei einer festen Temperatur von ρ(λ) d λ ermittelt man aus der Nullstelle der Ableitung: ∂ρ = 0. ∂λ ∂ρ −40πhc = ∂λ λ6 1 e hc λ k BT hc ! 8πhc 1 hc + 5 e λk B T = 0 2 2 λ hc λ k BT −1 e λk B T − 1 hc λk B T −5 e hc + hc =0 2 λ λ k BT λ k BT −1 e hc 1 ⇔5= hc − λk BT λ k BT 1− e ⇔ 80 Substitution: x = ( hc : ⇒ x = 5 1 − e− x λk BT ) Diese transzendente Gleichung ist nur numerisch lösbar. Außer der physikalisch sinnlosen Lösung x = 0 hat die Gleichung die Lösung x ≈ 4.965. Damit: λ max = hc 2,898 mm ⋅ K = 4.965 ⋅ k B ⋅ T T λ max ⋅ T ≈ 2900 µm ⋅ K Wien’sches Verschiebungsgesetz Man erhält so: 6.2.4 Das Gesetz von Stefan-Boltzmann Josef Stefan (1835-1893) schloss 1879 aus experimentellen Untersuchungen, dass die totale Energiedichte im Strahlungsfeld proportional ist zu T4. Dasselbe Ergebnis erhielt Ludwig Boltzmann (1844-1906) fünf Jahre später aus thermodynamischen Betrachtungen. Es folgt allerdings auch einfach aus der Integration der Planck’schen Strahlungsgesetzes. Es ist zweckmäßig, eine Flächenleistung einzuführen, also die Leistung des schwarzen Strahlers pro Abstrahlungsfläche. Dazu führt man die spektrale Flächenleistungsdichte c ρP ( ω, T ) := ρ(ω, T ) ein. 4 Die totale Leistung pro Abstrahlungsfläche folgt dann aus der Integration des Plank’schen Gesetzes: ∞ ∞ ∞ P c ω2 = ρ P (ω, T ) d ω = ρ(ω, T ) d ω = 40 A 0 4π 2 c 2 0 ∫ Dazu substituiert man: x = ∫ hω ∫ e hω k BT dω. −1 hω dx h kT ⇒ = ⇒ dω = dx . k BT d ω k BT h 4 ∞ P ( k BT ) 4 x3 π2 k B 4T 4 k BT 3 x dx , so dass = dx = . A 4π 2 c 2 h 3 0 e x − 1 60 c 2 h3 h 14243 Damit wird: ω3 d ω = ∫ = Der Faktor σ = 5,67 ⋅ 10 −8 π4 15 π2 k B 4 heißt Stefan-Boltzmann-Konstante und hat den Wert 60 c 2 h3 W . m2K 4 Die gesamte in den Raum abgestrahlte Leistung pro strahlender Fläche eines schwarzen Körpers mit der Temperatur T beträgt: P W = σ ⋅ T 4 mit σ = 5,67 ⋅ 10 −8 2 4 A m K Stefan-Boltzmann-Gesetz 81 7. Kernphysik Gleichzeitig mit der Quantentheorie der Elektronenhülle begann auch die Untersuchung der Atomkerne. 7.1 Struktur des Atomkerns Rutherford’sche Experimente: Es gibt im Zentrum der Atome einen massiven winzigen Kern, in dem der positive Ladungsanteil des Atoms vereint ist. Später (in den 1930er Jahren) fand man heraus, dass der Atomkern eine Struktur besitzt: Der Atomkern besteht aus zwei Teilchen, den Protonen und den Neutronen. Das Proton hat eine positive Ladung, die vom Betrag her derjenigen des Elektrons entspricht ( qProton = +e = +1,60217653 ⋅ 10−19 C ) und eine Masse von mP = 1,67262171 ⋅ 10−27 kg Es ist damit 1836mal schwerer als ein Elektron. Das Neutron, das vom Engländer James Chadwick (1891-1974) im Jahre 1932 nachgewiesen wurde, ist elektrisch neutral ( qNeutron = 0 ), hat aber eine dem Proton sehr ähnliche Masse: mn = 1, 67492721 ⋅ 10−27 kg Die Bestandteile des Kerns (also Protonen und Neutronen) nennt man Nukleonen. Abgesehen vom Wasserstoff, der nur ein Proton als Kern besitzt, haben alle anderen Kerne sowohl Protonen als auch Neutronen. Die verschiedenen Kerne bezeichnet man als Nuklide. Die Anzahl der Protonen im Kern nennt man Ordnungszahl Z, die identisch ist mit der Zahl der Elektronen im neutralen Atom. Da fast die gesamte Masse im Kern vereint ist, ist die Summe der Protonen und Neutronen die Massenzahl A, auch relative Atommasse genannt, die in der atomaren Masseneinheit u angegeben wird, die einem 12. der Masse des Kohlenstoffisotops C-12 entspricht. Man schreibt das Nuklid X dann: A Z X . Da das Element durch seine Ordnungszahl bereits festgelegt ist, lässt man diese meist weg, und spricht z. B. nur noch von O-16. Man findet bei vielen Elementen Kerne mit unterschiedlichen Neutronenzahlen. Kerne mit demselben Z, aber unterschiedlichem A nennt man Isotope. 11 12 13 14 15 16 Bsp.: Kohlenstoffisotope 6 C , 6 C , 6 C , 6 C , 6 C und 6 C (unterschiedliche Häufigkeit in der Natur) 82 Aus Streuexperimenten kann man die Größe der Kerne abschätzen. Kerne sind relativ gut kugelsymmetrisch und haben einen Radius von: r ≈ 1,2 ⋅ 10−15 ⋅ 3 A m , d. h. das Volumen eines Kerns ändert sich proportional zur Zahl der Nukleonen. Genau wie ein Elektron einen Spin und eine Drehimpulsquantenzahl besitzt, so gilt das auch für Protonen und Neutronen. Beide haben wie das Elektron einzeln einen Spin von ½, gehören also auch zu den Fermionen. Der Kernspinquantenzahl I eines zusammengesetzten Kernes kann demnach halb- oder ganzzahlig sein, je nachdem, wie viele Protonen und Neutronen er enthält. Der Kerndrehimpuls ist analog zum Elektron dann I ( I + 1) h . Die magnetischen Momente des Kerns werden in Einheiten des Kernmagnetons gemessen: µN = eh = 5,051 ⋅ 10−27 Am 2 , 2m p das wegen des Massenunterschiedes etwa 1836mal kleiner ist als das Bohr’sche Magneton des Elektrons. Das magnetische Moment des Protons beträgt: µ p = 2,7928 µ N und das des Neutrons: µ n = −1,9135 µ N Im Neutron muss es also trotz seiner nicht vorhandenen Gesamtladung Ströme geben, die das magnetische Moment verursachen. Das Minuszeichen sagt aus, dass das magnetische Moment dem Spin des Neutrons entgegengerichtet ist. 7.2 Bindungsenergie und Kernkräfte Vergleich: Masse eines 4 2 He -Kerns mit der Masse aller Kernbausteine: Masse eines neutralen 4 2 He -Atoms: 4,002603 u Masse von 2 Neutronen: Masse von 2 11H -Atomen (inkl. Elektr.): 2,017330 u 2,015650 u 4,032980 u Die Masse des He-Atoms ist also um 0,030377 u kleiner als die Masse der Bestandteile. Wo ist die Masse geblieben ? Nach der berühmten Einsteinschen Formel E = m ⋅ c 2 sind Masse und Energie äquivalent. Der Massendefekt beim Helium entspricht einer Energie von 2 m E = 0,030377 u ⋅ c 2 = 5,044 ⋅ 10−29 kg ⋅ 2,998 ⋅ 108 = 4,534 ⋅ 10−12 J = 28,30 MeV . s 83 Diese Energie ist die Gesamtbindungsenergie des Kerns, die bei der Bildung aus den einzelnen Bausteinen frei geworden ist. Sie muss auch wieder zugeführt werden, um den Kern in seine Bausteine zu zerlegen. Beachte: Der Kern verfügt nicht über seine Bindungsenergie, sondern es ist die Energie, die ihm „fehlt“. Vergleich der Bindungsenergien Elektronenhülle – Kern: Bindungsenergie des Elektrons im Wasserstoffatom: Bindungsenergie des He-Kerns: Masse eines Wasserstoffatoms: 1,007825 u Masse eines Elektrons: = 13,6 eV 28,3 MeV 939 MeV 511 keV Im Allgemeinen sind die Kernbindungsenergien um den Faktor 106 größer als die Elektronenbindungsenergien. Normiert man die Gesamtbindungsenergie auf die Anzahl der Nukleonen, dann bekommt man die mittlere Bindungsenergie pro Nukleon, die von der Gesamtzahl der Nukleonen im Kern abhängig ist. Im Fall von 24 He beträgt sie 28,3 MeV / 4 = 7,08 MeV. 56 Fe Die Bindungsenergie pro Nukleon wächst bei kleinen Kernen sehr schnell an, hat bei 26 ein Maximum und fällt danach langsam ab. Größere Kerne halten also etwas schwächer zusammen als mittelgroße Kerne. Die Frage, die sich stellt, ist diejenige nach der Kraft, die die Kerne zusammenhält. Da die Protonen alle positiv geladen sind, müssten sie aufgrund der Coulomb-Kraft eine starke Abstoßung erfahren. Es muss also eine andere Kraft existieren, die den Kern zusammenhält, nämlich die starke Kernkraft (oder auch starke Wechselwirkung). Sie hat folgende Eigenschaften: - sehr kurze Reichweite (ca. 10−15 m) ladungssymmetrisch, d. h. Fp − p = Fn −n - ladungsunabhängig, d. h. Fp − p = Fp − n - Das Potenzial, das die Wechselwirkung zwischen zwei Nukleonen bestimmt, wurde zuerst von Hideki Yukawa formuliert: − EYukawa (r ) = − A ⋅ e r r0 r Yukawa-Potenzial Es unterscheidet sich von dem Coulomb- oder Gravitationspotenzial durch den Exponentialterm, der die Kurzreichweitigkeit beschreibt. Dabei ist r0 = λπ mit λ π = Compton-Wellenlänge des π-Mesons oder auch Pions. 2π 84 7.3 Radioaktivität Die Entwicklung der Kernphysik geht auf das Jahr 1896 und Henri Becquerel (1852 – 1908) zurück. Er entdeckte (durch Zufall), dass ein bestimmtes Mineral, das Uran enthält, eine photographische Platte schwärzt, ohne dass Licht auf die Platte fällt. Das Mineral musste also irgendwelche Strahlen abgeben, die ähnlich wie die Röntgenstrahlen wirken, jedoch ohne äußere Anregung. Dieses Phänomen wird als Radioaktivität bezeichnet. Man nennt diese Strahlung ganz allgemein auch ionisierende Strahlung, weil ihre Energie ausreicht, andere Atome zu ionisieren. Lenkt man die Strahlung durch ein Magnetfeld ab, so stellt man fest, dass man offenbar (mindestens) drei unterschiedliche Arten der Radioaktivität unterscheiden muss. Diese drei Arten werden in einem senkrechten Magnetfeld, unterschiedlich abgelenkt, so dass sie unterschiedliche Ladungen besitzen müssen. α-Strahlen sind positiv geladen. β-Strahlen sind negativ geladen. γ-Strahlen sind ungeladen. Man stellte bald fest, dass es sich bei diesen Strahlungsarten um bereits bekannte Teilchen handelte: α-Strahlen sind Heliumkerne, bestehen also aus zwei Protonen und zwei Neutronen. β-Strahlen sind Elektronen, wie sie auch in der Atomhülle zu finden sind. γ-Strahlen sind hochenergetische Photonen, deren Energie in der Regel höher ist als Röntgenstrahlen. 7.3.1 Alpha-Zerfall Wenn ein Kern ein α-Teilchen emittiert, findet eine Kernumwandlung statt. Der ursprüngliche Kern hat zwei Protonen und zwei Neutronen verloren. 226 88 Ra Bsp.: Radium → 222 4 86 Rn + 2 He Beim α-Zerfall wird also ein neues Element gebildet. Der Tochterkern ist verschieden vom Mutterkern. Diese Umwandlung nennt man auch Transmutation. Ganz allgemein gilt bei α-Zerfall: A Z X → A− 4 Z −2 X '+ 24 He Der α-Zerfall findet statt, weil bei großen Kernen die starke Wechselwirkung nicht mehr ausreicht, den Kern zusammenzuhalten. (Sie wirkt nur zu benachbarten Nukleonen, die Coulomb-Abstoßung durch den ganzen Kern.) Bestimmt man die Massen auf beiden Seiten, dann fehlt etwas, das in Form der Zerfallsenergie Q freigesetzt wird (in Form von kinetischer Energie von α-Teilchen und Tochterkern): mMutterk.c 2 = mTochterk.c 2 + mα c 2 + Q ⇔ Q = ( mMutterk. − mTochterk. − mα ) ⋅ c 2 85 Wenn die Coulomb-Abstoßung im Kern größer ist, als die starke Wechselwirkung, warum zerfallen nicht alle großen Kerne instantan ? Das vom α-Teilchen wahrgenommene Potential setzt sich zusammen aus der kurzreichweitigen starken Wechselwirkung und der Coulomb-Abstoßung. - - - - - Zwischen r = 0 und r = r0 herrscht die anziehende Kernkraft, für r = r0 gibt es Coulomb-Abstoßung Das im Kern gefangene α-Teilchen wird zwischen den Potentialwänden hin- und her gestoßen. Nach den Gesetzen der klassischen Physik kann das Teilchen nicht entkommen. Nach den quantenmechanischen Gesetzen, insbesondere wegen der Heisenberg’schen Unschärferelation, besteht aber eine gewisse Wahrscheinlichkeit, dass das α-Teilchen am Orte B ist. Die Wahrscheinlichkeit und damit die Zerfallsrate wird von der Höhe und Breite der Barriere beeinflusst. Lebensdauern von solchen Kernen variieren von Bruchteilen von Mikrosekunden bis hin zu 1010 Jahren. Es werden deshalb α-Teilchen emittiert, weil diese eine sehr hohe Bindungsenergie haben. Anwendung von α-Strahlung: Rauchmelder Enthält 0,2 mg 241 95 Am in Form von AmO2. α-Strahlung ionisiert die Luft zwischen zwei geladenen Platten, was zu einer definierten, konstanten Leitfähigkeit führt. Dringt Rauch ein, so wird die meiste α-Strahlung von den Rauchpartikeln absorbiert, die Leitfähigkeit nimmt ab. 7.3.2 Beta-Zerfall Auch beim β-Zerfall kommt es zu einer Kernumwandlung, die sich unter Emission eines Elektrons oder β−-Teilchens vollzieht. Beispiel: Kohlenstoff-14 14 6C → 147 N + e − Der Mutterkern emittiert ein Elektron, deshalb muss aus Ladungserhaltungsgründen der Tochterkern eine Ladung mehr haben. Das Elektron ist kein Hüllenelektron, sondern es stammt aus dem Kern. Hierbei wandelt sich ein Neutron spontan in ein Proton um, wobei ein Elektron abgegeben wird: n → p + e− Aufgrund der Herkunft aus dem Kern nennt man diese Elektronen häufig einfach β−-Teilchen, um sie nicht mit Hüllenelektronen zu verwechseln. Die Teilchen als solche sind aber identisch. 86 Aus dem Massendefekt lässt sich die Energie des β-Teilchens berechnen. Die große Mehrzahl der Elektronen besitzt aber eine deutlich geringere Energie. Sorgfältige Messungen zeigten auch, dass die Impuls- und Drehimpulserhaltung verletzt sind. Wolfgang Pauli schlug deshalb 1930 vor, dass es beim β-Zerfall ein weiteres Teilchen geben musste, dass man offenbar nur schwer nachweisen konnte. Mittlerweile hat man dieses Teilchen experimentell nachweisen können, und es heißt Neutrino. Die korrekte Formulierung des β-Zerfalls lautet also: 14 14 − − 6 C → 7 N + e + ν e und n → p + e + ν e . Viele Nuklide zerfallen unter Emission eines β–-Teilchens. Es sind dies Isotope, die im Vergleich zur Protonenzahl sehr viele Neutronen besitzen. Nuklide, die sehr viele Protonen im Vergleich zu den Neutronen besitzen, zerfallen unter Aussendung eines Positrons e+. Ein Positron hat dieselben Eigenschaften wie ein Elektron, nur entgegen-gesetzte Ladung (Antiteilchen). Deshalb nennt man diesen Zerfall β +-Zerfall. 19 10 Ne Beispiel: → 199 F + e + + ν e . Hierbei wandelt sich ein Proton in ein Neutron unter Aussendung eines Positrons und eines Neurinos um: p → n + e+ + ν e . Mit einem Elektron wird ein Antineutrino emittiert und mit einem Antielektron ein Neutrino. Der β-Zerfall lässt sich also schreiben als: A Z X → A Z +1 X '+ e− + νe β− -Zerfall A Z X → A Z −1 X '+ e+ + ν e β+ -Zerfall Neben β+- und β−-Zerfall gibt es noch einen dritten damit zusammenhängenden Prozess, den Elektroneneinfang oder auch K-Einfang. Dabei absorbiert der Kern ein Hüllenelektron, vornehmlich aus der K-Schale. Beispiel: 7 − 4 Be + e oder allgemein: → 37 Li + ν e A Z X + e− → A Z −1 X '+ ν e K-Einfang Das Elektron verschwindet im Kern, und aus einem Proton wird ein Neutron; zusätzlich wird wieder ein Neutrino emittiert. Wenn die Lücke in der K-Schale durch ein höheres Elektron aufgefüllt wird, entsteht wieder Röntgenstrahlung. Der β-Zerfall wird über die schwache Kernkraft (oder auch schwache Wechselwirkung) vermittelt. Das Neutrino wechselwirkt mit Materie nur über diese schwache WW, weshalb es auch so schwer nachzuweisen ist. 87 7.3.3 Gamma-Zerfall Gamma-Strahlung entsteht beim Zerfall eines Kerns, der sich genau wie die Elektronenhülle in energetisch höheren und niedrigeren Zuständen befinden kann. Beim Übergang in einen niedrigeren oder den Grundzustand emittiert er ein Photon, das γ-Quant. Da die Energieniveaus des Kerns viel weiter voneinander entfernt sind als in der Elektronenhülle, sind die Energien des γ-Quants in der Größenordnung keV und MeV. Der Kern gelangt häufig durch einen vorausgegangenen radioaktiven Zerfall in einen angeregten Zustand. Beispiel: kann durch β-Zerfall zu 126C entweder in den Grundzustand oder in einen angeregten Zustand übergehen. Nach Emission eines γ-Quants mit der Energie 4,4 MeV ist der Kern dann auch im Grundzustand. 12 5B Man kann den γ-Zerfall schreiben als: A * Z X → ZA X + γ Der Kern kann im angeregten Zustand auch eine gewisse Zeit verbleiben. Er befindet sich dann in einem metastabilen Zustand, der als Isomer bezeichnet wird. Der Kern kann auch durch innere Konversion in den Grundzustand übergehen, bei dem der Kern mit einem Hüllenelektron wechselwirkt. Das Elektron bekommt kinetische Energie, die (minus der Bindungsenergie) dem γ-Quant entspricht. Unterschied Röntgenstrahlung und γ-Strahlung: Röntgenstrahlung stammt von Übergängen in der Elektronenhülle, γ-Strahlung stammt von Übergängen im Kern. 7.3.4 Zerfallsgesetz und Halbwertszeit Eine makroskopische Probe eines radioaktiven Isotops besteht aus einer großen Anzahl von radioaktiven Kernen, die natürlich nicht alle gleichzeitig zerfallen. Es handelt sich vielmehr um einen Zufallsprozess. Es ist prinzipiell nicht vorhersagbar, wann genau ein einzelnes Atom zerfällt. Man kann aber auf der Grundlage von Wahrscheinlichkeiten vorhersagen, wie viele Kerne aus einer großen Anzahl in einem bestimmten Zeitintervall zerfallen. Die Anzahl der in einem kurzen Zeitintervall dt stattfindenden Zerfälle dN ist proportional der Intervalllänge: dN ~ dt Die Anzahl der zerfallenden Atome wird auch proportional sein zu der Zahl der noch nicht zerfallenen Atome N: dN ~ N 88 Daraus folgt: dN ~ N ⋅ dt Die Anzahl der noch nicht zerfallenen Atome N nimmt natürlich durch den radioaktiven Zerfall ab, deshalb muss die Proportionalitätskonstante negativ sein: dN = −λ ⋅ N ⋅ dt . λ nennt man Zerfallskonstante. Je größer sie ist, desto mehr Kerne zerfallen in einer bestimmten Zeit. Man muss jetzt die Zahl N als Funktion der Zeit bestimmen: dN = −λ ⋅ dt . N Integration der Gleichung: N ∫ N0 t dN = − λ ⋅ dt , N 0 ∫ wobei N0 die Anzahl der Mutterkerne zur Zeit t = 0 ist. Die Integration führt zu: ln N − ln N 0 = ln N = −λt , N0 was zum Zerfallsgesetz führt: N (t ) = N 0 ⋅ e−λt Es besagt, dass die Anzahl der radioaktiven Mutterkerne mit der Zeit exponentiell abnimmt. Die Zerfallsrate (= Zahl der Zerfälle pro Sekunde) wird Aktivität A genannt und beträgt: A= dN = −λ ⋅ N 0 ⋅ e −λt = −λ ⋅ N , dt d. h. bei t = 0: dN −λ⋅0 A0 = = −λ ⋅ N 0 = −λ ⋅ N 0 ⋅ e dt t = 0 Daraus folgt: A(t ) = A0 ⋅ e −λt so dass die Aktivität zeitlich mit derselben Rate abnimmt wie die Zahl der Mutterkerne. Die Aktivität hat die Einheit Zerfälle pro Sekunde, was 1 Becquerel ist (= 1 Bq). In der Praxis gibt man für ein radioaktives Nuklid allerdings nicht die Zerfallskonstante an, sondern die sog. Halbwertszeit. Sie gibt an, nach welcher Zeit sich die Anzahl der Mutterkerne und damit auch die Aktivität gerade halbiert hat. Beispiel: hat eine Halbwertszeit von 30 Jahren. Wenn man 1023 Atome dieses Isotops hat, dann sind davon nach 30 Jahren nur noch 5 ⋅ 1022 vorhanden. Nach weiteren 30 Jahren sind es nur noch 2,5 ⋅ 1022 usw. Dieses Verhalten ist charakteristisch für eine Exponentialfunktion. 137 55 Cs 89 Die Halbwertszeit T1/ 2 hängt natürlich mit der Zerfallskonstante zusammen. Nach der Halbwertszeit beträgt die Anzahl Mutterkerne N nur noch die Hälfte der ursprünglichen Anzahl N0: N (T1/2 ) = N0 = N 0 ⋅ e −λ⋅T1/2 . 2 Kürzen von N0 und Logarithmieren liefert: ln 1 = − ln 2 = −λ ⋅ T1/2 2 bzw. T1/2 = ln 2 0,693 = λ λ Halbwertszeit Man kann das Zerfallsgesetz also auch schreiben als: N (t ) = N 0 ⋅ e 7.3.5 − t ln 2 T1/2 Anwendung: Die Radiokarbon-Methode Eine von vielen Anwendungen der Radioaktivität ist die Radiokarbon-Methode, auch C-14Methode genannt, mit deren Hilfe man das Alter von historischen und fossilen Gegenständen bestimmen kann. Alle Pflanzen nehmen CO2 auf. Den Kohlenstoff bauen sie in ihre organischen Moleküle ein. Der Kohlenstoff im natürlich vorkommenden CO2 besteht überwiegend aus 126C . Zu einem ganz geringen Anteil ( 1,3 ⋅ 10−12 ) findet man das radioaktive Isotop 146C . Obwohl C-14 eine Halbwertszeit von nur 5730 Jahren hat, ist das Verhältnis von 146C zu 126C über viele Tausende von Jahren weitestgehend konstant geblieben. Grund: Die kosmische Strahlung trifft auf Atomkerne, die sie in ihre Einzelteile aufspaltet. Dadurch entstehen unter anderem freie Neutronen. Diese wiederum treffen auf StickstoffAtome, was zu folgender Kernumwandlung führt: n + 147 N → 146 C + p . Dabei wird ein Proton abgegeben. Durch diesen Prozess wird der Verlust an C-14 wieder kompensiert. Solange die Pflanze lebt, nimmt sie CO2 aus der Luft auf, wodurch das Verhältnis 146C zu 126C der daraus aufgebauten Moleküle demjenigen in der Atmosphäre entspricht. Stirbt die Pflanze jedoch, hört auch der Stoffwechsel auf, und das 146C zerfällt kontinuierlich zu 147 N , ohne nachgeliefert zu werden. Nach 5730 Jahren hat sich das Verhältnis 14 6C zu 12 6C halbiert. 90 In der Praxis muss man Korrekturen anbringen, weil das natürliche Verhältnis doch geringen Änderungen unterworfen ist. Außerdem muss man die Ergebnisse immer vergleichen mit Gegenständen, deren Alter man aus anderen Quellen kennt. Mit der Radiokarbon-Methode eignet sich für Gegenstände, die ca. bis 60.000 Jahre alt sind. Darüber hinaus wird die Methode ungenau, weil zu wenig C-14 enthalten ist. Insbesondere für sehr alte Gesteine bietet sich der Zerfall von 238 92 U 238 92 U mit einer Halbwertszeit von 4,5 Mrd. Jahren an. Man misst bei Gesteinen die Menge von im Verhältnis zu den daraus entstandenen Tochterkernen. Daraus weiß man, dass sich die ersten Gesteine vor ca. 4 Mrd. Jahren gebildet haben und das erste Leben vor ca. 3 Mrd. Jahren entstanden ist. Ohne die radioaktiven Methoden wäre eine Altersbestimmung und damit die Rekonstruktion der Erdgeschichte undenkbar. 7.4 Kernreaktionen Eine Kernreaktion haben wir bei der Radiokarbon-Methode bereits kennen gelernt. Dabei handelt es sich um die Reaktion n + 147 N → 146 C + p . Man schreibt die Reaktion auch: 14 7 N ( n, p ) 146 C Bisher haben wir andere Transmutationen kennen gelernt, die beim spontanen Zerfall der Kerne passieren. Von einer Kernreaktion spricht man dann, wenn die Transmutation mit einem anderen Kern oder einem anderen Teilchen wechselwirkt. Ernst Rutherford war der erste, der 1919 α-Teilchen durch Stickstoffgas leitete und beobachtete, dass dabei Protonen emittiert werden. Er schloss daraus, dass eine Kernumwandlung zum Sauerstoff passiert ist: 4 14 2 He + 7 N → 178 O + 11H Seitdem hat man sehr viele Kernreaktionen entdeckt, und gerade die sehr schweren Elemente im Periodensystem, die in der Natur gar nicht vorkommen, hat man durch solche KernReaktionen überhaupt erst herstellen können. Natürlich bleiben die Ladung, die Nukleonenzahl sowie Energie und Impuls bei der Kernreaktion erhalten. Man kann dadurch entscheiden, ob eine Kernreaktion stattfinden kann. Wenn z.B. die Gesamtmasse der Reaktionsprodukte kleiner ist als die der Ausgangsteilchen, dann wird erscheint der Massenverlaust als kinetische Energie der Produkte. Ist sie größer als die der Ausgangsteilchen, dann kann die Reaktion nur dann stattfinden, wenn die fehlende Energie als kinetische Energie mitgebracht wird. Betrachtet man als allgemeine Kernreaktion: a + X →Y +b 91 Dann ist die Reaktionsenergie: Q = (ma + m X −mY − mb ) ⋅ c 2 . Q ist damit gleich der Änderung der kinetischen Energie: b Y X a Q = Ekin + Ekin − Ekin − Ekin . X In der Regel ist Ekin = 0, da der Targetkern gegenüber dem ankommenden Teilchen ruht. Ist Q > 0, nennt man die Reaktion exotherm, also wird Wärme abgegeben. Ist Q < 0, läuft die Reaktion endotherm ab, d. h. man muss von außen Energie hinzufügen. Insbesondere Neutronen sind als Projektilteilchen sehr gut geeignet, weil sie wegen der Ladungsneutralität dicht an den Targetkern herankommen. Positiv geladene Teilchen (α, p) sind wegen der Coulomb-Abstoßung weniger effektiv. Elektronen sind zum Initiieren von Kernreaktionen wenig geeignet, da sie nicht der starken Wechselwirkung unterliegen. Man beobachtete insbesondere beim Neutronenbeschuss von Uran einen Prozess, der in der Welt eine ganz besondere Rolle spielen sollte: die Kernspaltung. 7.4.1 Kernspaltung Enddeckung durch Otto Hahn und Fritz Strassmann (1938): Durch Neutronenbeschuss von Uran mit Neutronen wurden kleinere Kerne erzeugt, die annähernd nur halb so schwer waren wie das Uran-Atom. Der Kern wurde gespalten (bisher waren immer nur kleine Fragmente emittiert worden). Die Kernspaltung verläuft insbesondere beim Uran-235 viel leichter ab als beim Uran-238. Man hat die Kernspaltung zunächst versucht, mit dem Tröpfchenmodell zu beschreiben, nach dem man sich den Uran-Kern wie einen Wassertropfen vorstellt. Das U-Atom erhält durch das Neutron zusätzliche innere Energie (wie beim Erwärmen eines Tropfens). Der Zwischenzustand 236 92 U , den man als Compoundkern bezeichnet, offenbart sich mit einer starken Bewegung, so dass der Kern eine abnormal gestreckte Form annimmt. Dadurch nimmt die kurzreichweitige Kernkraft ab, bis die Coulomb-Abstoßung dominiert; der Kern teilt sich. Die beiden neu entstandenen Kerne N1 und N2 nennt man Spaltfragmente, wobei in dieser Reaktion auch noch zwei oder drei Neutronen abgegeben werden. Die Reaktion kann man also schreiben als: n+ Der Compoundkern 236 92 U 235 92 U → 236 92 U → N1 + N 2 + j ⋅ n, j = 1, 2, 3,... hat nur eine sehr kurze Lebensdauer von ca. 10-12 s. Eine typische Spaltreaktion ist z.B.: n+ 235 92 U 89 → 144 56 Ba + 36 Kr + 3n , die beiden Spaltfragmente sind also in der Regel nicht gleich groß. 92 Bei einer solchen Spaltreaktion wird eine enorme Menge an Energie frei, weil die Masse von 235 92 U deutlich größer ist als die der Spaltfragmente und Neutronen. Bindungsenergie pro Nukleon für 235 92 U : 7,6 MeV/Nukleon Bindungsenergie pro Nukleon für mittelschwere Elemente: ca. 8,5 MeV/Nukleon Pro Nukleon gewinnt man also eine Energie von 0,9 MeV, und man hat es hier mit 235 Nukleonen zu tun: 0,9 MeV/Nukleon mal 235 Nukleonen = 211,5 MeV pro Kernspaltung. Man stellte fest, dass man die freiwerdenden Neutronen wieder als Initiator einer neuen Kernspaltung verwenden konnte, so dass man eine Kettenreaktion in Gang setzte. Auf diese Weise gelang es, die Spaltungsreaktionen selbsterhaltend zu machen und riesige Energiemengen freizusetzen. 1942: erster Kernreaktor (University of Chicago durch Enrico Fermi und seine Mitarbeiter) Diese Kettenreaktion läuft aber nur dann an, wenn man die ursprünglich sehr schnellen Neutronen abbremst. Dazu verwendet man sog. Moderatoren, die den Impuls umso besser aufnehmen, je näher die Atome im Moderator von der Masse her an die der Neutronen herankommen. Der beste Moderator wäre also Wasserstoff 11H . Leider neigt 11H dazu, Neutronen komplett zu absorbieren. Daher weicht man auf das zweitleichteste Isotop aus, das Deuterium 12 D . Deswegen verwendet man häufig schweres Wasser als Moderator, bei dem die Wasserstoffatome durch Deuteriumatome ersetzt worden sind. Ein anderer gebräuchlicher Moderator (wenn auch nicht so effektiv) ist Graphit. Da natürliches Uran nur zu 0,7 das gut spaltbare 235 92 U enthält, deshalb reichert man üblicherweise das natürlich Uran durch Diffusion oder Gaszentrifugen künstlich auf 2 bis 4% mit 235 92 U an. Einige Neutronen verlassen den Reaktorkern durch dessen Oberfläche, noch ehe sie weitere Spaltungen in Gang setzen. Damit es zu einer Kettenreaktion kommen kann, braucht man eine hinreichend große Masse an Uran. Die mindestens benötigte Menge nennt man kritische Masse. Sein Wert hängt von dem verwendeten Isotop ab. Typische Werte liegen im Bereich von einigen Kilogramm. Für eine Kettenreaktion muss mindestens eines der drei frei werdenden Neutronen eine weitere Spaltung auslösen. Die mittlere Neutronenzahl pro Spaltung, die zu weiteren Spaltungen führt, nennt man Multiplikationsfaktor f. Für f < 1 ist der Reaktor unterkritisch, und es findet keine Kettenreaktion statt. Für f > 1 ist der Reaktor überkritisch, und die Kettenreaktion verläuft unkontrolliert. Um eine kontrollierte Kettenreaktion zu betreiben, verwendet man Kontrollstäbe (meistens aus Cd oder B), die man in den Reaktor einfährt und die Neutronen absorbieren. Auf diese Weise hält man den Reaktor bei f = 1. 93 Anwendungen: - Energieerzeugung Forschungsreaktoren (Neutronen, Myonen etc.) Gefahren: - Sicherheitsrisiko Bereitstellung von spaltbarem Uran, Wiederaufbereitung Entsorgungsproblem der radioaktiven Spaltprodukte Alternative zur Beschaffung von mit U-235 angereichertem Uran: Brutreaktoren Man erbrütet sich spaltbares Plutonium aus dem sonst nutzlosen 238 92 U durch folgende Reaktionen: n+ → 238 92 U 239 92 U → 239 93 Np 239 92 U 239 93 Np → + e− + ν 239 94 Pu + e− + ν Damit kann man die Vorräte an spaltbarem Material um den Faktor 100 erhöhen. Problematisch ist allerdings, das Plutonium sehr giftig ist und auch eine viel höhere Aktivität hat als Uran (HWZ von Pu-239: 24 000 Jahre, U-238: 4,5 Mrd. Jahre) Außerdem kann Pu zum Bau von Atombomben verwendet werden, was das Sicherheitsrisiko nochmal erhöht. 7.4.2 Kernfusion Die Masse eines jeden Kerns ist kleiner als die Gesamtmasse der einzelnen Kernbausteine. Würde man also aus zwei Protonen und zwei Neutronen einen Heliumkern zusammensetzen, bekäme man einen Massendefekt, der als Energie frei wird. Dieser Vorgang heißt Kernfusion. Um Energie zu erhalten, muss man kleine Kerne fusionieren und große Kerne spalten. Die Grenze ist das Fe-56. Die einfachste Kernfusionsreaktion ist die Bildung von Deuterium: 1 1H + n → 12 D + γ Die Massen der Ausgangsteilchen sind: 1,007825 u + 1,008665 u = 2,016490 u. Die Masse des Deuteriums beträgt: 2,014102 u. Man hat also eine Massendifferenz von 0,002388 u. Die freigesetzte Energie beträgt: E = 0,002388 u ⋅ 931,5 MeV = 2, 22 MeV . u Diese Energie wird von der γ-Strahlung weggetragen und vom Deuterium in Form kinetischer Energie. 94 Kernfusion findet täglich im großen Stil statt, nämlich in der Sonne und allen anderen Sternen im Universum. Der Energieausstoß der Sonne geht auf folgende Kernreaktionen zurück: 1 1H + 11H → 12 D + e + + ν e 1 1H + 12 D → 23 He + γ 3 3 2 He + 2 He → (0, 42 MeV) (5, 49 MeV) 4 1 2 He + 1 H + 1 1H (12,86 MeV) Der gesamt Prozess läuft also folgendermaßen ab: 4 11H → 24 He + 2e + + 2ν e + 2 γ Dieser Prozess wird auch Proton-Proton-Zyklus genannt. Es müssen zuerst zwei der ersten und zwei der zweiten Reaktionen stattfinden, damit eine dritte Reaktion ablaufen kann. Der Energiegewinn ist damit 2 ⋅ 0, 42 MeV + 2 ⋅ 5, 49 MeV + 12,86 MeV = 24,7 MeV . Die beiden Positronen annihilieren schnell mit zwei Elektronen und erzeugen noch zusätzlich E = 2 ⋅ me ⋅ c 2 = 1,02 MeV , so dass die Gesamtmenge an gewonnener Energie pro Zyklus 26,7 MeV beträgt. In heißeren Sternen findet der sog. Kohlenstoff-Stickstoff-Zyklus statt: 12 6C + 11H → 137 N + γ (1,95 MeV) 13 7N → 136 C + e + + ν (1,37 MeV) 13 6C 14 7N + 1 1H → 14 7N + 1 1H +γ (7,54 MeV) → 15 8O +γ (7,35 MeV) 15 8O → 157 N + e + + ν (1,86 MeV) 15 7N + (4,96 MeV) 1 1H → 12 6C + 4 2 He Dieser Prozess (1937-1939 entdeckt) heißt nach seinen Entdeckern auch Bethe-WeizsäckerZyklus (Hans Bethe (1906-2005) und Carl Friedrich v. Weizsäcker (1912-2007)). Man versucht natürlich, die Energiegewinnung der Sonne auf der Erde nachzubauen. Bei einem Fusionsreaktor sind diejenigen Fusionsreaktionen am erfolgversprechendsten, bei denen die Wasserstoffisotope Deuterium und Tritium beteiligt sind: 2 1H + 12 H → 13 H + 11H (4,03 MeV) 2 1H + 12 H → 23 He + n (3,27 MeV) 2 1H + 13 H → 24 He + n (17,59 MeV) Man erkennt, dass bei dieser Fusionsreaktion die abgegebene Energie pro eingesetzter Brennstoffmasse größer sein kann. Außerdem kann man Deuterium verwenden, das im Wasser in der Natur zu 0,015% vorkommt. Man erhält also 1 g Deuterium aus 60 Liter Meerwasser. Ferner bekommt man keine radioaktiven Spaltprodukte, die man anschließend entsorgen muss. 95 Das Problem bei diesen Reaktionen ist, dass die Teilchen positiv geladen sind und man sie dicht aneinander bringen muss, damit die starke Kernkraft wirken kann. Man benötigt also eine hohe kinetische Energie der Teilchen, was hohe Temperaturen bedeutet. Die Sterne sind durch den hohen Druck heiß genug und halten ihre Fusionsreaktion von alleine aufrecht. Auf der Erde jedoch macht der stabile Einschluss des heißen Plasmas Probleme und vor allem das Aufheizen des Plasmas, das im Moment noch mehr Energie benötigt, als am Ende durch die Kernfusionsreaktionen gewonnen werden kann. 7.5 Radiometrie und medizinische Anwendungen 7.5.1 Dosimetrie und Strahlentherapie Da ionisierende Strahlung beim Durchgang durch Materialien sowie durch den menschlichen Körper beachtliche Schäden hervorrufen kann, ist es wichtig, die Strahlendosis quantitativ zu ermitteln. Dies ist die Aufgabe der Dosimetrie. Die offizielle SI-Einheit für die aufgenommene Strahlendosis ist das Gray (Gy): 1 Gy = 1 J/kg. Die aufgenommene Dosis hängt aber auch vom betreffenden Körperteil und von der Art der Strahlung selbst ab. Daher ist die physikalische Einheit Gray kein aussagekräftiges Maß für Strahlungsschäden, insbesondere nicht bei Menschen und anderen lebenden Organismen. Man führt daher die Äquivalentdosis ein, die einen sog. Qualitätsfaktor (QF) der entsprechenden Strahlungsart berücksichtigt: Äquivalentdosis (Sv) = Dosis (Gy) · QF Qualitätsfaktoren verschiedener Strahlungsarten: Strahlungsart: QF: Röntgen- oder γ-Strahlung β-Strahlung (Elektronen) schnelle Protonen langsame Neutronen schnelle Neutronen α-Teilchen und schwere Ionen ≈1 ≈1 1 ≈3 bis 10 bis 20 Obwohl radioaktive Strahlung Krebs verursachen kann, kann sie auch zur Krebstherapie eingesetzt werden. Dabei werden relativ hohe Dosen zum Abtöten der Tumore benötigt, und es kommt darauf an, das gesunde benachbarte Gewebe so wenig wie möglich in Mitleidenschaft zu ziehen. Man verwendet dazu einen dünnen Röntgen- oder γ-Strahl und rotiert die Quelle um den Tumor herum, damit die Dosis an jedem anderen Ort so gering wie möglich ist – mit Ausnahme der Tumorzellen. Es werden auch Protonen, Neutronen und Elektronen aus Teilchenbeschleunigern zur Krebstherapie eingesetzt. 96 Man kann radioaktive Substanzen auch als Marker verwenden. Man synthetisiert dazu Moleküle mit radioaktiven Nukliden und kann dann ihren Weg beim Transport durch den Organismus oder während der Teilnahme an einer chemischen Reaktion beobachten. 7.5.2 - Medizinische Diagnostik: CT, PET und MRT Computertomographie (CT) Ein Röntgenstrahl wird unter verschiedenen Winkeln durch den Körper gestrahlt. Man erreicht dadurch eine Schichtabbildung des zu untersuchenden Körperteils. - Positronen-Emissions-Tomographie (PET) Moleküle mit β+-Strahlern (C-11, N-13, O-15, F-18) werden in den Körper injiziert. Das Positron trifft sehr schnell auf ein Elektron. Beide annihilieren sich und senden dabei γ-Strahlen mit jeweils 511 keV in entgegengesetzte Richtung aus. Das kann Hinweise auf den Stoffwechsel oder andere Funktionsweisen im Körper geben. - Kernspinresonanz (NMR), Magnetresonanz-Tomographie (MRT) Wir wissen von der Spin-Bahn-Kopplung, dass die Zustände abhängig vom Spin der Elektronen im Magnetfeld aufgespalten werden, und zwar umso mehr, je größer das Magnetfeld ist. Auch Kerne haben ein magnetisches Moment. Betrachtet man Wasserstoff mit nur einem Proton, so kann dieser Kernspin nur zwei Werte annehmen, nämlich Spin auf oder Spin ab. Im Magnetfeld sind die Energien des Kern in den beiden Zuständen nicht mehr gleich. Strahlt man nun elektromagnetische Strahlung im Radiobereich ein, dann wird die Strahlung genau dann absorbiert, wenn die Energiedifferenz der beiden Kernspin-Zustände genau der Strahlungsenergie entspricht. Auf diese Weise kann man beispielsweise Wasserstoff im menschlichen Körper detektieren, aber auch in der Forschung sehr viel über die Struktur der Materie und deren Bindungen herausfinden. 7.6 Elementarteilchen und das Standardmodell Bis jetzt wurden Protonen und Neutronen immer als kleinste Bestandteile des Kerns betrachtet. Man hat mit Teilchenbeschleunigern nebenbei immer mehr kleinste Elementarteilchen gefunden mit mehr oder weniger verschiedenen Eigenschaften. 1964 wurde von Murray Gell-Mann und George Zweig vorgeschlagen, dass die sog. Hadronen, und zu dieser Teilchenfamilie gehören Protonen und Neutronen, eben nicht elementar sind, sondern ihrerseits aus noch viel kleineren Teilchen zusammengesetzt sind – den sog. Quarks. Mittlerweile wurden 6 verschiedene Quarks gefunden: up, down, charm, strange, top, bottom. 97 Das Proton bestehen aus zwei up-Quarks und einem down-Quark. Die Quarks werden von Gluonen zusammengehalten, die die tatsächlichen Austauschteilchen der starken Wechselwirkung sind. Ein up-Quark hat die Ladung +2/3e, ein down-Quark –1/3e. Deshalb ist die Gesamtladung des Protons +1e. Man hat noch nie ein isoliertes Quark beobachten können, sondern sie kommen immer wenigstens gepaart und mit einem Gluon verbunden vor. Es gibt aber bereits Hinweise auf die Existenz von getrennten Quarks und Gluonen, einem sog. Quark-Gluon-Plasma. Möglicherweise gelingt es, freie Quarks mit den neuesten Teilchenbeschleunigern, z.B. dem LHC am CERN zu beobachten. Ein Neutron besteht aus zwei down- und einem up-Quark, hat demzufolge die Ladung Null. Auch ein π-Meson ist kein Elementarteilchen im eigentlichen Sinn, sondern besteht aus einem up- und einem Anti-down-Quark. Es besitzt also eine Ladung +1e. Es gibt auch die negative Variante aus einem down- und einem Anti-up-Quark mit einer negativen Ladung -1e, genauso wie eine neutrale Form. Diese Ladung und auch die anziehende Wechselwirkung zwischen Protonen und Neutronen wird durch das π-Mesonen-Austausch-Modell beschrieben. Aus heutiger Sicht kennt man innerhalb des sog. Standardmodells folgende Elementarteilchen: - 6 Quarks (up, down, charm, strange, top, bottom) - 6 Leptonen (Elektron und Elektron-Neutrino, Myon und Myonneutrino, Tau-Teilchen (oder auch „Tauon“) und Tauneutrino) - 3 Arten von Eichbosonen (Photon als Vermittler der elektromagnetischen Wechselwirkung, W±- bzw. Z-Boson als Austauschteilchen der schwachen Wechselwirkung, Gluon als Vermittler der starken Wechselwirkung) Es gibt noch theoretisch vorhergesagte Teilchen, wie z. B. das Graviton (das Austauschteilchen der Gravitation), oder das Higgs-Boson (durch Wechselwirkung mit dem Higgs-Feld wird einem Teilchen seine Masse zugeordnet), sowie noch einige andere Teilchen. Diese sind aber experimentell noch nicht nachgewiesen worden. 98