Kursvorlesung Theoretische Optik WS 1999/2000 Falk Lederer Institut für Festkörpertheorie und Theoretische Optik Friedrich-Schiller-Universität Jena 4 Inhaltsverzeichnis 1 Einführung 8 2 Optische Felder in dispersiven und isotropen Medien 2.1 Die Maxwellschen Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Übergang zu Gleichungen in der Optik . . . . . . . . . . . . . . . 2.1.2 Das Zeitverhalten der Felder - Mono- und Polychromasie . . . . . 2.1.3 Die Maxwellschen Gleichungen im Fourierraum . . . . . . . . . . 2.1.4 Übergang von den Maxwellgleichungen zur Wellengleichung . . . . 2.1.5 Bemerkungen zur Polarisation . . . . . . . . . . . . . . . . . . . . 2.2 Beschreibung der Medien - die Materialgleichungen . . . . . . . . . . . . 2.2.1 Grundsätzliches . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Die dielektrische Polarisation und die dielektrische Funktion . . . 2.2.3 Der Konduktionsstrom und die Leitfähigkeit . . . . . . . . . . . . 2.2.4 Die komplexe dielektrische Funktion . . . . . . . . . . . . . . . . 2.2.5 Dispersion im Glas . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.6 Die Materialgleichungen im Zeitbereich . . . . . . . . . . . . . . . 2.3 Die Energiestromdichte und Energiebilanz . . . . . . . . . . . . . . . . . 2.3.1 Der zeitlich gemittelte Poyntingvektor . . . . . . . . . . . . . . . 2.3.2 Die zeitlich gemittelte Energiebilanz . . . . . . . . . . . . . . . . . 2.4 Die Kramers–Kronigsche Dispersionsrelation . . . . . . . . . . . . . . . . 2.5 Die Normalmoden des homogenen isotropen Mediums . . . . . . . . . . . 2.5.1 Longitudinale Wellen . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.2 Transversale Wellen . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.3 Energiestromdichte und Intensität ebener Wellen . . . . . . . . . 2.6 Gebündelte Wellenfelder (Strahlen) und Impulse - Analogie von Beugung und Pulsverbreiterung (Dispersion) . . . . . . . . . . . . . . . . . . . . . 2.6.1 Ausbreitung gebündelter Wellenfelder im homogenen Raum . . . 2.6.2 Ausbreitung eines Gauß-Bündels . . . . . . . . . . . . . . . . . . 2.6.3 Gaußsche Optik . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.4 Gaußsche Moden in einem Resonator . . . . . . . . . . . . . . . . 2.6.5 Ausbreitung von Impulsen . . . . . . . . . . . . . . . . . . . . . . 37 39 47 53 56 62 3 Beugungstheorie 3.1 Wechselwirkung mit ebenen Schirmen . . . . . . . . . . . . . . . . . 3.2 Beschreibung der Ausbreitung in verschiedenen Näherungen . . . . 3.2.1 Der allgemeine Fall - kleine Öffnungen, große Öffnungswinkel 3.2.2 Fresnelnäherung - paraxial . . . . . . . . . . . . . . . . . . . 76 76 77 77 78 5 . . . . . . . . . . . . 9 9 9 10 11 11 12 13 13 16 17 18 22 23 24 24 26 26 29 30 31 36 3.2.3 Fraunhofernäherung - paraxial und Fernfeld . . . . . . . . . . . . Fraunhoferbeugung an ebenen Schirmen . . . . . . . . . . . . . . . . . . 3.3.1 Bemerkungen zur Fresnelbeugung am Spalt . . . . . . . . . . . . 78 82 87 4 Fourieroptik −→ Optische Filterung 4.1 Die Abbildung eines beliebigen Feldes mit einer dünnen Linse . . . . . . 88 88 4.1.1 Transferfunktion einer dünnen Linse . . . . . . . . . . . . . . . . 4.1.2 Die Beschreibung der Abbildung . . . . . . . . . . . . . . . . . . . Optische Filterung bzw. Bildberarbeitung . . . . . . . . . . . . . . . . . 88 89 92 4.2.1 4.2.2 Die 4f - Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . Beispiele: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 95 Das Prinzip der holographischen Abbildung . . . . . . . . . . . . . . . . 99 3.3 4.2 4.3 5 Die Polarisation elektromagnetischer Wellen 5.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Die Polarisation einer Normalmode im isotropen, dispersiven Medium 5.2.1 Polarisationszustände . . . . . . . . . . . . . . . . . . . . . . . 5.3 Alternative Darstellung des Polarisationszustandes . . . . . . . . . . . 5.3.1 5.3.2 7 Optische Felder in isotropen, dispersiven und stückweise Medien 7.1 Grundsätzliches . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.1 Definition des Problems . . . . . . . . . . . . . . . . 7.1.2 Grenzflächen und Symmetrien . . . . . . . . . . . . . 7.1.3 Die Übergangsbedingungen . . . . . . . . . . . . . . 7.2 Das Feld im Schichtsystem −→ die Matrixmethode . . . . . 7.3 102 102 102 104 107 in homogenen, anisotro110 . . . . . . . . . . . . . . . 110 . . . . . . . . . . . . . . . 113 . . . . . . . . . . . . . . . 113 Normalmoden im anisotropen Medium . . . . . . . . . . . . . 6.4.1 Normalmoden bei Ausbreitung in Hauptachsen . . . . 6.4.2 Normalmoden bei beliebiger Ausbreitungsrichtung −→ onsrelation . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.3 Einachsige Kristalle . . . . . . . . . . . . . . . . . . . . 7.2.1 7.2.2 . . . . Poincaré-Kugel, Stokes-Parameter . . . . . . . . . . . . . . . . . . 107 Jones-Kalkül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 6 Grundzüge der Kristalloptik - Normalmoden pen Medien 6.1 Suszeptibiltäts- und Dielektrizitätstensor . . . 6.2 Die optische Klassifikation von Kristallen . . . 6.3 Das Indexellipsoid . . . . . . . . . . . . . . . . 6.4 . . . . . . . . . . . . . . . . Dispersi. . . . . . . . . . . . 114 115 116 121 homogenen 127 . . . . . . . 127 . . . . . . . 127 . . . . . . . 128 . . . . . . . 129 . . . . . . . 129 Das Feld in einer homogenen Schicht . . . . . . . . . . . . . . . . 129 Das Feld im Schichtsystem . . . . . . . . . . . . . . . . . . . . . . 131 Reflexions - Transmissionsproblem an Schichtsystemen . . . . . . . . . . 132 6 7.3.1 7.3.2 7.4 Allgemeines Schichtsystem . . . . . . . . . . . . . . . . . . . . . . 132 Die einfache Grenzfläche . . . . . . . . . . . . . . . . . . . . . . . 139 7.3.3 Die optische Schicht . . . . . . . . . . . . . . . . . . . . . . . 7.3.4 Periodische Vielschichtsysteme - Bragg-Spiegel . . . . . . . . . 7.3.5 Fabry-Perot-Resonatoren . . . . . . . . . . . . . . . . . . . . . Geführte Wellen in Schichtsystemen . . . . . . . . . . . . . . . . . . . 7.4.1 Feldstruktur geführter Wellen . . . . . . . . . . . . . . . . . . 7.4.2 Die Dispersionsrelation geführter Wellen . . . . . . . . . . . . 7.4.3 Geführte Wellen an einer Grenzfläche - Oberflächenpolaritonen 7.4.4 Geführte Wellen in einer Schicht - Schichtwellenleiter . . . . . 7.4.5 Anregung geführter Moden . . . . . . . . . . . . . . . . . . . . 7.4.6 Einige Bemerkungen zu Streifen- und Faserwellenleitern . . . . 8 Statistische Optik – Kohärenztheorie 8.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . 8.2 Statistische Eigenschaften des Lichtes . . . . . . . . 8.2.1 Definitionen . . . . . . . . . . . . . . . . . . 8.3 Interferenz mit partiell kohärentem Licht . . . . . . 8.3.1 Interferenz zweier partiell kohärenter Wellen 8.3.2 Interferenz und zeitliche Kohärenz . . . . . . 8.3.3 Interferenz und räumliche Kohärenz . . . . . 8.3.4 Räumliche Kohärenz und Ausbreitung . . . 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 151 155 163 163 164 166 170 177 179 . . . . . . . . . . . . . . . . 184 184 185 185 190 190 191 192 193 Kapitel 1 Einführung Optik(grie. optique - Lehre vom Licht) 8 Kapitel 2 Optische Felder in dispersiven und isotropen Medien 2.1 2.1.1 Die Maxwellschen Gleichungen Übergang zu Gleichungen in der Optik Die Maxwellschen Gleichungen in ihrer allgemeinsten Form lauten rot E(r, t) = − ∂B(r, t) , ∂t div D(r, t) = ρext (r, t) (2.1) rot H(r, t) = jmakr (r, t) + ∂D(r, t) , ∂t div B(r, t) = 0 Die dielektrische Verschiebung D(r, t) und das Magnetfeld H(r, t) unterscheiden sich in Medien vom elektrischen Feld E(r, t) und der Induktion B(r, t) folgendermaßen D(r, t) = ε0 E(r, t) + P(r, t) (2.2) H(r, t) = 1 [B(r, t) − M(r, t)] µ0 Dabei beschreiben die dielektrische Polarisation P(r, t) und die Magnetisierung M(r, t) den Einfluß der Materie. Sie hängen mit den Feldern E(r, t) und B(r, t) über die Materialgleichungen zusammen. Dieser Zusammenhang ist im allgemeinen recht kompliziert und folgt aus anderen Theorien (Festkörpertheorie). In der Optik hat man es in der Regel mit unmagnetischen Medien zu tun und kann deshalb M(r, t) = 0 setzen. Die Quellen der Felder sind die frei verschiebbaren Ladungsdichten ρext (r, t) und die makroskopischen Stromdichten jmakr (r, t) = jcond (r, t) + jconv (r, t). Der konduktive Strom hängt in noch zu spezifizierender Weise vom elektrischen Feld ab, jcond (r, t) = f (E). Für 9 den konvektiven Strom gilt: jconv (r, t) = ρext (r, t)v. In der Optik gibt es in der Regel keine externen Ladungen (ρext (r, t) = 0, jconv (r, t) = 0). Damit lassen sich die Maxwellschen Gleichungen in der für die Optik relevanten Form schreiben rot E(r, t) = −µ0 ∂H(r, t) , ∂t ε0 div E(r, t) = −div P(r, t) (2.3) rot H(r, t) = jcond (r, t) + ∂E(r, t) ∂P(r, t) + ε0 , ∂t ∂t div H(r, t) = 0 Die Polarisationsladungen ρpol (r, t) = −div P(r, t) und -ströme jpol (r, t) = ∂P(r,t) sind ∂t nicht vorgebbar. Die Grundaufgabe der Optik besteht darin, bei vorgegebenem Zusammenhang P(E) und j(E) die Gleichungen (2.3) konsistent zu lösen. Obwohl physikalische Größen reell sind, kann man sie in linearen Theorien ins Komplexe fortsetzen, muß jedoch letztendlich wieder zum Realteil übergehen. Bei Produktbildungen ist immer mit den reellen Größen zu rechnen. Die Gleichungen (2.3) gelten also für komplexe Größen, wobei für den Realteil gilt Er (r, t) = 12 [E(r, t) + E∗ (r, t)] = Re [E(r, t)] 2.1.2 Das Zeitverhalten der Felder - Mono- und Polychromasie A) Monochromasie ←→ stationäre Felder Alle Felder weisen eine harmonische Zeitabhängigkeit auf ∼ exp(−iωt) → feste Phasenlage, vollständige Kohärenz, unendliche Wellenzüge. Wir geben das für alle Felder typische Zeitverhalten für das elektrische Feld an E(r, t) = E(r, ω) exp(−iωt) B) Polychromasie ←→ nichtstationäre Felder Alle Wellenzüge sind endlich. Das Feld wird in seine Fourierkomponenten zerlegt ←→ Zerlegung in unendliche, harmonische Wellenzüge ∞ E(r, t) = E(r, ω) exp(−iωt)dω (2.4) −∞ 1 E(r, ω) = 2π ∞ E(r, t) exp(iωt)dt −∞ 10 (2.5) 2.1.3 Die Maxwellschen Gleichungen im Fourierraum Setzt man die Fourierzerlegung (2.4) in die Gleichungen (2.3) ein und beachtet dabei, daß die Zeitableitungen wegen ∂E(r, t) ∂ = ∂t ∂t ∞ ∞ E(r, ω) exp(−iωt)dω = −∞ (−iω)E(r, ω) exp(−iωt)dω −∞ im Fourierraum in die Multiplikation mit (−iω) übergehen, erhält man rot E(r, ω) = iωµ0 H(r, ω), ε0 div E(r, ω) = −div P(r, ω) (2.6) rot H(r, ω) = j(r, ω) − iωP(r, ω) − iωε0 E(r, ω), 2.1.4 div H(r, ω) = 0 Übergang von den Maxwellgleichungen zur Wellengleichung A) Zeitraum Aus den Gleichungen (2.3) erhält man ∂H(r, t) ∂ ∂E(r, t) ∂P(r, t) rotrot E(r, t) = −µ0 rot = −µ0 j(r, t) + + ε0 ∂t ∂t ∂t ∂t rotrot E(r, t) + ∂j(r, t) ∂ 2 P(r, t) 1 ∂2 − µ E(r, t) = −µ 0 0 c2 ∂t2 ∂t ∂t2 Weiterhin gilt für das elektrische Feld ε0 div E(r, t) = −div P(r, t) und das Magnetfeld erhält man aus ∂H(r, t) 1 = − rot E(r, t) ∂t µ0 11 (2.7) B) Frequenzraum Durch Fouriertransformation von (2.7) oder direkt aus (2.6) erhält man rotrot E(r, ω) − ω2 E(r, ω) = iωµ0 j(r, ω) + µ0 ω 2 P(r, ω) c2 (2.8) Entsprechend gilt ε0 div E(r, ω) = −div P(r, ω) (2.9) und H(r, ω) = − i rot E(r, ω) ωµ0 (2.10) Im stationären Fall erhält man die Lösung des Problems durch die Lösung der obigen Gleichungen und einfache Multiplikation mit exp(−iωt). Für nichtstationäre Felder hat man die Fourier-Rücktransformation (2.4) auszuführen, um die zeitabhängigen Felder zu erhalten. 2.1.5 Bemerkungen zur Polarisation In beliebigen isotropen Medien sind im allgemeinen alle Feldkomponenten verkoppelt. Die Situation vereinfacht sich, wenn in einer Richtung (z.B. y ) Translationsinvarianz vorliegt (−→ ∂/∂y = 0). Das gilt in homogenen unendlichen, Medien, Schichten und an unendlichen Grenzflächen. Der Differentialoperator der Wellengleichung (2.8) schreibt sich dann (2) ∂ ∂E x ∂E z + ∆ Ex ∂z ∂x ∂x (2) rot rot E = grad div E − ∆E = 0 − ∆(2) E y ∂ ∂E x ∆ Ez + ∂E z ∂z Die Zerlegung E = E⊥ + E mit ∂x ∂z Ex E = 0 Ez 0 E⊥ = E y , 0 ergibt mit (2.8) ω2 ∆ E⊥ + 2 E⊥ (r, ω) = −iωµ0 j⊥ (r, ω) − µ0 ω 2 P⊥ (r, ω) c (2) ∆(2) E + ω2 E(r, ω) − grad(2) div(2) E = −iωµ0 j(r, ω) − µ0 ω 2 P(r, ω) c2 Bei Vorliegen von Translationsinvarianz in einer Richtung können die verkoppelten vektoriellen Wellengleichungen (2.8) entkoppelt werden. Die Ausbreitung der senkrecht zueinander polarisierten Felder kann unabhängig berechnet werden. Die entsprechenden Polarisationen kürzt man mit (oder p oder TM) und (⊥ oder s oder TE) ab. 12 2.2 2.2.1 Beschreibung der Medien - die Materialgleichungen Grundsätzliches Die Bestimmung der Zusammenhänge P(E) und j(E) erfordert i.a. die Lösung eines komplizierten Vielteilchenproblems in der Festkörpertheorie. Oftmals beschreiben jedoch phänomenologische Modelle diesen Zusammenhang ausreichend. Wir werden hier als einfaches Modell das Drude-Modell für freie und gebundene Ladungträger kennenlernen. Freie Ladungsträger treten in Metallen und angeregten Halbleitern (Intrabandeffekte), gebundene Ladungsträger in Dielektrika und Halbleitern (Interbandeffekte) auf. Der Zusammenhang zwischen Ursache (elektrisches Feld) und Wirkung (induzierte Polarisation bzw. Strom) wird im Rahmen der linearen Responsetheorie beschrieben. Wir klassifizieren die Materialeigenschaften am Beispiel der Polarisation. Die lineare Reaktion des Mediums kann im Zeit- oder im Frequenzraum beschrieben werden. Die die Reaktion vermittelnde Größe heißt im Zeitraum Responsefunktion und in Frequenzraum Übertragungsfunktion. E(r, t) −→ Medium (Responsefunktion) −→ P(r, t) E(r, ω) −→ Medium (Übertragungsfunktion) −→ P(r, ω) 2.2.1.1 Definition der Begriffe • linear: P(r, t) = ε0 R(r, t)E(r, t), R(r, t) - Responsefunktion, - Operator P(r, ω) = ε0 χ(r, ω) E(r, ω), χ(r, ω) - Suszeptibilität, - Operator FT χ(r, ω) ←→ R(r, t) • dispersiv (nichtinstantan) ←→ nichtdispersiv (instantan): dispersiv −→ χ(r, ω) ←→ P(r, t) = f E(r, t, t ) nichtdispersiv −→ χ (r) ←→ P(r, t) = f [E(r, t)] • homogen ←→ inhomogen homogen −→ χ(ω), R(t) • isotrop ←→ anisotrop anisotrop −→ χij (r, ω) Rij (r, t) • lokal ←→ nichtlokal nichtlokal −→ P(r, t) = f E(r, r , t, t ) 13 2.2.1.2 Folgerungen für die Wellengleichungen aus den unterschiedlichen Materialgleichungen Wir setzen die relevante Polarisation P̄(r, ω) in die Wellengleichung (ohne Stromterm) ω2 rotrot Ē(r, ω) − 2 Ē(r, ω) = µ0 ω 2 P̄(r, ω) c und in D̄(r, ω) = ε0 Ē(r, ω) + P̄(r, ω) ein. a) linear, homogen, isotrop, nichtdispersiv χ(r, ω) = χ skalare Konstante ←→ P̄(r, ω) = ε0 χ Ē(r, ω) P(r, t) = ε0 χE(r, t) ←→ D(r, t) = ε0 εE(r, t) D̄(r, ω) = ε0 ε Ē(r, ω) R(t) = → χ(ω) exp(−iωt)dω = 2πχδ(t) damit wird wegen div D̄(r, ω) = 0 →ε=1+χ instantan div Ē(r, ω) = 0 und damit ∆ Ē(r, ω) + ∆ E(r, t) − ω2 ε Ē(r, ω) = 0 c2 ε ∂2 E(r, t) = 0 c2 ∂t2 Das Ergebnis ist ’unphysikalisch’, da jedes Medium dispersiv ist. Gilt näherungsweise in einem Frequenzbereich, in dem Dispersion zu vernachlässigen ist. b) linear, homogen, isotrop,dispersiv −→ χ(ω) P̄(r, ω) = ε0 χ(ω) Ē(r, ω), D̄(r, ω) = ε0 ε(ω) Ē(r, ω) div D̄(r, ω) = 0 div Ē(r, ω) = 0 für ε(ω) = 0. Daraus folgt die Helmholtzgleichung ∆ Ē(r, ω) + ω2 ε (ω) Ē(r, ω) = 0 c2 → Response hängt von Frequenz ab. c) linear, inhomogen, isotrop, dispersiv −→ χ(r,ω) 14 P̄(r, ω) = ε0 χ(r, ω) Ē(r, ω), D̄(r, ω) = ε0 ε(r, ω) Ē(r, ω). div D̄(r, ω) = ε0 ε(r, ω)div Ē(r, ω) + ε0 Ē(r, ω)grad ε(r, ω), grad ε(r, ω) Ē(r, ω). div Ē(r, ω) = − ε(r, ω) Damit erhält man ω2 ∆ Ē(r, ω) + 2 ε (ω) Ē(r, ω) = −grad c grad ε(r, ω) Ē(r, ω) ε(r, ω) → Kopplung der Feldkomponenten. d) linear, homogen, anisotrop, dispersiv −→ χij (ω) P̄i (r, ω) = ε0 χij (ω) Ēj (r, ω) D̄i (r, ω) = ε0 εij (ω) Ēj (r, ω). e) nichtlinear, homogen, isotrop, dispersiv −→ χ(ω, Ē) P̄(r, ω) = ε0 χ(r, ω) Ē(r, ω) + P̄NL (Ē) →tritt auf für hohe Intensitäten. Ähnliche Überlegungen lassen sich für den Strom j̄(r, ω) anstellen. Im wesentlichen lassen sich zwei Fälle unterscheiden: 1. Beiträge gebundener Elektronen und Gitterschwingungen → typisch für Dielektrika und Halbleiter • Gitterschwingungen oder Phononen ionischer Teil (geladene Teilchen) der Materialresponse, große Massen (103 × Elektronenmasse), kleine Schwingungen, verantwortlich für thermische Eigenschaften, einige spezielle Gitterschwingungen (Phononenmoden) tragen zu optischen Eigenschaften bei, optische und akustische Phononen, optische relevant, aber geringe Dispersion → constant, longitudinal und transversal, nur transversale koppeln mit Licht, longitudinale WW stärker → höhere Frequenzen in Resonanznähe werden die Teilchen aus der Ruhelage bewegt → durch Verschiebung der Ladungsschwerpunkte entsteht ein Dipolmoment (Polarisationsdichte), das mit der Feldfrequenz schwingt → Abstrahlung eines Feldes → Überlagerung mit einfallendem Feld → Amplituden hängen vom Verhältnis der anregenden Frequenz zur Eigenfrequenz ab, Dispersion (unterschiedliche Reaktion)→ χ(ω) 15 • Elektronenübergänge eigentlich quantentheoretisch, Teilchen von Valenzband in Leitungsband, Übergangsfrequenz, Vielteilcheneffekte, kann klassisch durch eine Schwingung gebundener Elektronen beschrieben werden, (Eigenfrequenzen der Ionen ω0ion << Eigenfrequenzen der Elektronen ω0el ) → χ(ω) 2. Beiträge freier Elektronen → typisch für Metalle und angeregte Halbleiter relativ freie Elektronen → Modell des freien Elektronengases (keine gegenseitige WW), Ladungsbalance durch Untergrund der Ionen, Stöße nur mit ruhenden Ionen → σ(ω) → die beiden Fälle werden einzeln behandelt und später zusammengeführt. 2.2.2 Die dielektrische Polarisation und die dielektrische Funktion → Beiträge gebundener Teilchen (Ionen, Elektronen) → Drude–Modell zeitabhängiges Feld E(r, t) ruft eine Verschiebung s(r, t) für eine bestimmte Sorte von Atomen hervor → Beschreibung als Oszillator mit äußerer, treibender Kraft s̈(r,t)+g ṡ(r,t) + ω02 s(r,t) = − e E(r, t) m mit der Resonanzfrequenz (elektronischer Übergang oder optische Gitterschwingung) ω0 und der Dämpfung g . Das induzierte Dipolmoment ist p(r, t) = −es(r,t), was auf die Dipoldichte oder dielektrische Polarisation P(r, t) = N p(r, t) führt. Damit ergibt sich P̈(r,t)+g Ṗ(r,t) + ω02 P(r, t) = mit der Oszillatorstärke f= e2 N E(r, t) = ε0 f E(r, t) m 1 e2 N . ε0 m Wir lösen die Gleichung im Fourierraum ∞ E(r, t) = ∞ Ē(r, ω) exp(−iωt)dω, P(r, t) = −∞ P̄(r, ω) exp(−iωt)dω −∞ und erhalten −ω 2 P̄(r, ω) − igω P̄(r, ω) + ω02 P̄(r, ω) = ε0 f Ē(r, ω) P̄(r, ω) = (ω02 ε0 f Ē(r, ω). − ω 2 ) − igω 16 Im Falle mehrerer Resonanzen ergibt sich fj 2 Ē(r, ω) P̄(r, ω) = ε0 2 − ig ω ω − ω j 0j j = ε0 χ (ω) Ē(r, ω) mit der komplexen, frequenzabhängigen Suszeptibilität fj 2 = χPhon (ω) + χElek (ω) . χ (ω) = ω0j − ω 2 − igj ω j Für die dielektrische Verschiebung kann man dann schreiben D̄(r, ω) = ε0 Ē(r, ω) + ε0 χ (ω) Ē(r, ω) = ε0 ε (ω) Ē(r, ω), wobei ε (ω) die komplexe dielektrische Funktion darstellt. Das wichtigste Ergebnis besteht darin, daß die dielektrische Response im Frequenzraum (Übertragungsfunktion) komplex und frequenzabhängig ist. Die Auswirkungen auf das zeitliche Verhalten diskutieren wir später, geben jedoch die zeitliche Responsefunktion R(t) an 1 . 1 FT [χ(ω)] = R(t) = 2π 2π ∞ χ(ω) exp(−iωt)dω −∞ f g = exp(− t) sin ν 0 t, ν0 2 2.2.3 ν02 = ω02 g2 − . 4 Der Konduktionsstrom und die Leitfähigkeit → Beitrag freier Ladungsträger (wechselwirkungsfreies Elektronengas über positiv geladenem Hintergrund), getriebener Oszillator mit Resonanzfrequenz ω0 = 0 (keine rücktreibende Kraft) e s̈(r, t)+g ṡ(r, t) = − E(r, t), m wobei die Elektronenmasse m im Halbleiter durch die effektive Masse meff zu ersetzen ist. Die Dämpfung g hängt mit Stößen der Elektronen mit den Rümpfen zusammen. Der induzierte Srom ergibt sich zu j(r, t) = −N eṡ(r, t) und damit j̇(r, t)+gj(r, t) = e2 N E(r, t) = ε0 f E(r, t) = ε0 ωp2 E(r, t) m mit der Plasmafrequenz ωp2 = f = 1 e2 N . ε0 m Im Fourierraum ergibt sich −iω j̄(r, ω) + g j̄(r, ω) = ε0 ωp2 Ē(r, ω) 17 j̄(r, ω) = ε0 ωp2 Ē(r, ω) = σ (ω) Ē(r, ω). g − iω mit der komplexen Leitfähigkeit ε0 ωp2 ε0 ωωp2 σ (ω) = = −i . g − iω −ω 2 − igω Bemerkung zur Plasmafrequenz: Wir berechnen die Bewegung einer externen Ladungswolke ρext in ihrem eigenen Feld: j̇(r,t)+gj(r,t) =ε0 ωp2 E(r, t) und ε0 divE(r, t) = ρext . Divergenzbildung ergibt divj̇(r,t)+gdivj(r,t) =ε0 ωp2 divE(r, t) = ωp2 ρext . Benutzt man die Kontinuitätsgleichung ρ̇ext + divj = 0, ergibt sich −ρ̈ext − g ρ̇ext = ωp2 ρext ρ̈ext + g ρ̇ext + ωp2 ρext = 0, d.h. die Plasmafrequenz ωp2 ist die Eigenfrequenz der im eigenen Feld schwingenden Ladungswolke. 2.2.4 Die komplexe dielektrische Funktion Wir setzen die Materialgleichungen j̄(r, ω) und P̄(r, ω) in die Wellengleichung (2.8) ein und erhalten rotrot E(r, ω) − ω2 E(r, ω) = iωµ0 j(r, ω) + µ0 ω 2 P(r, ω) 2 c = µ0 ε0 ω 2 χ(ω) + iωµ0 σ (ω) E(r, ω) i ω2 rotrot E(r, ω) = 2 1 + χ(ω) + σ (ω) E(r, ω) c ωε0 ω2 = 2 ε(ω)E(r, ω) c mit der komplexen dielektrischen Funktion i ε(ω) = 1 + χ(ω) + σ (ω) = ε (ω) + iε (ω) ωε0 ωp2 fj 2 =1+ , + 2 − igω 2 − ig ω −ω ω − ω j 0j j 18 die die Beiträge des Vakuums, der Gitterschwingungen, der gebundenen und freien Elektronen enthält. Speziell gilt für die relevanten Materialien im IR und sichtbaren Spektralbereich: • Dielektrika, Isolatoren in der Nähe einer Gitterresonanz (IR-Spektralbereich) f fj 2 + 2 ε(ω) = 1 + 2 (ω0 − ω 2 ) − igω ω0j − ω − igj ω j = ε∞ + (ω02 f , − ω 2 ) − igω wobei ε∞ den Beitrag des Vakuums und aller elektronischen Übergänge beschreibt. Damit erhält man ε(ω) = ε(ω) + i ε(ω) = ε (ω) + i ε (ω) ε (ω) = ε∞ + f (ω02 − ω 2 ) , 2 (ω02 − ω 2 ) + g 2 ω 2 gf ω ε (ω) = 2 . 2 (ω0 − ω 2 ) + g 2 ω 2 Die Lage der Resonanzen wird durch ω0 und die Resonanzbreite durch g bestimmt. Die Resonanz trägt auch zu statischer Dielektrizitätskonstante f . ε0 = ε(0) = ε∞ + 2 ω0 bei. Die Oszillatorstärke kann damit in den Formeln entsprechend f = ε0 − ε∞ ω02 ersetzt werden. Bei der sog. longitudinalen Frequenz (ω = ωL ) verschwindet der Realteil der dielektrischen Funktion, d.h. ε (ωL ) = 0. ε (ω) = 0 ist immer mit einer Absorption verbunden, d.h. Absorption und Dispersion treten immer gemeinsam auf. Isolierte Resonanz 12 ε′ ε′′ 8 4 ε0 0 ω0 ε∞ ω ωL -4 19 Man beachte, daß in Resonanznähe ε (ω) < 0 (führt auf Dämpfung ohne Absorption) sein kann. Normale Dispersion liegt für ∂ε (ω)/∂ω > 0, anormale für ∂ε (ω)/∂ω > 0 < 0 vor. Für eine extrem scharfe ’ Resonanz gilt g → 0. Scharfe Resonanz 12 ε 8 4 ε0 0 ω0 ε∞ ω ωL -4 -8 Hier kann man einen Zusammenhang zwischen den beiden charakteristischen Frequenzen ω0 und ωL , die sog. Lyddane-Sachs-Teller Relation, angeben ωL = ω0 ε0 . ε∞ • Dielektrische Medien im sichtbaren Spektralbereich kann man vorteilhaft mit einem sog. Doppelresonanzmodell beschreiben, wobei jeweils eine Gitterschwingung im IR und ein elektronischer ’Übergang’ berücksichtigt werden ε(ω) = ε∞ + 2 (ω0G fG fe + 2 , 2 − ω ) − igG ω (ω0e − ω 2 ) − ige ω √ wobei typische Werte für ein Flouridglas sind: fG = 1.22 × 1014 s−1 , gG = 0.9 × √ 1014 s−1 , ω0G = 1.74 × 1014 s−1 , fe = 6.7 × 1015 s−1 , ge = 2.8 × 1015 s−1 , ω0e = 0.9 × 1016 s−1 . In ε∞ sind mögliche andere weit entfernte Resonanzen enthalten, u.U. kann hier ε∞ = 1 sein. Zwei Resonanzen 20 2 .2 ε' 2 1 .8 1 .6 V IS 1 .4 0 2 4 6 8 ω in 10 1 5 s -1 • Halbleiter ε(ω) = 1 + j fj 2 ω0j − ω 2 − igj ω + 2 ωphl f + , (ω02 − ω 2 ) − igω −ω 2 − igω 2 ωphl f + = ε∞ + 2 (ω0 − ω 2 ) − igω −ω 2 − igω d.h. im Halbleiter treten neben den Gitterschwingungsbeiträgen im fernen IR, elektronische Übergänge im nahen IR oder im Sichtbaren (wide-gap Halbleiter) auf. Daneben sind im angeregten HL die Beiträge der Elektronen im Leitungsband zu beachten. ωphl ist im allgemeinen wesentlich kleiner als ωpmet ≈ 1016 s−1 > ω und ist im IR angesiedelt (ωphl = 1014 s−1 < ω). • Metalle ε(ω) = 1 − 2 ωpmet . ω 2 + igω Hier ist (ωpmetl >> ω) . Damit weist die dielektrische Funktion einen großen negativen Realteil auf. Als Beispiel möge Aluminium dienen: 1. λ = 500 nm, ε = −32, ε = 7.3 2. λ = 700 nm, ε = −46, ε = 20 Die Beiträge freier Elektronen (sowohl im Halbleiter als auch im Metall) führen auf ωp2 gωp2 , ε (ω) = . ε (ω) = 1 − 2 ω + g2 ω (ω 2 + g 2 ) 21 Metall ε′ ε′′ 20 ωP 2 -g 2 0 V IS 5 10 15 20 25 ω in 10 15 s -1 -2 0 2.2.5 Dispersion im Glas Glas spielt als optisches Material eine herausragende Rolle. Im Gegensatz zu kristallinen Medien ist Glas amorph. Man unterscheidet zwischen Kronglas, das im wesentlichen aus Soda, Kalk und Siliziumdioxid besteht, niedrigbrechend ist ( n = 1.42...1.53) und eine geringe Dispersion aufweist und Flintglas, das aus Bleioxid und Siliziumdioxid besteht, hochbrechend ist ( n = 1.5...1.76) und eine starke Dispersion aufweist. Zur Dispersion des Glases tragen phononische und elektronische Anteile bei, deren Resonanzfrequenzen jedoch weit von den optischen Frequenzen entfernt sind (ω0p << ω << ω0e ), d.h. Absorptionseffekte können vernachlässigt werden (ε = 0) . Es gilt damit im Doppelresonanzmodell f 2 j , j = p, e ε (ω) − 1 = ω0j − ω 2 j mit ω = 2πc/λ folgt ε (λ) − 1 = j sj λ2 , λ2 − λ2j sj = fj λ2j 4π 2 c2 • elektronischer Beitrag → λ2e << λ2 [ε (λ) − 1]e = se 1− λ2e λ2 ≈ se λ2e λ4e 1 + 2 + 4 + ... . λ λ • phononischer Beitrag → λ2p >> λ2 s λ2 sp λ2 = − p2 [ε (λ) − 1]p = 2 λp λ − λ2p 22 −1 λ2 s p λ2 1− 2 ≈− 2 . λp λp Damit ergibt sich ε (λ) − 1 = [ε (λ) − 1]p + [ε (λ) − 1]e λ2e λ4e s p λ2 ≈ − 2 + se 1 + 2 + 4 + ... λp λ λ C D ≈ A − Bλ2 + 2 + 4 . λ λ oder n ≈ Ã + 2.2.6 dn 2B̃ ≈− 3. dλ λ B̃ , λ2 Die Materialgleichungen im Zeitbereich → die Responsefunktion oder Greensche Funktion Im Frequenzraum gilt: D̄(r, ω) = ε0 ε(ω)Ē(r, ω) P̄(r, ω) = ε0 χ(ω)Ē(r, ω). Wir beschränken uns hier auf den Zusammenhang zwischen Polarisation und elektrischem Feld im Zeitraum. Wir führen die Responsefunktion (Greensche Funktion) R(t) folgendermaßen ein ∞ 1 χ(ω) exp (−iωt) dω. R(t) = 2π −∞ 1 (Man beachte den zur FT zusätzlichen Faktor 2π ). Mit ∞ χ(ω) = R(t) exp (iωt) dt −∞ ∞ 1 E(r, t) exp (iωt) dt Ē(r, ω) = 2π −∞ erhält man ∞ ∞ 1 1 P(r, t) exp (iωt) dt = ε0 R(t ) exp (iωt ) E(r, t ) exp (iωt ) dt dt 2π −∞ 2π −∞ und mit der Transformation t = t − t ∞ exp (iωt) dt P(r, t) − ε0 −∞ −∞ P(r, t) = ε0 ∞ t −∞ R(t − t )E(r, t )dt =0 R(t − t )E(r, t )dt . Für E(r, t ) = δ(t − t0 ) ergibt sich P(r, t) = ε0 R(t − t0 ) ,d.h. die Response- oder Greensche Funktion. Beispiele: 23 • Dielektrika 1 R(t) = 2π ∞ 2 −∞ ω0 f exp (−iωt) dω, − ω 2 − igω Anwendung des Residuensatzes ergibt g 1 g2 sin Ωt, Ω = ω02 − . R(t) ∼ exp − t 2 Ω 4 t g P(r, t) ∼ exp − (t − t ) sin [Ω(t − t )] E(r, t )dt 2 −∞ • Metall R(t) ∼ exp (−gt) P(r, t) ∼ t −∞ exp [−g(t − t )] E(r, t )dt Die Dispersionstheorie ist ein Beispiel für eine lineare Übertragungstheorie. Eine lineare Differentialgleichung mit dem Differentialoperator LD LD W (t) = U (t) hat im Zeitraum die Lösung t W (t) = −∞ h(t − t )U (t )dt , wobei U das Ursachenfeld, W Wirkungsfeld und R die Response- oder Greensche Funktion darstellen, wobei gilt LD h(t − t ) = −δ(t − t ). Im Fourierraum gilt La W̄ (ω) = Ū (ω) , . W̄ (ω) = h̄ (ω) Ū (ω) = H (ω) Ū (ω) wobei La ein algebraischer Operator und H (ω) die Übertragungsfunktion des Systems ist. Es gilt 1 FT [H] . h= 2π 2.3 2.3.1 Die Energiestromdichte und Energiebilanz Der zeitlich gemittelte Poyntingvektor Der Energiefluß eines elektromagnetischen Feldes wird durch den Poyntingvektor S, der Energiefluß durch eine Fläche (Detektor) durch S · n beschrieben, wobei n der Normalenvektor zur Fläche ist. Der momentane Energiefluß ist definiert als S(r, t) = Er (r, t) × Hr (r, t). Folgende Zeitskalen treten auf: 24 • Die Schwingungsdauer ist gegeben duch T0 = 2π/ω0 ≤ 10−14 s. • Für die Impulsdauer Tp gilt i.a. Tp >> T0 . • Für die Meßzeit Tm gilt i.a. Tm >> T0 , Tm ≥ Tp → der Detektor kann im allgemeinen den schnellen Oszillationen nicht folgen und mißt den zeitlichen Mittelwert. Man schreibt die Felder als Produkt aus langsam veränderlichen Amplituden (Einhüllende) und schnellen Oszillationen → × 1 Ẽ(r, t) exp (−iω0 t) + c.c. . 2 Damit ergibt sich für den Energiefluß (instantaner Poyntingvektor) Er (r, t) = S(r, t) = Er (r, t) × Hr (r, t) 1 = Ẽ(r, t) × H̃∗ (r, t) + Ẽ∗ (r, t) × H̃(r, t) 4 1 + Ẽ(r, t) × H̃(r, t) exp (−2iω0 t) + Ẽ∗ (r, t) × H̃∗ (r, t) exp (2iω0 t) 4 1 1 = Ẽ(r, t) × H̃∗ (r, t) + Ẽ(r, t) × H̃(r, t) cos 2ω0 t 2 2 1 ∗ + Ẽ (r, t) × H̃∗ (r, t) sin 2ω0 t. 2 Der Meßprozeß stellt eine zeitliche Mittelung von S(r, t) dar Tm 1 S(r, t) = S(r, t)dt. 2Tm −Tm Die Integration führt zum Verschwinden der schnell oszillierenden Anteile Tm 1 1 Ẽ(r, t) × H̃∗ (r, t) dt. S(r, t) = 2 2Tm −Tm Für stationäre (monochromatische) Felder Ẽ(r, t) = Ē(r, ω), H̃(r, t) = H̄(r, ω) vereinfacht sich die Beziehung zu 1 S(r, t) = Ē(r, ω) × H̄∗ (r, ω) . 2 Im allgemeinen bezeichnet man I = |S(r, t)| als die optische Intensität. Bei der Messung wird i.a. die Phaseninformation zerstört. 25 2.3.2 Die zeitlich gemittelte Energiebilanz → hier nur stationäre Felder Aus den Maxwell-Gleichungen erhält man ∂ ∂ ε0 E2r (r, t) + µ0 H2r (r, t) + div [Er (r, t) × Hr (r, t)] = − jr (r, t) + Ṗr (r, t) Er (r, t). ∂t ∂t Zeitliche Mittelung ergibt für die linke Seite " $ # 1 ∂ ! ε0 E2r (r, t) + µ0 H2r (r, t) +div [Er (r, t) × Hr (r, t)] = div Ē(r, ω) × H̄∗ (r, ω) . ∂t 2 Für die rechte Seite erhalten wir & % − jr (r, t) + Ṗr (r, t) Er (r, t) " 1 ! σ Ē exp (−iωt) − iωε0 χĒ exp (−iωt) + c.c. Ē exp (−iωt) + c.c. =− 4 ' ( σ 1 Ē exp (−iωt) + c.c. Ē exp (−iωt) + c.c. −iωε0 χ + i =− 4 ωε0 1 1 ∗ ∗ = iωε0 [ε (ω) − 1] ĒĒ + c.c. = iωε0 [ε (ω) − 1 + iε (ω)] ĒĒ + c.c. 4 4 1 ∗ = − ωε0 ε (ω) Ē(r, ω)Ē (r, ω). 2 Es gilt also 1 ∗ div S = − ωε0 ε (ω) Ē(r, ω)Ē (r, ω). 2 Senken des Energieflusses ergeben sich damit für nichtverschwindenden Imaginärteil der dielektrischen Funktion, also in der Nähe von Materialresonanzen, d.h. Materialresonanzen sind immer mit einem Energieverlust des elektromagnetischen Feldes verbunden → Absorption. 2.4 Die Kramers–Kronigsche Dispersionsrelation Wir zeigen, daß in einem linearen System unter bestimmten Bedingungen Real- und Imaginärteil der Übertragungsfunktion durch eine Intergraltransformation verbunden sind. Insbesondere wird das für die dielektrische Suszeptibilität (oder die dielektrische Funktion) gelten. lineares Übertragungssystem: U (t ) URSACHE E(t ) E(t ) h(t, t ) → W (t) RESPONSEFUNKTION WIRKUNG R(t, t ) R̃(t, t ) → P(t) → D(t) → → → 26 speziell: P(t) = ε0 t −∞ t D(t) = ε0 mit −∞ R(t − t )E(t )dt , R̃(t − t )E(t )dt R̃(t − t ) = δ(t − t ) + R(t − t ). Definition der Voraussetzungen: ∞ h(t, t )U (t )dt W (t) = −∞ t = h(t, t )U (t )dt −∞ t h(t − t )U (t )dt = −∞ ∞ = h(τ )U (t − τ )dτ → linear → kausal t = t − τ → zeitinvariant 0 ∞ mit h(τ ) als Response- und H(ω) = −∞ h(τ ) exp (iωτ ) dτ als Übertragungsfunktion. Für die (reelle) dielektrische Polarisation gilt dann t R(τ )Er (r, t − τ )dτ, Pr (r, t) = ε0 −∞ damit ist R(τ ) reell. Die K.-K.-Dispersionsrelation besagt nun, daß es eine Beziehung zwischen Real- und Imaginärteil von H(ω) (oder hier: χ(ω) ) gibt, wenn diese vier Bedingungen erfüllt sind. Folgerungen aus diesen Voraussetzungen: • Realität ∞ E(r, t) = Ē(r, ω) exp (−iωτ ) dω −∞ aus folgt E(r, t) = E∗ (r, t) Ē(r, ω) = Ē∗ (r, −ω), d.h. nur positive Frequenzen sind relevant. • Linearität P̄(r, ω) = ε0 χ(ω)Ē(r, ω), P̄∗ (r, ω) = ε0 χ∗ (ω)Ē∗ (r, ω), P̄(r, ω) = ε0 χ∗ (−ω)Ē(r, ω), 27 damit χ(ω) = χ∗ (−ω) oder χ(ω) = χ(−ω) χ(ω) = −χ(−ω). → konsistent mit Drude-Formeln. • Kausalität ∞ ∞ R(τ ) exp (iωτ ) dτ = χ(ω) = −∞ R(τ ) exp (iωτ ) dτ, 0 da R(τ ) = 0 für τ < 0. analytische Fortsetzung: ω = ω + iω → da τ > 0 und R(τ ) endlich χ(ω) ist in der oberen Halbebene analytisch. ∞ R(τ ) exp (iω τ ) exp (−ω τ ) dτ. χ(ω) = 0 Ableitung: Man berechne das Integral ℑω C C2 χ(ω̄) dω̄, ω̄ − ω C1 −ω ω ℜω wobei C den in der Abbildung dargetellten Intergrationsweg entspricht. Für reelles ω ist der Intergrand analytisch und für ω̄ → iω̄ verschwindet der Beitrag zum Integral. Wir haben also: χ(ω̄) 0= dω̄ C ω̄ − ω ∞ χ(ω̄) χ(ω̄) χ(ω̄) =℘ dω̄ + dω̄ + dω̄ C1 ω̄ − ω C2 ω̄ − ω −∞ ω̄ − ω ∞ 0 χ(ω̄) ρ exp (iϕ) =℘ dω̄ + lim [iχ(ω)] dϕ + 0 ρ→0 −∞ ω̄ − ω −π ρ exp (iϕ) ∞ χ(ω̄) dω̄ − iπχ(ω) + 0 =℘ −∞ ω̄ − ω und damit die vorläufige Form der Dispersionsrelation ∞ i χ(ω̄) χ(ω) = − ℘ dω̄, π −∞ ω̄ − ω 28 d.h. eine Beziehung zwischen Real-und Imaginärteil. Mit χ(ω) = χ (ω) und χ(ω) = χ (ω) folgt ∞ 1 χ (ω̄) χ (ω) = ℘ dω̄, π −∞ ω̄ − ω 1 χ (ω) = − ℘ π ∞ −∞ χ (ω̄) dω̄. ω̄ − ω Die endgültige Form erhält man, wenn man χ (ω) = χ (−ω) und χ (ω) = −χ (−ω) ausnutzt und die dielektrische Funktion χ(ω) = ε(ω) − 1 = [ε (ω) − 1] + iε (ω) einführt 2 ε (ω) − 1 = ℘ π ∞ 0 2 ε (ω) = − ω℘ π ω̄ε (ω̄) dω̄, ω̄ 2 − ω 2 ∞ 0 [ε (ω̄) − 1] dω̄. ω̄ 2 − ω 2 ∞ ℘ −∞ bezeichnet ein Hauptwertintegral. Physikalisch sagen die KKD aus, daß die Dispersion eines Mediums durch die Absorption hervorgerufen wird, d.h., die Kenntnis des vollständigen Absorptionsspektrums ist zur Bestimmung der dielektrischen Funktion bei einer Frequenz erforderlich. Oftmals reicht jedoch das Spektrum in der Nähe der interessierenden Frequenz aus. Für eine unendlich schmale Absorptionslinie ε (ω) = Aδ(ω − ω0 ) erhält man ε (ω) − 1 = Aω0 − ω2 ω02 und bestätigt damit das Drude-Modell. 2.5 Die Normalmoden des homogenen isotropen Mediums → Suche nach einfachsten Lösungen der Wellengleichung im Fourierraum → Normalmoden oder Elementaranregungen, mit denen dann jede beliebige Lösung konstruiert werden kann. Normalmoden in der Optik zeichnen sich im allgemeinen dadurch aus, daß bei der Propagation • die Amplitudenverteilung unveränderlich ist, • der Polarisationszustand erhalten bleibt, • die Phase eine harmonische Abhängigkeit aufweist und • eine Dispersionsrelation verbindet Frequenz und Wellenzahl. 29 Ausgangspunkt ist die Wellengleichung rotrot Ē(r, ω) = ω2 ε(ω)Ē(r, ω) c2 mit der Bedingung der Divergenzfreiheit ε0 ε(ω)div Ē(r, ω) = 0 und der komplexen dielektrischen Funktion ε(ω) = 1 + χ(ω) + i σ (ω) = ε (ω) + iε (ω). ωε0 Wegen ε0 ε(ω)div Ē(r, ω) = 0 hat man zunächst zwei Fälle zu unterscheiden: • longitudinale Wellen bei ω = ωL → ε(ω) = 0, • transversale Wellen für ω = ωL → div Ē(r, ω) = 0. Wir vermuten als einfachste Lösungen ebene Wellen Ē(r, ω) = E(k, ω) exp (ikr) , wobei k vorerst unbestimmt ist und die Amplitude für festes (k, ω) konstant ist. Damit ergibt sich das Gesamtfeld zu ∞ E(k, ω) exp [i (kr−ωt)] dω. E(r, t) = −∞ Der sog. komplexe Wellenzahlvektor k = k + ik definiert die Flächen konstanter Phase k r =const. und konstanter Amplitude k r =const. → Ebenengleichungen. Stimmen beide Flächen überein, spricht man von homogenen Wellen, ansonsten von inhomogenen Wellen. Stehen die Flächen senkrecht aufeinander, handelt es sich um evaneszente Wellen 2.5.1 Longitudinale Wellen Longitudinale Wellen können nur im dielektrischen Medium für ε(ω) = 0 bei der longitudinalen Frequenz ω = ωL auftreten. Aus rotrot Ē(r, ωL ) = 0 folgt mit dem ebenen-Wellen-Ansatz und den Bezeichnungen Ē⊥,für die zum k - Vektor senkrechte und parallele Feldkomponente k× k × Ē(r, ωL ) = 0, k× k× Ē⊥ +Ē = 0, k× k × Ē⊥ + k× k × Ē = 0, k 2 Ē⊥ = 0 → Ē(r, ωL ) = Ē(r, ωL ). 30 2.5.2 Transversale Wellen Die für uns interessanten Lösungen sind die divergenzfreien transversalen Wellen. Für ω = ωL gilt div Ē(r, ω) = 0 und damit erhält man aus der Wellengleichung die Helmholtzgleichung ∆Ē(r, ω) + ω2 ε(ω)Ē(r, ω) = 0. c2 Damit wird Ē(r, ω) durch drei skalare Gleichungen bei einer Nebenbedingung bestimmt → zwei unabhängige komplexe Feldkomponenten. Mit dem EW-Ansatz erhalten wir ω2 2 −k + 2 ε(ω) Ē(k, ω) = 0 c und kĒ(k, ω) = 0. Daraus folgt • die Dispersionsrelation k2 = k 2 = kx2 + ky2 + kz2 = ω2 ε(ω), c2 die die Länge des Wellenzahlvektors in Abhängigkeit von der Frequenz bestimmt und • die Transversalität k ⊥ Ē(k, ω). Ebenen Wellen sind Lösungen der Maxwellgleichungen im homogenen, isotropen Medium, wenn die Dispersionsrelation k(ω) erfüllt ist und die Wellen transversal sind. Im allgemeinen ist k komplex und damit die EW keine Normalmode (Amplitude verändert sich bei der Ausbreitung). Man führt dann in der Optik oftmals eine komplexe Brechzahl ein ω ω ω) ε(ω) = n̂(ω) = [n(ω) + iκ(ω)] . k= c c c Da die Dispersionsrelation gilt, kann man Ē(k, ω) = Ē(ω) schreiben. 2.5.2.1 Diskussion der Lösung in den verschiedenen Frequenzbereichen 1. ε(ω) = ε (ω) > 0 → Transparenzgebiet, weit weg von Resonanzen → bevorzugtes Gebiet der Optik 31 ε′ ε′′ ω k 2 = k2 − k2 + 2ik k = ω2 ω2 2 ε (ω) = n (ω). c2 c2 • k = 0 → reeller Wellenzahlvektor Ē(r, ω) = E(ω) exp (ikr) , H̄(r, ω) = H(ω) exp (ikr) mit i 1 rot Ē(r, ω) = [k × E(ω)] exp (ikr) ωµ0 ωµ0 1 ε0 H(ω) = [k × E(ω)] → |H|2 = n2 (ω) |E|2 ωµ0 µ0 H̄(r, ω) = − mit µ0 = Z = 377 Ohm ε0 als Wellenwiderstand. Die Dispersionsrelation kann als k = k(ω) = 2π ω ω = n(ω) = n(ω) c cn λ oder ω = ω(k) = c k n(ω) geschrieben werden. Beispiele: ε(ω) = ε (ω) = ε∞ + ω02 f → − ω2 32 Gitterschwingungen (Phononen) ω ω= ω= ω0 + 2 c ε0 c k ε∞ k f ε∞ ω0 k (Phonon-Polariton) oder ε(ω) = ε (ω) = 1 − ωp2 → ω2 freie Elektronen (Plasma) ω ω = ck ωp k (Plasmon-Polariton) Schlußfolgerungen:Ebene, monochromatische, transversale, elliptisch polarisierte Wellen Ē(r, ω) = E(ω) exp {i [k (ω) r−ωt]} sind Normalmoden des homogenen isotropen Mediums für ε(ω) = ε (ω) > 0, d.h. 0 < ω < ω0 , ω > ωL , wenn die Dispersionsrelation k(ω) = ωc n(ω) erfüllt ist. • k k = 0 → k ⊥ k → komplexer Wellenzahlvektor → inhomogene, speziell evaneszente Wellen k 2 = k2 − k2 = k2 = k2 − k 2 . ω2 ε(ω), c2 Das heißt, k2 = 0 für k2 > k 2 und die evaneszenten Wellen haben die Form Ē(r, ω) = E(ω) exp {i [k (ω) r]} exp (−k r) , 33 d.h. Flächen konstanter Phase stehen senkrecht auf Flächen konstanter Amplitude → keine Normalmoden, da exponentielles Wachstum im homogenen Raum. Evaneszente Wellen können nur an Grenzflächen existieren. 2. ε(ω) = ε (ω) < 0, Reststrahlgebiet, in der Nähe von Resonanzen, ω0 < ω < ωL (Dielektrika), ω < ωp (Metalle) ε′ ε′′ ω k 2 = k2 − k2 + 2ik k = • k = 0 ω2 ε (ω) < 0 c2 ω2 |ε (ω)| c2 k2 = Ē(r, ω) ∼ exp (−k r) → starke Dämpfung → keine Ausbreitung, wenn ε = 0 • k k = 0 → k ⊥ k → evaneszente Wellen 2 2 k =k −k 2 k2 = ω2 = − 2 |ε (ω)| c ω2 |ε (ω)| + k2 . c2 Evaneszente Wellen → nur an Grenzflächen wie bei 1) aber für alle k2 . 3. ε(ω) komplex → in Resonanznähe, aber später schwache Absorption ε (ω) << |ε (ω)| voraussetzen k2 = k 2 = ω2 ω2 ε(ω) = [n(ω) + iκ(ω)]2 2 2 c c mit ε (ω) ≶ 0 und k komplex. ε(ω) = ε (ω) + iε (ω) = n2 (ω) − κ2 (ω) + 2in(ω)κ(ω) 34 daraus folgt ε (ω) = n2 (ω) − κ2 (ω) ε (ω) = 2n(ω)κ(ω) und damit für beliebiges ε * ε 2 n (ω) = sgn (ε ) 1 + (ε /ε ) + 1 , 2 2 * ε 2 κ (ω) = sgn (ε ) 1 + (ε /ε ) − 1 . 2 2 Man kann zwei Grenzfälle unterscheiden: ε′ ε′′ 1 2 ω 1. Dielektrikum ε , ε > 0, ε << ε , ω < ω0 n(ω) ≈ ) ε (ω), κ(ω) ≈ 1 ε (ω) ) 2 ε (ω) d.h. die Ausbreitung dominiert die Absorption. 2. Metalle, Reststrahlgebiet ε < 0, ε > 0, ε << |ε | , ω0 < ω < ωL n(ω) ≈ 1 ε (ω) ) , 2 |ε (ω)| κ(ω) ≈ ) |ε (ω)| , d.h. Dämpfung dominiert Ausbreitung. Beispiel: Aluminium @ 500 nm → ε = −32 + i7.3 n ≈ 0.65, κ ≈ 5.6 → 1/eDämpfung nach 56 nm Struktur der Lösungen für schwache Dämpfung (Fall1): 35 Sind die ebenen Wellen homogen? →Von vorn gilt: |k | ≈ k2 − k2 = ω2 ε (ω), c2 2k k = ω 2 ε (ω). c2 ω) ε (ω), c |k | ≈ 1 ω ε (ω) ) 2 c ε (ω) k k ≈ |k | |k | , d.h. Real- und Imaginärteil des Wellenzahlvektors sind annähernd parallel → homogene Wellen. im homogenen, isotropen Medium breiten sich in Resonanznähe gedämpfte, homogene ebene Wellen aus → keine Normalmoden , ω + ω Ē(r, ω) = E(ω) exp (ikr) = E(ω) exp i n (ω) (er) exp − κ (ω) (er) . c c ε′ ε′′ a c a c b ω (a) ungedämpfte Wellen →Normalmoden → Plasmon-Polaritonen, Phonon-Polaritonen; zusätzlich → evaneszente QWellen an Grenzflächen (b) evaneszente Wellen (c) gedämpfte, fast homogene Wellen für schwache Dämpfung (ε > 0); stark gedämpfte Wellen für ε < 0 . 2.5.3 Energiestromdichte und Intensität ebener Wellen Die Energiestromdichte hängt mit der Intensität wie folgt zusammen Tm 1 1 S(r, t) = I(r, t)n = Ẽ(r, t) × H̃∗ (r, t) dt, 2 2Tm −Tm 36 dabei sind die--Größen langsam veränderlich. Für ebene Wellen erhalten wir Ẽ(r, t) = E(t) exp (ikr) = E(t) exp (ik r) exp (−k r) H̃∗ (r, t) = H∗ (t) exp (ik r) exp (−k r) . Wir bemerken, daß im stationären Fall gilt: E(t) = E(ω). 1 1 S(r, t) = ωµ0 4Tm Tm −Tm k∗ |E(t)|2 − Ẽ∗ (t) (k∗ E) dt exp (−2k r) k 1 = nk exp (−2k r) ωµ0 4Tm =n Tm −Tm |E(t)|2 dt ω 1 Tm ε0 nk exp −2 κ (nk r) |E(t)|2 dt. µ0 c 4Tm −Tm Für stationäre Wellen gilt dann: ω ε0 1 nk exp −2 κ (nk r) |E(ω)|2 . S(r, t) = n 2 µ0 c 2.6 Gebündelte Wellenfelder (Strahlen) und Impulse - Analogie von Beugung und Pulsverbreiterung (Dispersion) Wir wollen zeigen, daß sich Pulse mit endlicher transversaler Breite (gepulste Bündel) als eine Superposition (im Frequenz- und Ortsfrequenzraum) von Normalmoden darstellen lassen. Es wird sich herausstellen, daß sich die raum-zeitlich lokalisierten optischen Anregungen sowohl zeitlich als auch räumlich durch die unterschiedliche Phasenentwicklung in Ausbreitungsrichtung für verschiedene Frequenzen (wegen der Dispersion) und Ortsfrequenzen (wegen der unterschiedlichen Ausbreitungsrichtungen der einzelnen Normalmoden) verbreitern werden. Im räumlichen Bereich spricht man von Beugung, im zeitlichen einfach von Pulsverbreiterung. Wir behandeln den räumlichen Fall, gehen dann zum allgemeinen Fall über und diskutieren zum Schluß den zeitlichen Fall. Bündel werden charakterisiert durch ihre endliche Breite. Bündel ebene Welle 2w 37 Ein Bündel stellt eine kontinuierliche Überlagerung stationärer, ebener Wellen verschiedener Ausbreitungsrichtung dar. ∞ E(r, t) = −∞ Ē(k) exp [i (kr − ωt)] d3 k. Impulse werden charakterisiert durch ihre endliche Länge. Impuls stationäre Welle 2Tp Ein Impuls stellt eine kontinuierliche Überlagerung stationärer, ebener Wellen verschiedener Frequenz dar. + = ∞ E(r, t) = −∞ + Ē(ω) exp [i (k(ω)r − ωt)] dω. Ein Impuls endlicher Breite (Bündel) stellt eine kontinuierliche Überlagerung stationärer, ebener Wellen verschiedener Frequenz und Ausbreitungsrichtung dar. ∞ E(r, t) = Ē(k,ω) exp [i (k(ω)r − ωt)] d3 kdω. −∞ In der Literatur wird die Ausbreitung solch lokalisierter Anregung oftmals auch alternativ beschrieben. Man separiert zeitlich und räumlich schnell oszillierende Anteile von langsam veränderlichen (’slowly varying envelope approximation’-SVEA). Dieses Vorgehen bietet sich immer dann an, wenn die spektralen Breiten im Frequenz und Ortsfrequenzbereich wesentlich kleiner als die entsprechenden Mittenfrequenzen sind. Man schreibt z.B. für ein gepulstes Bündel, das die Mittenfrequenz ω0 besitzt und sich in z -Richtung ausbreitet E(r, t) = Ẽ(r,t) exp [i (k(ω 0 )z−ω 0 t)] . Ẽ(r,t) folgt dann i.a. einer aus der Wellengleichung abgeleiteten parabolischen Differentialgleichung (1. Ordnung in Ausbreitungsrichtung). Wir kommen später auf diese Methode zurück. 38 2.6.1 Ausbreitung gebündelter Wellenfelder im homogenen Raum Das Verständnis dieses Effektes (Beugung) ist wichtig für das Verständnis der optischen Abbildung, der optischen Filterung, der Mikroskopie, der Beugung an Gittern, der optischen Nahfeldmikroskopie etc. Wir beginnen mit dem stationären Fall (ω = const.) Unser Vorgehen lehnt sich stark an die lineare Übertragungstheorie an (integrale Formulierung). Am Ende zeigen wir die Äquivalenz zu einer differentiellen Formulierung. Wir nehmen an, daß wir uns im optischen Transparenzgebiet befinden, d.h., ε(ω) = ε (ω) > 0, d.h. es existieren Normalmoden in Form von stationären homogenen und evaneszenten ebenen Wellen. Wir beschränken uns hier auf die skalare Näherung, die im Fall eindimensionaler Bündel den Fall linear polarisierten Lichtes exakt beschreibt. Im zweidimensionalen Fall stellt sie eine Näherung dar, ist jedoch auch hier exakt, wenn man die skalare Größe mit einer Komponente des Vektorpotentials identifiziert (siehe Zusatzkapitel). Wir schreiben für das stationäre optische Feld Ē(r,ω) → Ēy (r,ω)ey → Ēy (r,ω) → u(r, ω). Damit folgt aus der Helmholtzgleichung ω2 ε (ω) Ē(r, ω) = 0, c2 in skalarer Näherung bei fester Frequenz ω ∆ Ē(r, ω) + ω2 ε (ω) u(r, ω) = 0, c2 ∆ u(r, ω) + k 2 (ω) u(r, ω) = 0. ∆ u(r, ω) + Wir werden im folgenden die feste Frequenz ω oftmals weglassen. 2.6.1.1 Beliebig enge Bündel → der allgemeine Fall Die Aufgabe besteht darin, bei vorgegebener Feldverteilung in einer Ebenen (z.B. z = 0 ) die Feldverteilung im Halbraum z > 0 zu bestimmen. 39 Fouriertransformation ergibt ∞ u(r, ω) = U (k, ω) exp [ik(ω)r] d3 k −∞ und stellt eine Überlagerung der NM mit unterschiedlicher Ausbreitungsrichtung (gegeben durch k) dar. Wir haben jedoch zu beachten, daß die NM der Dispersionsrelation k2 = k 2 = kx2 + ky2 + kz2 = ω2 ε (ω) c2 genügen müssen, nur zwei Komponenten von k können unabhängig gewählt werden, z. B. kx , ky . Aus Gründen der einfacheren Schreibweise setzen wir kx = α, ky = β, kz = γ. Damit schreiben wir anstelle der 3D Fouriertransformation (wir lassen jetzt ω weg) ∞ u(r) = U (α, β;z) exp [i (αx + βy)] dαdβ. −∞ Einsetzen in die skalare Helmholtzgleichung ∆ u(r) + k 2 (ω) u(r) = 0 ergibt d2 2 2 2 + k (ω) − α − β U (α, β;z) = 0, dz 2 2 d 2 + γ (ω) U (α, β;z) = 0, dz 2 mit der Lösung U (α, β;z) = U1 (α, β) exp (iγz) + U2 (α, β) exp (−iγz) . Offensichtlich gibt es zwei Typen von Lösungen: 1. γ 2 ≥ 0, und damit α2 + β 2 ≤ k 2 , d.h. homogene Wellen γ k α β 2. γ 2 < 0, und damit α2 + β 2 > k 2 , d.h. evaneszente Wellen, da γ = kz imaginär ist. 40 γ α α ²+ β²>k² k β Damit entfällt der zweite Teil der Lösung, da eine unendlich anwachsende Amplitude im Halbraum unphysikalisch ist. Wir erhalten also . U (α, β;z) = U1 (α, β) exp (iγz) = U (α, β; 0) exp (iγz) = U0 (α, β) exp (iγz) mit der Randbedingung U (α, β; 0) = U0 (α, β). Das Gesamtfeld im Halbraum z > 0 ergibt sich somit zu ∞ u(r) = U0 (α, β) exp [iγ (α, β) z] exp [i (αx + βy)] dαdβ. (2.11) −∞ Die Ursache der Beugung ist die unterschiedliche Phasenverschiebung in Propagationsrichtung für verschiedene α, β. Es ist klar, daß sich die Randbedingung U0 (α, β) aus der Feldverteilung auf dem Rand z = 0 ergibt, da gilt U0 (α, β) = 1 2π 2 ∞ −∞ u0 (x, y) exp [−i (αx + βy)] dxdy, wobei u0 (x, y) = u(x, y, 0). U0 (α, β) stellt damit die räumliche spektrale Verteilung bei z = 0 dar und wird Ortsfrequenzspektrum oder Winkelspektrum von u0 (x, y) genannt (im Sinne der FT sind α, β Ortsfrequenzen, im Sinne der Optik ebener Wellen sind α/k, β/k Richtungskosinusse und repräsentieren deshalb Winkel). Die Anfangverteilung u0 (x, y) bestimmt damit das Spektrum, Ausbreitung bedeutet nur Multiplikation mit dem Phasenfaktor exp [iγ (α, β) z] und ergibt ein neues Spektrum U (α, β; z) = U0 (α, β) exp [iγ (α, β) z] und damit eine neue Verteilung u(x, y, z). Damit ist das Wesen der Beugung beschrieben. Man kann Gl.(2.11) also folgendermaßen interpretieren: • 1. Das resultierende Feld ergibt sich aus der Rücktransformation des neuen Spektrums: ∞ U (α, β; z) exp [i (αx + βy)] dαdβ. u(r) = −∞ 2. Das resultierende Feld ergibt sich aus der Überlagerung homogener und inhomogener ebener Wellen (’plane-wave spectrum’), die der Dispersionsrelation genügen ∞ u(r) = U0 (α, β) exp {i [αx + βy + γ (α, β) z]} dαdβ. −∞ 41 Im Sinne der linearen Übertragungstheorie können die Ergebnisse folgendermaßen interpretiert werden: Die lineare Gleichung ∆u + k 2 u = 0 hat im Fourierraum die Lösung U (α, β; z) = H(α, β; z)U0 (α, β), wobei U0 (α,) β) die Ursache, U (α, β; z) die Wirkung und H(α, β; z) = exp [iγ (α, β) z] (mit k 2 − α2 − β 2 ) die Übertragungsfunktion darstellen. Entsprechend ergibt γ (α, β) = sich im Ortraum ∞ h(x − x , y − y ; z)u0 (x , y )dx dy u (x, y, z) = −∞ mit der Responsefunktion 2 ∞ 1 h(x, y; z) = H(α, β; z) exp [i (αx + βy)] dαdβ. 2π −∞ Diskussion der Übertragungsfunktion Die ÜF H(α, β; z) = exp [iγ (α, β) z] ist im allgemeinen komplex. Für ein festes z kann man Betrag und Argument einfach graphisch darstellen: Phase Betrag k |H| 1 arg H kz β α α β Man hat zwischen dem Beitrag homogener und evaneszenter Wellen zu unterscheiden. 1. homogene Wellen → α2 +β 2 ≤ k 2 |H| = 1, arg H = 0 , d.h. jede homogene ebene ) Welle wird bei der Ausbreitung mit einem Phasenfaktor exp i k 2 − α2 − β 2 z belegt. ) 2 2 2 2 2 2 2. evaneszente Wellen→ α + β > k |H| = exp − α + β − k z , arg H = 0 , d.h. jede evaneszente Welle wird bei der Ausbreitung mit einem Amplitudenfaktor <1 belegt → Beiträge werden für wachsende z gedämpft. 42 Es ist die Frage zu klären, wann evaneszente Wellen auftreten. Das hängt offensichtlich von der Struktur der Anfangsverteilung u0 (x, y) ab und erfordert die Präsenz hoher Ortsfrequenzen, d.h., es muß U0 (α, β) = 0 für α2 + β 2 > k 2 gelten. Wir wollen das am eindimensionalen Beispiel untersuchen. Es gelte: 1 für |x| ≤ a2 u0 (x) = . 0 sonst Damit 1 0 .7 5 a sin( a2 α) U0 (α) ∼ a = sinc α . ( 2 α) 2 0 .5 0 .2 5 0 -1 0 −π 0 π 10 a α 2 -0 .2 5 . . Die wesentliche Information ist im Intervall . a2 α. ≤ π enthalten, d.h. |α| = 2π/a ist die größte auftretende Ortsfrequenz für eine Struktur mit der Breite a. Evaneszente Wellen treten auf für |α| > k, d.h. 2π 2π >k= n a λ also λ , n d.h. evaneszente Wellen sind mit Strukturen verbunden, die kleiner als die Wellenlänge sind. Die damit in Zusammenhang stehenden Informationen gehen bei der Ausbreitung über makroskopische Distanzen ( z >> λ ) verloren. Beispiel: Da exp(−2π) ≈ 0, folgt für α2 = 2k 2 (a = √λ2n ), kz = 2π oder nach einer Ausbreitungslänge z = λ/n ist diese Information verloren gegangen. Schlußfolgerung: Im homogenen Raum werden über makroskopische Distanzen nur Informationen übertragen, die mit Strukturdetails |∆x| , |∆y| > λ/n zusammenhängen, d.h., der freie Raum stellt für das Licht einen Tiefpaßfilter dar. Zusammenfassend kann also die Ausbreitung einer begrenzten Feldverteilung folgendermaßen beschrieben werden: FT−1 FT u0 (x, y) → U0 (α, β) → U (α, β; z) = H(α, β; z)U0 (α, β) → u(x, y, z) a< 2.6.1.2 Fresnel- (paraxiale) Näherung → wichtiger Spezialfall Wenn das Ortfrequenzspektrum ’schmalbandig’ ist, d.h., U0 (α, β) = 0 für 43 α2 + β 2 k 2 oder anders gesagt, die ebenen Wellen, die das Bündel beschreiben, nur eine kleine Neigung zur Ausbreitungsrichtung (paraxiale Näherung) aufweisen, kann die Größe γ = ) 2 k − α2 − β 2 in eine Potenzreihe ) α2 + β 2 α2 + β 2 2 2 2 = k − γ = k −α −β ≈k 1− 2k 2 2k entwickelt werden und die Übertragungsfunktion HF (α, β; z) in Fresnelscher Näherung α2 + β 2 HF (α, β; z) = exp (ikz) exp −i z 2k enthält nur noch homogenen Wellen. Dieser Fall tritt auf, wenn die Strukturdetails die Bedingung |∆x| , |∆y| λ/n ≈ 10 λ/n erfüllen. Phase Betrag |H| arg H 1 kz k α β α k β Damit erhält man für die Ausbreitung des Spektrums UF (α, β; z) = HF (α, β; z)U0 (α, β). (2.12) Ist die Anfangsverteilung ’grob’, sind die Spektralamplituden U0 (α, β) nur für α2 + β 2 k 2 von Null verschieden. Es tragen nur paraxiale, ebene Wellen zur Übertragung der Information bei. In Fresnelscher Näherung kann man die Resultate im Fourierraum einfach auf den Ortsraum übertragen. Man erhält ∞ UF (α, β; z) exp [i (αx + βy)] dαdβ uF (x, y, z) = −∞ ∞ = −∞ ∞ = −∞ HF (α, β; z)U0 (α, β) exp [i (αx + βy)] dαdβ hF (x − x , y − y ; z)u0 (x , y )dx dy mit der Responsefunktion 44 hF (x, y; z) = = 1 2π 1 2π 2 ∞ −∞ HF (α, β; z) exp [i (αx + βy)] dαdβ 2 α2 + β 2 z exp [i (αx + βy)] dαdβ. exp −i 2k −∞ exp (ikz) ∞ Quadratische Ergänzung im Exponenten und anschließende elementare Integration führt auf i k 2 2 , hF (x, y; z) = exp (ikz) − exp i x +y λz 2z d.h., die Responsefunktion ist eine Kugelwelle in paraxialer Näherung. Man erhält schließlich i uF (x, y, z) = − exp (ikz) λz k 2 2 dx dy . u0 (x , y ) exp i (x − x ) + (y − y ) 2z −∞ (2.13) ∞ In paraxialer Näherung kann die Ausbreitung • im Fourierraum mit Gl.(2.12) und anschließender Fouriertransformation oder • im Ortsraum unter Benutzung von Gl.(2.13). beschrieben werden. 2.6.1.3 Die paraxiale Wellengleichung Die Wellengleichung ist eine elliptische Differentialgleichung, d.h. die Lösung des Randwertproblems erfordert die Vorgabe der Felder auf dem gesamten Rand. Im Gegensatz dazu erfordert die Lösung einer parabolischen DGL nur die Vorgabe der Anfangswerte. Für eine numerische Lösung des Problems ist also eine parabolische DGL von Vorteil. Wir zeigen, daß sich in paraxialer Näherung die Wellengleichung zu einer parabolischen Gleichung vereinfacht. In paraxialer Näherung gilt UF (α, β; z) = HF (α, β; z)U0 (α, β) α2 + β 2 = exp (ikz) exp −i z U0 (α, β) 2k und mit Einführung des langsam veränderlichen Spektrums V (α, β; z) 45 UF (α, β; z) = exp (ikz) V (α, β; z) α2 + β 2 V (α, β; z) = exp −i z V0 (α, β). 2k erhält man Differentiation ∂ 1 2 V (α, β; z) = α + β 2 V (α, β; z) ∂z 2k und anschließende Fouriertransformation ergibt ∞ ∞ 2 1 ∂ α + β 2 V (α, β; z) exp [i (αx + βy)] dαdβ V (α, β; z) exp [i (αx + βy)] dαdβ = i ∂z 2k −∞ −∞ i 2 ∞ ∂ 1 ∂ ∂2 i v(x, y, z) = − + V (α, β; z) exp [i (αx + βy)] dαdβ ∂z 2k ∂x2 ∂y 2 −∞ 2 ∂2 ∂ 1 ∂ v(x, y, z) + i v(x, y, z) = − ∂z 2k ∂x2 ∂y 2 oder in kompakter Form ∂ 1 i v(x, y, z) + ∆(2) v(x, y, z) = 0 ∂z 2k u(x, y, z) = v(x, y, z) exp (ikz) . Das gleiche Ergebnis erhält man aus der skalaren Helmholtzgleichung, die wir jedoch aus Gründen der Allgemeingültigkeit für inhomogene Medien aufschreiben wollen (siehe Übungen, numerische Lösung mit der ’beam propagation method’-BPM). ∆u(x, y, z) + k 2 (r, ω)u(x, y, z) = 0 mit k 2 (r, ω) = ω2 ε(r, ω). c2 Wir spalten einen schnell oszillierenden Anteil ab u(x, y, z) = v(x, y, z) exp (ik0 z) wobei k0 ≈ k. Damit folgt für die Dynamik der langsamen Amplitude v 2 ∂2 ∂ (2) 2 v(x, y, z) = 0, v(x, y, z) + 2ik v(x, y, z) + k (r, ω) − k v(x, y, z) + ∆ 0 0 ∂z 2 ∂z wenn man wegen |kv| |∂v/∂z| das erste Glied vernachlässigt. Für homogene Medien (k = k0 ) erhalten wir das obige Ergebnis 1 ∂ i v(x, y, z) + ∆(2) v(x, y, z) = 0. ∂z 2k In inhomogenen Medien kann man die nun parabolische Gleichung 2 ∂ k (r, ω) − k02 1 (2) i v(x, y, z) + v(x, y, z) = 0 ∆ v(x, y, z) + ∂z 2k0 2k0 durch Vorgabe der Anfangsbedingung v(x, y, z = 0) = v0 (x, y). lösen. Zwei Methoden sind dabei weit verbreitet, die Fast-Fourier-Transform BPM und die Finite-DifferenzenMethode (Näheres in den Übungen). 46 2.6.2 Ausbreitung eines Gauß-Bündels → wichtiger Spezialfall, da die transversale Laser-Fundamentalmode diese Gestalt aufweist. Fundamentalmode im Fokus u 0 y x 2 x y2 exp [iϕ(x, y)] . u0 (x, y) = v0 (x, y) = A0 exp − + wx2 wy2 Wir beschränken uns auf Rotationssymmetrie (wx2 = wy2 = w02 ) und setzen im Moment eine ’flache’ Phase voraus ϕ(x, y) = 0) (Gauß im Fokus). Die Breite ist durch u0 (x2 + y 2 = w02 ) = A0 exp (−1) definiert. Die Ausbreitung wird im Ortsfrequenzraum berechnet. 1. Feld bei z = 0: x2 + y 2 u0 (x, y) = v0 (x, y) = A0 exp − w02 . 2. Spektrum bei z = 0: 1 U0 (α, β) = V0 (α, β) = A0 (2π)2 ∞ x2 + y 2 exp − w02 −∞ exp [−i(αx + βy)] dxdy A0 2 A0 2 α2 + β 2 α2 + β 2 = = , w exp − w exp − 4π 0 4/w02 4π 0 ws2 d.h. das Spektrum weist ebenfalls ein Gauß-Profil auf und das Produkt aus räumlicher und spektraler Breite ist konstant (2ws × 2w0 = 8). 47 Spektrum der Fundamentalmode im Fokus U 0 β α 3. Ist paraxiale Näherung erfüllt? Es gilt U0 (α, β) ≈ 0 für (α2 + β 2 ) ≥ 16/w02 → exp (−4) . Die Bedingung für die Gültigkeit der paraxialen Näherung k 2 α2 + β 2 ergibt k 2 16/w02 w02 16 2 = 2π n λ 2λ πn 2 2 λ ≈ , n d.h., die paraxiale Näherung gilt für w0 10 nλ = 10λn 4. Ausbreitung des Spektrums: U (α, β; z) = V (α, β; z) exp (ikz) α2 + β 2 V (α, β; z) = U0 (α, β) exp −i z 2k 2 2 α2 + β 2 A0 2 2 (α + β ) w exp −w0 exp −i z . = 4π 0 4 2k 5. Rücktransformation in den Ortsraum: A0 2 w v(x, y, z) = 4π 0 ∞ −∞ w02 2 i 2 exp − α + β + z exp [i (αx + βy)] dαdβ 4 2k 2 = A0 2 2 2 1 1 x +y x +y = A0 . exp − z exp − 2iz 2iz z 1 + i 2 2 1 + kw2 z0 w 1+ 2 w 1+i 0 0 kw0 48 0 z0 Schlußfolgerungen: • Gauß-Bündel behält bei der Ausbreitung Gestalt, jedoch Amplitude, Breite und Phase ändern sich. • zwei Parameter, Ausbreitungslänge z und Beugungsparameter z0 , bestimmen die Eigenschaften, wobei kw02 π = w02 . z0 = 2 λn Man bezeichnet die Größe LB = 2z0 als Beugungslänge oder Rayleigh-Gebiet. Für w0 10λn ergibt sich LB 600λn . Beugungslänge Man kann nun schreiben: z 2 2 2 2 1 − i zz0 (x + y ) x +y z0 v(x, y, z) = A0 2 exp − 2 exp i 2 1 + zz0 w02 1 + zz w02 1 + zz 0 0 2 2 x +y 1 k (x + y ) exp [iϕ(z)] , = A0 exp − exp i 2 2 2 z 1 + z0 2 z 2 z w0 1 + z z 1+ 2 2 0 z0 wobei w02 = 2z0 k ausgenutzt wurde und tan ϕ = − z z0 die Guoy-Phasenverschiebung darstellt. Ein Gauß-Bündel läßt sich nun bequem unter Einführung von z -abhängiger Amplitude, Breite und Krümmung schreiben 2 x + y2 k (x2 + y 2 ) v(x, y, z) = A(z) exp − 2 exp i exp [iϕ(z)] w (z) 2 R(z) mit: 49 1. der Amplitude A(z) = A0 1 1 = A 0 2 2 , 1 + zz0 1 + L2zB Intensität Intensität im Nullpunkt 2. der Breite w(z) = w0 1+ z z0 Bündelbreite 50 2 = w0 1+ 2z LB 2 , 3. der Krümmung 6 2 7 z 2 LB 0 =z 1+ R(z) = z 1 + z 2z Krümmungsradius Phasenfronten 4. und der Phase tan ϕ = − Phase 51 z 2z =−− z0 LB 2.6.2.1 Eigenschaften eines Gauß-Strahls bei der Ausbreitung Das Verhältnis von Ausbreitungslänge z und Beugungsparameter z0 = bestimmt die Ausbreitungseigenschaften. kw02 2 = π w2 λn 0 1. z z0 : Das Gauß-Bündel ändert seine Gestalt und Phase nicht. 2. z z0 : a) Das Produkt aus Breite und Amplitude ist konstant. → A(z)w(z) = const. 2 √ b) Bündelbreite → w(z) = w0 1 + zz0 → w(LB ) = w0 5 ≈ 2w0 → LB bezeichnet die Beugungslänge oder Fokustiefe. speziell für z z0 gilt w(z) ≈ w0 zz0 → w(z)/z = tan Θ0 ≈ w0 /z0 Θ0 ≈ λw0 1 λ λ = → Θ0 w0 ∼ 2 πnw0 w0 πn n d.h., die Strahldivergenz nimmt zu mit stärkerer Fokussierung und größerer Wellenläge. c) Krümmung Fläche konstanter Phase: x2 + y 2 + ϕ(z) = const. Φ(x, y, z) = k z + 2R(z) Krümmungsradius R(z) z 2 1 ∂2Φ ∂2Φ . 1 0 =z 1+ = + k ∂x2 ∂y 2 R(z) z R(0) → ∞ ; R(z0 ) = 2z0 = Rmin ; R(z → ∞) = z 52 2.6.2.2 Zusammenhang der Parameter des Gauß-Bündels mit einem komplexen Bündelparameter q(z) Es sei q(z) = z − iz0 1 z z0 1 = 2 +i 2 = 2 q(z) z − iz0 z + z0 z + z02 = 1 z 1+ z02 z2 +i 1 z0 1 + z2 z02 1 1 λn = +i 2 . q(z) R(z) πw (z) Diese Beziehung gilt für jedes z und ordnet einer bestimmten vorgegebenen Krümmung und Bündelbreite eineindeutig einen komplexen Parameter zu, der damit das Verhalten des Bündels vollständig beschreibt. Beispiel: Ausbreitung im homogenen Raum um z = d 1. Vorgabe der Anfangsbedingungen: 1 λn 1 = +i 2 q(0) R(0) πw (0) 2. Ausbreitung (folgt aus Definition des Parameters) q(d) = q(0) + d 3. Bündelparameter bei z = d 1 1 λn . 1 = = +i 2 q(d) q(0) + d R(d) πw (d) 2.6.3 Gaußsche Optik Die Fundamentalmoden vieler Laser weisen eine Gaußsche Intensitätsverteilung auf. Es ist daher zweckmäßig, auf der Grundlage des komplexen q - Parameters eine einfache Beschreibung der Ausbreitung und Wechselwirkung dieser Bündel zu versuchen. Ziel ist es für vorgegebene R0 , w0 (d.h. q0 ) die entsprechenden qn ,d.h. Rn , wn , nach dem Durchgang durch n optische Elemente zu finden. Dabei haben wir q(zi ) durch qi ersetzt. Obwohl wir Wellenoptik und nicht geometrische Optik betreiben, können die optischen Elemente mit den aus der geometrischen Optik bekannten 2x2 ABCD-Matrizen beschrieben werden. In der geometrischen Optik gilt: A B M̂ = . C D Beim Durchgang durch mehrere Elemente multipliziert man einfach die Matrizen 53 M̂ = M̂N M̂N−1 ..M̂1 = A B C D . (2.14) Die Matrix verbindet die Strahlabstände und die Neigungswinkel vor und nach dem Element r1 r2 = M̂ . Θ2 Θ1 Bildet man den Quotienten z1 = r1 , Θ1 so erhält man A r1 + B r2 , = Θr11 Θ2 C Θ1 + D z2 = Az1 + B Cz1 + D Diese Quotienten, die einem Abstand auf der optischen Achse entsprechen, sind über die Matrixelemente verbunden, jedoch nicht durch eine kanonische Matrixmultiplikation. Die Brücke zur Wellenoptik kann man jetzt schlagen, indem man folgert, daß die endliche Bündelbreite aus dem rellen Abstand einen komplexen Parameter q macht. Damit erhält man für die Entwicklung des q - Prameters beim Durchgang durch ein Element q1 = A1 q0 + B1 C1 q0 + D1 oder entsprechend beim Durchgang durch n -Elemente qn = Aq0 + B Cq0 + D mit der Matrix (2.14). ABCD-Matrizen für ausgewählte optische Systeme: 54 1. Ausbreitung im homogenen Raum - Ausbreitungslänge d M̂ = 1 d 0 1 2. Durchgang durch dünne Linse der Brennweite f (f < 0 für Konkavlinse) f <0 f >0 M̂ = 1 0 − f1 1 , 3. Durchgang durch sphärische Fläche mit Krümmungsradius RS (von Medium mit n1 in Medium mit n2 ), wobei RS < 0 für Konkavfläche. RS > 0 RS < 0 M̂ = 1 0 1) − (nn22−n RS n1 n2 4. Durchgang durch ebene Fläche (von Medium mit n1 in Medium mit n2 ) M̂ = 5. Reflexion am ebenen Spiegel M̂ = 1 0 0 1 1 0 0 , n1 n2 , 6. Reflexion am sphärischen Spiegel (Krümmungsradius RS ) RS > 0 RS < 0 M̂ = 7. Durchgang durch ein Schichtsystem (di , ni ) 55 1 2 RS 0 1 , , M̂ = 1 0 8N di i=1 ni 1 . Man beachte, daß nur die Entwicklung der Bündelbreite und -krümmung beschrieben wird. Amplitudenänderungen durch Reflexionen sind nicht enthalten. 2.6.4 Gaußsche Moden in einem Resonator 2.6.4.1 Transversale Fundamentalmoden (Rotationssymmetrie) Die Idee besteht darin, daß ein Resonator stabil sein sollte, wenn die Spiegelflächen mit den Phasenflächen übereinstimmen. In paraxialer Näherung heißt das, daß die Krümmungsradien der Spiegel identisch mit den Krümmungsradien der Phasenflächen sein sollten. Definitionen: • Wegen R(z) = z + z02 z ist der Radius der Phasenfläche negativ für negative z. • Trifft das Bündel auf eine konkave Spiegelfläche, gilt für den Spiegelradius Ri (i = 1, 2) < 0. • z1,2 bezeichne den Abstand von der Taille zum Spiegel ’1’,’2’. d sei der Abstand der Spiegel und damit z2 = z1 + d Beispiele: • R(z1 ), R(z2 ) > 0; R1 > 0, R2 < 0 56 d 0 z1 z2 • R(z1 ) < 0, R(z2 ) > 0; R1 , R2 < 0 z1 z2 0 d Die Konsistenzbedingungen lauten nun: R2 = −R(z2 ) R1 = R(z1 ), R1 = z1 + Ersetzen von z02 ergibt z02 , z1 −R2 = z2 + z02 . z2 z1 (R1 − z1 ) = −z2 (R2 + z2 ) und mit z2 = z1 + d erhält man z1 = − d (R2 + d) , R1 + R2 + 2d d.h. bei Vorgabe von R1 , R2 , d folgt die Lage der Moden im Resonator. Die Stabilität der Moden wird dadurch bestimmt, daß die Bedingung z02 = R1 z1 − z12 = − d (R1 + d) (R2 + d) (R1 + R2 + d) (R1 + R2 + 2d)2 (2.15) erfüllt sein muß. Gleichzeitig folgt aus z02 die Taillenbreite w0 . Nach einigen Umformungen folgt aus Gl.(2.15) die Stabilitätsbedingung eines Resonators d d 1+ ≤1 0≤ 1+ R1 R2 57 oder die Hyperbelgleichung 0 ≤ g1 g2 ≤ 1. In der Abbildung sind die Gebiete zwischen den Koordinatenachsen und den Hyperbeln stabil. Die beiden folgenden Konfigurationen sind Beispiele für einen stabilen bzw. instabilen Resonator: b1 ) R1 , R2 < 0; |R1 | = d + ε1 , |R2 | = d + ε2 ; 0 ≤ ε1 ε2 ≤ d2 ε1 ε2 ≥ 0 stabil b2 ) ε1 ε2 < 0 instabil 58 Folgende Faustregeln hinsichtlich der Dimensionierung stabiler Resonatoren lassen sich aufstellen: • beide Spiegel sind konkav 1. Beide Mittelpunkte der entsprechenden Kreise müssen außerhalb des Resonators liegen. 2. Beide Mittelpunkte müssen innen und näher zum entprechenden anderen Spiegel liegen. instabil stabil • ein Spiegel ist konvex, der andere konkav Beide Mittelpunkte müssen jenseits eines Spiegels liegen, wobei der Mittelpunkt des Konvexspiegels weiter entfernt vom Resonator liegen muß. instabil stabil 59 Instabile Resonatoren sind für high-gain-Laser interessant, da wegen der großen Verluste das stärkste Modenfeld selektiert wird. Gauß-Bündel sind Lösungen der paraxialen Wellengleichung. Gleichzeitig sind sie die Normalmoden von Resonatoren mit gekrümmten Spiegeln (ebene Spiegel sind Grenzfall). Damit kann ein beliebiges Feld nach einem vollständigen Satz von Resonatormoden entwickelt werden → siehe nächstes Unterkapitel. 2.6.4.2 Bemerkungen zu Moden höherer Ordnung Das Ziel besteht im Auffinden des gesamten Modensatzes. Die bisher behandelte Fundamentalmode ist forminvariant, unterliegt aber der Beugung. Trotzdem kann diese Mode als eine longitudinale Normalmode des Resonators angesehen werden, da sie unveränderlich im Resonator existiert. Die Fundamentalmode ist rotationssymmetrisch in Amplitude und Phase. Die Konsistenzbedingung bezog sich nur auf die Phasenfläche. Moden mit gleicher Phasenfläche, aber azimuthal variierender Intensitätsverteilung sollten ebenfalls diese Bedingung erfüllen. Für die Gaußche Mode galt bisher 2 w0 x + y2 k x2 + y 2 exp − 2 exp i exp [iϕ(z)] . vG (x, y, z) = A w(z) w (z) 2 R(z) Wir verallgemeinern den Ansatz ( x, y -Abhängigkeit der Phase bleibt erhalten) v(x, y, z) = X √ √ y x 2 2 Y vG (x, y, z). w(z) w(z) Einsetzen in die paraxiale Wellengleichung ergibt eine Eigenwertgleichung mit den Eigenwerten l und m und den hermiteschen Polynomen als Eigenfunktionen, wenn man berücksichtigt, daß vG (x, y, z) Lösung der paraxialen Wellengleichung ist. Die Gesamtlösung (mit schnellen Phasenanteilen) schreibt sich dann √ x √ y w0 ul,m (x, y, z) = Al,m 2 2 Gl Gm w(z) w(z) w(z) 2 k x + y2 exp (ikz) exp [i(l + m + 1)ϕ(z)] . exp i 2 R(z) mit u2 Gl (u) = Hl (u) exp − 2 60 und den hermiteschen Polynomen Hl (u) ( H0 = 1, H1 = 2u und Hl+1 = 2uHl − 2lHl−1 ). Aus der Orthogonalität der Gauß-Hermite-Polynome ∞ √ Gl (x)Gm (x)dx = π2l lδlm −∞ folgt die Orthogonalität der Resonatormoden ∞ ulm (x, y)u∗l m (x, y)dxdy ∼ δll δmm . −∞ Damit kann ein beliebiges Feld im Resonator nach diesen Moden entwickelt werden u(x, y, z) = Al,m ulm (x, y, z), l,m wobei die Entwicklungskoeffizienten aus dem Eingangsfeld folgen Al,m ∼ u0 (x, y)ulm (x, y, 0)dxdy. Durch Störungen (Spiegelinhomogenitäten, Nichtlinearitäten etc.) können diese Moden koppeln. 61 2.6.5 Ausbreitung von Impulsen 2.6.5.1 Pulse mit endlicher transversaler Breite (gepulste Bündel) Bisher: transversal begrenztes Wellenfeld (Strahl), aber monochromatisch −→ ω festgelegt −→ k(ω) fest −→ cw-Laser aber: für viele Anwendungen sind Impulse im Bereich von 100 fs - 100 ps von Interesse (Spektroskopie, nichtlineare Optik) Zeit- und Frequenzskalen: Pulsenveloppe: 10−13 s ≤ T0 ≤ 10−10 s Mittenfrequenz: ω0 = 2πν ∼ 4·1015 Hz −→ Schwingungsdauer Ts = 2π/ω0 ≈ 1.6 fs Spektrum des Pulses (z.B. Gauß): t2 f (t) = exp (−iω0 t) exp − 2 T0 6 (ω − ω0 )2 F (ω) ∼ exp − 4/T02 −→ spektrale Breite: 7 → ωs2 = 4 → ωs T0 = 2 T02 4·1010 Hz ≤ ωs ≤ 4·1013 Hz −→ ωs << ω0 −→ ω−ω0 << ω0 Folgerung: Statt die komplizierte, im allgemeinen nicht analytisch vorliegende, Dispersionsrelation k(ω) zu benutzen, kann man eine Taylorentwicklung bei ω = ω0 vornehmen und damit die Dispersionseigenschaften in parabolischer oder kubischer Näherung beschreiben. k ωs ω0 62 ω . . ∂k .. 1 ∂ 2 k .. k(ω) ≈ k (ω0 ) + (ω − ω0 ) + (ω − ω0 )2 + .. . . 2 ∂ω ω0 2 ∂ω ω0 k (ω0 ) = k0 , → 1 k0 n (ω0 ) = = −→ Phasengeschwindigkeit vPh ω0 c . 1 ∂k .. = −→ Gruppengeschwindigkeit vg ∂ω .ω0 . ∂ 2 k .. Dω = −→ Dispersion der Gruppengeschwindigkeit ∂ω 2 .ω0 Damit · · · ist die komplizierte Dispersionsrelation auf drei Größen zurückgeführt: Phasengeschwindigkeit Gruppengeschwindigkeit Dispersion der Gruppengeschwindigkeit a) Gruppengeschwindigkeit −→ Ausbreitungsgeschwindigkeit des Pulszentrums. Mit 6 . 7 ω 1 1 ∂n .. k(ω) = n(ω) −→ = n(ω0 ) + ω0 c vg c ∂ω .ω0 c n(ω0 ) = vPH . ∂n . ng (ω0 ) n(ω0 ) + ω0 ∂ω ω0 vg = . ∂n .. ng (ω0 ) = n(ω0 ) + ω0 −→ Gruppenindex ∂ω .ω0 normale Dispersion: anormale Dispersion: ∂n/∂ω > 0 vg < vPH , ng > n ∂n/∂ω < 0 vg > vPH , ng < n b) Dispersion der Gruppengeschwindigkeit (GVD) (manchmal einfach Dispersion)−→ verantwortlich für Änderung der Pulsform bei der Ausbreitung . 2 ps ∂ 2 k .. D = Dω = . ∂ω 2 ω0 km manchmal auch (optische Kommunikation): 2π ∂ 1 Dλ = = − 2 cDω ∂λ vg λ 63 Achtung wegen Vorzeichen! wichtig für spätere Diskussion (bei veränderlicher Frequenz unter dem Puls) −→ chirp: ∂ D= ∂ω 1 vg =− 1 ∂vg vg2 ∂ω −→ D > 0 ∂vg <0 ∂ω −→ D < 0 ∂vg >0 ∂ω Ausgangspunkt ist die skalare Helmholtzgleichung: ω2 ∆ u(r, ω) + 2 ε(ω) u(r, ω) = 0 c (2.16) wobei ω jetzt eine beliebige Fourierkomponente des Feldes darstellt. Es gilt weiterhin die Dispersionsrelation k 2 (ω) = ω2 ε(ω). c2 Für die Entwicklung des Fourierspektrums gilt U (α, β, ω; z) = U0 (α, β, ω) exp [iγ (α, β, ω) z] mit γ (α, β, ω) = ) k 2 (ω) − α2 − β 2 . 64 (2.17) Das Anfangsspektrum bei z = 0 U0 (α, β, ω) ist die Fouriertransformierte der Feldverteilung 1 U0 (α, β, ω) = (2π)3 ∞ −∞ u0 (x, y, t) exp [−i (αx + βy − ωt)] dxdydt In Fresnelscher (paraxialer) Näherung (k 2 (ω) >> α2 + β 2 ) ergibt sich aus 2.17 α2 + β 2 U (α, β, ω; z) ≈ U0 (α, β, ω) exp [ik (ω) z] exp −i z 2k (ω) und damit die Übertragungsfunktion für Pulse in Fresnelscher Näherung α2 + β 2 HFP (α, β, ω; z) = exp [ik (ω) z] exp −i z 2k (ω) Durch Einsetzen der Taylorentwicklung von k(ω) in ersten Term und Ersetzen von k(ω) ≈ k(ω0 ) = k0 (gilt nicht für extrem kurze Impulse T0 15 fs) im zweiten Term erhält man die parabolische Näherung der Übertragungsfunktion 1 D α2 + β 2 2 HFP (α, β, ω; z) ≈ exp [ik0 z] exp i (ω − ω0 ) z exp i (ω − ω0 ) z exp −i z vg 2 2k0 (2.18) 1 α2 + β 2 ω (2.19) + Dω 2 − = exp [ik0 z] exp i z vg 2 2k0 = exp [ik0 z] H FP (α, β, ω; z) wobei H FP (α, β, ω; z) den in z langsam variierenden Teil der Übertragungsfunktion darstellt. Damit ergibt sich für das Gesamtfeld u(x, y, z, t) u(x, y, z, t) = exp [ik0 z] −∞ = exp [i (k0 z − ω0 t)] ∞ ∞ −∞ U0 (α, β, ω)H FP (α, β, ω; z) exp [i (αx + βy − ωt)] dαdβdω U0 (α, β, ω)H FP (α, β, ω; z) exp [i (αx + βy − ωt)] dαdβdω Einführung der langsam variierenden Amplitude u(x, y, z, t) = v(x, y, z, t) exp [i (k0 z − ω0 t)] 65 führt auf: ∞ v(x, y, z, t) = −∞ U0 (α, β, ω)H FP (α, β, ω; z) exp [i (αx + βy − ωt)] dαdβdω Das Spektrum des Gesamtanfangsfeldes ist noch durch das Spektrum des ’langsamen’ Feldes zu ersetzen: u0 (x, y, t) = v0 (x, y, t) exp (−iω0 t) 1 U0 (α, β, ω) = (2π)3 ∞ −∞ v0 (x, y, t) exp [−i (αx + βy − ωt)] dxdydt = V0 (α, β, ω) ∞ v(x, y, z, t) = −∞ z dαdβdω V0 (α, β, ω)HFP (α, β, ω; z) exp i αx + βy − ω t − vg −∞ = V0 (α, β, ω)H FP (α, β, ω; z) exp [i (αx + βy − ωt)] dαdβdω ∞ wobei der lineare Term aus der Transmissionsfunktion separiert worden ist. Führt man die sog. ’mitgeführte’ Zeit des Impulses τ =t− z vg ein und schreibt schließlich die Transmissionsfunktion aus, erhält man die langsame Amplitude im mitgeführten Bezugssystem z α2 + β 2 2 Dω − exp {i [αx + βy − ωτ ]} dαdβdω V0 (α, β, ω) exp i 2 k0 −∞ ṽ(x, y, z, τ ) = ∞ Für das Gesamtfeld gilt dann: u(x, y, z, t) = ṽ(x, y, z, τ ) exp [i (k0 z − ω0 t)] Damit ist die Evolution eines beliebigen Eingangsimpulses endlicher transversaler Dimension vollständig beschrieben. Die Analogie zwischen Beugungs-und Dispersionseffekten kann leicht hergestellt werden, wenn man erhält eine dreidimensionale Verallgemeinerung der Beugung: 66 → v(− µ , τ) = z− → →2 → → → → ρ − µ ) d− ρ ρ exp (i− V0 (− ρ ) exp i δ − 2 1 − α x − → k10 − → − → β − k0 y ρ = ,µ = , δ = ω −τ D Man erkennt leicht den Zusammenhang: D ←→ −1/k0 ,dabei gilt zu beachten,daß D ≷ 0. Aus der Entwicklung des Spektrums gelingt es wieder, eine Differentialgleichung für die langsame Amplitude abzuleiten: z α2 + β 2 2 Dω − V (α, β, ω; z) = V0 (α, β, ω) exp i 2 k0 Differenzieren ergibt: ∂V (α, β, ω; z) 1 i =− ∂z 2 α2 + β 2 Dω − k0 2 V (α, β, ω; z) Fourier-Rücktransformation führt auf die gewünschte DGL: i ∂v(x, y, z, τ ) D ∂ 2 1 (2) v(x, y, z, τ ) + ∆ v(x, y, z, τ ) = 0 − 2 ∂z 2 ∂τ 2k0 (2.20) → paraxiale Gleichung zur Beschreibung der Impulsausbreitung. Für D = 0 wird der Fall der ’einfachen’ Beugung reproduziert. 2.6.5.2 Unendliche transversale Ausdehnung Spezialfall: α = β = 0 → nur eine Ortsfrequenz in z-Richtung, ebene Welle 1. Anfangsverteilung: u0 (t) = v0 (t) exp (−iω0 t) 2. Anfangsspektrum: V0 (ω) = U0 (ω) 3. Entwicklung des Spektrums: D 2 V (ω; z) = exp i z ω V0 (ω) 2 −→ Rücktransformation mit τ 67 4. Entwicklung der Amplitude: D 2 ṽ(z, τ ) = V0 (ω) exp i z ω exp [−i ωτ ] dω 2 −∞ ∞ Die Fouriertransformation der Übertragungsfunktion D 2 HP (ω; z) = exp i z ω 2 ergibt die zeitliche Responsefunktion 6 7 2 (τ − t 2 ) exp −i hP (τ − t ; z) = −iπDz 2Dz Damit kann man im Zeitraum schreiben: ∞ ṽ(z, τ ) = −∞ hP (τ − t ; z)v0 (t )dt Die Differentialgleichung für die langsame Amplitude ergibt sich aus (2.20) zu i ∂v(z, τ ) D ∂ 2 v(z, τ ) = 0 − ∂z 2 ∂τ 2 (2.21) Aus (2.21) kann man nochmals einfach die Analogie zwischen Beugungs- und Dispersionseffekten ablesen (α, β) ←→ ω, (x, y) ←→ τ, ∇ ←→ 2.6.5.3 ∂ 1 , ←→ −D, aber :D ≶ 0. ∂τ k0 Beispiel: Chirpfreier Gauß-Impuls → Analogie zur Beugung ausnutzen 1. Anfangsverteilung −→ chirpfreier Impuls u0 u0 e 2T0 τ 68 t2 u0 (t) = A exp − 2 T0 2. Anfangsspektrum: τ2 exp (−iω0 t) → v0 (τ ) = A exp − 2 T0 T0 ω 2 T02 V0 (ω) = A √ exp − 4 π spektrale Breite: ωs2 = 4/T02 Ergebnisse von Ausbreitung eines Gauß-Strahles ausnutzen: z0 beschreibt Gauß z0 = k 2 w 2 0 =− 1 T02 ≷0 2D Dispersionslänge: LD = 2 |z0 | 3. damit folgt aus Analogie zur Ausbreitung eines Bündels die Entwicklung der Amplitude: i τ2 τ2 T0 exp − exp − exp [i ϕ(z)] v(z, τ ) = A T (z) T (z)2 2D R(z) mit 9 : A(z) = A: ; 4 1 2 , 1+ T (z) = T0 1+ z z0 z z0 2 ’Krümmung’ ist für Impuls keine passende Größe → Einführung des Chirps Erinnerung: ∂2 ∂2 + ∂x2 ∂y 2 Φ(x, y) = k R(z) für monochromatische Felder galt: Φ(τ ) = −ωτ −→ − ∂Φ(τ ) =ω ∂τ Verallgemeinerung auf beliebige Zeitabhängigkeit der (Gesamt)-Phase − ∂Φ(τ ) = ω(τ ) ∂τ und − ∂ 2 Φ(τ ) = chirp ∂τ 2 Man führt den ’chirp’ als dimensionslose Größe ein (parabolische Näherung): 69 T02 ∂ 2 Φ(τ ) C=− 2 ∂τ 2 damit wird die variable Frequenz unter dem Puls − ∂Φ(τ ) τ = ω(τ ) = ω0 + 2C ∂τ T0 C > 0 −→ up-chirp C < 0 −→ down-chirp τ τ Man hat nun die Krümmung R(z) durch den chip C(z) zu ersetzen: Φ(τ ) = −ω0 τ − τ2 τ2 ≡ −ω0 τ − C(z) 2 2DR(z) T0 Mit R(z) = −→ C(z) = T02 z0 =− 2DR(z) R(z) z0 z z 2 + z02 z −→ C(z) = − 2 =− 2 z z + z0 z0 1 + z2 z02 Achtung: Der Chirp trägt das Vorzeichen von z0 und damit von D. Damit ergibt sich für das Gesamtfeld: u(z, τ ) = A τ2 τ2 T0 exp −iC(z) 2 exp [i ϕ(z)] exp [i (k0 z − ω0 t)] exp − T (z) T (z)2 T0 Physikalisch ist die Situation ähnlich zu der beim Bündel. Die entscheidende Größe ist der Dispersionsparameter z0 = − 70 T02 2D 1) z << |z0 |: keine Effekte 2) z ≈ |z0 |: wie bei Bündel 3) D ≶ 0 spielt nur bei chirp eine Rolle, da sonst quadratisch. 2.6.5.4 Beispiel: Gechirpter Gauß-Impuls Oftmals generieren Laser gechirpte Impulse oder man erzeugt sich den Chirp gezielt, um den Puls zu komprimieren. Diese Kompression kann man in Analogie zur Strahlausbreitung erwarten (gekrümmte Phase −→ Fokussierung). Ein gechirpter Eingangsimpuls hat die Form 2 τ (1 + iC0 ) . v0 (τ ) = A exp − T02 Durch Fouriertransformation erhält man das Spektrum ω 2 T02 (1 − iC0 ) V0 (ω) = A exp − . 4(1 + C02 ) Damit ergibt sich die spektrale Breite zu ω 2s = 4(1 + C02 ) . T02 Ein gechirpter Puls ist immer spektral breiter als ein ungechirpter (ω 2s = 4/T02 ) −→ transformationsbegrenzt. Das Ziel besteht nun darin, Pulsbreite und Chirp in Abhängigkeit von den Eingangsparametern zu berechnen. Da ein gaußförmiger Strahl vollständig vom q-Parameter beschrieben wird, kann man das auch von einem Gauß-Impuls erwarten. Wir nutzen diese Analogie aus. Bei Ausbreitung im homogenen Raum gilt: 71 q(z) = q(0) + z. (2.22) Wir erinnern uns an den Zusammenhang von q-Parameter und Strahlparametern 1 2 1 = +i 2 . q(z) R(z) kw (z) Durch Ausnutzen der Analogie zwischen Beugung und Dispersion können wir den qParameter des Impulses mit Pulslänge und Chirp in Zusammenahn bringen. Wir ersetzen: k −→ − 2DC(z) 1 1 , w2 (z) −→ T 2 (z), −→ D R(z) T02 und erhalten 1 T02 2D 2DC(z) 2D −i 2 = = 2 C(z) − i 2 . q(z) T02 T (z) T0 T (z) (2.23) Man beachte, daß T0 mit der Pulsbreite bei z = 0 und nicht in der Taille zusammenhängt. Als Eingangsgröße (z = 0) erhält man aus 2.23 2D 1 = 2 [C0 − i] q(0) T0 (2.24) wobei C0 = C(0). Die Idee besteht nun darin, Gl.(2.24) in Gl.(2.22) einzusetzen und mit Gl.(2.23) gleichzusetzen. Da sowohl Real- als auch Imaginärteil identisch sein müssen, erhält man zwei Gleichungen für die fünf Größen C0 , T0 , z, C(z), T (z), d.h. man muß sich drei dieser Größen vorgeben. Man geht folgendermaßen vor, um die Pulsparameter bei z = d zu berechnen: 1) q-Parameter am Eingang q(0) = T02 (C0 + i) 2D (1 + C02 ) (2.25) 2) Entwicklung des q-Parameters q(d) = q(0) + d = T02 (C0 + i) 1 +d = 2Dd 1 + C02 + C0 T02 + iT02 (2.26) 2 2 2D (1 + C0 ) 2D (1 + C0 ) 3) Invertieren von Gl. 2.23 ergibt q(d) = T02 T 2 (d) C(d)T 2 (d) + iT02 4 2 4 2D [C (d)T (d) + T0 ] 72 (2.27) 4) Gleichsetzen von 2.26 und 2.27 führt auf [2Dd (1 + C02 ) + C0 T02 ] C(d)T02 T 4 (d) = (1 + C02 ) [C 2 (d)T 4 (d) + T04 ] T02 T 2 (d) 1 = (1 + C02 ) [C 2 (d)T 4 (d) + T04 ] Bei Vorgabe von drei relevanten Größen lassen sich daraus die zwei gewünschten Größen berechnen. Ein wichtiger Spezialfall ist dadurch gegeben, daß man fragt, an welcher Stelle ein gechirpter Puls seine größte Kompression (Taille) erreicht und wie groß die Kompression ist. Vorgegeben sind damit: C0 , T0 , C(d) = 0 (Taille) und die Gleichungen vereinfachen sich zu: 2Dd 1 + C02 + C0 T02 = 0 −→ d = − T 2 (z) = C0 T02 1 C0 = − sgn(D) LD 2 2D (1 + C0 ) 2 (1 + C02 ) T02 (1 + C02 ) Schlußfolgerungen: 1) Ein Puls kann komprimiert werden, wenn das Produkt aus Anfangschirp und Dispersion negativ ist −→ C0 D < 0. 2) Die Kompression ist umso größer je größer der Anfangschirp ist. Physikalische Interpretation: z.B. C0 < 0 und D > 0 −→ ∂vg /∂ω < 0 −→’blau’ schneller als ’rot’ 73 −→ der ’rote Schwanz’ überholt die ’blaue Front’ −→ bis C(z) = 0 (Taille), d.h. der Puls wird kompromiert. Bei der weiteren Ausbreitung wird C(z) > 0 und damit die ’rote Front’ schneller als der ’blaue Schwanz’ , d.h., der Puls wird breiter. Experiment: • Ausbreitung im nichtlinearen Medium (Selbstphasenmodulation) −→ C < 0 −→ anschließend Ausbreitung in Medium mit D > 0 −→ Kompression (Faktor 5 ist typisch) • Halbleiterlaser liefern gechirpten Puls hier Analogie weiterführen (chirper) IEEE JQE 26 (90)1158 2.6.5.5 Beispiel: Ausbreitung eines Gauß-Impulses mit endlicher Breite −→ optisches Bullet Zur expliziten Berechnung nutzt man die in Kapitel 2.6.1.1 abgeleitetet Ergebnisse (insbesondere Gl.(2.18), die für jede beliebige Anfangsverteilung (nicht auf Gauß beschränkt) gelten. Hier beschränken wir uns auf ein raum-zeitliches Gauß-Profil. 1. Eingangsfeld: 2 x + y2 τ2 v0 (x, y, τ ) = A exp − 2 exp − T0 w02 2. Feld nach Ausbreitung : v(x, y, z, τ ) = A τ2 T0 w0 x2 + y 2 exp − exp − 2 T (z) w(z) T (z)2 w (z) τ2 x2 + y 2 exp ik0 exp −iC(z) 2 exp [i ϕ(z)] exp [i (k0 z − ω0 t)] 2R(z) T0 u(x, y, z, τ ) = v(x, y, z, τ ) exp {i [k0 z − ω0 (τ − z/vg )]} mit T (z) = T0 1+ 2z Ld 2 , w(z) = w0 −1 2z 2z sgn(D) 1+ C(z) = , Ld Ld Ld = T02 , |D| Lb = kw02 74 1+ 6 R(z) = z 1 + 2z Lb Lb 2z 2 , 2 7 Eine Verallgemeinerung auf Gauß-Hermite- bzw. Gauß-Laguerre-Moden ist möglich (im Resonator). 75 Kapitel 3 Beugungstheorie 3.1 Wechselwirkung mit ebenen Schirmen a) Beugung im weiteren Sinne −→ Ausbreitung eines räumlich begrenzten Wellenfeldes in einem Halbraum −→ Problem bisher behandelt. b) Beugung historisch −→ Feld trifft auf Hindernis −→ WW induziert Polarisation, die ein Sekundärfeld abstrahlt −→ Interferenz führt zum Beugungsbild −→ vektorielles Randwertproblem −→ vektorielles Randwertproblem selbstkonsistent zu lösen Es gibt nur wenige strenge Lösungen −→ keine große praktische Bedeutung Näherungen: a) geometrische Optik −→ Schatten b) skalare Beugungstheorie mit Näherungen für die Wechselwirkung −→ von der Apertur gehen Erregungen mit bestimmten Amplituden aus −→ Interferenz Die Wechselwirkung mit der Apertur wird durch eine komplexe Transferfunktion t(x, y) beschrieben, wobei gilt, daß t(x, y) = 0 außerhalb der Apertur. Damit reduziert sich das Beugungsproblem auf drei verschiedene Prozesse: 1. Ausbreitung von der Lichtquelle zur Apertur 2. Multiplikation der Feldverteilung mit der Transferfunktion 3. Ausbreitung der modifizierten Feldverteilung hinter der Apertur Problem ’1’ spielt für viele Anwendungen keine Roll, da man eine ebene Beleuchtungswelle (keine Beugung) voraussetzt. Wechselwirkung mit der Apertur u+ (x, y, zA ) = t(x, y)u− (x, y, zA ) Ausbreitung nach der Apertur 76 ∞ u(x, y, z) = h (x − x , y − y , z − zA ) u+ (x , y , zA )dx dy −∞ oder ∞ H (α, β; z − zA ) U+ (α, β; zA ) exp [i (αx + βy)] dαdβ, u(x, y, z) = −∞ wobei h= 1 FT [H] (2π)2 und im folgenden wird zB = z − zA eingeführt. Die Ausbreitung im Halbraum hinter der Apertur kann exakt oder in verschiedenen Näherungen (Fresnel, Fraunhofer) beschrieben werden. 3.2 Beschreibung der Ausbreitung in verschiedenen Näherungen 3.2.1 Der allgemeine Fall - kleine Öffnungen, große Öffnungswinkel Die Übertragubgsfunktion wurde im Kapitel 2.6.1 abgeleitet. Wir erinnern uns: H (α, β; zB ) = exp (iγzB ) mit 2 γ = k 2 (ω) − α2 − β 2 . Es bestehen keinerlei Beschränkungen bzgl. der Ortsfrequenzen α, β, d.h., es treten sowohl homogene als auch evaneszente Wellen auf. Es sind beliebig kleine Aperturstrukturen zugelassen. Dazu benutzt man die sog. Weyl-Darstellung der Kugelwelle (Winkelspektrum der Kugelwelle). 1 i exp (ikr) = r 2π ∞ −∞ 1 exp [i (αx + βy + γzB )] dαdβ γ Die Kugelwelle ist die Green’sche Funktion der Helmholtzgleichung im homogenen Raum. Daraus folgt durch einfaches Differenzieren: 77 ∞ ∂ 1 exp (ikr) = −2π exp [i (αx + βy + γzB )] dαdβ = FT [H] = (2π)2 h ∂z r −∞ 1 ∂ 1 h (x, y, zB ) = − exp (ikr) 2π ∂z r mit r = x2 + y 2 + zB2 . Damit wird die Beugung durch die Rayleigh-Formel ∞ u(x, y, z) = h (x − x , y − y , zB ) u+ (x , y , zA )dx dy −∞ beschrieben. h (x − x , y − y , zB ) bezeichnet man auch als Green’sche Funktion der Helmholtzgleichung im homogenen Halbraum. Man kann sich aus der Übertragungsfunktion die Responsefunktion im Ortsraum beschaffen. 3.2.2 Fresnelnäherung - paraxial Wenn α2 + β 2 << k 2 (eingeschränktes Ortsfrequenzspektrum −→ bestimmte minimale Größe der Variationen in der Apertur), kann man die oben abgeleiteten Übertragungsund Responsefunktionen benutzen. z B α2 + β 2 HF (α, β; zB ) = exp (ikzB ) exp −i 2k i k 2 2 hF (x, y, zB ) = − x +y exp (ikzB ) exp i λzB 2zB Das gleiche Ergebnis erhält man, wenn h (x, y, zB ) im Ortsraum entwickelt wird. 3.2.3 Fraunhofernäherung - paraxial und Fernfeld kzB >> 1 −→ zB >> λ α2 + β 2 << k 2 , zusätzliche Forderung (Begründung später) für Fresnelzahl NF NF 0.1 mit NF = Ableitung aus Fresnelnäherung mit Methode der stationären Phase: Zu berechnen ist das Integral 78 a a 1 z0 = λ zB π zB I= g(p, q) exp [iκf (p, q)] dpdq Die näherungsweise Berechnung kann erfolgen, wenn κ >> 1 und g(p, q) langsam veränderlich ist. Idee: Wenn κ >> 1, oszilliert der Expomnt im Integranden schon bei kleinen Änderungen von f (p, q) stark −→ durch die Integration heben sich diese Beiträge heraus. Ausnahme: stationäre Punkte pm , qm ∂f ∂f = fp |pm ,qm = 0, = fq |pm ,qm = 0 ∂p pm ,qm ∂q pm ,qm Das Integral läßt sich dann näherungsweise als eine Summe über die stationären Punkte darstellen: M 1 2π g (pm , qm ) exp [iκf (pm , qm )] I= iκ m=1 fpp(m) fqq(m) − f 2 pq(m) Das Beugungsfeld in Fresnelnäherung ergibt sich zu ∞ uF (x, y, zB ) = −∞ z B U+ (α, β; zA ) exp (ikzB ) exp −i α2 + β 2 exp [i (αx + βy)] dαdβ 2k Anwendung der Methode der stationären Phase: ∞ uF (x, y, zB ) = exp (ikzB ) −∞ α x 1 α2 β 2 β y − dαdβ U+ (α, β; zA ) exp ikzB + + 2 k zB k zB 2 k2 k Mit den Abkürzungen: p= α , k q= f (p, q) = p β , k κ = kzB >> 1 x y 1 2 +q − p + q2 zB zB 2 folgt daraus: ∞ uF (x, y, zB ) = k 2 exp (iκ) U+ (kp, kq; zA ) exp [iκf (p, q)] dpdq −∞ Die Ableitungen lauten 79 (3.1) x ∂f − p, = ∂p zB ∂ 2f ∂2f = = −1, ∂p2 ∂q 2 ∂f y − q, = ∂q zB ∂2f =0 ∂p∂q damit ergeben sich die stationären Punkte: p1 = x , zB q1 = y x2 + y 2 −→ f (p1 , q1 ) = zB 2zB Das Beugungsfeld in Fraunhofernäherung ergibt sich dann zu: 2π 2 x y k 2 2 uFR (x, y, zB ) = k exp (ikzB ) U+ (k , k ; zA ) exp i (x + y ) ikzB zB zB 2zB x y k (2π)2 2 2 exp (ikzB ) U+ (k , k ; zA ) exp i (x + y ) = −i λzB zB zB 2zB −→ in Fraunhoferscher Näherung ist die Amplitudenverteilung des Beugungsbildes proportional zur Fouriertransformierten des Feldes hinter der Apertur (2π)4 I= (λzB )2 2 x y U+ (k , k ) zB zB Interpretation: An jedem Ort x, y trägt nur eine Ortsfrequenz α = k zxB ; β = k zyB mit der entsprechenden Spektralamplitude U+ (k zxB , k zyB ; zA ) zum Beugungsbild bei (i.a. tragen alle Ortsfrequenzen bei). Warum muß die Bedingung NF = a a 0.1 λ zB erfüllt sein? zwei wesentliche Quotienten: Apertur/Wellenlänge und Apertur/Abstand Idee: 80 • f (p, q) muß schnell im Vergleich zu U (p, q) abklingen −→ U (p, q) ≈ const. an stationären Punkten • schnelles Abklingen von U (p, q) wird durch Apertur und nicht durch kleine Strukturen bestimmt Wir zeigen das für den eindimensionalen Fall: a) spektrale Breite im Exponenten ps f 1 ∂ 2 f f (p) ≈ f (ps ) + (p − ps )2 2 ∂p2 ps 2 x2 1 x = − p− 2zB 2 zB p Interpretation: 1 ∂ 2 f (p − ps )2 f (p) ≈ f (ps ) + 2 ∂p2 ps 2 x2 1 x = − p− 2zB 2 zB Damit ergibt sich für den Exponenten (Phase) in (3.1) kx2 1 zB kzB f (p) ≈ − 2zB 2 k kx α− zB 2 damit ergibt sich für die spektrale Breite: ws2 2k = zB −→ π 2ws = 4 λzB b) spektrale Breite von U (p, q) : Apertur −→ a −→ αa = 2π/a −→ Breite = 4π/a 81 Mit der Forderungen, dass U (p, q) sich langsamer ändert als der Exponent folgt: a2 π 4π/a >> 4 −→ NF = << π λzB λz q.e.d. Damit ergibt sich (im eindimensionalen Fall) für die Gültigkeit der Fraunhofernäherung: 1) a2 << k 2 −→ ∆x >> λ 2) kzB >> 1 −→ zB >> λ 3) NF = a2 λz << 1 Beispiel: ∆x = 10λ, 3.3 −→ zB >> a = 100λ a2 λ −→ zB >> 104 λ ≈ 1 cm Fraunhoferbeugung an ebenen Schirmen Beleuchtungswelle: • senkrecht u− (x, y, zA ) = A exp (ikz zA ) • schräg u− (x, y, zA ) = A exp [i (kx x + ky y + kz zA )] Beugungsbild: (2π)4 I(x, y, zB ) = |u(x, y, zB )| = (λzB )2 2 −→ 2 U+ (k x , k y ) zB zB Spektrum nach Schirm bei α = k zxB , β = k zyB 82 Spektrum: Feld nach Schirm: u+ (x, y, zA ) = u− (x, y, zA )t(x, y) = A exp [i (kx x + ky y + kz zA )] t(x, y) x y A exp (ikz zA ) U+ (k , k ) = zB zB (2π)2 = A exp (ikz zA ) T ∞ −∞ x y t(x , y ) exp −i k − kx x + k − ky y dx dy zB zB x y k − kx , k − ky zB zB Damit ergibt sich für die Intensität des Beugungsbildes 2 4 x y 2 (2π) k − kx , k − ky I(x, y, zB ) = A 2 T zB zB (λzB ) −→ |FT der Apertur|2 −→ Verschiebung des Bildes durch schräge Beleuchtung 3.3.0.1 Beispiele: 3.3.0.2 rechteckiger Spalt bei senkrechter Beleuchtung t(x, y) = 1 für |x| a, |y| b 0 sonst x y 2 sinc kb I(x, y, zB ) ∼ sinc ka zB zB 2 83 3.3.0.3 Lochblende t(x, y) = 1 für x2 + y 2 a2 0 sonst 2 ka 2 2 J1 zB x + y I(x, y, zB ) ∼ ka 2 + y2 x zB −→ Airy-Funktion −→ Definition des Auflösungsvermögens Punkt −→Airy-Beugungsscheibchen x 2 + y 2 = ρ2 ρs 0.61λ ka ρs = 1.22π −→ = zB zB a Θ= Θ −→ 3.3.0.4 2ρs 1.22λ = zB a Auflösungsvermögen später eindimensionale periodische Strukturen b - Periode, 2a - Öffnung 84 tS (x) für |x| a 0 sonst t1 (x) = t(x) = N −1 t1 (x − nb) n=0 N −1 ∞ x x ∼ t1 (x − nb) exp −ik x dx T k zB zB n=0 −∞ mit x − nb = X T x k zB ∼ N −1 a n=0 −a ∼ TS ∼ TS wegen x x tS (X ) exp −ik X exp −ik nb dX zB zB x k zB N −1 x exp −ik nb zB n=0 sin N k x b 2 zB x k zB sin k2 zxB b sin N 2δ δ exp (−iδn) = sin 2 n=0 N −1 Für ein Strichgitter gilt: TS x k zB x = sinc k a zB Damit ergibt sich die Intensität des Beugungsbildes zu I ∼ sinc2 sin2 N k x b 2 zB x k a 2 k x zB sin 2 zB b 85 50 N =7 I I0 40 30 20 10 xS 0 -4 2 -3 5 -2 8 -2 1 -1 4 -7 0 7 = xp 14 21 28 xN Die Struktur des Beugungsbildes wird durch drei Größen bestimmt: • Breite des Beugungsbildes → erste Nullstelle der Spaltfunktion k xS λzB a = π → xS = zB a • Maxima des Beugungsbildes → Maxima der Gitterfunktion λzB k xp b = nπ → xp = n 2 zB b • Breite der Maxima → Nullstellen der Gitterfunktion N λzB k xN b = π → xN = 2 zB Nb N −→ ∞ −→ Delta-Funktion δ(x − n λb zB ) 86 N 35 42 k b x 2 zB π 3.3.1 Bemerkungen zur Fresnelbeugung am Spalt Verhalten wird durch Fresnelzahl NF = a a λ zB = 1 z0 π zB bestimmt. • NF 10 (a groß, λzB klein, zB < 1/30 z0 ) −→ geometrischer Schatten • NF 0.1 ( zB > 3z0 ) −→ Fraunhoferbeugung −→ Fouriertransformation der Apertur • 10 NF 0.1 (1/30 z0 < zB < 3z0 ) −→ Fresnelbeugung Beispiel: 1D Spalt u+ (x) = 1 für |x| a α2 U+ (α) = a sinc(αa) −→ U (α; z) ∼ a sinc(αa) exp −i z 2k u(x, z) ∼ α2 a sinc(αa) exp −i z exp (iαx) dα 2k 87 Kapitel 4 Fourieroptik −→ Optische Filterung Beherrscht man die Beschreibung der Ausbreitung des Feldes, benötigt man noch die Transferfunktion einer Linse, um die optische Abbildung zu beschreiben. Wir beschränken uns auf die paraxiale Näherung ( siehe Kapitel 3.2.2), was im allgemeinen für die optischen Systeme eine ausreichende Näherung darstellt. Es wird sich herausstellen, daß unter bestimmten Bedingungen bei der Abbildung die Fouriertransformierte des Objektes entsteht. Diese Feldverteilung kann nun in der Fourierebene manipuliert werden. Eine weitere Abbildung erzeugt ein gegenüber dem Objekt verändertes Bild. Durch gezielte Manipulationen können Filterfunktionen verwirklicht werden. Die Ausbreitung im homogenen Raum wird im Fourierraum beschrieben, die Wechselwirkung mit der Linse im Ortsraum. 4.1 Die Abbildung eines beliebigen Feldes mit einer dünnen Linse 4.1.1 Transferfunktion einer dünnen Linse Eine dünne Linse soll nur die Phase eines optischen Feldes verändern (Transmission = 1). Nimmt man an, daß eine Linse eine vom Fokus ausgehende Kugelwelle in eine ebene Welle transformiert, ergibt sich für die Transferfunktion einer dünnen Linse wegen k 2 2 tL (x, y) = exp (ikz) x +y exp (ikz) exp i 2f k 2 2 . tL (x, y) = exp −i x +y 2f Im Fourierraum gilt damit: λf f 2 2 TL (α, β) = −i . exp i α +β 2k (2π)2 Der Vollständigkeit halber geben wir noch die Übertragungsfunktion des homogenen Raumes an 88 i 2 2 HF (α, β; z) = exp (ikz) exp − α +β z . 2k 4.1.2 Die Beschreibung der Abbildung Das Objekt befinde sich im hinteren Fokus einer Linse, das Beugungsbild wird im Fokus berechnet. 4.1.2.1 1. Spektrum in der Objektebene U0 (α, β) = FT−1 [u0 (x, y)] 4.1.2.2 2. Ausbreitung Objekt −→Linse U− (α, β; f ) = HF (α, β; f ) U0 (α, β) 4.1.2.3 3. Wechselwirkung mit der Linse u+ (x, y, f ) = tL (x, y) u− (x, y, f ) −→ U+ (α, β; f ) = TL (α, β) ∗ U− (α, β; f ) 4.1.2.4 4. Ausbreitung Linse −→Bildebene U (α, β; 2f ) = HF (α, β; f ) U+ (α, β; f ) 89 4.1.2.5 5. Fouriertransformation in der Bildebene u(x, y, 2f ) = FT [U (α, β; 2f )] Durchführung der Rechnung 90 4.1.2.6 1. Spektrum in der Objektebene U0 (α, β) = FT−1 [u0 (x, y)] 4.1.2.7 2. Ausbreitung Objekt −→Linse i 2 2 U− (α, β; f ) = exp (ikf ) exp − α + β f U0 (α, β) 2k 4.1.2.8 3. Wechselwirkung mit der Linse U+ (α, β; f ) = TL (α, β) ∗ U− (α, β; f ) ∞ f λf 2 2 · exp (ikf ) exp i (α − α ) + (β − β ) = −i 2k (2π)2 −∞ i 2 2 α + β f U0 (α , β )dα dβ · exp − 2k 4.1.2.9 4. Ausbreitung Linse −→Bildebene ∞ λf f 2 2 U (α, β; 2f ) = −i · exp (2ikf ) exp i (α − α ) + (β − β ) 2k (2π)2 −∞ i 2 i 2 2 2 α + β f exp − α + β f U0 (α , β )dα dβ · exp − 2k 2k λf = −i exp (2ikf ) (2π)2 f U0 (α , β ) exp −i (αα + ββ ) dα dβ k −∞ ∞ f λf f = −i exp (2ikf ) u0 − α, − β k k (2π)2 −→ das Spektrum in der Bildebene entspricht der Objektverteilung, wobei die Ortsfre k k quenzen (α, β) durch − f x, − f y zu ersetzen sind. 91 4.1.2.10 5. Fouriertransformation in der Bildebene u(x, y, 2f ) = FT [U (α, β; 2f )] λf = −i exp (2ikf ) (2π)2 ∞ −∞ f f u0 − α, − β exp [i (αx + βy)] dαdβ k k Mit der Koordinatentransformation f x = − α, k f k k y = − β −→ dα = − dx , dβ = − dy k f f ergibt sich 1 u(x, y, 2f ) = −i exp (2ikf ) λf ∞ −∞ (2π)2 exp (2ikf ) U0 = −i λf k u0 (x , y ) exp −i (xx + yy ) dx dy f k k x, y f f Das Bild in der hinteren Brennebene entspricht der Fouriertransformierten der Objektverteilung −→ Analogie zum Fernfeld in der Fraunhofernäherung, aber zB ←→ f . Die optische Fouriertransformation erlaubt Manipulationen am spektralen Inhalt. 4.2 4.2.1 Optische Filterung bzw. Bildberarbeitung Die 4f - Geometrie 92 In der hinteren Brennebene der ersten Linse (Fourierebene) soll eine Manipulation am Spektrum durch eine Pupillenfunktion p(x, y) vorgenommen werden. Das wesentliche Ergebnis bisher ist, daß das Bild in der hinteren Brennebene einer Linse (Objekt in vorderer Brennebene) proportional zur Fouriertransformierten der Objektverteilung ist k k x, y , (4.1) u(x, y, 2f ) = A U0 f f wobei A eine komplexe Amplitude ist. Unser Ziel besteht nun darin, die Abbildung durch die zweite Linse unter Berücksichtigung der Manipulation zu beschreiben und eine Übertragungsfunktion HA (α, β; 4f ) des gesamtem abbildenden Systems zu finden. ∞ u(x, y, 4f ) = HA (α, β; 4f ) U0 (α, β) exp [i (αx + βy)] dαdβ −∞ Die Aperturfunktion p(x, y) beschreibt alle Begrenzungen des Systems und beliebige, zusätzlich einzubringende, Filterfunktionen. Damit ergibt sich mit (4.1) das Feld hinter der Pupille zu u+ (x, y, 2f ) = u(x, y, 2f )p(x, y) k k = A U0 x, y p(x, y) f f Aus den vorangegangenen Rechnungen wissen wir, daß die Linse eine Fouriertransformation dieser Feldverteilung durchführt, also u(x, y, 4f ) = AU+ k k x, y; 2f f f ∞ = AA U0 −∞ ∞ =A −∞ k u+ (x , y , 2f ) exp −i (xx + yy ) dx dy f k k k x , y p(x , y ) exp −i (xx + yy ) dx dy f f f Eine Koordinatentransformation α= k k x , β = y f f führt auf 93 u(x, y, 4f ) = A ∞ −∞ u(−x, −y, 4f ) = A ∞ −∞ =A f f U0 (α, β) p( α, β) exp [−i (αx + βy)] dαdβ k k f f p( α, β)U0 (α, β) exp [i (αx + βy)] dαdβ k k ∞ HA (α, β; 4f ) U0 (α, β) exp [i (αx + βy)] dαdβ (4.2) −∞ Damit können wir die Übertragungsfunktion ablesen: f α, f β) HA (α, β; 4f ) = Ap( k k −→ Jede Fourieramplitude des Objektspektrums wird mit der Pupillenfunktion gewichtet, d.h., die Pupillenfunktion stellt im wesentlichen die Übertragungsfunktion dar. Ähnlich zu unserem früheren Vorgehen können wir die Abbildung im Ortsraum beschreiben, indem wir die Responsefunktion hA (x − x , y − y ) einführen. ∞ u(−x, −y, 4f ) = hA (x − x , y − y )u0 (x , y )dx dy −∞ wobei gilt: 1 hA (x − x , y − y ) = (2π)2 =A ∞ HA (α, β; 4f ) exp {i [α (x − x ) + β (y − y )]} dαdβ −∞ ∞ −∞ f f p( α, β) exp {i [α (x − x ) + β (y − y )]} dαdβ k k mit x= f α, k y= f β k folgt ← → hA (x − x , y − y ) = A ∞ −∞ k p(x, y) exp −i [x (x − x) + y (y − y)] dxdy f ← → k k = AP (x − x) , (y − y) f f 94 und damit ← → u(−x, −y, 4f ) = A ∞ −∞ k k P (x − x) , (y − y) u0 (x , y )dx dy , f f (4.3) d.h., wie zu erwarten war, ist die Responsefunktion im wesentlichen die Fouriertransformation der Pupillenfunktion. Die 4f -Abbildung mit einer Aperturfunktion bei z = 2f ist damit im Fourier-und im Ortsraum beschrieben. 4.2.2 Beispiele: 4.2.2.1 Die ideale Abbildung (unendliche Apertur) Mit p = 1 −→ P ∼ δ (x − x ) δ (y − y ) folgt aus 4.2 oder 4.3 ← → u(−x, −y, 4f ) = A u0 (x, y) d.h. ein seitenverkehrtes Original. 4.2.2.2 Endliche Apertur p(x, y) = 1 für x2 + y 2 ≤ (D/2)2 0 sonst 95 Die Übertragungsfunktion ergibt sich damit zu HA (α, β; 4f ) = 2 2 1 für fk α + fk β ≤ (D/2)2 0 sonst d.h. die endliche Apertur schneidet die hohen Objektortsfrequenzen ab (Tiefpaßfilter) und bestimmt damit das Auflösungsvermögen. Mit ρ2 = a2 + β 2 ergibt sich damit für die obere Grenzfrequenz ρG , (Bandbreite des Systems) ρ2G k2 = 2 f D 2 2 −→ ρG = 2πn D . λf 2 Entsprechend der Fourier-Theorie hängt die kleinste noch übertragbare Struktur mit der Bandbreite zusammen ∆rmin = 2π 2λf 2λ λ λ = = ≈ ≈ ρG nD nF nΘ n sin Θ (4.4) wobei F = D/f ≈ 2Θ die Fresnelzahl der Linse und Θ der halbe Aperturwinkel ist. Gl.(4.4) ist die bekannte Formel für das Auflösungsvermögen bei der optischen Abbildung. Ein alternativer Zugang zur Bestimmung des Auflösungsvermögen ergibt sich im Ortsraum: 96 ← → u(−x, −y, 4f ) = A ∞ −∞ k k P (x − x) , (y − y) u0 (x , y )dx dy f f 2 2 ∞ J1 (x − x) + (y − y) ← → = A u0 (x , y )dx dy, 2 2 kD (x − x) + (y − y) −∞ 2f kD 2f d.h., jeder Objektpunkt wird bei der Abbildung zu einem Airy’schen Beugungsscheibchen. P fk (x − x) , fk (y − y) stellt gleichzeitig die Green’sche Funktion des Übertragungssystems dar. Definiert man die Auflösungsgrenze dahingehend, daß das Maximum eines zweiten Bildpunktes im ersten Minimum des ersten liegen muß, erhält man kD ∆rmin = 1.22π 2f 2 ∆rmin = 4.2.2.3 1.22λ n sin Θ Optisches Differenzieren (hier eindimensional) Man gebe sich eine Pupillenfunktion p(x) = −ix vor und erhält u(x, 4f ) = A ∞ −∞ ∂ =B ∂x =B f U0 (α) −i α exp (−iαx) dα k ∞ U0 (α) exp (−iαx) dα −∞ ∂ u0 (−x) ∂x Experimentell kann die Funktion mit einem Graukeil mit einem Phasensprung π im Zentrum realisiert werden: x exp i32 π für x > 0 p(x) = |x| exp i π2 für x > 0 97 4.2.2.4 Das Phasenkontrastverfahren nach Zernike Problem: Ein reines Phasenobjekt (z.B. biologische Objekte) u0 (x, y) = exp [iϕ(x, y)] wird bei der idealen Abbildung identisch abgebildet, d.h., u(−x, −y, 4f ) = exp [iϕ(x, y)] und damit I(−x, −y, 4f ) = |u(−x, −y, 4f )|2 = 1, d.h., die Information geht bei der Detektion verloren. Die Idee besteht nun darin, eine Manipulation in der Pupillenebene vorzunehmen. Die Phasenvariationen im Objekt sind i.a. klein, d.h., u0 (x) ≈ 1 + iϕ(x) U0 (α) = δ(α) + iΦ(α) Die Pupillenfunktion sei ein Phasenplättchen mit einem Loch im Zentrum, so daß nur die Ortsfrequenz α = 0 unbeeinflußt hindurchgeht. Alle anderen Ortsfrequenzen sollen einen Phasenshift π/2 erfahren. p(x) = f p( α) = k 1 für x ≈ 0 exp i π2 = i sonst 1 für α ≈ 0 π exp i 2 = i sonst Damit ergibt sich in der Bildebene u(−x, 4f ) ≈ A ∞ [δ(α) − Φ(α)] exp (iαx) dα −∞ [1 − ϕ(x)] =A und für die Intensität I(x, 4f ) ∼ 1 − 2ϕ(x), d.h., die Phasenmodulation wird in eine Amplitudenmodulation umgewandelt. 98 4.3 Das Prinzip der holographischen Abbildung Idee: Wenn das Feld u(x, y, zH ) in einer Ebene z = zH bekannt ist (genügend groß), ist es im Prinzip im gesamten Halbraum z > zH bekannt (2D Information −→ 3D Information). Das Problem besteht darin, daß bei z = zH das komplexe Feld bekannt sein muß. Konventionelle Aufnahmeverfahren registrieren i.a. nur die Intensität. So weist eine Fotoplatte eine Transmissionsfunktion t(x, y, zH ) = C |u(x, y, zH )|2 auf. Der Ausweg besteht darin, das Objektfeld mit einer einfach strukturierten Referenzwelle (z.B. ebene Welle) zu überlagern. a) Aufzeichnung des Hologramms uH (x, y, zH ) = u(x, y, zH ) + a exp (iKrH ) 99 t(x, y, zH ) = C |uH (x, y, zH )|2 = C |u|2 + |a|2 + ua∗ exp (−iKrH ) + u∗ a exp (iKrH ) t(x, y, zH ) ist die Transmissionsfunktion einer entwickelten Fotoplatte −→ Hologramm. Das Interferenzmuster weist keine Ähnlichkeit mit dem Objekt auf. Der Interferenzterm trägt die benötigte Phaseninformation. Eine Verkleinerung (’Zerbrechen’) des Hologramms bedeutet keinen Verlust des Bildes. Es werden nur bestimmte Ortfrequenzen ausgeblendet. b) Rekonstruktion des Objektes noindent uH+ (x, y, zH+ ) = a exp (±iKrH ) t(x, y, zH ) Das dritte Glied in der Transmissionsfunktion ergibt bei zur Referenzwelle identischer Rekonstruktionswelle ∼ |a|2 exp [−i (K − K) rH ] u(x, y, zH ) = |a|2 u(x, y, zH ) Das Objektfeld breitet sich im Halbraum z > zH aus −→ virtuelle Abbildung. Das vierte Glied in der Transmissionsfunktion ergibt bei zur Referenzwelle konjugierter Rekonstruktionswelle ∼ |a|2 exp [i (K − K) rH ] u∗ (x, y, zH ) = |a|2 u∗ (x, y, zH ) Das konjugierte Objektfeld (einlaufende Welle) breitet sich im Halbraum z < zH aus −→ relle Abbildung. Fourier-Holographie 100 Holographische (van der Lugt) Filter Das Ziel besteht in der optischen Generierung einer beliebigen Filterfunktion, um optische Filterung (Bildverarbeitung) zu implementieren. ∞ u(x, y, z) = f (x − x , y − y , z)u0 (x , y )dx dy −∞ 101 Kapitel 5 Die Polarisation elektromagnetischer Wellen 5.1 Einführung Der zeitliche Verlauf des reellen elektrischen Feldvektors Er (r,t) bestimmt den Polarisationszustand des Feldes. Wir betrachten hier den Polarisationszustand einer Normalmode E(r, t) = E(ω) exp {i [k (ω) r − ωt]} wobei wir uns der Einfachheit halber auf eine sich in z ausbreitende Mode beschränken. Die Ergebnisse können auf Normalmoden mit kleinen transversalen Wellenzahlvektoren (paraxiale Verhältnisse) übertragen werden. Da die Felder transversal sind, besitzen sie nur eine x− und y−Komponente. Die Orientierung und Gestalt der Fläche, auf der sich der (reelle) elektrische Feldvektor bewegt, bestimmt den Polarisationszustand. Diese Fläche ist i.a. eine sich mit der Ausbreitungsrichtung nicht ändernde Ellipse, die zur Linie (lineare Polarisation) oder zum Kreis (zirkulare Polarisation) entarten kann. 5.2 Die Polarisation einer Normalmode im isotropen, dispersiven Medium Wir berechnen die Bewegung des momentanen elektrischen Feldvektors, wobei nach Voraussetzung 0 k = 0 k gilt. Die relevante Größe ist der Realteil des Feldes Er (r, t) = E(ω) exp [ikz − ωt)] , wobei wegen der Transversalität des Feldes nur zwei komplexe Feldkomponenten frei wählbar sind. 102 Ex Ex exp (iϕx ) E(ω) = E y = Ey exp (iϕy ) 0 0 mit den reellen Größen Ex,y und ϕx,y . Ex cos (Φ − ϕx ) X(z, t) ! Er (r, t) = Ey cos (Φ − ϕy ) = Y (z, t) 0 0 und Φ = ωt − kz. Wir erhalten X = cos (Φ) cos (ϕx ) + sin (Φ) sin (ϕx ) Ex (5.1) Y = cos (Φ) cos (ϕy ) + sin (Φ) sin (ϕy ) Ey (5.2) Multipliziert man zuerst (5.1) mit sin (ϕy ) und (5.2) mit sin (ϕx ) und subtrahiert die Gleichungen und wiederholt das entsprechend mit cos (ϕy ) , cos (ϕx ), erhält man X Y sin (ϕy ) − sin (ϕx ) = cos (Φ) sin (ϕy − ϕx ) Ex Ey X Y cos (ϕy ) − cos (ϕx ) = − sin (Φ) sin (ϕy − ϕx ) . Ex Ey Mit der Abkürzung δ = ϕy − ϕx und Quadrieren und Addieren der resultierenden Gleichungen ergibt sich die Gleichung einer Ellipse X2 Y 2 XY + 2 −2 cos δ = sin2 δ. 2 Ex Ey Ex Ey Die Dreh-Transformation ins Hauptachsensystem führt man mit X = ξ cos ψ − η sin ψ Y = ξ sin ψ + η cos ψ durch. Verschwinden des ξη -Gliedes erfordert für den Drehwinkel tan 2ψ = 2Ex Ey cos δ Ex2 − Ey2 und es folgt die Ellipsengleichung im Hauptachsensystem η2 ξ2 + =1 α2 β 2 103 (5.3) mit den Hauptachsen 1 = α2 1 = β2 cos2 ψ sin2 ψ cos δ + − sin 2ψ 2 2 Ex Ey Ex Ey sin2 ψ cos2 ψ cos δ + + sin 2ψ Ex2 Ey2 Ex Ey 1 sin2 δ 1 , sin2 δ wobei sich ψ aus 5.3 ergibt. Abbildung 5.1: Polarisationsellipse Die Normalmode eines isotropen, dispersiven Mediums ist i.a. elliptisch polarisiert, da beliebige Ex , Ey und Phasendifferenz δ = (ϕy − ϕx ) . 5.2.1 Polarisationszustände A) elliptische Polarisation −→ Ex = Ey , δ = nπ α) δ = ±π/2 −→ ψ = 0, α = Ex , β = Ey +π/2 −→ linksdrehend, −π/2 −→ rechtsdrehend (man sieht entgegen der Ausbreitungsrichtung auf den Feldvektor) β) 0 < δ < π −→ linksdrehend π < δ < 2π −→ rechtsdrehend ψ ist endlich B) zirkulare Polarisation −→ Ex = Ey = E, δ = ±π/2 ψ = 0, α = E, β=E rechts/links wie oben C) lineare Polarisation −→ δ = nπ 104 105 tan 2ψ = (−1)n 2Ex Ey Ex2 − Ey2 Ex = Ey ψ = π/4, 3π/4 Bemerkung: linear polarisierte Welle ist die Überlagerung zweier zirkularer Wellen (kz = 0, δ = ±π/2) cos (ωt) cos (ωt) cos (ωt) 0 E sin (ωt) + E − sin (ωt) = 2E 0 0 0 . 106 5.3 Alternative Darstellung des Polarisationszustandes 5.3.1 Poincaré-Kugel, Stokes-Parameter −→ anschauliche Darstellung der Dynamik von Systemen mit drei Freiheitsgraden s0 = Ex2 + Ey2 s1 = Ex2 − Ey2 s2 = 2Ex Ey cos δ s3 = 2Ex Ey sin δ s20 = s21 + s22 + s23 Jeder Polarisationszustand kann durch einen Punkt auf der Kugeloberfläche (Radius s0 ) dargestellt werden. Abbildung 5.2: Poincare-Kugel obere Halbkugel untere Halbkugel Äquator Pole −→ linksdrehend −→ rechtsdrehend −→ lineare Polarisation s3 = 0 −→ δ = nπ −→ zirkulare Polarisation s1 = s2 = 0 −→ Ex = Ey , δ = ±π/2 107 5.3.2 Jones-Kalkül Dieses Kalkül ist nützlich, um die Änderung des Polarisationszustandes bei Durchgang durch optische Elemente zu berechnen. Polarisationszustand J, normiert j opt. Element Matrix −→ T J= = Ex exp (iϕx ) Ey exp (iϕy ) Ex2 + Ey2 exp (iϕx ) = mit tan Ψ = Ex2 + Ey2 exp (iϕx ) √ √ Ex Ex2 +Ey2 Ey Ex2 +Ey2 jx jy exp (iδ) Ey Ey Ex , sin Ψ = 2 , cos Ψ = 2 2 Ex Ex + Ey Ex + Ey2 cos Ψ j= sin Ψ exp (iδ) Kennt man jx und jy folgen daraus Ex , Ey , δ. Beispiele: a) lineare Polarisation δ = nπ jlin = cos Ψ ± sin Ψ b) zirkulare Polarisation δ = ±π/2, Ex = Ey Ψ = π/4 1 1 1 1 , jzr = √ jzl = √ i 2 2 −i Definition der Orthogonalität: ∗ ∗ j1 j∗2 = j1x j2x + j1y j2y = δ12 z.B. lin. polarisiert (x und y), zirkular (rechts, links) Zerlegung jedes beliebigen Polarisationszustandes nach diesen orthogonalen Zuständen: 108 j = αj1 + βj2 α = j∗1 j, β = j∗2 j, Durchrechnen durch optische Elemente: · jin jout = T Bei Anwendungen oft Koordinatentransformation (Drehung) nötig. ·j j =R = R (−Θ) · T ·R (Θ) T = R cos Θ sin Θ − sin Θ cos Θ 109 Kapitel 6 Grundzüge der Kristalloptik Normalmoden in homogenen, anisotropen Medien 6.1 Suszeptibiltäts- und Dielektrizitätstensor Bisherige Annahme der Isotropie (Richtungsunabhängigkeit der optischen Eigenschaften) von Materialen fallenlassen. In vielen optischen Materialien (insbesondere Kristalle) hängen die Polarisierbarkeiten (Auslenkungen) von der Richtung des Feldes ab, da die Atome periodisch, aber mit unterschiedlichen Symmetrien angeordnet sind Anisotropie. Beispiele: Lithiumniobat −→ elektro-optisches Material Quarz −→ Polarisatoren Flüssigkristalle −→ Anzeigeelemente, NLO MQW −→ Optoelektronik Wir beschränken uns hier auf eine Frequenz- (Monochromasie) und eine Ortsfrequenzkomponente (ebene Welle), die Ergebnisse sind zu verallgemeinern bei Anwendung der im isotropen Medien benutzten Methoden (Fouriertransformation), i.a. jedoch schwieriger. Wir nehmen weiterhin Absorptionsfreiheit an. Im isotropen Material waren elliptisch polarisierte, ebene monochromatische Wellen die Normalmoden. Im folgenden sollen die Normalmoden des anisotropen Mediums identifiziert werden. Mit Hilfe dieser Normalmoden kann man sich dann jede beleibige raum-zeitlich begrenzte Lösung aufbauen. bisher: P(r, ω) = ε0 χ (ω) E(r, ω) D(r, ω) = ε0 ε (ω) E(r, ω) Im folgenden wird E durch E usw. ersetzt, da nur eine Frequenzkomponente betrachtet wird 110 jetzt: Pi (r, ω) = ε0 3 j=1 ! χij (ω) Ej (r, ω) = ε0 χij (ω)Ej (r, ω) Tensorkomponenten P E, χij - wiederspiegelt die Kristallstruktur −→ jedoch nicht mikroskopisch wegen unterschiedlicher Längenskalen (Optik - 5 · 10−7 m,Kristall - 5 · 10−10 m das Feld spürt periodische Anordnung nicht im einzelnen, aber Symmetrien des Kristalls analog: Di (r, ω) = ε0 εij (ω)Ej (r, ω) D(r, ω) = ε0 ε(ω)E(r, ω) DE χ = (χij )- Suszeptibilitätstensor ε = (εij ) - Dielektrizitätstensor −→ im folgenden benutzt oftmals auch inverser Tensor σ D(r, ω) ε0 E(r, ω) = σ σ = [ ε]−1 = (σij ) Eigenschaften: · σij , εij · εij = εji , σij = σji −→ reell im Transparenzgebiet (ω weggelassen,nicht vergessen). −→ Tensoren sind symmetrisch, nur noch 6 Komponenten, d.h. Tensor Beweis: Aus Maxwell-Gleichungen im Fourierraum folgt: ε∗ E∗ − µ0 H∗ H) + j∗ E = 0 div (E × H∗ ) − iω (E Für ein verlustfreies Medium gilt div S = 12 [div (E × H∗ )] = 0 und damit ε∗ E∗ ) = 0 (iE ε∗ E∗ ) = − (E Gilt für jedes beliebige E-Feld, also auch wenn nur Ex = 0 |Ex |2 (ε∗xx ) = 0 111 In analoger Weise gilt das für εyy und εzz , d.h. alle Diagonalelemente des Tensors sind reell. Nutzt man dieses Ergebnis aus gilt z.B. weiterhin (: ε∗xy Ex Ey∗ + ε∗yx Ey Ex∗ = ε∗xy − εyx Ex Ey∗ = 0 −→ ε∗xy = εyx . Dieses Ergebnis kann man auf alle εij verallgemeinern. Damit ist gezeit, daß der dielektrische Tensor hermitisch ist. (analog gilt das für χij und σij ) · Transformation auf Hauptachsen möglich −→ hier für σij zeigen Richtungen gesucht, wo D E σij Dj = ε0 Ei = λDi det [σij − λIij ] = 0, Iij = δij Gleichung 3.Ordnung −→ drei Wurzeln λ(α) . Wir setzen (α) σij Dj (α) = λ(α) Dj , (α) um die Eigenvektoren Dj zu bestimmen. Die Eigenvektoren sind orthogonal, da (α) σij Dj (α) (β) = λ(α) Dj , σij Dj (β) = λ(β) Dj und die anschließende Multiplikation ergibt (β) (α) Di σij Dj (α) (β) − Di σij Dj (β) (α) = λ(α) − λ(β) Di Di Die linke Seite verschwindet, da Summationen vertauscht werden können und σij = (β) (α) σji Di Di = 0 für λ(α) = λ(β) . Die Hauptachsenrichtungen spiegeln die Kristallsymmetrien wieder. εij = εi δij , (εij ) = σij = σi δij = 1 δij εi 0 0 ε1 (ω) 0 0 ε2 (ω) 0 0 ε3 (ω) ein anisotropes Medium wird i.a. durch drei verschiedene dielektrische Funktionen charakterisiert (im Hauptachsensystem). In der Regel rechnet man im Hauptachsen(Kristall-) System und führt zum Schluß die Transformation ins Laborsystem durch. 112 6.2 Die optische Klassifikation von Kristallen a) isotrop Es existieren drei kristallographisch äquivalente, senkrechte Achsen −→ kubische Kristalle −→ Gase, amorphe Festkörper, Flüssigkeiten, polykristalline Medien ε1 (ω) = ε2 (ω) = ε3 (ω) −→ Di = ε0 ε (ω) Ei b) optisch einachsig (uniaxial) Es existieren zwei oder mehr kristallographisch äquivalente Achsen in einer Ebene −→ trigonal, tetragonal, hexagonal ε1 (ω) = ε2 (ω) = ε3 (ω) c) optisch zweiachsig (biaxial) Es existieren keine zwei kristallographisch äquivalente Richtungen −→ orthorhombisch, monoklin, triklin ε1 (ω) = ε2 (ω) = ε3 (ω) 6.3 Das Indexellipsoid −→ geometrische Veranschaulichung des inversen dielektrischen Tensors σ Vektor: im physikalischen Raum unabhängig vom Koordinatensystem, einfach im Hauptachsensystem Tensor: Ähnlich ist ein symmetrischer Tensor als Fläche 2. Ordnung darzustellen −→ invariant gegenüber Koordinatentransformationen Darstellung von σ = [ ε]−1 : 3 σij xi xj = 1 i,j=1 113 wegen: 3 σij Di Dj = ε0 i,j=1 3 Ei Di = 2wel i=1 in Hauptachsen: σ1 x21 + σ2 x22 + σ3 x23 = x21 x22 x23 + + =1 ε1 ε2 ε3 → k n3 Dx n1 n2 Dy Abbildung 6.1: Indexellipsoid Das Medium wird durch einen Tensor (statt eines Skalars) beschrieben ; Hauptachsen: √ ε i = ni Degenerierte Fälle: kubisch: Kugel einachsig: rotationssymmetrisch um z−Achse und n1 = n2 6.4 Normalmoden im anisotropen Medium Normalmode: · Lösung der Wellengleichung, die bei der Ausbreitung nur eine raum-zeitliche Phasenänderung erfährt. · die räumliche und zeitliche Phasenänderung hängen über eine Dispersionsrelation ω = ω(k) oder k = k(ω) zusammen. 114 Isotropes Medium: Normalmode −→ monochromatische ebene Welle E(r, t) = Eω exp {i [k (ω) r−ωt]} ω2 ε(ω) c2 bei reellem ε(ω) > 0 und mit kEω = kDω = 0. Die Welle ist i.a. elliptisch polarisiert, der Polarisationszustand bleibt bei der Ausbreitung erhalten. k2 (ω) = −→ jetzt Suche nach Normalmoden im anistropen Medium. Im Hauptachsensystem ist deren Berechnung einfach. 6.4.1 Normalmoden bei Ausbreitung in Hauptachsen Annahme: Hauptachsen in x, y, z −→ kDω = kEω = 0, Ausbreitung in z - Richtung (k −→kz ), Dx , Dy = 0 Di = ε0 εi Ei −→ Achtung keine Summation Feld beliebig in x, y−Ebene: D1 , ε1 D1 exp [i (k1 r−ωt)] = D1 exp [iϕ1 ] exp (iωt) mit k21 = D2 , ε2 D2 exp [i (k2 r−ωt)] = D2 exp [iϕ2 ] exp (iωt) mit k22 = ω2 ε1 (ω) c2 ω2 ε2 (ω) c2 −→ E D −→ elliptische Polarisation keine Normalmode −→ Polarisationszustand ändert sich bei der Ausbreitung wegen δ = ϕ2 − ϕ1 = (k2 − k1 ) z. Jedoch wenn Feld in jeweils einer Hauptachse polarisiert −→ Normalmode D(a) = {D1 exp [i (ka r−ωt)]} e1 −→ k2a = ω2 2 na = k21 −→ Normalmode a 2 c D(b) = {D2 exp [i (kb r−ωt)]} e2 −→ k2b = ω2 2 nbk = k22 −→ Normalmode b 2 c −→es existieren zwei senkrecht zueinander, linear polarisierte Normalmoden, −→ E D. 115 6.4.2 Normalmoden bei beliebiger Ausbreitungsrichtung −→ Dispersionsrelation 6.4.2.1 Geometrische Konstruktion I · · · · · · · 6.4.2.2 Vorgabe von ω und Kristall −→ εi −→ Indexellipsoid bekannt Vorgabe der Ausbreitungsrichtung −→ k/k Ebene durch Ursprung des Indexellipsoids und senkrecht zu k zeichnen −→Schnittfläche ist Ellipse −→ Indexellipse Die Halbachsen dieser Ellipse sind die Brechzahlen na , nb der Normalmoden in dieser Ausbreitungsrichtung −→ ka = ωc na , kb = ωc nb Die Richtungen der Halbachsen −→ Polarisationsrichtungen von D(a) und D(b) an. (a) D (a) (b) D (b) E(a) und E(b) folgen aus Ei = ε0iεi , Ei = ε0iεi damit D(a,b) E(a,b) und E(a,b) nicht ⊥ zu k. Ellipse −→ Kreis, Richtungdes k- Vektors definiert die optischen Achse. Ableitung der Dispersionsrelation isotropes Medium: Dispersionsrelation: Die Länge des k- Vektor ist nicht von der Richtung abhängig. ω2 k (ω) = 2 ε(ω) c 2 Feld der Normalmode: 116 E(r, t) = Eω exp {i [k (ω) r−ωt]} D(r, t) = Dω exp {i [k (ω) r−ωt]} elliptisch polarisiert anisotropes Medium: Normalmode wird wieder eine ebene, monochromatische Welle ∼ exp {i [k (ω) r−ωt]} sein. Im anisotropen Medien wird jedoch die Länge des k-Vektors i.a. neben der Frequenz auch noch von der Ausbreitungsrichtung abhängen (Dispersionsrelation). Darüberhinaus wurde schon deutlich, daß die Polarisation der Normalmode nicht elliptisch sein wird. Um die Richtungsabhängigkeit zu erfassen. schreiben wir den k-Vektor komponentenweise auf: k1 u1 k = k2 = k u2 mit u21 + u22 + u23 = 1 k3 u3 Ziel: ω = ω(k1 , k2 , k3 ) oder ω = ω(k, u,1 u2 , u3 ) oder k = k(ω, u1 , u2 , u3 ) zusammen. Maxwell-Gleichungen: kDω = 0 k × Eω = ωµ0 Hω kHω = 0 k × Hω = −ωDω 1 S = (Eω × H∗ω ) 2 k ∦ S, S ⊥ Eω jetzt Index ’ω weglassen ω2 1 − [k× (k × E)] = 2 D c ε0 −k (k · E) +k2 E = 117 ω2 1 D c2 ε0 im Hauptachsensystem Di = ε0 εi Ei −ki kj Ej + k 2 Ei = j ω2 εi Ei c2 ω2 2 E ε − k = −k kj Ej i i i c2 j für isotrope Medien wird die rechte Seite zu Null. Eigenwertgleichung: ω2 ε c2 1 − k22 − k32 k2 k1 k3 k1 k1 k2 ω2 ε − k12 − k32 c2 2 k3 k2 k1 k3 E1 0 E2 0 = k2 k3 2 ω E3 0 ε − k22 − k32 c2 3 Aus det [..] = 0 folgt die gewünschte Dispersionsrelation ω = ω(k) für vorgegebenen ki /k. Hier einfacheren Weg: ki kj Ej ε − k2 j c2 i Ei = − ω2 Multiplikation mit ki und Summation über ’i’ ergibt bei Subsitution i ←→ j auf der linken Seite kj Ej = − j da div E = j i ki2 kj Ej , ε − k2 j c2 i ω2 kj Ej =0 folgt daraus die Dispersionsrelation i ki2 =1 2 k 2 − ωc2 εi 118 u1 k1 u1 mit k2 = k(ω) u2 = ωc n(ω) u2 können wir schreiben k3 u3 u3 i k 2 u2i =1 2 k 2 − ωc2 εi i i u2i =1 1 − nεi2 1 u2i = 2 2 [n (ω) − εi (ω)] n (ω) Damit ergibt sich für vorgegebene εi (ω) und Richtungskosinus’ (u1 , u2 , u3 ) die Brechzahl n (ω, u1 , u2 , u3 ) (eigentlich n (ω, u1 , u2 ), da u21 + u22 + u23 = 1), die die Normalmode sieht. Explizit ergibt sich: u21 n2 − ε2 n2 − ε3 n2 + u22 n2 − ε1 n2 − ε3 n2 + u23 n2 − ε1 n2 − ε2 n2 = n2 − ε 1 n2 − ε 2 n2 − ε 3 −→ quadratische Gleichung in n2 (n6 -Term verschwindet) −→ zwei Lösungen na , nb und damit ka = ωc na , kb = ωc nb für die beiden senkrecht zueinander polarisierten Normalmoden D(a) und D(b) . speziell: Ausbreitung in einer Hauptachse −→ u3 = 1 (siehe Kapitel 6.3.1): n2 − ε 1 n2 − ε 1 n2 − ε 2 n2 = n2 − ε 1 n2 − ε 2 n2 − ε 3 n2 − ε2 ε3 = 0 −→ n2a = ε1 , n2b = ε2 Geometrische Interpretation II - Die Normalenfläche k ui = nui ) −→ Normalenfläche −→ centrosymGleichung einer Fläche im ki -Raum ( ω/c metrische, aus zwei Blättern bestehende Fläche −→ schneidet jede Hauptebene als Kreis und Ellipse. biaxial: 4 Schnittpunkte der Flächen −→ Verbindungslinien ergeben die zwei optischen Achsen. uniaxial: Rotationsellipse und Kugel −→ 2 Schnittpunkte in den Polen −→ Verbindungslinie ergibt die optische Achse (wenn ε1 = ε2 = n2or , ε3 = n2e ), dann ist z-Achse die optische Achse kubisch: Kugel 119 Abbildung 6.2: (a) zweiachsiger; (b) einachsiger; (c) isotroper Kristall Vorgehen: · Richtung festlegen (u1 , u2 ) −→ Schnittpunkte mit Oberfläche · Abstand Zentrum - Schnittpunkt ergibt die Brechzahlen der Normalmoden · in der optischen Achse −→ na = nb −→ damit zwei geometrische Interpretationen: a) Indexellipsoid · · · Richtung festlegen Indexellipse Halbachsen ergeben na , nb (Brechzahlen, die NM sehen) optische Achse dann, wenn Indexellipse zum Kreis entartet bei einachsigen Kristallen ist die optische Achse mit einer Hauptachse identisch b) Normalenfläche · · Richtung festlegen Schnittpunkte mit Normalenfläche Abstände vom Zentrum ergeben na , nb optische Achse verbindet die Schnittpunkte der Blätter Felder: 120 ε0 εi ki Di = − ω 2 kj Ej ε − k2 j c2 i ε1 k1 : ε − k2 c2 1 D1 : D 2 : D 3 = − ω 2 ε2 k2 ω2 ε − c2 2 k2 : ε3 k3 ω2 ε − c2 3 k2 Verhältnis reell −→ Phasendifferenz 0 −→ lineare Polarisation also: Im anisotropen Medium existieren zwei Normalmoden - linear polarisierte ebenen mono c c chromatische Wellen- mit zwei unterschiedlichen Phasengeschwindigkeiten na , nb und zwei senkrecht zueinander stehenden Polarisationsrichtungen bei beliebig vorzugebender Richtung 6.4.3 Einachsige Kristalle −→ trigonal, tetragonal, hexagonal Indexellipsoid ist rotationssymmetrisch um z- Achse ε1 = ε2 = εor = n2or , ε3 = εe = n2e −→ ordentlicher und außerordentlicher Brechungsindex 2 Normalmoden: a) ordentliche Welle −→ n unabhängig von Richtung b) außerordentliche Welle −→ n abhängig von Richtung Die z-Achse ist die optische Achse mit na = nb . Die ordentliche Welle ist senkrecht zur Rotationsachse und zum k-Vektor polarisiert. Die außerordentliche Welle ist senkrecht zum k-Vektor polarisiert und liegt in der Ebene k-VektorRotationsachse. Dispersionsrelation: u21 n2 − εor n2 − εe n2 + u22 n2 − εor n2 − εe n2 + 2 2 2 n − εe +u23 n2 − εor n2 = n2 − εor Division durch n2 ergibt: n − εor 2 u21 + u22 n − εe + 2 u23 n − εor 2 121 (n2 − εe ) (n2 − εor ) − =0 n2 1. Wellenzahl der ordentlichen Welle unabhängig von Richtung n2a = εor −→ ka2 = ω2 2 n = k02 εor c2 a 2. Wellenzahl der außerordentlichen Welle abhängig von Richtung u21 + u22 (n2 − εe ) (n2 − εor ) n2 − εe + u23 n2 − εor = n2 εe εor n2 u21 + u22 + u23 − n2 − u21 + u22 εe − u23 εor + εe + εor − 2 = 0 n εe εor εe 1 − u21 − u22 + εor 1 − u23 − 2 = 0 n u23 1 (u21 + u22 ) + − 2 =0 εe (ω) εor (ω) n (ω) −→ Vorgabe von ui −→ na , nb Man beachte, daß εe , εor in dispersiven Medien Funktionen der Frequenz sind. Geometrische Darstellung als Normalenflächen da ki2 = k02 n2 u2i 1. ordentlich ka2 = k12 + k22 = k02 εor = k02 n2or 2. außerordentlich 1 k32 1 (k12 + k22 ) + =1 εe k02 εor k02 1 (k12 + k22 ) 1 k32 + =1 n2e k02 n2or k02 −→ Rotationsellipsoid, deshalb o.B.d.A. Ausbreitung in y − z−Ebene −→ u1 = 0. Man beachte, daß sich die Größe der Ellipse mit der Frequenz ändert. Einfache Berechnung von n2 (Θ) u23 1 u22 + = 2 εe εor n 122 u2 = sin Θ, u2 = cos Θ sin2 Θ cos2 Θ 1 + = 2 εe (ω) εor (ω) n (ω, Θ) n2 (ω, Θ) = εe (ω) εor (ω) εor (ω) sin2 Θ + εe (ω) cos2 Θ Klassifizierungen: εor > εe −→ negativ einachsig εor < εe −→ positiv einachsig Polarisation der Felder: 1) ordentlich: senkrecht zu Ebenen optischer Achse - k , D ⊥ k, D E 123 2) außerordentlich:senkrecht zu k und in Ebene optische Achse - k D3 = ε0 εe E3 D ⊥ k, D E, da D1 = ε0 ε0r E1 , Bemerkungen zur Ausbreitung von Gaußschen Strahlen Zusammenhang zwischen Dispersionsrelation ←→ Propagationsgleichung: Das Ziel besteht darin, zu zeigen, daß für die außerordentliche Welle die Richtung des k-Vektors nicht mit der Ausbreitungsrichtung eines Gauß-Bündels übereinstimmt. Weiterhin wollen wir zeigen, wie diese Ausbreitungsrichtung mit der Normalenfläche in Zusammenhang steht. Wir erinnern uns an die skalare Helmholtzgleichung für eine Fourierkomponente ∆u(r, ω) + ω2 ε(ω)u(r, ω) = 0 c2 im isotropen Medium. Im Ortsfrequenzraum folgt daraus ω2 2 2 2 − α + β + γ + 2 ε(ω) U (α, β, γ; ω) = 0. c Man kann die Dispersionsrelation der Normalmoden der Helmholtzgleichung ablesen: α2 + β 2 + γ 2 = kx2 + ky2 + kz2 = ω2 ε(ω). c2 Es gilt auch der Umkehrschluß: Kennt man die Dispersionsrelation, findet man die zugehörige Differentialgleichung. Im einachsigen Kristall haben wir die Dispersionsrelation u21 u22 u2 1 + + 3 = 2 εe εe εor n kz2 ω2 kx2 ky2 + + = n2e n2e n2or c2 124 Daraus folgt sofort eine modifizierte Helmholtzgleichung im anisotropen Medium ω2 1 ∂2 1 ∂2 1 ∂2 u(r, ω) + + + u(r, ω) = 0 εe ∂x2 εe ∂y 2 εor ∂z 2 c2 Mit den Transformationen ξ = ne x, η = ne y, ς = nor z erhalten wir eine kugelsymmetrische Helmholtzgleichung für die Ausbreitung im freien Raum 2 ω2 ∂2 ∂2 ∂ u(ξ, η, ς, ω) + + + u(ξ, η, ς, ω) = 0 ∂ξ 2 ∂η 2 ∂ς 2 c2 Für paraxiale Bedingungen ist die Lösung für einen Gaußschen Strahl bei z = 0 1 ω ξ 2 + η 2 u∼ , exp i ς − iz0 2c ς − iz0 wobei ξ und ς darauf hinweisen, daß sich der Strahl in einer beliebigen Richtung in der ξ - ς −Ebene ausbreiten kann. Im Prinzip ist damit das Problem der Ausbreitung eines Gauß-Strahl gelöst, wenn man nur die entsprechende Rücktransformation ausführt. Auf die anfaggs gestellten Fragen haben wir jedoch noch keine Antwort erhalten. Zu diesem Zwecke bedienen wir uns einfacher geometrischer Überlegungen. In den symmetrischen Koordinaten stimmen die Richtungen der Phasenfrontnormalen (Richtung des k-Vektors und des Strahls überein. Man nutzt nun die Transformationsgleichungen, um die Verhältnisse im ’echten’ Raum (x, y, z) darzustellen. Man wähle einen Punkt (x0 , z0 ) auf der Achse des Gaußschen Strahles −→ entspricht einem Punkt (ξ0 , ς0 ) im transformierten System. Es gilt dann tan Θ = z0 ne ς0 ne = = tan ψ, x0 nor ξ0 nor wobei Θ die Richtung der Achse des Gauß-Strahls angibt. Nun betrachtet man die zwei Schnittpunkte mit den Achsen ς = ς1 , ξ = ξ1 . Im realen System hat man dann 125 ξ1 nor ! x1 = = tan β, z1 ς1 ne wobei β den Winkel der Normalen zur Phasenfläche bezeichnet (siehe Abbildung) . Im transformierten System gilt ς0 ξ1 = . ς1 ξ0 Damit erhalten wir tan β = ξ1 nor ς0 nor z0 n2or n2or = = = tan Θ , ς1 ne ξ0 ne x0 n2e n2e tan β n2or = 2 tan Θ ne d.h. Richtung des k-Vektors und Strahlrichtung stimmen nicht überein (walk off). Jetzt bleibt noch, eine Beziehung der Strahlrichtung zur Normalenfläche herzustellen. Wir gehen zurück zur Dispersionsrelation für die außerordentliche Welle (Ausnutzen der Rotationssysmmetrie und Weglassen des ky -Terms) kx2 kz2 ω2 + = , n2e n2or c2 die Normalenfläche ist eine Ellipse, deren Tangente gegeben ist durch kx n2or dkz =− , dkx kz n2e was zur Normalen − dkx kz n2e n2e = = tan β = tan Θ, dkz kx n2or n2or führt, d.h., die Richtung des Gaußschen Strahles steht senkrecht auf der Normalenfläche. Diese Richtung ist gleichzeitig die Richtung des Poyntingvektors, da die Gruppengeschwindigkeit gegeben ist mit vg = ∇k ω und damit ebenfalls senkrecht auf der Fläche mit konstantem ω (Normalenfläche) steht.. · · · · Die Strahlachse eines Gauß-Strahl stimmt mit der Richtung der Gruppengeschwindigkeit und des Poyntingvektors überein, i.e. senkrecht zu Normalenfläche. Damit stimmt bei außerordentlichen Strahlen die Richtung des k− Vektors nicht mit der Richtung der Strahlausbreitung überein. Damit stimmen auch die Richtungen von ordentlichen und außerordentlichen Strahlen nicht überein −→ walk off. Übereinstimmung besteht nur bei Ausbreitung in Richtung der Hauptachsen. 126 Kapitel 7 Optische Felder in isotropen, dispersiven und stückweise homogenen Medien 7.1 7.1.1 Grundsätzliches Definition des Problems −→ bisher keine echten Grenzflächeneffekte (nur Feld vorgegeben auf Grenzfläche), jetzt werden Reflexion-und Transmissionseigenschaften diskutiert. Physikalische Systeme · Grenzflächen · Schichten · Schichtsysteme Geometrien: · Wechselwirkung von Normalmoden (ebene, monochromatische Wellen) mit beliebigen Vielschichtsystemen −→ Interferometer, dielektrische Spiegel etc. −→ Überlagerung der Normalmoden (Wechselwirkung von raum-zeitlichen begrenzten Feldern mit diesen Geometrien) · ’Einsperren’ dieser Normalmoden in beliebige Wellenleiter −→ neue Normalmoden −→ geführte Wellen −→ beugungsfrei −→ Überlagerung der neuen Normalmoden (Pulspropagation in Wellenleitern) −→ Wellenleiter- oder Intergrierte Optik, Spektroskopie an Oberflächen Vorgehen: • Maxwellsche Übergangsbedingungen an Grenzflächen • Feldberechnung im inhomogenen Medium −→ Matrixmethode • Reflexions - Transmissionsproblem −→ Grenzfläche, Schicht, Schichtsystem, FabryPerot Interferometer 127 • Geführte Wellen −→ Grenzfläche, Film, Streifen, Faser 7.1.2 Grenzflächen und Symmetrien bisher: Homogenität des Raumes −→ exp (ikr) Stationarität −→ exp (−iωt) E(r, t) = Eω exp [i (kr − ωt)] jetzt: Grenzfläche in (y, z) - Ebene, unendlich ausgedehnt 1. k = kx , 0, kz in (x, z) - Ebene −→ Einfallsebene Problem hängt nicht von y - Koordinate ab 2. Homogenität nur noch in z - Richtung zu retten: ∼ exp (ikz z) kz stetig an Grenzflächen E(x, z, t) = Eω (x) exp [i (kz z − ωt)] 3. Polarisation −→ Erinnerung an vorn −→ Translationsinvarian in eine Richtung −→ E = ETE + ETM Gesamtfeld wird zerlegt, unabhängig durchgerechnet und schließlich wieder addiert. ETE TM: 0 0 = Ey = E , 0 0 TE: ETM = Ex , HTE = Hx Ez 0 0 = Hy = H 0 0 −→ kETE = kETM = 0 4. Transversalität 5. Dispersionsrelation in Schicht ’i’: 2 −→ ki2 = kix + kz2 = 2 = kix ω2 εi (ω) c2 ω2 εi (ω) − kz2 2 c 128 Hz HTM 7.1.3 Die Übergangsbedingungen a) Felder Maxwell −→ Et , Ht gehen stetig durch Grenzflächen TE: E und Hz stetig TM: Ez und H stetig a) Wellenzahlvektoren Homogenität in z- Richtung −→ Phase exp (ikz z) −→ kz stetig 7.2 Das Feld im Schichtsystem −→ die Matrixmethode 7.2.1 Das Feld in einer homogenen Schicht Die Schicht sei durch eine dielektrische Funktion εf (ω) charakterisiert und weise die Dicke d auf. Das Ziel besteht darin, bei Vorgabe der Felder bei x = 0 die Felder bei x = d zu berechnen. Dabei beschränkt man sich auf die Tangentialkomponenten, da diese stetig übergehen, und berechnet die Normalkomponenten später. Wir zeigen das im Fourierraum für eine Fourierkomponente E(x, z; ω), H(x, z; ω). TE-Polarisation Feldgleichung (ω und weglassen, aber nicht vergessen): 2 ∂ ∂2 ω2 + + 2 εf (ω) E(x, z) = 0 ∂x2 ∂z 2 c Mit dem Ansatz: E(x, z) = E(x) exp (ikz z) , H(x, z) = H(x) exp (ikz z) folgen aus d2 ω2 2 + 2 εf (ω) − kz E(x) = 0 dx2 c und i rot E(x, z) ωµ0 die beiden Gleichungen für die tangentialen Felder Ey = E, Hz 2 d 2 + kfx E(x) = 0 dx2 HTE (x, z) = − Hz (x) = − i ∂ E(x). ωµ0 ∂x 129 TM-Polarisation In analoger Weise folgt für die tangentialen Komponenten Hy = H, Ez 2 d 2 + kfx H(x) = 0 dx2 Ez (x) = i ∂ H(x). ωε0 ε ∂x ∂ ∂ E(x), ∂x H(x) Damit besteht die Aufgabe darin, jeweils die Felder (E, H)) und Ableitungen ∂x bei x = d aus ihrer Kenntnis bei x = 0 zu bestimmen. Am Ende der Rechnung (alle Schichten) folgt aus H −→ ETM und damit E = ETE + ETM . Aufgrund der identischen Struktur obiger Gleichungen können wir beide Polarisationsrichtungen simultan behandeln, indem wir setzen E, H −→ F iωµ0 Hz , −iωε0 Ez (x) −→ G Damit ergibt sich d2 2 + kfx F (x) = 0 dx2 G(x) = αf ∂ F (x). ∂x mit αfTE = 1, αfTM = 1 . εf Die allgemeine Lösung ergibt sich zu F (x) = C1 exp (ikfx x) + C2 exp (−ikfx x) G(x) = αf ∂ F (x) = ikfx αf [C1 exp (ikfx x) − C2 exp (−ikfx x)] . ∂x F (0) und G(0) werden als bekannt vorausgesetzt. Damit können die unbekannten Koeffizienten C1 und C2 bestimmt werden. Aus F (0) = C1 + C2 G(0) = ikfx αf (C1 − C2 ) 130 folgt 1 i C1 = G(0) F (0) − 2 kfx αf 1 i G(0) . F (0) + C2 = 2 kfx αf Damit ergibt sich die gesucht Lösung für 0 ≤ x ≤ d zu F (x) = cos (kfx x) F (0) + 1 sin (kfx x) G(0) kfx αf G(x) = −kfx αf sin (kfx x) F (0) + cos (kfx x) G(0) 7.2.2 Das Feld im Schichtsystem Dielektrische Schichtsysteme sind häufig benutzte optische Bauelemente (Braggspiegel, gechirpte Spiegel zur Dispersionskompensation, Interferometer, Vielschichtwellenleiter, Braggwellenleiter). Darüberhinaus kann man jede beleibige inhomogene Brechzahlverteilung durch eine Diskretisierung in ein Schichtsystem beliebig genau annähern (wichtig für sog. ’GRIN’ - Graded-Index-Wellenleiter. Unser Ziel besteht darin, die Ergebnisse für eine Schicht auf einen Schichtstapel zu übertragen. Es wirkt sich nun vorteilhaft aus, daß wir für unsere Rechnungen die Feldkomponenten nutzen, die stetig durch die Grenzflächen gehen. Wir können das Feld in der ersten Schicht schreiben als F (x) F (0) =m , G(x) G(0) d.h. eine 2 x 2-Matrix beschreibt die Ausbreitung der Felder 131 (x) = m cos (kfx x) −kfx αf sin (kfx x) 1 kfx αf sin (kfx x) cos (kfx x) . (x) = Speziell gilt am Ende der Schicht x = d. Für absorptionsfreie Medien gilt weiterhinm 1, d.h. die Matrix ist unimodular. Für ein Schichtsystem, charakterisiert durch εi , di , gilt: a) zwei Schichten: F F F 2 (d2 ) 2 (d2 )m 1 (d1 ) =m =m G d1 +d2 G d1 G 0 b) N Schichten: F G = d1 +d2 +..+dN =D = M N i (di ) m i=1 N F G =M 0 F G (7.1) 0 i (di ) m i=1 i haben die gleiche Gestalt und unterscheiden sich nur durch unterAlle Matrizen m i schiedliche kfx , αf , di . Das Verfahren arbeitet folgendermaßen: · Man gebe sich F (0) und G(0) vor (E, Hz für TE, Ez , H für TM) · Die Vorgabe von kz , αfi , di erlaubt die Berechnung der Matrixelemente. · Durch Multiplikation der Matrizen ergibt sich die Gesamtmatrix. · Damit kann man die Felder F (D) und G(D) berechnen. 7.3 Reflexions - Transmissionsproblem an Schichtsystemen 7.3.1 Allgemeines Schichtsystem 7.3.1.1 Reflexions- und Transmissionskoeffizienten - die verallgemeinerten Fresnelschen Formeln Das Ziel besteht darin, reflektiertes und transmittiertes Gesamtfeld in Abhängigkeit vom Einfallswinkel und Frequenz des einfallenden Feldes zu bestimmen. Bisher haben wir nur bestimmte Feldkomponenten von der ersten bis zur letzten Schicht durchgerechnet. Diese Komponenten müssen nun mit den zugänglichen Feldern verknüpft werden. Wir definieren am Anfang die wesentlichen Größen: Wellenzahlvektor des einfallenden (kI ), reflektierten (kR ) und transmittierten (kT ) Feldes: ksx −ksx kcx kI = 0 , kR = 0 , kT = 0 kz kz kz 132 mit ksx = ω2 2 = ε (ω) − k ks2 (ω) − kz2 , s z c2 kcx = ω2 2 = ε (ω) − k kc2 (ω) − kz2 , c z c2 wobei εs (ω) und εc (ω) die dielektrischen Funktionen des Substrats und Claddings sind. Bemerkung zum Reflxions-und Brechungsgesetz: kz ist eine Erhaltungsgröße 1. ks sin ϕI = ks sin ϕR ϕI = ϕR (Reflexionsgesetz) 2. ks sin ϕI = kc sin ϕT ns sin ϕI = nc sin ϕT (Brechungsgesetz) A) Feld im Substrat mit den komplexen Feldamplituden FI , FR . Fs (x, z) = exp (ikz z) [FI exp (iksx x) + FR exp (−iksx x)] (7.2) Gs (x, z) = iαs ksx exp (ikz z) [FI exp (iksx x) − FR exp (−iksx x)] B) Feld im Schichtsystem −→ bekannt durch Matrixmethode Ff (x, z) = exp (ikz z) F (x) (7.3) Gs (x, z) = exp (ikz z) G(x) und F G =M x C) Feld im Cladding 133 F G 0 Fc (x, z) = exp (ikz z) FT exp [ikcx (x − D)] (7.4) Gc (x, z) = iαc kcx exp (ikz z) FT exp [ikcx (x − D)] . Das Ziel besteht nun darin, FR und FT in Abhängigkeit von kz (∼ sin ϕI ), εi , di und N zu berechnen. Dazu nutzen wir Gl.(7.3) und die Tatsache, daß F und G stetig an den Grenzflächen sind. Es gilt F F =M . G D G 0 Setzen wir nun auf der linken Seite das Claddingfeld (7.4) bei x = D und auf der rechten Seite das Substratfeld (7.2) bei x = 0 ein, erhalten wir FT iαc kcx FT = M11 M12 M21 M22 FI + FR iαs ksx (FI − FR ) . Die Lösung des inhomogenen Gleichungssystems ergibt FR = (αs ksx M22 − αc kcx M11 ) − i (M21 + αs ksx αc kcx M12 ) FI (αs ksx M22 + αc kcx M11 ) + i (M21 − αs ksx αc kcx M12 ) (7.5) N FT = 2αs ksx (M11 M22 − M12 M21 ) 2αs ksx FI = FI . N N (7.6) Wir spezifizieren die Resultate (7.5) und (7.6) auf die beiden Polarisationsrichtungen: A) TE - Polarisation Es gilt F = E = Ey , αTE = 1 Damit erhalten wir für das reflektierte Feld ERTE = RTE EITE (7.7) RTE = (ksx M22 − kcx M11 ) − i (M21 + ksx kcx M12 ) (ksx M22 + kcx M11 ) + i (M21 − ksx kcx M12 ) NTE 134 und das transmittierte Feld ETTE = TTE EITE (7.8) TTE = 2ksx , NTE wobei RTE und TTE die komplexen Reflexions- und Transmissionskoeffizienten sind (beeinflussen Amplitude und Phase des einfallenden Feldes). Man beachte, daß die Matrixelemente von der Polarisationsrichtung abhängig sind, d.h. MijTE = MijTM . B) TM - Polarisation Es gilt 1 αTM = . ε Die einfache Durchführung der Rechnung wie bei der TE-Polarisation ist hier nicht korrekt, da wir nicht das Verhältnis der H-Felder (z.B. HR /HI ) sondern das Verhältnis der elektrischen Felder (z.B. ERTM /EITM ) benötigen. Wir müssen deshalb die H-Felder in die E TM −Felder umrechnen. F = H = Hy , Nebenrechnung: kz f kx f ETM Ex kz Ex = − sin ϕ = − TM E k E TM = − k Ex , kz wegen E=− 1 (k × H) ωε0 ε folgt Ex = und schließlich E TM = − und damit 1 kz Hy ωε0 ε k 1 Hy = − √ Hy ωε0 ε ωc ε TM ER,T = EITM εs HR,T , εs,c HI 135 das heißt, der Faktor εs /εc spielt nur bei der Berechnung der Transmissionskoeffizienten eine Rolle. Wenn wir das beachten erhalten wir aus Gl. (7.5), indem wir Zähler und Nenner mit εs εc multiplizieren. ERTM = RTM EITM (7.9) RTM = (εc ksx M22 − εs kcx M11 ) − i (εs εc M21 + ksx kcx M12 ) FI (εc ksx M22 + εs kcx M11 ) + i (εs εc M21 − ksx kcx M12 ) NTM ETTM = TTM EITM TTM √ 2 εs εc ksx = . NTM (7.10) Damit sind die komplexen Reflexions- und Transmissionskoeffizienten (R, T = |R| , |T | exp iϕ)) für beide Polarisationsrichtungen bekannt. Die Amplituden- und Phasenänderung ist i.a. unterschiedlich und abhängig von sin ϕI , εi (ω) , di und N. Dieses Ergebnis findet Anwendung beim Verfahren der Ellipsometrie. Ist das einfallende Licht linear polari TM ◦ TE = EI , ϕITE = ϕITM ), wird das reflektierte oder transmitsiert (z.B.45 −→ EI tierte Feld i.a. elliptisch polarisiert sein. Aus mehreren Messungen ermittelt man dann εi (ω) , di . Die Formeln (7.7) -(7.10) stellen die verallgemeinerten Fresnelschen Formeln für ein beliebiges dielektrisches Vielschichtsystem dar. 7.3.1.2 Bemerkungen zum Reflexions-Transmissionsverhalten von Impulsen mit endlicher Breite Die für eine Normalmode geltenden Formeln (7.7) -(7.10) können auf den wichtigen Fall, daß das einfallende Feld zeitlich und/oder räumlich begrenzt ist, erweitert werden, indem wir unsere Ergebnisse aus Kapitel 2 nutzen. Wir haben jedoch zu beachten, daß die karthesischen Koordinaten x ←→ z vertauscht worden sind. Um Konfusionen zu vermeiden, ersetzen wir die Komponenten des k - Vektors wieder durch (α, β, γ). Hier gilt nun kz ←→ α, ky ←→ β, ks,c,fx ←→ γs,c,f . Der Einfachheit halber nehmen wir an, daß die Haupteinfallsrichtung senkrecht zum Schichtsystem orientiert ist (ϕI = 0). Damit erhalten wir identische Ergebnisse für die Reflektions- und Transmissionskoeffizienten in TE- und TM-Polarisation. Ist die Begrenzung nur in einer Dimension relevant (∞-Ausdehnung in Polarisationsrichtung) ist das Vorgehen exakt. Für eine begrenzte Feldverteilung in beiden Dimensionen hat das Feld eine Komponente in Ausbreitungsrichtung. Für nicht zu enge Bündel (Durchmesses einige zehn Wellenlängen) kann man diese Komponente vernachlässigen. Wir berechnen das Spektrum des einfallenden Feldes zu 136 1 EITE,TM (α, β, ω̄) = (2π)3 ∞ dzdydt EITE,TM (z, y, t) exp [−i (αz + βy − ω̄t)] −∞ Das reflektierte/transmittierte Spektrum berechnet man mit den verallgemeinerten Fresnelschen Formeln (7.7) -(7.10). Es gilt zum Beispiel für die Reflexion des TE-Feldes ERTE (α, β, ω̄) = RTE (α, β, ω̄) EITE (α, β, ω̄) (7.11) [γs M22 (α, β, ω̄) − γc M11 (α, β, ω̄)] − i [M21 (α, β, ω̄) + γs γc M12 (α, β, ω̄)] RTE (α, β, ω̄) = [γs M22 (α, β, ω̄) + γc M11 (α, β, ω̄)] + i [M21 (α, β, ω̄) − γs γc M12 (α, β, ω̄)] mit ω2 2 2 − β2 = ε (ω) − α ks,c,f (ω) − α2 − β 2 . s,c,f c2 Für γs,c,f kann im allgemeinen die Fresnelsche Näherung und die Entwicklung der Dispersionsrelation ks,c,f (ω) verwendet werden γs,c,f = γs,c,f 1 D 2 α2 + β 2 ≈ k0 + ω̄ + ω̄ − . vg 2 2k0 Damit ist das reflektierte Spektrum bekannt. Das Feld ergibt sich dann aus ∞ ERTE dαdβdω̄ ERTE (α, β, ω̄) exp [i (αz + βy − ω̄t)] (z, y, t) = −∞ ∞ dαdβdω̄ RTE (α, β, ω̄) EITE (α, β, ω̄) exp [i (αz + βy − ω̄t)] . = −∞ Analog verfährt man bei der Berechnung des transmittierten Feldes. 7.3.1.3 Reflektivität und Transmissivität Häufig benötigt man man nicht die komplexen Koeffizenten, sondern die Verhältnisse der Energieflüsse (Reflektivität und Transmissivität). Dazu müssen wir den Energiefluß senkrecht zu den Grenzflächen berechnen. Fluß durch eine Fläche x = const. : 1 S ex = (E × H∗ ) ex 2 mit H∗ = 1 (k∗ × E∗ ) ωµ0 137 folgt S ex = 1 1 (k∗ ex ) |E|2 = (kx ) |E|2 . 2ωµ0 2ωµ0 In absorptionsfreien Schichten und Substrat bleibt der Energiefluß erhalten. Es gilt im Substrat Ss ex = 1 ksx |EI |2 − ksx |ER |2 2ωµ0 und im Cladding Sc ex = 1 (kcx ) |ET |2 . 2ωµ0 Ss ex = Sc ex |EI |2 = |ER |2 + (kcx ) |ET |2 . ksx Das Ziel besteht in der Berechnung der globalen Reflektivitäten ρ und Transmissivitäten τ sowie derer für die einzelnen Polarisationsrichtungen. Wir benutzen die Ergebnisse des vorhergehenden Kapitels. TM ER = ETE R + ER , TM ET = ETE T + ET TE 2 TM 2 (kcx ) TE 2 TM 2 ET + ET |EI | = ER + ER + ksx 2 = (kcx ) (kcx ) 2 TE 2 2 2 TM 2 EI EI |RTE | + |TTE | + |RTM | + |TTM | . ksx ksx 2 Das einfallende Feld wird wie folgt zerlegt ETM E d ETE EITE = |EI | cos δ, EITM = |EI | sin δ. 138 Damit ergibt sich (kcx ) (kcx ) 2 2 2 2 2 1 = |RTE | + |TTE | cos δ + |RTM | + |TTM | sin2 δ ksx ksx (kcx ) 1 = |RTE |2 cos2 δ + |RTM |2 sin2 δ + |TTE |2 cos2 δ + |TTM |2 sin2 δ ksx 1=ρ+τ mit ρ = ρTE cos2 δ + ρTM sin2 δ τ = τTE cos2 δ + τTM sin2 δ und ρTE,TM = |RTE,TM |2 , τTE,TM = (kcx ) |TTE,TM |2 . ksx Damit kann man alle relevanten Größen berechnen, wenn die Reflektions- und Transmissionskoeffizienten und der Polarisationszustand am Eingang bekannt sind. 7.3.2 Die einfache Grenzfläche 7.3.2.1 Fresnelsche Formeln Wir erinnern uns an die relevanten Wellenzahlvektoren ksx −ksx kcx kR = 0 , kT = 0 . kI = 0 , kz kz kz Die stetige Komponente ergibt sich zu ω√ ω εs sin ϕI = ns sin ϕI. c c Damit kann man die entsprechenden x-Komponenten von k schreiben als kz = kix = ω2 εi − kz2 = c2 ksx = ω ns cos ϕI , c ω2 ω ω2 ε − εs sin2 ϕI = i 2 2 c c c kcx = 139 ω c n2i − n2s sin2 ϕI n2c − n2s sin2 ϕI , d.h. ksx ist immer reell, während kcx für nc < ns sin ϕI imaginär wird (Totalreflexion). Mit der ’Schichtmatrix’ 1 0 −→ 0) = m(d 0 1 ergeben sich die Reflexions- und Transmissionskoeffizienten. A) TE-Polarisation RTE (ksx − kcx ) ns cos ϕI − nc cos ϕT ns cos ϕI − n2c − n2s sin2 ϕI = = = (ksx + kcx ) ns cos ϕI + nc cos ϕT ns cos ϕI + n2c − n2s sin2 ϕI TTE = 2ksx 2ns cos ϕI 2ns cos ϕI = = (ksx + kcx ) ns cos ϕI + nc cos ϕT ns cos ϕI + n2c − n2s sin2 ϕI ρTE |ksx − kcx |2 = |RTE | = |ksx + kcx |2 τTE = 2 (kcx ) 4ksx (kcx ) |TTE |2 = . ksx |ksx + kcx |2 ρTE + τTE = 1 140 A) TM-Polarisation RTM (ksx εc − kcx εs ) nc cos ϕI − ns cos ϕT ns n2c cos ϕI − n2s n2c − n2s sin2 ϕI = = = (ksx εc + kcx εs ) nc cos ϕI + ns cos ϕT ns n2c cos ϕI + n2s n2c − n2s sin2 ϕI TTM √ 2ksx εc εs 2ns cos ϕI 2n2s nc cos ϕI = = , == 2 (ksx εc + kcx εs ) nc cos ϕI + ns cos ϕT ns n2c cos ϕI + n2s n2c − n2s sin ϕI und damit ρTM = |RTM |2 = τTM = |ksx εc − kcx εs |2 , |ksx εc + kcx εs |2 (kcx ) 4ksx (kcx ) εs |εc | |TTM |2 = . ksx |ksx εc + kcx εs |2 Widerspruch für ϕI = 0 ? Es gilt RTE = −RTM , TTE = TTM . Warum? 7.3.2.2 Totalreflexion 141 Bedingung: kcx = 0 nc = ns sin ϕI sin ϕItot = nc . ns Für ϕI > sin ϕItot gilt dann ω ω2 n2s sin2 ϕI − n2c = iµc = i kz2 − 2 εc imaginär. kcx = i c c Totalreflexion tritt auf, wenn (kcx ) = 0. Das gilt für beide Polarisationsrichtungen in gleicher Weise. Für die Energieflüsse gilt (hier TE): ρTE 2 |ksx − iµc |2 Z = = =1 |ksx + iµc |2 Z ∗ τTE = 4ksx (kcx ) = 0. |ksx + kcx |2 Für Metalle ( (εc ) < 0, (εc ) << | (εc )| tritt immer Totalreflexion auf kein Grenzwinkel. (εc ) << | (εc )| führt zu einer kleinen Verschiebung des Grenzwinkels und zu einer Verschmierung des abrupten Übergangs. Da der Reflexionskoeffizient komplex ist, kommt es bei der Totalreflexion zu einer Phasenverschiebung. A) TE-Polarisation 142 RTE = 1 · exp (iΘTE ) = ksx − iµc Z exp (iα) = ∗ = = exp (2iα) ksx + iµc Z exp (−iα) µc Θ =− tan α = tan TE = − 2 ksx n2s sin2 ϕI − n2c sin2 ϕI − sin2 ϕItot =− . ns cos ϕI cos ϕI B) TM-Polarisation Entsprechend gilt für TM-Polarisation RTM = 1 · exp (iΘTM ) = tan α = tan ksx εc − iµc εs Z exp (iα) = ∗ = = exp (2iα) ksx εc + iµc εs Z exp (−iα) µc εs εs Θ ΘTM =− = tan TE , 2 ksx εc εc 2 d.h. |ΘTM | > |ΘTE | , linear polarisiertes Licht wird bei Totalreflexion elliptisch polarisiert Fresnelsches Prisma 143 Das Feld im Cladding ist evaneszent ∼ exp (ikz z) exp (−µc z) . Der mittlere Energiefluß ins Cladding verschwindet Sx = 7.3.2.3 1 1 k |E|2 x = (kx ) |E|2 = 0. 2ωµ0 2ωµ0 Der Brewster-Winkel Für TM-polarisiertes Licht gibt es einen zweiten ausgezeichneten Winkel −→ Brewsterwinkel ϕB . Dort verschwindet der Reflexionskoeffizient −→ RTM = 0, d.h., es muß gelten ksx εc = kcx εs ε2c εs − sin2 ϕB εs = ε2s εc − sin2 ϕB εs sin2 ϕB = εs εc (εs − εc ) εc = 2 2 εs (εs − εc ) (εs + εc ) tan ϕB = εc . εs Der Brewster-Winkel existiert für ns ≶ nc . Physikalische Interpretation: tan ϕB = sin ϕB nc = cos ϕB ns π ns sin ϕB = nc cos ϕB = nc sin − ϕB 2 π ns sin ϕB = nc sin ϕT ϕT = − ϕB , 2 d.h., Wellenzahlvektoren der reflektierten und transmittierten Welle stehen senkrecht aufeinander keine Abstrahlung in Richtung der potentiellen reflektierten Welle. 144 7.3.2.4 Folgerungen aus spezifischem Reflexionsverhalten 1. ϕI = ϕB 2. ϕI > ϕtot 7.3.2.5 reflektiertes Licht ist vollständig TE-polarisiert bei beliebig polarisiertem Eingangsfeld EI ΘTE = Θ TM , aber |RTE | = |RTM | für lin.pol.einfallende Welle (45◦ ) EITE = EITM ERTE = ERTM , aber in Abhängigkeit vom Material ist ein Winkel zu finden, wo ∆Θ ≈ 45◦ , d.h., zweimalige Totalreflexion gibt zirkular polarisiertes Licht. Der Goos-Hänchen-Shift −→ Totalreflexion endlicher Bündel an Grenzflächen (hier für TE-Polarisation zeigen) Ebene Welle: EI (x, z) = EI exp [i (ksx x + kz z)] −→ EI (x, z) = EI exp [i (αz + γs x)] ER (x, z) = EI exp [i (αz − γs x)] exp [iΘ (α)] mit ω α = ns sin ϕI , c γs = ω2 2 n − α2 . c2 s −→ wichtig für das folgende ist, daß die Phasenverschiebung vom Einfallswinkel (transversale Wellenzahl) abhängt. Bündel: EI (x, z) = dαeI (α) exp [i (αz + γs x)] Da schräger Einfall mit Haupteinfallswinke α0 = ωc ns sin ϕI0 α = α0 + ε nur Integration über nichtverschwindene Spektralamplituden EI (x, z) = exp (iα0 z) −∆ ER (x, z) = exp (iα0 z) ∆ dεeI (ε) exp [i (εz + γs x)] ∆ −∆ dεeI (ε) exp [i (εz − γs x)] exp [iΘ (α0 + ε)] . 145 Annahmen: · Reflexion an der Grenzfläche x = 0. · da Divergenz des Strahles klein −→ alle Fourierkomponenten totalreflektiert. Damit kann die Phasenverschiebung entwickelt werden ∂Θ ε = Θ (α0 ) + Θ ε Θ (α0 + ε) ≈ Θ (α0 ) + ∂α α0 und wir erhalten ER (0, z) = exp {i [α0 z + Θ (α0 )]} ∆ −∆ dεeI (ε) exp [i (z + Θ ) ε] exp {i [α0 z + Θ (α0 )]} EI (z + Θ ) . −→ der reflektierte Strahl ist um d = −Θ verschoben (Goos-Hänchen Shift). Berechnung dieser Verschiebung: von vorn: 2 α2 − ωc2 n2c Θ = −2 arctg ω2 2 n − α2 c2 s −→ Θ |α0 = −2 1 ω2 2 n − α02 α02 − c2 s α0 Θ |α0 = −d = −2 tan xET mit xET = wobei xET als Eindringtiefe interpretiert werden kann tan ϕI0 = 146 ω2 2 n c2 c d/2 . xET = −2 tan ϕI0 1 1 = µc α02 − 1 µc ω2 2 n c2 c , 7.3.2.6 Bemerkungen zur Metallrefelxion und Doppelbrechung A) Metallreflexion Wir setzen ein ’ideales’Metall (freie Elektronen ohne Stöße) im Cladding voraus: ωp2 , ω2 wobei im optischen Spektralbereich (ωp > ω) εc (ω) < 0 gilt. Damit gilt für alle Einfallswinkel ω2 µc = |εc (ω)| + kz2 , c2 d.h. an Metallgrenzflächen tritt immer Totalreflexion auf, unabhängig vom Einfallswinkel. Die Eindringtiefe µ1c ist immer kleiner als bei Dielektrika. B) Doppelbrechung an anisotropen Medien (einachsig) εc (ω) = 1 − z. B. : ns = 1 (isotrop), nc −→ ncor und nce Prinzip: Stetigkeit von kz ns sin ϕI = ncor sin ϕTor nce (ϕTor ) sin ϕTe Doppelbrechung von Strahlen: Wenn die Hauptausbreitungsrichtung nicht in einer Hauptachse liegt, stimmen im anisotropen Medium die Richtungen von k und S nicht überein (walk off). 147 7.3.3 Die optische Schicht 7.3.3.1 Reflexions- und Transmissionskoeffizienten Wir beziehen uns auf folgende Geometrie und beschränken uns der Eifachheit halber auf TE-Polarisation (TM analog aus Kapitel 7.3.1) Aus den Gln.(7.7) und (7.8) folgt mit = m(d) M = RTE cos (kfx d) −kfx sin (kfx d) 1 kfx sin (kfx d) cos (kfx d) sin 2δ (ksx − kcx ) cos + i kfx − , = δ δ ksx kcx sin (ksx + kcx ) cos − i kfx + 2 kfx 2 N δ 2 TTE = ksx kcx kfx 2ksx , N wobei δ = kfx d. 2 Für die Reflektivität und Transmissivität ergibt sich damit ρTE = |RTE |2 τTE = kcx |TTE |2 . ksx Für absorptionsfreie Filme gilt natürlich: ρTE + τTE = 1 148 und 2 τTE 2 + kfx + sin2 2δ − 4kcx ksx = 2 ksx kcx δ 2 2 δ (ksx + kcx ) cos + kfx + sin2 2 kfx 2 . N 4kcx ksx = N (ksx + kcx ) ρTE cos2 2δ ksx kcx kfx Reflektivitäten und Transmissivitäten sind phasenempfindlich (Resonatoren). Daraus ergeben sich die bekannten Anwendungsfälle. a) λ/2-Schichten δ = kfx d = mπ, 2 d=m λ 2nf 1 − kz2 kf2 −→ ⊥−→ d = m λ 2nf mit sin 2δ = 0, cos 2δ = ±1 folgt dann ρTE = (ksx − kcx )2 −→ wie Grenzfläche. (ksx + kcx )2 Mit ksx = kcx ergibt sich ρTE = 0 −→ Antireflexionsschicht. b) λ/4-Schichten δ π = kfx d = (2m + 1) 2 2 d = (2m + 1) λ 4nf 1 − kz2 kf2 −→ ⊥−→ d = (2m + 1) λ 4nf mit sin 2δ = 1, cos 2δ = 0 folgt dann ρTE kfx − = kfx + ksx kcx kfx ksx kcx kfx 2 2 und für senkrechten Einfall ρTE = (n2f (n2f 1− − ns n c ) = 2 + ns nc ) 1+ 2 ns nc n2f ns nc n2f 2 2 , d.h. für n2f >> ns nc wird die Reflektivität maximiert, beträgt bei ns = nc = 1, nf = 2 jedoch nur 35%. Die Idee besteht nun darin λ/4-Schichten hintereinander anzuordnen. Fügt man eine zweite Schicht mit nf = 1.5 hinzu, erhält man mit 5 solchen Doppelschichten eine Reflektivität von 95%. Solche dielektrischen Schichtsysteme spielen eine große praktische Rolle und werden als Laser- oder Resonatorspiegel (Braggspiegel) eingesetzt. Wir kommen später auf diesen Punkt zurück. 149 7.3.3.2 Der optische Tunneleffekt Analog zum Tunneleffekt in der Quantenmechanik kann Licht durch dünne Filme tunneln, wenn eigentlich die Bedingungen der Totalreflexion erfüllt sind, also εf < 0 oder εf < εc, εs und ϕI > ϕTot Wir erhalten also k 2 − ω22 εf (ω), z kfx = iµf = i 2 c ω |ε | + k 2 , f c2 z Dielektrikum . Metall Für eine symmetrische Anordnung εc = εs und sin (iµf d) = i sinh (µf d) , cos (iµf d) = cosh (µf d) ergibt sich dann für den Transmissionskoeffizienten mit Γ = µf d 1 TTE = − µ2f ) sinh Γ 2ksx µf C 2 = exp Γ + exp (−Γ) − iC [exp Γ − exp (−Γ)] cosh Γ − i = 2 (ksx 2 exp (−Γ) . (1 − iC) + (1 + iC) exp (−2Γ) 150 Damit folgt für die Transmissivität τTE = C 2 ) (1 4 exp (−2Γ) + exp (−4Γ)) + 2 (1 − C 2 ) exp (−2Γ) (1 + 4 ≈ exp (−2Γ) . (1 + C 2 ) Für Γ = µf d ∼ 1 erhalten wir τTE ∼ 0.1. Für einen Metallfilm mit |εf | = 10 folgt bei senkrechtem Einfall 2π λ Γ= |εf |d 1 d . λ 20 Das Licht kann also durch extrem dünne Filme ’tunneln’, wenn es eigentlich totalreflektiert werden müßte. Anwendungen ergeben sich für die Nahfeldmikroskopie bei Auflösungen unterhalb der Wellenlänge. 7.3.4 Periodische Vielschichtsysteme - Bragg-Spiegel Periodische Strukturen spielen in der Physik eine große Rolle (Kristalle, Supergitter, atomare Ketten, Arrays von Wellenleitern). Periodische Anordnungen von Schichten werden als Bragg-Spiegel bezeichnet. Die Reflektivität dieser Spiegel ist in bestimmten Frequenzbereichen nahezu ’1’ und wächst mit der Anzahl der Schichten und dem Brechzahlkontrast zwischen den Schichten. Braggspiegel werden in Resonatoren (Laser, Interferometer) eingesetzt. Ändert sich die Periode (z. b. linear) nennt man die Spiegel gechirpt. Solche Spiegel werden zur Dispersionskompensation in Nachrichtenübertragungsstrecken und bei der Erzeugung ultrakurzer Impulse (einige fs) eingesetzt. 151 Wir wollen hier die Grundlagen der Braggreflexion verstehen und betrachten ein halbunendliches periodisches Vielschichtsystem [x > 0, (ε1 , d1 ) , (ε2 , d2 )] und setzen TEPolarisation und Monochromasie voraus. Von vorn wissen wir, daß an der Grenzfläche Substrat-Braggspiegel (x = 0) gelten muß: EI + ER = E0 ∂E = E0 , iksx (EI − ER ) = ∂x 0 (7.12) damit ergibt sich für die Reflektivität 2 ksx E0 + iE0 2 ER , ρ = = EI ksx E0 − iE0 (7.13) d. h., Totalreflexion tritt auf, wenn E0 reell ist. Die Aufgabe besteht nun darin, das Feld im Vielschichtsystem zu berechnen. Für endliche Systeme muß die Matrixmethode und die numerische Lösung des Problems herangezogen werden. Ist das periodische Medium unendlich ausgedehnt (Analogie zum eindimensionalen Kristall), kann man vom BlochTheorem (siehe Festkörperphysik) Gebrauch machen. Das periodische Vielschichtsystem kann charakterisiert werden durch ε(x) = ε(x + Λ), wobei Λ = d1 + d2 die Periode darstellt. Das Bloch-Theorem sagt aus, daß nun jede Lösung die Gestalt E(x, z; ω) = exp {i [kx (kz , ω) x + kz z]} Ekx (x) mit Ekx (x + Λ) = Ekx (x) annimmt. kx ist der sog., bislang unbekannte, Blochvektor. Natürlich unterscheidet sich der zu bestimmende Zusammenhang zwischen kx , kz und ω von der Volumendispersionsrelation ω2 2 kx = 2 ε (ω) − kz2 . c Zur Vereinfachung der Schreibweise setzen wir im folgenden kx = K. Das Feld trägt den Index ’K’,.d.h., zu jeder Lösung der Dispersionsrelation gehört ein anderes Feld. Die Felder am Anfang der N −ten und (N + 1) −ten Schicht sind damit folgendermaßen verbunden (wir lassen den Index weg) E E = exp (iKΛ) . E Nd E (N+1)d Andererseits können wir die Felder unter Benutzung der Matrixmethode verbinden E E =M (7.14) E (N+1)d E Nd 152 =M (d2 ) M (d1 ), wobei Mij = ! M (2) M (1) . Gleichsetzen ergibt mit M ik kj k # E " exp (iKΛ) I M− =0 E Nd (7.15) und mit µ = exp (iKΛ) erhält man wegen " # I = 0 det M−µ die vorläufige Dispersionsrelation (eigentlich ist K) zu bestimmen $ 2 (M11 + M22 ) (M11 + M22 ) ± − 1. µ= 2 2 (7.16) Bevor wir uns näher mit dieser Dispersionsrelation beschäftigen, bestimmen wir aus Gl.(7.15) das Feld und die Ableitung E 1 ENd . = (µ − M11 ) /M12 E Nd 153 Setzen wir N = 0, folgt aus Gl.(7.13) , daß für Totalreflexion E0 und damit µ reell sein muß, d.h. (M11 + M22 ) ≥1 2 mit M11 = cos (k1x d1 ) cos (k2x d1 ) − k2x sin (k1x d1 ) sin (k2x d1 ) k1x M22 = cos (k1x d1 ) cos (k2x d1 ) − k1x sin (k1x d1 ) sin (k2x d1 ) . k2x Die explizite Dispersionsrelation ergibt sich aus Gl.(7.16) mit µ = exp (iKΛ) = cos (KΛ) + i sin (KΛ) = cos (KΛ) − {cos (KΛ)}2 − 1 zu cos {K (kz , ω) Λ} = (M11 + M22 ) 2 2 und ersetzt damit die Volumendispersionsrelation kx2 = ωc2 ε (ω) − kz2 . Folgende Schlußfolgerungen lassen sich aus der Dispersionsrelation ziehen: 1. Für die obige Bedingung für Totalreflexion (µ reell) wird der Blochvektor komplex mit {K (kz , ω) Λ} = nπ und $ 2 (M + M ) (M11 + M22 ) 11 22 n {K (kz , ω) Λ} = ln (−1) − 1 . ± 2 2 2. Komplexer Wellenzahlvektor bedeutet Dämpfung. Damit ist in diesem Bereich von (kz , ω) keine Ausbreitung möglich −→ evaneszente Einhüllende. Es gibt unendlich viele solcher Bereiche (n = 1...∞). Diese Bereiche heißen verbotene Bänder oder gaps −→ Braggspiegel, Braggwellenleiter, ’photonic crystals’ 3. Die Bandgrenzen sind gegeben durch {K (kz , ω) Λ} = nπ K (kz , ω) = nπ/Λ (und mit K = 2π/λB (λB −Blochwellenlänge) Λ = nλB /2) und {K (kz , ω) Λ} = 0. 4. Außerhalb der verbotenen Bänder existieren propagierende Lösungen, die sich aber in ihren Eigenschaften von Volumenwellen unterscheiden (Dispersionsrelation) Ausnutzen der starken Krümmung zur Dispersionskompensation. 5. Für senkrechten Einfall (kz = 0) heißt das, daß verbotene Frequenzbereiche existieren (Filter etc.). 6. Graphische Darstellung der Dispersionsrelation für kz = 0 in dimensionslosen Größen: Λc ω(KΛ) 154 7. Nimmt man (M11 + M22 ) 2 ω ω ω 1 n ω n1 2 sin = cos + n1 d1 cos n2 d2 − n1 d1 sin n2 d2 c c 2 n1 n2 c c cos {K (ω) Λ} = so findet man leicht im ersten verbotenen Band mit KΛ = π + ix für die Mitte des gaps, die gegeben ist mit ωB π ωB n1 d1 = n2 d2 = c c 2 cosh xma 1 = 2 n2 n1 + n1 n2 ∼ , xma = Λ(K)ma ≈ 2 λ/4 − Schichten, n 2 − n1 n2 + n1 für |n2 − n1 | << (n2 + n1 ) Dämpfung ist proportional zum Kontrast. 8. Die Breite des Bandes ergibt sich zu ∆ωgap ≈ 2ωB 2ωB xma = Λ(K)ma π π und ist damit ebenfalls proportional zum Kontrast. 7.3.5 Fabry-Perot-Resonatoren Fabry-Perot-Resonatoren stellen eine Kombination der in den Kapiteln 7.3.3. und 7.3.4. behandelten Konfigurationen, Schicht (Cavity) und periodisches Vielschichtsystem (Spiegel) , dar. Sie spielen in der Optik eine wichtige Rolle. Zum einen werden sie als • Spektralapparate verwendet, • zum anderen stellt ein Laser mit ebenen Spiegeln einen Fabry-Perot-Resonator mit einem aktiven Medium in der Cavity dar. • In der nichtlinearen Optik sind sie von Interesse, da in der Cavity eine starke Feldüberhöhung auftritt und damit nichtlinear optische Effekte bei geringeren Intensitäten des einfallenden Lichtes auftreten. Effekte wie 155 1. Bistabilität, 2. Modulationsinstabilität, 3. Muster- und Resonatorsolitonenbildung sind Gegenstand moderner Forschung. Aus diesem Grunde ist es wichtig, die wesentlichen physikalischen Eigenschaften dieses optischen Elementes zu verstehen. Hinsichtlich der Spiegel unterscheidet man zwischen Resonatoren mit Metall- (Auskopplung über den Tunneleffekt) und Bragg-Spiegeln.Wir untersuchen das Transmissionsverhalten der Resonatoren für • beliebige ebene, unterschiedliche Spiegel mit Absorption • absorbierende Cavity • TE-Polarisation Folgende Geometrie wird betrachtet: ET SD RD D E+ TD E- R0 0 S0 EI T0 ER Dabei sind EI , ER und ET ,die Amplituden des einfallenden, reflektierten und transmittierten Feldes an den jeweiligen äußeren Grenzflächen der Spiegel. Die Reflexions- und Transmissionskoeffizienten können für Metallfilme und Braggspiegel mit den in den Kapiteln 7.3.3. und 7.3.4. behandelten Methoden berechnet werden. 1) am unteren Spiegel gilt: T0 EI + R0 E− (0) = E+ (0) (7.17) Das Ziel besteht darin, E− (0) und E+ (0) durch die Felder ER und ET zu ersetzen. 156 2) E+ (0) wird ersetzt durch Felder am oberen Spiegel ET = TD E+ (D) mit E+ (D) = E+ (0) exp (ikfx D) E+ (0) = ET exp (−ikfx D) TD (7.18) 3) jetzt ersetzt man E− (0) a) am oberen Spiegel gilt: E− (D) = RD E+ (D) = RD ET TD b) am unteren Spiegel gilt: E− (0) = E− (D) exp (ikfx D) RD E− (0) = ET exp (ikfx D) TD wegen E− (D) = E− (0) exp (−ikfx D) 4) nun setzt man E+ (0) und E− (0) in 7.17 ein und erhält: T0 EI + R0 E− (0) = E+ (0) T0 EI + R0 RD ET ET exp (ikfx D) = exp (−ikfx D) TD TD EI = 1 {exp (−ikfx D) − R0 RD exp (ikfx D)} ET . T0 TD Daraus folgt Transmissionsfunktion eines Fabry-Perot zu TTE = ET T0 TD exp (ikfx D) = . EI 1 − R0 RD exp (2ikfx D) Die Reflexion- und der Spiegel sind komplex −→ (R, T )0,D = Transmissionskoeffizienten R,T (|R| , |T |)0,D exp iϕ0,D , aber nur die Phasen der Reflexionskoeffizienten spielen für die Transmissivität τTE ∼ |TTE |2 eine Rolle. Wir setzen jetzt kfx = (kfx ) + i (kfx ) = k + iα und erhalten 2 2 |TTE | = |T | = |T0 |2 |TD |2 exp (−2αD) 1 + exp (−4αD) |R0 | |RD | − |R0 | |RD | exp (−2αD) cos 2kD + ϕ0 + ϕD 2 2 δ τ= kcx |T |2 . ksx (7.19) 157 Die Art der Spiegel (Bragg-Spiegel unterschiedlicher Dicke) beeinflußt die Phasen (ϕ0 , ϕD ) und damit die Transmissivität. Die Beziehung 7.19 stellt die allgemeinste Formel zur Berechnung der Transmissivität bei Vorgabe von |R0 | , |RD | , |T0 | , |TD | und ϕ0 , ϕD dar, i.a. gilt τma < 1. Wir behandeln nun einige Spezialfälle: a) verlustfreier FP-Resonator (Cavity und Spiegel) τ= kcx |T0 |2 |TD |2 ksx 1 + |R0 |2 |RD |2 − |R0 | |RD | cos δ Wegen Verlustfreiheit der Spiegel gilt: |T0 |2 |TD |2 = = k ksx 1 − |RD |2 1 − |R0 |2 k kcx ksx 1 − |R0 |2 1 − |RD |2 kcx mit cos δ = cos2 δ δ δ − sin 2 = 1 − 2 sin 2 2 2 2 erhalten wir 1 − |RD |2 τ= 1 + |R0 |2 |RD |2 − 2 |R0 | |RD | 1 − 2 sin 2 2δ ( = 1 − |R0 |2 4 |R0 | |RD | (1 − |R0 | |RD |)2 2δ 2 2 + 2 2 sin 2 1 − |R0 | 1 − |RD | 1 − |R0 | 1 − |RD | )−1 . Und mit ρ0 = |R0 |2 , ρD = |RD |2 ( )−1 2 √ √ 1 − ρ0 ρD 4 ρ0 ρD δ τ= . + sin 2 (1 − ρ0 ) (1 − ρD ) (1 − ρ0 ) (1 − ρD ) 2 b) verlustfreier FP-Resonator mit symmetrischen Spiegeln Dieser wichtigste Spezialfall erlaubt die Ableitung einer kompakten Formel (Airy-Formel) für die Transmissivität. Bei Verlustfreiheit gilt das Reziprozitätstheorem, d.h. Reflektivitäten und Transmissivitäten an den Einzelspiegeln sind gleich von innen und von außen. Damit gilt ϕ = ϕ0 = ϕD ρ = |R0 |2 = |RD |2 = ρ0 = ρD , 158 gilt ( τ= 4ρ (1 − ρ)2 2δ 2 + 2 sin 2 (1 − ρ) (1 − ρ) )−1 −1 2δ = 1 + F sin 2 mit F = 4ρ (1 − ρ)2 und δ = kD + ϕ 2 Die Airy-Formel beschreibt die Transmissivität eines symmetrischen, verlustfreien FabryPerot-Resonators. Nur in diesem Fall ist die maximale Transmissivität τ = 1 für δ/2 = nπ zu erreichen. Bemerkungen und Schlußfolgerungen • Gleichungen gelten analog für TM-Polarisation, man hat die entsprechenden Refexionskoeffiziente RTM bzw. Reflektivitäten ρTM einzusetzen. • Resonanzen: τMAX = 1 für δ/2 = kDMAX + ϕ = mπ mit 2π k = kx = λ DMAX n2F − n2S sin2 ϕI m − ϕπ mπ − ϕ λ = = kx 2 n2F − n2S sin2 ϕI λ cavity. 2 (7.20) Transmissionseigenschaften ändern sich mit ϕI und λ. • Transmissionsminima τMIN = 1 1+F −→ Ziel: großes F, um großen Kontrast zu erreichen, z.B. F = 100 4ρ (1 − ρ)2 4 ρ = 1 − ε 2 ≈ 100 ε = 0.2 ρ = 0.8. ε 100 = F = 159 Abbildung 7.1: Fabry-Perot-Resonator 160 • bei Pulsen und Bündeln geht man wie bei der Grenzfläche vor −→z.B. TE: ET (α, β, ω) = TFP (α, β, ω)EI (α, β, ω) −→ Fouriertransformation ET (x, y, t) = FT [ET (α, β, ω)], interessante Näherung (Moden- oder mean-field-Theorie) TFP (α, β, ω) ∼ σ2 1 (ω) − α2 − β 2 −→ σ 2 (ω) (komplexe Resonanz) entwickeln und Fouriertransformation −→ DGL in z, y, t. • Reflektivitäten von Metallfilmen oder dielektrischen Spiegeln werden mit den in den Kapiteln 7.3.3. und 7.3.4. vorgestellten Methoden berechnet. • Finesse (Güte) eines Resonators: ∆ 2δ π ABSTAND DER RESONANZEN = = Φ= HALBWERTSBREITE ε ε . ε = FWHM " 1 + F sin 2 ε 2 −1 ε #−1 . 1 mπ ± = = 1+F 2 2 2 ε 2 2 F =1ε= √ 2 F π√ π Φ= F ε= . 2 Φ −→ Linienbreite ist umgekehrt proportional zur Finesse. Wir erhalten für die AiryFormel )−1 ( 2 δ 2Φ τ = 1+ sin 2 . π 2 • Fabry-Perot-Resonator als Spektralapparat −→ Auflösungsvermögen (senkrechter Einfall) Resonanz: ∆k ε π D = mπ ± = mπ ± 2 2 2Φ π 2π |∆k| = 2 nf |∆λ| = λ ΦD kD + ϕ = mπ −→ kD + ϕ ± ∆λ = λ ∼ 1 ∼ ε (ρ) λ nf ΦD ΦD D Das Auflösungsvermögen wird größer mit kleinerer Linienbreite oder /und größerer Cavitydicke. = 4 · 10−6 ∆λ = Beispiel: λ = 5 · 10−7 m, Φ = 30, nf D = 4 · 10−3 m ∆λ λ 2 · 10−12 m • Feldüberhöhung in der Cavity ∼ |T |−2 ∼ 1/(1 − ρ) ∼ Φ −→ wichtig für nichlineare Effekte 161 • Lebensdauer der Photonen in der Cavity Unschärferelation: ∆ωTc = const. ≈ 1. Wegen π 1 |∆k| = nF ∆ω = c ΦD ∆ω = c π 1 nF ΦD D Tc = = ∼ . nF ΦD ∆ω cπ ε (ρ) Lebensdauer wächst mit Finesse und Cavity-Dicke. Trade-off zwischen Feldüberhöhung und Lebensdauer. • Optische Bistabilität −→ in Resonator Feldüberhöhung −→ wenn Cavity-Material nichtlinear ist (z.B. nF (I) = nF + n2 I) −→ Verstimmung δ0 δ δ0 = + kDn2 I = + akD |ET |2 2 2 2 T = 1 ET EI und T = f (ET ) a) geringe Finesse T ET 1 2 3 4 ET 1 2 3 4 EI b) große Finesse T 1 2 ET 4 3 3 2 4 1 ET 162 1 2 3 4 EI 7.4 Geführte Wellen in Schichtsystemen Motivation: • Suche nach Wellen, die sich beugungsfrei ausbreiten. • Miniaturisierung der Optik −→ Licht in dielektrischen Schichten (Streifen, Fasern) kleiner Dimension einsperren. • Störunanfälligkeit, Führung des Lichtes an gewünschte Positionen, optische Nachrichtenübertragung • überhöhte nichtlineare Effekte. • Schichtsysteme deshalb, um allgemeingültige Aspekte zu erkennen und bestimmte praktisch wichtige Fälle (stark gekoppelte Wellenleiter, Bragg-Wellenleiter) behandeln zu können. 7.4.1 Feldstruktur geführter Wellen bisher: Reflexions–Transmissionsproblem Aufgabe: Vorgabe von kz , EI , di, εi −→ Berechnung von ER, ET Felder (eine Fourierkomponente) sind Normalmoden des homogenen Mediums: ∼ Eα (kz , ω) exp [i (kαx x + kz z − ωt)] Frage: Kann Schichtsystem Wellen einfangen (nicht mehr unendlich ausgedehnt) Hinweis: Totalreflexion ET (x, z) = ET exp (ikz z) exp (−µc x) −→ Totalreflexion ist der prinzipielle Mechanismus (auch an Grenzfläche???) neue Eigenschaft geführter Wellen −→ Ausbreitung ist nur absorptions- und nicht beugungsbegrenzt. Feldstruktur geführter Wellen: • ebene Welle in Ausbreitungsrichtung ∼ exp (ikz z) 163 • oszillierende Lösung (stehende Wellenfelder) im Kern (Schichten, Faserkern, Streifen) (später werden wir auch exponentielle Felder im Kern kennenlernen), hier zumindest in einer Schicht ∼ A sin (kfx x) + B cos (kfx x) mit kix = 1. Einschränkung: kz2 < ω2 εi (ω) − kz2 > 0 c2 ω2 max {εi (ω)} c2 i • evaneszente Wellen in Substrat und Cladding ∼ exp [−µc (x − D)] ∼ exp (µs x) mit: kz2 − µs,c = Cladding Substrat ω2 εs,c (ω) > 0 c2 2. Einschränkung: ω2 εs,c (ω) c2 und damit ist die z-Komonente des Wellenzahlvektors geführter Wellen eingeschränkt: ω ω ns,c < kz < max ni max i c c kz2 > Die Feldstruktur in den umgebenden Medien ET (x, z) = ET exp (ikz z) exp [−µc (x − D)] ES (x, z) = ES exp (ikz z) exp (µs x) x>D x<0 impliziert, daß eine reflektierte und transmittierte Welle im Grenzfall verschwindender einfallender Welle existiert. Diese Tatsache nutzen wir aus, um die Eigenschaften geführter Wellen einfach durch Spezialisierung der in Kapitel 7.3 gewonnenen Erkenntnisse abzuleiten anstatt den gesamten schwerfälligen Apparat nochmals zu bemühen. 7.4.2 Die Dispersionsrelation geführter Wellen Da ET , ER = 0 für EI −→ 0, gilt R, T −→ ∞, d.h. geführte Wellen sind Resonanzen des Systems (vgl. mit getriebenen harmonischen Oszillator) x= ω2 F − ω02 −→ ω = ω0 ist Resonanz. Damit erhält man die Dispersionsrelation geführter Wellen für verschwindende Nenner von R, T . Man kann ein allgemeines physikalischen Prinzip formulieren: 164 Die Pole der Responsefunktion (oder der Greenschen Funktion) entsprechen Resonanzen des Systems. Man erhält damit von vorn: . (αs ksx M22 + αc kcx M11 ) + i (M21 − αs ksx αc kcx M12 ) = 0 und mit ksx = iµs , kcx = iµc . (αs µs M22 + αc µc M11 ) + (M21 + αs µs αc µc M12 ) = 0 M11 + αs µs M12 + 1 αs µs . M21 + M22 = 0 αc µc αc µc mit αTE = 1, αTM = 1 ε zusätzlich zur Materialdispersion k 2 (ω) = ω2 εi (ω) = kx2 + kz2 c2 tritt die Wellenleiterdispersionsrelation kz (ω, Geometrie) es gibt nur einen diskreten Satz von Lösungen −→ Moden, d.h. bei Vorgabe von εi , di , ω folgt kzµ (ω) . Bemerkung: Analogie zur zeitfreien Schrödingergleichung z.B. TE-Polarisation 2 ω2 d 2m 2m d2 2 + ε(x) E(x) = k E(x) ←→ − V (x) ψ(x) = − Eψ(x) z dx2 c2 dx2 2 2 • geführte Wellen ←→ diskrete Energieeigenwerte kz2 > ω2 εc,s ←→ E < VUmgebung c2 e e V VS 2 kz w 2 2 c e f e C E S • Tunneleffekt kz2 > ω2 εFilm ←→ E < VBarriere c2 165 VC e V VB 2 kz 2 w c2 E • Warum nur endliche Anzahl diskreter Moden? Randbedingung (ET,R −→ 0 für x −→ ±∞) wählt diskrete Werte von kz aus. εc , εs , kz bestimmen eindeutig die Ableitungen auf den Grenzflächen nur die erlaubten kz führen auf Lösungen mit dem richtigen asymptotischen Verhalten auf dem Rand. • Dispersionsrelation ist eine komplizierte transzendente Gleichung für kz (ω, d, εi , εc , εs ) −→ im allgemeinen werden numerische Nullstellensuchroutinen benötigt. • Feldberechnung im Schichtsystem 1. kz aus Dispersionsrelation 2. im Substrat gilt: F (x) = F exp (µs x) , G(x) = α ∂ {F exp (µs x)} ∂x F (0), G(0) = αµs F (0) sind bekannt bei Vorgabe von F (0) −→ freier Parameter 3. 7.4.3 F G = M(x) x F G = M(x) 0 1 αµs F (0). Geführte Wellen an einer Grenzfläche - Oberflächenpolaritonen Gibt es lokalisierte Anregungen an einer Oberfläche? Bedingung: kz2 > ω2 ε c2 c,s Matrix: = M 1 0 0 1 166 damit folgt die Dispersionsrelation 1+ αs µs = 1. αc µc a) TE-Polarisation (α = 1) µs + µc = 0, da beide Größen positiv sind, gibt es keine Lösung. Das ist physikalisch sofort klar, da hier ∂E F = E, G= ∂x und Feld und Ableitung müssen steig sein. Die Ableitung ist jedoch unstetig an der Grenzfläche. es existieren keine TE-polarisierten Oberflächenpolaritonen. b) TM-Polarisation (α = 1/ε) Dispersionsrelation µc µs + =0 εc εs −→ vgl. Brewster kcx ksx − = 0, εc εs da µc , µs > 0 εc · εs < 0, d.h., ein Medium muß ’oberflächenaktiv’ sein (εc ∨ εs < 0) −→ Geführte TM-polarisierte Oberflächenwellen existieren nur in der Nähe von Resonanzen eines beteiligten Materials. 167 Existenzbedingungen: • Dielektrika −→ ω0(T) < ω < ωL −→ Oberflächen-Phonon-Polaritonen • Metall −→ ω < ωp −→ Oberflächen-Plasmon-Polaritonen explizite Dispersionsrelation (µc εs )2 = (µs εc )2 ε2s (ω) ω2 ω2 2 2 2 kz − 2 εc = εc kz − 2 εs (ω) c c $ ω kz (ω) = c εs (ω) εc εc + εs (ω) • zweite Bedingung: εc + εs (ω) < 0, also insgesamt: 1. εs (ω) < 0, εc > 0, 2. |εs (ω)| > εc es existiert bei Vorgabe der Frequenz und für eine Materialkombination nur eine geführte Mode mit kz (ω). Beispiel:OF-Plasmon-Polaritonen an Grenzfläche Luft-Metall Metall: ωp2 εs (ω) = 1 − 2 < −εc = −1 ω ωp2 ω2 < . 2 168 Explizite Dispersionsrelation: ω2 ω 2 1 − ωp2 kz2 (ω) = 2 c 1 + 1 − ωp22 ω 2 1 2 1 2 2 2 ω = ωp + 2c kz − ωp + 2c2 kz2 − c2 kz2 ωp2 , 2 4 √ kz −→ ∞ ω −→ ωp / 2. kz −→ 0 ω −→ 0, 2 w =ckz w w w =w P P e C+e w S( )=0 2 kz −→ an der Grenzfläche können sich im ’dämpfenden’ Frequenzbereich (Volumen) ungedämpfte Wellen ausbreiten. Feldstruktur eines TM-OF-Polaritons stetige Felder −→ F = Hy = H, da ε das Vorzeichen wechselt, gilt das auch für G= ∂Hy . ∂x Hs (x, z) = H0 exp (ikz z) exp (µs x) Hs (x, z) = H0 exp (ikz z) exp (−µc x) mit µs = kz2 + ω2 |εM |. c2 Aus der Maxwellgleichung ETM = i rot HTM ωε0 ε 169 1 ∂H , ε ∂x folgt Es,cx = kz H ωε0 εs,c i µs H ωε0 εs i µc Ecz = − H ωε0 εc Esz = GF ∼ ∼ ∂ ∂z ∂ ∂x ∂ ∼ . ∂x GF Ex H,Ez x x H, Ex in Phase, Ez um -π/2 phasenverschoben. OF-Wellen: • Spektroskopie, jedoch eingeschränkter Frequenzbereich • Radiowellen (AM) • Erdbeben, Wasserwellen • whispering gallery 7.4.4 Geführte Wellen in einer Schicht - Schichtwellenleiter −→ eigentliche Basis der Integrierten Optik typische Parameter: • d ≈ einige λ • ∆ε ≈ 10−3 − 10−1 • Herstellung durch Beschichtung, Diffusion, Ionenimplantation 170 = m(d) M = 1 αf kfx cos (kfx d) −αf kfx sin (kfx d) sin (kfx d) cos (kfx d) Dispersionsrelation: M11 + αs µs M12 + cos 1 αs µs . M21 + M22 = 0 αc µc αc µc δ δ αf kfx δ αs µs δ αs µs sin − sin + cos = 0, + 2 αf kfx 2 αc µc 2 αc µc 2 tan (kfx d) = αs µ s αc µ c − ααfskµfxs 1+ αf kfx αc µ c = αf kfx (αs µs + αc µc ) 2 αf2 kfx − αc αs µc µs tan (kfx d) = 7.4.4.1 δ = kfx d 2 kfx αf µs αc 2 kfx αc αs + − µc αs µc µs α2f . a) TE-Polarisation (α = 1) kfx (µs + µc ) , 2 kfx − µc µ s −→ implizite Gleichung für kz −→ Lösungen kzν ; für reelle dielektrische Funktionen und tan (kfx d) = ω2 ω2 2 max (ε , ε ) ≤ k ≤ εf c s z c2 c2 171 sind alle Lösungen reell. 7.4.4.2 Bemerkungen: • Trick zur Bestimmung der Wellenzahl (Propagationskonstante) −→ kz vorgeben −→ d oder ω bestimmen √ 1. Startwert: kz =(ω/c) εf 2. einsetzen in : dcalc 1 = kfx kfx (µs + µc ) arctan + νπ . 2 kfx − µc µs ( ν = 0, 1, 2.. nummeriert Moden) 172 3. ∆ = dcalc − d 4. kz reduzieren bis dcalc − d das Vorzeichen wechselt. 5. Intervallhalbierung • meist im sichtbaren Gebiet εi (ω) = εi , da weit weg von Resonanz. Wellenleiterdispersion i.a. viel stärker als Materialdispersion. • Verschwinden eines Modes −→ cut-off (hier o.B.d.A. εc < εs ) Definition des cut offs: γs = 0 −→ kein Abklingen kz2 = tan ω √ c ω2 ε c2 s √ε − ε √ε − ε εs − εc f s s c εf − εs d = = εf − εs εf − εs (ωd)TE co (ωd)TE co εs − εc arctan + νπ εf − εs c arctan a =√ + νπ εf − εs c =√ εf − εs max π/2 mit Asymmetrieparameter a : εs ≈εc εs ≈εf a −→ 0 a −→ ∞ . εs =εc −→ cut-off Frequenz für kz (ω) −→ d fest −→ cut-offDicke für kz (d) −→ ω fest 1. symmetrischer Wellenleiter cut-off = 0 2. stark asymmetrischer Wellenleiter (ωd)TE co = √ c εf− εs *π 2 + νπ + • Anzahl der Moden m −→ Umstellen nach ν und ν = m + 1 • 1 2π √ m = 1 + int εf− εs d − arctan a π λ mit int(c) = Vorkommawert −1 f. c > 0 . f. c < 0 • Dispersionskurven −→ graphische Darstellung der Dispersionsrelation mit neff = ω kz / c 1. kz (ω) −→ neff (ω) 2. kz (d) −→ neff (d) 173 3. kz (ωd) −→ speziell in Faseroptik ω √ ω d d εf− εs = dNA = 2πNA c c λ n2eff − εs B= εf− εs V = neff (V ) oder B(V ); V - Wellenleiterparameter, NA- numerische Apertur Modenanzahl: 1 2π √ m = 1 + int εf− εs d − arctan a π λ d arctan a = 1 + int 2NA − λ π d m = 1 + int 2NA symm.WL λ d 1 stark asymm.WL m = 1 + int 2NA − λ 2 • Feldstruktur µs,c = 1. kz −→ 2. kz −→ ω ε c f ω c kz2 − ω2 εs,c c2 µs,c werden am größten starker Abfall max(εs,c ) µs ∨ µc −→ 0 weites Eindringen 174 F G = m(x) x F = E, F G 0 dF dE G= = dx dx Ef (x) = m11 E0 + m12 dE , dx 0 dE = µs E0 dx 0 µs Ef (x) = E0 cos (kfx d) + sin (kfx d) . kfx Gesamtfeld einer Mode: # " µsν cos (kfxν d) + kfxν sin (kfxν d) exp [−µc (x − d)] Eν (x, z) = E0 exp (ikzν z) cos (kfxν x) + µsν sin (kfxν x) kfxν exp (µs x) x>d 0≤x≤d , x<0 also: kzν aus Dispersionsrelation Modenfeld Eν (x); ν-Anzahl der Nulldurchgänge • Energietransport 1 S = (E × H∗ ) 2 1 1 ∂E ∗ ∗ =0 Sx = (EHz ) = iE 2 2ωµ0 ∂x 1 1 ∂E ∗ kzν ∗ Sz = (EHx ) = − iE |Eν (x)|2 = 2 2ωµ0 ∂z 2ωµ0 Energiefluß geführter Moden nur in Ausbreitungsrichtung • Geführte Leistung kzν Pν = 2ωµ0 7.4.4.3 ∞ −∞ 2 |Eν (x)| dx W m b) TM-Polarisation (α = 1/ε) • Dispersionsrelation tan (kfx d) = kfx εf (µs εc + µc εs ) . 2 kfx εc εs − µc µs ε2f 175 • cut off √ε − ε √ε − ε ε ε εf εs − εc f s s c s f tan εf − εs d = = c (εf − εs ) εs εc εc εf − εs c εf √ = a + νπ (ωd)TM arctan co εc ε f − εs ω √ TE TM > kzν . für TM-Polarisation sind cut-off Dicken und Frequenzen größer kzν • Anzahl der Moden 1 2π √ εf m = 1 + int εf− εs d − arctan a . π λ εc • Feldstruktur # " εf µsν cos (kfxν d) + εs kfxν sin (kfxν d) exp [−µc (x − d)] x > d Hν (x, z) = H0 exp (ikzν z) cos (kfxν x) + εf µsν sin (kfxν x) 0≤x≤d , εs kfxν exp (µs x) x<0 und die elektrischen Feldkomponenten folgen mit Ex = i ∂H kzν =− H ωε0 ε ∂z ωε0 ε i ∂H ωε0 ε(x) ∂x Ez = − • Energietransport Sx = 0 1 kzν |Hν (x)|2 . Sz = (Ex H ∗ ) == 2 2ωε0 ε(x) • Geführte Leistung PνTM kzν = 2ωε0 ∞ −∞ |Hν (x)|2 dx ε(x) W . m Bemerkung: Geführte Wellen im Strahlenbild q C k q d S ∆Φ + ∆Θtot = 2kxf d + Θc + Θs = 2mπ. 176 7.4.5 Anregung geführter Moden −→ OF-Polaritonen analog zwei Möglichkeiten: Feldanpassung oder Wellenzahl (kz )-Anpassung • Feldanpassung −→ Stirnflächenkopplung im Wellenleiter (ohne Strahlungsmoden): aν Eν (x) exp (ikzν z) E(x, z) = ν E(x, 0) ≈ wegen : Pν = kzν 2ωµ0 kzν aν = 2ωµ0 Pν ν∞ −∞ ∞ −∞ Eµ (x) aν Eν (x) |Eν (x)|2 dx Ein (x)Eν (x)dx, d.h. die Mode ν wird durch das einfallende Feld Ein (0) mit der Amplitude aν angeregt. Gauß-Strahl regt den Grund-Modus gut an. Wegen der Symmetrie ungerader Moden werden sie nur von versetztem Gauß-Strahl angeregt. • Wellenzahlanpassung −→ Impulserhaltung e kz e C e f S 1. kz muß an Grenzflächen stetig übergehen 2. Bedingung für die Existenz geführter Wellen kz > ω√ εc,s c auch für OF-Polaritonen $ $ εs (ω) εc |εM (ω)| ω ω ω kz (ω) = = εc > εc . c εc + εs (ω) c |εM (ω)| /εc − 1 c 177 3. Dispersionsrelation der Volumenwelle erfordert ω√ ω2 2 kz = εc,s − ks,cx < εc,s 2 c c Widerspruch • Prismenkopplung ω√ εf c Auf Wellenleiter Medium mit εp > εf (Prisma) kz < 2 kpx = ωc2 εp − kz2 > 0. kz < ω√ εp c x z e möglichst weit hinten p evaneszent kpx kz e kz f −→ Physik des Tunneleffektes , ATR(’attenuated total reflection’) R breiter Spalt enger Spalt kz Breite und Minimum der Resonanz und damit die Effektivität der Anregung hängen von Breite des Luftspalts ab Strahlungsdämpfung ∼ 1/Breite −→ Optimierung; Prisma ’verfälscht’ Mode Metallfilm Luft Luft Metall Otto-Geometrie (WL, OF) 178 Kretschmann-Geometrie (OF) • Gittlerkoppler f e g kz C e f e S kzn Gitter: d(z) = d + ς(z) ς(z) = A sin (gz) mit g= 2π P P - Gitterperiode Bedingung: kzν = kz + mg ω = ns sin φ + mg. c Gittermodulation bestimmt Effektivität (ähnlich Luftspalt). Bei beiden Methoden ist Einkopplung stets mit Auskopplung verbunden. 7.4.6 Einige Bemerkungen zu Streifen- und Faserwellenleitern 7.4.6.1 Streifenwellenleiter −→ für Anwendung wichtiger −→ zweidimensionale Führung w h e e C e f 179 S i. a. keine Aufspaltung in TE- und TM-Moden → Hybridmoden (besitzen alle Feldkomponenten) Et (x, y) . Eν (x, y) = Ez (x, y) Die Gleichungen lassen sich entkoppeln und es folgt eine Eigenwertgleichung für Et (x, y) 2 ω 2 2 Et (x, y) + ∇t {Et (x, y)∇t log ε(x, y)} = 0 ∇t + ε(x, y) − kz c2 mit ∇t = ∂ ∂x ∂ ∂y . 0 EW-Gleichung kann nur mit vektoriellen Eigenwertlösern behandelt werden → z.B. Finite-Element-Methode (FEM). Wichtige Näherung → Effektive-Index-Methode: Quasi-TE, Quasi-TM → sukzessive Lösung für zwei Schichtwellenleiter 1) w TE d e C e f e neff 12 neff 22 neff 12 e C e f e S neff 22 S neff 12 2) in y-Richtung nun als effektiver Wellenleiter neff 12 TM y neff 22 w neff 12 7.4.6.2 x Zerlegung in 3 Gebiete Grundbauelemente: 1. Richtkoppler Aufbau: Theorie: Supermoden, Kopplung P1 (z) = P0 cos2 (kkop z) 180 y d e C e f e S neff 12 → nichtlinearer Schalter. Technologie: 7.4.6.3 Reflektoren (Spiegel) → Bragg-Gitter 2π 2π neff = mg = m λ Λ mλ . Λ= 2neff 2 |kz | = 2 7.4.6.4 Faserwellenleiter → Quarzglas, Si02 , → Kern, cladding, jacket, zylindrische Geometrie, step-index, gradedindex Brechzahlverhältnisse: Wellenleiterparameter: V = 2π 2 rco nco − n2c λ Für V < 2.405 single-mode Wellenleiter, ansonsten multi-mode i.a. schwache Wellenleitung → skalare Näherung der Eigenwertgleichung 2 ω 2 2 ∇t + ψ(x, y) = 0 ε(x, y) − kz c2 → Entartung, Zylindersymmetrie, Besselfunktionen sind Eigenlösungen, Grundmodus kann oft durch Gauß-Profil genähert werden für 1 < V < 2.405. Man erhält mit ∆ = 0.5 εco − εc εco 181 r2 ψ ∼ ψ0 exp −2 2 log V rco 1 kz = rco 7.4.6.5 / exp (−2 log V ) V2 − 1 − 2 log V . 2∆ Dämpfung und Dispersion → Dämpfung extrem niedrig α = 0.2 dB/km @ 1.55 µm (50% nach 15 km) → im wesentliche Rayleigh-Streuung an stochastischen Inhomogenitäten Dispersion: Dω = ∂ 2 kz ∂ 1 = , ∂ω 2 ∂ω vg oft: Dλ = mit ω= ∂ 1 ∂λ vg 2πc λ 182 [Dω ] = ps2 km folgt 2πc ∂ ∂ =− 2 ∂λ λ ∂ω und damit 2πc ps Dω , [Dλ ] = 2 λ nm · km ps Dλ = 1 nm×km bedeutet, daß sich eine Wellenlängenverschiebung um 1nm bei der Ausbreitung über 1 km in einer Veränderung der Ankunftszeit um 1 ps bemerkbar macht. Es gilt die Faustformel: 2 . ps / 1.88 ps ≈− 2 Dω . Dλ nm · km λ [µm] km Dλ = − Typische Dispersionswerte bei der Kommunikartionswellenlänge von λ = 1550 nm: Standardfaser (billig, einfaches Profil): Dλ = 17 ps/(nm· km) 183 Kapitel 8 Statistische Optik – Kohärenztheorie 8.1 Grundlagen wesentliche Beiträge durch Max Born und Emil Wolf (50iger Jahre) Gegenstand: Eigenschaften von ‘zufälligem’ Licht → Fluktuationen der Quelle oder der optischen Eigenschaften des Mediums, das vom Licht passiert wird. • natürliches Licht (Wärmestrahler), viele unabhängige Atome (unterschiedliches ω und Phase) • Streuung an rauhen Oberflächen → Kohärenztheorie Annahmen: skalare Näherung u(r, t), bisher: u(r, t) = U (r, ω) exp −iωt) + c.c. z.B.: U (r, ω) = exp (ikr) → Phasen vollständig determiniert → kohärentes Licht Feld ist Zufallsgröße, erfüllt jedoch nach wie vor die Wellengleichung. Statistische Eigenschaften führen zur Einteilung des Lichtes nach dem Grad der Korrelation der Phasen in: • kohärentes Licht • partiell kohärentes Licht • inkohärentes Licht Wir definieren zuerst wesentliche Begriffe der Kohärenztheorie. 184 8.2 Statistische Eigenschaften des Lichtes 8.2.1 Definitionen u(r, t) → komplexes anyltisches Signal ∞ u(r, t) = U (r, ω) exp (−iωt) dω 0 ∞ uR (r, t) = U (r, ω) exp (−iωt) dω. 0 8.2.1.1 a) Intensität I(r, t) = |u(r, t)|2 e |u(r, t)|2 - Zufallsintensität, e - Ensemblemittelwert → gleiche Präparation des Systems • statistisch stationär - Lampe mit konstantem Strom I(r, t) = I(r). Es gilt die Ergodenhypothese: Ensemblemittelwert kann durch Zeitmittelwert ersetzt werden. e = t = 1 I(r) = lim 2T T |u(r, t)|2 dt −T T →∞ • statistisch nichtstationär → Lampe mit veränderlichem Strom → I(r, t) 185 8.2.1.2 b) zeitliche Kohärenz und Spektrum Annahmen: statistisch stationär → I(r) und am festen Ort → I(r) = I. Maß für Korrelation von u(t) und u(t + τ ) → Autokorrelationsfunktion G(τ ) 1 G(τ ) = u∗ (t)u(t + τ ) = lim T →∞ 2T T u∗ (t)u(t + τ )dt. −T G(τ ) ist die zeitliche Kohärenzfunktion. Zeitskalen: u(t) schwach veränderlich innerhalb von tK (Korrelationszeit), darüberhinaus ‘rauh’, d.h., G(τ ) = 0 für τ > tK . Speziell gilt: G(0) = I. G(τ ) beschreibt damit Kohärenz und Intensität. Man kann beide Effekte trennen durch die Einführung einer normierten Größe → komplexer zeitlicher Kohärenzgrad g(τ ) g(τ ) = G(τ ) u∗ (t)u(t + τ ) = G(0) u∗ (t)u(t) 0 ≤ g(τ ) ≤ 1. Beispiel: deterministisches Licht u(t) = A exp (−iω0 t) 1 |A|2 exp (−iω0 τ ) dt 2T g(τ ) = = exp (−iω0 τ ) → |g(τ )| = 1. 2 1 |A| dt 2T i.a.: Kohärenzzeit: |g(τ )| nimmt monoton ab Definition der Kohärenzzeit über Breite von |g(τ )| = 1/e o. 1/2. 186 τc = ∞ −∞ |g(τ )|2 dτ, also |g(τ )| = 1 τc → ∞. z.B.: g(τ ) = exp (− |τ | /A) τc = 2 exp (−2 |τ | /A) dτ = A(1 − 0) = A. Kohärenzlänge: lc = cτc wenn Längendifferenzen in optischen Systemen ≤ lc → Kohärenz. 8.2.1.3 c) Das Wiener-Khinchin-Theorem → Zusammenhang Spektrum und zeitliche Kohärenz Theorem: Die Fouriertransformation der Autokorrelationsfunktion eines Signals ist identisch mit dem Betragsquadrat der Fouriertransformation des Signal. hier also: Zusammenhang zwischen FT der zeitlichen Kohärenzfunktion und des Signalspektrums ∞ S(ω) exp (−iωt) dω G(τ ) = −∞ und S(ω) = |U (ω)|2 . Beweis (beachten, daß endliche Zeiten, da bei stationären Prozessen unendliche Energie): T 1 ∗ u∗ (t)u(t + τ )dt. G(τ ) = u (t)u(t + τ ) = lim T →∞ 2T −T abgeschnittene FT: 1 UT (ω) = 2π uT (t) = uT (t) = ∞ uT (t) exp (iωt) dt −∞ u(t) 0 für |t| ≤ T sonst ∞ −∞ UT (ω) exp (−iωt) dω, 187 1 G(τ ) = lim T →∞ 2T T UT∗ (ω ) exp (iω t) UT (ω ) exp [−iω (t + τ )] dω dω dt −T 1 = lim 2π T →∞ 2T T |UT (ω )| exp (−iω τ ) dω 2 −T S(ω) = 2π lim 1 T →∞ 2T |UT (ω)|2 q.e.d. S(ω)dω → spektrale Intensität zwischen ω und ω + dω. Da U (−ω) = 0 , gilt I= ∞ S(ω)dω. 0 → Kohärenz einer Lichtquelle durch spektrale Intensität bestimmt. Es gilt: τc ∆ω = const. mit spektraler Breite 2 ∞ S(ω)dω 0 ∆ω = ∞ 2 S (ω)dω 0 • spektrale Filter verbessern Kohärenz, aber Intensität geht verloren, • Monochromasie ( ∆ω → 0) bedeutet vollst. zeitl. Kohärenz ( τc → ∞). • wenn ∆ω << ω0 oder τc >> tsystem → Quasimonochromasie (wie kohärentes Licht) 188 8.2.1.4 d) gegenseitige Kohärenzfunktion (räumliche und zeitliche Kohärenz) → Kreuzkorrelation u(r1 , t1 ), u(r2 , t2 ) mit τ = t2 − t1 G (r1 , r2 , τ ) = u∗ (r1 , t), u(r2 , t + τ ) G (r1 , r2 , τ ) g (r1 , r2 , τ ) = , I(r1 )I(r2 ) 0 ≤ |g (r1 , r2 , τ )| ≤ 1. G - gegenseitige Kohärenzfunktion, g - komplexer Kohärenzgrad, g (r1 , r2 , τ ) - Maß für Korrelation zwischen (r1 , t) und (r2 , t + τ ). Beispiel: ebene, monochromatische Welle: |g (r1 , r2 , τ )| = |exp [ik (r1 − r2 ) − ωτ ]| = 1. speziell: a) zeitliche Kohärenz: r1 = r2 = r b) räumliche Kohärenz: τ = 0. 8.2.1.5 e) gegenseitige Intensität - räumliche Kohärenz →τ =0 G (r1 , r2 , 0) = u∗ (r1 , t), u(r2 , t) = G (r1 , r2 ) G (r1 , r2 ) → gegenseitige Intensität G (r1 , r2 ) g (r1 , r2 ) = I(r1 )I(r2 ) g (r1 , r2 ) → normierte gegenseitige Intensität Bemerkung: Wenn Wegdifferenz im optischen System <lc G (r1 , r2 , τ ) = G (r1 , r2 ) exp (−iω0 τ ) = G (r1 , r2 ) G(τ ), Separartion von zeitlicher und räumlicher Kohärenz, dabei vollst. zeitl. Kohärenz →quasimonochr. Licht. Kohärenzgebiet: 189 Wenn Apertur <Kohärenzgebiet |g| = 1 → Kohärenz Wenn Auflösungsgrenze >Kohärenzgebiet |g| = 0 → Inkohärenz z.B.: Wärmestrahler → Kohärenzgebiet ∼ λ2 , d.h. inkohärent. 8.3 Interferenz mit partiell kohärentem Licht 8.3.1 Interferenz zweier partiell kohärenter Wellen Es seien u1 (r,t) und u2 (r,t) zwei Zufallsfunktionen mit den Intensitäten an einem Ort r zur gleichen Zeit t I2 = |u2 (r,t)|2 I1 = |u1 (r,t)|2 , und der Kreuzkorrelation G12 = u∗1 u2 bzw. der normierten Größe g12 u∗1 u2 = √ I1 I2 (man beachte den Unterschied zu den Größen g und G ohne Index, bisher kein Bezug zu diesen Größen). Überlagerung ergibt: I(r) = |u1 + u2 |2 = |u1 |2 + |u2 |2 + u∗1 u2 + u1 u∗2 = I1 + I2 + G12 + G∗12 = I1 + I2 + 2 (G12 ) = I1 + I2 + 2 I1 I2 (g12 ) = I1 + I2 + 2 I1 I2 |g12 | cos ϕ, ϕ = arg (g12 ) . 1. |g12 | = 1 → Interferenzformel für kohärentes Licht 2. |g12 | = 0 → I = I1 + I2 → inkohärentes Licht 3. i.a. 0 ≤ |g12 | < 1 → Interferenzmuster mit Sichtbarkeit √ Imax − Imin I1 I2 v= =2 |g12 | Imax + Imin I1 + I2 und für I1 = I2 v = |g12 | . Das Ziel besteht nun darin, g12 mit g (τ ) oder g (r1 r2 , τ ) in Zusammenhang zu bringen, um eine Meßvorschrift für die normierten Kohärenzfunktionen zu besitzen. 190 8.3.2 Interferenz und zeitliche Kohärenz Wir betrachten das Signal am gleichen Ort zu zwei verschiedenen Zeiten. u1 = u(t) → I0 = |u(t)|2 u2 = u(t + τ ) → I0 = |u(t + τ )|2 → zeitversetzte Welle Damit gilt: g12 = u∗1 u2 u∗ (t)u(t + τ ) = = g (τ ) . I0 I0 Das Interferenzmuster ergibt sich zu I (r) = I1 + I2 + 2 I1 I2 (g12 ) I(τ ) = 2I0 {1 + [g (τ )]} = 2I0 [1 + |g (τ )| cos ϕ (τ )] |g (τ )| bestimmt die Sichtbarkeit v = |g (τ )| und cos ϕ (τ ) die Lage der Interferenzstreifen, d.h. v = 1 für τ = 0 und v = 0 für τ > τc . Realisierung → Michelson- oder Mach-Zehnder-Interferometer: τ= 2(d2 − d1 ) c Quasimonochromasie (ω0 >> ∆ω) u(t) = a(t) exp (−iω0 t) g (τ ) = ga (τ ) exp (−iω0 τ ) = |ga (τ )| exp [−i (ω0 τ − ϕa )] a∗ (t)a(t + τ ) ga (τ ) = |a(t)|2 I(τ ) = 2I0 1 + |ga (τ )| cos Kontrast 8.3.2.1 ω0 τ Periode − ϕa (τ ) Fourier-Transformations-Spektroskopie: Da S(ω) reell ist, gilt 191 Lage . G (τ ) = g (τ ) I0 = ∞ S(ω) exp (−iωτ ) dω 0 I(τ ) = 2I0 + 2I0 g (τ ) ∞ = 2I0 + 2 S(ω) exp (−iωτ ) dω 0 ∞ ∞ =2 S(ω)dω + 2 S(ω) cos (ωτ ) dω 0 0 ∞ =2 S(ω) [1 + cos (ωτ )] dω. 0 I(τ ) messen → FT−1 [I(τ )] = S(ω) G (τ ) Interpretation: kontinuierliche Überlagerung von Interferogrammen mit Sichtbarkeit v = 1. 8.3.3 Interferenz und räumliche Kohärenz Young–Interferometer → Beugung am Schirm, u1 = u1 (r,t) - Licht von Loch ’1’, u2 = u2 (r,t) - Licht von Loch ’2’ Messung von I(r,t) r1 = (−a, 0, 0) , r2 = (a, 0, 0) , r = (x, 0, d) , Θ≈ 2a . d In Fresnelnäherung gilt: 1. Loch |r − r1 | d + (x + a)2 / (2d) u1 (r,t) = u r1 ,t − ≈ u r1 ,t − , c c 2.Loch |r − r2 | u2 (r,t) = u r2 ,t − c d + (x − a)2 / (2d) ≈ u r2 ,t − c Weiterhin I1 ≈ I2 ≈ I0 . Von vorn haben wir: I = 2I0 (1 + |g12 | cos ϕ) 192 . mit u∗1 u2 u∗ (r1 , t̄)u(r2 , t̄ + τ ) = = g (r1 , r2 , τ ) I0 I0 erhält man den gegenseitigen komplexen Kohärenzgrad. Dabei ist g12 = d + (x + a)2 /2d , c (x + a)2 (x − a)2 2ax x τ= − = =Θ . 2dc 2dc dc c t̄ = und dieser Kohärenzgrad über die Intensität zu messen: I(x) = 2I0 {1 + g [r1 , r2 , τ (x)] cos ϕ(x)} . Setzt man zeitliche Kohärenz voraus (τ < τc ), kann man separieren g (r1 , r2 , τ ) = g (r1 , r2 ) exp (−iω0 τ ) und erhält die normierte gegenseitige Intensität (räumlicher Kohärenzgrad) x I(x) = 2I0 1 + |g (r1 , r2 )| cos ω0 Θ + ϕ (r1 , r2 ) . c Periode: xp = λ/Θ, Sichtbarkeit v = |g (r1 , r2 )| , Lage ϕ (r1 , r2 ) Messung der räumlichen Kohärenz mit Young-Interferometer und quasimonochromatischem Licht. 8.3.4 Räumliche Kohärenz und Ausbreitung Annahme: zeitlich kohärentes Licht (τ < τc ), G (r1 , r2 , τ ) = G (r1 , r2 ) exp (−iω0 t) Frage: Wie ändert sich räumliche Kohärenz bei Ausbreitung durch beliebiges, lineares System? ui (r ) −→ h(r, r ) −→ue (r) ∞ h(r, r )ui (r )dr ue (r) = −∞ Kohärenzfunktion am Ausgang ∞ Ge (r1 , r2 ) = h∗ (r1 , r1 )h(r2 , r2 )Gi (r1 , r2 ) dr1 dr2 . −∞ 193 • Intensität: 1. partielle Kohärenz am Eingang ∞ Ie (r) = h∗ (r, r1 )h(r, r2 )Gi (r1 , r2 ) dr1 dr2 −∞ um Intensität zu berechnen, braucht man die Kohärenzfunktion am Eingang. 2. Inkohärenz am Eingang → Gi (r1 , r2 ) ∼ σIi (r1 )δ(r1 − r2 ) ∞ h∗ (r, r1 )h(r, r1 )Ii (r1 ) dr1 Ie (r) = σ −∞ Übertragungsfunktion für inkohärentes Licht hINT (r, r ) = σ |h(r, r )| 2 • Kohärenzfunktion bei inkohärenter Beleuchtung Gi (r1 , r2 ) ∼ σIi (r1 )δ(r1 − r2 ) ∞ Ge (r1 , r2 ) = σ h∗ (r1 , r1 )h(r2 , r1 )Ii (r1 )dr1 . −∞ inkohärentes Licht wird bei der Ausbreitung partiell kohärent. Physik: Licht, das von einem Punkt kommt, und dami kohärent ist, wird in entferntere Bereiche gebeugt Korrelation ist endlich → van–Cittert-ZernikeTheorem Ähnlichkeit zu verrauschtem Zeitsignal → Filter →Kohärenzzeit wird größer → Raum wirkt als Tiefpaßfilter Beispiel: d sehr groß → Fraunhoferbeugung ri r1 h(ri , r1 ) ∼ exp −ik d ∞ kr 1 |Ge (r1 , r2 )| ∼ σ exp −i (r2 − r1 ) Ii (r1 )dr1 , d −∞ k I˜i − FT(II ). |Ge (r1 , r2 )| ∼ σ I˜i (r2 − r1 ) , d ˜ k Ii d (r2 − r1 ) |ge (r1 , r2 )| = ˜ Ii (0) • Ii ∼ δ(r1 ) |ge (r1 , r2 )| = 1 Punktquelle liefert vollständig kohärentes Licht 194 • Lichtquelle groß (Radius a) Kohärenzgebiet sehr klein I(r1 ) = I0 für |r1 | ≤ a, 2 J1 kd aρ |ge (r1 , r2 )| = , k aρ d ρ = |r2 − r1 | , |ge (r1 , r2 )| = Θs = 2a , d k 2π π a= a = Θs d λd λ 2 J1 (πρΘs /λ) πρΘs /λ 2 J1 (x) =0 x für ρc = 1.22 x = 3.832 λ Θs Kohärenzradius ρc Beispiel: λ = 0.6 µm, a = 1 cm, d = 100 m ρc = 3.7 mm • Anwendung: Michelson-Stern-Interferometer Schirm r Stern inkohärent, Kohärenz → 0, wenn ρc = 1.22λ/Θs = 1.22λd/ (2a) 2a = 1.22λd/ρc ρc über verschwindene Sichtbarkeit im Interferogramm bestimmen Sterndurchmesser 2a. 195