Kapitel 2 Optische Felder in dispersiven und isotropen Medien 2.1

Werbung
Kapitel 2
Optische Felder in dispersiven und
isotropen Medien
2.1
2.1.1
Die Maxwellschen Gleichungen
Übergang zu Gleichungen in der Optik
Die Maxwellschen Gleichungen in ihrer allgemeinsten Form lauten
rot E(r, t) = −
∂B(r, t)
,
∂t
div D(r, t) = ρext (r, t)
(2.1)
rot H(r, t) = jmakr (r, t) +
∂D(r, t)
,
∂t
div B(r, t) = 0
Die dielektrische Verschiebung D(r, t) und das Magnetfeld H(r, t) unterscheiden sich
in Medien vom elektrischen Feld E(r, t) und der Induktion B(r, t) folgendermaßen
D(r, t) = ε0 E(r, t) + P(r, t)
(2.2)
H(r, t) =
1
[B(r, t) − M(r, t)]
µ0
Dabei beschreiben die dielektrische Polarisation P(r, t) und die Magnetisierung M(r, t)
den Einfluß der Materie. Sie hängen mit den Feldern E(r, t) und B(r, t) über die Materialgleichungen zusammen. Dieser Zusammenhang ist im allgemeinen recht kompliziert
und folgt aus anderen Theorien (Festkörpertheorie). In der Optik hat man es in der Regel
mit unmagnetischen Medien zu tun und kann deshalb M(r, t) = 0 setzen.
Die Quellen der Felder sind die frei verschiebbaren Ladungsdichten ρext (r, t) und die
makroskopischen Stromdichten jmakr (r, t) = jcond (r, t) + jconv (r, t). Der konduktive Strom
hängt in noch zu spezifizierender Weise vom elektrischen Feld ab, jcond (r, t) = f (E). Für
9
den konvektiven Strom gilt: jconv (r, t) = ρext (r, t)v. In der Optik gibt es in der Regel
keine externen Ladungen (ρext (r, t) = 0, jconv (r, t) = 0).
Damit lassen sich die Maxwellschen Gleichungen in der für die Optik relevanten Form
schreiben
rot E(r, t) = −µ0
∂H(r, t)
,
∂t
ε0 div E(r, t) = −div P(r, t)
(2.3)
rot H(r, t) = jcond (r, t) +
∂E(r, t)
∂P(r, t)
+ ε0
,
∂t
∂t
div H(r, t) = 0
Die Polarisationsladungen ρpol (r, t) = −div P(r, t) und -ströme jpol (r, t) = ∂P(r,t)
sind
∂t
nicht vorgebbar.
Die Grundaufgabe der Optik besteht darin, bei vorgegebenem Zusammenhang P(E)
und j(E) die Gleichungen (2.3) konsistent zu lösen.
Obwohl physikalische Größen reell sind, kann man sie in linearen Theorien ins Komplexe fortsetzen, muß jedoch letztendlich wieder zum Realteil übergehen. Bei Produktbildungen ist immer mit den reellen Größen zu rechnen. Die Gleichungen (2.3) gelten
also für komplexe Größen, wobei für den Realteil gilt Er (r, t) = 12 [E(r, t) + E∗ (r, t)] =
Re [E(r, t)]
2.1.2
Das Zeitverhalten der Felder - Mono- und Polychromasie
A) Monochromasie ←→ stationäre Felder
Alle Felder weisen eine harmonische Zeitabhängigkeit auf ∼ exp(−iωt) → feste Phasenlage, vollständige Kohärenz, unendliche Wellenzüge. Wir geben das für alle Felder
typische Zeitverhalten für das elektrische Feld an
E(r, t) = E(r, ω) exp(−iωt)
B) Polychromasie ←→ nichtstationäre Felder
Alle Wellenzüge sind endlich. Das Feld wird in seine Fourierkomponenten zerlegt ←→
Zerlegung in unendliche, harmonische Wellenzüge
∞
E(r, t) =
E(r, ω) exp(−iωt)dω
(2.4)
−∞
1
E(r, ω) =
2π
∞
E(r, t) exp(iωt)dt
−∞
10
(2.5)
2.1.3
Die Maxwellschen Gleichungen im Fourierraum
Setzt man die Fourierzerlegung (2.4) in die Gleichungen (2.3) ein und beachtet dabei,
daß die Zeitableitungen wegen
∂E(r, t)
∂
=
∂t
∂t
∞
∞
E(r, ω) exp(−iωt)dω =
−∞
(−iω)E(r, ω) exp(−iωt)dω
−∞
im Fourierraum in die Multiplikation mit (−iω) übergehen, erhält man
rot E(r, ω) = iωµ0 H(r, ω),
ε0 div E(r, ω) = −div P(r, ω)
(2.6)
rot H(r, ω) = j(r, ω) − iωP(r, ω) − iωε0 E(r, ω),
2.1.4
div H(r, ω) = 0
Übergang von den Maxwellgleichungen zur Wellengleichung
A) Zeitraum
Aus den Gleichungen (2.3) erhält man
∂H(r, t)
∂
∂E(r, t)
∂P(r, t)
rotrot E(r, t) = −µ0 rot
= −µ0
j(r, t) +
+ ε0
∂t
∂t
∂t
∂t
rotrot E(r, t) +
∂j(r, t)
∂ 2 P(r, t)
1 ∂2
−
µ
E(r,
t)
=
−µ
0
0
c2 ∂t2
∂t
∂t2
Weiterhin gilt für das elektrische Feld
ε0 div E(r, t) = −div P(r, t)
und das Magnetfeld erhält man aus
∂H(r, t)
1
= − rot E(r, t)
∂t
µ0
11
(2.7)
B) Frequenzraum
Durch Fouriertransformation von (2.7) oder direkt aus (2.6) erhält man
rotrot E(r, ω) −
ω2
E(r, ω) = iωµ0 j(r, ω) + µ0 ω 2 P(r, ω)
c2
(2.8)
Entsprechend gilt
ε0 div E(r, ω) = −div P(r, ω)
(2.9)
und
H(r, ω) = −
i
rot E(r, ω)
ωµ0
(2.10)
Im stationären Fall erhält man die Lösung des Problems durch die Lösung der obigen
Gleichungen und einfache Multiplikation mit exp(−iωt). Für nichtstationäre Felder hat
man die Fourier-Rücktransformation (2.4) auszuführen, um die zeitabhängigen Felder zu
erhalten.
2.1.5
Bemerkungen zur Polarisation
In beliebigen isotropen Medien sind im allgemeinen alle Feldkomponenten verkoppelt.
Die Situation vereinfacht sich, wenn in einer Richtung (z.B. y ) Translationsinvarianz
vorliegt (−→ ∂/∂y = 0). Das gilt in homogenen unendlichen, Medien, Schichten und an
unendlichen Grenzflächen. Der Differentialoperator der Wellengleichung (2.8) schreibt
sich dann



 (2)
∂
∂E x
∂E z
+
∆ Ex
∂z

 ∂x ∂x
  (2)

rot rot E = grad div E − ∆E = 

0
 − ∆(2) E y
∂
∂E x
∆ Ez
+ ∂E z
∂z
Die Zerlegung E = E⊥ + E mit

∂x
∂z

Ex
E =  0 
Ez


0
E⊥ =  E y  ,
0
ergibt mit (2.8)
ω2
∆ E⊥ + 2 E⊥ (r, ω) = −iωµ0 j⊥ (r, ω) − µ0 ω 2 P⊥ (r, ω)
c
(2)
∆(2) E +
ω2
E(r, ω) − grad(2) div(2) E = −iωµ0 j(r, ω) − µ0 ω 2 P(r, ω)
c2
Bei Vorliegen von Translationsinvarianz in einer Richtung können die verkoppelten
vektoriellen Wellengleichungen (2.8) entkoppelt werden. Die Ausbreitung der senkrecht
zueinander polarisierten Felder kann unabhängig berechnet werden. Die entsprechenden
Polarisationen kürzt man mit (oder p oder TM) und (⊥ oder s oder TE) ab.
12
2.2
2.2.1
Beschreibung der Medien - die Materialgleichungen
Grundsätzliches
Die Bestimmung der Zusammenhänge P(E) und j(E) erfordert i.a. die Lösung eines
komplizierten Vielteilchenproblems in der Festkörpertheorie. Oftmals beschreiben jedoch
phänomenologische Modelle diesen Zusammenhang ausreichend. Wir werden hier als einfaches Modell das Drude-Modell für freie und gebundene Ladungträger kennenlernen.
Freie Ladungsträger treten in Metallen und angeregten Halbleitern (Intrabandeffekte),
gebundene Ladungsträger in Dielektrika und Halbleitern (Interbandeffekte) auf. Der Zusammenhang zwischen Ursache (elektrisches Feld) und Wirkung (induzierte Polarisation
bzw. Strom) wird im Rahmen der linearen Responsetheorie beschrieben. Wir klassifizieren die Materialeigenschaften am Beispiel der Polarisation. Die lineare Reaktion des
Mediums kann im Zeit- oder im Frequenzraum beschrieben werden. Die die Reaktion
vermittelnde Größe heißt im Zeitraum Responsefunktion und in Frequenzraum Übertragungsfunktion.
E(r, t) −→ Medium (Responsefunktion)
−→ P(r, t)
E(r, ω) −→ Medium (Übertragungsfunktion) −→ P(r, ω)
2.2.1.1
Definition der Begriffe
• linear:
P(r, t) = ε0 R(r, t)E(r, t),
R(r, t) - Responsefunktion, - Operator
P(r, ω) = ε0 χ(r, ω) E(r, ω),
χ(r, ω) - Suszeptibilität, - Operator
FT
χ(r, ω) ←→ R(r, t)
• dispersiv (nichtinstantan) ←→ nichtdispersiv (instantan):
dispersiv
−→ χ(r, ω) ←→ P(r, t) = f E(r, t, t )
nichtdispersiv
−→ χ (r)
←→ P(r, t) = f [E(r, t)]
• homogen ←→ inhomogen
homogen −→ χ(ω), R(t)
• isotrop ←→ anisotrop
anisotrop −→ χij (r, ω) Rij (r, t)
• lokal ←→ nichtlokal
nichtlokal −→ P(r, t) = f E(r, r , t, t )
13
2.2.1.2
Folgerungen für die Wellengleichungen aus den unterschiedlichen
Materialgleichungen
Wir setzen die relevante Polarisation P̄(r, ω) in die Wellengleichung (ohne Stromterm)
ω2
rotrot Ē(r, ω) − 2 Ē(r, ω) = µ0 ω 2 P̄(r, ω)
c
und in D̄(r, ω) = ε0 Ē(r, ω) + P̄(r, ω) ein.
a) linear, homogen, isotrop, nichtdispersiv
χ(r, ω) = χ skalare Konstante
←→
P̄(r, ω) = ε0 χ Ē(r, ω)
P(r, t) = ε0 χE(r, t)
←→
D(r, t) = ε0 εE(r, t)
D̄(r, ω) = ε0 ε Ē(r, ω)
R(t) =
→
χ(ω) exp(−iωt)dω = 2πχδ(t)
damit wird wegen div D̄(r, ω) = 0
→ε=1+χ
instantan
div Ē(r, ω) = 0 und damit
∆ Ē(r, ω) +
∆ E(r, t) −
ω2
ε Ē(r, ω) = 0
c2
ε ∂2
E(r, t) = 0
c2 ∂t2
Das Ergebnis ist ’unphysikalisch’, da jedes Medium dispersiv ist. Gilt näherungsweise
in einem Frequenzbereich, in dem Dispersion zu vernachlässigen ist.
b) linear, homogen, isotrop,dispersiv −→ χ(ω)
P̄(r, ω) = ε0 χ(ω) Ē(r, ω),
D̄(r, ω) = ε0 ε(ω) Ē(r, ω)
div D̄(r, ω) = 0 div Ē(r, ω) = 0 für ε(ω) = 0.
Daraus folgt die Helmholtzgleichung
∆ Ē(r, ω) +
ω2
ε (ω) Ē(r, ω) = 0
c2
→ Response hängt von Frequenz ab.
c) linear, inhomogen, isotrop, dispersiv −→ χ(r,ω)
14
P̄(r, ω) = ε0 χ(r, ω) Ē(r, ω),
D̄(r, ω) = ε0 ε(r, ω) Ē(r, ω).
div D̄(r, ω) = ε0 ε(r, ω)div Ē(r, ω) + ε0 Ē(r, ω)grad ε(r, ω),
grad ε(r, ω)
Ē(r, ω).
div Ē(r, ω) = −
ε(r, ω)
Damit erhält man
ω2
∆ Ē(r, ω) + 2 ε (ω) Ē(r, ω) = −grad
c
grad ε(r, ω)
Ē(r, ω)
ε(r, ω)
→ Kopplung der Feldkomponenten.
d) linear, homogen, anisotrop, dispersiv −→ χij (ω)
P̄i (r, ω) = ε0 χij (ω) Ēj (r, ω)
D̄i (r, ω) = ε0 εij (ω) Ēj (r, ω).
e) nichtlinear, homogen, isotrop, dispersiv −→ χ(ω, Ē)
P̄(r, ω) = ε0 χ(r, ω) Ē(r, ω) + P̄NL (Ē)
→tritt auf für hohe Intensitäten.
Ähnliche Überlegungen lassen sich für den Strom j̄(r, ω) anstellen.
Im wesentlichen lassen sich zwei Fälle unterscheiden:
1. Beiträge gebundener Elektronen und Gitterschwingungen → typisch für Dielektrika
und Halbleiter
• Gitterschwingungen oder Phononen
ionischer Teil (geladene Teilchen) der Materialresponse, große Massen (103 ×
Elektronenmasse), kleine Schwingungen, verantwortlich für thermische Eigenschaften, einige spezielle Gitterschwingungen (Phononenmoden) tragen zu optischen Eigenschaften bei, optische und akustische Phononen, optische relevant, aber geringe Dispersion → constant, longitudinal und transversal, nur
transversale koppeln mit Licht, longitudinale WW stärker → höhere Frequenzen
in Resonanznähe werden die Teilchen aus der Ruhelage bewegt → durch Verschiebung der Ladungsschwerpunkte entsteht ein Dipolmoment (Polarisationsdichte), das mit der Feldfrequenz schwingt → Abstrahlung eines Feldes →
Überlagerung mit einfallendem Feld → Amplituden hängen vom Verhältnis
der anregenden Frequenz zur Eigenfrequenz ab, Dispersion (unterschiedliche
Reaktion)→ χ(ω)
15
• Elektronenübergänge
eigentlich quantentheoretisch, Teilchen von Valenzband in Leitungsband, Übergangsfrequenz, Vielteilcheneffekte, kann klassisch durch eine Schwingung gebundener Elektronen beschrieben werden, (Eigenfrequenzen der Ionen ω0ion <<
Eigenfrequenzen der Elektronen ω0el ) → χ(ω)
2. Beiträge freier Elektronen → typisch für Metalle und angeregte Halbleiter
relativ freie Elektronen → Modell des freien Elektronengases (keine gegenseitige
WW), Ladungsbalance durch Untergrund der Ionen, Stöße nur mit ruhenden Ionen
→ σ(ω)
→ die beiden Fälle werden einzeln behandelt und später zusammengeführt.
2.2.2
Die dielektrische Polarisation und die dielektrische Funktion
→ Beiträge gebundener Teilchen (Ionen, Elektronen) → Drude–Modell
zeitabhängiges Feld E(r, t) ruft eine Verschiebung s(r, t) für eine bestimmte Sorte
von Atomen hervor → Beschreibung als Oszillator mit äußerer, treibender Kraft
s̈(r,t)+g ṡ(r,t) + ω02 s(r,t) = −
e
E(r, t)
m
mit der Resonanzfrequenz (elektronischer Übergang oder optische Gitterschwingung) ω0
und der Dämpfung g . Das induzierte Dipolmoment ist
p(r, t) = −es(r,t),
was auf die Dipoldichte oder dielektrische Polarisation
P(r, t) = N p(r, t)
führt. Damit ergibt sich
P̈(r,t)+g Ṗ(r,t) + ω02 P(r, t) =
mit der Oszillatorstärke
f=
e2 N
E(r, t) = ε0 f E(r, t)
m
1 e2 N
.
ε0 m
Wir lösen die Gleichung im Fourierraum
∞
E(r, t) =
∞
Ē(r, ω) exp(−iωt)dω,
P(r, t) =
−∞
P̄(r, ω) exp(−iωt)dω
−∞
und erhalten
−ω 2 P̄(r, ω) − igω P̄(r, ω) + ω02 P̄(r, ω) = ε0 f Ē(r, ω)
P̄(r, ω) =
(ω02
ε0 f
Ē(r, ω).
− ω 2 ) − igω
16
Im Falle mehrerer Resonanzen ergibt sich
fj
2
Ē(r, ω)
P̄(r, ω) = ε0
2 − ig ω
ω
−
ω
j
0j
j
= ε0 χ (ω) Ē(r, ω)
mit der komplexen, frequenzabhängigen Suszeptibilität
fj
2
= χPhon (ω) + χElek (ω) .
χ (ω) =
ω0j − ω 2 − igj ω
j
Für die dielektrische Verschiebung kann man dann schreiben
D̄(r, ω) = ε0 Ē(r, ω) + ε0 χ (ω) Ē(r, ω) = ε0 ε (ω) Ē(r, ω),
wobei ε (ω) die komplexe dielektrische Funktion darstellt. Das wichtigste Ergebnis besteht darin, daß die dielektrische Response im Frequenzraum (Übertragungsfunktion)
komplex und frequenzabhängig ist. Die Auswirkungen auf das zeitliche Verhalten diskutieren wir später, geben jedoch die zeitliche Responsefunktion R(t) an
1
. 1
FT [χ(ω)] =
R(t) =
2π
2π
∞
χ(ω) exp(−iωt)dω
−∞
f
g
=
exp(− t) sin ν 0 t,
ν0
2
2.2.3
ν02
=
ω02
g2
− .
4
Der Konduktionsstrom und die Leitfähigkeit
→ Beitrag freier Ladungsträger (wechselwirkungsfreies Elektronengas über positiv geladenem Hintergrund), getriebener Oszillator mit Resonanzfrequenz ω0 = 0 (keine rücktreibende Kraft)
e
s̈(r, t)+g ṡ(r, t) = − E(r, t),
m
wobei die Elektronenmasse m im Halbleiter durch die effektive Masse meff zu ersetzen
ist. Die Dämpfung g hängt mit Stößen der Elektronen mit den Rümpfen zusammen. Der
induzierte Srom ergibt sich zu
j(r, t) = −N eṡ(r, t)
und damit
j̇(r, t)+gj(r, t) =
e2 N
E(r, t) = ε0 f E(r, t) = ε0 ωp2 E(r, t)
m
mit der Plasmafrequenz
ωp2 = f =
1 e2 N
.
ε0 m
Im Fourierraum ergibt sich
−iω j̄(r, ω) + g j̄(r, ω) = ε0 ωp2 Ē(r, ω)
17
j̄(r, ω) =
ε0 ωp2
Ē(r, ω) = σ (ω) Ē(r, ω).
g − iω
mit der komplexen Leitfähigkeit
ε0 ωp2
ε0 ωωp2
σ (ω) =
= −i
.
g − iω
−ω 2 − igω
Bemerkung zur Plasmafrequenz:
Wir berechnen die Bewegung einer externen Ladungswolke ρext in ihrem eigenen Feld:
j̇(r,t)+gj(r,t) =ε0 ωp2 E(r, t)
und
ε0 divE(r, t) = ρext .
Divergenzbildung ergibt
divj̇(r,t)+gdivj(r,t) =ε0 ωp2 divE(r, t) = ωp2 ρext .
Benutzt man die Kontinuitätsgleichung
ρ̇ext + divj = 0,
ergibt sich
−ρ̈ext − g ρ̇ext = ωp2 ρext
ρ̈ext + g ρ̇ext + ωp2 ρext = 0,
d.h. die Plasmafrequenz ωp2 ist die Eigenfrequenz der im eigenen Feld schwingenden
Ladungswolke.
2.2.4
Die komplexe dielektrische Funktion
Wir setzen die Materialgleichungen j̄(r, ω) und P̄(r, ω) in die Wellengleichung (2.8) ein
und erhalten
rotrot E(r, ω) −
ω2
E(r, ω) = iωµ0 j(r, ω) + µ0 ω 2 P(r, ω)
2
c
= µ0 ε0 ω 2 χ(ω) + iωµ0 σ (ω) E(r, ω)
i
ω2
rotrot E(r, ω) = 2 1 + χ(ω) +
σ (ω) E(r, ω)
c
ωε0
ω2
= 2 ε(ω)E(r, ω)
c
mit der komplexen dielektrischen Funktion
i
ε(ω) = 1 + χ(ω) +
σ (ω) = ε (ω) + iε (ω)
ωε0
ωp2
fj
2
=1+
,
+
2 − igω
2 − ig ω
−ω
ω
−
ω
j
0j
j
18
die die Beiträge des Vakuums, der Gitterschwingungen, der gebundenen und freien Elektronen enthält.
Speziell gilt für die relevanten Materialien im IR und sichtbaren Spektralbereich:
• Dielektrika, Isolatoren in der Nähe einer Gitterresonanz (IR-Spektralbereich)
f
fj
2
+ 2
ε(ω) = 1 +
2
(ω0 − ω 2 ) − igω
ω0j − ω − igj ω
j
= ε∞ +
(ω02
f
,
− ω 2 ) − igω
wobei ε∞ den Beitrag des Vakuums und aller elektronischen Übergänge beschreibt.
Damit erhält man
ε(ω) = ε(ω) + i ε(ω) = ε (ω) + i ε (ω)
ε (ω) = ε∞ +
f (ω02 − ω 2 )
,
2
(ω02 − ω 2 ) + g 2 ω 2
gf ω
ε (ω) = 2
.
2
(ω0 − ω 2 ) + g 2 ω 2
Die Lage der Resonanzen wird durch ω0 und die Resonanzbreite durch g bestimmt.
Die Resonanz trägt auch zu statischer Dielektrizitätskonstante
f
.
ε0 = ε(0) = ε∞ + 2
ω0
bei. Die Oszillatorstärke kann damit in den Formeln entsprechend
f = ε0 − ε∞ ω02
ersetzt werden. Bei der sog. longitudinalen Frequenz (ω = ωL ) verschwindet der
Realteil der dielektrischen Funktion, d.h. ε (ωL ) = 0. ε (ω) = 0 ist immer mit einer
Absorption verbunden, d.h. Absorption und Dispersion treten immer gemeinsam
auf.
Isolierte Resonanz
12
ε′
ε′′
8
4
ε0
0
ω0
ε∞
ω
ωL
-4
19
Man beachte, daß in Resonanznähe ε (ω) < 0 (führt auf Dämpfung ohne Absorption) sein kann. Normale Dispersion liegt für ∂ε (ω)/∂ω > 0, anormale für
∂ε (ω)/∂ω > 0 < 0 vor. Für eine extrem scharfe ’ Resonanz gilt g → 0.
Scharfe Resonanz
12
ε
8
4
ε0
0
ω0
ε∞
ω
ωL
-4
-8
Hier kann man einen Zusammenhang zwischen den beiden charakteristischen Frequenzen ω0 und ωL , die sog. Lyddane-Sachs-Teller Relation, angeben
ωL = ω0
ε0
.
ε∞
• Dielektrische Medien im sichtbaren Spektralbereich kann man vorteilhaft mit einem
sog. Doppelresonanzmodell beschreiben, wobei jeweils eine Gitterschwingung im IR
und ein elektronischer ’Übergang’ berücksichtigt werden
ε(ω) = ε∞ +
2
(ω0G
fG
fe
+ 2
,
2
− ω ) − igG ω (ω0e − ω 2 ) − ige ω
√
wobei typische Werte für ein Flouridglas
sind: fG = 1.22 × 1014 s−1 , gG = 0.9 ×
√
1014 s−1 , ω0G = 1.74 × 1014 s−1 , fe = 6.7 × 1015 s−1 , ge = 2.8 × 1015 s−1 , ω0e =
0.9 × 1016 s−1 . In ε∞ sind mögliche andere weit entfernte Resonanzen enthalten,
u.U. kann hier ε∞ = 1 sein.
Zwei Resonanzen
20
2 .2
ε'
2
1 .8
1 .6
V IS
1 .4
0
2
4
6
8
ω in 10 1 5 s -1
• Halbleiter
ε(ω) = 1 +
j
fj
2
ω0j − ω 2 − igj ω
+
2
ωphl
f
+
,
(ω02 − ω 2 ) − igω −ω 2 − igω
2
ωphl
f
+
= ε∞ + 2
(ω0 − ω 2 ) − igω −ω 2 − igω
d.h. im Halbleiter treten neben den Gitterschwingungsbeiträgen im fernen IR, elektronische Übergänge im nahen IR oder im Sichtbaren (wide-gap Halbleiter) auf.
Daneben sind im angeregten HL die Beiträge der Elektronen im Leitungsband zu
beachten. ωphl ist im allgemeinen wesentlich kleiner als ωpmet ≈ 1016 s−1 > ω und
ist im IR angesiedelt (ωphl = 1014 s−1 < ω).
• Metalle
ε(ω) = 1 −
2
ωpmet
.
ω 2 + igω
Hier ist (ωpmetl >> ω) . Damit weist die dielektrische Funktion einen großen negativen Realteil auf. Als Beispiel möge Aluminium dienen:
1. λ = 500 nm, ε = −32, ε = 7.3
2. λ = 700 nm, ε = −46, ε = 20
Die Beiträge freier Elektronen (sowohl im Halbleiter als auch im Metall) führen
auf
ωp2
gωp2
,
ε
(ω)
=
.
ε (ω) = 1 − 2
ω + g2
ω (ω 2 + g 2 )
21
Metall
ε′
ε′′
20
ωP 2 -g 2
0
V IS
5
10
15
20
25
ω in 10 15 s -1
-2 0
2.2.5
Dispersion im Glas
Glas spielt als optisches Material eine herausragende Rolle. Im Gegensatz zu kristallinen
Medien ist Glas amorph. Man unterscheidet zwischen Kronglas, das im wesentlichen aus
Soda, Kalk und Siliziumdioxid besteht, niedrigbrechend ist ( n = 1.42...1.53) und eine
geringe Dispersion aufweist und Flintglas, das aus Bleioxid und Siliziumdioxid besteht,
hochbrechend ist ( n = 1.5...1.76) und eine starke Dispersion aufweist. Zur Dispersion
des Glases tragen phononische und elektronische Anteile bei, deren Resonanzfrequenzen jedoch weit von den optischen Frequenzen entfernt sind (ω0p << ω << ω0e ), d.h.
Absorptionseffekte können vernachlässigt werden (ε = 0) . Es gilt damit im Doppelresonanzmodell
f
2 j , j = p, e
ε (ω) − 1 =
ω0j − ω 2
j
mit ω = 2πc/λ folgt
ε (λ) − 1 =
j
sj λ2
,
λ2 − λ2j
sj =
fj λ2j
4π 2 c2
• elektronischer Beitrag → λ2e << λ2
[ε (λ) − 1]e = se
1−
λ2e
λ2
≈ se
λ2e λ4e
1 + 2 + 4 + ... .
λ
λ
• phononischer Beitrag → λ2p >> λ2
s λ2
sp λ2
= − p2
[ε (λ) − 1]p = 2
λp
λ − λ2p
22
−1
λ2
s p λ2
1− 2
≈− 2 .
λp
λp
Damit ergibt sich
ε (λ) − 1 = [ε (λ) − 1]p + [ε (λ) − 1]e
λ2e λ4e
s p λ2
≈ − 2 + se 1 + 2 + 4 + ...
λp
λ
λ
C
D
≈ A − Bλ2 + 2 + 4 .
λ
λ
oder
n ≈ Ã +
2.2.6
dn
2B̃
≈− 3.
dλ
λ
B̃
,
λ2
Die Materialgleichungen im Zeitbereich
→ die Responsefunktion oder Greensche Funktion
Im Frequenzraum gilt:
D̄(r, ω) = ε0 ε(ω)Ē(r, ω)
P̄(r, ω) = ε0 χ(ω)Ē(r, ω).
Wir beschränken uns hier auf den Zusammenhang zwischen Polarisation und elektrischem Feld im Zeitraum. Wir führen die Responsefunktion (Greensche Funktion) R(t)
folgendermaßen ein
∞
1
χ(ω) exp (−iωt) dω.
R(t) =
2π −∞
1
(Man beachte den zur FT zusätzlichen Faktor 2π
). Mit
∞
χ(ω) =
R(t) exp (iωt) dt
−∞
∞
1
E(r, t) exp (iωt) dt
Ē(r, ω) =
2π −∞
erhält man
∞
∞
1
1
P(r, t) exp (iωt) dt = ε0
R(t ) exp (iωt ) E(r, t ) exp (iωt ) dt dt
2π −∞
2π
−∞
und mit der Transformation t = t − t
∞
exp (iωt) dt P(r, t) − ε0
−∞
−∞
P(r, t) = ε0
∞
t
−∞
R(t − t )E(r, t )dt
=0
R(t − t )E(r, t )dt .
Für E(r, t ) = δ(t − t0 ) ergibt sich P(r, t) = ε0 R(t − t0 ) ,d.h. die Response- oder
Greensche Funktion.
Beispiele:
23
• Dielektrika
1
R(t) =
2π
∞
2
−∞ ω0
f
exp (−iωt) dω,
− ω 2 − igω
Anwendung des Residuensatzes ergibt
g 1
g2
sin Ωt,
Ω = ω02 − .
R(t) ∼ exp − t
2 Ω
4
t
g
P(r, t) ∼
exp − (t − t ) sin [Ω(t − t )] E(r, t )dt
2
−∞
• Metall
R(t) ∼ exp (−gt)
P(r, t) ∼
t
−∞
exp [−g(t − t )] E(r, t )dt
Die Dispersionstheorie ist ein Beispiel für eine lineare Übertragungstheorie. Eine lineare
Differentialgleichung mit dem Differentialoperator LD
LD W (t) = U (t)
hat im Zeitraum die Lösung
t
W (t) =
−∞
h(t − t )U (t )dt ,
wobei U das Ursachenfeld, W Wirkungsfeld und R die Response- oder Greensche Funktion darstellen, wobei gilt
LD h(t − t ) = −δ(t − t ).
Im Fourierraum gilt
La W̄ (ω) = Ū (ω) ,
.
W̄ (ω) = h̄ (ω) Ū (ω) = H (ω) Ū (ω)
wobei La ein algebraischer Operator und H (ω) die Übertragungsfunktion des Systems
ist. Es gilt
1
FT [H] .
h=
2π
2.3
2.3.1
Die Energiestromdichte und Energiebilanz
Der zeitlich gemittelte Poyntingvektor
Der Energiefluß eines elektromagnetischen Feldes wird durch den Poyntingvektor S, der
Energiefluß durch eine Fläche (Detektor) durch S · n beschrieben, wobei n der Normalenvektor zur Fläche ist. Der momentane Energiefluß ist definiert als
S(r, t) = Er (r, t) × Hr (r, t).
Folgende Zeitskalen treten auf:
24
• Die Schwingungsdauer ist gegeben duch T0 = 2π/ω0 ≤ 10−14 s.
• Für die Impulsdauer Tp gilt i.a. Tp >> T0 .
• Für die Meßzeit Tm gilt i.a. Tm >> T0 , Tm ≥ Tp
→ der Detektor kann im allgemeinen den schnellen Oszillationen nicht folgen und mißt
den zeitlichen Mittelwert. Man schreibt die Felder als Produkt aus langsam veränderlichen Amplituden (Einhüllende) und schnellen Oszillationen
→
×
1
Ẽ(r, t) exp (−iω0 t) + c.c. .
2
Damit ergibt sich für den Energiefluß (instantaner Poyntingvektor)
Er (r, t) =
S(r, t) = Er (r, t) × Hr (r, t)
1
=
Ẽ(r, t) × H̃∗ (r, t) + Ẽ∗ (r, t) × H̃(r, t)
4
1
+
Ẽ(r, t) × H̃(r, t) exp (−2iω0 t) + Ẽ∗ (r, t) × H̃∗ (r, t) exp (2iω0 t)
4
1 1 = Ẽ(r, t) × H̃∗ (r, t) + Ẽ(r, t) × H̃(r, t) cos 2ω0 t
2
2
1 ∗
+ Ẽ (r, t) × H̃∗ (r, t) sin 2ω0 t.
2
Der Meßprozeß stellt eine zeitliche Mittelung von S(r, t) dar
Tm
1
S(r, t) =
S(r, t)dt.
2Tm −Tm
Die Integration führt zum Verschwinden der schnell oszillierenden Anteile
Tm 1 1
Ẽ(r, t) × H̃∗ (r, t) dt.
S(r, t) =
2 2Tm −Tm
Für stationäre (monochromatische) Felder
Ẽ(r, t) = Ē(r, ω), H̃(r, t) = H̄(r, ω)
vereinfacht sich die Beziehung zu
1 S(r, t) = Ē(r, ω) × H̄∗ (r, ω) .
2
Im allgemeinen bezeichnet man
I = |S(r, t)|
als die optische Intensität. Bei der Messung wird i.a. die Phaseninformation zerstört.
25
2.3.2
Die zeitlich gemittelte Energiebilanz
→ hier nur stationäre Felder
Aus den Maxwell-Gleichungen erhält man
∂
∂
ε0 E2r (r, t) + µ0 H2r (r, t) + div [Er (r, t) × Hr (r, t)] = − jr (r, t) + Ṗr (r, t) Er (r, t).
∂t
∂t
Zeitliche Mittelung ergibt für die linke Seite
"
$
# 1
∂ !
ε0 E2r (r, t) + µ0 H2r (r, t) +div [Er (r, t) × Hr (r, t)] = div Ē(r, ω) × H̄∗ (r, ω) .
∂t
2
Für die rechte Seite erhalten wir
&
%
− jr (r, t) + Ṗr (r, t) Er (r, t)
"
1 !
σ Ē exp (−iωt) − iωε0 χĒ exp (−iωt) + c.c. Ē exp (−iωt) + c.c.
=−
4 '
(
σ
1
Ē exp (−iωt) + c.c. Ē exp (−iωt) + c.c.
−iωε0 χ + i
=−
4
ωε0
1
1
∗
∗
= iωε0 [ε (ω) − 1] ĒĒ + c.c. = iωε0 [ε (ω) − 1 + iε (ω)] ĒĒ + c.c.
4
4
1
∗
= − ωε0 ε (ω) Ē(r, ω)Ē (r, ω).
2
Es gilt also
1
∗
div S = − ωε0 ε (ω) Ē(r, ω)Ē (r, ω).
2
Senken des Energieflusses ergeben sich damit für nichtverschwindenden Imaginärteil der
dielektrischen Funktion, also in der Nähe von Materialresonanzen, d.h. Materialresonanzen sind immer mit einem Energieverlust des elektromagnetischen Feldes verbunden →
Absorption.
2.4
Die Kramers–Kronigsche Dispersionsrelation
Wir zeigen, daß in einem linearen System unter bestimmten Bedingungen Real- und
Imaginärteil der Übertragungsfunktion durch eine Intergraltransformation verbunden
sind. Insbesondere wird das für die dielektrische Suszeptibilität (oder die dielektrische
Funktion) gelten.
lineares Übertragungssystem:
U (t )
URSACHE
E(t )
E(t )
h(t, t )
→ W (t)
RESPONSEFUNKTION
WIRKUNG
R(t, t )
R̃(t, t )
→ P(t)
→ D(t)
→
→
→
26
speziell:
P(t) = ε0
t
−∞
t
D(t) = ε0
mit
−∞
R(t − t )E(t )dt ,
R̃(t − t )E(t )dt
R̃(t − t ) = δ(t − t ) + R(t − t ).
Definition der Voraussetzungen:
∞
h(t, t )U (t )dt
W (t) =
−∞
t
=
h(t, t )U (t )dt
−∞
t
h(t − t )U (t )dt
=
−∞
∞
=
h(τ )U (t − τ )dτ
→
linear
→
kausal
t = t − τ
→
zeitinvariant
0
∞
mit h(τ ) als Response- und H(ω) = −∞ h(τ ) exp (iωτ ) dτ als Übertragungsfunktion. Für
die (reelle) dielektrische Polarisation gilt dann
t
R(τ )Er (r, t − τ )dτ,
Pr (r, t) = ε0
−∞
damit ist R(τ ) reell. Die K.-K.-Dispersionsrelation besagt nun, daß es eine Beziehung
zwischen Real- und Imaginärteil von H(ω) (oder hier: χ(ω) ) gibt, wenn diese vier Bedingungen erfüllt sind.
Folgerungen aus diesen Voraussetzungen:
• Realität
∞
E(r, t) =
Ē(r, ω) exp (−iωτ ) dω
−∞
aus
folgt
E(r, t) = E∗ (r, t)
Ē(r, ω) = Ē∗ (r, −ω),
d.h. nur positive Frequenzen sind relevant.
• Linearität
P̄(r, ω) = ε0 χ(ω)Ē(r, ω),
P̄∗ (r, ω) = ε0 χ∗ (ω)Ē∗ (r, ω),
P̄(r, ω) = ε0 χ∗ (−ω)Ē(r, ω),
27
damit
χ(ω) = χ∗ (−ω)
oder
χ(ω) = χ(−ω)
χ(ω) = −χ(−ω).
→
konsistent mit Drude-Formeln.
• Kausalität
∞
∞
R(τ ) exp (iωτ ) dτ =
χ(ω) =
−∞
R(τ ) exp (iωτ ) dτ,
0
da R(τ ) = 0 für τ < 0.
analytische Fortsetzung: ω = ω + iω → da τ > 0 und R(τ ) endlich χ(ω) ist in
der oberen Halbebene analytisch.
∞
R(τ ) exp (iω τ ) exp (−ω τ ) dτ.
χ(ω) =
0
Ableitung: Man berechne das Integral
ℑω
C
C2
χ(ω̄)
dω̄,
ω̄ − ω
C1
−ω
ω
ℜω
wobei C den in der Abbildung dargetellten Intergrationsweg entspricht. Für reelles
ω ist der Intergrand analytisch und für ω̄ → iω̄ verschwindet der Beitrag zum Integral.
Wir haben also:
χ(ω̄)
0=
dω̄
C ω̄ − ω
∞
χ(ω̄)
χ(ω̄)
χ(ω̄)
=℘
dω̄ +
dω̄ +
dω̄
C1 ω̄ − ω
C2 ω̄ − ω
−∞ ω̄ − ω
∞
0
χ(ω̄)
ρ exp (iϕ)
=℘
dω̄ + lim [iχ(ω)]
dϕ + 0
ρ→0
−∞ ω̄ − ω
−π ρ exp (iϕ)
∞
χ(ω̄)
dω̄ − iπχ(ω) + 0
=℘
−∞ ω̄ − ω
und damit die vorläufige Form der Dispersionsrelation
∞
i
χ(ω̄)
χ(ω) = − ℘
dω̄,
π −∞ ω̄ − ω
28
d.h. eine Beziehung zwischen Real-und Imaginärteil. Mit χ(ω) = χ (ω) und χ(ω) =
χ (ω) folgt
∞ 1
χ (ω̄)
χ (ω) = ℘
dω̄,
π −∞ ω̄ − ω
1
χ (ω) = − ℘
π
∞
−∞
χ (ω̄)
dω̄.
ω̄ − ω
Die endgültige Form erhält man, wenn man χ (ω) = χ (−ω) und χ (ω) = −χ (−ω)
ausnutzt und die dielektrische Funktion χ(ω) = ε(ω) − 1 = [ε (ω) − 1] + iε (ω) einführt
2
ε (ω) − 1 = ℘
π
∞
0
2
ε (ω) = − ω℘
π
ω̄ε (ω̄)
dω̄,
ω̄ 2 − ω 2
∞
0
[ε (ω̄) − 1]
dω̄.
ω̄ 2 − ω 2
∞
℘ −∞ bezeichnet ein Hauptwertintegral. Physikalisch sagen die KKD aus, daß die Dispersion eines Mediums durch die Absorption hervorgerufen wird, d.h., die Kenntnis
des vollständigen Absorptionsspektrums ist zur Bestimmung der dielektrischen Funktion bei einer Frequenz erforderlich. Oftmals reicht jedoch das Spektrum in der Nähe der
interessierenden Frequenz aus.
Für eine unendlich schmale Absorptionslinie ε (ω) = Aδ(ω − ω0 ) erhält man
ε (ω) − 1 =
Aω0
− ω2
ω02
und bestätigt damit das Drude-Modell.
2.5
Die Normalmoden des homogenen isotropen Mediums
→ Suche nach einfachsten Lösungen der Wellengleichung im Fourierraum → Normalmoden oder Elementaranregungen, mit denen dann jede beliebige Lösung konstruiert werden kann. Normalmoden in der Optik zeichnen sich im allgemeinen dadurch aus, daß bei
der Propagation
• die Amplitudenverteilung unveränderlich ist,
• der Polarisationszustand erhalten bleibt,
• die Phase eine harmonische Abhängigkeit aufweist und
• eine Dispersionsrelation verbindet Frequenz und Wellenzahl.
29
Ausgangspunkt ist die Wellengleichung
rotrot Ē(r, ω) =
ω2
ε(ω)Ē(r, ω)
c2
mit der Bedingung der Divergenzfreiheit
ε0 ε(ω)div Ē(r, ω) = 0
und der komplexen dielektrischen Funktion
ε(ω) = 1 + χ(ω) +
i
σ (ω) = ε (ω) + iε (ω).
ωε0
Wegen ε0 ε(ω)div Ē(r, ω) = 0 hat man zunächst zwei Fälle zu unterscheiden:
• longitudinale Wellen bei ω = ωL → ε(ω) = 0,
• transversale Wellen für ω = ωL → div Ē(r, ω) = 0.
Wir vermuten als einfachste Lösungen ebene Wellen
Ē(r, ω) = E(k, ω) exp (ikr) ,
wobei k vorerst unbestimmt ist und die Amplitude für festes (k, ω) konstant ist. Damit
ergibt sich das Gesamtfeld zu
∞
E(k, ω) exp [i (kr−ωt)] dω.
E(r, t) =
−∞
Der sog. komplexe Wellenzahlvektor k = k + ik definiert die Flächen konstanter Phase k r =const. und konstanter Amplitude k r =const. → Ebenengleichungen. Stimmen
beide Flächen überein, spricht man von homogenen Wellen, ansonsten von inhomogenen Wellen. Stehen die Flächen senkrecht aufeinander, handelt es sich um evaneszente
Wellen
2.5.1
Longitudinale Wellen
Longitudinale Wellen können nur im dielektrischen Medium für ε(ω) = 0 bei der longitudinalen Frequenz ω = ωL auftreten. Aus
rotrot Ē(r, ωL ) = 0
folgt mit dem ebenen-Wellen-Ansatz und den Bezeichnungen Ē⊥,für die zum k - Vektor
senkrechte und parallele Feldkomponente
k× k × Ē(r, ωL ) = 0,
k× k× Ē⊥ +Ē = 0,
k× k × Ē⊥ + k× k × Ē = 0,
k 2 Ē⊥ = 0 → Ē(r, ωL ) = Ē(r, ωL ).
30
2.5.2
Transversale Wellen
Die für uns interessanten Lösungen sind die divergenzfreien transversalen Wellen. Für
ω = ωL gilt
div Ē(r, ω) = 0
und damit erhält man aus der Wellengleichung die Helmholtzgleichung
∆Ē(r, ω) +
ω2
ε(ω)Ē(r, ω) = 0.
c2
Damit wird Ē(r, ω) durch drei skalare Gleichungen bei einer Nebenbedingung bestimmt
→ zwei unabhängige komplexe Feldkomponenten. Mit dem EW-Ansatz erhalten wir
ω2
2
−k + 2 ε(ω) Ē(k, ω) = 0
c
und
kĒ(k, ω) = 0.
Daraus folgt
• die Dispersionsrelation
k2 = k 2 = kx2 + ky2 + kz2 =
ω2
ε(ω),
c2
die die Länge des Wellenzahlvektors in Abhängigkeit von der Frequenz bestimmt
und
• die Transversalität
k ⊥ Ē(k, ω).
Ebenen Wellen sind Lösungen der Maxwellgleichungen im homogenen, isotropen Medium, wenn die Dispersionsrelation k(ω) erfüllt ist und die Wellen transversal sind.
Im allgemeinen ist k komplex und damit die EW keine Normalmode (Amplitude
verändert sich bei der Ausbreitung). Man führt dann in der Optik oftmals eine komplexe
Brechzahl ein
ω
ω
ω)
ε(ω) = n̂(ω) = [n(ω) + iκ(ω)] .
k=
c
c
c
Da die Dispersionsrelation gilt, kann man Ē(k, ω) = Ē(ω) schreiben.
2.5.2.1
Diskussion der Lösung in den verschiedenen Frequenzbereichen
1. ε(ω) = ε (ω) > 0 → Transparenzgebiet, weit weg von Resonanzen → bevorzugtes
Gebiet der Optik
31
ε′
ε′′
ω
k 2 = k2 − k2 + 2ik k =
ω2 ω2 2
ε
(ω)
=
n (ω).
c2
c2
• k = 0 → reeller Wellenzahlvektor
Ē(r, ω) = E(ω) exp (ikr) ,
H̄(r, ω) = H(ω) exp (ikr)
mit
i
1
rot Ē(r, ω) =
[k × E(ω)] exp (ikr)
ωµ0
ωµ0
1
ε0
H(ω) =
[k × E(ω)] → |H|2 = n2 (ω) |E|2
ωµ0
µ0
H̄(r, ω) = −
mit
µ0
= Z = 377 Ohm
ε0
als Wellenwiderstand. Die Dispersionsrelation kann als
k = k(ω) =
2π
ω
ω
=
n(ω) =
n(ω)
c
cn
λ
oder
ω = ω(k) =
c
k
n(ω)
geschrieben werden.
Beispiele:
ε(ω) = ε (ω) = ε∞ +
ω02
f
→
− ω2
32
Gitterschwingungen (Phononen)
ω
ω=
ω=
ω0 +
2
c
ε0
c
k
ε∞
k
f
ε∞
ω0
k
(Phonon-Polariton)
oder
ε(ω) = ε (ω) = 1 −
ωp2
→
ω2
freie Elektronen (Plasma)
ω
ω = ck
ωp
k
(Plasmon-Polariton)
Schlußfolgerungen:Ebene, monochromatische, transversale, elliptisch polarisierte Wellen
Ē(r, ω) = E(ω) exp {i [k (ω) r−ωt]}
sind Normalmoden des homogenen isotropen Mediums für ε(ω) = ε (ω) > 0,
d.h. 0 < ω < ω0 , ω > ωL , wenn die Dispersionsrelation k(ω) = ωc n(ω) erfüllt
ist.
• k k = 0 → k ⊥ k → komplexer Wellenzahlvektor → inhomogene, speziell
evaneszente Wellen
k 2 = k2 − k2 =
k2 = k2 − k 2 .
ω2
ε(ω),
c2
Das heißt, k2 = 0 für k2 > k 2 und die evaneszenten Wellen haben die Form
Ē(r, ω) = E(ω) exp {i [k (ω) r]} exp (−k r) ,
33
d.h. Flächen konstanter Phase stehen senkrecht auf Flächen konstanter Amplitude → keine Normalmoden, da exponentielles Wachstum im homogenen
Raum. Evaneszente Wellen können nur an Grenzflächen existieren.
2. ε(ω) = ε (ω) < 0, Reststrahlgebiet, in der Nähe von Resonanzen, ω0 < ω < ωL
(Dielektrika), ω < ωp (Metalle)
ε′
ε′′
ω
k 2 = k2 − k2 + 2ik k =
• k = 0
ω2 ε (ω) < 0
c2
ω2 |ε (ω)|
c2
k2 =
Ē(r, ω) ∼ exp (−k r) → starke Dämpfung
→ keine Ausbreitung, wenn ε = 0
• k k = 0 → k ⊥ k → evaneszente Wellen
2
2
k =k −k
2
k2 =
ω2 = − 2 |ε (ω)|
c
ω2 |ε (ω)| + k2 .
c2
Evaneszente Wellen → nur an Grenzflächen wie bei 1) aber für alle k2 .
3. ε(ω) komplex → in Resonanznähe, aber später schwache Absorption ε (ω) <<
|ε (ω)| voraussetzen
k2 = k 2 =
ω2
ω2
ε(ω)
=
[n(ω) + iκ(ω)]2
2
2
c
c
mit ε (ω) ≶ 0 und k komplex.
ε(ω) = ε (ω) + iε (ω) = n2 (ω) − κ2 (ω) + 2in(ω)κ(ω)
34
daraus folgt
ε (ω) = n2 (ω) − κ2 (ω)
ε (ω) = 2n(ω)κ(ω)
und damit für beliebiges ε
*
ε
2
n (ω) =
sgn (ε ) 1 + (ε /ε ) + 1 ,
2
2
*
ε
2
κ (ω) =
sgn (ε ) 1 + (ε /ε ) − 1 .
2
2
Man kann zwei Grenzfälle unterscheiden:
ε′
ε′′
1
2
ω
1. Dielektrikum ε , ε > 0, ε << ε , ω < ω0
n(ω) ≈
)
ε (ω),
κ(ω) ≈
1 ε (ω)
)
2 ε (ω)
d.h. die Ausbreitung dominiert die Absorption.
2. Metalle, Reststrahlgebiet ε < 0, ε > 0, ε << |ε | , ω0 < ω < ωL
n(ω) ≈
1 ε (ω)
)
,
2 |ε (ω)|
κ(ω) ≈
)
|ε (ω)| ,
d.h. Dämpfung dominiert Ausbreitung.
Beispiel: Aluminium @ 500 nm → ε = −32 + i7.3 n ≈ 0.65, κ ≈ 5.6 → 1/eDämpfung nach 56 nm
Struktur der Lösungen für schwache Dämpfung (Fall1):
35
Sind die ebenen Wellen homogen?
→Von vorn gilt:
|k | ≈
k2 − k2 =
ω2 ε (ω),
c2
2k k =
ω 2 ε (ω).
c2
ω) ε (ω),
c
|k | ≈
1 ω ε (ω)
)
2 c ε (ω)
k k ≈ |k | |k | ,
d.h. Real- und Imaginärteil des Wellenzahlvektors sind annähernd parallel → homogene
Wellen.
im homogenen, isotropen Medium breiten sich in Resonanznähe gedämpfte, homogene
ebene Wellen aus → keine Normalmoden
,
ω
+ ω
Ē(r, ω) = E(ω) exp (ikr) = E(ω) exp i n (ω) (er) exp − κ (ω) (er) .
c
c
ε′
ε′′
a
c
a
c
b
ω
(a) ungedämpfte Wellen →Normalmoden → Plasmon-Polaritonen, Phonon-Polaritonen;
zusätzlich → evaneszente QWellen an Grenzflächen
(b) evaneszente Wellen
(c) gedämpfte, fast homogene Wellen für schwache Dämpfung (ε > 0); stark gedämpfte Wellen für ε < 0 .
2.5.3
Energiestromdichte und Intensität ebener Wellen
Die Energiestromdichte hängt mit der Intensität wie folgt zusammen
Tm 1 1
S(r, t) = I(r, t)n =
Ẽ(r, t) × H̃∗ (r, t) dt,
2 2Tm −Tm
36
dabei sind die--Größen langsam veränderlich. Für ebene Wellen erhalten wir
Ẽ(r, t) = E(t) exp (ikr) = E(t) exp (ik r) exp (−k r)
H̃∗ (r, t) = H∗ (t) exp (ik r) exp (−k r) .
Wir bemerken, daß im stationären Fall gilt: E(t) = E(ω).
1 1
S(r, t) =
ωµ0 4Tm
Tm
−Tm
k∗ |E(t)|2 − Ẽ∗ (t) (k∗ E) dt exp (−2k r)
k 1
=
nk exp (−2k r)
ωµ0 4Tm
=n
Tm
−Tm
|E(t)|2 dt
ω
1 Tm
ε0
nk exp −2 κ (nk r)
|E(t)|2 dt.
µ0
c
4Tm −Tm
Für stationäre Wellen gilt dann:
ω
ε0
1
nk exp −2 κ (nk r) |E(ω)|2 .
S(r, t) = n
2
µ0
c
2.6
Gebündelte Wellenfelder (Strahlen) und Impulse - Analogie von Beugung und Pulsverbreiterung (Dispersion)
Wir wollen zeigen, daß sich Pulse mit endlicher transversaler Breite (gepulste Bündel)
als eine Superposition (im Frequenz- und Ortsfrequenzraum) von Normalmoden darstellen lassen. Es wird sich herausstellen, daß sich die raum-zeitlich lokalisierten optischen
Anregungen sowohl zeitlich als auch räumlich durch die unterschiedliche Phasenentwicklung in Ausbreitungsrichtung für verschiedene Frequenzen (wegen der Dispersion) und
Ortsfrequenzen (wegen der unterschiedlichen Ausbreitungsrichtungen der einzelnen Normalmoden) verbreitern werden. Im räumlichen Bereich spricht man von Beugung, im
zeitlichen einfach von Pulsverbreiterung. Wir behandeln den räumlichen Fall, gehen dann
zum allgemeinen Fall über und diskutieren zum Schluß den zeitlichen Fall.
Bündel werden charakterisiert durch ihre endliche Breite.
Bündel
ebene Welle
2w
37
Ein Bündel stellt eine kontinuierliche Überlagerung stationärer, ebener Wellen verschiedener Ausbreitungsrichtung dar.
∞
E(r, t) =
−∞
Ē(k) exp [i (kr − ωt)] d3 k.
Impulse werden charakterisiert durch ihre endliche Länge.
Impuls
stationäre Welle
2Tp
Ein Impuls stellt eine kontinuierliche Überlagerung stationärer, ebener Wellen verschiedener Frequenz dar.
+
=
∞
E(r, t) =
−∞
+
Ē(ω) exp [i (k(ω)r − ωt)] dω.
Ein Impuls endlicher Breite (Bündel) stellt eine kontinuierliche Überlagerung stationärer,
ebener Wellen verschiedener Frequenz und Ausbreitungsrichtung dar.
∞
E(r, t) =
Ē(k,ω) exp [i (k(ω)r − ωt)] d3 kdω.
−∞
In der Literatur wird die Ausbreitung solch lokalisierter Anregung oftmals auch alternativ beschrieben. Man separiert zeitlich und räumlich schnell oszillierende Anteile von
langsam veränderlichen (’slowly varying envelope approximation’-SVEA). Dieses Vorgehen bietet sich immer dann an, wenn die spektralen Breiten im Frequenz und Ortsfrequenzbereich wesentlich kleiner als die entsprechenden Mittenfrequenzen sind. Man
schreibt z.B. für ein gepulstes Bündel, das die Mittenfrequenz ω0 besitzt und sich in z
-Richtung ausbreitet
E(r, t) = Ẽ(r,t) exp [i (k(ω 0 )z−ω 0 t)] .
Ẽ(r,t) folgt dann i.a. einer aus der Wellengleichung abgeleiteten parabolischen Differentialgleichung (1. Ordnung in Ausbreitungsrichtung). Wir kommen später auf diese
Methode zurück.
38
2.6.1
Ausbreitung gebündelter Wellenfelder im homogenen Raum
Das Verständnis dieses Effektes (Beugung) ist wichtig für das Verständnis der optischen
Abbildung, der optischen Filterung, der Mikroskopie, der Beugung an Gittern, der optischen Nahfeldmikroskopie etc.
Wir beginnen mit dem stationären Fall (ω = const.) Unser Vorgehen lehnt sich stark
an die lineare Übertragungstheorie an (integrale Formulierung). Am Ende zeigen wir die
Äquivalenz zu einer differentiellen Formulierung.
Wir nehmen an, daß wir uns im optischen Transparenzgebiet befinden, d.h.,
ε(ω) = ε (ω) > 0,
d.h. es existieren Normalmoden in Form von stationären homogenen und evaneszenten
ebenen Wellen. Wir beschränken uns hier auf die skalare Näherung, die im Fall eindimensionaler Bündel den Fall linear polarisierten Lichtes exakt beschreibt. Im zweidimensionalen Fall stellt sie eine Näherung dar, ist jedoch auch hier exakt, wenn man die skalare
Größe mit einer Komponente des Vektorpotentials identifiziert (siehe Zusatzkapitel).
Wir schreiben für das stationäre optische Feld
Ē(r,ω) → Ēy (r,ω)ey → Ēy (r,ω) → u(r, ω).
Damit folgt aus der Helmholtzgleichung
ω2
ε (ω) Ē(r, ω) = 0,
c2
in skalarer Näherung bei fester Frequenz ω
∆ Ē(r, ω) +
ω2
ε (ω) u(r, ω) = 0,
c2
∆ u(r, ω) + k 2 (ω) u(r, ω) = 0.
∆ u(r, ω) +
Wir werden im folgenden die feste Frequenz ω oftmals weglassen.
2.6.1.1
Beliebig enge Bündel → der allgemeine Fall
Die Aufgabe besteht darin, bei vorgegebener Feldverteilung in einer Ebenen (z.B. z = 0
) die Feldverteilung im Halbraum z > 0 zu bestimmen.
39
Fouriertransformation ergibt
∞
u(r, ω) =
U (k, ω) exp [ik(ω)r] d3 k
−∞
und stellt eine Überlagerung der NM mit unterschiedlicher Ausbreitungsrichtung (gegeben durch k) dar. Wir haben jedoch zu beachten, daß die NM der Dispersionsrelation
k2 = k 2 = kx2 + ky2 + kz2 =
ω2
ε (ω)
c2
genügen müssen, nur zwei Komponenten von k können unabhängig gewählt werden, z.
B. kx , ky . Aus Gründen der einfacheren Schreibweise setzen wir
kx = α,
ky = β,
kz = γ.
Damit schreiben wir anstelle der 3D Fouriertransformation (wir lassen jetzt ω weg)
∞
u(r) =
U (α, β;z) exp [i (αx + βy)] dαdβ.
−∞
Einsetzen in die skalare Helmholtzgleichung
∆ u(r) + k 2 (ω) u(r) = 0
ergibt
d2
2
2
2
+ k (ω) − α − β U (α, β;z) = 0,
dz 2
2
d
2
+ γ (ω) U (α, β;z) = 0,
dz 2
mit der Lösung
U (α, β;z) = U1 (α, β) exp (iγz) + U2 (α, β) exp (−iγz) .
Offensichtlich gibt es zwei Typen von Lösungen:
1. γ 2 ≥ 0, und damit α2 + β 2 ≤ k 2 , d.h. homogene Wellen
γ
k
α
β
2. γ 2 < 0, und damit α2 + β 2 > k 2 , d.h. evaneszente Wellen, da γ = kz imaginär ist.
40
γ
α
α ²+ β²>k²
k
β
Damit entfällt der zweite Teil der Lösung, da eine unendlich anwachsende Amplitude
im Halbraum unphysikalisch ist. Wir erhalten also
.
U (α, β;z) = U1 (α, β) exp (iγz) = U (α, β; 0) exp (iγz) = U0 (α, β) exp (iγz)
mit der Randbedingung U (α, β; 0) = U0 (α, β). Das Gesamtfeld im Halbraum z > 0
ergibt sich somit zu
∞
u(r) =
U0 (α, β) exp [iγ (α, β) z] exp [i (αx + βy)] dαdβ.
(2.11)
−∞
Die Ursache der Beugung ist die unterschiedliche Phasenverschiebung in Propagationsrichtung für verschiedene α, β. Es ist klar, daß sich die Randbedingung U0 (α, β) aus der
Feldverteilung auf dem Rand z = 0 ergibt, da gilt
U0 (α, β) =
1
2π
2 ∞
−∞
u0 (x, y) exp [−i (αx + βy)] dxdy,
wobei u0 (x, y) = u(x, y, 0). U0 (α, β) stellt damit die räumliche spektrale Verteilung bei
z = 0 dar und wird Ortsfrequenzspektrum oder Winkelspektrum von u0 (x, y) genannt
(im Sinne der FT sind α, β Ortsfrequenzen, im Sinne der Optik ebener Wellen sind α/k,
β/k Richtungskosinusse und repräsentieren deshalb Winkel).
Die Anfangverteilung u0 (x, y) bestimmt damit das Spektrum, Ausbreitung bedeutet
nur Multiplikation mit dem Phasenfaktor exp [iγ (α, β) z] und ergibt ein neues Spektrum
U (α, β; z) = U0 (α, β) exp [iγ (α, β) z] und damit eine neue Verteilung u(x, y, z). Damit
ist das Wesen der Beugung beschrieben.
Man kann Gl.(2.11) also folgendermaßen interpretieren:
•
1. Das resultierende Feld ergibt sich aus der Rücktransformation des neuen Spektrums:
∞
U (α, β; z) exp [i (αx + βy)] dαdβ.
u(r) =
−∞
2. Das resultierende Feld ergibt sich aus der Überlagerung homogener und inhomogener ebener Wellen (’plane-wave spectrum’), die der Dispersionsrelation
genügen
∞
u(r) =
U0 (α, β) exp {i [αx + βy + γ (α, β) z]} dαdβ.
−∞
41
Im Sinne der linearen Übertragungstheorie können die Ergebnisse folgendermaßen
interpretiert werden:
Die lineare Gleichung
∆u + k 2 u = 0
hat im Fourierraum die Lösung
U (α, β; z) = H(α, β; z)U0 (α, β),
wobei U0 (α,)
β) die Ursache, U (α, β; z) die Wirkung und H(α, β; z) = exp [iγ (α, β) z] (mit
k 2 − α2 − β 2 ) die Übertragungsfunktion darstellen. Entsprechend ergibt
γ (α, β) =
sich im Ortraum
∞
h(x − x , y − y ; z)u0 (x , y )dx dy u (x, y, z) =
−∞
mit der Responsefunktion
2 ∞
1
h(x, y; z) =
H(α, β; z) exp [i (αx + βy)] dαdβ.
2π
−∞
Diskussion der Übertragungsfunktion Die ÜF
H(α, β; z) = exp [iγ (α, β) z]
ist im allgemeinen komplex. Für ein festes z kann man Betrag und Argument einfach
graphisch darstellen:
Phase
Betrag
k
|H|
1
arg H
kz
β
α
α
β
Man hat zwischen dem Beitrag homogener und evaneszenter Wellen zu unterscheiden.
1. homogene Wellen → α2 +β 2 ≤ k 2 |H| = 1, arg H = 0 , d.h. jede
homogene ebene
)
Welle wird bei der Ausbreitung mit einem Phasenfaktor exp i k 2 − α2 − β 2 z
belegt.
)
2
2
2
2
2
2
2. evaneszente Wellen→ α + β > k |H| = exp − α + β − k z , arg H = 0 ,
d.h. jede evaneszente Welle wird bei der Ausbreitung mit einem Amplitudenfaktor
<1 belegt → Beiträge werden für wachsende z gedämpft.
42
Es ist die Frage zu klären, wann evaneszente Wellen auftreten. Das hängt offensichtlich von der Struktur der Anfangsverteilung u0 (x, y) ab und erfordert die Präsenz hoher
Ortsfrequenzen, d.h., es muß U0 (α, β) = 0 für α2 + β 2 > k 2 gelten. Wir wollen das am
eindimensionalen Beispiel untersuchen.
Es gelte:
1
für |x| ≤ a2
u0 (x) =
.
0
sonst
Damit
1
0 .7 5
a sin( a2 α)
U0 (α) ∼ a
= sinc α .
( 2 α)
2
0 .5
0 .2 5
0
-1 0
−π 0 π
10
a
α
2
-0 .2 5
. .
Die wesentliche Information ist im Intervall . a2 α. ≤ π enthalten, d.h. |α| = 2π/a
ist die größte auftretende Ortsfrequenz für eine Struktur mit der Breite a. Evaneszente
Wellen treten auf für |α| > k, d.h.
2π
2π
>k=
n
a
λ
also
λ
,
n
d.h. evaneszente Wellen sind mit Strukturen verbunden, die kleiner als die Wellenlänge
sind. Die damit in Zusammenhang stehenden Informationen gehen bei der Ausbreitung
über makroskopische Distanzen ( z >> λ ) verloren.
Beispiel:
Da exp(−2π) ≈ 0, folgt für α2 = 2k 2 (a = √λ2n ), kz = 2π oder nach einer Ausbreitungslänge z = λ/n ist diese Information verloren gegangen.
Schlußfolgerung: Im homogenen Raum werden über makroskopische Distanzen nur
Informationen übertragen, die mit Strukturdetails |∆x| , |∆y| > λ/n zusammenhängen,
d.h., der freie Raum stellt für das Licht einen Tiefpaßfilter dar.
Zusammenfassend kann also die Ausbreitung einer begrenzten Feldverteilung folgendermaßen beschrieben werden:
FT−1
FT
u0 (x, y) → U0 (α, β) → U (α, β; z) = H(α, β; z)U0 (α, β) → u(x, y, z)
a<
2.6.1.2
Fresnel- (paraxiale) Näherung
→ wichtiger Spezialfall
Wenn das Ortfrequenzspektrum ’schmalbandig’ ist, d.h.,
U0 (α, β) = 0
für
43
α2 + β 2 k 2
oder anders gesagt, die ebenen Wellen, die das Bündel beschreiben, nur eine kleine Neigung
zur Ausbreitungsrichtung (paraxiale Näherung) aufweisen, kann die Größe γ =
)
2
k − α2 − β 2 in eine Potenzreihe
)
α2 + β 2
α2 + β 2
2
2
2
=
k
−
γ = k −α −β ≈k 1−
2k 2
2k
entwickelt werden und die Übertragungsfunktion HF (α, β; z) in Fresnelscher Näherung
α2 + β 2
HF (α, β; z) = exp (ikz) exp −i
z
2k
enthält nur noch homogenen Wellen. Dieser Fall tritt auf, wenn die Strukturdetails die
Bedingung |∆x| , |∆y| λ/n ≈ 10 λ/n erfüllen.
Phase
Betrag
|H|
arg H
1
kz
k
α
β
α
k
β
Damit erhält man für die Ausbreitung des Spektrums
UF (α, β; z) = HF (α, β; z)U0 (α, β).
(2.12)
Ist die Anfangsverteilung ’grob’, sind die Spektralamplituden U0 (α, β) nur für α2 + β 2 k 2 von Null verschieden. Es tragen nur paraxiale, ebene Wellen zur Übertragung der
Information bei.
In Fresnelscher Näherung kann man die Resultate im Fourierraum einfach auf den
Ortsraum übertragen. Man erhält
∞
UF (α, β; z) exp [i (αx + βy)] dαdβ
uF (x, y, z) =
−∞
∞
=
−∞
∞
=
−∞
HF (α, β; z)U0 (α, β) exp [i (αx + βy)] dαdβ
hF (x − x , y − y ; z)u0 (x , y )dx dy mit der Responsefunktion
44
hF (x, y; z) =
=
1
2π
1
2π
2 ∞
−∞
HF (α, β; z) exp [i (αx + βy)] dαdβ
2
α2 + β 2
z exp [i (αx + βy)] dαdβ.
exp −i
2k
−∞
exp (ikz)
∞
Quadratische Ergänzung im Exponenten und anschließende elementare Integration
führt auf
i
k 2
2
,
hF (x, y; z) = exp (ikz) − exp i
x +y
λz
2z
d.h., die Responsefunktion ist eine Kugelwelle in paraxialer Näherung. Man erhält
schließlich
i
uF (x, y, z) = − exp (ikz)
λz
k 2
2
dx dy .
u0 (x , y ) exp i
(x − x ) + (y − y )
2z
−∞
(2.13)
∞
In paraxialer Näherung kann die Ausbreitung
• im Fourierraum mit Gl.(2.12) und anschließender Fouriertransformation oder
• im Ortsraum unter Benutzung von Gl.(2.13).
beschrieben werden.
2.6.1.3
Die paraxiale Wellengleichung
Die Wellengleichung ist eine elliptische Differentialgleichung, d.h. die Lösung des Randwertproblems erfordert die Vorgabe der Felder auf dem gesamten Rand. Im Gegensatz
dazu erfordert die Lösung einer parabolischen DGL nur die Vorgabe der Anfangswerte.
Für eine numerische Lösung des Problems ist also eine parabolische DGL von Vorteil.
Wir zeigen, daß sich in paraxialer Näherung die Wellengleichung zu einer parabolischen
Gleichung vereinfacht.
In paraxialer Näherung gilt
UF (α, β; z) = HF (α, β; z)U0 (α, β)
α2 + β 2
= exp (ikz) exp −i
z U0 (α, β)
2k
und mit Einführung des langsam veränderlichen Spektrums V (α, β; z)
45
UF (α, β; z) = exp (ikz) V (α, β; z)
α2 + β 2
V (α, β; z) = exp −i
z V0 (α, β).
2k
erhält man
Differentiation
∂
1 2
V (α, β; z) =
α + β 2 V (α, β; z)
∂z
2k
und anschließende Fouriertransformation ergibt
∞
∞
2
1
∂
α + β 2 V (α, β; z) exp [i (αx + βy)] dαdβ
V (α, β; z) exp [i (αx + βy)] dαdβ =
i
∂z
2k
−∞
−∞
i
2
∞
∂
1
∂
∂2
i v(x, y, z) = −
+
V (α, β; z) exp [i (αx + βy)] dαdβ
∂z
2k ∂x2 ∂y 2
−∞
2
∂2
∂
1
∂
v(x, y, z)
+
i v(x, y, z) = −
∂z
2k ∂x2 ∂y 2
oder in kompakter Form
∂
1
i v(x, y, z) + ∆(2) v(x, y, z) = 0
∂z
2k
u(x, y, z) = v(x, y, z) exp (ikz) .
Das gleiche Ergebnis erhält man aus der skalaren Helmholtzgleichung, die wir jedoch
aus Gründen der Allgemeingültigkeit für inhomogene Medien aufschreiben wollen (siehe
Übungen, numerische Lösung mit der ’beam propagation method’-BPM).
∆u(x, y, z) + k 2 (r, ω)u(x, y, z) = 0
mit k 2 (r, ω) =
ω2
ε(r, ω).
c2
Wir spalten einen schnell oszillierenden Anteil ab
u(x, y, z) = v(x, y, z) exp (ik0 z)
wobei k0 ≈ k. Damit folgt für die Dynamik der langsamen Amplitude v
2
∂2
∂
(2)
2
v(x, y, z) = 0,
v(x,
y,
z)
+
2ik
v(x,
y,
z)
+
k
(r,
ω)
−
k
v(x,
y,
z)
+
∆
0
0
∂z 2
∂z
wenn man wegen |kv| |∂v/∂z| das erste Glied vernachlässigt.
Für homogene Medien (k = k0 ) erhalten wir das obige Ergebnis
1
∂
i v(x, y, z) + ∆(2) v(x, y, z) = 0.
∂z
2k
In inhomogenen Medien kann man die nun parabolische Gleichung
2
∂
k (r, ω) − k02
1 (2)
i v(x, y, z) +
v(x, y, z) = 0
∆ v(x, y, z) +
∂z
2k0
2k0
durch Vorgabe der Anfangsbedingung v(x, y, z = 0) = v0 (x, y). lösen. Zwei Methoden
sind dabei weit verbreitet, die Fast-Fourier-Transform BPM und die Finite-DifferenzenMethode (Näheres in den Übungen).
46
2.6.2
Ausbreitung eines Gauß-Bündels
→ wichtiger Spezialfall, da die transversale Laser-Fundamentalmode diese Gestalt aufweist.
Fundamentalmode im Fokus
u
0
y
x
2
x
y2
exp [iϕ(x, y)] .
u0 (x, y) = v0 (x, y) = A0 exp −
+
wx2 wy2
Wir beschränken uns auf Rotationssymmetrie (wx2 = wy2 = w02 ) und setzen im Moment
eine ’flache’ Phase voraus ϕ(x, y) = 0) (Gauß im Fokus). Die Breite ist durch
u0 (x2 + y 2 = w02 ) = A0 exp (−1)
definiert.
Die Ausbreitung wird im Ortsfrequenzraum berechnet.
1. Feld bei z = 0:
x2 + y 2
u0 (x, y) = v0 (x, y) = A0 exp −
w02
.
2. Spektrum bei z = 0:
1
U0 (α, β) = V0 (α, β) =
A0
(2π)2
∞
x2 + y 2
exp −
w02
−∞
exp [−i(αx + βy)] dxdy
A0 2
A0 2
α2 + β 2
α2 + β 2
=
=
,
w exp −
w exp −
4π 0
4/w02
4π 0
ws2
d.h. das Spektrum weist ebenfalls ein Gauß-Profil auf und das Produkt aus räumlicher und spektraler Breite ist konstant (2ws × 2w0 = 8).
47
Spektrum der Fundamentalmode im Fokus
U
0
β
α
3. Ist paraxiale Näherung erfüllt? Es gilt
U0 (α, β) ≈ 0
für (α2 + β 2 ) ≥ 16/w02 → exp (−4) . Die Bedingung für die Gültigkeit der paraxialen Näherung
k 2 α2 + β 2
ergibt
k 2 16/w02
w02
16
2 =
2π
n
λ
2λ
πn
2
2
λ
≈
,
n
d.h., die paraxiale Näherung gilt für w0 10 nλ = 10λn
4. Ausbreitung des Spektrums:
U (α, β; z) = V (α, β; z) exp (ikz)
α2 + β 2
V (α, β; z) = U0 (α, β) exp −i
z
2k
2
2
α2 + β 2
A0 2
2 (α + β )
w exp −w0
exp −i
z .
=
4π 0
4
2k
5. Rücktransformation in den Ortsraum:
A0 2
w
v(x, y, z) =
4π 0
∞
−∞
w02
2
i
2
exp − α + β
+ z exp [i (αx + βy)] dαdβ
4
2k


2
= A0


2
2
2
1
1
x +y
x +y

 = A0
 .
exp − z exp −
2iz
2iz
z
1
+
i
2
2
1 + kw2
z0
w 1+ 2
w 1+i
0
0
kw0
48
0
z0
Schlußfolgerungen:
• Gauß-Bündel behält bei der Ausbreitung Gestalt, jedoch Amplitude, Breite und
Phase ändern sich.
• zwei Parameter, Ausbreitungslänge z und Beugungsparameter z0 , bestimmen die
Eigenschaften, wobei
kw02
π
= w02 .
z0 =
2
λn
Man bezeichnet die Größe LB = 2z0 als Beugungslänge oder Rayleigh-Gebiet. Für
w0 10λn ergibt sich LB 600λn .
Beugungslänge
Man kann nun schreiben:










z
2
2


2
2
1 − i zz0
(x
+
y
)
x +y
z0
v(x, y, z) = A0
2 exp −
2  exp i
2 





1 + zz0

 w02 1 + zz

 w02 1 + zz




0




0







2
2
x +y
1
k (x + y ) 
exp [iϕ(z)] ,
= A0 exp
−
exp
i
2 
2

 2 z 1 + z0 2 
z


2
z
 w0 1 + z

z
1+
2
2
0
z0
wobei
w02 =
2z0
k
ausgenutzt wurde und
tan ϕ = −
z
z0
die Guoy-Phasenverschiebung darstellt.
Ein Gauß-Bündel läßt sich nun bequem unter Einführung von z -abhängiger Amplitude, Breite und Krümmung schreiben
2
x + y2
k (x2 + y 2 )
v(x, y, z) = A(z) exp − 2
exp i
exp [iϕ(z)]
w (z)
2 R(z)
mit:
49
1. der Amplitude
A(z) = A0 1
1
=
A
0
2
2 ,
1 + zz0
1 + L2zB
Intensität
Intensität im Nullpunkt
2. der Breite
w(z) = w0
1+
z
z0
Bündelbreite
50
2
= w0
1+
2z
LB
2
,
3. der Krümmung
6
2 7
z 2 LB
0
=z 1+
R(z) = z 1 +
z
2z
Krümmungsradius
Phasenfronten
4. und der Phase
tan ϕ = −
Phase
51
z
2z
=−−
z0
LB
2.6.2.1
Eigenschaften eines Gauß-Strahls bei der Ausbreitung
Das Verhältnis von Ausbreitungslänge z und Beugungsparameter z0 =
bestimmt die Ausbreitungseigenschaften.
kw02
2
=
π
w2
λn 0
1. z z0 : Das Gauß-Bündel ändert seine Gestalt und Phase nicht.
2. z z0 :
a) Das Produkt aus Breite und Amplitude ist konstant. → A(z)w(z) = const.
2
√
b) Bündelbreite → w(z) = w0 1 + zz0
→ w(LB ) = w0 5 ≈ 2w0 → LB bezeichnet die Beugungslänge oder Fokustiefe.
speziell für z z0 gilt w(z) ≈ w0 zz0 → w(z)/z = tan Θ0 ≈ w0 /z0
Θ0 ≈
λw0
1 λ
λ
=
→ Θ0 w0 ∼
2
πnw0
w0 πn
n
d.h., die Strahldivergenz nimmt zu mit stärkerer Fokussierung und größerer
Wellenläge.
c) Krümmung
Fläche konstanter Phase:
x2 + y 2
+ ϕ(z)
= const.
Φ(x, y, z) = k z +
2R(z)
Krümmungsradius R(z)
z 2 1 ∂2Φ ∂2Φ . 1
0
=z 1+
=
+
k ∂x2
∂y 2
R(z)
z
R(0) → ∞ ; R(z0 ) = 2z0 = Rmin ; R(z → ∞) = z
52
2.6.2.2
Zusammenhang der Parameter des Gauß-Bündels mit einem komplexen Bündelparameter q(z)
Es sei
q(z) = z − iz0
1
z
z0
1
= 2
+i 2
=
2
q(z)
z − iz0
z + z0
z + z02
=
1
z 1+
z02
z2
+i
1
z0 1 +
z2
z02
1
1
λn
=
+i 2 .
q(z)
R(z)
πw (z)
Diese Beziehung gilt für jedes z und ordnet einer bestimmten vorgegebenen Krümmung
und Bündelbreite eineindeutig einen komplexen Parameter zu, der damit das Verhalten
des Bündels vollständig beschreibt.
Beispiel: Ausbreitung im homogenen Raum um z = d
1. Vorgabe der Anfangsbedingungen:
1
λn
1
=
+i 2
q(0)
R(0)
πw (0)
2. Ausbreitung (folgt aus Definition des Parameters)
q(d) = q(0) + d
3. Bündelparameter bei z = d
1
1
λn
. 1
=
=
+i 2
q(d)
q(0) + d
R(d)
πw (d)
2.6.3
Gaußsche Optik
Die Fundamentalmoden vieler Laser weisen eine Gaußsche Intensitätsverteilung auf. Es
ist daher zweckmäßig, auf der Grundlage des komplexen q - Parameters eine einfache Beschreibung der Ausbreitung und Wechselwirkung dieser Bündel zu versuchen. Ziel ist es
für vorgegebene R0 , w0 (d.h. q0 ) die entsprechenden qn ,d.h. Rn , wn , nach dem Durchgang
durch n optische Elemente zu finden. Dabei haben wir q(zi ) durch qi ersetzt. Obwohl wir
Wellenoptik und nicht geometrische Optik betreiben, können die optischen Elemente mit
den aus der geometrischen Optik bekannten 2x2 ABCD-Matrizen beschrieben werden.
In der geometrischen Optik gilt:
A B
M̂ =
.
C D
Beim Durchgang durch mehrere Elemente multipliziert man einfach die Matrizen
53
M̂ = M̂N M̂N−1 ..M̂1 =
A B
C D
.
(2.14)
Die Matrix verbindet die Strahlabstände und die Neigungswinkel vor und nach dem
Element
r1
r2
= M̂
.
Θ2
Θ1
Bildet man den Quotienten z1 =
r1
,
Θ1
so erhält man
A r1 + B
r2
,
= Θr11
Θ2
C Θ1 + D
z2 =
Az1 + B
Cz1 + D
Diese Quotienten, die einem Abstand auf der optischen Achse entsprechen, sind über die
Matrixelemente verbunden, jedoch nicht durch eine kanonische Matrixmultiplikation. Die
Brücke zur Wellenoptik kann man jetzt schlagen, indem man folgert, daß die endliche
Bündelbreite aus dem rellen Abstand einen komplexen Parameter q macht. Damit erhält
man für die Entwicklung des q - Prameters beim Durchgang durch ein Element
q1 =
A1 q0 + B1
C1 q0 + D1
oder entsprechend beim Durchgang durch n -Elemente
qn =
Aq0 + B
Cq0 + D
mit der Matrix (2.14).
ABCD-Matrizen für ausgewählte optische Systeme:
54
1. Ausbreitung im homogenen Raum - Ausbreitungslänge d
M̂ =
1 d
0 1
2. Durchgang durch dünne Linse der Brennweite f (f < 0 für Konkavlinse)
f <0
f >0
M̂ =
1 0
− f1 1
,
3. Durchgang durch sphärische Fläche mit Krümmungsradius RS (von Medium mit
n1 in Medium mit n2 ), wobei RS < 0 für Konkavfläche.
RS > 0
RS < 0
M̂ =
1
0
1)
− (nn22−n
RS
n1
n2
4. Durchgang durch ebene Fläche (von Medium mit n1 in Medium mit n2 )
M̂ =
5. Reflexion am ebenen Spiegel
M̂ =
1 0
0 1
1
0
0
,
n1
n2
,
6. Reflexion am sphärischen Spiegel (Krümmungsradius RS )
RS > 0
RS < 0
M̂ =
7. Durchgang durch ein Schichtsystem (di , ni )
55
1
2
RS
0
1
,
,
M̂ =
1
0
8N
di
i=1 ni
1
.
Man beachte, daß nur die Entwicklung der Bündelbreite und -krümmung beschrieben
wird. Amplitudenänderungen durch Reflexionen sind nicht enthalten.
2.6.4
Gaußsche Moden in einem Resonator
2.6.4.1
Transversale Fundamentalmoden (Rotationssymmetrie)
Die Idee besteht darin, daß ein Resonator stabil sein sollte, wenn die Spiegelflächen
mit den Phasenflächen übereinstimmen. In paraxialer Näherung heißt das, daß die Krümmungsradien der Spiegel identisch mit den Krümmungsradien der Phasenflächen sein sollten.
Definitionen:
• Wegen
R(z) = z +
z02
z
ist der Radius der Phasenfläche negativ für negative z.
• Trifft das Bündel auf eine konkave Spiegelfläche, gilt für den Spiegelradius Ri (i =
1, 2) < 0.
• z1,2 bezeichne den Abstand von der Taille zum Spiegel ’1’,’2’. d sei der Abstand
der Spiegel und damit
z2 = z1 + d
Beispiele:
• R(z1 ), R(z2 ) > 0; R1 > 0, R2 < 0
56
d
0
z1
z2
• R(z1 ) < 0, R(z2 ) > 0; R1 , R2 < 0
z1
z2
0
d
Die Konsistenzbedingungen lauten nun:
R2 = −R(z2 )
R1 = R(z1 ),
R1 = z1 +
Ersetzen von z02 ergibt
z02
,
z1
−R2 = z2 +
z02
.
z2
z1 (R1 − z1 ) = −z2 (R2 + z2 )
und mit z2 = z1 + d erhält man
z1 = −
d (R2 + d)
,
R1 + R2 + 2d
d.h. bei Vorgabe von R1 , R2 , d folgt die Lage der Moden im Resonator. Die Stabilität
der Moden wird dadurch bestimmt, daß die Bedingung
z02 = R1 z1 − z12 = −
d (R1 + d) (R2 + d) (R1 + R2 + d)
(R1 + R2 + 2d)2
(2.15)
erfüllt sein muß. Gleichzeitig folgt aus z02 die Taillenbreite w0 . Nach einigen Umformungen
folgt aus Gl.(2.15) die Stabilitätsbedingung eines Resonators
d
d
1+
≤1
0≤ 1+
R1
R2
57
oder die Hyperbelgleichung
0 ≤ g1 g2 ≤ 1.
In der Abbildung sind die Gebiete zwischen den Koordinatenachsen und den Hyperbeln
stabil.
Die beiden folgenden Konfigurationen sind Beispiele für einen stabilen bzw. instabilen
Resonator:
b1 ) R1 , R2 < 0; |R1 | = d + ε1 , |R2 | = d + ε2 ; 0 ≤ ε1 ε2 ≤ d2 ε1 ε2 ≥ 0 stabil
b2 ) ε1 ε2 < 0 instabil
58
Folgende Faustregeln hinsichtlich der Dimensionierung stabiler Resonatoren lassen sich
aufstellen:
• beide Spiegel sind konkav
1. Beide Mittelpunkte der entsprechenden Kreise müssen außerhalb des Resonators liegen.
2. Beide Mittelpunkte müssen innen und näher zum entprechenden anderen Spiegel liegen.
instabil
stabil
• ein Spiegel ist konvex, der andere konkav
Beide Mittelpunkte müssen jenseits eines Spiegels liegen, wobei der Mittelpunkt
des Konvexspiegels weiter entfernt vom Resonator liegen muß.
instabil
stabil
59
Instabile Resonatoren sind für high-gain-Laser interessant, da wegen der großen Verluste
das stärkste Modenfeld selektiert wird.
Gauß-Bündel sind Lösungen der paraxialen Wellengleichung. Gleichzeitig sind sie die
Normalmoden von Resonatoren mit gekrümmten Spiegeln (ebene Spiegel sind Grenzfall). Damit kann ein beliebiges Feld nach einem vollständigen Satz von Resonatormoden
entwickelt werden → siehe nächstes Unterkapitel.
2.6.4.2
Bemerkungen zu Moden höherer Ordnung
Das Ziel besteht im Auffinden des gesamten Modensatzes. Die bisher behandelte Fundamentalmode ist forminvariant, unterliegt aber der Beugung. Trotzdem kann diese Mode
als eine longitudinale Normalmode des Resonators angesehen werden, da sie unveränderlich im Resonator existiert. Die Fundamentalmode ist rotationssymmetrisch in Amplitude und Phase. Die Konsistenzbedingung bezog sich nur auf die Phasenfläche. Moden mit
gleicher Phasenfläche, aber azimuthal variierender Intensitätsverteilung sollten ebenfalls
diese Bedingung erfüllen. Für die Gaußche Mode galt bisher
2
w0
x + y2
k x2 + y 2
exp − 2
exp i
exp [iϕ(z)] .
vG (x, y, z) = A
w(z)
w (z)
2 R(z)
Wir verallgemeinern den Ansatz ( x, y -Abhängigkeit der Phase bleibt erhalten)
v(x, y, z) = X
√
√ y
x
2
2
Y
vG (x, y, z).
w(z)
w(z)
Einsetzen in die paraxiale Wellengleichung ergibt eine Eigenwertgleichung mit den Eigenwerten l und m und den hermiteschen Polynomen als Eigenfunktionen, wenn man berücksichtigt, daß vG (x, y, z) Lösung der paraxialen Wellengleichung ist. Die Gesamtlösung
(mit schnellen Phasenanteilen) schreibt sich dann
√ x
√ y
w0
ul,m (x, y, z) = Al,m
2
2
Gl
Gm
w(z)
w(z)
w(z)
2
k x + y2
exp (ikz) exp [i(l + m + 1)ϕ(z)] .
exp i
2 R(z)
mit
u2
Gl (u) = Hl (u) exp −
2
60
und den hermiteschen Polynomen Hl (u) ( H0 = 1, H1 = 2u und Hl+1 = 2uHl −
2lHl−1 ).
Aus der Orthogonalität der Gauß-Hermite-Polynome
∞
√
Gl (x)Gm (x)dx = π2l lδlm
−∞
folgt die Orthogonalität der Resonatormoden
∞
ulm (x, y)u∗l m (x, y)dxdy ∼ δll δmm .
−∞
Damit kann ein beliebiges Feld im Resonator nach diesen Moden entwickelt werden
u(x, y, z) =
Al,m ulm (x, y, z),
l,m
wobei die Entwicklungskoeffizienten aus dem Eingangsfeld folgen
Al,m ∼ u0 (x, y)ulm (x, y, 0)dxdy.
Durch Störungen (Spiegelinhomogenitäten, Nichtlinearitäten etc.) können diese Moden
koppeln.
61
2.6.5
Ausbreitung von Impulsen
2.6.5.1
Pulse mit endlicher transversaler Breite (gepulste Bündel)
Bisher: transversal begrenztes Wellenfeld (Strahl), aber monochromatisch −→ ω festgelegt −→ k(ω) fest −→ cw-Laser
aber: für viele Anwendungen sind Impulse im Bereich von 100 fs - 100 ps von Interesse
(Spektroskopie, nichtlineare Optik)
Zeit- und Frequenzskalen:
Pulsenveloppe:
10−13 s ≤ T0 ≤ 10−10 s
Mittenfrequenz:
ω0 = 2πν ∼ 4·1015 Hz −→ Schwingungsdauer Ts = 2π/ω0 ≈
1.6 fs
Spektrum des Pulses (z.B. Gauß):
t2
f (t) = exp (−iω0 t) exp − 2
T0
6
(ω − ω0 )2
F (ω) ∼ exp −
4/T02
−→
spektrale Breite:
7
→ ωs2 =
4
→ ωs T0 = 2
T02
4·1010 Hz ≤ ωs ≤ 4·1013 Hz −→ ωs << ω0 −→ ω−ω0 << ω0
Folgerung: Statt die komplizierte, im allgemeinen nicht analytisch vorliegende, Dispersionsrelation k(ω) zu benutzen, kann man eine Taylorentwicklung bei ω = ω0 vornehmen
und damit die Dispersionseigenschaften in parabolischer oder kubischer Näherung beschreiben.
k
ωs
ω0
62
ω
.
.
∂k ..
1 ∂ 2 k ..
k(ω) ≈ k (ω0 ) +
(ω − ω0 ) +
(ω − ω0 )2 + ..
.
.
2
∂ω ω0
2 ∂ω ω0
k (ω0 ) = k0 , →
1
k0
n (ω0 )
=
=
−→ Phasengeschwindigkeit
vPh
ω0
c
.
1
∂k ..
=
−→ Gruppengeschwindigkeit
vg
∂ω .ω0
.
∂ 2 k ..
Dω =
−→ Dispersion der Gruppengeschwindigkeit
∂ω 2 .ω0
Damit
·
·
·
ist die komplizierte Dispersionsrelation auf drei Größen zurückgeführt:
Phasengeschwindigkeit
Gruppengeschwindigkeit
Dispersion der Gruppengeschwindigkeit
a) Gruppengeschwindigkeit −→ Ausbreitungsgeschwindigkeit des Pulszentrums.
Mit
6
. 7
ω
1
1
∂n ..
k(ω) = n(ω) −→
=
n(ω0 ) + ω0
c
vg
c
∂ω .ω0
c
n(ω0 )
= vPH
.
∂n .
ng (ω0 )
n(ω0 ) + ω0 ∂ω
ω0
vg = .
∂n ..
ng (ω0 ) = n(ω0 ) + ω0
−→ Gruppenindex
∂ω .ω0
normale Dispersion:
anormale Dispersion:
∂n/∂ω > 0 vg < vPH , ng > n
∂n/∂ω < 0 vg > vPH , ng < n
b) Dispersion der Gruppengeschwindigkeit (GVD) (manchmal einfach Dispersion)−→
verantwortlich für Änderung der Pulsform bei der Ausbreitung
. 2
ps
∂ 2 k ..
D = Dω =
.
∂ω 2 ω0 km
manchmal auch (optische Kommunikation):
2π
∂
1
Dλ =
= − 2 cDω
∂λ vg
λ
63
Achtung wegen Vorzeichen!
wichtig für spätere Diskussion (bei veränderlicher Frequenz unter dem Puls) −→
chirp:
∂
D=
∂ω
1
vg
=−
1 ∂vg
vg2 ∂ω
−→ D > 0 ∂vg
<0
∂ω
−→ D < 0 ∂vg
>0
∂ω
Ausgangspunkt ist die skalare Helmholtzgleichung:
ω2
∆ u(r, ω) + 2 ε(ω) u(r, ω) = 0
c
(2.16)
wobei ω jetzt eine beliebige Fourierkomponente des Feldes darstellt. Es gilt weiterhin
die Dispersionsrelation
k 2 (ω) =
ω2
ε(ω).
c2
Für die Entwicklung des Fourierspektrums gilt
U (α, β, ω; z) = U0 (α, β, ω) exp [iγ (α, β, ω) z]
mit
γ (α, β, ω) =
)
k 2 (ω) − α2 − β 2
.
64
(2.17)
Das Anfangsspektrum bei z = 0 U0 (α, β, ω) ist die Fouriertransformierte der Feldverteilung
1
U0 (α, β, ω) =
(2π)3
∞
−∞
u0 (x, y, t) exp [−i (αx + βy − ωt)] dxdydt
In Fresnelscher (paraxialer) Näherung (k 2 (ω) >> α2 + β 2 ) ergibt sich aus 2.17
α2 + β 2
U (α, β, ω; z) ≈ U0 (α, β, ω) exp [ik (ω) z] exp −i
z
2k (ω)
und damit die Übertragungsfunktion für Pulse in Fresnelscher Näherung
α2 + β 2
HFP (α, β, ω; z) = exp [ik (ω) z] exp −i
z
2k (ω)
Durch Einsetzen der Taylorentwicklung von k(ω) in ersten Term und Ersetzen von
k(ω) ≈ k(ω0 ) = k0 (gilt nicht für extrem kurze Impulse T0 15 fs) im zweiten Term
erhält man die parabolische Näherung der Übertragungsfunktion
1
D
α2 + β 2
2
HFP (α, β, ω; z) ≈ exp [ik0 z] exp i (ω − ω0 ) z exp i (ω − ω0 ) z exp −i
z
vg
2
2k0
(2.18)
1
α2 + β 2
ω
(2.19)
+ Dω 2 −
= exp [ik0 z] exp i z
vg 2
2k0
= exp [ik0 z] H FP (α, β, ω; z)
wobei H FP (α, β, ω; z) den in z langsam variierenden Teil der Übertragungsfunktion
darstellt.
Damit ergibt sich für das Gesamtfeld u(x, y, z, t)
u(x, y, z, t) = exp [ik0 z]
−∞
= exp [i (k0 z − ω0 t)]
∞
∞
−∞
U0 (α, β, ω)H FP (α, β, ω; z) exp [i (αx + βy − ωt)] dαdβdω
U0 (α, β, ω)H FP (α, β, ω; z) exp [i (αx + βy − ωt)] dαdβdω
Einführung der langsam variierenden Amplitude
u(x, y, z, t) = v(x, y, z, t) exp [i (k0 z − ω0 t)]
65
führt auf:
∞
v(x, y, z, t) =
−∞
U0 (α, β, ω)H FP (α, β, ω; z) exp [i (αx + βy − ωt)] dαdβdω
Das Spektrum des Gesamtanfangsfeldes ist noch durch das Spektrum des ’langsamen’
Feldes zu ersetzen:
u0 (x, y, t) = v0 (x, y, t) exp (−iω0 t)
1
U0 (α, β, ω) =
(2π)3
∞
−∞
v0 (x, y, t) exp [−i (αx + βy − ωt)] dxdydt
= V0 (α, β, ω)
∞
v(x, y, z, t) =
−∞
z
dαdβdω
V0 (α, β, ω)HFP (α, β, ω; z) exp i αx + βy − ω t −
vg
−∞
=
V0 (α, β, ω)H FP (α, β, ω; z) exp [i (αx + βy − ωt)] dαdβdω
∞
wobei der lineare Term aus der Transmissionsfunktion separiert worden ist. Führt
man die sog. ’mitgeführte’ Zeit des Impulses
τ =t−
z
vg
ein und schreibt schließlich die Transmissionsfunktion aus, erhält man die langsame
Amplitude im mitgeführten Bezugssystem
z
α2 + β 2
2
Dω −
exp {i [αx + βy − ωτ ]} dαdβdω
V0 (α, β, ω) exp i
2
k0
−∞
ṽ(x, y, z, τ ) =
∞
Für das Gesamtfeld gilt dann:
u(x, y, z, t) = ṽ(x, y, z, τ ) exp [i (k0 z − ω0 t)]
Damit ist die Evolution eines beliebigen Eingangsimpulses endlicher transversaler
Dimension vollständig beschrieben.
Die Analogie zwischen Beugungs-und Dispersionseffekten kann leicht hergestellt werden, wenn man erhält eine dreidimensionale Verallgemeinerung der Beugung:
66
→
v(−
µ , τ) =
z−
→ →2 →
→
→
→
ρ −
µ ) d−
ρ
ρ exp (i−
V0 (−
ρ ) exp i δ −
2




 1 
−
α
x
−
→  k10 
−
→
−
→




β
− k0
y
ρ =
,µ =
, δ =
ω
−τ
D
Man erkennt leicht den Zusammenhang: D ←→ −1/k0 ,dabei gilt zu beachten,daß
D ≷ 0.
Aus der Entwicklung des Spektrums gelingt es wieder, eine Differentialgleichung für
die langsame Amplitude abzuleiten:
z
α2 + β 2
2
Dω −
V (α, β, ω; z) = V0 (α, β, ω) exp i
2
k0
Differenzieren ergibt:
∂V (α, β, ω; z)
1
i
=−
∂z
2
α2 + β 2
Dω −
k0
2
V (α, β, ω; z)
Fourier-Rücktransformation führt auf die gewünschte DGL:
i
∂v(x, y, z, τ ) D ∂ 2
1 (2)
v(x, y, z, τ ) +
∆ v(x, y, z, τ ) = 0
−
2
∂z
2 ∂τ
2k0
(2.20)
→ paraxiale Gleichung zur Beschreibung der Impulsausbreitung. Für D = 0 wird der
Fall der ’einfachen’ Beugung reproduziert.
2.6.5.2
Unendliche transversale Ausdehnung
Spezialfall: α = β = 0 → nur eine Ortsfrequenz in z-Richtung, ebene Welle
1. Anfangsverteilung:
u0 (t) = v0 (t) exp (−iω0 t)
2. Anfangsspektrum:
V0 (ω) = U0 (ω)
3. Entwicklung des Spektrums:
D 2
V (ω; z) = exp i z ω V0 (ω)
2
−→ Rücktransformation mit τ
67
4. Entwicklung der Amplitude:
D 2
ṽ(z, τ ) =
V0 (ω) exp i z ω exp [−i ωτ ] dω
2
−∞
∞
Die Fouriertransformation der Übertragungsfunktion
D 2
HP (ω; z) = exp i z ω
2
ergibt die zeitliche Responsefunktion
6
7
2
(τ
−
t
2
)
exp −i
hP (τ − t ; z) =
−iπDz
2Dz
Damit kann man im Zeitraum schreiben:
∞
ṽ(z, τ ) =
−∞
hP (τ − t ; z)v0 (t )dt
Die Differentialgleichung für die langsame Amplitude ergibt sich aus (2.20) zu
i
∂v(z, τ ) D ∂ 2
v(z, τ ) = 0
−
∂z
2 ∂τ 2
(2.21)
Aus (2.21) kann man nochmals einfach die Analogie zwischen Beugungs- und Dispersionseffekten ablesen
(α, β) ←→ ω, (x, y) ←→ τ, ∇ ←→
2.6.5.3
∂ 1
,
←→ −D, aber :D ≶ 0.
∂τ k0
Beispiel: Chirpfreier Gauß-Impuls
→ Analogie zur Beugung ausnutzen 1. Anfangsverteilung −→ chirpfreier Impuls
u0
u0
e
2T0
τ
68
t2
u0 (t) = A exp − 2
T0
2. Anfangsspektrum:
τ2
exp (−iω0 t) → v0 (τ ) = A exp − 2
T0
T0
ω 2 T02
V0 (ω) = A √ exp −
4
π
spektrale Breite: ωs2 = 4/T02
Ergebnisse von Ausbreitung eines Gauß-Strahles ausnutzen:
z0 beschreibt Gauß
z0 =
k 2
w
2 0
=−
1 T02
≷0
2D
Dispersionslänge: LD = 2 |z0 |
3. damit folgt aus Analogie zur Ausbreitung eines Bündels die Entwicklung der Amplitude:
i
τ2
τ2
T0
exp −
exp −
exp [i ϕ(z)]
v(z, τ ) = A
T (z)
T (z)2
2D R(z)
mit
9
:
A(z) = A:
;
4
1
2 ,
1+
T (z) = T0
1+
z
z0
z
z0
2
’Krümmung’ ist für Impuls keine passende Größe → Einführung des Chirps
Erinnerung:
∂2
∂2
+
∂x2 ∂y 2
Φ(x, y) =
k
R(z)
für monochromatische Felder galt:
Φ(τ ) = −ωτ
−→
−
∂Φ(τ )
=ω
∂τ
Verallgemeinerung auf beliebige Zeitabhängigkeit der (Gesamt)-Phase
−
∂Φ(τ )
= ω(τ )
∂τ
und
−
∂ 2 Φ(τ )
= chirp
∂τ 2
Man führt den ’chirp’ als dimensionslose Größe ein (parabolische Näherung):
69
T02 ∂ 2 Φ(τ )
C=−
2 ∂τ 2
damit wird die variable Frequenz unter dem Puls
−
∂Φ(τ )
τ
= ω(τ ) = ω0 + 2C
∂τ
T0
C > 0 −→ up-chirp
C < 0 −→ down-chirp
τ
τ
Man hat nun die Krümmung R(z) durch den chip C(z) zu ersetzen:
Φ(τ ) = −ω0 τ −
τ2
τ2
≡ −ω0 τ − C(z) 2
2DR(z)
T0
Mit
R(z) =
−→ C(z) =
T02
z0
=−
2DR(z)
R(z)
z0 z
z 2 + z02
z
−→ C(z) = − 2
=− 2
z
z + z0
z0 1 +
z2
z02
Achtung: Der Chirp trägt das Vorzeichen von z0 und damit von D.
Damit ergibt sich für das Gesamtfeld:
u(z, τ ) = A
τ2
τ2
T0
exp −iC(z) 2 exp [i ϕ(z)] exp [i (k0 z − ω0 t)]
exp −
T (z)
T (z)2
T0
Physikalisch ist die Situation ähnlich zu der beim Bündel. Die entscheidende Größe
ist der Dispersionsparameter
z0 = −
70
T02
2D
1) z << |z0 |: keine Effekte
2) z ≈ |z0 |: wie bei Bündel
3) D ≶ 0 spielt nur bei chirp eine Rolle, da sonst quadratisch.
2.6.5.4
Beispiel: Gechirpter Gauß-Impuls
Oftmals generieren Laser gechirpte Impulse oder man erzeugt sich den Chirp gezielt, um
den Puls zu komprimieren. Diese Kompression kann man in Analogie zur Strahlausbreitung erwarten (gekrümmte Phase −→ Fokussierung).
Ein gechirpter Eingangsimpuls hat die Form
2
τ (1 + iC0 )
.
v0 (τ ) = A exp −
T02
Durch Fouriertransformation erhält man das Spektrum
ω 2 T02 (1 − iC0 )
V0 (ω) = A exp −
.
4(1 + C02 )
Damit ergibt sich die spektrale Breite zu
ω 2s =
4(1 + C02 )
.
T02
Ein gechirpter Puls ist immer spektral breiter als ein ungechirpter (ω 2s = 4/T02 ) −→
transformationsbegrenzt.
Das Ziel besteht nun darin, Pulsbreite und Chirp in Abhängigkeit von den Eingangsparametern zu berechnen. Da ein gaußförmiger Strahl vollständig vom q-Parameter
beschrieben wird, kann man das auch von einem Gauß-Impuls erwarten. Wir nutzen diese
Analogie aus.
Bei Ausbreitung im homogenen Raum gilt:
71
q(z) = q(0) + z.
(2.22)
Wir erinnern uns an den Zusammenhang von q-Parameter und Strahlparametern
1
2
1
=
+i 2 .
q(z)
R(z)
kw (z)
Durch Ausnutzen der Analogie zwischen Beugung und Dispersion können wir den qParameter des Impulses mit Pulslänge und Chirp in Zusammenahn bringen. Wir ersetzen:
k −→ −
2DC(z)
1
1
, w2 (z) −→ T 2 (z),
−→
D
R(z)
T02
und erhalten
1
T02
2D
2DC(z)
2D
−i 2
=
= 2 C(z) − i 2
.
q(z)
T02
T (z)
T0
T (z)
(2.23)
Man beachte, daß T0 mit der Pulsbreite bei z = 0 und nicht in der Taille zusammenhängt.
Als Eingangsgröße (z = 0) erhält man aus 2.23
2D
1
= 2 [C0 − i]
q(0)
T0
(2.24)
wobei C0 = C(0).
Die Idee besteht nun darin, Gl.(2.24) in Gl.(2.22) einzusetzen und mit Gl.(2.23)
gleichzusetzen. Da sowohl Real- als auch Imaginärteil identisch sein müssen, erhält man
zwei Gleichungen für die fünf Größen C0 , T0 , z, C(z), T (z), d.h. man muß sich drei dieser
Größen vorgeben.
Man geht folgendermaßen vor, um die Pulsparameter bei z = d zu berechnen:
1) q-Parameter am Eingang
q(0) =
T02 (C0 + i)
2D (1 + C02 )
(2.25)
2) Entwicklung des q-Parameters
q(d) = q(0) + d =
T02 (C0 + i)
1
+d =
2Dd 1 + C02 + C0 T02 + iT02 (2.26)
2
2
2D (1 + C0 )
2D (1 + C0 )
3) Invertieren von Gl. 2.23 ergibt
q(d) =
T02 T 2 (d)
C(d)T 2 (d) + iT02
4
2
4
2D [C (d)T (d) + T0 ]
72
(2.27)
4) Gleichsetzen von 2.26 und 2.27 führt auf
[2Dd (1 + C02 ) + C0 T02 ]
C(d)T02 T 4 (d)
=
(1 + C02 )
[C 2 (d)T 4 (d) + T04 ]
T02 T 2 (d)
1
=
(1 + C02 )
[C 2 (d)T 4 (d) + T04 ]
Bei Vorgabe von drei relevanten Größen lassen sich daraus die zwei gewünschten Größen
berechnen.
Ein wichtiger Spezialfall ist dadurch gegeben, daß man fragt, an welcher Stelle ein gechirpter Puls seine größte Kompression (Taille) erreicht und wie groß die Kompression
ist.
Vorgegeben sind damit: C0 , T0 , C(d) = 0 (Taille) und die Gleichungen vereinfachen sich
zu:
2Dd 1 + C02 + C0 T02 = 0 −→ d = −
T 2 (z) =
C0 T02
1
C0
= − sgn(D)
LD
2
2D (1 + C0 )
2
(1 + C02 )
T02
(1 + C02 )
Schlußfolgerungen:
1) Ein Puls kann komprimiert werden, wenn das Produkt aus Anfangschirp und Dispersion negativ ist −→ C0 D < 0.
2) Die Kompression ist umso größer je größer der Anfangschirp ist.
Physikalische Interpretation:
z.B. C0 < 0 und D > 0 −→ ∂vg /∂ω < 0 −→’blau’ schneller als ’rot’
73
−→ der ’rote Schwanz’ überholt die ’blaue Front’ −→ bis C(z) = 0 (Taille), d.h. der
Puls wird kompromiert. Bei der weiteren Ausbreitung wird C(z) > 0 und damit die ’rote
Front’ schneller als der ’blaue Schwanz’ , d.h., der Puls wird breiter.
Experiment:
• Ausbreitung im nichtlinearen Medium (Selbstphasenmodulation) −→ C < 0 −→
anschließend Ausbreitung in Medium mit D > 0 −→ Kompression (Faktor 5 ist
typisch)
• Halbleiterlaser liefern gechirpten Puls
hier Analogie weiterführen (chirper) IEEE JQE 26 (90)1158
2.6.5.5
Beispiel: Ausbreitung eines Gauß-Impulses mit endlicher Breite
−→ optisches Bullet
Zur expliziten Berechnung nutzt man die in Kapitel 2.6.1.1 abgeleitetet Ergebnisse
(insbesondere Gl.(2.18), die für jede beliebige Anfangsverteilung (nicht auf Gauß beschränkt) gelten.
Hier beschränken wir uns auf ein raum-zeitliches Gauß-Profil.
1. Eingangsfeld:
2
x + y2
τ2
v0 (x, y, τ ) = A exp − 2 exp −
T0
w02
2. Feld nach Ausbreitung :
v(x, y, z, τ ) = A
τ2
T0 w0
x2 + y 2
exp −
exp − 2
T (z) w(z)
T (z)2
w (z)
τ2
x2 + y 2
exp ik0
exp −iC(z) 2 exp [i ϕ(z)] exp [i (k0 z − ω0 t)]
2R(z)
T0
u(x, y, z, τ ) = v(x, y, z, τ ) exp {i [k0 z − ω0 (τ − z/vg )]}
mit
T (z) = T0
1+
2z
Ld
2
,
w(z) = w0
−1
2z
2z sgn(D)
1+
C(z) =
,
Ld
Ld
Ld =
T02
,
|D|
Lb = kw02
74
1+
6
R(z) = z 1 +
2z
Lb
Lb
2z
2
,
2 7
Eine Verallgemeinerung auf Gauß-Hermite- bzw. Gauß-Laguerre-Moden ist möglich (im
Resonator).
75
Kapitel 3
Beugungstheorie
3.1
Wechselwirkung mit ebenen Schirmen
a) Beugung im weiteren Sinne −→ Ausbreitung eines räumlich begrenzten Wellenfeldes
in einem Halbraum −→ Problem bisher behandelt.
b) Beugung historisch −→ Feld trifft auf Hindernis −→ WW induziert Polarisation, die
ein Sekundärfeld abstrahlt −→ Interferenz führt zum Beugungsbild
−→ vektorielles Randwertproblem −→ vektorielles Randwertproblem selbstkonsistent zu
lösen
Es gibt nur wenige strenge Lösungen −→ keine große praktische Bedeutung
Näherungen:
a) geometrische Optik −→ Schatten
b) skalare Beugungstheorie mit Näherungen für die Wechselwirkung −→ von der Apertur
gehen Erregungen mit bestimmten Amplituden aus −→ Interferenz
Die Wechselwirkung mit der Apertur wird durch eine komplexe Transferfunktion t(x, y)
beschrieben, wobei gilt, daß t(x, y) = 0 außerhalb der Apertur.
Damit reduziert sich das Beugungsproblem auf drei verschiedene Prozesse:
1. Ausbreitung von der Lichtquelle zur Apertur
2. Multiplikation der Feldverteilung mit der Transferfunktion
3. Ausbreitung der modifizierten Feldverteilung hinter der Apertur
Problem ’1’ spielt für viele Anwendungen keine Roll, da man eine ebene Beleuchtungswelle (keine Beugung) voraussetzt.
Wechselwirkung mit der Apertur
u+ (x, y, zA ) = t(x, y)u− (x, y, zA )
Ausbreitung nach der Apertur
76
∞
u(x, y, z) =
h (x − x , y − y , z − zA ) u+ (x , y , zA )dx dy −∞
oder
∞
H (α, β; z − zA ) U+ (α, β; zA ) exp [i (αx + βy)] dαdβ,
u(x, y, z) =
−∞
wobei
h=
1
FT [H]
(2π)2
und im folgenden wird zB = z − zA eingeführt.
Die Ausbreitung im Halbraum hinter der Apertur kann exakt oder in verschiedenen
Näherungen (Fresnel, Fraunhofer) beschrieben werden.
3.2
Beschreibung der Ausbreitung in verschiedenen
Näherungen
3.2.1
Der allgemeine Fall - kleine Öffnungen, große Öffnungswinkel
Die Übertragubgsfunktion wurde im Kapitel 2.6.1 abgeleitet. Wir erinnern uns:
H (α, β; zB ) = exp (iγzB )
mit
2
γ = k 2 (ω) − α2 − β 2 .
Es bestehen keinerlei Beschränkungen bzgl. der Ortsfrequenzen α, β, d.h., es treten
sowohl homogene als auch evaneszente Wellen auf. Es sind beliebig kleine Aperturstrukturen zugelassen. Dazu benutzt man die sog. Weyl-Darstellung der Kugelwelle (Winkelspektrum der Kugelwelle).
1
i
exp (ikr) =
r
2π
∞
−∞
1
exp [i (αx + βy + γzB )] dαdβ
γ
Die Kugelwelle ist die Green’sche Funktion der Helmholtzgleichung im homogenen
Raum.
Daraus folgt durch einfaches Differenzieren:
77
∞
∂ 1
exp (ikr) =
−2π
exp [i (αx + βy + γzB )] dαdβ = FT [H] = (2π)2 h
∂z r
−∞
1 ∂ 1
h (x, y, zB ) = −
exp (ikr)
2π ∂z r
mit r =
x2 + y 2 + zB2 . Damit wird die Beugung durch die Rayleigh-Formel
∞
u(x, y, z) =
h (x − x , y − y , zB ) u+ (x , y , zA )dx dy −∞
beschrieben. h (x − x , y − y , zB ) bezeichnet man auch als Green’sche Funktion der
Helmholtzgleichung im homogenen Halbraum.
Man kann sich aus der Übertragungsfunktion die Responsefunktion im Ortsraum
beschaffen.
3.2.2
Fresnelnäherung - paraxial
Wenn α2 + β 2 << k 2 (eingeschränktes Ortsfrequenzspektrum −→ bestimmte minimale
Größe der Variationen in der Apertur), kann man die oben abgeleiteten Übertragungsund Responsefunktionen benutzen.
z B
α2 + β 2
HF (α, β; zB ) = exp (ikzB ) exp −i
2k
i
k 2
2
hF (x, y, zB ) = −
x +y
exp (ikzB ) exp i
λzB
2zB
Das gleiche Ergebnis erhält man, wenn h (x, y, zB ) im Ortsraum entwickelt wird.
3.2.3
Fraunhofernäherung - paraxial und Fernfeld
α2 + β 2 << k 2 ,
kzB >> 1 −→ zB >> λ
zusätzliche Forderung (Begründung später) für Fresnelzahl NF
NF 0.1
mit
NF =
Ableitung aus Fresnelnäherung mit
Methode der stationären Phase:
Zu berechnen ist das Integral
78
a a
1 z0
=
λ zB
π zB
I=
g(p, q) exp [iκf (p, q)] dpdq
Die näherungsweise Berechnung kann erfolgen, wenn κ >> 1 und g(p, q) langsam veränderlich ist.
Idee: Wenn κ >> 1, oszilliert der Expomnt im Integranden schon bei kleinen Änderungen
von f (p, q) stark −→ durch die Integration heben sich diese Beiträge heraus.
Ausnahme: stationäre Punkte pm , qm
∂f ∂f = fp |pm ,qm = 0,
= fq |pm ,qm = 0
∂p pm ,qm
∂q pm ,qm
Das Integral läßt sich dann näherungsweise als eine Summe über die stationären Punkte
darstellen:
M
1
2π g (pm , qm ) exp [iκf (pm , qm )]
I=
iκ m=1 fpp(m) fqq(m) − f 2
pq(m)
Das Beugungsfeld in Fresnelnäherung ergibt sich zu
∞
uF (x, y, zB ) =
−∞
z B
U+ (α, β; zA ) exp (ikzB ) exp −i
α2 + β 2 exp [i (αx + βy)] dαdβ
2k
Anwendung der Methode der stationären Phase:
∞
uF (x, y, zB ) = exp (ikzB )
−∞
α x
1 α2 β 2
β y
−
dαdβ
U+ (α, β; zA ) exp ikzB
+
+ 2
k zB k zB
2 k2
k
Mit den Abkürzungen:
p=
α
,
k
q=
f (p, q) = p
β
,
k
κ = kzB >> 1
x
y
1 2
+q −
p + q2
zB
zB 2
folgt daraus:
uF (x, y, zB ) = k 2 exp (iκ)
∞
U+ (kp, kq; zA ) exp [iκf (p, q)] dpdq
−∞
Die Ableitungen lauten
79
(3.1)
x
∂f
− p,
=
∂p
zB
∂ 2f
∂2f
=
= −1,
∂p2
∂q 2
∂f
y
− q,
=
∂q
zB
∂2f
=0
∂p∂q
damit ergeben sich die stationären Punkte:
p1 =
x
,
zB
q1 =
y
x2 + y 2
−→ f (p1 , q1 ) =
zB
2zB
Das Beugungsfeld in Fraunhofernäherung ergibt sich dann zu:
2π 2
x
y
k
2
2
uFR (x, y, zB ) =
k exp (ikzB ) U+ (k , k ; zA ) exp i
(x + y )
ikzB
zB zB
2zB
x
y
k
(2π)2
2
2
exp (ikzB ) U+ (k , k ; zA ) exp i
(x + y )
= −i
λzB
zB zB
2zB
−→
in Fraunhoferscher Näherung ist die Amplitudenverteilung des Beugungsbildes
proportional zur Fouriertransformierten des Feldes hinter der Apertur
(2π)4
I=
(λzB )2
2
x
y
U+ (k , k )
zB zB Interpretation:
An jedem Ort x, y trägt nur eine Ortsfrequenz α = k zxB ; β = k zyB mit der entsprechenden Spektralamplitude U+ (k zxB , k zyB ; zA ) zum Beugungsbild bei (i.a. tragen alle Ortsfrequenzen bei).
Warum muß die Bedingung
NF =
a a
0.1
λ zB
erfüllt sein?
zwei wesentliche Quotienten: Apertur/Wellenlänge und Apertur/Abstand
Idee:
80
• f (p, q) muß schnell im Vergleich zu U (p, q) abklingen −→ U (p, q) ≈ const. an
stationären Punkten
• schnelles Abklingen von U (p, q) wird durch Apertur und nicht durch kleine Strukturen bestimmt
Wir zeigen das für den eindimensionalen Fall:
a) spektrale Breite im Exponenten
ps
f
1 ∂ 2 f f (p) ≈ f (ps ) +
(p − ps )2
2 ∂p2 ps
2
x2
1
x
=
−
p−
2zB 2
zB
p
Interpretation:
1 ∂ 2 f (p − ps )2
f (p) ≈ f (ps ) +
2 ∂p2 ps
2
x2
1
x
=
−
p−
2zB 2
zB
Damit ergibt sich für den Exponenten (Phase) in (3.1)
kx2 1 zB
kzB f (p) ≈
−
2zB 2 k
kx
α−
zB
2
damit ergibt sich für die spektrale Breite:
ws2
2k
=
zB
−→
π
2ws = 4
λzB
b) spektrale Breite von U (p, q) :
Apertur −→ a −→ αa = 2π/a −→ Breite = 4π/a
81
Mit der Forderungen, dass U (p, q) sich langsamer ändert als der Exponent folgt:
a2
π
4π/a >> 4
−→ NF =
<< π
λzB
λz
q.e.d.
Damit ergibt sich (im eindimensionalen Fall) für die Gültigkeit der Fraunhofernäherung:
1)
a2 << k 2
−→
∆x >> λ
2)
kzB >> 1
−→
zB >> λ
3)
NF =
a2
λz
<< 1
Beispiel: ∆x = 10λ,
3.3
−→
zB >>
a = 100λ
a2
λ
zB >> 104 λ ≈ 1 cm
−→
Fraunhoferbeugung an ebenen Schirmen
Beleuchtungswelle:
• senkrecht
u− (x, y, zA ) = A exp (ikz zA )
• schräg
u− (x, y, zA ) = A exp [i (kx x + ky y + kz zA )]
Beugungsbild:
(2π)4
I(x, y, zB ) = |u(x, y, zB )| =
(λzB )2
2
−→
2
U+ (k x , k y )
zB zB Spektrum nach Schirm bei α = k zxB , β = k zyB
82
Spektrum:
Feld nach Schirm:
u+ (x, y, zA ) = u− (x, y, zA )t(x, y) = A exp [i (kx x + ky y + kz zA )] t(x, y)
x
y
A
exp (ikz zA )
U+ (k , k ) =
zB zB
(2π)2
= A exp (ikz zA ) T
∞
−∞
x
y
t(x , y ) exp −i k − kx x + k − ky y dx dy zB
zB
x
y
k − kx , k − ky
zB
zB
Damit ergibt sich für die Intensität des Beugungsbildes
2
4 x
y
2 (2π) k − kx , k − ky I(x, y, zB ) = A
2 T
zB
zB
(λzB )
−→
|FT der Apertur|2
−→
Verschiebung des Bildes durch schräge Beleuchtung
3.3.0.1
Beispiele:
3.3.0.2
rechteckiger Spalt bei senkrechter Beleuchtung
t(x, y) =
1 für |x| a, |y| b
0
sonst
x
y
2
sinc kb
I(x, y, zB ) ∼ sinc ka
zB
zB
2
83
3.3.0.3
Lochblende
t(x, y) =
1 für x2 + y 2 a2
0
sonst
2
ka
2
2
J1 zB x + y

I(x, y, zB ) ∼  ka 2 + y2
x
zB

−→
Airy-Funktion
−→
Definition des Auflösungsvermögens
Punkt −→Airy-Beugungsscheibchen
x 2 + y 2 = ρ2
ρs
0.61λ
ka
ρs = 1.22π −→
=
zB
zB
a
Θ=
Θ −→
3.3.0.4
2ρs
1.22λ
=
zB
a
Auflösungsvermögen später
eindimensionale periodische Strukturen
b - Periode, 2a - Öffnung
84
tS (x) für |x| a
0
sonst
t1 (x) =
t(x) =
N
−1
t1 (x − nb)
n=0
N
−1 ∞
x x
∼
t1 (x − nb) exp −ik x dx
T k
zB
zB
n=0
−∞
mit x − nb = X
T
x
k
zB
∼
N
−1 a
n=0 −a
∼ TS
∼ TS
wegen
x
x tS (X ) exp −ik X exp −ik nb dX zB
zB
x
k
zB
N
−1
x
exp −ik nb
zB
n=0
sin N k x b
2 zB
x
k
zB
sin k2 zxB b
sin N 2δ
δ
exp (−iδn) =
sin
2
n=0
N
−1
Für ein Strichgitter gilt:
TS
x
k
zB
x
= sinc k a
zB
Damit ergibt sich die Intensität des Beugungsbildes zu
I ∼ sinc2
sin2 N k x b
2 zB
x
k a
2 k x
zB
sin 2 zB b
85
50
N =7
I
I0
40
30
20
10
xS
0
-4 2 -3 5 -2 8 -2 1 -1 4
-7
0
7
= xp
14
21
28
xN
Die Struktur des Beugungsbildes wird durch drei Größen bestimmt:
• Breite des Beugungsbildes → erste Nullstelle der Spaltfunktion
k
xS
λzB
a = π → xS =
zB
a
• Maxima des Beugungsbildes → Maxima der Gitterfunktion
λzB
k xp
b = nπ → xp = n
2 zB
b
• Breite der Maxima → Nullstellen der Gitterfunktion
N
λzB
k xN
b = π → xN =
2 zB
Nb
N −→ ∞ −→ Delta-Funktion δ(x − n λb zB )
86
N
35
42
k b x
2 zB π
3.3.1
Bemerkungen zur Fresnelbeugung am Spalt
Verhalten wird durch Fresnelzahl NF =
a a
λ zB
=
1 z0
π zB
bestimmt.
• NF 10 (a groß, λzB klein, zB < 1/30 z0 ) −→ geometrischer Schatten
• NF 0.1 ( zB > 3z0 ) −→ Fraunhoferbeugung −→ Fouriertransformation der
Apertur
• 10 NF 0.1 (1/30 z0 < zB < 3z0 ) −→ Fresnelbeugung
Beispiel: 1D Spalt
u+ (x) = 1 für |x| a
α2
U+ (α) = a sinc(αa) −→ U (α; z) ∼ a sinc(αa) exp −i z
2k
u(x, z) ∼
α2
a sinc(αa) exp −i z exp (iαx) dα
2k
87
Kapitel 4
Fourieroptik −→ Optische Filterung
Beherrscht man die Beschreibung der Ausbreitung des Feldes, benötigt man noch die
Transferfunktion einer Linse, um die optische Abbildung zu beschreiben. Wir beschränken
uns auf die paraxiale Näherung ( siehe Kapitel 3.2.2), was im allgemeinen für die optischen Systeme eine ausreichende Näherung darstellt. Es wird sich herausstellen, daß
unter bestimmten Bedingungen bei der Abbildung die Fouriertransformierte des Objektes entsteht. Diese Feldverteilung kann nun in der Fourierebene manipuliert werden. Eine
weitere Abbildung erzeugt ein gegenüber dem Objekt verändertes Bild. Durch gezielte
Manipulationen können Filterfunktionen verwirklicht werden.
Die Ausbreitung im homogenen Raum wird im Fourierraum beschrieben, die Wechselwirkung mit der Linse im Ortsraum.
4.1
Die Abbildung eines beliebigen Feldes mit einer
dünnen Linse
4.1.1
Transferfunktion einer dünnen Linse
Eine dünne Linse soll nur die Phase eines optischen Feldes verändern (Transmission =
1). Nimmt man an, daß eine Linse eine vom Fokus ausgehende Kugelwelle in eine ebene
Welle transformiert, ergibt sich für die Transferfunktion einer dünnen Linse wegen
k 2
2
tL (x, y) = exp (ikz)
x +y
exp (ikz) exp i
2f
k 2
2
.
tL (x, y) = exp −i
x +y
2f
Im Fourierraum gilt damit:
λf
f 2
2
TL (α, β) = −i
.
exp i
α +β
2k
(2π)2
Der Vollständigkeit halber geben wir noch die Übertragungsfunktion des homogenen
Raumes an
88
i 2
2
HF (α, β; z) = exp (ikz) exp −
α +β z .
2k
4.1.2
Die Beschreibung der Abbildung
Das Objekt befinde sich im hinteren Fokus einer Linse, das Beugungsbild wird im Fokus
berechnet.
4.1.2.1
1. Spektrum in der Objektebene
U0 (α, β) = FT−1 [u0 (x, y)]
4.1.2.2
2. Ausbreitung Objekt −→Linse
U− (α, β; f ) = HF (α, β; f ) U0 (α, β)
4.1.2.3
3. Wechselwirkung mit der Linse
u+ (x, y, f ) = tL (x, y) u− (x, y, f )
−→ U+ (α, β; f ) = TL (α, β) ∗ U− (α, β; f )
4.1.2.4
4. Ausbreitung Linse −→Bildebene
U (α, β; 2f ) = HF (α, β; f ) U+ (α, β; f )
89
4.1.2.5
5. Fouriertransformation in der Bildebene
u(x, y, 2f ) = FT [U (α, β; 2f )]
Durchführung der Rechnung
90
4.1.2.6
1. Spektrum in der Objektebene
U0 (α, β) = FT−1 [u0 (x, y)]
4.1.2.7
2. Ausbreitung Objekt −→Linse
i 2
2
U− (α, β; f ) = exp (ikf ) exp −
α + β f U0 (α, β)
2k
4.1.2.8
3. Wechselwirkung mit der Linse
U+ (α, β; f ) = TL (α, β) ∗ U− (α, β; f )
∞
f λf
2
2
·
exp (ikf )
exp i
(α − α ) + (β − β )
= −i
2k
(2π)2
−∞
i 2
2
α + β f U0 (α , β )dα dβ · exp −
2k
4.1.2.9
4. Ausbreitung Linse −→Bildebene
∞
λf
f 2
2
U (α, β; 2f ) = −i
·
exp (2ikf )
exp i
(α − α ) + (β − β )
2k
(2π)2
−∞
i 2
i 2
2
2
α + β f exp −
α + β f U0 (α , β )dα dβ · exp −
2k
2k
λf
= −i
exp (2ikf )
(2π)2
f
U0 (α , β ) exp −i (αα + ββ ) dα dβ k
−∞
∞
f
λf
f
= −i
exp (2ikf ) u0 − α, − β
k
k
(2π)2
−→ das Spektrum in der Bildebene entspricht der Objektverteilung, wobei die Ortsfre
k
k
quenzen (α, β) durch − f x, − f y zu ersetzen sind.
91
4.1.2.10
5. Fouriertransformation in der Bildebene
u(x, y, 2f ) = FT [U (α, β; 2f )]
λf
= −i
exp (2ikf )
(2π)2
∞
−∞
f
f
u0 − α, − β exp [i (αx + βy)] dαdβ
k
k
Mit der Koordinatentransformation
f
x = − α,
k
f
k
k
y = − β −→ dα = − dx , dβ = − dy k
f
f
ergibt sich
1
u(x, y, 2f ) = −i
exp (2ikf )
λf
∞
−∞
(2π)2
exp (2ikf ) U0
= −i
λf
k
u0 (x , y ) exp −i (xx + yy ) dx dy f
k k
x, y
f f
Das Bild in der hinteren Brennebene entspricht der Fouriertransformierten der Objektverteilung −→ Analogie zum Fernfeld in der Fraunhofernäherung, aber zB ←→ f .
Die optische Fouriertransformation erlaubt Manipulationen am spektralen Inhalt.
4.2
4.2.1
Optische Filterung bzw. Bildberarbeitung
Die 4f - Geometrie
92
In der hinteren Brennebene der ersten Linse (Fourierebene) soll eine Manipulation am
Spektrum durch eine Pupillenfunktion p(x, y) vorgenommen werden. Das wesentliche
Ergebnis bisher ist, daß das Bild in der hinteren Brennebene einer Linse (Objekt in
vorderer Brennebene) proportional zur Fouriertransformierten der Objektverteilung ist
k k
x, y ,
(4.1)
u(x, y, 2f ) = A U0
f f
wobei A eine komplexe Amplitude ist. Unser Ziel besteht nun darin, die Abbildung
durch die zweite Linse unter Berücksichtigung der Manipulation zu beschreiben und
eine Übertragungsfunktion HA (α, β; 4f ) des gesamtem abbildenden Systems zu finden.
∞
u(x, y, 4f ) =
HA (α, β; 4f ) U0 (α, β) exp [i (αx + βy)] dαdβ
−∞
Die Aperturfunktion p(x, y) beschreibt alle Begrenzungen des Systems und beliebige,
zusätzlich einzubringende, Filterfunktionen.
Damit ergibt sich mit (4.1) das Feld hinter der Pupille zu
u+ (x, y, 2f ) = u(x, y, 2f )p(x, y)
k k
= A U0
x, y p(x, y)
f f
Aus den vorangegangenen Rechnungen wissen wir, daß die Linse eine Fouriertransformation dieser Feldverteilung durchführt, also
u(x, y, 4f ) = AU+
k k
x, y; 2f
f f
∞
= AA
U0
−∞
∞
=A
−∞
k
u+ (x , y , 2f ) exp −i (xx + yy ) dx dy f
k k k
x , y p(x , y ) exp −i (xx + yy ) dx dy f
f
f
Eine Koordinatentransformation
α=
k k
x , β = y
f
f
führt auf
93
u(x, y, 4f ) = A
∞
−∞
u(−x, −y, 4f ) = A
∞
−∞
=A
f f
U0 (α, β) p( α, β) exp [−i (αx + βy)] dαdβ
k k
f f
p( α, β)U0 (α, β) exp [i (αx + βy)] dαdβ
k k
∞
HA (α, β; 4f ) U0 (α, β) exp [i (αx + βy)] dαdβ
(4.2)
−∞
Damit können wir die Übertragungsfunktion ablesen:
f α, f β)
HA (α, β; 4f ) = Ap(
k k
−→ Jede Fourieramplitude des Objektspektrums wird mit der Pupillenfunktion gewichtet, d.h., die Pupillenfunktion stellt im wesentlichen die Übertragungsfunktion dar.
Ähnlich zu unserem früheren Vorgehen können wir die Abbildung im Ortsraum beschreiben, indem wir die Responsefunktion hA (x − x , y − y ) einführen.
∞
u(−x, −y, 4f ) =
hA (x − x , y − y )u0 (x , y )dx dy −∞
wobei gilt:
1
hA (x − x , y − y ) =
(2π)2
=A
∞
HA (α, β; 4f ) exp {i [α (x − x ) + β (y − y )]} dαdβ
−∞
∞
−∞
f f
p( α, β) exp {i [α (x − x ) + β (y − y )]} dαdβ
k k
mit
x=
f
α,
k
y=
f
β
k
folgt
←
→
hA (x − x , y − y ) = A
∞
−∞
k
p(x, y) exp −i [x (x − x) + y (y − y)] dxdy
f
←
→
k k = AP
(x − x) , (y − y)
f
f
94
und damit
←
→
u(−x, −y, 4f ) = A
∞
−∞
k k P
(x − x) , (y − y) u0 (x , y )dx dy ,
f
f
(4.3)
d.h., wie zu erwarten war, ist die Responsefunktion im wesentlichen die Fouriertransformation der Pupillenfunktion.
Die 4f -Abbildung mit einer Aperturfunktion bei z = 2f ist damit im Fourier-und im
Ortsraum beschrieben.
4.2.2
Beispiele:
4.2.2.1
Die ideale Abbildung (unendliche Apertur)
Mit p = 1 −→ P ∼ δ (x − x ) δ (y − y ) folgt aus 4.2 oder 4.3
←
→
u(−x, −y, 4f ) = A u0 (x, y)
d.h. ein seitenverkehrtes Original.
4.2.2.2
Endliche Apertur
p(x, y) =
1 für x2 + y 2 ≤ (D/2)2
0 sonst
95
Die Übertragungsfunktion ergibt sich damit zu
HA (α, β; 4f ) =
2 2
1 für fk α + fk β ≤ (D/2)2
0 sonst
d.h. die endliche Apertur schneidet die hohen Objektortsfrequenzen ab (Tiefpaßfilter)
und bestimmt damit das Auflösungsvermögen.
Mit ρ2 = a2 + β 2 ergibt sich damit für die obere Grenzfrequenz ρG , (Bandbreite des
Systems)
ρ2G
k2
= 2
f
D
2
2
−→ ρG =
2πn D
.
λf 2
Entsprechend der Fourier-Theorie hängt die kleinste noch übertragbare Struktur mit der
Bandbreite zusammen
∆rmin =
2π
2λf
2λ
λ
λ
=
=
≈
≈
ρG
nD
nF
nΘ
n sin Θ
(4.4)
wobei F = D/f ≈ 2Θ die Fresnelzahl der Linse und Θ der halbe Aperturwinkel ist.
Gl.(4.4) ist die bekannte Formel für das Auflösungsvermögen bei der optischen Abbildung.
Ein alternativer Zugang zur Bestimmung des Auflösungsvermögen ergibt sich im
Ortsraum:
96
←
→
u(−x, −y, 4f ) = A
∞
−∞
k k P
(x − x) , (y − y) u0 (x , y )dx dy f
f
2
2
∞ J1
(x − x) + (y − y)
←
→
= A
u0 (x , y )dx dy,
2
2
kD
(x − x) + (y − y)
−∞
2f
kD
2f
d.h., jeder Objektpunkt wird
bei der Abbildung zu einem Airy’schen Beugungsscheibchen. P fk (x − x) , fk (y − y) stellt gleichzeitig die Green’sche Funktion des Übertragungssystems dar.
Definiert man die Auflösungsgrenze dahingehend, daß das Maximum eines zweiten
Bildpunktes im ersten Minimum des ersten liegen muß, erhält man
kD ∆rmin
= 1.22π
2f 2
∆rmin =
4.2.2.3
1.22λ
n sin Θ
Optisches Differenzieren (hier eindimensional)
Man gebe sich eine Pupillenfunktion p(x) = −ix vor und erhält
u(x, 4f ) = A
∞
−∞
∂
=B
∂x
=B
f
U0 (α) −i α exp (−iαx) dα
k
∞
U0 (α) exp (−iαx) dα
−∞
∂
u0 (−x)
∂x
Experimentell kann die Funktion mit einem Graukeil mit einem Phasensprung π im
Zentrum realisiert werden:
x exp i32 π für x > 0
p(x) =
|x| exp i π2 für x > 0
97
4.2.2.4
Das Phasenkontrastverfahren nach Zernike
Problem: Ein reines Phasenobjekt (z.B. biologische Objekte) u0 (x, y) = exp [iϕ(x, y)]
wird bei der idealen Abbildung identisch abgebildet, d.h., u(−x, −y, 4f ) = exp [iϕ(x, y)]
und damit I(−x, −y, 4f ) = |u(−x, −y, 4f )|2 = 1, d.h., die Information geht bei der
Detektion verloren.
Die Idee besteht nun darin, eine Manipulation in der Pupillenebene vorzunehmen.
Die Phasenvariationen im Objekt sind i.a. klein, d.h.,
u0 (x) ≈ 1 + iϕ(x)
U0 (α) = δ(α) + iΦ(α)
Die Pupillenfunktion sei ein Phasenplättchen mit einem Loch im Zentrum, so daß nur
die Ortsfrequenz α = 0 unbeeinflußt hindurchgeht. Alle anderen Ortsfrequenzen sollen
einen Phasenshift π/2 erfahren.
p(x) =
f
p( α) =
k
1 für x ≈ 0
exp i π2 = i sonst
1 für α ≈ 0
π
exp i 2 = i sonst
Damit ergibt sich in der Bildebene
u(−x, 4f ) ≈ A
∞
[δ(α) − Φ(α)] exp (iαx) dα
−∞
[1 − ϕ(x)]
=A
und für die Intensität
I(x, 4f ) ∼ 1 − 2ϕ(x),
d.h., die Phasenmodulation wird in eine Amplitudenmodulation umgewandelt.
98
4.3
Das Prinzip der holographischen Abbildung
Idee: Wenn das Feld u(x, y, zH ) in einer Ebene z = zH bekannt ist (genügend groß),
ist es im Prinzip im gesamten Halbraum z > zH bekannt (2D Information −→ 3D
Information). Das Problem besteht darin, daß bei z = zH das komplexe Feld bekannt
sein muß. Konventionelle Aufnahmeverfahren registrieren i.a. nur die Intensität. So weist
eine Fotoplatte eine Transmissionsfunktion
t(x, y, zH ) = C |u(x, y, zH )|2
auf. Der Ausweg besteht darin, das Objektfeld mit einer einfach strukturierten Referenzwelle (z.B. ebene Welle) zu überlagern.
a) Aufzeichnung des Hologramms
uH (x, y, zH ) = u(x, y, zH ) + a exp (iKrH )
99
t(x, y, zH ) = C |uH (x, y, zH )|2
= C |u|2 + |a|2 + ua∗ exp (−iKrH ) + u∗ a exp (iKrH )
t(x, y, zH ) ist die Transmissionsfunktion einer entwickelten Fotoplatte −→ Hologramm.
Das Interferenzmuster weist keine Ähnlichkeit mit dem Objekt auf. Der Interferenzterm trägt die benötigte Phaseninformation. Eine Verkleinerung (’Zerbrechen’) des Hologramms bedeutet keinen Verlust des Bildes. Es werden nur bestimmte Ortfrequenzen
ausgeblendet.
b) Rekonstruktion des Objektes noindent
uH+ (x, y, zH+ ) = a exp (±iKrH ) t(x, y, zH )
Das dritte Glied in der Transmissionsfunktion ergibt bei zur Referenzwelle identischer
Rekonstruktionswelle
∼ |a|2 exp [−i (K − K) rH ] u(x, y, zH ) = |a|2 u(x, y, zH )
Das Objektfeld breitet sich im Halbraum z > zH aus −→ virtuelle Abbildung.
Das vierte Glied in der Transmissionsfunktion ergibt bei zur Referenzwelle konjugierter
Rekonstruktionswelle
∼ |a|2 exp [i (K − K) rH ] u∗ (x, y, zH ) = |a|2 u∗ (x, y, zH )
Das konjugierte Objektfeld (einlaufende Welle) breitet sich im Halbraum z < zH aus −→
relle Abbildung.
Fourier-Holographie
100
Holographische (van der Lugt) Filter
Das Ziel besteht in der optischen Generierung einer beliebigen Filterfunktion, um optische
Filterung (Bildverarbeitung) zu implementieren.
∞
u(x, y, z) =
f (x − x , y − y , z)u0 (x , y )dx dy −∞
101
Kapitel 5
Die Polarisation
elektromagnetischer Wellen
5.1
Einführung
Der zeitliche Verlauf des reellen elektrischen Feldvektors Er (r,t) bestimmt den Polarisationszustand des Feldes.
Wir betrachten hier den Polarisationszustand einer Normalmode
E(r, t) = E(ω) exp {i [k (ω) r − ωt]}
wobei wir uns der Einfachheit halber auf eine sich in z ausbreitende Mode beschränken.
Die Ergebnisse können auf Normalmoden mit kleinen transversalen Wellenzahlvektoren
(paraxiale Verhältnisse) übertragen werden. Da die Felder transversal sind, besitzen sie
nur eine x− und y−Komponente. Die Orientierung und Gestalt der Fläche, auf der
sich der (reelle) elektrische Feldvektor bewegt, bestimmt den Polarisationszustand. Diese
Fläche ist i.a. eine sich mit der Ausbreitungsrichtung nicht ändernde Ellipse, die zur Linie
(lineare Polarisation) oder zum Kreis (zirkulare Polarisation) entarten kann.
5.2
Die Polarisation einer Normalmode im isotropen, dispersiven Medium
Wir berechnen die Bewegung des momentanen elektrischen Feldvektors, wobei nach Voraussetzung
 
0
k = 0 
k
gilt. Die relevante Größe ist der Realteil des Feldes
Er (r, t) = E(ω) exp [ikz − ωt)] ,
wobei wegen der Transversalität des Feldes nur zwei komplexe Feldkomponenten frei
wählbar sind.
102


 
Ex
Ex exp (iϕx )
E(ω) =  E y  =  Ey exp (iϕy ) 
0
0
mit den reellen Größen Ex,y und ϕx,y .

 

Ex cos (Φ − ϕx )
X(z, t)
!
Er (r, t) =  Ey cos (Φ − ϕy )  =  Y (z, t) 
0
0
und Φ = ωt − kz. Wir erhalten
X
= cos (Φ) cos (ϕx ) + sin (Φ) sin (ϕx )
Ex
(5.1)
Y
= cos (Φ) cos (ϕy ) + sin (Φ) sin (ϕy )
Ey
(5.2)
Multipliziert man zuerst (5.1) mit sin (ϕy ) und (5.2) mit sin (ϕx ) und subtrahiert die
Gleichungen und wiederholt das entsprechend mit cos (ϕy ) , cos (ϕx ), erhält man
X
Y
sin (ϕy ) −
sin (ϕx ) = cos (Φ) sin (ϕy − ϕx )
Ex
Ey
X
Y
cos (ϕy ) −
cos (ϕx ) = − sin (Φ) sin (ϕy − ϕx ) .
Ex
Ey
Mit der Abkürzung δ = ϕy − ϕx und Quadrieren und Addieren der resultierenden Gleichungen ergibt sich die Gleichung einer Ellipse
X2 Y 2
XY
+ 2 −2
cos δ = sin2 δ.
2
Ex
Ey
Ex Ey
Die Dreh-Transformation ins Hauptachsensystem führt man mit
X = ξ cos ψ − η sin ψ
Y = ξ sin ψ + η cos ψ
durch. Verschwinden des ξη -Gliedes erfordert für den Drehwinkel
tan 2ψ =
2Ex Ey
cos δ
Ex2 − Ey2
und es folgt die Ellipsengleichung im Hauptachsensystem
η2
ξ2
+
=1
α2 β 2
103
(5.3)
mit den Hauptachsen
1
=
α2
1
=
β2
cos2 ψ sin2 ψ
cos δ
+
−
sin 2ψ
2
2
Ex
Ey
Ex Ey
sin2 ψ cos2 ψ
cos δ
+
+
sin 2ψ
Ex2
Ey2
Ex Ey
1
sin2 δ
1
,
sin2 δ
wobei sich ψ aus 5.3 ergibt.
Abbildung 5.1: Polarisationsellipse
Die Normalmode eines isotropen, dispersiven Mediums ist i.a. elliptisch polarisiert, da
beliebige Ex , Ey und Phasendifferenz δ = (ϕy − ϕx ) .
5.2.1
Polarisationszustände
A) elliptische Polarisation −→ Ex = Ey , δ = nπ
α) δ = ±π/2 −→ ψ = 0,
α = Ex ,
β = Ey
+π/2 −→ linksdrehend, −π/2 −→ rechtsdrehend (man sieht entgegen der Ausbreitungsrichtung auf den Feldvektor)
β)
0 < δ < π −→ linksdrehend
π < δ < 2π −→ rechtsdrehend
ψ ist endlich
B) zirkulare Polarisation −→ Ex = Ey = E, δ = ±π/2
ψ = 0,
α = E,
β=E
rechts/links wie oben
C) lineare Polarisation −→ δ = nπ
104
105
tan 2ψ = (−1)n
2Ex Ey
Ex2 − Ey2
Ex = Ey ψ = π/4, 3π/4
Bemerkung: linear polarisierte Welle ist die Überlagerung zweier zirkularer Wellen
(kz = 0, δ = ±π/2)






cos (ωt)
cos (ωt)
cos (ωt)

0
E  sin (ωt)  + E  − sin (ωt)  = 2E 
0
0
0
.
106
5.3
Alternative Darstellung des Polarisationszustandes
5.3.1
Poincaré-Kugel, Stokes-Parameter
−→ anschauliche Darstellung der Dynamik von Systemen mit drei Freiheitsgraden
s0 = Ex2 + Ey2
s1 = Ex2 − Ey2
s2 = 2Ex Ey cos δ
s3 = 2Ex Ey sin δ
s20 = s21 + s22 + s23
Jeder Polarisationszustand kann durch einen Punkt auf der Kugeloberfläche (Radius s0 )
dargestellt werden.
Abbildung 5.2: Poincare-Kugel
obere Halbkugel
untere Halbkugel
Äquator
Pole
−→ linksdrehend
−→ rechtsdrehend
−→ lineare Polarisation s3 = 0 −→ δ = nπ
−→ zirkulare Polarisation s1 = s2 = 0 −→ Ex = Ey , δ = ±π/2
107
5.3.2
Jones-Kalkül
Dieses Kalkül ist nützlich, um die Änderung des Polarisationszustandes bei Durchgang
durch optische Elemente zu berechnen.
Polarisationszustand
J, normiert j
opt. Element Matrix −→ T
J=
=
=
mit
tan Ψ =
Ex exp (iϕx )
Ey exp (iϕy )

Ex2 + Ey2 exp (iϕx ) 
Ex2
+
Ey2
exp (iϕx )
√
√
Ex
Ex2 +Ey2
Ey
Ex2 +Ey2
jx
jy
exp (iδ)


Ey
Ey
Ex
, sin Ψ = 2
, cos Ψ = 2
2
Ex
Ex + Ey
Ex + Ey2
cos Ψ
j=
sin Ψ exp (iδ)
Kennt man jx und jy folgen daraus Ex , Ey , δ.
Beispiele:
a) lineare Polarisation δ = nπ
jlin =
cos Ψ
± sin Ψ
b) zirkulare Polarisation δ = ±π/2, Ex = Ey Ψ = π/4
1
1
1
1
,
jzr = √
jzl = √
i
2
2 −i
Definition der Orthogonalität:
∗
∗
j1 j∗2 = j1x j2x
+ j1y j2y
= δ12
z.B. lin. polarisiert (x und y), zirkular (rechts, links)
Zerlegung jedes beliebigen Polarisationszustandes nach diesen orthogonalen
Zuständen:
108
j = αj1 + βj2
α = j∗1 j,
β = j∗2 j,
Durchrechnen durch optische Elemente:
· jin
jout = T
Bei Anwendungen oft Koordinatentransformation (Drehung) nötig.
·j
j =R
= R
(−Θ) · T
·R
(Θ)
T
=
R
cos Θ sin Θ
− sin Θ cos Θ
109
Kapitel 6
Grundzüge der Kristalloptik Normalmoden in homogenen,
anisotropen Medien
6.1
Suszeptibiltäts- und Dielektrizitätstensor
Bisherige Annahme der Isotropie (Richtungsunabhängigkeit der optischen Eigenschaften) von Materialen fallenlassen. In vielen optischen Materialien (insbesondere Kristalle)
hängen die Polarisierbarkeiten (Auslenkungen) von der Richtung des Feldes ab, da die
Atome periodisch, aber mit unterschiedlichen Symmetrien angeordnet sind Anisotropie.
Beispiele:
Lithiumniobat −→ elektro-optisches Material
Quarz
−→ Polarisatoren
Flüssigkristalle −→ Anzeigeelemente, NLO
MQW
−→ Optoelektronik
Wir beschränken uns hier auf eine Frequenz- (Monochromasie) und eine Ortsfrequenzkomponente (ebene Welle), die Ergebnisse sind zu verallgemeinern bei Anwendung der im
isotropen Medien benutzten Methoden (Fouriertransformation), i.a. jedoch schwieriger.
Wir nehmen weiterhin Absorptionsfreiheit an.
Im isotropen Material waren elliptisch polarisierte, ebene monochromatische Wellen die Normalmoden. Im folgenden sollen die Normalmoden des anisotropen Mediums
identifiziert werden. Mit Hilfe dieser Normalmoden kann man sich dann jede beleibige
raum-zeitlich begrenzte Lösung aufbauen.
bisher:
P(r, ω) = ε0 χ (ω) E(r, ω)
D(r, ω) = ε0 ε (ω) E(r, ω)
Im folgenden wird E durch E usw. ersetzt, da nur eine Frequenzkomponente betrachtet wird
110
jetzt:
Pi (r, ω) = ε0
3
j=1
!
χij (ω) Ej (r, ω) = ε0 χij (ω)Ej (r, ω)
Tensorkomponenten
P E, χij - wiederspiegelt die Kristallstruktur −→ jedoch nicht mikroskopisch
wegen unterschiedlicher Längenskalen (Optik - 5 · 10−7 m,Kristall - 5 · 10−10 m das
Feld spürt periodische Anordnung nicht im einzelnen, aber Symmetrien des Kristalls
analog:
Di (r, ω) = ε0 εij (ω)Ej (r, ω)
D(r, ω) = ε0 ε(ω)E(r, ω)
DE
χ
= (χij )- Suszeptibilitätstensor
ε = (εij ) - Dielektrizitätstensor −→ im folgenden benutzt
oftmals auch inverser Tensor σ
D(r, ω)
ε0 E(r, ω) = σ
σ
= [
ε]−1 = (σij )
Eigenschaften:
· σij , εij
· εij = εji , σij = σji
−→ reell im Transparenzgebiet (ω weggelassen,nicht vergessen).
−→ Tensoren sind symmetrisch, nur noch 6 Komponenten, d.h. Tensor
Beweis:
Aus Maxwell-Gleichungen im Fourierraum folgt:
ε∗ E∗ − µ0 H∗ H) + j∗ E = 0
div (E × H∗ ) − iω (E
Für ein verlustfreies Medium gilt div S = 12 [div (E × H∗ )] = 0 und damit
ε∗ E∗ ) = 0
(iE
ε∗ E∗ ) = − (E
Gilt für jedes beliebige E-Feld, also auch wenn nur Ex = 0
|Ex |2 (ε∗xx ) = 0
111
In analoger Weise gilt das für εyy und εzz , d.h. alle Diagonalelemente des Tensors sind
reell.
Nutzt man dieses Ergebnis aus gilt z.B. weiterhin (:
ε∗xy Ex Ey∗ + ε∗yx Ey Ex∗ = ε∗xy − εyx Ex Ey∗ = 0 −→ ε∗xy = εyx .
Dieses Ergebnis kann man auf alle εij verallgemeinern. Damit ist gezeit, daß der
dielektrische Tensor hermitisch ist. (analog gilt das für χij und σij )
·
Transformation auf Hauptachsen möglich −→ hier für σij zeigen
Richtungen gesucht, wo D E
σij Dj = ε0 Ei = λDi
det [σij − λIij ] = 0, Iij = δij
Gleichung 3.Ordnung −→ drei Wurzeln λ(α) . Wir setzen
(α)
σij Dj
(α)
= λ(α) Dj ,
(α)
um die Eigenvektoren Dj zu bestimmen.
Die Eigenvektoren sind orthogonal, da
(α)
σij Dj
(α)
(β)
= λ(α) Dj , σij Dj
(β)
= λ(β) Dj
und die anschließende Multiplikation ergibt
(β)
(α)
Di σij Dj
(α)
(β)
− Di σij Dj
(β) (α)
= λ(α) − λ(β) Di Di
Die linke Seite verschwindet, da Summationen vertauscht werden können und σij =
(β) (α)
σji Di Di = 0 für λ(α) = λ(β) . Die Hauptachsenrichtungen spiegeln die Kristallsymmetrien wieder.
εij = εi δij ,

(εij ) = 
σij = σi δij =
1
δij
εi

0
0
ε1 (ω)
0 
0
ε2 (ω)
0
0
ε3 (ω)
ein anisotropes Medium wird i.a. durch drei verschiedene dielektrische Funktionen
charakterisiert (im Hauptachsensystem). In der Regel rechnet man im Hauptachsen(Kristall-) System und führt zum Schluß die Transformation ins Laborsystem durch.
112
6.2
Die optische Klassifikation von Kristallen
a) isotrop
Es existieren drei kristallographisch äquivalente, senkrechte Achsen
−→ kubische Kristalle
−→ Gase, amorphe Festkörper, Flüssigkeiten, polykristalline Medien
ε1 (ω) = ε2 (ω) = ε3 (ω) −→ Di = ε0 ε (ω) Ei
b) optisch einachsig (uniaxial)
Es existieren zwei oder mehr kristallographisch äquivalente Achsen in einer Ebene
−→ trigonal, tetragonal, hexagonal
ε1 (ω) = ε2 (ω) = ε3 (ω)
c) optisch zweiachsig (biaxial)
Es existieren keine zwei kristallographisch äquivalente Richtungen
−→ orthorhombisch, monoklin, triklin
ε1 (ω) = ε2 (ω) = ε3 (ω)
6.3
Das Indexellipsoid
−→ geometrische Veranschaulichung des inversen dielektrischen Tensors σ
Vektor: im physikalischen Raum unabhängig vom Koordinatensystem, einfach im Hauptachsensystem
Tensor: Ähnlich ist ein symmetrischer Tensor als Fläche 2. Ordnung darzustellen −→
invariant gegenüber Koordinatentransformationen
Darstellung von σ
= [
ε]−1 :
3
σij xi xj = 1
i,j=1
113
wegen:
3
σij Di Dj = ε0
i,j=1
3
Ei Di = 2wel
i=1
in Hauptachsen:
σ1 x21 + σ2 x22 + σ3 x23 =
x21 x22 x23
+
+
=1
ε1
ε2
ε3
→
k
n3
Dx
n1
n2
Dy
Abbildung 6.1: Indexellipsoid
Das Medium wird durch einen Tensor (statt eines Skalars) beschrieben ; Hauptachsen:
√
ε i = ni
Degenerierte Fälle:
kubisch:
Kugel
einachsig: rotationssymmetrisch um z−Achse und n1 = n2
6.4
Normalmoden im anisotropen Medium
Normalmode:
· Lösung der Wellengleichung, die bei der Ausbreitung nur eine raum-zeitliche
Phasenänderung erfährt.
· die räumliche und zeitliche Phasenänderung hängen über eine Dispersionsrelation ω = ω(k) oder k = k(ω) zusammen.
114
Isotropes Medium:
Normalmode −→ monochromatische ebene Welle
E(r, t) = Eω exp {i [k (ω) r−ωt]}
ω2
ε(ω)
c2
bei reellem ε(ω) > 0 und mit kEω = kDω = 0. Die Welle ist i.a. elliptisch polarisiert,
der Polarisationszustand bleibt bei der Ausbreitung erhalten.
k2 (ω) =
−→ jetzt Suche nach Normalmoden im anistropen Medium. Im Hauptachsensystem ist
deren Berechnung einfach.
6.4.1
Normalmoden bei Ausbreitung in Hauptachsen
Annahme: Hauptachsen in x, y, z −→ kDω = kEω = 0, Ausbreitung in z - Richtung
(k −→kz ), Dx , Dy = 0
Di = ε0 εi Ei
−→ Achtung keine Summation
Feld beliebig in x, y−Ebene:
D1 , ε1 D1 exp [i (k1 r−ωt)] = D1 exp [iϕ1 ] exp (iωt) mit k21 =
D2 , ε2 D2 exp [i (k2 r−ωt)] = D2 exp [iϕ2 ] exp (iωt) mit k22 =
ω2
ε1 (ω)
c2
ω2
ε2 (ω)
c2
−→ E D −→ elliptische Polarisation keine Normalmode −→ Polarisationszustand
ändert sich bei der Ausbreitung wegen δ = ϕ2 − ϕ1 = (k2 − k1 ) z.
Jedoch wenn Feld in jeweils einer Hauptachse polarisiert −→ Normalmode
D(a) = {D1 exp [i (ka r−ωt)]} e1 −→ k2a =
ω2 2
na = k21 −→ Normalmode a
2
c
D(b) = {D2 exp [i (kb r−ωt)]} e2 −→ k2b =
ω2 2
nbk = k22 −→ Normalmode b
2
c
−→es existieren zwei senkrecht zueinander, linear polarisierte Normalmoden, −→
E D.
115
6.4.2
Normalmoden bei beliebiger Ausbreitungsrichtung −→
Dispersionsrelation
6.4.2.1
Geometrische Konstruktion I
·
·
·
·
·
·
·
6.4.2.2
Vorgabe von ω und Kristall −→ εi −→ Indexellipsoid bekannt
Vorgabe der Ausbreitungsrichtung −→ k/k
Ebene durch Ursprung des Indexellipsoids und senkrecht zu k zeichnen
−→Schnittfläche ist Ellipse −→ Indexellipse
Die Halbachsen dieser Ellipse sind die Brechzahlen na , nb der Normalmoden
in dieser Ausbreitungsrichtung −→ ka = ωc na , kb = ωc nb
Die Richtungen der Halbachsen −→ Polarisationsrichtungen von D(a) und D(b) an.
(a)
D
(a)
(b)
D
(b)
E(a) und E(b) folgen aus Ei = ε0iεi ,
Ei = ε0iεi
damit D(a,b) E(a,b) und E(a,b) nicht ⊥ zu k.
Ellipse −→ Kreis, Richtungdes k- Vektors definiert die optischen Achse.
Ableitung der Dispersionsrelation
isotropes Medium:
Dispersionsrelation:
Die Länge des k- Vektor ist nicht von der Richtung abhängig.
ω2
k (ω) = 2 ε(ω)
c
2
Feld der Normalmode:
116
E(r, t) = Eω exp {i [k (ω) r−ωt]}
D(r, t) = Dω exp {i [k (ω) r−ωt]}
elliptisch polarisiert
anisotropes Medium:
Normalmode wird wieder eine ebene, monochromatische Welle
∼ exp {i [k (ω) r−ωt]}
sein. Im anisotropen Medien wird jedoch die Länge des k-Vektors i.a. neben der Frequenz
auch noch von der Ausbreitungsrichtung abhängen (Dispersionsrelation). Darüberhinaus
wurde schon deutlich, daß die Polarisation der Normalmode nicht elliptisch sein wird. Um
die Richtungsabhängigkeit zu erfassen. schreiben wir den k-Vektor komponentenweise
auf:




k1
u1
k =  k2  = k  u2 
mit
u21 + u22 + u23 = 1
k3
u3
Ziel:
ω = ω(k1 , k2 , k3 ) oder ω = ω(k, u,1 u2 , u3 ) oder k = k(ω, u1 , u2 , u3 ) zusammen.
Maxwell-Gleichungen:
kDω = 0
k × Eω = ωµ0 Hω
kHω = 0
k × Hω = −ωDω
1
S = (Eω × H∗ω )
2
k ∦ S,
S ⊥ Eω
jetzt Index ’ω weglassen
ω2 1
− [k× (k × E)] = 2 D
c ε0
−k (k · E) +k2 E =
117
ω2 1
D
c2 ε0
im Hauptachsensystem
Di = ε0 εi Ei
−ki
kj Ej + k 2 Ei =
j
ω2
εi Ei
c2
ω2
2
E
ε
−
k
=
−k
kj Ej
i
i
i
c2
j
für isotrope Medien wird die rechte Seite zu Null.
Eigenwertgleichung:


ω2
ε
c2 1
− k22 − k32
k2 k1
k3 k1
k1 k2
ω2
ε − k12 − k32
c2 2
k3 k2

  
k1 k3
E1
0




E2
0 
=
k2 k3
2
ω
E3
0
ε − k22 − k32
c2 3
Aus det [..] = 0 folgt die gewünschte Dispersionsrelation ω = ω(k) für vorgegebenen ki /k.
Hier einfacheren Weg:
ki
kj Ej
ε − k2 j
c2 i
Ei = − ω2
Multiplikation mit ki und Summation über ’i’ ergibt bei Subsitution i ←→ j auf der
linken Seite
kj Ej = −
j
da div E =
j
i
ki2
kj Ej ,
ε − k2 j
c2 i
ω2
kj Ej =0 folgt daraus die Dispersionsrelation
i
ki2
=1
2
k 2 − ωc2 εi
118





u1
k1
u1
mit  k2  = k(ω)  u2  = ωc n(ω)  u2  können wir schreiben
k3
u3
u3

i
k 2 u2i
=1
2
k 2 − ωc2 εi
i
i
u2i
=1
1 − nεi2
1
u2i
= 2
2
[n (ω) − εi (ω)]
n (ω)
Damit ergibt sich für vorgegebene εi (ω) und Richtungskosinus’ (u1 , u2 , u3 ) die Brechzahl
n (ω, u1 , u2 , u3 ) (eigentlich n (ω, u1 , u2 ), da u21 + u22 + u23 = 1), die die Normalmode sieht.
Explizit ergibt sich:
u21 n2 − ε2 n2 − ε3 n2 + u22 n2 − ε1 n2 − ε3 n2 + u23 n2 − ε1 n2 − ε2 n2 =
n2 − ε 1
n2 − ε 2
n2 − ε 3
−→ quadratische Gleichung in n2 (n6 -Term verschwindet) −→ zwei Lösungen na , nb und
damit ka = ωc na , kb = ωc nb für die beiden senkrecht zueinander polarisierten Normalmoden D(a) und D(b) .
speziell:
Ausbreitung in einer Hauptachse −→ u3 = 1 (siehe Kapitel 6.3.1):
n2 − ε 1
n2 − ε 1
n2 − ε 2 n2 = n2 − ε 1 n2 − ε 2 n2 − ε 3
n2 − ε2 ε3 = 0 −→ n2a = ε1 , n2b = ε2
Geometrische Interpretation II - Die Normalenfläche
k
ui = nui ) −→ Normalenfläche −→ centrosymGleichung einer Fläche im ki -Raum ( ω/c
metrische, aus zwei Blättern bestehende Fläche −→ schneidet jede Hauptebene als Kreis
und Ellipse.
biaxial:
4 Schnittpunkte der Flächen −→ Verbindungslinien ergeben die zwei optischen
Achsen.
uniaxial: Rotationsellipse und Kugel −→ 2 Schnittpunkte in den Polen −→ Verbindungslinie
ergibt die optische Achse (wenn ε1 = ε2 = n2or , ε3 = n2e ), dann ist z-Achse die
optische Achse
kubisch: Kugel
119
Abbildung 6.2: (a) zweiachsiger; (b) einachsiger; (c) isotroper Kristall
Vorgehen:
·
Richtung festlegen (u1 , u2 ) −→ Schnittpunkte mit Oberfläche
·
Abstand Zentrum - Schnittpunkt ergibt die Brechzahlen der Normalmoden
·
in der optischen Achse −→ na = nb
−→
damit zwei geometrische Interpretationen:
a) Indexellipsoid
·
·
·
Richtung festlegen Indexellipse Halbachsen ergeben na , nb
(Brechzahlen, die NM sehen)
optische Achse dann, wenn Indexellipse zum Kreis entartet
bei einachsigen Kristallen ist die optische Achse mit einer Hauptachse identisch
b) Normalenfläche
·
·
Richtung festlegen Schnittpunkte mit Normalenfläche
Abstände vom Zentrum ergeben na , nb
optische Achse verbindet die Schnittpunkte der Blätter
Felder:
120
ε0 εi ki
Di = − ω 2
kj Ej
ε − k2 j
c2 i
ε1 k1
:
ε − k2
c2 1
D1 : D 2 : D 3 = − ω 2
ε2 k2
ω2
ε −
c2 2
k2
:
ε3 k3
ω2
ε −
c2 3
k2
Verhältnis reell −→ Phasendifferenz 0 −→ lineare Polarisation
also:
Im anisotropen Medium existieren zwei Normalmoden - linear polarisierte ebenen
mono
c
c
chromatische Wellen- mit zwei unterschiedlichen Phasengeschwindigkeiten na , nb und
zwei senkrecht zueinander stehenden Polarisationsrichtungen bei beliebig vorzugebender
Richtung
6.4.3
Einachsige Kristalle
−→
trigonal, tetragonal, hexagonal
Indexellipsoid ist rotationssymmetrisch um z- Achse
ε1 = ε2 = εor = n2or ,
ε3 = εe = n2e
−→ ordentlicher und außerordentlicher Brechungsindex
2 Normalmoden:
a) ordentliche Welle
−→ n unabhängig von Richtung
b) außerordentliche Welle −→ n abhängig von Richtung
Die z-Achse ist die optische Achse mit na = nb .
Die ordentliche Welle ist senkrecht zur Rotationsachse und zum k-Vektor polarisiert.
Die außerordentliche Welle ist senkrecht zum k-Vektor polarisiert und liegt in der Ebene
k-VektorRotationsachse.
Dispersionsrelation:
u21 n2 − εor n2 − εe n2 + u22 n2 − εor n2 − εe n2 +
2
2 2
n − εe
+u23 n2 − εor n2 = n2 − εor
Division durch n2 ergibt:
2
n − εor
u21
+
u22
2
n − εe +
u23
2
n − εor
121
(n2 − εe ) (n2 − εor )
−
=0
n2
1. Wellenzahl der ordentlichen Welle unabhängig von Richtung
n2a = εor −→ ka2 =
ω2 2
n = k02 εor
c2 a
2. Wellenzahl der außerordentlichen Welle abhängig von Richtung
u21 + u22
(n2 − εe ) (n2 − εor )
n2 − εe + u23 n2 − εor =
n2
εe εor
n2 u21 + u22 + u23 − n2 − u21 + u22 εe − u23 εor + εe + εor − 2 = 0
n
εe εor
εe 1 − u21 − u22 + εor 1 − u23 − 2 = 0
n
u23
1
(u21 + u22 )
+
− 2
=0
εe (ω)
εor (ω) n (ω)
−→ Vorgabe von ui −→ na , nb
Man beachte, daß εe , εor in dispersiven Medien Funktionen der Frequenz sind.
Geometrische Darstellung als Normalenflächen
da
ki2 = k02 n2 u2i
1. ordentlich
ka2 = k12 + k22 = k02 εor = k02 n2or
2. außerordentlich
1 k32
1 (k12 + k22 )
+
=1
εe
k02
εor k02
1 (k12 + k22 )
1 k32
+
=1
n2e
k02
n2or k02
−→ Rotationsellipsoid, deshalb o.B.d.A. Ausbreitung in y − z−Ebene −→ u1 = 0. Man
beachte, daß sich die Größe der Ellipse mit der Frequenz ändert.
Einfache Berechnung von n2 (Θ)
u23
1
u22
+
= 2
εe
εor
n
122
u2 = sin Θ,
u2 = cos Θ
sin2 Θ cos2 Θ
1
+
= 2
εe (ω) εor (ω)
n (ω, Θ)
n2 (ω, Θ) =
εe (ω) εor (ω)
εor (ω) sin2 Θ + εe (ω) cos2 Θ
Klassifizierungen:
εor > εe −→ negativ einachsig
εor < εe −→ positiv einachsig
Polarisation der Felder:
1) ordentlich: senkrecht zu Ebenen optischer Achse - k ,
D ⊥ k, D E
123
2) außerordentlich:senkrecht zu k und in Ebene optische Achse - k
D3 = ε0 εe E3
D ⊥ k, D E, da
D1 = ε0 ε0r E1 ,
Bemerkungen zur Ausbreitung von Gaußschen Strahlen
Zusammenhang zwischen Dispersionsrelation ←→ Propagationsgleichung:
Das Ziel besteht darin, zu zeigen, daß für die außerordentliche Welle die Richtung des
k-Vektors nicht mit der Ausbreitungsrichtung eines Gauß-Bündels übereinstimmt. Weiterhin wollen wir zeigen, wie diese Ausbreitungsrichtung mit der Normalenfläche in Zusammenhang steht.
Wir erinnern uns an die skalare Helmholtzgleichung für eine Fourierkomponente
∆u(r, ω) +
ω2
ε(ω)u(r, ω) = 0
c2
im isotropen Medium. Im Ortsfrequenzraum folgt daraus
ω2
2
2
2
− α + β + γ + 2 ε(ω) U (α, β, γ; ω) = 0.
c
Man kann die Dispersionsrelation der Normalmoden der Helmholtzgleichung ablesen:
α2 + β 2 + γ 2 = kx2 + ky2 + kz2 =
ω2
ε(ω).
c2
Es gilt auch der Umkehrschluß: Kennt man die Dispersionsrelation, findet man die zugehörige Differentialgleichung. Im einachsigen Kristall haben wir die Dispersionsrelation
u21 u22
u2
1
+
+ 3 = 2
εe
εe
εor
n
kz2
ω2
kx2 ky2
+
+
=
n2e n2e n2or
c2
124
Daraus folgt sofort eine modifizierte Helmholtzgleichung im anisotropen Medium
ω2
1 ∂2
1 ∂2
1 ∂2
u(r,
ω)
+
+
+
u(r, ω) = 0
εe ∂x2 εe ∂y 2 εor ∂z 2
c2
Mit den Transformationen
ξ = ne x,
η = ne y,
ς = nor z
erhalten wir eine kugelsymmetrische Helmholtzgleichung für die Ausbreitung im freien
Raum
2
ω2
∂2
∂2
∂
u(ξ,
η,
ς,
ω)
+
+
+
u(ξ, η, ς, ω) = 0
∂ξ 2 ∂η 2 ∂ς 2
c2
Für paraxiale Bedingungen ist die Lösung für einen Gaußschen Strahl bei z = 0
1
ω ξ 2 + η 2
u∼ ,
exp i
ς − iz0
2c ς − iz0
wobei ξ und ς darauf hinweisen, daß sich der Strahl in einer beliebigen Richtung in der
ξ - ς −Ebene ausbreiten kann. Im Prinzip ist damit das Problem der Ausbreitung eines
Gauß-Strahl gelöst, wenn man nur die entsprechende Rücktransformation ausführt. Auf
die anfaggs gestellten Fragen haben wir jedoch noch keine Antwort erhalten.
Zu diesem Zwecke bedienen wir uns einfacher geometrischer Überlegungen. In den
symmetrischen Koordinaten stimmen die Richtungen der Phasenfrontnormalen (Richtung des k-Vektors und des Strahls überein. Man nutzt nun die Transformationsgleichungen, um die Verhältnisse im ’echten’ Raum (x, y, z) darzustellen.
Man wähle einen Punkt (x0 , z0 ) auf der Achse des Gaußschen Strahles −→ entspricht
einem Punkt (ξ0 , ς0 ) im transformierten System. Es gilt dann
tan Θ =
z0
ne ς0
ne
=
=
tan ψ,
x0
nor ξ0
nor
wobei Θ die Richtung der Achse des Gauß-Strahls angibt. Nun betrachtet man die zwei
Schnittpunkte mit den Achsen ς = ς1 , ξ = ξ1 . Im realen System hat man dann
125
ξ1 nor !
x1
=
= tan β,
z1
ς1 ne
wobei β den Winkel der Normalen zur Phasenfläche bezeichnet (siehe Abbildung) . Im
transformierten System gilt
ς0
ξ1
= .
ς1
ξ0
Damit erhalten wir
tan β =
ξ1 nor
ς0 nor
z0 n2or
n2or
=
=
=
tan
Θ
,
ς1 ne
ξ0 ne
x0 n2e
n2e
tan β
n2or
= 2
tan Θ
ne
d.h. Richtung des k-Vektors und Strahlrichtung stimmen nicht überein (walk off).
Jetzt bleibt noch, eine Beziehung der Strahlrichtung zur Normalenfläche herzustellen.
Wir gehen zurück zur Dispersionsrelation für die außerordentliche Welle (Ausnutzen der
Rotationssysmmetrie und Weglassen des ky -Terms)
kx2
kz2
ω2
+
=
,
n2e n2or
c2
die Normalenfläche ist eine Ellipse, deren Tangente gegeben ist durch
kx n2or
dkz
=−
,
dkx
kz n2e
was zur Normalen
−
dkx
kz n2e
n2e
=
=
tan
β
= tan Θ,
dkz
kx n2or
n2or
führt, d.h., die Richtung des Gaußschen Strahles steht senkrecht auf der Normalenfläche.
Diese Richtung ist gleichzeitig die Richtung des Poyntingvektors, da die Gruppengeschwindigkeit gegeben ist mit
vg = ∇k ω
und damit ebenfalls senkrecht auf der Fläche mit konstantem ω (Normalenfläche) steht..
·
·
·
·
Die Strahlachse eines Gauß-Strahl stimmt mit der Richtung der Gruppengeschwindigkeit und des Poyntingvektors überein, i.e. senkrecht zu Normalenfläche.
Damit stimmt bei außerordentlichen Strahlen die Richtung des k− Vektors nicht mit
der Richtung der Strahlausbreitung überein.
Damit stimmen auch die Richtungen von ordentlichen und außerordentlichen Strahlen nicht überein −→ walk off.
Übereinstimmung besteht nur bei Ausbreitung in Richtung der Hauptachsen.
126
Kapitel 7
Optische Felder in isotropen,
dispersiven und stückweise
homogenen Medien
7.1
7.1.1
Grundsätzliches
Definition des Problems
−→ bisher keine echten Grenzflächeneffekte (nur Feld vorgegeben auf Grenzfläche), jetzt
werden Reflexion-und Transmissionseigenschaften diskutiert.
Physikalische Systeme
·
Grenzflächen
·
Schichten
·
Schichtsysteme
Geometrien:
· Wechselwirkung von Normalmoden (ebene, monochromatische Wellen) mit
beliebigen Vielschichtsystemen −→ Interferometer, dielektrische Spiegel etc.
−→ Überlagerung der Normalmoden (Wechselwirkung von raum-zeitlichen
begrenzten Feldern mit diesen Geometrien)
· ’Einsperren’ dieser Normalmoden in beliebige Wellenleiter −→ neue Normalmoden −→ geführte Wellen −→ beugungsfrei −→
Überlagerung der neuen Normalmoden (Pulspropagation in Wellenleitern)
−→ Wellenleiter- oder Intergrierte Optik, Spektroskopie an Oberflächen
Vorgehen:
• Maxwellsche Übergangsbedingungen an Grenzflächen
• Feldberechnung im inhomogenen Medium −→ Matrixmethode
• Reflexions - Transmissionsproblem −→ Grenzfläche, Schicht, Schichtsystem, FabryPerot Interferometer
127
• Geführte Wellen −→ Grenzfläche, Film, Streifen, Faser
7.1.2
Grenzflächen und Symmetrien
bisher:
Homogenität des Raumes −→ exp (ikr)
Stationarität −→ exp (−iωt)
E(r, t) = Eω exp [i (kr − ωt)]
jetzt:
Grenzfläche in (y, z) - Ebene, unendlich ausgedehnt
1. k = kx , 0, kz in (x, z) - Ebene −→ Einfallsebene Problem hängt nicht von
y - Koordinate ab
2. Homogenität nur noch in z - Richtung zu retten: ∼ exp (ikz z) kz stetig an
Grenzflächen
E(x, z, t) = Eω (x) exp [i (kz z − ωt)]
3. Polarisation −→ Erinnerung an vorn −→ Translationsinvarian in eine Richtung
−→ E = ETE + ETM Gesamtfeld wird zerlegt, unabhängig durchgerechnet und
schließlich wieder addiert.
ETE
TM:
 

0
0
=  Ey  =  E  ,
0
0

TE:

ETM = 
Ex

,

HTE = 
Hx
Ez
 

0
0
=  Hy  =  H 
0
0
−→ kETE = kETM = 0
4. Transversalität
5. Dispersionsrelation in Schicht ’i’:
2
−→ ki2 = kix
+ kz2 =
2
=
kix
ω2
εi (ω)
c2
ω2
εi (ω) − kz2
2
c
128

Hz

HTM

7.1.3
Die Übergangsbedingungen
a) Felder
Maxwell −→ Et , Ht gehen stetig durch Grenzflächen
TE:
E und Hz stetig
TM:
Ez und H stetig
a) Wellenzahlvektoren
Homogenität in z- Richtung −→ Phase exp (ikz z) −→ kz stetig
7.2
Das Feld im Schichtsystem −→ die Matrixmethode
7.2.1
Das Feld in einer homogenen Schicht
Die Schicht sei durch eine dielektrische Funktion εf (ω) charakterisiert und weise die
Dicke d auf. Das Ziel besteht darin, bei Vorgabe der Felder bei x = 0 die Felder bei
x = d zu berechnen. Dabei beschränkt man sich auf die Tangentialkomponenten, da
diese stetig übergehen, und berechnet die Normalkomponenten später. Wir zeigen das
im Fourierraum für eine Fourierkomponente E(x, z; ω), H(x, z; ω).
TE-Polarisation
Feldgleichung (ω und weglassen, aber nicht vergessen):
2
∂
∂2
ω2
+
+ 2 εf (ω) E(x, z) = 0
∂x2 ∂z 2
c
Mit dem Ansatz:
E(x, z) = E(x) exp (ikz z) ,
H(x, z) = H(x) exp (ikz z)
folgen aus
d2
ω2
2
+ 2 εf (ω) − kz E(x) = 0
dx2
c
und
i
rot E(x, z)
ωµ0
die beiden Gleichungen für die tangentialen Felder Ey = E, Hz
2
d
2
+ kfx E(x) = 0
dx2
HTE (x, z) = −
Hz (x) = −
i ∂
E(x).
ωµ0 ∂x
129
TM-Polarisation
In analoger Weise folgt für die tangentialen Komponenten Hy = H, Ez
2
d
2
+ kfx H(x) = 0
dx2
Ez (x) =
i ∂
H(x).
ωε0 ε ∂x
∂
∂
E(x), ∂x
H(x)
Damit besteht die Aufgabe darin, jeweils die Felder (E, H)) und Ableitungen ∂x
bei x = d aus ihrer Kenntnis bei x = 0 zu bestimmen. Am Ende der Rechnung (alle
Schichten) folgt aus H −→ ETM und damit E = ETE + ETM .
Aufgrund der identischen Struktur obiger Gleichungen können wir beide Polarisationsrichtungen simultan behandeln, indem wir setzen
E, H −→ F
iωµ0 Hz , −iωε0 Ez (x) −→ G
Damit ergibt sich
d2
2
+ kfx F (x) = 0
dx2
G(x) = αf
∂
F (x).
∂x
mit
αfTE = 1,
αfTM =
1
.
εf
Die allgemeine Lösung ergibt sich zu
F (x) = C1 exp (ikfx x) + C2 exp (−ikfx x)
G(x) = αf
∂
F (x) = ikfx αf [C1 exp (ikfx x) − C2 exp (−ikfx x)] .
∂x
F (0) und G(0) werden als bekannt vorausgesetzt. Damit können die unbekannten
Koeffizienten C1 und C2 bestimmt werden. Aus
F (0) = C1 + C2
G(0) = ikfx αf (C1 − C2 )
130
folgt
1
i
C1 =
G(0)
F (0) −
2
kfx αf
1
i
G(0) .
F (0) +
C2 =
2
kfx αf
Damit ergibt sich die gesucht Lösung für 0 ≤ x ≤ d zu
F (x) = cos (kfx x) F (0) +
1
sin (kfx x) G(0)
kfx αf
G(x) = −kfx αf sin (kfx x) F (0) + cos (kfx x) G(0)
7.2.2
Das Feld im Schichtsystem
Dielektrische Schichtsysteme sind häufig benutzte optische Bauelemente (Braggspiegel,
gechirpte Spiegel zur Dispersionskompensation, Interferometer, Vielschichtwellenleiter,
Braggwellenleiter). Darüberhinaus kann man jede beleibige inhomogene Brechzahlverteilung durch eine Diskretisierung in ein Schichtsystem beliebig genau annähern (wichtig
für sog. ’GRIN’ - Graded-Index-Wellenleiter.
Unser Ziel besteht darin, die Ergebnisse für eine Schicht auf einen Schichtstapel
zu übertragen. Es wirkt sich nun vorteilhaft aus, daß wir für unsere Rechnungen die
Feldkomponenten nutzen, die stetig durch die Grenzflächen gehen. Wir können das Feld
in der ersten Schicht schreiben als
F (x)
F (0)
=m
,
G(x)
G(0)
d.h. eine 2 x 2-Matrix beschreibt die Ausbreitung der Felder
131
(x) =
m
cos (kfx x)
−kfx αf sin (kfx x)
1
kfx αf
sin (kfx x)
cos (kfx x)
.
(x) =
Speziell gilt am Ende der Schicht x = d. Für absorptionsfreie Medien gilt weiterhinm
1, d.h. die Matrix ist unimodular. Für ein Schichtsystem, charakterisiert durch εi , di , gilt:
a) zwei Schichten:
F
F
F
2 (d2 )
2 (d2 )m
1 (d1 )
=m
=m
G d1 +d2
G d1
G 0
b) N Schichten:
F
G
=
d1 +d2 +..+dN =D
=
M
N
i (di )
m
i=1
N
F
G
=M
0
F
G
(7.1)
0
i (di )
m
i=1
i haben die gleiche Gestalt und unterscheiden sich nur durch unterAlle Matrizen m
i
schiedliche kfx , αf , di .
Das Verfahren arbeitet folgendermaßen:
·
Man gebe sich F (0) und G(0) vor (E, Hz für TE, Ez , H für TM)
·
Die Vorgabe von kz , αfi , di erlaubt die Berechnung der Matrixelemente.
·
Durch Multiplikation der Matrizen ergibt sich die Gesamtmatrix.
·
Damit kann man die Felder F (D) und G(D) berechnen.
7.3
Reflexions - Transmissionsproblem an Schichtsystemen
7.3.1
Allgemeines Schichtsystem
7.3.1.1
Reflexions- und Transmissionskoeffizienten - die verallgemeinerten
Fresnelschen Formeln
Das Ziel besteht darin, reflektiertes und transmittiertes Gesamtfeld in Abhängigkeit vom
Einfallswinkel und Frequenz des einfallenden Feldes zu bestimmen. Bisher haben wir nur
bestimmte Feldkomponenten von der ersten bis zur letzten Schicht durchgerechnet. Diese
Komponenten müssen nun mit den zugänglichen Feldern verknüpft werden.
Wir definieren am Anfang die wesentlichen Größen:
Wellenzahlvektor des einfallenden (kI ), reflektierten (kR ) und transmittierten (kT )
Feldes:






ksx
−ksx
kcx
kI =  0  ,
kR =  0  ,
kT =  0 
kz
kz
kz
132
mit
ksx =
ω2
2 =
ε
(ω)
−
k
ks2 (ω) − kz2 ,
s
z
c2
kcx =
ω2
2 =
ε
(ω)
−
k
kc2 (ω) − kz2 ,
c
z
c2
wobei εs (ω) und εc (ω) die dielektrischen Funktionen des Substrats und Claddings sind.
Bemerkung zum Reflxions-und Brechungsgesetz:
kz ist eine Erhaltungsgröße 1. ks sin ϕI = ks sin ϕR ϕI = ϕR (Reflexionsgesetz)
2. ks sin ϕI = kc sin ϕT ns sin ϕI = nc sin ϕT (Brechungsgesetz)
A) Feld im Substrat
mit den komplexen Feldamplituden FI , FR .
Fs (x, z) = exp (ikz z) [FI exp (iksx x) + FR exp (−iksx x)]
(7.2)
Gs (x, z) = iαs ksx exp (ikz z) [FI exp (iksx x) − FR exp (−iksx x)]
B) Feld im Schichtsystem
−→ bekannt durch Matrixmethode
Ff (x, z) = exp (ikz z) F (x)
(7.3)
Gs (x, z) = exp (ikz z) G(x)
und
F
G
=M
x
C) Feld im Cladding
133
F
G
0
Fc (x, z) = exp (ikz z) FT exp [ikcx (x − D)]
(7.4)
Gc (x, z) = iαc kcx exp (ikz z) FT exp [ikcx (x − D)] .
Das Ziel besteht nun darin, FR und FT in Abhängigkeit von kz (∼ sin ϕI ), εi , di und N
zu berechnen. Dazu nutzen wir Gl.(7.3) und die Tatsache, daß F und G stetig an den
Grenzflächen sind. Es gilt
F
F
=M
.
G D
G 0
Setzen wir nun auf der linken Seite das Claddingfeld (7.4) bei x = D und auf der rechten
Seite das Substratfeld (7.2) bei x = 0 ein, erhalten wir
FT
iαc kcx FT
=
M11 M12
M21 M22
FI + FR
iαs ksx (FI − FR )
.
Die Lösung des inhomogenen Gleichungssystems ergibt
FR =
(αs ksx M22 − αc kcx M11 ) − i (M21 + αs ksx αc kcx M12 )
FI
(αs ksx M22 + αc kcx M11 ) + i (M21 − αs ksx αc kcx M12 )
(7.5)
N
FT =
2αs ksx (M11 M22 − M12 M21 )
2αs ksx
FI =
FI .
N
N
(7.6)
Wir spezifizieren die Resultate (7.5) und (7.6) auf die beiden Polarisationsrichtungen:
A) TE - Polarisation
Es gilt
F = E = Ey ,
αTE = 1
Damit erhalten wir für das reflektierte Feld
ERTE = RTE EITE
(7.7)
RTE =
(ksx M22 − kcx M11 ) − i (M21 + ksx kcx M12 )
(ksx M22 + kcx M11 ) + i (M21 − ksx kcx M12 )
NTE
134
und das transmittierte Feld
ETTE = TTE EITE
(7.8)
TTE =
2ksx
,
NTE
wobei RTE und TTE die komplexen Reflexions- und Transmissionskoeffizienten sind (beeinflussen Amplitude und Phase des einfallenden Feldes). Man beachte, daß die Matrixelemente von der Polarisationsrichtung abhängig sind, d.h. MijTE = MijTM .
B) TM - Polarisation
Es gilt
1
αTM = .
ε
Die einfache Durchführung der Rechnung wie bei der TE-Polarisation ist hier nicht korrekt, da wir nicht das Verhältnis der H-Felder (z.B. HR /HI ) sondern das Verhältnis der
elektrischen Felder (z.B. ERTM /EITM ) benötigen. Wir müssen deshalb die H-Felder in die
E TM −Felder umrechnen.
F = H = Hy ,
Nebenrechnung:
kz
f
kx
f
ETM
Ex
kz
Ex
= − sin ϕ = −
TM
E
k
E TM = −
k
Ex ,
kz
wegen
E=−
1
(k × H)
ωε0 ε
folgt
Ex =
und schließlich
E TM = −
und damit
1
kz Hy
ωε0 ε
k
1
Hy = − √ Hy
ωε0 ε
ωc ε
TM
ER,T
=
EITM
εs HR,T
,
εs,c HI
135
das heißt, der Faktor εs /εc spielt nur bei der Berechnung der Transmissionskoeffizienten
eine Rolle. Wenn wir das beachten erhalten wir aus Gl. (7.5), indem wir Zähler und
Nenner mit εs εc multiplizieren.
ERTM = RTM EITM
(7.9)
RTM =
(εc ksx M22 − εs kcx M11 ) − i (εs εc M21 + ksx kcx M12 )
FI
(εc ksx M22 + εs kcx M11 ) + i (εs εc M21 − ksx kcx M12 )
NTM
ETTM = TTM EITM
TTM
√
2 εs εc ksx
=
.
NTM
(7.10)
Damit sind die komplexen Reflexions- und Transmissionskoeffizienten (R, T = |R| , |T | exp iϕ))
für beide Polarisationsrichtungen bekannt. Die Amplituden- und Phasenänderung ist
i.a. unterschiedlich und abhängig von sin ϕI , εi (ω) , di und N. Dieses Ergebnis findet
Anwendung beim Verfahren
der
Ellipsometrie. Ist das einfallende Licht linear polari TM ◦
TE = EI , ϕITE = ϕITM ), wird das reflektierte oder transmitsiert (z.B.45 −→ EI
tierte Feld i.a. elliptisch polarisiert sein. Aus mehreren Messungen ermittelt man dann
εi (ω) , di . Die Formeln (7.7) -(7.10) stellen die verallgemeinerten Fresnelschen Formeln
für ein beliebiges dielektrisches Vielschichtsystem dar.
7.3.1.2
Bemerkungen zum Reflexions-Transmissionsverhalten von Impulsen
mit endlicher Breite
Die für eine Normalmode geltenden Formeln (7.7) -(7.10) können auf den wichtigen
Fall, daß das einfallende Feld zeitlich und/oder räumlich begrenzt ist, erweitert werden,
indem wir unsere Ergebnisse aus Kapitel 2 nutzen. Wir haben jedoch zu beachten, daß
die karthesischen Koordinaten x ←→ z vertauscht worden sind. Um Konfusionen zu
vermeiden, ersetzen wir die Komponenten des k - Vektors wieder durch (α, β, γ).
Hier gilt nun kz ←→ α, ky ←→ β, ks,c,fx ←→ γs,c,f .
Der Einfachheit halber nehmen wir an, daß die Haupteinfallsrichtung senkrecht zum
Schichtsystem orientiert ist (ϕI = 0). Damit erhalten wir identische Ergebnisse für die
Reflektions- und Transmissionskoeffizienten in TE- und TM-Polarisation. Ist die Begrenzung nur in einer Dimension relevant (∞-Ausdehnung in Polarisationsrichtung) ist das
Vorgehen exakt. Für eine begrenzte Feldverteilung in beiden Dimensionen hat das Feld
eine Komponente in Ausbreitungsrichtung. Für nicht zu enge Bündel (Durchmesses einige zehn Wellenlängen) kann man diese Komponente vernachlässigen. Wir berechnen
das Spektrum des einfallenden Feldes zu
136
1
EITE,TM (α, β, ω̄) =
(2π)3
∞
dzdydt EITE,TM (z, y, t) exp [−i (αz + βy − ω̄t)]
−∞
Das reflektierte/transmittierte Spektrum berechnet man mit den verallgemeinerten
Fresnelschen Formeln (7.7) -(7.10). Es gilt zum Beispiel für die Reflexion des TE-Feldes
ERTE (α, β, ω̄) = RTE (α, β, ω̄) EITE (α, β, ω̄)
(7.11)
[γs M22 (α, β, ω̄) − γc M11 (α, β, ω̄)] − i [M21 (α, β, ω̄) + γs γc M12 (α, β, ω̄)]
RTE (α, β, ω̄) =
[γs M22 (α, β, ω̄) + γc M11 (α, β, ω̄)] + i [M21 (α, β, ω̄) − γs γc M12 (α, β, ω̄)]
mit
ω2
2
2 − β2 =
ε
(ω)
−
α
ks,c,f
(ω) − α2 − β 2 .
s,c,f
c2
Für γs,c,f kann im allgemeinen die Fresnelsche Näherung und die Entwicklung der Dispersionsrelation ks,c,f (ω) verwendet werden
γs,c,f =
γs,c,f
1
D 2 α2 + β 2
≈ k0 + ω̄ + ω̄ −
.
vg
2
2k0
Damit ist das reflektierte Spektrum bekannt. Das Feld ergibt sich dann aus
∞
ERTE
dαdβdω̄ ERTE (α, β, ω̄) exp [i (αz + βy − ω̄t)]
(z, y, t) =
−∞
∞
dαdβdω̄ RTE (α, β, ω̄) EITE (α, β, ω̄) exp [i (αz + βy − ω̄t)] .
=
−∞
Analog verfährt man bei der Berechnung des transmittierten Feldes.
7.3.1.3
Reflektivität und Transmissivität
Häufig benötigt man man nicht die komplexen Koeffizenten, sondern die Verhältnisse
der Energieflüsse (Reflektivität und Transmissivität). Dazu müssen wir den Energiefluß
senkrecht zu den Grenzflächen berechnen.
Fluß durch eine Fläche x = const. :
1
S ex = (E × H∗ ) ex
2
mit
H∗ =
1
(k∗ × E∗ )
ωµ0
137
folgt
S ex =
1
1
(k∗ ex ) |E|2 =
(kx ) |E|2 .
2ωµ0
2ωµ0
In absorptionsfreien Schichten und Substrat bleibt der Energiefluß erhalten. Es gilt
im
Substrat
Ss ex =
1 ksx |EI |2 − ksx |ER |2
2ωµ0
und im Cladding
Sc ex =
1
(kcx ) |ET |2 .
2ωµ0
Ss ex = Sc ex |EI |2 = |ER |2 +
(kcx )
|ET |2 .
ksx
Das Ziel besteht in der Berechnung der globalen Reflektivitäten ρ und Transmissivitäten
τ sowie derer für die einzelnen Polarisationsrichtungen. Wir benutzen die Ergebnisse des
vorhergehenden Kapitels.
TM
ER = ETE
R + ER ,
TM
ET = ETE
T + ET
TE 2 TM 2 (kcx ) TE 2 TM 2 ET + ET |EI | = ER + ER +
ksx
2
=
(kcx )
(kcx )
2 TE 2
2
2 TM 2
EI
EI
|RTE | +
|TTE |
+ |RTM | +
|TTM |
.
ksx
ksx
2
Das einfallende Feld wird wie folgt zerlegt
ETM
E
d
ETE
EITE = |EI | cos δ,
EITM = |EI | sin δ.
138
Damit ergibt sich
(kcx )
(kcx )
2
2
2
2
2
1 = |RTE | +
|TTE | cos δ + |RTM | +
|TTM | sin2 δ
ksx
ksx
(kcx ) 1 = |RTE |2 cos2 δ + |RTM |2 sin2 δ +
|TTE |2 cos2 δ + |TTM |2 sin2 δ
ksx
1=ρ+τ
mit
ρ = ρTE cos2 δ + ρTM sin2 δ
τ = τTE cos2 δ + τTM sin2 δ
und
ρTE,TM = |RTE,TM |2 ,
τTE,TM =
(kcx )
|TTE,TM |2 .
ksx
Damit kann man alle relevanten Größen berechnen, wenn die Reflektions- und Transmissionskoeffizienten und der Polarisationszustand am Eingang bekannt sind.
7.3.2
Die einfache Grenzfläche
7.3.2.1
Fresnelsche Formeln
Wir erinnern uns an die relevanten Wellenzahlvektoren






ksx
−ksx
kcx
kR =  0  ,
kT =  0  .
kI =  0  ,
kz
kz
kz
Die stetige Komponente ergibt sich zu
ω√
ω
εs sin ϕI = ns sin ϕI.
c
c
Damit kann man die entsprechenden x-Komponenten von k schreiben als
kz =
kix =
ω2
εi − kz2 =
c2
ksx =
ω
ns cos ϕI ,
c
ω2
ω
ω2
ε
−
εs sin2 ϕI =
i
2
2
c
c
c
kcx =
139
ω
c
n2i − n2s sin2 ϕI
n2c − n2s sin2 ϕI ,
d.h. ksx ist immer reell, während kcx für nc < ns sin ϕI imaginär wird (Totalreflexion).
Mit der ’Schichtmatrix’
1 0
−→ 0) =
m(d
0 1
ergeben sich die Reflexions- und Transmissionskoeffizienten.
A) TE-Polarisation
RTE
(ksx − kcx )
ns cos ϕI − nc cos ϕT
ns cos ϕI − n2c − n2s sin2 ϕI
=
=
=
(ksx + kcx )
ns cos ϕI + nc cos ϕT
ns cos ϕI + n2c − n2s sin2 ϕI
TTE =
2ksx
2ns cos ϕI
2ns cos ϕI
=
=
(ksx + kcx )
ns cos ϕI + nc cos ϕT
ns cos ϕI + n2c − n2s sin2 ϕI
ρTE
|ksx − kcx |2
= |RTE | =
|ksx + kcx |2
τTE =
2
(kcx )
4ksx (kcx )
|TTE |2 =
.
ksx
|ksx + kcx |2
ρTE + τTE = 1
140
A) TM-Polarisation
RTM
(ksx εc − kcx εs )
nc cos ϕI − ns cos ϕT
ns n2c cos ϕI − n2s n2c − n2s sin2 ϕI
=
=
=
(ksx εc + kcx εs )
nc cos ϕI + ns cos ϕT
ns n2c cos ϕI + n2s n2c − n2s sin2 ϕI
TTM
√
2ksx εc εs
2ns cos ϕI
2n2s nc cos ϕI
=
=
,
==
2
(ksx εc + kcx εs )
nc cos ϕI + ns cos ϕT
ns n2c cos ϕI + n2s n2c − n2s sin ϕI
und damit
ρTM = |RTM |2 =
τTM =
|ksx εc − kcx εs |2
,
|ksx εc + kcx εs |2
(kcx )
4ksx (kcx ) εs |εc |
|TTM |2 =
.
ksx
|ksx εc + kcx εs |2
Widerspruch für ϕI = 0 ? Es gilt RTE = −RTM , TTE = TTM . Warum?
7.3.2.2
Totalreflexion
141
Bedingung:
kcx = 0 nc = ns sin ϕI
sin ϕItot =
nc
.
ns
Für ϕI > sin ϕItot gilt dann
ω
ω2
n2s sin2 ϕI − n2c = iµc = i kz2 − 2 εc imaginär.
kcx = i
c
c
Totalreflexion tritt auf, wenn (kcx ) = 0. Das gilt für beide Polarisationsrichtungen in
gleicher Weise. Für die Energieflüsse gilt (hier TE):
ρTE
2
|ksx − iµc |2 Z =
=
=1
|ksx + iµc |2 Z ∗ τTE =
4ksx (kcx )
= 0.
|ksx + kcx |2
Für Metalle (
(εc ) < 0, (εc ) << |
(εc )| tritt immer Totalreflexion auf kein
Grenzwinkel. (εc ) << |
(εc )| führt zu einer kleinen Verschiebung des Grenzwinkels
und zu einer Verschmierung des abrupten Übergangs.
Da der Reflexionskoeffizient komplex ist, kommt es bei der Totalreflexion zu einer Phasenverschiebung.
A) TE-Polarisation
142
RTE = 1 · exp (iΘTE ) =
ksx − iµc
Z
exp (iα)
= ∗ =
= exp (2iα)
ksx + iµc
Z
exp (−iα)
µc
Θ
=−
tan α = tan TE = −
2
ksx
n2s sin2 ϕI − n2c
sin2 ϕI − sin2 ϕItot
=−
.
ns cos ϕI
cos ϕI
B) TM-Polarisation
Entsprechend gilt für TM-Polarisation
RTM = 1 · exp (iΘTM ) =
tan α = tan
ksx εc − iµc εs
Z
exp (iα)
= ∗ =
= exp (2iα)
ksx εc + iµc εs
Z
exp (−iα)
µc εs
εs
Θ
ΘTM
=−
= tan TE ,
2
ksx εc
εc
2
d.h.
|ΘTM | > |ΘTE | ,
linear polarisiertes Licht wird bei Totalreflexion elliptisch polarisiert Fresnelsches
Prisma
143
Das Feld im Cladding ist evaneszent ∼ exp (ikz z) exp (−µc z) . Der mittlere Energiefluß
ins Cladding verschwindet
Sx =
7.3.2.3
1
1
k |E|2 x =
(kx ) |E|2 = 0.
2ωµ0
2ωµ0
Der Brewster-Winkel
Für TM-polarisiertes Licht gibt es einen zweiten ausgezeichneten Winkel −→ Brewsterwinkel ϕB . Dort verschwindet der Reflexionskoeffizient −→ RTM = 0, d.h., es muß gelten
ksx εc = kcx εs
ε2c εs − sin2 ϕB εs = ε2s εc − sin2 ϕB εs
sin2 ϕB =
εs εc (εs − εc )
εc
=
2
2
εs (εs − εc )
(εs + εc )
tan ϕB =
εc
.
εs
Der Brewster-Winkel existiert für ns ≶ nc .
Physikalische Interpretation:
tan ϕB =
sin ϕB
nc
=
cos ϕB
ns
π
ns sin ϕB = nc cos ϕB = nc sin
− ϕB
2
π
ns sin ϕB = nc sin ϕT ϕT = − ϕB ,
2
d.h., Wellenzahlvektoren der reflektierten und transmittierten Welle stehen senkrecht
aufeinander keine Abstrahlung in Richtung der potentiellen reflektierten Welle.
144
7.3.2.4
Folgerungen aus spezifischem Reflexionsverhalten
1. ϕI = ϕB
2. ϕI > ϕtot
7.3.2.5
reflektiertes Licht ist vollständig TE-polarisiert bei beliebig polarisiertem
Eingangsfeld EI
ΘTE = Θ TM , aber |RTE | = |RTM | für lin.pol.einfallende Welle (45◦ ) EITE = EITM ERTE = ERTM , aber in Abhängigkeit vom Material ist ein Winkel zu finden, wo
∆Θ ≈ 45◦ , d.h., zweimalige Totalreflexion gibt zirkular polarisiertes Licht.
Der Goos-Hänchen-Shift
−→ Totalreflexion endlicher Bündel an Grenzflächen (hier für TE-Polarisation zeigen)
Ebene Welle:
EI (x, z) = EI exp [i (ksx x + kz z)] −→ EI (x, z) = EI exp [i (αz + γs x)]
ER (x, z) = EI exp [i (αz − γs x)] exp [iΘ (α)]
mit
ω
α = ns sin ϕI ,
c
γs =
ω2 2
n − α2 .
c2 s
−→ wichtig für das folgende ist, daß die Phasenverschiebung vom Einfallswinkel
(transversale Wellenzahl) abhängt.
Bündel:
EI (x, z) =
dαeI (α) exp [i (αz + γs x)]
Da schräger Einfall mit Haupteinfallswinke α0 = ωc ns sin ϕI0
α = α0 + ε
nur Integration über nichtverschwindene Spektralamplituden
EI (x, z) = exp (iα0 z)
−∆
ER (x, z) = exp (iα0 z)
∆
dεeI (ε) exp [i (εz + γs x)]
∆
−∆
dεeI (ε) exp [i (εz − γs x)] exp [iΘ (α0 + ε)] .
145
Annahmen:
·
Reflexion an der Grenzfläche x = 0.
·
da Divergenz des Strahles klein −→ alle Fourierkomponenten totalreflektiert.
Damit kann die Phasenverschiebung entwickelt werden
∂Θ ε = Θ (α0 ) + Θ ε
Θ (α0 + ε) ≈ Θ (α0 ) +
∂α α0
und wir erhalten
ER (0, z) = exp {i [α0 z + Θ (α0 )]}
∆
−∆
dεeI (ε) exp [i (z + Θ ) ε]
exp {i [α0 z + Θ (α0 )]} EI (z + Θ ) .
−→ der reflektierte Strahl ist um d = −Θ verschoben (Goos-Hänchen Shift).
Berechnung dieser Verschiebung:
von vorn:
2
α2 − ωc2 n2c
Θ = −2 arctg ω2 2
n − α2
c2 s
−→ Θ |α0 = −2 1
ω2 2
n − α02 α02 −
c2 s
α0
Θ |α0 = −d = −2 tan xET
mit
xET =
wobei xET als Eindringtiefe interpretiert werden kann
tan ϕI0 =
146
ω2 2
n
c2 c
d/2
.
xET
= −2 tan ϕI0
1
1
=
µc
α02 −
1
µc
ω2 2
n
c2 c
,
7.3.2.6
Bemerkungen zur Metallrefelxion und Doppelbrechung
A) Metallreflexion
Wir setzen ein ’ideales’Metall (freie Elektronen ohne Stöße) im Cladding voraus:
ωp2
,
ω2
wobei im optischen Spektralbereich (ωp > ω) εc (ω) < 0 gilt. Damit gilt für alle Einfallswinkel
ω2
µc =
|εc (ω)| + kz2 ,
c2
d.h. an Metallgrenzflächen tritt immer Totalreflexion auf, unabhängig vom Einfallswinkel. Die Eindringtiefe µ1c ist immer kleiner als bei Dielektrika.
B) Doppelbrechung an anisotropen Medien (einachsig)
εc (ω) = 1 −
z. B. : ns = 1 (isotrop), nc −→ ncor und nce
Prinzip: Stetigkeit von kz
ns sin ϕI =
ncor sin ϕTor
nce (ϕTor ) sin ϕTe
Doppelbrechung von Strahlen:
Wenn die Hauptausbreitungsrichtung nicht in einer Hauptachse liegt, stimmen im
anisotropen Medium die Richtungen von k und S nicht überein (walk off).
147
7.3.3
Die optische Schicht
7.3.3.1
Reflexions- und Transmissionskoeffizienten
Wir beziehen uns auf folgende Geometrie und beschränken uns der Eifachheit halber auf
TE-Polarisation (TM analog aus Kapitel 7.3.1)
Aus den Gln.(7.7) und (7.8) folgt mit
= m(d)
M
=
RTE
cos (kfx d)
−kfx sin (kfx d)
1
kfx
sin (kfx d)
cos (kfx d)
sin 2δ
(ksx − kcx ) cos + i kfx −
,
=
δ
δ
ksx kcx
sin
(ksx + kcx ) cos − i kfx +
2
kfx
2
N
δ
2
TTE =
ksx kcx
kfx
2ksx
,
N
wobei
δ
= kfx d.
2
Für die Reflektivität und Transmissivität ergibt sich damit
ρTE = |RTE |2
τTE =
kcx
|TTE |2 .
ksx
Für absorptionsfreie Filme gilt natürlich:
ρTE + τTE = 1
148
und
2
τTE
2
+ kfx +
sin2 2δ − 4kcx ksx
=
2
ksx kcx
δ
2
2 δ
(ksx + kcx ) cos + kfx +
sin2
2
kfx
2 .
N
4kcx ksx
=
N
(ksx + kcx )
ρTE
cos2 2δ
ksx kcx
kfx
Reflektivitäten und Transmissivitäten sind phasenempfindlich (Resonatoren). Daraus ergeben sich die bekannten Anwendungsfälle.
a) λ/2-Schichten
δ
= kfx d = mπ,
2
d=m
λ
2nf 1 −
kz2
kf2
−→ ⊥−→ d = m
λ
2nf
mit sin 2δ = 0, cos 2δ = ±1 folgt dann
ρTE =
(ksx − kcx )2
−→ wie Grenzfläche.
(ksx + kcx )2
Mit ksx = kcx ergibt sich ρTE = 0 −→ Antireflexionsschicht.
b) λ/4-Schichten
δ
π
= kfx d = (2m + 1)
2
2
d = (2m + 1)
λ
4nf 1 −
kz2
kf2
−→ ⊥−→ d = (2m + 1)
λ
4nf
mit sin 2δ = 1, cos 2δ = 0 folgt dann
ρTE
kfx −
=
kfx +
ksx kcx
kfx
ksx kcx
kfx
2
2
und für senkrechten Einfall
ρTE =
(n2f
(n2f
1−
− ns n c )
=
2
+ ns nc )
1+
2
ns nc
n2f
ns nc
n2f
2
2 ,
d.h. für n2f >> ns nc wird die Reflektivität maximiert, beträgt bei ns = nc = 1, nf = 2
jedoch nur 35%. Die Idee besteht nun darin λ/4-Schichten hintereinander anzuordnen.
Fügt man eine zweite Schicht mit nf = 1.5 hinzu, erhält man mit 5 solchen Doppelschichten eine Reflektivität von 95%. Solche dielektrischen Schichtsysteme spielen eine große
praktische Rolle und werden als Laser- oder Resonatorspiegel (Braggspiegel) eingesetzt.
Wir kommen später auf diesen Punkt zurück.
149
7.3.3.2
Der optische Tunneleffekt
Analog zum Tunneleffekt in der Quantenmechanik kann Licht durch dünne Filme tunneln, wenn eigentlich die Bedingungen der Totalreflexion erfüllt sind, also
εf < 0
oder
εf < εc, εs
und
ϕI > ϕTot
Wir erhalten also
  k 2 − ω22 εf (ω),
z
kfx = iµf = i 2 c
ω

|ε | + k 2 ,
f
c2
z
Dielektrikum
.
Metall
Für eine symmetrische Anordnung εc = εs und sin (iµf d) = i sinh (µf d) , cos (iµf d) =
cosh (µf d) ergibt sich dann für den Transmissionskoeffizienten mit Γ = µf d
1
TTE =
− µ2f )
sinh Γ
2ksx µf
C
2
=
exp Γ + exp (−Γ) − iC [exp Γ − exp (−Γ)]
cosh Γ − i
=
2
(ksx
2 exp (−Γ)
.
(1 − iC) + (1 + iC) exp (−2Γ)
150
Damit folgt für die Transmissivität
τTE =
C 2 ) (1
4 exp (−2Γ)
+ exp (−4Γ)) + 2 (1 − C 2 ) exp (−2Γ)
(1 +
4
≈
exp (−2Γ) .
(1 + C 2 )
Für Γ = µf d ∼ 1 erhalten wir τTE ∼ 0.1. Für einen Metallfilm mit |εf | = 10 folgt bei
senkrechtem Einfall
2π λ
Γ=
|εf |d 1
d .
λ
20
Das Licht kann also durch extrem dünne Filme ’tunneln’, wenn es eigentlich totalreflektiert werden müßte. Anwendungen ergeben sich für die Nahfeldmikroskopie bei
Auflösungen unterhalb der Wellenlänge.
7.3.4
Periodische Vielschichtsysteme - Bragg-Spiegel
Periodische Strukturen spielen in der Physik eine große Rolle (Kristalle, Supergitter,
atomare Ketten, Arrays von Wellenleitern). Periodische Anordnungen von Schichten
werden als Bragg-Spiegel bezeichnet. Die Reflektivität dieser Spiegel ist in bestimmten Frequenzbereichen nahezu ’1’ und wächst mit der Anzahl der Schichten und dem
Brechzahlkontrast zwischen den Schichten. Braggspiegel werden in Resonatoren (Laser,
Interferometer) eingesetzt. Ändert sich die Periode (z. b. linear) nennt man die Spiegel gechirpt. Solche Spiegel werden zur Dispersionskompensation in Nachrichtenübertragungsstrecken und bei der Erzeugung ultrakurzer Impulse (einige fs) eingesetzt.
151
Wir wollen hier die Grundlagen der Braggreflexion verstehen und betrachten ein
halbunendliches periodisches Vielschichtsystem [x > 0, (ε1 , d1 ) , (ε2 , d2 )] und setzen TEPolarisation und Monochromasie voraus. Von vorn wissen wir, daß an der Grenzfläche
Substrat-Braggspiegel (x = 0) gelten muß:
EI + ER = E0
∂E = E0 ,
iksx (EI − ER ) =
∂x 0
(7.12)
damit ergibt sich für die Reflektivität
2 ksx E0 + iE0 2
ER ,
ρ = = EI
ksx E0 − iE0 (7.13)
d. h., Totalreflexion tritt auf, wenn E0 reell ist. Die Aufgabe besteht nun darin, das Feld
im Vielschichtsystem zu berechnen. Für endliche Systeme muß die Matrixmethode und
die numerische Lösung des Problems herangezogen werden. Ist das periodische Medium
unendlich ausgedehnt (Analogie zum eindimensionalen Kristall), kann man vom BlochTheorem (siehe Festkörperphysik) Gebrauch machen. Das periodische Vielschichtsystem
kann charakterisiert werden durch
ε(x) = ε(x + Λ),
wobei Λ = d1 + d2 die Periode darstellt. Das Bloch-Theorem sagt aus, daß nun jede
Lösung die Gestalt
E(x, z; ω) = exp {i [kx (kz , ω) x + kz z]} Ekx (x)
mit
Ekx (x + Λ) = Ekx (x)
annimmt. kx ist der sog., bislang unbekannte, Blochvektor. Natürlich unterscheidet sich
der zu bestimmende Zusammenhang zwischen kx , kz und ω von der Volumendispersionsrelation
ω2
2
kx = 2 ε (ω) − kz2 .
c
Zur Vereinfachung der Schreibweise setzen wir im folgenden kx = K. Das Feld trägt
den Index ’K’,.d.h., zu jeder Lösung der Dispersionsrelation gehört ein anderes Feld.
Die Felder am Anfang der N −ten und (N + 1) −ten Schicht sind damit folgendermaßen
verbunden (wir lassen den Index weg)
E
E
= exp (iKΛ)
.
E Nd
E (N+1)d
Andererseits können wir die Felder unter Benutzung der Matrixmethode verbinden
E
E
=M
(7.14)
E (N+1)d
E Nd
152
=M
(d2 ) M
(d1 ), wobei Mij = ! M (2) M (1) . Gleichsetzen ergibt
mit M
ik
kj
k
# E "
exp (iKΛ) I
M−
=0
E Nd
(7.15)
und mit µ = exp (iKΛ) erhält man wegen
"
#
I = 0
det M−µ
die vorläufige Dispersionsrelation (eigentlich ist K) zu bestimmen
$
2
(M11 + M22 )
(M11 + M22 )
±
− 1.
µ=
2
2
(7.16)
Bevor wir uns näher mit dieser Dispersionsrelation beschäftigen, bestimmen wir aus
Gl.(7.15) das Feld und die Ableitung
E
1
ENd .
=
(µ − M11 ) /M12
E Nd
153
Setzen wir N = 0, folgt aus Gl.(7.13) , daß für Totalreflexion E0 und damit µ reell sein
muß, d.h.
(M11 + M22 ) ≥1
2
mit
M11 = cos (k1x d1 ) cos (k2x d1 ) −
k2x
sin (k1x d1 ) sin (k2x d1 )
k1x
M22 = cos (k1x d1 ) cos (k2x d1 ) −
k1x
sin (k1x d1 ) sin (k2x d1 ) .
k2x
Die explizite Dispersionsrelation ergibt sich aus Gl.(7.16) mit
µ = exp (iKΛ) = cos (KΛ) + i sin (KΛ) = cos (KΛ) − {cos (KΛ)}2 − 1
zu
cos {K (kz , ω) Λ} =
(M11 + M22 )
2
2
und ersetzt damit die Volumendispersionsrelation kx2 = ωc2 ε (ω) − kz2 .
Folgende Schlußfolgerungen lassen sich aus der Dispersionsrelation ziehen:
1. Für die obige Bedingung für Totalreflexion (µ reell) wird der Blochvektor komplex
mit
{K (kz , ω) Λ} = nπ
und


$
2
 (M + M )

(M11 + M22 )
11
22
n

{K (kz , ω) Λ} = ln (−1)
− 1 .
±


2
2

2. Komplexer Wellenzahlvektor bedeutet Dämpfung. Damit ist in diesem Bereich von
(kz , ω) keine Ausbreitung möglich −→ evaneszente Einhüllende. Es gibt unendlich
viele solcher Bereiche (n = 1...∞). Diese Bereiche heißen verbotene Bänder oder
gaps −→ Braggspiegel, Braggwellenleiter, ’photonic crystals’
3. Die Bandgrenzen sind gegeben durch {K (kz , ω) Λ} = nπ K (kz , ω) = nπ/Λ
(und mit K = 2π/λB (λB −Blochwellenlänge) Λ = nλB /2) und {K (kz , ω) Λ} = 0.
4. Außerhalb der verbotenen Bänder existieren propagierende Lösungen, die sich aber
in ihren Eigenschaften von Volumenwellen unterscheiden (Dispersionsrelation) Ausnutzen der starken Krümmung zur Dispersionskompensation.
5. Für senkrechten Einfall (kz = 0) heißt das, daß verbotene Frequenzbereiche existieren (Filter etc.).
6. Graphische Darstellung der Dispersionsrelation für kz = 0 in dimensionslosen
Größen: Λc ω(KΛ)
154
7. Nimmt man
(M11 + M22 )
2
ω
ω
ω
1 n
ω
n1
2
sin
= cos
+
n1 d1 cos
n2 d2 −
n1 d1 sin
n2 d2
c
c
2 n1 n2
c
c
cos {K (ω) Λ} =
so findet man leicht im ersten verbotenen Band mit KΛ = π + ix für die Mitte des
gaps, die gegeben ist mit
ωB
π
ωB
n1 d1 =
n2 d2 =
c
c
2
cosh xma
1
=
2
n2 n1
+
n1 n2
∼
, xma = Λ(K)ma ≈ 2
λ/4 − Schichten,
n 2 − n1
n2 + n1
für
|n2 − n1 | << (n2 + n1 )
Dämpfung ist proportional zum Kontrast.
8. Die Breite des Bandes ergibt sich zu
∆ωgap ≈
2ωB
2ωB
xma =
Λ(K)ma
π
π
und ist damit ebenfalls proportional zum Kontrast.
7.3.5
Fabry-Perot-Resonatoren
Fabry-Perot-Resonatoren stellen eine Kombination der in den Kapiteln 7.3.3. und 7.3.4.
behandelten Konfigurationen, Schicht (Cavity) und periodisches Vielschichtsystem (Spiegel) , dar. Sie spielen in der Optik eine wichtige Rolle. Zum einen werden sie als
• Spektralapparate verwendet,
• zum anderen stellt ein Laser mit ebenen Spiegeln einen Fabry-Perot-Resonator mit
einem aktiven Medium in der Cavity dar.
• In der nichtlinearen Optik sind sie von Interesse, da in der Cavity eine starke
Feldüberhöhung auftritt und damit nichtlinear optische Effekte bei geringeren Intensitäten des einfallenden Lichtes auftreten. Effekte wie
155
1. Bistabilität,
2. Modulationsinstabilität,
3. Muster- und Resonatorsolitonenbildung
sind Gegenstand moderner Forschung.
Aus diesem Grunde ist es wichtig, die wesentlichen physikalischen Eigenschaften dieses optischen Elementes zu verstehen.
Hinsichtlich der Spiegel unterscheidet man zwischen Resonatoren mit Metall- (Auskopplung über den Tunneleffekt) und Bragg-Spiegeln.Wir untersuchen das Transmissionsverhalten der Resonatoren für
• beliebige ebene, unterschiedliche Spiegel mit Absorption
• absorbierende Cavity
• TE-Polarisation
Folgende Geometrie wird betrachtet:
ET
SD
RD
D
E+
TD
E-
R0
0
S0
EI
T0
ER
Dabei sind EI , ER und ET ,die Amplituden des einfallenden, reflektierten und transmittierten Feldes an den jeweiligen äußeren Grenzflächen der Spiegel. Die Reflexions- und
Transmissionskoeffizienten können für Metallfilme und Braggspiegel mit den in den Kapiteln 7.3.3. und 7.3.4. behandelten Methoden berechnet werden.
1) am unteren Spiegel gilt:
T0 EI + R0 E− (0) = E+ (0)
(7.17)
Das Ziel besteht darin, E− (0) und E+ (0) durch die Felder ER und ET zu ersetzen.
156
2) E+ (0) wird ersetzt durch Felder am oberen Spiegel
ET = TD E+ (D) mit E+ (D) = E+ (0) exp (ikfx D)
E+ (0) =
ET
exp (−ikfx D)
TD
(7.18)
3) jetzt ersetzt man E− (0)
a) am oberen Spiegel gilt:
E− (D) = RD E+ (D) =
RD
ET
TD
b) am unteren Spiegel gilt:
E− (0) = E− (D) exp (ikfx D)
RD
E− (0) =
ET exp (ikfx D)
TD
wegen
E− (D) = E− (0) exp (−ikfx D)
4) nun setzt man E+ (0) und E− (0) in 7.17 ein und erhält:
T0 EI + R0 E− (0) = E+ (0)
T0 EI + R0
RD
ET
ET exp (ikfx D) =
exp (−ikfx D)
TD
TD
EI =
1
{exp (−ikfx D) − R0 RD exp (ikfx D)} ET .
T0 TD
Daraus folgt Transmissionsfunktion eines Fabry-Perot zu
TTE =
ET
T0 TD exp (ikfx D)
=
.
EI
1 − R0 RD exp (2ikfx D)
Die Reflexion- und
der Spiegel sind komplex −→ (R, T )0,D =
Transmissionskoeffizienten
R,T
(|R| , |T |)0,D exp iϕ0,D , aber nur die Phasen der Reflexionskoeffizienten spielen für die
Transmissivität τTE ∼ |TTE |2 eine Rolle. Wir setzen jetzt
kfx = (kfx ) + i (kfx ) = k + iα
und erhalten
2
2
|TTE | = |T | =
|T0 |2 |TD |2 exp (−2αD)
1 + exp (−4αD) |R0 | |RD | − |R0 | |RD | exp (−2αD) cos 2kD + ϕ0 + ϕD
2
2
δ
τ=
kcx
|T |2 .
ksx
(7.19)
157
Die Art der Spiegel (Bragg-Spiegel unterschiedlicher Dicke) beeinflußt die Phasen (ϕ0 , ϕD )
und damit die Transmissivität. Die Beziehung 7.19 stellt die allgemeinste Formel zur Berechnung der Transmissivität bei Vorgabe von |R0 | , |RD | , |T0 | , |TD | und ϕ0 , ϕD dar, i.a.
gilt τma < 1.
Wir behandeln nun einige Spezialfälle:
a) verlustfreier FP-Resonator (Cavity und Spiegel)
τ=
kcx
|T0 |2 |TD |2
ksx 1 + |R0 |2 |RD |2 − |R0 | |RD | cos δ
Wegen Verlustfreiheit der Spiegel gilt:
|T0 |2 |TD |2 =
=
k ksx 1 − |RD |2
1 − |R0 |2
k
kcx
ksx 1 − |R0 |2 1 − |RD |2
kcx
mit
cos δ = cos2
δ
δ
δ
− sin 2 = 1 − 2 sin 2
2
2
2
erhalten wir
1 − |RD |2
τ=
1 + |R0 |2 |RD |2 − 2 |R0 | |RD | 1 − 2 sin 2 2δ
(
=
1 − |R0 |2
4 |R0 | |RD |
(1 − |R0 | |RD |)2
2δ
2 2 + 2 2 sin
2
1 − |R0 | 1 − |RD |
1 − |R0 | 1 − |RD |
)−1
.
Und mit
ρ0 = |R0 |2 , ρD = |RD |2
( )−1
2
√
√
1 − ρ0 ρD
4 ρ0 ρD
δ
τ=
.
+
sin 2
(1 − ρ0 ) (1 − ρD ) (1 − ρ0 ) (1 − ρD )
2
b) verlustfreier FP-Resonator mit symmetrischen Spiegeln
Dieser wichtigste Spezialfall erlaubt die Ableitung einer kompakten Formel (Airy-Formel)
für die Transmissivität. Bei Verlustfreiheit gilt das Reziprozitätstheorem, d.h. Reflektivitäten und Transmissivitäten an den Einzelspiegeln sind gleich von innen und von außen.
Damit gilt
ϕ = ϕ0 = ϕD
ρ = |R0 |2 = |RD |2 = ρ0 = ρD ,
158
gilt
(
τ=
4ρ
(1 − ρ)2
2δ
2 +
2 sin
2
(1 − ρ)
(1 − ρ)
)−1
−1
2δ
= 1 + F sin
2
mit
F =
4ρ
(1 − ρ)2
und
δ
= kD + ϕ
2
Die Airy-Formel beschreibt die Transmissivität eines symmetrischen, verlustfreien FabryPerot-Resonators. Nur in diesem Fall ist die maximale Transmissivität τ = 1 für δ/2 =
nπ zu erreichen.
Bemerkungen und Schlußfolgerungen
• Gleichungen gelten analog für TM-Polarisation, man hat die entsprechenden Refexionskoeffiziente RTM bzw. Reflektivitäten ρTM einzusetzen.
• Resonanzen: τMAX = 1 für δ/2 = kDMAX + ϕ = mπ mit
2π
k = kx =
λ
DMAX
n2F − n2S sin2 ϕI
m − ϕπ
mπ − ϕ
λ
=
= kx
2 n2F − n2S sin2 ϕI
λ
cavity.
2
(7.20)
Transmissionseigenschaften ändern sich mit ϕI und λ.
• Transmissionsminima
τMIN =
1
1+F
−→ Ziel: großes F, um großen Kontrast zu erreichen, z.B. F = 100
4ρ
(1 − ρ)2
4
ρ = 1 − ε 2 ≈ 100 ε = 0.2 ρ = 0.8.
ε
100 = F =
159
Abbildung 7.1: Fabry-Perot-Resonator
160
• bei Pulsen und Bündeln geht man wie bei der Grenzfläche vor −→z.B. TE: ET (α, β, ω) =
TFP (α, β, ω)EI (α, β, ω) −→ Fouriertransformation ET (x, y, t) = FT [ET (α, β, ω)],
interessante Näherung (Moden- oder mean-field-Theorie)
TFP (α, β, ω) ∼
σ2
1
(ω) − α2 − β 2
−→ σ 2 (ω) (komplexe Resonanz) entwickeln und Fouriertransformation −→ DGL
in z, y, t.
• Reflektivitäten von Metallfilmen oder dielektrischen Spiegeln werden mit den in
den Kapiteln 7.3.3. und 7.3.4. vorgestellten Methoden berechnet.
• Finesse (Güte) eines Resonators:
∆ 2δ
π
ABSTAND DER RESONANZEN
=
=
Φ=
HALBWERTSBREITE
ε
ε
.
ε = FWHM
"
1 + F sin
2
ε 2 −1
ε #−1 . 1
mπ ±
= = 1+F
2
2
2
ε 2
2
F
=1ε= √
2
F
π√
π
Φ=
F ε= .
2
Φ
−→ Linienbreite ist umgekehrt proportional zur Finesse. Wir erhalten für die AiryFormel
)−1
(
2
δ
2Φ
τ = 1+
sin 2
.
π
2
• Fabry-Perot-Resonator als Spektralapparat −→ Auflösungsvermögen (senkrechter
Einfall)
Resonanz:
∆k
ε
π
D = mπ ± = mπ ±
2
2
2Φ
π
2π
|∆k| = 2 nf |∆λ| =
λ
ΦD
kD + ϕ = mπ −→ kD + ϕ ±
∆λ = λ ∼ 1 ∼ ε (ρ)
λ nf ΦD
ΦD
D
Das Auflösungsvermögen wird größer mit kleinerer Linienbreite oder /und größerer Cavitydicke.
= 4 · 10−6 ∆λ =
Beispiel: λ = 5 · 10−7 m, Φ = 30, nf D = 4 · 10−3 m ∆λ
λ
2 · 10−12 m
• Feldüberhöhung in der Cavity ∼ |T |−2 ∼ 1/(1 − ρ) ∼ Φ −→ wichtig für nichlineare
Effekte
161
• Lebensdauer der Photonen in der Cavity
Unschärferelation: ∆ωTc = const. ≈ 1. Wegen
π
1
|∆k| = nF ∆ω =
c
ΦD
∆ω =
c π
1
nF ΦD
D
Tc =
=
∼
.
nF ΦD
∆ω
cπ
ε (ρ)
Lebensdauer wächst mit Finesse und Cavity-Dicke. Trade-off zwischen Feldüberhöhung
und Lebensdauer.
• Optische Bistabilität
−→ in Resonator Feldüberhöhung −→ wenn Cavity-Material nichtlinear ist (z.B.
nF (I) = nF + n2 I) −→ Verstimmung
δ0
δ
δ0
=
+ kDn2 I =
+ akD |ET |2
2
2
2
T =
1
ET
EI
und
T = f (ET )
a) geringe Finesse
T
ET
1
2
3
4 ET
1
2
3
4 EI
b) große Finesse
T
1
2
ET
4
3
3
2
4
1
ET
162
1
2
3
4 EI
7.4
Geführte Wellen in Schichtsystemen
Motivation:
• Suche nach Wellen, die sich beugungsfrei ausbreiten.
• Miniaturisierung der Optik −→ Licht in dielektrischen Schichten (Streifen, Fasern)
kleiner Dimension einsperren.
• Störunanfälligkeit, Führung des Lichtes an gewünschte Positionen, optische Nachrichtenübertragung
• überhöhte nichtlineare Effekte.
• Schichtsysteme deshalb, um allgemeingültige Aspekte zu erkennen und bestimmte
praktisch wichtige Fälle (stark gekoppelte Wellenleiter, Bragg-Wellenleiter) behandeln zu können.
7.4.1
Feldstruktur geführter Wellen
bisher: Reflexions–Transmissionsproblem
Aufgabe: Vorgabe von kz , EI , di, εi −→ Berechnung von ER, ET
Felder (eine Fourierkomponente) sind Normalmoden des homogenen Mediums:
∼ Eα (kz , ω) exp [i (kαx x + kz z − ωt)]
Frage: Kann Schichtsystem Wellen einfangen (nicht mehr unendlich ausgedehnt)
Hinweis: Totalreflexion
ET (x, z) = ET exp (ikz z) exp (−µc x)
−→ Totalreflexion ist der prinzipielle Mechanismus (auch an Grenzfläche???)
neue Eigenschaft geführter Wellen −→ Ausbreitung ist nur absorptions- und nicht beugungsbegrenzt.
Feldstruktur geführter Wellen:
• ebene Welle in Ausbreitungsrichtung
∼ exp (ikz z)
163
• oszillierende Lösung (stehende Wellenfelder) im Kern (Schichten, Faserkern, Streifen) (später werden wir auch exponentielle Felder im Kern kennenlernen), hier
zumindest in einer Schicht
∼ A sin (kfx x) + B cos (kfx x)
mit
kix =
1. Einschränkung:
kz2 <
ω2
εi (ω) − kz2 > 0
c2
ω2
max {εi (ω)}
c2 i
• evaneszente Wellen in Substrat und Cladding
∼ exp [−µc (x − D)]
∼ exp (µs x)
mit:
kz2 −
µs,c =
Cladding
Substrat
ω2
εs,c (ω) > 0
c2
2. Einschränkung:
ω2
εs,c (ω)
c2
und damit ist die z-Komonente des Wellenzahlvektors geführter Wellen eingeschränkt:
ω ω
ns,c < kz < max
ni
max
i
c
c
kz2 >
Die Feldstruktur in den umgebenden Medien
ET (x, z) = ET exp (ikz z) exp [−µc (x − D)]
ES (x, z) = ES exp (ikz z) exp (µs x)
x>D
x<0
impliziert, daß eine reflektierte und transmittierte Welle im Grenzfall verschwindender
einfallender Welle existiert. Diese Tatsache nutzen wir aus, um die Eigenschaften geführter Wellen einfach durch Spezialisierung der in Kapitel 7.3 gewonnenen Erkenntnisse
abzuleiten anstatt den gesamten schwerfälligen Apparat nochmals zu bemühen.
7.4.2
Die Dispersionsrelation geführter Wellen
Da ET , ER = 0 für EI −→ 0, gilt R, T −→ ∞, d.h. geführte Wellen sind Resonanzen des
Systems (vgl. mit getriebenen harmonischen Oszillator)
x=
ω2
F
− ω02
−→ ω = ω0 ist Resonanz. Damit erhält man die Dispersionsrelation geführter Wellen
für verschwindende Nenner von R, T . Man kann ein allgemeines physikalischen Prinzip
formulieren:
164
Die Pole der Responsefunktion (oder der Greenschen Funktion) entsprechen Resonanzen des Systems.
Man erhält damit von vorn:
.
(αs ksx M22 + αc kcx M11 ) + i (M21 − αs ksx αc kcx M12 ) = 0
und mit
ksx = iµs ,
kcx = iµc
.
(αs µs M22 + αc µc M11 ) + (M21 + αs µs αc µc M12 ) = 0
M11 + αs µs M12 +
1
αs µs
.
M21 +
M22 = 0
αc µc
αc µc
mit
αTE = 1,
αTM =
1
ε
zusätzlich zur Materialdispersion
k 2 (ω) =
ω2
εi (ω) = kx2 + kz2
c2
tritt die Wellenleiterdispersionsrelation kz (ω, Geometrie) es gibt nur einen diskreten
Satz von Lösungen −→ Moden, d.h. bei Vorgabe von εi , di , ω folgt kzµ (ω) .
Bemerkung: Analogie zur zeitfreien Schrödingergleichung
z.B. TE-Polarisation
2
ω2
d
2m
2m
d2
2
+
ε(x)
E(x)
=
k
E(x)
←→
−
V
(x)
ψ(x)
=
−
Eψ(x)
z
dx2
c2
dx2
2
2
• geführte Wellen ←→ diskrete Energieeigenwerte
kz2 >
ω2
εc,s ←→ E < VUmgebung
c2
e
e
V
VS
2
kz
w 2
2
c
e
f
e
C
E
S
• Tunneleffekt
kz2 >
ω2
εFilm ←→ E < VBarriere
c2
165
VC
e
V
VB
2
kz
2
w
c2
E
• Warum nur endliche Anzahl diskreter Moden?
Randbedingung (ET,R −→ 0 für x −→ ±∞) wählt diskrete Werte von kz aus.
εc , εs , kz bestimmen eindeutig die Ableitungen auf den Grenzflächen nur die
erlaubten kz führen auf Lösungen mit dem richtigen asymptotischen Verhalten auf
dem Rand.
• Dispersionsrelation ist eine komplizierte transzendente Gleichung für kz (ω, d, εi , εc , εs ) −→
im allgemeinen werden numerische Nullstellensuchroutinen benötigt.
• Feldberechnung im Schichtsystem
1. kz aus Dispersionsrelation
2. im Substrat gilt:
F (x) = F exp (µs x) ,
G(x) = α
∂
{F exp (µs x)}
∂x
F (0), G(0) = αµs F (0) sind bekannt bei Vorgabe von F (0) −→ freier Parameter
3.
7.4.3
F
G
= M(x)
x
F
G
= M(x)
0
1
αµs
F (0).
Geführte Wellen an einer Grenzfläche - Oberflächenpolaritonen
Gibt es lokalisierte Anregungen an einer Oberfläche?
Bedingung: kz2 >
ω2
ε
c2 c,s
Matrix:
=
M
1 0
0 1
166
damit folgt die Dispersionsrelation
1+
αs µs
= 1.
αc µc
a) TE-Polarisation (α = 1)
µs + µc = 0,
da beide Größen positiv sind, gibt es keine Lösung. Das ist physikalisch sofort klar, da
hier
∂E
F = E,
G=
∂x
und Feld und Ableitung müssen steig sein. Die Ableitung ist jedoch unstetig an der
Grenzfläche. es existieren keine TE-polarisierten Oberflächenpolaritonen.
b) TM-Polarisation (α = 1/ε)
Dispersionsrelation
µc µs
+
=0
εc
εs
−→ vgl. Brewster
kcx ksx
−
= 0,
εc
εs
da
µc , µs > 0 εc · εs < 0,
d.h., ein Medium muß ’oberflächenaktiv’ sein (εc ∨ εs < 0) −→ Geführte TM-polarisierte
Oberflächenwellen existieren nur in der Nähe von Resonanzen eines beteiligten Materials.
167
Existenzbedingungen:
• Dielektrika −→ ω0(T) < ω < ωL −→ Oberflächen-Phonon-Polaritonen
• Metall −→ ω < ωp −→ Oberflächen-Plasmon-Polaritonen
explizite Dispersionsrelation
(µc εs )2 = (µs εc )2
ε2s (ω)
ω2
ω2
2
2
2
kz − 2 εc = εc kz − 2 εs (ω)
c
c
$
ω
kz (ω) =
c
εs (ω) εc
εc + εs (ω)
• zweite Bedingung: εc + εs (ω) < 0, also insgesamt:
1. εs (ω) < 0, εc > 0,
2. |εs (ω)| > εc
es existiert bei Vorgabe der Frequenz und für eine Materialkombination nur eine
geführte Mode mit kz (ω).
Beispiel:OF-Plasmon-Polaritonen an Grenzfläche Luft-Metall
Metall:
ωp2
εs (ω) = 1 − 2 < −εc = −1
ω
ωp2
ω2 <
.
2
168
Explizite Dispersionsrelation:
ω2
ω 2 1 − ωp2
kz2 (ω) = 2
c 1 + 1 − ωp22
ω
2
1 2
1 2
2 2
ω =
ωp + 2c kz −
ωp + 2c2 kz2 − c2 kz2 ωp2 ,
2
4
√
kz −→ ∞ ω −→ ωp / 2.
kz −→ 0 ω −→ 0,
2
w =ckz
w
w
w =w
P
P
e C+e w S( )=0
2
kz
−→ an der Grenzfläche können sich im ’dämpfenden’ Frequenzbereich (Volumen)
ungedämpfte Wellen ausbreiten.
Feldstruktur eines TM-OF-Polaritons
stetige Felder −→ F = Hy = H,
da ε das Vorzeichen wechselt, gilt das auch für
G=
∂Hy
.
∂x
Hs (x, z) = H0 exp (ikz z) exp (µs x)
Hs (x, z) = H0 exp (ikz z) exp (−µc x)
mit µs =
kz2 +
ω2
|εM |.
c2
Aus der Maxwellgleichung
ETM =
i
rot HTM
ωε0 ε
169
1 ∂H
,
ε ∂x
folgt
Es,cx =
kz
H
ωε0 εs,c
i µs
H
ωε0 εs
i µc
Ecz = −
H
ωε0 εc
Esz =
GF
∼
∼
∂
∂z
∂
∂x
∂
∼
.
∂x
GF
Ex
H,Ez
x
x
H, Ex in Phase, Ez um -π/2 phasenverschoben.
OF-Wellen:
• Spektroskopie, jedoch eingeschränkter Frequenzbereich
• Radiowellen (AM)
• Erdbeben, Wasserwellen
• whispering gallery
7.4.4
Geführte Wellen in einer Schicht - Schichtwellenleiter
−→ eigentliche Basis der Integrierten Optik
typische Parameter:
• d ≈ einige λ
• ∆ε ≈ 10−3 − 10−1
• Herstellung durch Beschichtung, Diffusion, Ionenimplantation
170
= m(d)
M
=
1
αf kfx
cos (kfx d)
−αf kfx sin (kfx d)
sin (kfx d)
cos (kfx d)
Dispersionsrelation:
M11 + αs µs M12 +
cos
1
αs µs
.
M21 +
M22 = 0
αc µc
αc µc
δ
δ αf kfx
δ αs µs
δ
αs µs
sin −
sin +
cos = 0,
+
2 αf kfx
2 αc µc
2 αc µc
2
tan (kfx d) =
αs µ s
αc µ c
− ααfskµfxs
1+
αf kfx
αc µ c
=
αf kfx (αs µs + αc µc )
2
αf2 kfx
− αc αs µc µs
tan (kfx d) =
7.4.4.1
δ
= kfx d
2
kfx
αf
µs
αc
2
kfx
αc αs
+
−
µc
αs
µc µs
α2f
.
a) TE-Polarisation
(α = 1)
kfx (µs + µc )
,
2
kfx
− µc µ s
−→ implizite Gleichung für kz −→ Lösungen kzν ; für reelle dielektrische Funktionen und
tan (kfx d) =
ω2
ω2
2
max
(ε
,
ε
)
≤
k
≤
εf
c
s
z
c2
c2
171
sind alle Lösungen reell.
7.4.4.2
Bemerkungen:
• Trick zur Bestimmung der Wellenzahl (Propagationskonstante) −→ kz vorgeben
−→ d oder ω bestimmen
√
1. Startwert: kz =(ω/c) εf
2. einsetzen in :
dcalc
1
=
kfx
kfx (µs + µc )
arctan
+ νπ .
2
kfx
− µc µs
( ν = 0, 1, 2.. nummeriert Moden)
172
3. ∆ = dcalc − d
4. kz reduzieren bis dcalc − d das Vorzeichen wechselt.
5. Intervallhalbierung
• meist im sichtbaren Gebiet εi (ω) = εi , da weit weg von Resonanz. Wellenleiterdispersion i.a. viel stärker als Materialdispersion.
• Verschwinden eines Modes −→ cut-off (hier o.B.d.A. εc < εs )
Definition des cut offs: γs = 0 −→ kein Abklingen kz2 =
tan
ω √
c
ω2
ε
c2 s
√ε − ε √ε − ε
εs − εc
f
s
s
c
εf − εs d =
=
εf − εs
εf − εs
(ωd)TE
co
(ωd)TE
co
εs − εc
arctan
+ νπ
εf − εs




c
arctan
a
=√
+
νπ

εf − εs  c
=√
εf − εs
max π/2
mit Asymmetrieparameter a :
εs ≈εc
εs ≈εf
a −→ 0
a −→ ∞ .
εs =εc
−→ cut-off Frequenz für kz (ω) −→ d fest
−→ cut-offDicke für kz (d) −→ ω fest
1. symmetrischer Wellenleiter cut-off = 0
2. stark asymmetrischer Wellenleiter (ωd)TE
co =
√
c
εf− εs
*π
2
+ νπ
+
• Anzahl der Moden m −→ Umstellen nach ν und ν = m + 1
•
1 2π √
m = 1 + int
εf− εs d − arctan a
π λ
mit
int(c) =
Vorkommawert
−1
f. c > 0
.
f. c < 0
• Dispersionskurven
−→ graphische Darstellung der Dispersionsrelation mit neff =
ω
kz / c
1. kz (ω) −→ neff (ω)
2. kz (d) −→ neff (d)
173
3. kz (ωd) −→ speziell in Faseroptik
ω √
ω
d
d εf− εs = dNA = 2πNA
c
c
λ
n2eff − εs
B=
εf− εs
V =
neff (V ) oder B(V ); V - Wellenleiterparameter, NA- numerische Apertur
Modenanzahl:
1 2π √
m = 1 + int
εf− εs d − arctan a
π λ
d arctan a
= 1 + int 2NA −
λ
π
d
m = 1 + int 2NA
symm.WL
λ
d 1
stark asymm.WL
m = 1 + int 2NA −
λ 2
• Feldstruktur
µs,c =
1. kz −→
2. kz −→
ω
ε
c f
ω
c
kz2 −
ω2
εs,c
c2
µs,c werden am größten starker Abfall
max(εs,c ) µs ∨ µc −→ 0 weites Eindringen
174
F
G
= m(x)
x
F = E,
F
G
0
dF
dE
G=
=
dx
dx
Ef (x) = m11 E0 + m12
dE ,
dx 0
dE = µs E0
dx 0
µs
Ef (x) = E0 cos (kfx d) +
sin (kfx d) .
kfx
Gesamtfeld einer Mode:
#
 "
µsν

 cos (kfxν d) + kfxν sin (kfxν d) exp [−µc (x − d)]
Eν (x, z) = E0 exp (ikzν z) cos (kfxν x) + µsν sin (kfxν x)
kfxν


exp (µs x)
x>d
0≤x≤d ,
x<0
also: kzν aus Dispersionsrelation Modenfeld Eν (x); ν-Anzahl der Nulldurchgänge
• Energietransport
1
S = (E × H∗ )
2
1
1
∂E ∗
∗
=0
Sx = (EHz ) =
iE
2
2ωµ0
∂x
1
1
∂E ∗
kzν
∗
Sz = (EHx ) = −
iE
|Eν (x)|2
=
2
2ωµ0
∂z
2ωµ0
Energiefluß geführter Moden nur in Ausbreitungsrichtung
• Geführte Leistung
kzν
Pν =
2ωµ0
7.4.4.3
∞
−∞
2
|Eν (x)| dx
W
m
b) TM-Polarisation
(α = 1/ε)
• Dispersionsrelation
tan (kfx d) =
kfx εf (µs εc + µc εs )
.
2
kfx
εc εs − µc µs ε2f
175
• cut off
√ε − ε √ε − ε ε ε
εf εs − εc
f
s
s
c s f
tan
εf − εs d =
=
c
(εf − εs ) εs εc
εc εf − εs




c
εf
√
=
a
+
νπ
(ωd)TM
arctan
co

εc
ε f − εs 
ω √
TE
TM
> kzν
.
für TM-Polarisation sind cut-off Dicken und Frequenzen größer kzν
• Anzahl der Moden
1 2π √
εf
m = 1 + int
εf− εs d − arctan
a
.
π λ
εc
• Feldstruktur
#
 "
εf µsν

 cos (kfxν d) + εs kfxν sin (kfxν d) exp [−µc (x − d)] x > d
Hν (x, z) = H0 exp (ikzν z) cos (kfxν x) + εf µsν sin (kfxν x)
0≤x≤d ,
εs kfxν


exp (µs x)
x<0
und die elektrischen Feldkomponenten folgen mit
Ex =
i ∂H
kzν
=−
H
ωε0 ε ∂z
ωε0 ε
i
∂H
ωε0 ε(x) ∂x
Ez = −
• Energietransport
Sx = 0
1
kzν
|Hν (x)|2 .
Sz = (Ex H ∗ ) ==
2
2ωε0 ε(x)
• Geführte Leistung
PνTM
kzν
=
2ωε0
∞
−∞
|Hν (x)|2
dx
ε(x)
W
.
m
Bemerkung: Geführte Wellen im Strahlenbild
q
C
k
q
d
S
∆Φ + ∆Θtot = 2kxf d + Θc + Θs = 2mπ.
176
7.4.5
Anregung geführter Moden
−→ OF-Polaritonen analog
zwei Möglichkeiten: Feldanpassung oder Wellenzahl (kz )-Anpassung
• Feldanpassung −→ Stirnflächenkopplung
im Wellenleiter (ohne Strahlungsmoden):
aν Eν (x) exp (ikzν z)
E(x, z) =
ν
E(x, 0) ≈
wegen : Pν =
kzν
2ωµ0
kzν
aν =
2ωµ0 Pν
ν∞
−∞
∞
−∞
Eµ (x)
aν Eν (x)
|Eν (x)|2 dx
Ein (x)Eν (x)dx,
d.h. die Mode ν wird durch das einfallende Feld Ein (0) mit der Amplitude aν angeregt.
Gauß-Strahl regt den Grund-Modus gut an. Wegen der Symmetrie ungerader Moden
werden sie nur von versetztem Gauß-Strahl angeregt.
• Wellenzahlanpassung −→ Impulserhaltung
e
kz e
C
e
f
S
1. kz muß an Grenzflächen stetig übergehen
2. Bedingung für die Existenz geführter Wellen
kz >
ω√
εc,s
c
auch für OF-Polaritonen
$
$
εs (ω) εc
|εM (ω)|
ω
ω
ω
kz (ω) =
= εc
> εc .
c εc + εs (ω)
c
|εM (ω)| /εc − 1
c
177
3. Dispersionsrelation der Volumenwelle erfordert
ω√
ω2
2
kz =
εc,s − ks,cx
<
εc,s
2
c
c
Widerspruch
• Prismenkopplung
ω√
εf
c
Auf Wellenleiter Medium mit εp > εf (Prisma) kz <
2
kpx = ωc2 εp − kz2 > 0.
kz <
ω√
εp
c
x
z
e
möglichst
weit hinten
p
evaneszent
kpx kz
e
kz
f
−→ Physik des Tunneleffektes , ATR(’attenuated total reflection’)
R
breiter Spalt
enger Spalt
kz
Breite und Minimum der Resonanz und damit die Effektivität der Anregung hängen
von Breite des Luftspalts ab Strahlungsdämpfung ∼ 1/Breite −→ Optimierung; Prisma ’verfälscht’ Mode
Metallfilm
Luft
Luft
Metall
Otto-Geometrie (WL, OF)
178
Kretschmann-Geometrie (OF)
• Gittlerkoppler
f
e
g
kz
C
e
f
e
S
kzn
Gitter:
d(z) = d + ς(z)
ς(z) = A sin (gz)
mit
g=
2π
P
P - Gitterperiode
Bedingung:
kzν = kz + mg
ω
= ns sin φ + mg.
c
Gittermodulation bestimmt Effektivität (ähnlich Luftspalt).
Bei beiden Methoden ist Einkopplung stets mit Auskopplung verbunden.
7.4.6
Einige Bemerkungen zu Streifen- und Faserwellenleitern
7.4.6.1
Streifenwellenleiter
−→ für Anwendung wichtiger −→ zweidimensionale Führung
w
h
e
e
C
e
f
179
S
i. a. keine Aufspaltung in TE- und TM-Moden → Hybridmoden (besitzen alle Feldkomponenten)
Et (x, y)
.
Eν (x, y) =
Ez (x, y)
Die Gleichungen lassen sich entkoppeln und es folgt eine Eigenwertgleichung für Et (x, y)
2
ω
2
2
Et (x, y) + ∇t {Et (x, y)∇t log ε(x, y)} = 0
∇t +
ε(x, y) − kz
c2

mit
∇t = 
∂
∂x
∂
∂y

.
0
EW-Gleichung kann nur mit vektoriellen Eigenwertlösern behandelt werden → z.B.
Finite-Element-Methode (FEM).
Wichtige Näherung → Effektive-Index-Methode: Quasi-TE, Quasi-TM
→ sukzessive Lösung für zwei Schichtwellenleiter
1)
w
TE
d
e
C
e
f
e
neff 12 neff 22 neff 12
e
C
e
f
e S
neff 22
S
neff 12
2) in y-Richtung nun als effektiver Wellenleiter
neff 12
TM
y
neff 22
w
neff 12
7.4.6.2
x
Zerlegung in 3 Gebiete
Grundbauelemente:
1. Richtkoppler
Aufbau:
Theorie: Supermoden, Kopplung
P1 (z) = P0 cos2 (kkop z)
180
y
d
e
C
e
f
e S
neff 12
→ nichtlinearer Schalter.
Technologie:
7.4.6.3
Reflektoren (Spiegel)
→ Bragg-Gitter
2π
2π
neff = mg = m
λ
Λ
mλ
.
Λ=
2neff
2 |kz | = 2
7.4.6.4
Faserwellenleiter
→ Quarzglas, Si02 , → Kern, cladding, jacket, zylindrische Geometrie, step-index, gradedindex
Brechzahlverhältnisse:
Wellenleiterparameter:
V =
2π 2
rco nco − n2c
λ
Für V < 2.405 single-mode Wellenleiter, ansonsten multi-mode
i.a. schwache Wellenleitung → skalare Näherung der Eigenwertgleichung
2
ω
2
2
∇t +
ψ(x, y) = 0
ε(x, y) − kz
c2
→ Entartung, Zylindersymmetrie, Besselfunktionen sind Eigenlösungen, Grundmodus kann oft durch Gauß-Profil genähert werden für 1 < V < 2.405. Man erhält mit
∆ = 0.5
εco − εc
εco
181
r2
ψ ∼ ψ0 exp −2 2 log V
rco
1
kz =
rco
7.4.6.5
/ exp (−2 log V )
V2
− 1 − 2 log V .
2∆
Dämpfung und Dispersion
→ Dämpfung extrem niedrig
α = 0.2 dB/km @ 1.55 µm (50% nach 15 km)
→ im wesentliche Rayleigh-Streuung an stochastischen Inhomogenitäten
Dispersion:
Dω =
∂ 2 kz
∂ 1
=
,
∂ω 2
∂ω vg
oft:
Dλ =
mit
ω=
∂ 1
∂λ vg
2πc
λ
182
[Dω ] =
ps2
km
folgt
2πc ∂
∂
=− 2
∂λ
λ ∂ω
und damit
2πc
ps
Dω ,
[Dλ ] =
2
λ
nm · km
ps
Dλ = 1 nm×km bedeutet, daß sich eine Wellenlängenverschiebung um 1nm bei der
Ausbreitung über 1 km in einer Veränderung der Ankunftszeit um 1 ps bemerkbar macht.
Es gilt die Faustformel:
2
. ps /
1.88
ps
≈− 2
Dω
.
Dλ
nm · km
λ [µm]
km
Dλ = −
Typische Dispersionswerte bei der Kommunikartionswellenlänge von λ = 1550 nm:
Standardfaser (billig, einfaches Profil): Dλ = 17 ps/(nm· km)
183
Kapitel 8
Statistische Optik –
Kohärenztheorie
8.1
Grundlagen
wesentliche Beiträge durch Max Born und Emil Wolf (50iger Jahre)
Gegenstand: Eigenschaften von ‘zufälligem’ Licht → Fluktuationen der Quelle oder
der optischen Eigenschaften des Mediums, das vom Licht passiert wird.
• natürliches Licht (Wärmestrahler), viele unabhängige Atome (unterschiedliches ω
und Phase)
• Streuung an rauhen Oberflächen
→ Kohärenztheorie
Annahmen: skalare Näherung u(r, t), bisher: u(r, t) = U (r, ω) exp −iωt) + c.c. z.B.:
U (r, ω) = exp (ikr) → Phasen vollständig determiniert → kohärentes Licht
Feld ist Zufallsgröße, erfüllt jedoch nach wie vor die Wellengleichung. Statistische Eigenschaften führen zur Einteilung des Lichtes nach dem Grad der Korrelation der Phasen
in:
• kohärentes Licht
• partiell kohärentes Licht
• inkohärentes Licht
Wir definieren zuerst wesentliche Begriffe der Kohärenztheorie.
184
8.2
Statistische Eigenschaften des Lichtes
8.2.1
Definitionen
u(r, t) → komplexes anyltisches Signal
∞
u(r, t) =
U (r, ω) exp (−iωt) dω
0
∞
uR (r, t) = U (r, ω) exp (−iωt) dω.
0
8.2.1.1
a) Intensität
I(r, t) = |u(r, t)|2 e
|u(r, t)|2 - Zufallsintensität, e - Ensemblemittelwert → gleiche Präparation des Systems
• statistisch stationär - Lampe mit konstantem Strom
I(r, t) = I(r).
Es gilt die Ergodenhypothese: Ensemblemittelwert kann durch Zeitmittelwert ersetzt werden.
e = t = 1
I(r) = lim
2T
T
|u(r, t)|2 dt
−T
T →∞
• statistisch nichtstationär → Lampe mit veränderlichem Strom → I(r, t)
185
8.2.1.2
b) zeitliche Kohärenz und Spektrum
Annahmen: statistisch stationär → I(r) und am festen Ort → I(r) = I.
Maß für Korrelation von u(t) und u(t + τ ) → Autokorrelationsfunktion G(τ )
1
G(τ ) = u∗ (t)u(t + τ ) = lim
T →∞ 2T
T
u∗ (t)u(t + τ )dt.
−T
G(τ ) ist die zeitliche Kohärenzfunktion.
Zeitskalen: u(t) schwach veränderlich innerhalb von tK (Korrelationszeit), darüberhinaus ‘rauh’, d.h., G(τ ) = 0 für τ > tK .
Speziell gilt:
G(0) = I.
G(τ ) beschreibt damit Kohärenz und Intensität. Man kann beide Effekte trennen durch
die Einführung einer normierten Größe → komplexer zeitlicher Kohärenzgrad g(τ )
g(τ ) =
G(τ )
u∗ (t)u(t + τ )
=
G(0)
u∗ (t)u(t)
0 ≤ g(τ ) ≤ 1.
Beispiel: deterministisches Licht
u(t) = A exp (−iω0 t)
1
|A|2 exp (−iω0 τ ) dt
2T
g(τ ) =
= exp (−iω0 τ ) → |g(τ )| = 1.
2
1
|A|
dt
2T
i.a.:
Kohärenzzeit:
|g(τ )| nimmt monoton ab Definition der Kohärenzzeit über Breite von |g(τ )| = 1/e
o. 1/2.
186
τc =
∞
−∞
|g(τ )|2 dτ,
also |g(τ )| = 1 τc → ∞.
z.B.: g(τ ) = exp (− |τ | /A) τc = 2 exp (−2 |τ | /A) dτ = A(1 − 0) = A.
Kohärenzlänge: lc = cτc wenn Längendifferenzen in optischen Systemen ≤ lc →
Kohärenz.
8.2.1.3
c) Das Wiener-Khinchin-Theorem
→ Zusammenhang Spektrum und zeitliche Kohärenz
Theorem: Die Fouriertransformation der Autokorrelationsfunktion eines Signals ist
identisch mit dem Betragsquadrat der Fouriertransformation des Signal.
hier also: Zusammenhang zwischen FT der zeitlichen Kohärenzfunktion und des Signalspektrums
∞
S(ω) exp (−iωt) dω
G(τ ) =
−∞
und
S(ω) = |U (ω)|2 .
Beweis (beachten, daß endliche Zeiten, da bei stationären Prozessen unendliche Energie):
T
1
∗
u∗ (t)u(t + τ )dt.
G(τ ) = u (t)u(t + τ ) = lim
T →∞ 2T
−T
abgeschnittene FT:
1
UT (ω) =
2π
uT (t) =
uT (t) =
∞
uT (t) exp (iωt) dt
−∞
u(t)
0
für
|t| ≤ T
sonst
∞
−∞
UT (ω) exp (−iωt) dω,
187
1
G(τ ) = lim
T →∞ 2T
T
UT∗ (ω ) exp (iω t) UT (ω ) exp [−iω (t + τ )] dω dω dt
−T
1
= lim
2π
T →∞ 2T
T
|UT (ω )| exp (−iω τ ) dω 2
−T
S(ω) = 2π lim
1
T →∞ 2T
|UT (ω)|2
q.e.d.
S(ω)dω → spektrale Intensität zwischen ω und ω + dω. Da U (−ω) = 0 , gilt
I=
∞
S(ω)dω.
0
→ Kohärenz einer Lichtquelle durch spektrale Intensität bestimmt.
Es gilt:
τc ∆ω = const.
mit spektraler Breite
2
∞
S(ω)dω
0
∆ω = ∞ 2
S (ω)dω
0
• spektrale Filter verbessern Kohärenz, aber Intensität geht verloren,
• Monochromasie ( ∆ω → 0) bedeutet vollst. zeitl. Kohärenz ( τc → ∞).
• wenn ∆ω << ω0 oder τc >> tsystem → Quasimonochromasie (wie kohärentes Licht)
188
8.2.1.4
d) gegenseitige Kohärenzfunktion (räumliche und zeitliche Kohärenz)
→ Kreuzkorrelation u(r1 , t1 ), u(r2 , t2 ) mit τ = t2 − t1
G (r1 , r2 , τ ) = u∗ (r1 , t), u(r2 , t + τ )
G (r1 , r2 , τ )
g (r1 , r2 , τ ) = ,
I(r1 )I(r2 )
0 ≤ |g (r1 , r2 , τ )| ≤ 1.
G - gegenseitige Kohärenzfunktion, g - komplexer Kohärenzgrad, g (r1 , r2 , τ ) - Maß für
Korrelation zwischen (r1 , t) und (r2 , t + τ ).
Beispiel: ebene, monochromatische Welle:
|g (r1 , r2 , τ )| = |exp [ik (r1 − r2 ) − ωτ ]| = 1.
speziell:
a) zeitliche Kohärenz: r1 = r2 = r
b) räumliche Kohärenz: τ = 0.
8.2.1.5
e) gegenseitige Intensität - räumliche Kohärenz
→τ =0
G (r1 , r2 , 0) = u∗ (r1 , t), u(r2 , t) = G (r1 , r2 )
G (r1 , r2 ) → gegenseitige Intensität
G (r1 , r2 )
g (r1 , r2 ) = I(r1 )I(r2 )
g (r1 , r2 ) → normierte gegenseitige Intensität
Bemerkung:
Wenn Wegdifferenz im optischen System <lc
G (r1 , r2 , τ ) = G (r1 , r2 ) exp (−iω0 τ )
= G (r1 , r2 ) G(τ ),
Separartion von zeitlicher und räumlicher Kohärenz, dabei vollst. zeitl. Kohärenz →quasimonochr.
Licht.
Kohärenzgebiet:
189
Wenn Apertur <Kohärenzgebiet |g| = 1 → Kohärenz
Wenn Auflösungsgrenze >Kohärenzgebiet |g| = 0 → Inkohärenz
z.B.: Wärmestrahler → Kohärenzgebiet ∼ λ2 , d.h. inkohärent.
8.3
Interferenz mit partiell kohärentem Licht
8.3.1
Interferenz zweier partiell kohärenter Wellen
Es seien u1 (r,t) und u2 (r,t) zwei Zufallsfunktionen mit den Intensitäten an einem Ort r
zur gleichen Zeit t
I2 = |u2 (r,t)|2
I1 = |u1 (r,t)|2 ,
und der Kreuzkorrelation
G12 = u∗1 u2 bzw. der normierten Größe
g12
u∗1 u2 = √
I1 I2
(man beachte den Unterschied zu den Größen g und G ohne Index, bisher kein Bezug zu
diesen Größen).
Überlagerung ergibt:
I(r) = |u1 + u2 |2 = |u1 |2 + |u2 |2 + u∗1 u2 + u1 u∗2 = I1 + I2 + G12 + G∗12 = I1 + I2 + 2 (G12 )
= I1 + I2 + 2 I1 I2 (g12 )
= I1 + I2 + 2 I1 I2 |g12 | cos ϕ,
ϕ = arg (g12 ) .
1. |g12 | = 1 → Interferenzformel für kohärentes Licht
2. |g12 | = 0 → I = I1 + I2 → inkohärentes Licht
3. i.a. 0 ≤ |g12 | < 1 → Interferenzmuster mit Sichtbarkeit
√
Imax − Imin
I1 I2
v=
=2
|g12 |
Imax + Imin
I1 + I2
und für I1 = I2
v = |g12 | .
Das Ziel besteht nun darin, g12 mit g (τ ) oder g (r1 r2 , τ ) in Zusammenhang zu
bringen, um eine Meßvorschrift für die normierten Kohärenzfunktionen zu besitzen.
190
8.3.2
Interferenz und zeitliche Kohärenz
Wir betrachten das Signal am gleichen Ort zu zwei verschiedenen Zeiten.
u1 = u(t) → I0 = |u(t)|2
u2 = u(t + τ ) → I0 = |u(t + τ )|2
→
zeitversetzte Welle
Damit gilt:
g12 =
u∗1 u2 u∗ (t)u(t + τ )
=
= g (τ ) .
I0
I0
Das Interferenzmuster ergibt sich zu
I (r) = I1 + I2 + 2 I1 I2 (g12 )
I(τ ) = 2I0 {1 + [g (τ )]} = 2I0 [1 + |g (τ )| cos ϕ (τ )]
|g (τ )| bestimmt die Sichtbarkeit v = |g (τ )| und cos ϕ (τ ) die Lage der Interferenzstreifen,
d.h. v = 1 für τ = 0 und v = 0 für τ > τc .
Realisierung → Michelson- oder Mach-Zehnder-Interferometer:
τ=
2(d2 − d1 )
c
Quasimonochromasie (ω0 >> ∆ω)
u(t) = a(t) exp (−iω0 t)
g (τ ) = ga (τ ) exp (−iω0 τ ) = |ga (τ )| exp [−i (ω0 τ − ϕa )]
a∗ (t)a(t + τ )
ga (τ ) =
|a(t)|2
I(τ ) = 2I0
1 + |ga (τ )| cos
Kontrast
8.3.2.1
ω0 τ
Periode
− ϕa (τ )
Fourier-Transformations-Spektroskopie:
Da S(ω) reell ist, gilt
191
Lage
.
G (τ ) = g (τ ) I0 =
∞
S(ω) exp (−iωτ ) dω
0
I(τ ) = 2I0 + 2I0 g (τ )
∞
= 2I0 + 2
S(ω) exp (−iωτ ) dω
0
∞
∞
=2
S(ω)dω + 2
S(ω) cos (ωτ ) dω
0
0 ∞
=2
S(ω) [1 + cos (ωτ )] dω.
0
I(τ ) messen → FT−1 [I(τ )] = S(ω) G (τ )
Interpretation: kontinuierliche Überlagerung von Interferogrammen mit Sichtbarkeit
v = 1.
8.3.3
Interferenz und räumliche Kohärenz
Young–Interferometer → Beugung am Schirm,
u1 = u1 (r,t) - Licht von Loch ’1’, u2 = u2 (r,t) - Licht von Loch ’2’
Messung von I(r,t)
r1 = (−a, 0, 0) ,
r2 = (a, 0, 0) ,
r = (x, 0, d) ,
Θ≈
2a
.
d
In Fresnelnäherung gilt:
1. Loch
|r − r1 |
d + (x + a)2 / (2d)
u1 (r,t) = u r1 ,t −
≈ u r1 ,t −
,
c
c
2.Loch
|r − r2 |
u2 (r,t) = u r2 ,t −
c
d + (x − a)2 / (2d)
≈ u r2 ,t −
c
Weiterhin
I1 ≈ I2 ≈ I0 .
Von vorn haben wir:
I = 2I0 (1 + |g12 | cos ϕ)
192
.
mit
u∗1 u2 u∗ (r1 , t̄)u(r2 , t̄ + τ )
=
= g (r1 , r2 , τ )
I0
I0
erhält man den gegenseitigen komplexen Kohärenzgrad. Dabei ist
g12 =
d + (x + a)2 /2d
,
c
(x + a)2 (x − a)2
2ax
x
τ=
−
=
=Θ .
2dc
2dc
dc
c
t̄ =
und dieser Kohärenzgrad über die Intensität zu messen:
I(x) = 2I0 {1 + g [r1 , r2 , τ (x)] cos ϕ(x)} .
Setzt man zeitliche Kohärenz voraus (τ < τc ), kann man separieren
g (r1 , r2 , τ ) = g (r1 , r2 ) exp (−iω0 τ )
und erhält die normierte gegenseitige Intensität (räumlicher Kohärenzgrad)
x
I(x) = 2I0 1 + |g (r1 , r2 )| cos ω0 Θ + ϕ (r1 , r2 ) .
c
Periode: xp = λ/Θ, Sichtbarkeit v = |g (r1 , r2 )| , Lage ϕ (r1 , r2 )
Messung der räumlichen Kohärenz mit Young-Interferometer und quasimonochromatischem Licht.
8.3.4
Räumliche Kohärenz und Ausbreitung
Annahme: zeitlich kohärentes Licht (τ < τc ),
G (r1 , r2 , τ ) = G (r1 , r2 ) exp (−iω0 t)
Frage: Wie ändert sich räumliche Kohärenz bei Ausbreitung durch beliebiges, lineares
System?
ui (r ) −→
h(r, r )
−→ue (r)
∞
h(r, r )ui (r )dr
ue (r) =
−∞
Kohärenzfunktion am Ausgang
∞
Ge (r1 , r2 ) =
h∗ (r1 , r1 )h(r2 , r2 )Gi (r1 , r2 ) dr1 dr2 .
−∞
193
• Intensität:
1. partielle Kohärenz am Eingang
∞
Ie (r) =
h∗ (r, r1 )h(r, r2 )Gi (r1 , r2 ) dr1 dr2
−∞
um Intensität zu berechnen, braucht man die Kohärenzfunktion am Eingang.
2. Inkohärenz am Eingang → Gi (r1 , r2 ) ∼ σIi (r1 )δ(r1 − r2 )
∞
h∗ (r, r1 )h(r, r1 )Ii (r1 ) dr1
Ie (r) = σ
−∞
Übertragungsfunktion für inkohärentes Licht
hINT (r, r ) = σ |h(r, r )|
2
• Kohärenzfunktion bei inkohärenter Beleuchtung
Gi (r1 , r2 ) ∼ σIi (r1 )δ(r1 − r2 )
∞
Ge (r1 , r2 ) = σ
h∗ (r1 , r1 )h(r2 , r1 )Ii (r1 )dr1 .
−∞
inkohärentes Licht wird bei der Ausbreitung partiell kohärent.
Physik: Licht, das von einem Punkt kommt, und dami kohärent ist, wird in entferntere Bereiche gebeugt Korrelation ist endlich → van–Cittert-ZernikeTheorem
Ähnlichkeit zu verrauschtem Zeitsignal → Filter →Kohärenzzeit wird größer →
Raum wirkt als Tiefpaßfilter
Beispiel: d sehr groß → Fraunhoferbeugung
ri r1
h(ri , r1 ) ∼ exp −ik
d
∞
kr
1
|Ge (r1 , r2 )| ∼ σ exp −i
(r2 − r1 ) Ii (r1 )dr1 ,
d
−∞
k
I˜i − FT(II ).
|Ge (r1 , r2 )| ∼ σ I˜i
(r2 − r1 ) ,
d
˜ k
Ii d (r2 − r1 ) |ge (r1 , r2 )| =
˜ Ii (0)
• Ii ∼ δ(r1 )
|ge (r1 , r2 )| = 1 Punktquelle liefert vollständig kohärentes Licht
194
• Lichtquelle groß (Radius a) Kohärenzgebiet sehr klein
I(r1 ) = I0
für |r1 | ≤ a,
2 J1 kd aρ
|ge (r1 , r2 )| =
,
k
aρ
d
ρ = |r2 − r1 | ,
|ge (r1 , r2 )| =
Θs =
2a
,
d
k
2π
π
a=
a = Θs
d
λd
λ
2 J1 (πρΘs /λ)
πρΘs /λ
2 J1 (x)
=0
x
für
ρc = 1.22
x = 3.832
λ
Θs
Kohärenzradius ρc
Beispiel: λ = 0.6 µm, a = 1 cm, d = 100 m ρc = 3.7 mm
• Anwendung: Michelson-Stern-Interferometer
Schirm
r
Stern inkohärent, Kohärenz → 0, wenn ρc = 1.22λ/Θs = 1.22λd/ (2a) 2a =
1.22λd/ρc
ρc über verschwindene Sichtbarkeit im Interferogramm bestimmen Sterndurchmesser 2a.
195
Herunterladen