1. Einleitung 1.1 Elektronisch bedingte Eigenschaften 1.1.1 Allgemeine Bemerkungen 1.2 Elektronische Eigenschaften und Werkstoffgruppen 1.2.1 Übersicht 1.2.2 Wärmeleitfähigkeit 1.2.3 Magnetismus 1.2.4 Dielektrische Eigenschaften MaWi 2 Skript - Page 1 1. Einleitung 1.1 Elektronisch bedingte Eigenschaften 1.1.1 Allgemeine Bemerkungen Vorwort Jedes Textbuch beginnt mit einem Vorwort, das aber im allgemeinen nicht von der Zielgruppe - den Studierenden gelesen wird, sondern von den Kollegen. Die kennen den Stoff nämlich schon, und interessieren sich eher für folgende Punkte: Warum schreibt jemand überhaupt ein neues Textbuch; es gibt ja schon hinreichend viele? Was macht der liebe Kollege anders als die anderen, und mit welcher Begründung? Um hier niemanden zu enttäuschen: Wer gerne Vorwörter liest, findet eines im Link. Elektronen in Kristallen Die meisten Materialeigenschaften werden durch das Verhalten der Elektronen bestimmt. Dabei sind insbesondere die äußeren Elektronen der Atome des Festkörpers von Bedeutung; sie bewirken die Bindung. Bindungskräfte bestimmen den Gleichgewichtsabstand zwischen den Atomen des Festkörpers und damit, zusammen mit dem Atomgewicht, deren Dichte. Wie wir in Matwiss I gelernt haben, werden mechanische Eigenschaften von Materialien im wesentlichen durch die Bindungskräfte zwischen den Atomen festgelegt. Mechanisch kann ein Festkörper vereinfacht als System aus Kugeln und Federn verstanden werden. Äußere Kräfte müssen diese "Federkräfte" überwinden, wenn eine Verformung des Festkörpers erreicht werden soll. Mechanische Konstanten, wie der E-Modul und der Kompressionsmodul, lassen sich daher aus den Bindungskräften ableiten. Bei Metallen sind die bindenden Elektronen auf den gesamten Festkörper verteilt, und diese sogenannten freien Elektronen verursachen die elektrische Leitfähigkeit. Innere Elektronen führen hingegen zur Abstoßung zwischen den Atomen. Bei der vollständigen Beschreibung des Verhaltens von Elektronen in Festkörpern müssen quantenmechanische Zusammenhänge berücksichtigt werden - klassische Betrachtungen führen unweigerlich ins Abseits. Insbesondere kann nach dem Pauli-Prinzip jedes Energieniveau des Festkörpers nur durch maximal zwei Elektronen besetzt werden, die dann verschiedenen Spin haben müssen.. Daher besitzen viele Elektronen des Festkörpers auch bei sehr niedrigen Temperaturen hohe Energien. Während man naiv erwarten würde, daß sich die freien Elektronen am absoluten Nullpunkt in Ruhe befinden, führt das PauliPrinzip zu dem überraschenden Ergebnis, daß die überwiegende Anzahl der Elektronen auch dann noch Geschwindigkeiten bis zu 106 m/s besitzen! Überblick Eine detaillierte Inhaltsangabe findet sich im Link Zunächst werden in Kapitel 1 in Form eines Überblicks die wichtigsten elektronischen Eigenschaften beschrieben. In Kapitel 2 wird das Modell des freien Elektronengases behandelt und angewandt, ein stark vereinfachtes Modell, welches es aber bereits erlaubt, wichtige Begriffe der Vorlesung einzuführen. Kapitel 3 scheint das Thema zu verlassen und beschäftigt sich mit den Grundlagen und der Bestimmung der Struktur von Kristallen. Dabei werden auch einige praktische Methoden behandelt. In Kapitel 4 wird die Begründung für das Vorhandensein von Elektronenbändern geliefert. Dabei sind die Ergebnisse des Kapitels 3 Voraussetzung für das qualitative Verständnis des darauffolgenden Kapitel 5 widmet sich unserer Materialzielgruppe, den Halbleitern. Hier werden die Grundlagen für das Verständnis von Halbleitern gelernt Kapitel 6 behandelt die fundamental Kontakte, insbesondere den pn-Übergang, aus denen dann Halbleiterbauelemente werden. MaWi 2 Skript - Page 2 1.2 Elektronische Eigenschaften und Werkstoffgruppen 1.2.1 Übersicht Elektronische Eigenschaften sind oft so auffällig, daß ganze Werkstoffgruppen dadurch definiert sind. Besonders wichtig sind: Leiter = Metalle Sie besitzen frei bewegliche Elektronen. Daher haben sie eine hohe elektrische und thermische Leitfähigkeit . Beispiele: Alle Metalle und einige wenige Nichtmetalle (z.B Graphit). Die Leitfähigkeit sinkt etwas mit steigender Temperatur. Isolatoren Die Elektronen sind lokalisiert, daher haben sie nur eine geringe elektrische Leitfähigkeit und meist (aber nicht immer) auch eine kleine thermische Leitfähigkeit. Sie sind oft durchsichtig, da die Lichtenergie von den fest gebundenen Elektronen nicht absorbiert werden kann. Beispiele: Gläser, Keramik, die meisten Polymere. Halbleiter Sie besitzen wenig freie Ladungsträger (Elektronen und sog. "Löcher " oder "Defektelektronen") und sind bei tiefen Temperaturen nichtleitend. Die Leitfähigkeit steigt mit der Temperatur stark an. Sie kann durch Kristalldefekte stark beeinflußt werden. Durch Einstrahlung von Licht können freie Ladungsträger erzeugt werden (Solarzelle). Beispiele: Silizium (Si), Galliumarsenid (GaAs). (Feste) Ionenleiter Die verfügbaren Ladungsträger sind positive oder negative Ionen. Der Leitungsmechanismus erfolgt über Platzwechsel der Ionen entlang Gitterdefekten und Leerstellen. Die Leitfähigkeit nimmt mit bei festen Ionenleitern mit der Temperatur stark zu. Beispiel: Metalloxide, ZrO2 in der λ-Sonde; (und alle flüssigen Elektrolyte). Leitende und halbleitende Polymere Polymere sind überwiegend Isolatoren. In neuerer Zeit hat man aber auch elektrisch leitende und halbleitende Polymere gefunden mit Leitfähigkeiten bis zu 5 · 104 Ω–1 m–1 entlang den Polymerketten. Magnetische Materialien. Sie besitzen eine nach außen wirksame Magnetisierung (Ferromagnete) oder ein magnetisches Moment der Einzelatome. Viele Metalle sind paramagnetisch, einige wenige ferromagnetisch. Die magnetische Eigenschaft als solche hängt nicht unmittelbar von der Struktur des Materials ab; ist aber immer durch die Elektronen bedingt. Dielektrische Materialien (Dielektrika) Immer Isolatoren, interessant sind Dielektrizitätskonstanten εr und die Durchbruchsfeldstärke im Sinne des 1. Hauptsatzes der Materialwissenschaft. In der folgenden Tabelle sind einige Effekte zusammengefaßt. Unter "Feld" sind die treibenden Kräfte eingetragen, die zu "Flüssen" führen Physikalischer Effekt Feld Fluß und Mechanismus Anwendung Elektrische Leitung elektrisch Bewegung von Elektronen Elektrotechnik, Kabel, Schalter etc. Supraleitung elektrisch Bewegung von gekoppelten Elektronenpaaren Kabel, Magnete Ionenleitung elektrisch Bewegung von Ionen Sensoren Photoeffekt elektromagnetisch Quantensprünge von Elektronen zwischen diskreten Energieniveaus, Bandschema Detektoren Magnetismus magnetisch Magnetischer Fluß oder Induktion; Ausrichtung magnetischer Momente, Spins Trafo, Datenspeicherung Wärmeleitung "thermisch" Energieausgleich, Beweglichkeit von Elektronen in Metallen Maschinenbau, Turbinen, Kühlung MaWi 2 Skript - Page 3 Vorbemerkung: Aus historischen Gründen und der lieben Vollständigkeit halber werden im Kapitel 1 einige elektronische Eigenschaften gestreift, die im Hauptteil nicht mehr behandelt werden. 1.2.2 Wärmeleitfähigkeit Die Wärmeleitfähigkeit von Metallen ist wie die elektrische Leitfähigkeit zwar auch elektronisch bedingt, aber: Bei allen Festkörpern (Metalle inklusive) wird Wärme auch durch Gitterschwingungen (die wir Phononen nennen) transportiert. Deshalb haben auch Materialien ohne freie und bewegliche Elektronen noch eine endliche, manchmal sogar sehr gute Wärmeleitfähigkeit - die beste überhaupt hat z.B. Diamant. Die wesentlich Größe ist der Wärmestrom(vektor) jw , der analog zum elektrischenStrom definiert werden kann, Was dabei fließt ist reine Energie - als kinetische Energie von Elektronen oder Schwingungsenergie von Atomen. Wir definieren Wärmemenge Wärmestromdichte jW = Fläche · Zeit mit [ jw ] = J / (m2 · s) = W / m 2 Für einen Wärmestrom benötigt man als treibende "Kraft" (mit dem Ausdruck "Kraft" hier in symbolischer Bedeutung) einen Temperaturgradienten, der im eindimensionalen Fall als dT/dx geschrieben werden kann. Der Wärmestrom, d.h. die transportierte Wärmemenge ist dann proportional zum Temperaturgradienten. dT jW = – λ · dx Der Proportionalitätskoeffizient λ ([λ ] = W / m · K) ist die Wärmeleitfähigkeit des Materials. Die obige Gleichung ist genausowenig ein Naturgesetz wie das Ohmsche "Gesetz", sondern beschreibt eine oft gemachte experimentelle Beobachtung. Ziel der Festkörperphysik oder Materialwissenschaft ist es, diese Beziehung herzuleiten, ihre Grenzen aufzuzeigen, und Werte für λ zu errechnen. Die transportierte Wärmemenge nimmt bei gleichem Temperaturgefälle mit der Wärmeleitfähigkeit λ zu. Hier einige Zahlenwerte mit typischen Wärmeleitfähigkeiten verschiedener Materialien. Diamant hat dabei die höchste Wärmeleitfähigkeit aller bekannten Materialien. Ein echter Diamant fühlt sich deshalb wie Metalle immer kalt an, im Gegensatz zu Glas, da er die Körperwärme sehr schnell nach "außen" transportiert. Werkstoff λ [W/m K] Diamant 2302 Silber 414 Eisen 72 Quarz 1.4 Styropor 0.035 Hier noch ein schnelles Beispiel zum Umgang mit der Wärmeleitfähigkeit (zum selbst nachrechnen): Gegeben ist eine Metallplatte mit den in der Figur gegebenen Dimensionen. Wie schnell wird's am kalten Ende wärmer? MaWi 2 Skript - Page 4 Näherungsweise dauert eine Temperaturerwärmung (zum Abbau des T-Gradienten) am kalten Ende um 1 K bei einer Eisenplatte 5.1 ms, bei einer Silberplatte jedoch nur 0.6 ms, da die Wärmeleitfähigkeit des Eisens 72 W/(m K) und die des Silber 414 W/ (m K) beträgt (Hinweis: Die Temperaturerhöhung ergibt sich aus der zugeführten Wärmemenge dividiert durch die spezifische Wärme des Materials und dessen Masse). 1.2.3 Magnetismus Magnetische Eigenschaften von Werkstoffen werden wesentlich durch den Spin der Elektronen bestimmt. Wir werden sie nicht in dieser Vorlesung behandeln, sondern im 5. Semester in "Electronic Materials" Was man aber schon jetzt wissens sollte ist: Allgemein entsteht durch die Kreisbewegung von elektrischen Ladungen ein magnetisches Moment μ, definiert durch die folgende Gleichung mit der erklärenden Figur: μ := I · A I: elektrischer Strom A: umkreiste Fläche Die Einheit des magnetischen Momentes ist also: [μ] = A m2. Auch durch den Spin, der anschaulich (aber nicht ganz korrekt) als die Eigenrotation des Elektrons aufgefaßt werden kann, wird ein magnetisches Moment hervorgerufen, welches als Elementarmagnet wirkt. Unter der Magnetisierung M ([M ] = A / m) versteht man das magnetische Moment pro Volumeneinheit eines Materials. Die Magnetisierung ist eine weitere elektronische Eigenschaft von Materialien. magnetisches Moment Magnetisierung M = Volumen Die Magnetisierung beschreibt also den magnetischen Zustand eines Materials. Es kann dabei auch ohne eine äußere Einwirkung eine Magnetisierung vorliegen (Wir haben dann einen Permanentmagnet). Andererseits kann durch die Einwirkung eines äußeren magnetischen Feldes H0 die Magnetisierung im Inneren eines Körpers verändert werden. Zwischen der Magnetisierung und einem äußeren Magnetfeld besteht oft ein linearer Zusammenhang. M = χ · H0 Durch das äußere, magnetisches Feld H0 kommt es zu einer Veränderung der Richtungen der magnetischen Momente des Festkörpers. Das magnetische Feld im Inneren des Festkörpers Hi ist dann MaWi 2 Skript - Page 5 Hi = H0 + M Die durch diese Gleichung (mit derselben Wertigkeit wie das Ohmsche "Gesetz") eingeführte Materialkonstante χ, die magnetische Suszeptibilität, ist ein Maß dafür, wie stark die magnetischen Momente eines Festkörpers (bzw. Flüssigkeit, Gas) auf ein äußeres magnetisches Feld reagieren. Alle festen Körper lassen sich an Hand der magnetischen Suszeptibilität in drei Klassen einteilen: χ<0: Diamagnetische Materialien. Das äußere, magnetische Feld wird im Innern abgeschwächt. Die Atome dieser Festkörper haben abgeschlossene Elektronenschalen und kein nach außen wirkendes magnetisches Moment. Durch das äußere magnetische Feld wird auf Grund der Lenzschen Regel ein Magnetfeld induziert, was dem äußeren entgegenwirkt und dieses somit abschwächt. Beispiel: Edelgase χ>0: Paramagnetische Materialien. Das äußere magnetische Feld wird im Innern des Festkörpers verstärkt. Die Atome des Festkörpers besitzen ungepaarte Elektronen und ein permanentes magnetisches Moment. Durch das äußere, magnetische Feld kommt es zur Ausrichtung der magnetischen Momente des Festkörpers und damit zu einer Verstärkung des magnetischen Feldes im Innern. Beispiel: Al, Sauerstoff χ >> 0 : Ferromagnetische Materialien. Es kommt ebenfalls zu einer Verstärkung des äußeren, magnetischen Feldes, die aber erheblich stärker ist als im paramagnetischen Fall. Auf Grund einer spontanen Magnetisierung liegen in einem ferromagnetischen Festkörper bereits größere Bereiche mit parallel ausgerichteten magnetischen Momenten vor (Weiß'sche Bezirke), die durch ein äußeres, magnetisches Feld ausgerichtet werden können. Beispiel: Fe, Co, Ni. Ein typischer Wert der Suszeptibilität eines diamagnetischen Materials ist – 1.4 · 10–6 für Bismut; für ein paramagnetisches Material wie Sauerstoff (gasförmig) ergibt sich 0.14 · 10–6. 1.2.4 Dielektrische Eigenschaften Die Einwirkung eines zeitlich konstanten, elektrischen Feldes auf einen Festkörper mit lokalisierten Elektronen (Isolator) führt zur Erzeugung von elektrischen Dipolen im Innern. Das ist in der Figur schematisch dargestellt. Auch dielektrische Eigenschaften werden nicht in dieser Vorlesung behandeln, sondern im 5. Semester in "Electronic Materials" Das elektrische Dipolmoment ist definiert als p=Q·l Mit Q = elektrische Ladung, l = Abstand der positiven und negativen Ladung. Die Einheit des Dipolmomentes ist [p] = A · s · m Analog zur Magnetisierung definiert man eine größenunabhängige Polarisation P MaWi 2 Skript - Page 6 elektrisches Dipolmoment P= Volumeneinheit mit der Einheit [P] = As/m2. Die Polarisation des Materials ist - wie wir jetzt schon vermuten - in der Regel proportional zum elektrischen Feld E P = ε 0 · (εr – 1) · E Dabei ist ε0 = Dielektrizitätskonstante des Vakuum (ε 0 = 8.8542 · 10 –12 As/Vm), und εr = relative Dielektrizitätskonstante Einer hohen Dielektrizitätskonstanten entspricht also eine hohe Polarisierbarkeit des Mediums. Die Anwendung auf einen Kondensator ist klar: Die Kapazität eines Kondensator gibt seine Fähigkeit an, Ladungen zu speichern. Die Kapazität eines Plattenkondensators mit Dielektrikum bestimmt man nach der Formel F C = εr · ε0 · d Mit F = Fläche der Kondensatorplatte; d = Abstand der Kondensatorplatten Ein großes εr entspricht also einer großen Kapazität, die auf eine große Polarisierbarkeit des Dielektrikums im Kondensator schließen läßt. Hier einige Werte Werkstoff εr Luft 1 Glas 2 ... 16 Glimmer 4 ... 8 Wasser 80.3 Bleitellurid 400 MaWi 2 Skript - Page 7 2. Elektronen in Festkörpern 2.1 Klassische Betrachtung 2.1.1 Ohms Law and Materials Properties 2.1.2 Ohms Law and Classical Physics 2.1.3 The Hall Effect 2.1.4 Zusammenfassung Kapitel 2.1 2.1.5 Merkpunkte Kapitel 2.1 2.2 Quantenmechanische Betrachtung 2.2.1 Einleitung 2.2.2 Das Modell des freien Elektronengas 2.2.3 Zustandsdichte des freien Elektronengases 2.2.4 Zusammenfassung Kapitel 2.2 2.2.5 Merkpunkte Kapitel 2.2 2.3. Besetzungswahrscheinlichkeit und Fermi-Statistik 2.3.1 Fragestellung und Weg zur Antwort 2.3.2 Besetzungswahrscheinlichkeit und Fermi-Dirac Statistik 2.3.3 Eigenschaften Fermi-Dirac Statistik und erste Anwendungen 2.3.4 Zusammenfassung Kapitel 2.3 2.3.5 Merkpunkte Kapitel 2.3 2.4 Erste Anwendungen der Fermiverteilung 2.4.1 Wärmekapazität des freien Elektronengases 2.4.2 Elektrische Leitfähigkeit des freien Elektronengases 2.4.3 Zusammenfassung Kapitel 2.4 2.4.4 Merkpunkte Kapitel 2.4 2.5. Eigenschaften von Wellen und Teilchen 2.5.1 Mathematische Beschreibung 2.5.2 Verschiedene Wellensorten Merkpunkte Kapitel 2: Elektronen in Festkörpern MaWi 2 Skript - Page 8 Dieser Modul ersetzt den alten Deutschen Modul "Elektrische Leitfähigkeit", der unter "Illustrations" aber immer noch verfügbar ist. Es bestehen aber wesentliche Unterschiede zwischen dem neuen und dem alten Modul! Ein neuer Modul in deutscher Sprache der in etwa die Inhalte wiedergibt ist in einem anderen Hyperskript verfügbar Wer in Deutsch oder Englisch Problem hat sollte noch die beiden deutschen Module "Temperatur, Gleichverteilungssatz etc. - die Grundlagen" und "Beweglichkeit und Diffusion" zu Rate ziehen oder gleich die Essenz der Thermodynamik in einem anderen Hyperskript nacharbeiten 2. Elektronen in Festkörpern 2.1 Klassische Betrachtung 2.1.1 Ohms Law and Materials Properties In this subchapter we will give an outline of how to progress from the simple version of Ohms "Law", which is a kind of "electrical" definition for a black box, to a formulation of the same law from a materials point of view employing (almost) first principles. In other words: The electrical engineering point of view is: If a "black box" exhibits a linear relation between the (dc) current I flowing through it and the voltage U applied to it, it is an ohmic resistor. That is illustrated in the picture: As long as the voltage-current characteristic you measure between two terminals of the black box is linear, the black box is called an (ohmic) resistor. Neither the slope of the I-U-characteristics matters, nor what's in the box or what materials are involved. The Materials Science point of view is quite different, it is essentially the reverse of the electrical engineering point of view. Taken to the extreme, the Materials Science point of view is simply: Tell me what kind of material is in the black box, and I tell you: 1. If it really is an ohmic resistor, i.e. if the current relates linearly to the voltage for reasonable voltages and both polarities. 2. What its (specific) resistance will be, including its temperature dependence. 3. And everything else of interest. In what follows we will see, what we have to do for this approach. We will proceed in 3 steps. In step one and two, contained in this sub-chapter we simply reformulate Ohms law in physical quantities that are related to material properties. In other words, we look at the properties of the moving charges that produce an electrical current. But we only define the necessary quantities; we do not calculate their numerical values from basic principles. We will, however, calculate some numbers, based on experimental input. In the third step - which is the content of many chapters - we will find ways to actually calculate (some of) the important quantities, in particular for semiconductors. As it will turn out, this is not just difficult with classical physics, but simply impossible. We will need a good dose of quantum mechanics and statistical thermodynamics to get results. MaWi 2 Skript - Page 9 1. Step: Move to specific quantities First we switch from current I and voltage U to the current density j and the field strength E, which are not only independent of the (uninteresting) size and shape of the body, but, since they are vectors, carry far more information about the system of interest. This is easily seen in the schematic drawing below. Current density j and field strength E may depend on the coordinates, because U (taken as the local potential) and I depend on the coordinates, e.g. in the way schematically shown in the picture to the left. However, for a homogeneous material with constant cross section, we may write I j = F with F = cross sectional area of the reference plane considered. The direction of the vector j is parallel to the normal vector f of the reference area considered; it also may differ locally. So in full splendor we must write I(x,y,z) j(x,y,z) = ·f F The "global" field strength is U E = l With l = length of the body. If we want the local field strength E(x,y,z) as a vector, we have, in principle, to solve the Poisson equation ρ(x,y,z) ∇ · E(x,y,z) = εε0 With ρ(x,y,z) = charge density. For a homogeneous material with constant cross section, however, E is parallel to f and constant everywhere, again something that is clear without calculation. In order to make things easy, we realize that for a homogenous material of length l with constant cross-sectional area F, the field strength E and the current density j do not depend on position - they have the same numerical value everywhere. For this case we can now write down Ohms law with the new quantities and obtain MaWi 2 Skript - Page 10 1 1 j·F = I = ·U = R ·E·l R l j = ·E F·R The fraction l/ F · R obviously (think about it!) has the same numerical value for any homogeneous cube (or homogeneous whatever) of a given material; it is, of course, the specific conductivity σ 1 σ = l = ρ F·R In the equation above we have also defined the specific resistivity ρ with the unit [ρ] = Ωm, or - more frequently used - Ωcm. The specific resistivity obtained in this way is necessarily identical to what you would define as specific resistivity by looking at some rectangular body with cross-sectional area F and length l. You would assume that R is proprotional to l, and inversely proportional to F, and the proportionality constant you would call "specific resistivity". A 1 cm3 cube of homogeneous material having the specific resistivity ρ has the resistance R = ρ, if ρ is given in Ωcm. Of course, we will never mix up the specific resistivity ρ with the charge density ρ or general densities ρ, because we know from the context what is meant! The specific conductivity has the dimension [σ] = Ω–1cm–1 and is the quantity one uses if looking at conduction mechanisms etc. The specific resistivity is more prominent in technological terms and for charcaterizing materials and you should at least have a feeling for some representative numbers by remembering: ρ (metal) ≈ 2 µΩcm ρ (semicoductor) ≈ 1 Ωcm ρ (insulator) ≈ 1 GΩcm Restricting ourselves to isotropic and homogenoeus materials, restricts σ and ρ to being scalars with the same numerical value everywhere, and Ohms law now can be formulated for any material with weird shapes and being quite inhomogeneous; we "simply" have j = σ ·E Ohms law in this vector form is now valid at any point of a body, since we do not have to make assumptions about the shape of the body. To appreciate this, take an arbitrarily shaped body with current flowing through it, cut out a little cube (with your "mathematical" knife) at the coordinates (x,y,z) without changing the flow of current, and you must find that the local current density and the local field strength obey the equation given above locally. j(x,y,z) = σ · E(x,y,z) Of course, obtaining the external current I flowing for the external voltage U now needs summing up the contributions of all the little cubes, i.e. integration over the whole volume, which may not be an easy thing to do. Still, we have now a much more powerful version of Ohms law! But we should now harbor a certain suspicion: There is no good reason why j must always be parallel to E. This means that for the most general case σ is not a scalar quantity, but a tensor; σ = σij. (There is no good way to write tensors in html; we use the ij index to indicate tensor properties. Ohms law then writes MaWi 2 Skript - Page 11 jx = σxx · Ex + σxy · Ey + σxz · Ez jy = σyx · Ex + σyy · Ey + σyz · Ez jz = σzx · Ex + σzy · Ey + σzz · Ez For anisotropic inhomogeneous materials you have to take the tensor, and its components will all depend on the coordinates - that is the most general version of Ohms law. Note that this is not so general as to be meaningless: We still have the basic property of Ohms law: The local current density is directly proprotional to the local field strength (and not, for example, to exp– [const. · E] ). Our goal now is to find a relation that allows to calculate σij for a given material (or material composite); i.e. we are looking for σij = σij(material, temperature, pressure, defects... ) 2. Step: Describe σij in Terms of the Carrier Properties Electrical current needs charged and mobile "things", or charge carriers that are mobile. Note that we do not automatically assume that the charged "things" are always electrons. Anything charged and mobile will do. What we want to do now is to express σij in terms of the properties of the carriers present in the material under investigation. To do this, we will express an electrical current as a "mechanical" stream or current of (charged) particles, and compare the result we get with Ohms law. If you have problems visualizing this, check this Basic module. First, lets define an electrical current in a wire in terms of the carriers flowing through that wire. There are three crucial points to consider: 1. The external electrical current as measured in an Ampèremeter is the result of the net current flow through any cross section of an (uniform) wire. In other words, the measured current is proportional to the difference of the number of carriers of the same charge sign moving from the left to right through a given cross sectional area minus the number of carriers moving from the right to the left. In short: the net current is the difference of two partial currents flowing in opposite directions: Do not take this point as something simple! We will encounter cases where we have to sum up 8 partial currents to arrive at the externally flowing current, so keep this in mind! 2. In summing up the individual current contributions, make sure the signs are correct. The rule is simple: The electrical current is (for historical reasons) defined as flowing from the + pole to the – pole. For a particle current this means: In words: A technical current I flowing from + to – may be obtained by negatively charged carriers flowing in the opposite direction (from – to +), by positively charged carriers flowing in the same direction, or from both kinds of carriers flowing at the same time in the proper directions. MaWi 2 Skript - Page 12 The particle currents of differently charged particles then must be added! Conversely, if negatively charged carriers flow in the same directions as positively charged carriers, the value of the partial current flowing in the "wrong" direction must be subtracted to obtain the external current. 3. The flow of particles through a reference surface as symbolized by one of arrows above, say the arrow in the +x direction, must be seen as an average over the x -component of the velocity of the individual particles in the wire. Instead of one arrow, we must consider as many arrows as there are particles and take their average. A more detailed picture of a wire at a given instant thus looks like this An instant later it looks entirely different in detail, but exactly the same on average! If we want to obtain the net flow of particles through the wire (which is obviously proportional to the net current flow), we could take the average of the velocity components <v+x >pointing in the +x direction (to the right) on the left hand side, and subtract from this the average <v–x>of the velocity components pointing in the –x direction (to the left) on the right hand side. We call this difference in velocities the drift velocity vD of the ensemble of carriers. If there is no driving force, e.g. an electrical field, the velocity vectors are randomly distributed and <v+x >= <v–x>; the drift velocity and thus net current is zero as it should be. Average properties of ensembles can be a bit tricky. Lets look at some properties by considering the analogy to a localized swarm of summer flies "circling" around like crazy, so that the ensemble looks like a small cloud of smoke. A more detailed treatment can be found in the advanced section. First we notice that while the individual fly moves around quite fast, its vector velocity vi averaged over time t, <vi>t, must be zero as long as the swarm as an ensemble doesn't move. In other words, the individual flies, on average, move just as often to the left as to the right, etc. The net current produced by all flies at any given instance or by one individual fly after sufficient time is obviously zero for any reference surface. In real life, however, the fly swarm "cloud" often moves slowly around - it has a finite drift velocity which must be just the difference between the average movement in drift direction minus the average movement in the opposite direction. The drift velocity thus can be identified as the proper average that gives the net current through a reference plane perpendicular to the direction of the drift velocity. This drift velocity is usually much smaller than the average magnitude of the velocity <v>of the individual flies. Its value is the difference of two large numbers - the average velocity of the individual flies in the drift direction minus the average velocity of the individual flies in the direction opposite to the drift direction. Since we are only interested in the drift velocity of the ensemble of flies (or in our case, carriers) we may now simplify our picture as follows: MaWi 2 Skript - Page 13 We now equate the current density with the particle flux density by the basic law of current flow: Current density j = Number N of particles carrying the charge q flowing through the cross sectional area F (with the normal vector f and |f| = 1) during the time interval t, or q·N j = ·f F·t If the charge q is negative (e.g. for electrons we have q = –e; e = elementary charge), the direction of the electrical current is opposite to the particle current, as it should be. In scalar notation, because the direction of the current flow is clear, we have q·N j = F·t The problem with this formula is N, the number of carriers flowing through the cross section F every second. A number N of carriers is not a basic property of the material; we certainly would much prefer the carrier density n = N/V of carriers. In going from numbers to densities, we have to chose the volume V = F · l in such a way that it contains just the right number N of carriers. Since the cross section F is given, this means that we have to pick the length l in such a way, that all carriers contained in that length of material will have moved across the internal interface after 1 second. This is easy! The trick is to give l just that particular length that allows every carrier in the defined portion of the wire to reach the reference plane, i.e. l = vD · t This makes sure that all carriers contained in this length, will have reached F after the time t has passed, and thus all carriers contained in the volume V = F · vD · t will contribute to the current density. We can now write the current equation as follows: q·N j = q·n·V = F·t q·n·F·l = F·t q · n · F · vD · t = F·t F·t This was shown in excessive detail because now we have the fundamental law of electrical conductivity (in obvious vector form) j = q · n · vD This is a very general equation relating a particle current (density) via its drift velocity to an electrical current (density) via the charge q carried by the particles. Note that it does not matter at all, why an ensemble of charged particles moves on average. You do not need an electrical field as driving force anymore. If, for example, a concentration gradient induces a particle flow via diffusion, you have an electrical current too, if the particles are charged. Note also that electrical current flow without an electrical field as primary driving force as outlined above is not some odd special case, but at the root of most electronic devices that are more sophisticated than a simple resistor. Of course, if you have different particles numbered i, with different densities, drift velocities, and charges, you simply sum up the individual contributions as pointed out above: j = Σi (qi · ni · vi) All we have to do now is to compare our equation from above to Ohms law in its general form from above: j = q · n · vD := σ · E We then obtain MaWi 2 Skript - Page 14 q · n · vD σ = := constant E If Ohms law holds, σ must be a constant, and this implies by necessity vD = constant E This is a simple but far reaching equation, saying something about the driving force of electrical currents (= electrical field strength E) and the drift velocity of the particles in the material. What this means is that if vD/E = const. holds for any (reasonable) field E, the material will show ohmic behavior. We have a first condition for ohmic behavior expressed in terms of material properties . If, however, vD/E is constant (in time) for a given field, but with a value that depends on E, we have σ = σ(E); the behavior will not be ohmic! The requirement vD/E = const. for any electrical field thus requires a drift velocity in field direction for the particle, which is directly proportional to E. This leads to a simple conclusion: This is actually a rather strange result! A charged particle in an electrical field experiences a constant force, and Newtons first law tells us that this will induce a constant accelerations, i.e. its velocity should increase all the time! Its velocity therefore would grow to infinity - if there wouldn't be some kind of friction. We thus conclude that there must exist some mechanism that acts like a frictional force on all accelerated particles, and that this frictional force in the case of ohmic behavior must be in a form where the average drift velocity obtained is proportional to the driving force. Since vD/E = constant must obtain for all (ohmic) materials under investigation, we may give it a name: vD = µ = Mobility =Material constant E The mobility µ of the carriers has the unit [µ] = (m/s)/(V/m) = m 2/V · s. The mobility µ (Deutsch: Beweglichkeit) then is a material constant; it is determined by the "friction", i.e. the processes that determine the average velocity for carriers in different materials subjected to the same force q · E. Friction, as we (should) know, is a rather unspecified term, but always describing energy transfer from some moving body to the environment. Thinking ahead a little bit, we might realize that µ is a basic material constant even in the absence of electrical fields. Since it is tied to the "friction" a moving carrier experiences in its environment - the material under consideration - it simply expresses how fast carriers give up surplus energy to the lattice; and it must not matter how they got the surplus energy. It is therefore no suprise that µ pops up in all kinds of relations, e.g. in the famous Einstein - Smoluchowski equation linking diffusion coefficients and mobility of particles. Thinking ahead a little bit more, we realize that the mobility of carriers is an extremely important material parameter because it describes "somehow" how quickly carriers can respond to an electrical field and therefore if they can follow rapidly changing electrical fields - e.g. in a micorpocessor running at 4 GHz. Very large amounts of money are spend right now (2006) to increase the carrier mobility in Si - see the link for a taste treat of what that means . We now can write down the most general form of Ohms law applicable to all materials meeting the two requirements: n = const. and µ = const. everywhere. It is expressed completely in particle (= material) properties. σ = q·n·µ The task is now to calculate n and µ from first priciples, i.e. from only knowing what atoms we are dealing with in what kind of structure (e.g. crystal + crystal defects) This is a rather formidable task since σ variies over a extremely wide range, cf. a short table with some relevant numbers. In order to get acquainted with the new entity "mobility", we do a little exercise: MaWi 2 Skript - Page 15 Exercise 2.1-1 Derive and dicuss numbers for µ and vD Since we like to give σ as a positive number, we always take only the magnitude of the charge q carried by a particle. However, if we keep the sign, e.g. write σ = – e · n · µe for electrons carrying the charge q = – e; e = elementary charge, we now have an indication if the particle current and the electrical current have the same direction (σ > 0) or opposite directions (σ < 0) as in the case of electrons. But it is entirely a matter of taste if you like to schlepp1) along the signs all the time, or if you like to fill 'em in at the end. Everything more detailed then this is no longer universal but specific for certain materials. The remaining task is to calculate n and µ for given materials (or groups of materials). This is not too difficult for simple materials like metals, where we know that there is one (or a few) free electrons per atom in the sample - so we know n to a sufficient approximation. Only µ needs to be determined. This is fairly easily done with classical physics; the results, however, are flawed beyond repair: They just do not match the observations and the unavoidable conclusion is that classical physics must not be applied when looking at the behavior of electrons in simple metal crystals or in any other structure - we will show this in the immediately following subchapter 2.1.3. We obviously need to resort to quantum theory and solve the Schrödinger equation for the problem. This, surprisingly, is also fairly easy in a simple approximation. The math is not too complicated; the really difficult part is to figure out what the (mathematical) solutions actually mean. This will occupy us for quite some time. Fragebogen / Questionaire Multiple Choice Fragen zu 2.1.1 1) Slang (jiddish): to carry along with difficulty MaWi 2 Skript - Page 16 Dieser Modul ersetzt den alten Deutschen Modul "Elektrische Leitfähigkeit", der unter "Illustrations" aber immer noch verfügbar ist. Es bestehen aber wesentliche Unterschiede zwischen dem neuen und dem alten Modul! Ein neuer Modul in deutscher Sprache, der in etwa die Inhalte wiedergibt, ist in einem anderen Hyperskript verfügbar. Wer in Deutsch oder Englisch Probleme hat, sollte noch die beiden deutschen Module "Temperatur, Gleichverteilungssatz etc. - die Grundlagen" und "Beweglichkeit und Diffusion" zu Rate ziehen oder gleich die Essenz der Thermodynamik in einem anderen Hyperskript nacharbeiten. 2.1.2 Ohms Law and Classical Physics In this subchapter we will look at the classical treatment of the movement of electrons inside a material in an electrical field. In the preceding subchapter we obtained the most basic formulation of Ohms law, linking the specific conductivity to two fundamental material parameters: σ = q·n·µ For a homogeneous and isotropic material (e.g. polycrystalline metals or single crystal of cubic semiconductors), the concentration of carriers n and their mobility µ have the same value everywhere in the material, and the specific conductivity σ is a scalar. This is boring, however. So let's look at useful complications: In general terms, we may have more than one kind of carrier (this is the common situation in semiconductors) and n and µ could be functions of the temperature T, the local field strength Eloc resulting from an applied external voltage, the detailed structure of the material (e.g. the defects in the lattice), and so on. We will see that these complications are the essence of advanced electronic materials (especially semiconductors), but in order to make life easy we first will restrict ourselves to the special class of ohmic materials. We have seen before that this requires n and µ to be independent of the local field strength. However, we still may have a temperature dependence of σ; even commercial ohmic resistors, after all, do show a more or less pronounced temperature dependence - their resistance increases roughly linearly with T. In short, we are treating metals, characterized by a constant density of one kind of carriers (= electrons) in the order of 1...3 electrons per atom in the metal. Basic Equations and the Nature of the "Frictional Force" We consider the electrons in the metal to be "free", i.e. they can move freely in any direction - the atoms of the lattice thus by definition do not impede their movement. The (local) electrical field Eloc then exerts a force F = – e · Eloc on any given electron and thus accelerates the electrons in the field direction (more precisely, opposite to the field direction because the field vector points from + to – whereas the electron moves from – to +). In the fly swarm analogy, the electrical field would correspond to a steady airflow - some wind - that moves the swarm about with constant drift velocity. Now, if a single electron with the (constant) mass m and momentum p is subjected to a force F, the equation of motion from basic mechanics is dp F = dv = m· dt dt Note that p does not have to be zero when the field is switched on. If this would be all, the velocity of a given electron would acquire an ever increasing component in field direction and eventually approach infinity. This is obviously not possible, so we have to bring in a mechanism that destroys an unlimited increase in v. In classical mechanics this is done by introducing a frictional force Ffr that is proportional to the velocity: MaWi 2 Skript - Page 17 Ffr = – kfr · v Here, kfr is some friction constant. But this, while mathematically sufficient, is devoid of any physical meaning with regard to the moving electrons. There is no "friction" on an atomic scale! Think about it! Where should a friction force come from? An electron feels only forces from two kinds of fields - electromagnetic and gravitational (neglecting strange stuff from particle physics). It thus makes no sense to complement the differential equation above with a friction term - we have to look for a better approach. All that friction does to big classical bodies is to dissipate ordered kinetic energy of the moving body to the environment. Any ordered movement gets slowed down to zero surplus speed, and the environment gets somewhat hotter instead, i.e. unordered movement has increased. This is called energy dissipation, and that is what we need: Mechanisms that take kinetic energy away from an electron and "give" it to the crystal at large. The science behind that is called (Statistical) Thermodynamics - we have encountered it before. The best way to think about this is to assume that the electron, flying along with increasing velocity, will hit something else along its way every now and then; it has a collision with something else, or, as we will say from now on, it will be scattered by something else. This collision or scattering event will change its momentum, i.e. the magnitude and the direction of v, and thus also its kinetic energy Ekin, which is always given by m · v2 Ekin = p·v = 2 2 In other words, we consider collisions with something else, i.e. other particles (including "pseudo" particles), where the total energy and momentum of all the particles is preserved, but the individual particle looses its "memory" with respect to its velocity before the collision, and starts with a new momentum after every collision. What are the "partners" for collisions of an electron, or put in standard language, what are the scattering mechanisms? There are several possibilities: Other electrons. While this may happen, it is not the most important process in most cases. It also does not decrease the total energy contained in the electron movement - the losses of some electrons are the gains of others. Defects, e.g. foreign atoms, other point defects (i.e. voids, interstitials) or dislocations. This is a more important scattering mechanism, moreover, it is a mechanism where the electron can transfer its surplus energy (obtained through acceleration in the electric field) to the atoms of the lattice, which means that the material heats up. Phonons, i.e. "quantized" lattice vibrations traveling through the crystal. This is the most important scattering mechanism. The last aspect is a bit strange. While we (hopefully) have no problem imagining a crystal lattice with all atoms vibrating merrily, there is no immediate reason to consider these vibrations as being localized (whatever this means) and particlelike. You are right – but nevertheless: The lattice vibrations indeed are best described by a bunch of particle-like phonons careening through the crystal. This follows from a quantum mechanical treatment of lattice vibrations. Then it can be shown that these vibrations, which contain the thermal energy of the crystal, are quantized and show typical properties of (quantum) particles: They have a momentum, and an energy given by hν (h = Planck's constant, ν = frequency of the vibration). Phonons are a first example of "pseudo" particles; but there is no more "pseudo" to phonons than there is to photons. (Both of them are bosons, by the way.) We will not go into more details here. All we need to know is that a hot crystal has more phonons and more energetic phonons than a cold crystal, and treating the interaction of an electron with the lattice vibration as a collision with a phonon gives not only correct results, it is the only way to get results at all. At this point comes a crucial insight: It would be far from the truth to assume that only accelerated electrons scatter; scattering happens all the time to all the electrons moving randomly about because they all have some thermal energy. Generally, scattering is the mechanism to achieve thermal equilibrium and equidistribution of the energy of the crystal. If electrons are accelerated in an electrical field and thus gain energy in excess of thermal equilibrium, scattering is the way to transfer this surplus energy to the lattice which then will heat up. If the crystal is heated up from the outside, scattering is the mechanism to turn heat energy contained in lattice vibrations to kinetic energy of the electrons. MaWi 2 Skript - Page 18 Again: Even without an electrical field, scattering is the mechanism to transfer thermal energy from the lattice to the electrons (and back). Generally, scattering is the mechanism to achieve thermal equilibrium and equidistribution of the energy of the crystal. Our free electrons in metals behave very much like a gas in a closed container. They careen around with some average velocity that depends on the energy contained in the electron gas, which is – in classical terms – a direct function of the temperature. Averaging over Random Scattering Events Let's look at some figures illustrating the scattering processes. Shown here is the magnitude of the velocity v ±x of an electron in +x and –x direction without an external field. The electron moves with constant velocity until it is scattered, then it continues with some new velocity. The scattering processes, though unpredictable at single events, must lead to the averages of the velocity, which is characteristic for the material and its conditions. The plural in "averages" is intentional: there are different averages of the velocity! Whereas <v>= 0, <|v|>has a finite value (consult the "fly swarm modul" if you are unsure about this); this is also true for <vx>and <v –x>, where the averages are taken either over the positive or over the negative values only (see drawing). Here it holds that <vx>= –<v–x>, since due to the randomness of the scattering events there is no difference between either direction. From classical thermodynamics we know that the (classical) electron gas in thermal equilibrium with the environment contains the energy Ekin = (1/2)kT per particle and degree of freedom, with k = Boltzmann's constant and T = absolute temperature. If you forgot all about this, check this link, too. The three degrees of freedom are the possible movements in x-, y- and z-direction, so we have (considering just one of them) Ekin,x = ½ · m · <vx2> = ½ · kT kT <vx2> = m For the other directions we have exactly the same relations, of course. For the total energy we obtain m · <vx2> Ekin = m · <vy2> + 2 m · <vz 2> + m · <v2> = 2 2 m · (v0)2 = 2 3kT = 2 2 with v0 = (<v2>)½. v0 is thus the average thermal velocity of a carrier careening around in a crystal. We can easily calculate it from the formula given above; we have v0 = 3kT m ½ Note that by using classical thermodynamics to derive this result, all processes involved in an ideal gas (here formed by the free electrons) are included. This means that electron–electron scattering is already covered by this expression. Therefore, from now on electron–electron scattering events do not to play any role anymore. At this point you should stop a moment and think about just how fast those electrons will be careening around at room temperature (300 K) – without plugging numbers in the equation! Got a feeling for it? Probably not. So look at the exercise question (and the solution) further down! MaWi 2 Skript - Page 19 Now you should stop another moment and become very aware of the fact that this equation is from purely classical physics. It is absolutely true for classical particles - which electrons are not, actually. Electrons obey the Pauli principle, i.e. they behave about as non-classical as possible. This should make you feel a bit uncomfortable. Maybe the equation from above is not correct for electrons then? Indeed - it isn't. Why this is so we will see later, and also how we can "repair" the situation! Now lets turn on an electrical field . It will accelerate the electrons between the collisions (which now are collisions with defects and phonons only, since we stick to the classical treatment from above). Their velocity in field direction then increases linearly from whatever value it had right after a collision to some larger value right before the next collision. In our diagram from above this looks like this: Here we have an electrical field that accelerates electrons in x-direction (and "brakes" in –x direction). Between collisions, the electron gains velocity in +x-direction at a constant rate (= identical slope). The average velocity in +x direction, <v+x >, has now a larger absolute value than that in –x direction, <v–x>. However, beware of the pitfalls of schematic drawings: For real electrons the difference is very small as we shall see shortly; the slope in the drawing is very exaggerated. The drift velocity is contained in the difference <v+x >– <v–x>; it is completely described by the velocity gain between collisions. For obtaining a value, we may neglect the instantaneous velocity right after a scattering event because they average to zero anyway and just plot the velocity gain in a simplified picture; always starting from zero after a collision. The picture now looks quite simple; but remember that it contains some not so simple averaging. At this point it is time to define a very meaningful new average quantity to describe the influence of the scattering processes on the drift velocity: A certain mean time τ between collisions, which for certain reasons (becoming clear only later) is defined as the mean time for reaching the drift velocity vD in the simplified diagram. We also call τ the mean scattering time or just scattering time for short. This is most easily illustrated by simplifying the scattering diagram once more: We simply use just one time - the average - for the time that elapses between scattering events and obtain: This is the standard diagram illustrating the scattering of electrons in a crystal usually found in textbooks; the definition of the scattering time τ is included. It is highly idealized (if not to say just wrong) if you compare it to the correct picture above. Of course, the average velocity of both pictures will give the same value, but that's like saying that the average speed va of all real cars driving around in a city is the same as the average speed of ideal model cars, which are going at va all the time. Note that τ is only half of the average time between collisions. So, while this diagram is not wrong, it is a highly abstract rendering of the underlying processes obtained after several averaging procedures. From this diagram only, no conclusion whatsoever can be drawn as to the average velocities of the electrons without the electrical field! New Material Parameters and Classical Conductivity With the scattering concept, we now have two new (closely related) material parameters: The mean (scattering) time τ between two collisions as defined before. The mean free path l between collisions; i.e. the distance travelled by an electron (on average) before it collides with something else and changes its momentum. We have MaWi 2 Skript - Page 20 l = 2τ · (v0 + vD) Note that v0 enters the defining equation for l, and that we have to take twice the scattering time τ because it only refers to half the time between collisions! After we have come to this point, we now can go on: Using τ as a new parameter, we can rewrite Newtons equation from above for an electron (q = -e) as follows: ∆v dv m· = m· vD = m· = F = q·E = –e·E ∆t dt τ We now only consider what happens to the electron as long as it doesn't hit anything. Then it is possible to equate the differential quotient with the difference quotient, because the velocity change is constant. After a scattering event has taken place, the process is completely interrupted and starts under "virgin" conditions again. We obtain immediately the relation between the drift velocity vD and the applied field E: vD E·e = – τ m E·e·τ ⇒ vD = – m Inserting this equation for vD in the old definition of the current density j = – n · e · v D and invoking the general version of Ohms law, j = σ · E, yields n · e2 · τ j = ·E =: σ·E m This gives us the final result n · e2 · τ σ = m This is the classical formula for the conductivity of a classical "electron gas" material; i.e. metals. The conductivity contains the density n of the free electrons and their mean classical scattering time τ as material parameters. We have a good idea about n, but we do not yet know τclass , the mean classical scattering time for classical electrons. However, since we know the order of magnitude for the conductivity of metals, we may turn the equation around and use it to calculate the order of magnitude of τclass . If you do the exercise further down, you will see that the result is: σ·m ≈ (10–14 ... 10 –13) s τclass = n · e2 "Obviously" (as stated in many text books), this is a value that is far too small and thus the classical approach must be wrong. But is it really too small? How can you tell without knowing a lot more about electrons in metals? Let's face it: you can't !! So let's look at the mean free path l instead. We have MaWi 2 Skript - Page 21 l = 2 · τ · (v0 + vD) and 3kT (v 0)2 = m The last equation gives us a value v0 ≈ 104 m/s at room temperature! Now we need vD, and this we can estimate from the equation given above to vD = – E · τ · e/m ≈ 1 mm/s, if we use the value for τ dictated by the measured conductivities. It is much smaller than v0 and can be safely neglected in calculating l. We thus can rewrite the equation for the conductivity and obtain n · e2 · l σ = n · e2 · l ≈ 2 · m · (v0 + vD) 2 · m · v0 Knowing σ from experiments, but not l, allows to determine l. The mean free path l between collisions (for vD = 0) for typical metals thus is 2 · m · v0 · σ = 2 · v0 · τ ≈ (100 – 101) nm l = n · e2 And this is certainly too small! But before we discuss these results, let's see if they are actually true by doing an exercise: Exercise 2.1-2 Derive numbers for v0, τ, vD, and l Now to the important question: Why is a mean free path in the order of the size of an atom too small? Well, think about the scattering mechanisms. The distance between lattice defects is certainly much larger, and a phonon itself is "larger", too. It does not pay to spend more time on this. Whichever way you look at it, whatever tricky devices you introduce to make the approximations better (and physicists have tried very hard!), you will not be able to solve the problem: The mean free paths are never even coming close to what they need to be, and the conclusion which we will reach - maybe reluctantly, but unavoidably - must be: There is no way to describe conductivity (in metals) with classical physics! Scattering and a New Look on Mobility Somewhere on the way, we have also indirectly found that the mobility µ as defined before is just another way to look at scattering mechanisms. Let's see why. All we have to do is to compare the equation σ = (n · e2 · τ)/m for the conductivity from above with the master equation σ = q · n · µ. This gives us immediately MaWi 2 Skript - Page 22 e·τ µ = m e·l µ ≈ 2 · m · v0 In other words: The decisive material property determining the mobility µ is the average time between scattering events or the mean free path between those events. The mobility µ thus is a basic material property, well-defined even without electrical fields, and just another way to characterize the scattering processes taken place by a single number. We even can go one stage further with this: If we envision the movement of an electron again, as described above in many words, analogies ("fly swarm"), graphs and equations, we "see" exactly the same thing we envisioned when we looked a diffusing particle or vancany when we learned about diffusion and random walk. "Something" bounced round in a random matter, and everything important about the "something" was captured in its diffusion coefficient D. This diffusion coefficient was either defined via Fick's laws (e.g. Fick's first law jx = –D · dn/dx) or by looking at the atomic mechanisms that got us something like D ≈ a2 · r (a = lattice constant, r = jump rate). From the random walk consideration we had for the "diffusion length" L = (D · t)½, a relation that also could be used to define D. You should now have a certain feeling that all this old stuff from diffusion and what we just learned about the random bouncing around of electrons, must be somehow connected. After all, we always have the element of something moving around (mostly) at random. Right you are! Again, it was Einstein (and independently Smoluchowski) who found the proper relation, the EinsteinSmoluchowski relation hinted at a chapter ago: µ · kT D = e D·e µ = kT The mobility µ thus is "almost" the same as the diffusion coefficient D; for a given temperature T they are proportional to each other, How do we obtain this simple relation? Well - we won't at this point. It's not all that difficult to derive, but it is no accident either that it's called after Einstein (that's actually part of what he got the Nobel prize for). If you are not satisfied with that, check this link for a derivation, or this one for an alternative way. More to the relation between diffusion coefficient and mobility in this (German) link. If you are a bit exhausted and confused by now that's OK! This German link might help, where things are summed up once more. MaWi 2 Skript - Page 23 Mobility and Speed of Electronic Devices In the equations above slumbers an extremely important aspect of semicoductor technology: In all electronic devices carriers have to travel some distance before a signal can be produced. A MOS transistor, for example, switches currents on or off between its "Source" and "Drain" terminals depending on what voltage is applied to its "Gate". Source and drain are separated by some distance lSD, and the "Drain" only "feels" the "on" state after the time it takes the carriers to run the distance lSD. How long does that take if the voltage between Source and Drain is USD? Easy. If we know the mobility µ of the carriers, we also know their (average) velocity vSD in the source-drain region, which by definition is vSD = µ · USD/lSD. The traveling time tSD between source and drain for obvious reasons defines roughly the maximum frequency fmax the transistor can handle, we have tSD = lSD / vSD or lSD2 1 ≈ tSD = µ · USD fmax The maximum frequency of a MOS transistor thus is directly proportional to the mobility of the carriers in the material it is made from (always provided there are no other limiting factors). And since we used a rather general argument, we should not be surprised that pretty much the same relation is also true for most electronic devices, not just MOS transistors. This is a momentous statement: We linked a prime material parameter, the material constant µ, to one of the most important parameters of electronic circuits. We would like µ to be as large as possible, of course, and now we know what to do about it! Actually, we do not really know what to do, but other people do - and act on it. See the link to find out how it is done. A simple exercise is in order to see the power of this knowlegde: Exercise 2.1-3 What does it take to build a 4 GHz microprocessor? Fragebogen / Questionaire Multiple Choice Fragen zu 2.1.2 MaWi 2 Skript - Page 24 2.1.3 The Hall Effect This subchapter introduces two important topics: The Hall effect as an important observation in materials science and at the same time another irrefutable proof that classical physics just can't hack it when it comes to electrons in crystals. The Hall effect describes what happens to current flowing through a conducting material - a metal, a semiconductor - if it is exposed to a magnetic field B. We will look at this in classical terms; again we will encounter a fundamental problem. The standard geometry for doing an experiment in its most simple form is as follows: A magnetic field B is employed perpendicular to the current direction j, as a consequence a potential difference (i.e. a voltage) develops at right angles to both vectors. In other words: A Hall voltage UHall will be measured perpendicular to B and j. In yet other words: An electrical field EHall develops in y-direction Relevant vectors; the current is carried by electrons That is already the essence of the Hall effect. It is relatively easy to calculate the magnitude of the Hall voltage UHall that is induced by the magnetic field B. First we note that we must also have an electrical field E parallel to j because it is the driving force for the current. Second, we know that a magnetic field at right angles to a current causes a force on the moving carriers, the socalled Lorentz force FL, that is given by FL = q · (vD × B) We have to take the drift velocity vD of the carriers, because the other velocities (and the forces caused by these componentes) cancel to zero on average. The vector product assures that FL is perpendicular to vD and B. Note that instead the usual word "electron" the neutral term carrier is used, because in principle an electrical current could also be carried by charged particles other than electrons, e.g. positively charged ions. Remember a simple but important picture given before! For the geometry above, the Lorentz force FL has only a component in y - direction and we can use a scalar equation for it. Fy is given by Fy = – q · vD,x · Bz We have to be a bit careful: We know that the force is in y-direction, but we do no longer know the sign. It changes if either q, vD, or Bz changes direction and we have to be aware of that. However, it is important to note that for a fixed current density jx the direction of the Lorentz force is independent of the sign of the charge carriers – the sign of the charge and the sign of the drift velocity just cancel each other. With vD = µ · E and µ = mobility of the carriers, we obtain a rather simple equation for the force Fy = – |q| · µ · Ex · Bz This means that the current of carriers will be deflected from a straight line in y-direction. In other words, there is a component of the velocity in y-direction and the surfaces perpendicular to the y-direction will become charged as soon as the current (or the magnetic field) is switched on. The flow-lines of the carriers will look like this: MaWi 2 Skript - Page 25 The charging of the surfaces is unavoidable, because some of the carriers eventually will end up at the surface where they are "stuck". Notice that the sign of the charge for a given surface depends on the sign of the charge of the carriers. Negatively charged electrons (e- in the picture) end up on the surface opposite to posively charged carriers (called h+ in the picture). Notice, too, that the direction of the force Fy is the same for both types of carriers, simply because both q and vD change signs in the force formula The surface charge then induces an electrical field Ey in y-direction which opposes the Lorentz force; it tries to move the carriers back. In equilibrium, the Lorentz force Fy and the force from the electrical field Ey in y-direction (which is of course simply q · Ey) must be equal with opposite signs. We therefore obtain – q · Ey = – |q| · µ · Ex · Bz Ey = sgn(q) · µ · Ex · Bz The Hall voltage UHall now is simply the field in y-direction multiplied by the dimension dy in y-direction. It is clear then that the (easily measured) Hall voltage is a direct measure of the mobility µ of the carriers involved, and that its sign or polarity will change if the sign of the charges flowing changes. It is customary to define a Hall coefficient RHall for a given material. This can be done in different, but equivalent ways. In the link we look at a definition that is particularly suited for measurements. Here we use the following definition: Ey RHall = Bz · jx In other words, we expect that the Hall voltage Ey · dy (with dy = dimension in y-direction) is proportional to the current(density) j and the magnetic field strength B, which are, after all, the main experimental parameters (besides the trivial dimensions of the specimen): Ey = RHall · Bz · jx The Hall coefficient is a material parameter, indeed, because we will get different numbers for RHall if we do experiments with identical magnetic fields and current densities, but different materials. The Hall coefficient, as mentioned before, has interesting properties: RHall will change its sign, if the sign of the carriers is changed because then Ey changes its sign, too. It thus indicates in the most unambiguous way imaginable if positive or negative charges carry the current. RHall allows to obtain the mobility µ of the carriers, too, as we will see immediately. RHall is easily calculated: Using the equation for Ey from above, and the basic equation jx = σ · Ex, we obtain for negatively charged carriers: µ · Ex · Bz RHall = – µ = – σ · Ex · Bz –µ = σ –1 = |q| · n · µ |q| · n The blue part corresponds to the derivation given in the link; n is (obviously) the carrier concentration. If one knows the Hall coefficient or the carrier concentration, the Hall effect can be used to measure magnetic field strengths B ( not so easily done otherwise!). Measurements of the Hall coefficient of materials with a known conductivity (something easily measurable) thus give us directly the mobility of the carriers responsible for the conductance. MaWi 2 Skript - Page 26 The minus sign above is obtained for electrons, i.e. negative charges. If positively charged carriers would be involved, the Hall constant would bepositive. Note that while it is not always easy to measure the numerical value of the Hall voltage and thus of R with good precision, it is the easiest thing in the world to measure the polarity of a voltage. Let's look at a few experimental data: Material Li Cu Ag Au Al Be In Semiconductors (e.g. Si, Ge, GaAs, InP,...) R (× 10–24) cgs units –1,89 –0,6 –1,0 –0,8 +1,136 +2,7 +1,774 positive or negative values, depending on "doping" Comments: 1. the positive values for the metals were measured under somewhat special conditions (low temperatures; single crystals with special orientations), for other conditions negative values can be obtained, too. 2. The units are not important in the case, but multiplying with 9 · 1013 yields the value in m 3/Coulomb Whichever way we look at this, one conclusion is unavoidable: In certain materials including metals, the particles carrying the electrical current are positively charged under certain conditions. And this is positively not possible in a classical model that knows only negatively charged electrons as carriers of electrical current in solids! Again we are forced to conclude: There is no way to describe conductivity in metals and semiconductors with classical physics! Fragebogen / Questionaire Multiple Choice Fragen zu 2.1.3 MaWi 2 Skript - Page 27 2.1.4 Zusammenfassung Kapitel 2.1 Vorbemerkung: Hier sind absichtlich keine Links gesetzt. Wer hier etwas nicht sofort versteht, tut gut daran selbst aktiv zu suchen! Ohmsches Verhalten bedeutet, dass die Beziehung zwischen Strom I und elektrischer Spannung U eines Systems linear ist. Etwas allgemeiner ausgedrückt: Die "Antwort" (= Wirkung) eines Systems auf eine von außen kommende "Störung" des Gleichgewichts (= Ursache) is linear. "Doppelte" Ursache produziert doppelte "Wirkung". Für Spannungen / Ströme gilt dann das "Ohmsche Gesetz": 1 I ∝ U ⇒ I = ·U R R ist der Widerstand des Systems. Probengeometrieunabhängig und lokal schreibt sich das "Ohmsche Gesetz" für Strom dichte j und Feldstärke E wie folgt j = σ E 1 σ = = spez. Leitfähigkeit ρ Dabei ist ρ der spezifische Widerstand; σ (und ρ) sind in der allgemeinsten Form (ortsabhängige) Tensoren 2. Stufe. Falls das System ein homogenes Material ist, sind ρ (und ρ) Materialparameter oder Material"konstanten". Eine elektrische Stromdichte je ist immer verursacht durch eine ("mechanische") Stromdichte jT geladener Teilchen; es gilt immer q = Ladung des Teilchens je = q · jT jT = Zahl Teilchen N pro Fläche F und Zeit t N = F·t Je nach Vorzeichen der Ladung fliessen Teilchenströme und elektrische Ströme also in gleicher oder entgegengesetzter Richtung. Bei "regellos" umherfliegenden Teiclchen wie z.B in einem Gas, oder hier im "Elektronengas" in einem Metall, werden im Mittel pro Zeiteinheit genauso viele Teilchen von links nach rechts wie von rechts nach links durch eine Referenzfläche fliegen, der Nettostrom ist dann Null obwohl die Teilströme beachtlich sein können. Ströme lassen sich immer wie folgt ausdrücken Mechanisch Elektrisch jmech = n · vD jel = q · jmech = q · n · vD Mit n = Konzentration der Teilchen vD = Driftgeschwindigkeit = kollektive mittlere Geschwindigkeit senkrecht zur Referenzfläche, q = Ladung der Teilchen. Der Unterschied zwischen der individuellen, ständig nach Betrag und Richtung wechselnden Geschwindigkeit eines Teilchens und der kollektiven Driftgeschwindigkeit erschließt sich zwanglos aus der Mückenschwarmanalogie. Damit gilt für die elektrische Stromdichte ohmscher Materialien MaWi 2 Skript - Page 28 j = q · n · vD := σ · E für "ohmsche" Materialien Daraus folgt zwingend, daß für Materialien, die ohmsches Verhalten zeigen, vD/E eine Konstante, und zwar eine Materialkonstante, genannt Beweglichkeit µ, sein muß. Damit haben wir einen ersten immer gültigen Ausdruck für die spez. Leitfähigkeit eines (ohmschen) Mateirels: σ = q·n·µ Es bleibt, die Konzentration n und die Beweglichkeit µ der freien (= beweglichen) Ladungsträger aus mikroskopischen (= atomaren) Materialbetrachtungen zu berechnen. Die Konzentration ist zumindest bei Metallen ziemlich klar (einige Elektronen pro Atom), die schwierige Größe ist die Beweglichkeit. Aus der Existenz einer konstanten (mittleren) Geschwindigkeit im elektrischen Feld folgt aber sofort die Existenz einer Art "Reibung", die auf mikroskopischer Ebene nur durch ständige Stöße der beschleunigten Ladungsträger mit "Stoßpartnern" dargestellt werden kann. Stoßpartner sind Andere Elektronen (eher unwichtig) Defekte im Gitter (wichtig) "Phononen", d.h. durch das Gitter laufende elastische Wellen, die als "Quasi"partikel in der Quantentheorie formalisierten thermischen Gitterschwingungen (sehr wichtig). Damit lassen sich zwei neue, eng verwandte Parameter einführen: Die mittlere Zeit 2τ zwischen zwei Stößen und die mittlere freie Weglänge l = 2τ · (v0 + vD) die das Teilchen zwischen 2 Stößen zurücklegt. Dabei ist v0 der Betrag der mittleren Geschwindigkeit eines Teilchens (der individuellen Mücke im Mückenschwarm). Aus dem Newtonschen Grundgesetz F = –q · E = m · dv/dt := m · vD/τ folgt sofort E·e·τ vD = – m e·τ vD µ = = E = m n · e2 · τ σ e·D = kT n · e2 · l = m 2 · m · (v0 + vD) Damit ist die elektrische Leitfähigkeit auf sehr elementare Materialeigenschaften zurückgeführt: Konzentrationen von Ladungsträgern und ihre Bewegung von Stoß zu Stoß. Die Größe Beweglichkeit µ ist damit ein Maß für die erreichbare Driftgeschwindigkeit vD, die mittlere Stoßzeit τ, die mittlere freie Weglänge l und, unter Zuhilfenahme der Einstein-Smoluchowski Beziehung µ = (D · e) / (kT) auch der Diffusionskonstanten D (in obigen Gleichungen schon eingearbeitet). Damit ist die Beweglichkeit ein zentraler Materialparameter! Wie groß ist die mittlere Stoßzeit oder die mittlere freie Weglänge? Das erstere können wir nicht wissen, aber für die mittlere freie Weglänge haben wir ein Gefühl: Sie muß auf jeden Fall deutlich größer sein als typische Atomdurchmesser oder Gitterkonstanten. Wir können jetzt gemessene σ Werte nehmen, und sehen was für mittlere freie Weglängen sich ergeben. Allerdings brauchen wir dazu noch v0. Für klassische Teilchen im thermischen Gleichgewicht gilt immer, daß jeder Freiheitsgrad die Energie ½kT aufnimmt, wir haben also MaWi 2 Skript - Page 29 E = Ekin = ½ m · v02 = 3/2 kT v0 = = 3 kT 1/2 m Damit ergibt sich für das kleinstmögliche lmin ; d.h. für vD = 0 lmin ≈ 1 nm Das ist viel zu klein! Da wir keinen Fehler gemacht haben gibt es nur eine logische Schlußfolgerung: Die klassische Physik kann das Phänomen der Leitfähigkeit grundsätzlich nicht beschreiben - wir brauchen Quantentheorie! Das ergibt sich auch aus Messungen zum Hall-Effekt, die unabweisbar zeigen, daß sich in manchen Metallen unter bestimmten Voraussetzungen positive Ladungsträger bewegen. Der Hall-Effekt beschreibt die leicht zu verstehende Tatsache, daß fließende (= Strom tragende) Ladungsträger in einem Magnetfeld abgelenkt werden und damit Spannungen senkrecht zur Stromrichtung induzieren. In der optimalen Geometrie (stromverursachendes elektrisches Feld Ex und Magnetfeld Bz senkrecht zueinander) wird eine Hall-Spannung in y-Richtung induziert, das zugehörige elektrische Feld Ey steht senkrecht auf den beiden anderen. Es gilt (für negativ geladene Ladungsträger) Ey = – µ · Ex · Bz = – µ · (jx/σ) · Bz = RHall · Bz · jx µ RHall = ± σ Der Hall-Effekt erlaubt bei bekanntem (da leicht meßbarem) σ die Beweglichkeiten µ beliebiger Materialien zu messen. Außerdem steckt im Vorzeichen der Hall-Spannung das Vorzeichen der Ladungen die den Strom verursachen. Aus vielen Messungen folgt ebenfalls: Die klassische Physik kann das Phänomen der Leitfähigkeit grundsätzlich nicht beschreiben - wir brauchen Quantentheorie! MaWi 2 Skript - Page 30 2.1.5 Merkpunkte Kapitel 2.1 Ohmsches Gesetz 1 I ∝ U = ·U R besser: j = σ E Elektrischer Strom je = mechanischer Strom jT geladener Teilchen q = Ladung des Teilchens je = q · jT Zahl Teilchen N pro jT = Fläche F und Zeit t N = F·t Es zählt nur der Nettostrom = Differenz der Teilströme. Der Nettostrom ist bestimmt durch die Driftgeschwindigkeit vD j = q · n · vD Damit ergibt sich die "Mastergleichung" für die Leitfähigkeit; µ ist der Materialparameter "Beweglichkeit" = vD/E σ = q·n·µ Die Existenz einer konstanten Driftgeschwindigkeit trotz einer konstante Kraft erfordert die Existenz von "Reibung" = Stöße im Mikroskopischen. E·e·τ vD = – m Stoßpartner für die Elektronen sind Phononen, Kristallgitterdefekte und andere Elektronen. Die entscheidenden Parameter sind die mittlere Stoßzeit τ und die damit verknüpfte mittlere freie Weglänge l l = µ = 2τ(v 0 + vD) e·τ vD = E Es ergeben sich die nebenstehenden Beziehungen. Dabei ist die EinsteinSmoluchowski Beziehung zwischen µ und Diffusionkonstante D schon eingetragen, m n · e2 · τ σ = n · e2 · l 2 · m · (v0 + vD) E = Ekin = ½ m · v02 = 3/2 kT v0 = MaWi 2 Skript - Page 31 kT = m Die mittlere thermische Geschwindigkeit v0 folgt aus der klassischen Thermodynamik: e·D = 3 kT 1/2 m Für Metalle mit bekannter Konzentration n der Elektronen und gemessenen Leitfähigkeiten lassen sich die interessanten Größen ausrechnen; man erhält v0 ≈ 5 · 104 m/s τ ≈ 4 · 10–14 s Das kann nicht stimmen - insbesondere l ist viel zu klein! vD ≈ 6 · 10–1 m/s Offenbar ist Quantentheorie erforderlich! Der Hall Effekt betrachtet Stromfluß im Magnetfeld Bz . Bei orthogonaler Geometrie wird senkrecht zu Ex und Bz eine Hallspannung Ey · Breite induziert. Damit sind Beweglichkeiten direkt meßbar; das Vorzeichen der Hallkonstante gibt direkt das Vorzeichen der fließenden Ladungen. l ≈ 3 nm Ey = sgn(q) · µ · Ex · Bz = RHall · Bz · jx µ RHall = ± σ Gelegentlich findet man positive Ladungen; klassisch nicht erklärbar.Offenbar ist Quantentheorie erforderlich! MaWi 2 Skript - Page 32 2.2 Quantenmechanische Betrachtung 2.2.1 Einleitung Es ist nützlich, sich vor Aneignung dieses Kapitels noch einmal die Grundsätze der Quantentheorie ins Gedächtnis zu rufen. Das wird zwar in dieser Einleitung auch gemacht, aber ausführlicher findet sich das ganze in einem "Basic" Modul. Wir betrachten zunächst als Wiederholung (vergleiche MatWiss I) das Verhalten von Elektronen bei einzelnen Atomen. Es zeigte sich, daß die Elektronen wegen des Pauli-Prinzips auf verschiedene Orbitale mit verschiedenen Energien verteilt sind. Das Bild unten zeigt die Potentialtopfdarstellung eines Na-Atoms. Wer Probleme hat, dieses Bild zu interpretieren, sollte dringend die entsprechende Module von MaWi 1 nacharbeiten! Bei der Annäherung von zwei Atomen (z.B. H-Atome des H2-Moleküls) gibt es eine Aufspaltung der AtomEnergieniveaus in jeweils zwei Einzelniveaus. Das muß ganz allgemein so sein, denn Atomverbünde - ob zweiatomige Moleküle, große Moleküle oder Kristalle haben immer nur Orbitale, oder besser Zustände für Elektronen, die alle zur Lösung einer Schrödingergleichung gehören. Falls die Atomzustände nicht aufspalten würden, gäbe es sehr schnell keinen Platz mehr für die Elektronen, die im Atom einen bestimmten Zustand bevölkern, denn nach dem Pauli-Prinzip können sie nicht alle im selben Zustand sein. Das ist sofort evident für einen Festkörper: In einem Festkörper haben sich N (mit N ≈ 1022) Atome soweit angenähert, daß sich jedes Energieniveau des Einzelatoms, das im Prinzip allen Elektronen des gesamten Kristalls "zugänglich" ist, in N Sub-Niveaus aufspalten muß. Dies gilt also insbesondere für die Energie-Orbitale der äußeren Elektronen, weil sich deren Wellenfunktionen stark überlappen. In dieser qualitativen Betrachtung scheint ein Stück Willkür zu stecken - tut es auch. Aber jede Willkür verschwindet sofort, wenn man die Schrödingergleichung wirklich löst (die "Willkür" steckt dann in den verwendeten Näherungen). Das Prinzip der Bildung von Energiebändern aus bestimmten Atomorbitalen (bei Na-Beispiel aus dem 3s-Orbital) ist aber im graphischen Potentialtopfmodell problemlos nachzuvollziehen; es ist unten abermals gezeigt. Die Energie-Subniveaus liegen energetisch sehr dicht und werden auch als Energieband bezeichnet. Es gibt in dem 3s1 Band genau doppelt soviel Plätze wie Elektronen, da jedes Atom ein Energie(sub)niveau mit zwei Plätzen beisteuert. Die Aufspaltung der 2p6, 2s2 und 1s2 Niveaus ist so gering, dass wir in diesem Bild keine Bänder einzeichnen, sondern einfach die Atomniveaus beibehalten. Letztlich sind bei jeder Bindung ja auch nur die äußeren Elektronen betroffen. Energiebänder in Festkörpern haben einige allgemeine Eigenschaften, die wir kurz aufzählen wollen, bevor wir sie im Detail herleiten und interpretieren: Die Energieniveaus des Festkörpers liegen energetisch niedriger als bei den isolierten Atomen. Das muß einfach so sein, denn sonst gäbe es keinen Grund, daß die Atome "zusammenhalten". Die durch die Bildung des Festkörpers gewonnene Energie stimmt im wesentlichen mit der Bindungsenergie (pro Atom ca. 1eV) überein. MaWi 2 Skript - Page 33 Nicht alle Energiezustände in den Bändern müssen mit Elektronen besetzt sein. So ist z.B. beim Na das 2p-Band voll besetzt, das 3s-Band aber nur halb mit Elektronen gefüllt; die höheren Bänder sind vollständig leer - siehe unten. Bei einigen Materialien (Isolatoren, Halbleiter) stellt man im Bänderschema innerhalb eines gegebenen Bands Energielücken (engl: "gap") fest, d.h. Energiebereiche, in denen keine Energiezustände für Elektronen existieren. Die Besetzung der Energiezustände mit Elektronen ist bei endlicher Temperatur nicht für alle Zustände gleich wahrscheinlich. Die Besetzungswahrscheinlichkeit der Niveaus mit Elektronen regelt nicht mehr die Boltzmannverteilung, die nur für "klassische" Teilchen gilt, sondern die Fermi-Dirac Statistik; die wir uns noch erarbeiten müssen. Die Thematik der kommenden Kapitel ist damit vorgegeben. Insbesondere interessieren wir uns für folgende Themen: Wie genau kommen die Bänder zustanden? Wie entstehen Energielücken? Wie groß sind die beteiligten Energien? Welche Faktoren bestimmen die Zahlenwerte? Wie genau sind die einzelnen Zustände in einem Band verteilt? Wie groß ist die " Zustandsdichte", d.h. die Zahl der individuellen Niveaus in einem Band in einem gegeben Energieintervall bei der Energie E? Welche Niveaus werden von den vorhanden Elektronen auch bevölkert oder anders gefragt, wie groß ist die Besetzungswahrscheinlichkeit für einen bestimmten Platz? Was genau bedeutet die bereits angesprochene FermiDirac Statistik? Diese Fragen lassen sich leicht veranschaulichen. Wir betrachten dazu den Übergang vom Studierendengas, in dem N Studierende (aus Sicht des Professors alle ununterscheidbar) in der Lobby wild und völlig ungeordnet durcheinanderlaufen, zum Studierendenfestkörper. Der Studierendenfestkörper ist durch den Hörsaal vorgegeben, der definierte Energieniveaus hat (= Höhe der Sitzreihe in einem gestuften Hörsaal) mit einer bestimmten (und im allgemeinen verschiedenen) Zahl von Plätzen pro Energieniveau (= Zahl der Sitzplätze in einer Reihe). Das sind die durch die Art des Kristall vorgebenen Energiewerte (= Stufung) plus der Zustandsdichte (= Zahl der Plätze pro Stufe). Es gibt eine definierte Zahl von Plätzen bei definierten; d.h. mit einem Index n numerierbaren (potentiellen) Energien En. Viele, aber nicht alle Plätze sind mit Studierenden besetzt. Welcher Verteilungsfunktion die Studis folgen d.h. mit welcher Wahrscheinlichkeit Plätze bei der Energie En besetzt werden, ist aber nicht so klar. Wir können nicht unbedingt davon ausgehen, daß die Studis die (freie) Energie minimieren, denn dann müßten sie die vorhandenen Plätze von "unten" kommend lückenlos auffüllen und die "oberen" Plätze freilassen Bei der derzeitigen Entwicklung der Architektur ist es nur eine Frage der Zeit, bis die Parameter Energieniveaus En und Zahl der Plätze bei En als Funktion einer Koordinate ziemlich beliebig werden (im Gegensatz zu dem altmodischen Hörsaal, in dem die Abstände der Stufen i.d.R. konstant sind (d.h. En+1 – En = const, und pro Stufe gleichviel (oder stetig ansteigende) Platzzahlen vorliegen). Im allgemeinen wird es aber immer diskrete Energiewerte geben, mit einer beliebigen, aber gegebenen Zahl von Plätzen pro Energiewert. Die Verteilung der Studierenden auf die vorhandenen Plätze entspricht dann der Verteilung der Elektronen in einem Band. Und genausowenig wie Studis die vorhandenen Plätze von unten an vollständig auffüllen, tun das die Elektronen - das wäre zu ordentlich. Wir ahnen damit schon, daß die Entropie wieder eine wichtig Rolle spielen wird. Fragebogen / Questionaire Multiple Choice Fragen zu 2.2.1 MaWi 2 Skript - Page 34 2.2.2 Das Modell des freien Elektronengas Vorbemerkungen Alles was wir tun müssen, ist die Schrödingergleichung für die Elektronen in einem Kristall zu lösen. Leicht gesagt unmöglich zu tun; denn wir können die Schrödingergleichung noch nicht mal für zwei Atome in einem Molekül exakt analytisch lösen. Wir brauchen also Näherungen bzw. einfache Modelle. Wie sich herausstellte, führt schon eine extrem "freche" Näherung zum Erfolg: Das Modell des freien Elektronengas. Dieses Modell wird zwar nicht den Kuchen, den wir backen möchten, liefern (d.h. alle gestellten Fragen quantitativ beantworten) - aber es liefert uns die Art und Natur der benötigten Zutaten. Und das ist viel! Nicht nur könnten wir damit dann wirklich den gewünschten Kuchen backen (indem wir die mathematische Numerik als Knetmaschine bemühen); sondern wir haben jetzt die Freiheit, noch ganz andere Leckerbissen aus den erarbeiteten Zutaten herzustellen! Zunächst können insbesondere Metalle, später dann aber auch Halbleiter, im Rahmen dieses Modells betrachtet werden. Die Näherungen des Modells 1. Ein-Elektron-Näherung Anstelle des Gesamtsystems aus ca. 1023 Elektronen (pro Mol) betrachtet man ein extrem reduziertes System, bestehend aus einem Elektron. Die restlichen Elektronen (bestehend aus den Kollegen in einem Energieband und den Rumpfionen des Metalls) werden alle als ein im Mittel konstantes zusätzliches Potential betrachtet. Das bedeutet, daß die individuelle Wechselwirkung der Elektronen untereinander vernachlässigt wird - wir nehmen nur an, daß sie sich irgendwie im Raum gleichmäßig verteilen. Was dann für ein Elektron herauskommen wird, gilt dann eben auch für alle anderen. 2. Beschränkung auf freie Elektronen. Betrachtet werden nur die äußeren Elektronen der Atome - nur die Elektronen auf Orbitalen, die überhaupt von den anderen Atomen, d.h. der Kristallbindung etwas "merken". Atomkern und innere Elektronen werden vernachlässigt. Sie bilden ein statisches Hintergrundpotential für die freien Elektronen. 3. Konstantes Potential Im Prinzip müßte man jetzt zur Lösung der Schrödingergleichung für das eine noch betrachtete Elektron das im Raum periodisch variierende Potential einsetzen, wie es unten gezeichnet ist plus ein konstantes Zusatzpotential von den "Hintergrundelektronen". Das ist uns aber noch zu schwierig (obwohl das mathematisch schon machbar wäre), und wir verwenden einfach ein konstantes (Kasten)potential als (heftige, aber wie sich zeigen wird, sinnvolle) Näherung. Das sind die blauen Linien in der Zeichnung unten. Wir arbeiten auch grundsätzlich mit einem endlichen Kristall; in x-Richtung hat er, wie gezeigt, die Länge L. 4. Periodische Randbedingungen. MaWi 2 Skript - Page 35 Wie groß sind echte Kristalle? Für allgemeine Betrachtungen ist die Vorgabe einer Größe, z.B der Kantenlänge L, ja nicht besonders sinnvoll - allgemeine Wahrheiten können ja wohl kaum von der willkürlichen Größe des Körpers abhängen. Der übliche Trick in solchen Fällen ist: Der Festkörper wird als unendlich ausgedehnt beschrieben. Leider geht das im Modell des freien Elektronengases mathematisch nicht - die Lösungen der S.-Gleichungen sind dann einfach alle nur noch ψ = 0. Der in solchen Fällen anzuwendende Trick ist aber auch wohlbekannt und besteht darin, einen endliche Körper gedanklich so zu verbiegen, daß sein Ende auf den Anfang fällt. Kein Problem mit einem eindimensionalen mathematischen Kristall der Länge L, der einfach einen Abfolge von Punkten im Abstand a = Gitterkonstante ist. Wir biegen die Punktlinie zu einem Kreis, der sich selbst in den A... beißt; im Link kann man sich das (plus Rechnung dazu) ansehen Um das ganze dreidimensional zu sehen, muß man sich auch mächtig das Hirn verbiegen (und selbst dann klappt es ohne die Nachhilfe mit gewissen chemischen Substanzen, die man z.B aus Trauben gewinnt, nicht so recht), oder schlicht die ganz simple mathematische Formulierung hinschreiben: ψ(x + L, y + L, z + L) = ψ(x,y,z) In Worten: Die gesuchte Wellenfunktion ψ muß am Anfang und Ende des Kristall für jede Koordinatenrichtung denselben Wert haben. Diese Gleichung definiert sogenannte periodische Randbedingungen für die Wellenfunktion ψ(x,y,z) und macht unseren endliche Kristall mit der Kantenlänge L zu einem für das zu lösende Problem letztlich unendlich ausgedehnten Gebilde. Darf man das? Ja - man darf! In der Herleitung von Theorien darf man zunächst alles - das einzige Kriterium ist der Erfolg. Der Erfolg in unserem Fall zeigt sich (später) dann u.a. anderem darin, daß die Schlußfolgerungen, die wir ziehen können, dann gar nicht mehr von L oder den genauen Randbedingungen abhängen. Aber das können wir jetzt noch nicht wissen, jetzt rechnen wir einfach mal los. Lösung der Schrödingergleichung für das freie Elektronengas Für unser Problem genügt die uns bereits bekannte zeitunabhängige Schrödinger-Gleichung; die zeitabhängige Schrödingergleichung ist in einem advanced Modul dargestellt. Für unseren Fall eines Kastenpotential lautet sie (zunächst eindimensional): 2 d2ψ(x) – + V(x) · ψ(x) = E · ψ(x) · dx2 2me Für das Potential gilt V(x) = V = const. ( = 0) { ∞0 für 0 ≤ x ≤ L sonst Im Modell der freien Elektronen beginnt man die Energieskala meist bei der konstanten potentiellen Energie, d.h. man wählt E = E ' – V0, oder, wie oben angedeutet, schlicht V0 = 0; wir erhalten 2 d2ψ(x) – = E · ψ(x) · 2me dx2 In dieser Gleichung bedeutet E nach wie vor die (konstante) Gesamtenergie des Elektrons, aber da die potentielle Energie = 0 ist, beschreibt E jetzt automatisch nur noch die kinetische Energie des Elektrons. Für die y- und z- Richtung gilt natürlich genau dieselbe Gleichung. Die Lösung der Differentialgleichung ist einfach; man erhält ψ(r) = 1 3/2 · exp (i · k · r) L MaWi 2 Skript - Page 36 Mit r = (x,y,z) = Ortsvektor, und k = noch unspezifizierter Vektor, den wir mal Wellenvektor nennen, mit der offenkundigen Dimension [k] =1/cm . (1/L)3/2 ist ein Normierungsfaktor; er ergibt sich aus der Normierungsbedingung LLL ⌠ ⌠ ⌠ ψ(r) · ψ*(r) · dxdydz ⌡⌡⌡ = 1 0 0 0 Dass die gebene Funktion die Lösung der S.-Gleichung ist, ist bisher natürlich nur eine Behauptung. Ob die Behauptung stimmt, wird sich durch Einsetzen zeigen. Das machen wir aber in einer Übung weiter unten. Das Ergebnis ist, daß die angegebene Funktion dann und nur dann eine Lösung ist, falls die in der Lösung vorkommenden Größen Gesamtenergie E, und Wellenvektor k bestimmte Bedingungen erfüllen. Welche physikalische Bedeutung dieser Wellenvektor genau hat, wird sich uns nach und nach erschließen. Der Name deutet aber schon an, wohin die Reise gehen wird. Unsere Lösung für ein in einen Potentialkasten eingesperrtes Elektron hat selbst in dieser allgemeinen und noch unspezifischen Form eine überaus interessante Eigenschaft: Die Aufenthaltswahrscheinlicheit für dieses Elektron ist überall dieselbe, denn wenn wir ψ·ψ* bilden, erhalten wir ψ(r) · ψ*(r) = 1 3 · exp (i · k · r) · exp –(i · k · r) L = 1 3 L Wenn wir das Elektron "suchen", d.h. mit einer geeigneten Meßvorrichtung "nachschauen", werden wir es überall mit gleicher Wahrscheinlichkeit finden. Wir sagen: Das Elektron ist über den ganze Kristall "ausgeschmiert". Das ist ein ziemlich ungewöhnliches Ergebnis, nicht vereinbar mit dem intuitiven Bild des Elektrons als eines kleinen Kügelchens. Man ist vielleicht geneigt, das als "Artefakt", als künstliches Ergebnis der Näherungen zu betrachten, aber das wäre genauso falsch, wie anzunehmen, dass das reale Kügelchen "Elektron" jetzt nur so schnell durch den Kristall saust, dass es uns verschmiert vorkommt (etwa so wie ein Flugeugpropeller, den man ja auch "verschmiert" sieht). Im Übrigen haben wir die Lösung eines verwandten Problems, nämlich das in einen zweidimensionalen runden Kasten eingesperrte Elektron, schon mal angeguckt! Die "ausgeschmierte" Wellenfunktion ist das Elektron; auch ohne Näherungen wird sich daran nicht viel ändern. Dem Elektron andere Eigenschaften oder Attribute zuzuschreiben, außer den in der Wellenfunktion codierten (und natürlich den Grundparametern Masse, Ladung, Spin), ist genau so sinnvoll, wie zu behaupten, dass das Elektron fromm sei, grün-rot gestreift, und an klassischer Musik interessiert. Man kann das tun, aber es ändert nichts an dem was man messen kann - und mehr als das existiert in der Physik schlicht nicht. Der Wellenvektor k ist aber kein beliebiger Vektor, sondern muß Bedingungen erfüllen, die aus den bisher nicht betrachteten periodischen Randbedingungen folgen. Wir erhalten für die Komponenten des Wellenvektorsk = (kx,ky,kz ) für die nur Lösungen existieren nx · 2π kx = ± ny · 2π ky = ± L nz · 2π kz = ± L L ni = 0, ± 1, ± 2, ± 3, ..... Dabei sind die nx, ny, nz natürliche Zahlen (inklusive der 0) - sie sind die Quantenzahlen des Systems. Jeder mögliche Satz von Quantenzahlen ni, oder, was gleichbedeutend ist, jeder mögliche k-Vektor, numeriert einen der möglichen Zustände des Systems. Damit haben wir eine erste Eigenschaft von k: Ein Wellenvektor beschreibt einen definierten Zustand des Systems; er ist eine Art vektorielle Quantenzahl. Weiterhin gehört zu jeder Lösung, definiert durch einen Satz ni bzw ki, eine ganz bestimmte (hier nur kinetische) Energie E; gegeben durch 2 · k2 Ek = 2me MaWi 2 Skript - Page 37 Bisher sind das allerdings nur Behauptungen. Daß wir hier wirklich die Lösung des gegebenen Problems haben, muß erst noch verifiziert werden. Dies ist aber eine rein mathematische Übung, die wir auch als Übung machen werden. Übung 2.2-1 Verfiziere den Lösungsansatz Wir diskutieren jetzt die Lösungen. Wichtig ist wie immer die Energie. Die Gesamtenergie eines Elektrons in Abhängigkeit von seinem Wellenvektor (bzw. für den damit beschriebenen Zustand) sieht also so aus: Das ist zwar eine triviale Kurve - halt Punkte auf einer Parabel - aber wir werden das Bildchen noch oft brauchen (und es wird zunehmend komplizierter werden). Energiewerte sind natürlich nur bei diskreten k-Werten definiert; zur Klarheit ist aber auch die durchgehende Parabel mit eingezeichnet. Funktionen dieser Art, die einen Zusammenhang zwischen einer Energie und einem Wellenvektor herstellen haben einen Namen: Sie heißen Dispersionfunktion oder Dispersionsrelation. Wir wollen uns, falls wir das schon wissen sollten, nicht daran stören, daß auch Beziehungen zwischen der Frequenz einer Welle und ihrer Wellenlänge so heißen, oder Beziehunge zwischen Energie und Impuls - es ist letztlich dasselbe, nur in anderer Form dargestellt. Haben wir z. B. eine Beziehung zwischen Wellenvektor k und Kreisfrequenz ω, macht durchmultiplizieren der Gleichung mit daraus eine Beziehung zwischen Impuls k und Energie ω. Setzt man für den Wellenvektor k die obige Beziehung in die Energieformel ein, ergibt sich als endgültige Lösung für die "Eigenwerte" der Energie 2 Enx, ny, nz = · 2me 2 π 2 L · n 2 x + ny2 + nz 2 Die Elektronen können in dem Potentialtopf also nur ganz gestimmte, diskrete Energien annehmen. Zu jedem Zustand charakterisiert durch einen Satz von 3 ni (oder einem k), gehört also eine bestimmte Energie. Da der Klammerausdruck mit den ni sich minimal um 1 unterscheiden kann falls man die ni variiert, haben die Energieniveaus mindestens den Abstand 2 ∆Emin = 2me 2π L 2 Allerdings, das sehen wir sofort, können verschiedene Zustände identische Energien haben - zum Beispiel die Zustände (1,1,1) und (-1,1,1) oder (2.2,1) und (3,0,0): Sie sind bezüglich der Energie entartet (es heißt nun mal so!). Im Grunde ist jetzt alles klar - außer, daß wir nicht so recht wissen, was sich hinter dem Wellenvektor k verbirgt. Er ist die zentrale Größe der Lösung - schau'n mer mal! Zunächst erinnern wir uns daran, daß die Energie des Elektrons rein kinetisch ist. Wir können die Energie damit auch wie folgt ausdrücken: m e 2 · v2 1 m e · v2 E = 2 = p2 = 2me MaWi 2 Skript - Page 38 2me Dabei ist p der (klassische) Impuls des Elektrons. Der Vergleich mit unserer Lösung zeigt sofort: p = ·k Der Wellenvektor, multipliziert mit " h quer", ist also nichts anderes als der Impuls des Elektrons - auch in der Quantenmechanik. Nun erinnern wir uns an die de Broglie Beziehung, die den Impuls p und die Wellenlänge λ verknüpfte: |p| = h/λ. Setzen wir das ein erhalten wir 2π p k = = h · λ h 2π = λ Der Wellenvektor ist also auch sowas wie die reziproke Wellenlänge der dem Elektron zugeordneten "Materiewelle". Der Wellenvektor ist aber noch viel mehr: Er beschreibt den jeweiligen Zustand des Elektrons: Denn in seiner durch die Lösung der S.-Gleichung erhaltenen Definition stecken die Quantenzahlen ni des Systems; mit k numerieren wir also auch in etwas codierter (und gleich vektorieller Form) den durch die Quantenzahlen beschriebenenZustand des System. Denn die Angabe des Wellenvektors eines Elektrons reicht vollständig aus um seinen Zustand (d.h. sein Energieniveau und seinen Impuls) eindeutig zu kennzeichnen. Diese Eigenschaft hat der Wellenvektor auch dann noch, wenn die einfache Beziehung zwischen Wellenvektor und Impuls/Energie verloren geht - was passieren wird, sobald wir die extrem simplifizierten Näherung des freien Elektronengases aufgeben. Er beschreibt die Richtung und Wellenlänge der Materiewelle: Denn der Ausdruck exp i(k ·r ) = cos (k · r ) + i · sin (k · r ) ist nichts anderes als die mathematische Codierung einer einfachen ebenen Welle. Die Beziehung 2π k = λ erhalten wir direkt aus dieser Gleichung - wir brauchen de Broglie gar nicht zu bemühen. Dies bedeutet im Umkehrschluß, daß die de Broglie Beziehung in unserer Lösung "drinsteckt"; sie ist kein unabhängiges Naturgesetz sondern in der Schrödingergleichung automatisch enthalten. Die Darstellung von Wellen aller Arten mit einem exp i(k ·r) Ausdruck ist in einem eigenen Modul dargestellt. Wer hier Schwierigkeiten hat, sollte diesen Modul dringend studieren! Fragebogen / Questionaire Multiple Choice Fragen zu 2.2.2 MaWi 2 Skript - Page 39 2.2.3 Zustandsdichte des freien Elektronengases Ableitung der Zustandsdichte Im vorherigen Unterkapitel haben wir die möglichen Zustände des Elektrons und die möglichen Energien des Elektrons bestimmt. Im folgenden werden wir uns der Frage widmen, wieviele Zustände es zueiner Energie gibt und zeigen, daß diese Anzahl der Zustände für verschiedene Energien unterschiedlich ist. Die Anzahl der Elektronenzustände pro Energie(intervall) und pro Volumeneinheit wird als Zustandsdichte bezeichnet. Zustandsdichten sind fundamentale Bestimmungsgrößen von Systemen wie z.B Kristalle, amorphe Körper, Hohlraumresonatoren für Schallwellen oder Lichtwellen, usw. Nochmal. weil's so wichtig ist: Die hier angesprochen Zustandsdichte ist ein reale Eigenschaft realer Materialien und Systeme, und nicht nur eine mathematische Definition in einem skurrilen Modell eines Kristalls. Sie inkorporiert die zentralen elektronschen Eigenschaften des Materials; ihre reale Wichtigkeit kann kaum überschätzt werden. Hier rechnen wir halt so gut wir können, wenn's nicht gut genug sein sollte, werden wir Zustandsdichten, wie immer, einfach messen! Für unser Modell des freien Elektronengases können wir die Zustandsdichte im Prinzip durch abzählen erhalten. Versuchen wir es mal. Gleichzeitig tabellieren wir, wieviele Elektronen in den Zuständen, die zu einer Energie gehören, Platz haben. (wobei wir immer daran denken, daß wegen des Pauli-Prinzips ein Zustand mit maximal zwei Elektronen ("Spin up" und "Spin down") besetzt werden kann. Quantenzustand Energie (× Konstante ) nx ny nz 0 0 0 0 ±1 0 0 0 ±1 0 0 0 ±1 1 ±1 ±1 0 ±1 0 ±1 0 ±1 ±1 2 ±1 ±1 ±1 3 ±2 0 0 0 ±2 0 0 0 ±2 4 Zustände Zahl der e– pro E 1 2 2 2 2 6 12 4 4 4 12 24 8 16 6 12 2 2 2 Weiter ohne Details 2 1 0 5 48 2 1 1 6 ? 2 2 0 8 ? 2 2 1 9 ? 3 0 0 und so wie weiter? Damit das ganz klar wird, zeichnen wir jetzt das Energie- und Besetzungsschema für die ersten 5 Zustände: MaWi 2 Skript - Page 40 Spannend - offenbar ist weder die Abfolge der Energieneiveaus noch die Zustandsdichte eine triviale Größe; jedenfalls ist aus der Abzählerei kein sofort erkennbares einfaches Bildungsgesetz ableitbar! Wir müssen anders vorgehen - wir brauchen den Zustandsraum. Wir definieren ihn erst mal, und sehen uns dann an, was man damit machen kann. Der Zustandsraum (auch k-Raum, Phasenraum oder Impulsraum genannt) ist der Raum, der von den Wellenvektoren aufgespannt wird. Man stellt sich ihn am einfachsten vor als ein kubisches Gitter mit den Basisvektoren kx = ky = kx = 2π 0 0 0 L 0 0 2π L 2π 0 L Die Einheitszelle hat dann ein Volumen VEZ = 2π 3 L Jeder erlaubte Zustand des freien Elektronengases entspricht damit einem Translationsvektor in diesem Gitter, der ja identisch ist mit einem der erlaubten Wellenvektoren 2π k = · ( nx, ny, nz ) L Nochmal: Der Endpunkt des k-Vektors definiert eine bestimmte Zelle des Zustandsraums und damit einen bestimmtem Zustand. In jede Zelle des Zustandraumes passen nach dem Pauli-Prinzip genau zwei Elektronenzustände, außerdem hat jede Zelle eine definierte Energie gegeben durch die bereits abgeleitete Formel 2 · k2 E = 2me Damit sehen wir sofort: Alle Zellen im Zustandsraum, die den gleichen Abstand zum Nullpunkt haben, d.h. dasselbe k2, gehören zur gleichen Energie. Anders ausgedrückt: Kugelschalen im Zustandsraum sind Flächen identischer Energie. MaWi 2 Skript - Page 41 Das schauen wir uns mal an: Darstellung eines Achtels des Zustandsraumes, der sich aus den eingezeichneten Zellen mit dem Volumen (2π / L)3 zusammensetzt. Das Kugelschalensegment ist eine Fläche konstanter Energie. Das Rezept zur Berechnung der Zustandsdichte ist jetzt klar - oder? Die Zahl der Zustände mit derselben Energie im Energieinterval E, E + ∆E ist schlicht die Zahl der Zellen in diesem Intervall. Im Zustandsraum entspricht das Energieintervall einer "Zwiebelschale" mit Dicke ∆k. Das wollen wir mal berechnen. Wir betrachten eine Kugel im Zustandsraum mit dem Radius k und dem Volumen V(k) = (4/3) · π · k3 Die Zahl N der Elektronenzustände in dieser Kugel ist gleich der doppelten Zahl der Zellen die in die Kugel passen, dividiert durch das Volumen der Einheitszelle; wir haben N = 2V(k)/VEZ oder 4π · k3 3 Vkrist · k3 N(k) = 2 · = 2π L 3π2 3 Vkrist = L3 ist dabei das Raumvolumen des betrachteten Kristalls; nicht zu verwechseln mit den Volumina im kRaum! Wir definieren jetzt formal dieZustandsdichte D(E): Sie ist gegeben durch die Zahl der Zustände in einer Kugelschale (= 2 × Zahl der Einheitszellen in der Kugelschale) pro Energieintervall und pro Volumen. Das ist aber nichts anderes als die Differenz der Zahl der Zustände in einer Kugel mit Radius E + ∆E und einer Kugel mit Radius E dividiert durch Energieinterval ∆E und (Kristall)volumen V = L3. In Formeln haben wir N(E + ∆E) – N(E) 1 D(E) = · Vkrist 1 = ∆E dN(E) · Vkrist dE Wir müssen jetzt nur noch N(k) von oben durch N(E) ersetzen - die Beziehung zwischen k und E haben wir - und erhalten MaWi 2 Skript - Page 42 Vkrist N(E) = 3π2 2 · me · E 2 3/2 Damit ergibt sich (durch Differenzieren) für die Zustandsdichte des freien Elektronengases (2 · me)3/2 · E 1/2 D(E) = 2 · π2 · 3 Das ist, wie wir noch sehen werden, ein erstes übergreifendes und sehr wichtiges Ergebnis aus unserem Modell des freien Elektronengas. Sehr befriedigend ist, daß sich das Volumen V = L3 des Kristalls herauskürzt - unser Ergebnis ist ganz allgemein, und nicht mehr von der willkürlichen Größe des Kristalls abhängig. Ansonsten haben wir eine Proportionalität von D zur Wurzel aus E - das sollten wir uns merken. Die Einheit der Zustandsdichte ist 1 [D(E)] = eV · cm3 Wenn man das Konzept des Zustandsraums erst mal kapiert hat, und sich an einige Grundbegriffe der Quantentheorie erinnert, wie z. B. die Heisenbergsche Unschärferelation, kann man die Zustandsdichte auch in wenigen Zeilen direkt ableiten; der Link zeigt wie es geht. Mit der so definierten Zustandsdichte D(E) und der obigen Formel (oder mit jeder anderen quantitativen Beziehung) können wir jetzt zum Beispiel die Volumendichte ze(E) der Elektronenzustände im Energieintervall {E, E + ∆E} oder die Zahl der Elektronenzustände g(E) in diesem Energieintervall ∆E ausrechen, es gilt einfach ze(E) = D(E) · ∆E g(E) = L3 · D(E) · ∆E Aussehen tut das ganze wie unten gezeigt. Aber zwei Punkte müssen noch erwähnt werden: Die Zustandsdichte ist, wenn man so will, eine doppelte Dichte: Sowohl Zahl der Zustände pro Energie als auch pro Volumen. Der letzte Punkt ist aber trivial, denn wir verwenden ja durchgehend spezifische Größen, also auch (fast) immer Volumendichten. Das Wort "Dichte" in Zustandsdichte meint deshalb immer die Dichte bezüglich der Energie. MaWi 2 Skript - Page 43 Damit ist eigentlich alles gesagt, aber es ist manchmal bequemer, die Zustandsdichte in einer Form auszudrücken, die N(E), d.h. die Gesamtzahl der Zustände bis zur Energie E als Variable enthält. Die entsprechende Formel ist mit einem kleinen Trick leicht abzuleiten. Wir nehmen den ln aus der Formel für die Zahl N(E) der Elektronenzustände bis zur Energie E und erhalten 3 ln N(E) = dN ⇒ · ln E + const. 2 3 = N dE · 2 E Daraus folgt sofort 1 dN 1 3N(E) D(E) = = V dE V 2E Das ist jetzt zwar ein geschachtelter Ausdruck, da N ja von E abhängt, aber viel einfacher (und allgemeiner) als die volle Formel. Wie realistisch ist die berechnete Zustandsdichte des freien Elektronengases, oder, in anderen Worten: Wie sehen die Zustandsdichten realer Elektronen in realen Materialien aus? Nun ja - meist ziemlich kompliziert; wir werden noch auf viele Beispiele stoßen. Der Verlauf über die Energie ist nicht eine schöne Parabelfunktion, sondern ein mehr oder weniger wildes Gezappel, bei dem aber die Parabel immer noch zugrunde liegt. Aber das macht nichts! Entscheidend ist: Es gibt eine wohldefinierte Zustandsdichte und sie errechnet sich im Prinzip auch wie gehabt. Nur unsere Wellenfunktionen, und damit die Verteilung der Zustände im k-Raum, sind komplizierter. Wir werden bald sehen, daß es für die meisten Fragestellungen auf die genaue Form der Zustandsdichte sowieso nicht ankommt - im Zweifel nehmen wir immer die einfache Funktion für das freie Elektronengas. Von einem Elektron zu vielen Elektronen Im Prinzip haben wir für ein Elektron gerechnet. Wir haben aber auch unterstellt, daß die Elektronen sich gegenseitig nicht "sehen", d.h. wir dürfen wie bei der Behandlung der Atome, jetzt viele Elektronen auf die vorhandenen Zustände verteilen, denn das Ergebnis gilt für jedes Elektron unabhängig von den anderen. Entsprechend dem Pauli-Prinzip werden alle Zustände des Zustandsraumes mit Elektronen besetzt, bis alle in dem betrachteten Festkörper vorhandenen Elektronen untergebracht sind. Es werden also alle Zustände einer Kugel mit einem maximalen Radius kF im Zustandraum aufgefüllt. Fängt man bei kleinen k- Werten an, hat man irgendwann - eben beim Radius kF - alle Elektronen untergebracht. Dann ist kF der maximale Impuls den ein Elektron haben wird. Dem maximalen Impuls kF der Elektronen entspricht dann eine maximale Energie; das ist die Energie des "letzten" Elektrons, das wir einfüllen (immer bei T = 0 K; wir werden gleich sehen warum das betont wird). Diese Energie nennen wir Fermienergie EF. Die Fermienergie eines Systems ist eine Zahl mit einer Einheit [eV], sie ist wie die Zustandsdichte (die eine Funktion ist) eine, wenn nicht sogar die fundamentale Größe eines Systems mit Elektronen. In der Kugel mit Radius kF lassen sich damit alle N Elektronen des Festkörpers der Größe L3 auf Elektronenzuständen unterbringen. Damit können wir die Fermienergie auch über kF ausdrücken, denn wir haben im freien Elektronengasmodell eine feste Beziehung zwischen E und k. Wir erhalten 2 · kF2 EF = 2me Wir können kF noch durch N/Vkrist = ne, der Volumendichte der Elektronen im System ausdrücken. Dazu müssen wir lediglich bemerken, dass der "Fermiewellenvektor" kF identisch ist mit dem Radius der Kugel im k-Raum, die gerade N Zustände (oder halb so viel Gitterpunkte) enthält. Die Gleichung dazu haben wir bereits, eingesetzt erhalten wir MaWi 2 Skript - Page 44 2 EF = 2/3 3π2 · ne 2me Mit ne = N0/ L3 = (Volumen)dichte der freien Elektronen (in m – 3) des betrachteten Systems. Da wir die Volumendichten der freien Elektronen halbwegs kennen (wir haben z.B ein Elektron pro Atom für Alkalikristalle, 2 für Erdakalikristalle usw.) könnten wir die Fermienergie jetzt sogar ausrechnen bzw. abschätzen. Das könnte aber (noch) nicht besonders sinnvoll sein, da sie sich ja auf einen recht willkürlich definierten Nullpunkt der Energieskala beziehen würde. Aber was soll's; Übung macht bekanntlich den Meister oder besser Master; man kann ja mal schnell rechnen Übung 2.2-2 Zahlenwerte für Fermienergie Weiterhin können wir (hier noch mehr spasseshalber) eine Fermitemperatur definieren, indem wir einfach die allgemeine thermische Energie kB·T gleich der Fermienergie setzen, das ergibt EF TF = kB kB ist dabei die Boltzmannkonstante; nicht zu verwechseln mit dem Wellenvektor!!! Wir werden aber das B an kB zukünftig wieder weglassen - k und k unterscheiden sich durch kursive und nicht kursive Schreibweise. Stellen wir die Ergebnisse noch schnell graphisch dar, erhalten wir das folgende Bild: Da sich im "Potentialtopf" sehr viele freien Elektronen befinden (bei einem Metallstück mit der Masse im GrammBereich ca. 1023 Elektronen), liegen die Energieniveaus sehr dicht. Die Energien des freien Elektronengases sind daher letztlich quasikontinuierlich verteilt. Das sieht zwar im obigen Bild nicht so aus (es gibt eher weniger Zustände mit zunehmender Energie), aber das ist (mal wieder) ein Artefakt der vereinfachten, nämlich eindimensionalen Darstellung. Dreidimensional sähe es ganz anders aus! Wir haben jetzt natürlich noch eine wesentliche Frage: Wir haben die Zustände von "unten" her kommend systematisch aufgefüllt, d.h. wir haben die Energie des Systems minimiert. Dies ist aber nur bei T = 0 K die richtige Minimierungsvorschrift! Wie ist nun die Besetzung der Zustände bei endlicher Temperatur, d.h. wenn wir dem System etwas thermische Energie zuführen und dann die Entropie, d.h. die für das Minimum der freien Enthalpie notwendige Unordnung, berücksichtigen müssen? Wir müssen jetzt die freie Enthalpie minimieren (wir setzen konstanten Druck voraus) - und das ist eine ganz andere Sache, wie wir schon früher gesehen haben. Die Frage ist leicht, die Antwort schwierig; sie führt uns auf das nächste Unterkapitel Fragebogen / Questionaire Multiple Choice Fragen zu 2.2.3 MaWi 2 Skript - Page 45 2.2.4 Zusammenfassung Kapitel 2.2 Vorbemerkungen: Hier sind absichtlich keine Links gesetzt. Wer hier etwas nicht sofort versteht, tut gut daran selbst aktiv zu suchen! Aus dem Potentialtopfmodell des Einzelatoms ergibt sich das periodische Potential des Kristalls. Mit diesem Potential wäre eigentlich die Schrödingergleichung für die (sehr vielen) Elektronen des Systems zu lösen - in der Praxis ist das aber nicht möglich. Wir machen die brutalstmögliche Näherung, die Näherung (= das Modell) des freien Elektronengases. Nur ein Elektron; Potential V = const = 0 im Kristall der Länge L. Periodische Randbedingungen: ψ(x + L, y + L, z + L) = ψ(x, y, z). Damit haben wir nur noch eine rein mathematische Aufgabe. Die Differentialgleichung fürψ ist vollständig lösbar, insgesamt haben wir Schrödingergleichung 2 – d2ψ(x) + V(x) · ψ(x) = E · ψ(x) · 2me Lösung ψ(r) = dx2 V = 0 ∞ 1 3/2 · exp (i · k · r) L innerhalbL ny · 2π sonst ny · 2π kx = ± nz · 2π ky = ± kz = ± L L L Randbedingungen ni = 0, ± 1, ± 2, ± 3, ..... ψ(x) = ψ(x + L) 2 · k2 ψ(y) = ψ(y + L) Enx, ny, nz = 2 = 2me · 2me 2 π2 L · n 2 x + ny2 + nz 2 ψ(z) = ψ(z + L) L = Länge des Potentialtopfes (= Kristall), k = Wellenvektor, n i = Quantenzahlen, E = Gesamtenergie = kin. Energie für V = 0 Was bedeuten diese Formeln? Eine erste ziemlich befremdliche Erkenntnis ist: Die Aufenthaltswahrscheinlichkeit der Elektrons, gegeben durch ψ · ψ* ist konstant - das Elektron ist "ausgeschmiert", es ist überall im Modellkristall mit derselben Wahrscheinlichkeit zu finden. Die zweite Erkenntnis ist: Die entscheidende Größe ist der Wellenvektor k. Er enthält die wesentliche Information über das System in etwas codierter, aber durch Vergleich mit klassischen oder mathematischen Strukturen leicht faßlichen Form. Im einzelnen gilt: Der Wellenvektor ist eine Art vektorielle Quantenzahl des Systems, d.h. er "numeriert" die ∞ vielen Lösungen. Ein spezifischer Wellenvektor sondert eine spezifische Lösung aus, er beschreibt damit einen der möglichen Zustände des System. Der Wellenvektor bestimmt den Impuls p des Elektrons; es gilt p = · k. Der Impuls ist gequantelt - es gibt zwar ∞ viel mögliche Impulse, aber halt nicht alle denkbaren (wie bei den ∞ vielen möglichen Lösungen desselben Problems in klassischer Behandlung). Der Wellenvektor bestimmt die Gesamtenergie des System; es gilt E ∝ k2. Der Wellenvektor hat die Funktion einer reziproken Wellenlänge λ; es gilt k = 2π/λ Die letzte Beziehung folgt direkt aus der Struktur der Lösung. ψ ∝ exp(i · k · r) beschreibt eine Welle (über exp(i · k · r) = cos(k · r) + i · sin(k · r). Führt man eine Wellenlänge ein, muß gelten sin(kx · x) = sin(2π· x /λ). Damit ist auch die de Broglie Formel in der Lösung direkt enthalten. MaWi 2 Skript - Page 46 Zur Lösung der zeitabhängigen Schrödingergleichung kommt man immer durch Multiplikation der Lösung der zeitunabhängigen Schrödingergleichung mit dem Phasenfaktor exp–(iω · t) (mit ω gegeben aus E = ω); man erhält damit die allgemeine Struktur einer laufenden ebenen Welle: ψ(r, t) ∝ exp(i (k r – ω t)) Die Energie ist bezüglich mancher Quantenzahlen entartet. Alle Kombinationen mit identischen k2 haben dieselbe Energie. Eine Zustandsdichte D(E) = Dichte der Zustände pro Energieintervall und Volumen ist definierbar und kann ausgerechnet werden - durch Abzählen, oder eleganter durch Volumenbetrachtungen im Zustandsraum, auch Phasenraum genannt. . Der Zustandsraum ist der Raum der von den Wellenvektoren aufgespannt wird; die möglichen Zustände bilden ein (kub. primitives) Gitter. Es ergibt sich eine "Wurzel"beziehung: (2 · m)3/2 · E 1/2 D(E) = 2· 3 · π2 Hat man die verfügbaren Zustände für Elektronen, kann man die vorhanden Elektronen auf diese Zustände verteilen - wie beim Atommodell. Bei T = 0 K spielt die Entropie keine Rolle, es wird nur die Energie minimiert. d.h. die Zustände werden "von unten kommend" sukzessive gefüllt, bis bei einer definiertenEnergie EF das letzt Elektron untergebracht ist. Diese Energie wird sich als ein zentraler Materialparameter entpuppen; sie heißt Fermienergie. Für eine gegebene (Volumen)dichte der Elektronen ne kann man die Fermienergie ausrechnen und erhält 2 EF = 2/3 2 3π · ne 2me Zur Fermienergie kann man weiterhin eine FermitemperaturTF und einen Fermiimpuls pF = Fermiwellenvektor kF definieren über die Beziehungen: EF = kB · TF · kF2 EF = 2me MaWi 2 Skript - Page 47 · kF bzw. 2.2.5 Merkpunkte Kapitel 2.2 Näherung (= Modell) des freien Elektrongases Nur ein Elektron; Potential V = const = 0 im Kristall der Länge L; periodischen Randbedingungen Ergebnis: Welle mit Amplitude (1/L)3/2 ψ(r) = 1 3/2 · exp (i · k · r) L Aufenthaltswahrscheinlichkeit überall gleich! Das Elektron ist "ausgeschmiert". ψ · ψ* = 1/L 3 Entscheidende Größe ist der Wellenvektor k. Er bestimmt direkt: Die "Nummer" (= Quantenzahlsatz) der Lösung. Den Impuls p = nx · 2π ny · 2π kx = ± ky = ± L nz · 2π kz = ± L L k. Die Gesamtenergie E ∝ k2. Die Wellenlänge λ = 2π/k. Die Energie ist bezüglich der Quantenzahlen entartet. Die Zustandsdichte D(E) mißt, wieviel Zustände ∆Ne sich in einem Energieintervall ∆E und im Volumen V befinden. ∆Ne = D(E) · ∆E · V Die Zustandsdichte ist über Abzählen im Phasenraum (= Raum der Wellenvektoren) leicht zu berechnen. (2 · m)3/2 · E 1/2 D(E) = 2· Beim Auffüllen der Zustände mit Elektronen (bei T = 0 K), wird bei einer definierten Energie - der Fermienergie EF - das letzte Elektron untergebracht sein. 3 · π2 2 EF = Für eine bekannte Elektronendichte ne ist die Fermienergie leicht berechenbar. 2/3 3π2 · ne 2me Zustandsdichte und Fermienergie sind für die elektronischen Eigenschaften realer Kristalle die wichtigsten Kenngrößen überhaupt! Sie sind immer noch wohl definiert, auch wenn die einfachen Modellformeln des freien Elektronengases für reale Kristalle modifiziert werden müssen! MaWi 2 Skript - Page 48 2.3. Besetzungswahrscheinlichkeit und Fermi-Statistik 2.3.1 Fragestellung und Weg zur Antwort Die klassische Antwort In unserem Modell des freien Elektronengas haben wir diskrete Energieniveaus bekommen, mit Energiewerten die wir ausrechnen konnten. Zu einem Energieniveau können - je nach Entartungsgrad - mehrere Zustände gehören. Wieviel genau, können wir exakt ausrechnen (im Zweifelsfall, wie gezeigt, durch die Abzählerei bzw. Kombinatorik) oder mit Hilfe der Zustandsdichte D(E) in sehr guter Näherung approximieren. Denn die Volumendichte ze(E) der Elektronenzustände und die Zahl der Elektronenzustände g(E) im Energieintervall ∆E war ze(E) = D(E) · ∆E g(E) = L3 · D(E) · ∆E Wir müssen jetzt nur das Energieintervall ∆E gleich dem (minimalen) Abstand der diskreten Energienieveaus machen um die Zahl der Zustände zu E (d.h. den Entartungsgrad) zu bekommen. Im freien Elektronengasmodell nehmen wir also 2 ∆E = 2π 2 2me L Die Unterscheidung zwischen Zahl und Volumendichte an Zuständen, Elektronen, oder sonstigen Teilchen ist trivial und lästig. Oft sagt und schreibt man auch gar nicht mehr immer was eigentlich gemeint ist - es ergibt sich zweifelsfrei aus dem Kontext oder spätestens bei einem Check der Maßeinheiten. Im Kontext dieses Unterkapitels muß man allerdings genau hinschauen, wie wir gleich sehen werden. Unser ein Elektron hat also viele Möglichkeiten sich einen Zustand, und damit verkoppelt eine Energie auszusuchen die Frage ist, ob wir vorhersagen können, welche der Möglichkeiten unter den gegebenen Umständen realisiert werden. Eine berechtigte Frage mit einer simplen Antwort: Ein Elektron wird auf dem energetisch niedrigsten Niveau sitzen.Wir wollen aber nicht nur ein Elektron betrachten, sondern viele. Dann wird die Sache komplexer. Wir haben bereits überlegt, daß das freie Elektronengasmodell sich nicht ändert, wenn wir nun viele Elektronen "einfüllen"; aber unsere Fragestellung ändert sich etwas: Zwar haben unsere vielen Elektronen nach wie vor viele Möglichkeiten sich jeweils einen Zustand, und damit verkoppelt eine Energie auszusuchen, aber mit der Eingrenzung, daß alle diejenigen Zustände "Tabu" sind, die bereits von einem anderen Elektron besetzt werden - das Pauli Prinzip schlägt zu! Die Frage ist jetzt, ob wir vorhersagen können, wie sich die vielen Elektronen auf die Zustände und damit auch auf die Energien verteilen. Wie immer, können wir für Systeme mit vielen Teilchen nur statistische oder Wahrscheinlichkeitsaussagen machen. Wir fragen also nun ganz präzise Wie groß ist die Wahrscheinlichkeit dafür, daß ein Zustand, d.h. ein Energieniveau mit der Energie E mit Elektronen besetzt ist? Wir haben uns diese Frage in leicht verschiedenem Kontext schon einmal gestellt, als wir nach der Wahrscheinlichkeit fragten, mit der eine Leerstelle oder ein beliebiges diffundierendes klassisches Teilchen, eine Energiebarriere der Höhe E überwindet. Das war gleichbedeutend mit der Frage mit welcher Wahrscheinlichkeit dieses Teilchen ein Energieniveau bei E besetzt, und führte auf die Boltzmannverteilung E N(E) = N0 · exp – kT Mit N(E) = Zahl der Teilchen mit der Energie E, und N0 = Gesamtzahl der Teilchen (wobei immer N << N0 unterstellt ist). MaWi 2 Skript - Page 49 Aber das war für klassische Teilchen, die prinzipiell unterscheidbar waren und von denen beliebig viele auf einen Zustand passen - es gibt kein Pauli Prinzip. Wir hatten die Formel auch nicht hergeleitet, sondern postuliert und nur festgehalten, daß diese Verteilung für klassische Teilchen immer die freie Enthalpie bzw. Energie minimiert. Wir hatten außerdem keine Aussagen darüber gemacht, wieviele Plätze es bei einer gegebenen Energie eigentlich gibt. Zunächst könnte man auch meinen, das sei egal - ich kann immer beliebig viele klassische Teilchen auf einem Energieplatz unterbringen - was sollte sich ändern, wenn es viele Plätze gibt? Dass es ganz so einfach nicht ist, wird sofort klar, wenn wir uns das im Matwiss I eingeführte Modellsystem mit zwei Minima der freien Enthalpie etwas genauer betrachten: Die finale Aussage dazu war: "Falls ein thermodynamisches System verschiedene angeregte Energiezustände Ei relativ zum Grundzustand E hat (mit E0 = Zustand mit der kleinsten Energie := 0), dann ist die Zahl der Teilchen Ni bei der Energie Ei gegeben durch Ni = N0·exp–(Ei/kT). Dabei dürfen wir in guter Näherung N0 ≈ Gesamtzahl der Teilchen setzen, falls Ni << N0 gilt." Daran ist auch nichts falsch - aber für etwas kompliziertere Systeme mit Energieentartung, müssen wir schon den Entartungsgrad, oder was fast dasselbe ist, die Zustandsdichte, auch berücksichtigen. Denn der Trick an der Sache war ja, dass eben nicht alle Teilchen bei der kleineren Energie sitzen, obwohl das nicht verboten ist. Die Entropie wäre zu klein. Durch die Anordnung einiger Teilchen auf einem andern Zustand kann man die Unordnung vergrößern, bezahlt dafür aber mit höherer innerer Energie. "Irgendwie" müßte dabei aber schon die Zahl der Plätze eingehen. Tut es auch - wir haben nur bisher immer stillschweigend angenommen, dass es immer gleichviele sind. Da das aber hier von untergeordneter Bedeutung ist, betrachten wir mehr Details dazu in einem eigenen Modul. Die Fermi-Dirac Verteilungsfunktion bei T = 0 K Was wir jetzt wissen wollen ist: Wie groß ist die Wahrscheinlichkeit dafür, daß ein Energieniveau mit der Energie E mit einem Elektron, d.h. mit einem nicht-klassischen Teilchen besetzt ist, für das das Pauli Prinzip gilt? Diese Wahrscheinlichkeit muß von der Energie E und der Temperatur T abhängen; wir nennen sie nach den "Entdeckern" die Fermi-Dirac Verteilungsfunktion oder Fermi-Dirac Statistik oder einfach Fermistatistik f(E,T) (Die Menschen im allgemeinen sind ungerecht, im besonderen selbst besserer Menschen, wie Physiker und Materialwissenschaftler: Niemand kennt die Nr. 2! Wer hat nach Neils Armstrong als zweiter den Mond betreten? Die Frage nach Nummer 3 war im übrigen die 1.000.000 € Frage in einer Fernsehshow im April 2005; es wurden sogar 4 Namen zur Auswahl gegeben). Genau wie bei der Boltzmannverteilung fordern wir, daß eine Verteilung der Elektronen nach derFermistatistik automatisch zum Minimum der freien Energie F = E – T · S (oder Enthalpie) führt; oder anders ausgedrückt: Im thermodynamischen Gleichgewicht sind die Elektronen nach der Fermistatistik verteilt. Das Pauli Prinzip macht die Sache im Grunde einfach: Für T = 0 K können wir f(E,T) sofort angeben: Da der Entropiebeitrag zur freien Energie/Enthalpie dann keine Rolle spielt, müssen wir jetzt nur die Energie minimieren, und das können wir dann und nur dann, wenn wir alle verfügbaren Plätze "von unten her", d.h. bei der kleinsten Energie beginnend nacheinander auffüllen. Dabei kommt auf jeden Zustand genau ein Elektron. Klassische Teilchen hätten wir natürlich alle auf das tiefste Niveau gesetzt. Bei einer endlichen Zahl von Elektronen ist irgendwo dann auch das letzte Elektron untergebracht, und das " wo" bezieht sich dabei sowohl auf die Quantenzahlen des letzten zu besetzenden Zustandes als auch auf die zugehörige Energie. Dazu wiederholen wir jetzt eine eminent wichtige Definition: Die Energie des letzten besetzten Zustandes bei T = 0 K heißt Fermienergie EF. MaWi 2 Skript - Page 50 Damit haben wir wieder die absolute Schlüsselgröße aller elektronischen Eigenschaften von Festkörpern eingeführt mit einer noch etwas naiven Definition von EF. Wir wollen uns diese Definition zwar gut merken, aber möglichst bald durch eine bessere Definition ersetzen. Die Fermienergie wird also sowohl von der Art und Verteilung der (Energie)zustände abhängen, als auch von der Anzahl der unterzubringenden Elektronen. Damit können wir die Fermistatistik für T = 0 K leicht graphisch darstellen: Unterhalb der Fermienergie EF sind alle Zustände mit Sicherheit besetzt, d.h. f(E,T) = 1; oberhalb EF sind alle Zustände mit Sicherheit nicht besetzt (oder "leer"), d.h. f(E,T) = 0. Wir haben eine klare Besetzungsschematik, die nicht nur minmale Energie liefert, sondern gleichzeitig größtmögliche Ordnung. Denn es gibt eben nur eine einzige Anordnungsmöglichkeit P zu diesem Zustand (die Vertauschung zweier Elektronen bringt nichts, da wir sie nicht unterscheiden können). Aus dem Spezialfall T = 0 K können wir noch viel Honig saugen, bevor wir zum allgemeinen Fall beliebiger Temperaturen übergehen. Als erstes wollen wir nochmals die Fermienergie berechnen. Das ist einfach. Wir betrachten ein Material, das die Zustandsdichte des freien Elektronengases hat, und das über N0 freie Elektronen verfügt. Diese müssen wir auf die verfügbaren Energiezustände unterbringen, das Energieniveau des letzten untergebrachten Elektrons definiert die Fermienergie. Wir müssen also nur in die bereits abgeleitete Formel für die Zahl der Zustände N(E) bis zur Energie E, N0 und EF einsetzen und nach EF auflösen um für die Fermienergie (des freien Elektronengases) zu finden 2 EF = 2m e 3π2 · N0 V 2 2/3 = 2m e 3π2 · ne 2/3 Das ist schon eine ganz brauchbare Formel - sie enthält keinerlei Unbekannten mehr - und im Übrigen hatten wir sie schon! Für Alkalimetalle, zum Beispiel, wissen wir, daß wir genau ein freies Elektron pro Atom haben. Die Dichte an freien Elektronen ne = N0 / V ist also bestens bekannt und wir können die Fermienergie ausrechnen. Wie sinnvoll wäre das? Nun, das war Inhalt der Übung 2.2-2. Es ist schon sinnvoll (Übung ansehen!) aber nicht besonders, aus zwei Gründen: 1. Haben wir keine Ahnung, wie gut die Zustandsdichte des freien Elektronengases die wahre Zustandsdichte eines Alkalimetalls repräsentiert, und 2. Wir haben einen ziemlich willkürlichen Nullpunkt unserer Energieskala gewählt. Das Ergebnis - in [eV] - ist genauso willkürlich. Zum ersten Punkt sind uns die Hände gebunden - wir werden weder jetzt noch später bessere Zustandsdichten rechnen können - aber das zweite Problem läßt sich leicht beheben. Dazu nehmen wir unser altes Potentialtopfmodell für das freie Elektronengas und definieren einen neuen Nullpunkt für die Energieachse: Rechts sind die Energieniveaus eingezeichnet, die wir zwischenzeitlich ausgerechnet haben; der blaue Kasten symbolisiert das Quasikontinuum, das sich bei etwas höheren Energien ergibt (und das auch oberhalb der roten Linien auch noch da wäre). Die Fermienergie als letztes besetzes Niveau (immer noch bei T = 0 K) ist als gelbe Linie markiert. Die rote Linie definiert unseren neuen Energienullpunkt. MaWi 2 Skript - Page 51 Es ist die "Vakuumenergie" der Elektronen, d.h. die Energie die man gewinnt, wenn man aus dem "Vakuum", d.h. von weit her, ein Elektron auf eines der Niveaus im Kristall setzt. Umgekehrt ist es genau die Energie, die man braucht um ein Elektron vom Inneren des Kristall ins "Unendliche" zu bringen. Damit ist die Bedeutung der Fermienergie schlagartig klar: Es ist die kleinstmögliche Energie, die man braucht, um ein Elektron aus dem Kristall ins "Unendliche" zu bringen. Für ein einzelnes Atom war das schlicht die Ionisationsenergie I, für einen ganzen Kristall (oder jeden beliebigen Festkörper) nennen wir diese Energie "Austrittsarbeit"; oft abgekürzt mit "W" (für das englische "Workfunction"). Im Moment könnten wir statt "Austrittsarbeit" auch Fermienergie sagen - aber wir werden noch sehen, daß das Konzept der Fermienergie tiefer geht als die Definition einer Meßgröße - denn mehr ist die Austrittsarbeit erst mal nicht. Die Austrittsarbeit bezieht sich auf einen Kristall, und die Ionisationsenergie bezieht sich auf die einzelnen Atome der Basis des Kristall; die Zahlenwerte werden also unterschiedlich sein - aber wohl nicht sehr! Damit kennen wir die Größenordnung der Fermienergie in einem System mit der Vakuumenergie als Nullpunkt der Energieskala (und dem "Pfeil" der positiven Energierichtung nach unten): Sie wird so zwischen (2 ... 25) eV liegen. Zum Schluß betrachten wir noch die Zustandsdichte bei der Fermienergie; auch dafür haben wir bereits die passende Formel. 1 D(EF) = 3N0 · V 2EF Wir haben N0 in der Formel weil eben bei der Fermienergie alle N0 Elektronen untergebracht sind. Allerdings gilt das alles erstmal nur bei T = 0 K. Dann haben wir maximale Ordnung, die Entropie ist Null, und wir müssen nur die Energie minimieren. Für T > 0 K gilt das alles aber nicht mehr. Zum Minimum der freien Enthalpie gehört dann eine endliche Entropie, je höher die Temperatur, umso mehr Entropie und damit Unordnung wird gebraucht. Die einzige Art Unordnung zu machen, ist nicht mehr alle Plätze bei einer gegebenen Energie voll zu besetzen. Nimmt man zum Beispiel 3 Elektronen aus einem Energiezustand mit 10 Plätzen heraus, kann man die verbleibenden 7 Elektronen jetzt auf mehrere Arten auf die 10 Plätze verteilen - wir haben Unordnung geschaffen. Allerdings hat alles seinen Preis: Die herausgenommen Elektronen müssen wir woanders unterbringen - und Platz ist nur bei den bisher unbesetzten Niveaus mit höherer Energie. Schaffung von mehr EntropieS ist also mit einer Erhöhung der Energie E verbunden - nur bei definierten Werten von E und S wird sich ein Minimum von F = E – T·S finden Im nächsten Unterkapitel werden wir uns diese Thematik näher anschauen. Fragebogen / Questionaire Multiple Choice Fragen zu 2.3.1 MaWi 2 Skript - Page 52 2.3.2 Besetzungswahrscheinlichkeit und Fermi-Dirac Statistik Die Grundlagen zur Ableitung der Fermi-Dirac Statistik Bei endlicher Temperatur (T > 0K) wird die Besetzung der möglichen Energieniveaus der freien Elektronen durch die Thermodynamik geregelt. Der Gleichgewichtszustand des Elektronensystems ist durch das Minimum der freien Enthalpie G = H – TS gekennzeichnet. Bei endlichen Temperaturen bedeutet das, daß nicht alle Plätze unterhalb der (für T = 0 K) definierten Fermienengie besetzt sein können, denn nur so kann Unordnung im Elektronensystem des Kristalls zustande kommen. Was wir gerne wissen möchten ist: Mit welcher Wahrscheinlichkeit sind irgendwelche Zustände bei der Energie E und Temperatur T besetzt, denn mehr als Wahrscheinlichkeitsaussagen können wir nicht erwarten. Wir kennen die Antwort auf diese Frage für klassische Teilchen im Allgemeinen, und für Fermionen, also Teilchen, die dem Pauli Prinzip gehorchen müssen, für den Sonderfall T = 0 K. Wir suchen jetzt also die Fermi-Dirac Verteilungsfunktion f(E, T) für beliebige Temperaturen. Die Suche ist nicht so einfach; das Ergebnis aber schon. Wir werden die Herleitung hier nicht schaffen, denn dazu bräuchten wir komplexe mathematische Werkzeuge (Variationsrechnung, Methode der Lagrangen Parameter), ziemlich viel formale Thermodynamik und ziemlich viel Zeit. Wir werden aber einige Elemente der Herleitung etwas genauer ansehen, denn dabei kann man viel über das Wesen des Gleichgewichts im Elektronensystem und über die Eigenschaften der Fermi-Dirac Verteilung lernen. Zunächst überlegen wir uns qualitativ, wie die Fermi-Dirac Verteilungsfunktion notwendigerweise aussehen muß. Dazu betrachten wir als Einstieg ein Modellsystem mit konstanter Zustandsdichte D = 10 eV–1 (wir schenken uns das m –3 in der Dimension) bei T = 0 K und T > 0 K. In diese System stecken wir 90 Elektronen. Wir könnten auch D = 1011 eV –1 und 1012 Elektronen (oder jede beliebige ander sinnvolle Kombination) nehmen, aber das muss dann jemand anders zeichnen. Also immer wieder: Prinzipzeichnungen nicht mit der "Realität" verwechseln! In jedem Zustand, gekennzeichnet durch eine Energie E, kann man also maximal 10 Elektronen unterbringen. In Diagramm entspricht ein Platz für ein Elektron damit einem Kästchen. Die Verteilung der Elektronen auf die Zustände bei T = 0 K ist klar. Alle Zustände bis zur Fermienergie sind besetzt; danach ist alles leer. Insgesamt gibt es genau eine Möglichkeit, alle 90 Elektronen unterhalb der Fermienergie unterzubringen; oberhalb gibt es ebenfalls genau eine Möglichkeit, die Elektronen nicht unterzubringen Wir haben also größtmögliche Ordnung, da wir nur einen Mikrozustand haben um die gewünschte Anordung zu realisieren. Das ist gleichbedeutend mit einem Zustand minimaler Entropie. Bei einer endlichen Temperatur T1 müssen wir aber etwas Unordnung erzeugen, um zum Minimum der freien Enthalpie zu gelangen - bei möglichst minimaler Energieerhöhung. Dazu müssen wir aus einem besetzten Energieniveau einige Elektronen herausnehmen und ungern, aber notgedrungen, auf bisher unbesetzte Niveaus bei höheren Energien unterbringen. Es ist klar, daß wir das bei den höchsten besetzten Energieniveaus machen, und die freigesetzten Elektronen auf die niedrigsten unbesetzten Niveaus bringen. Qualitativ wird das so aussehen wie mit der roten Kurve gezeigt - wir haben insgesamt vier Elektronen umgeordnet. Die orange Kurve zeigt das ganze bei höherer Temperatur und deshalb mit noch mehr Unordnung. Wir können aber auch eine quantitative Aussage dazu machen - wir können nämlich den Grad der erzeugten Unordung und die gesamte Energie für die gezeigte Anordnung relativ leicht berechnen. Zunächst müssen wir dazu die Frage beantworten: Wieviele Möglichkeiten PE gibt es, n (ununterscheidbare) Elektronen auf die NE Plätze bei der Energie E anzuorden; in unserem Beispiel ist N = 10. Das ist die Frage, die wir uns schon bei der Berechnung der Leerstellenkonzentration gestellt und beantwortet haben, das Ergebnis war MaWi 2 Skript - Page 53 NE! PE = n! · (NE – n)! Wir haben damit aber erst den Beitrag einer "Energiesäule", eines Zustands, zur Gesamtentropie. Wir brauchen aber P, die Zahl aller Anordnungsmöglichkeiten. Natürlich sagt uns die elementare Kombinatorik wie das geht, aber man kann sich das ganz schnell auch selbst klarmachen. Wieviele Möglichkeiten gibt es für die Bildung einer einstelligen Zahl unter der Verwendung der üblichen Ziffern? Richtig, 10 Möglichkeiten. Für eine zweistellige Zahl? Richtig - 10 · 10. Und so weiter Wir haben also für P, die Gesamtzahl der Möglichkeiten n Elektronen auf je N Plätzen bei diskreten Energien Ei zu verteilen Ni! P = ∏ i ni! · (Ni – ni)! Die Gesamtzahl der Möglichkeiten ist also das Produkt über all die individuellen Möglichkeiten beim Energieniveau Nr. i, das Ni Elektronen Platz bietet und auf das wir ni Elektronen verteilen. Die Formel gilt natürlich auch für unser Beispiel, in dem wir Ni = const. = 10 hatten; aber sie ist viel allgemeiner und gilt für jedes Ni und ni. Damit können wir die Entropie S für unser Beispiel (und für jedes andere auch) jetzt berechnen; es gilt wie immer S = k · ln P Die Energie E ist sowieso klar, es gilt natürlich E = Σ ni · Ei und damit können wir die freie Enthalpie für jede gegebene Anordnung berechnen. Wir haben damit nur nicht die Anordnung mit dem Minimum der freien Enthalpie gefunden. Wir können aber aus dem simplen Beispiel noch weitere Aussagen über f(E,T) gewinnen. Die Zahl der Anordnungsmöglichkeiten in einem Energieniveau ist minimal (d.h. = 1) falls ni = Ni oder ni = 0. Sie ist maximal für ni = ½ Ni. Das sollte man sich selbst mal in Ruhe überlegen (oder mit der Stirlingschen Formel und einer Max-Min Rechnung beweisen). Das bedeutet, daß wir die bei T = 0 K besetzten Bereiche der Energieniveaus nie unter einen Besetzungsgrad von ½ sinken lassen werden, denn das würde die Energie ansteigen lassen bei sinkender Entropie! Wir werden weiterhin versuchen, größtmögliche Entropie bei den höchsten besetzen Niveaus zu produzieren, d.h. bei der Fermienergie. Damit ist schon fast zwingend klar, daß unsere Fermi-Dirac Verteilung bei E = EF den Wert ½ haben wird 1 f(E = EF, T) = 2 Eine letzte allgemeine Aussage: Die Elektronen, die wir aus Energieniveaus E < EF herausnehmen, müssen wir bei Energien E > EF wieder einbauen - denn die Teilchenzahl muß erhalten bleiben. Und genauso wie wir nur bei den höchsten besetzten Energienieveaus Unordnung machen werden, wird der Einbau bei den tiefsten nicht besetzten Energieniveaus erfolgen - wir haben das bereits festgestellt. Denkt man darüber nach, erkennt man, daß der Fermiverteilung (wir lassen ab jetzt ungerechterweise Herrn Dirac weg) keine große Wahl bleibt - sie wird wohl für jede Temperatur T punktsymmetrisch um den Punkt f(EF, T) herum sein müssen: f(EF + ε, T) = 1 – f(EF – ε, T) Wir können noch eine allerletzte Vermutung äußern: Bei endlichen Temperaturen steckt im System von der Größenordnung her die (zusätzliche) thermische Energie kT. Das ist, so können wir mit einiger Plausibilität vermuten, so ungefähr der Energiebetrag, um den wir die innere Energie E bei T erhöhen können, da die zugehörige Entropie die Energieerhöhung über das–T · S kompensiert. Das bedeutet aber nichts anderes anderes, als daß die " Aufweichungszone" in der Fermiverteilung - der Bereich, in dem f(E, T) ≠ 0 oder ≠ 1 ist - in der Größenordnung von kT liegen wird. Alles in allem: qualitativ muß die Fermi-Verteilung so aussehen wie oben eingezeichnet. Bei zunehmenden Temperaturen wird die "Aufweichungszone" größer, aber solange f(E = 0, T) ≈ 1 gilt, werden wir f(EF, T) = ½ haben. MaWi 2 Skript - Page 54 Und damit haben wir die Fermiverteilung für endliche Temperaturen schon ganz schön eingekreist! Wir brauchen jetzt nur noch eine Formel. Zur Berechnung der Fermi-Dirac Statistik Wir brauchen einen Ausdruck, der die freie Enthalpie beschreibt als "Funktion" der Fermi-Verteilung. Dabei wollen wir auch die Zustandsdichte des zu beschreibenden Systems verwenden, denn D(E) ist uns jetzt als eine der fundamentalen Funktionen bekannt, die ein Elektronensystem beschreiben. Zum "Rechnen" benutzen wir die Formel für die Zustandsdichte des freien Elektronengases; wenn wir es genau wissen möchten, verwenden wir die richtige, d.h. in der Regel gemessene Zustandsdichte. Die Zustandsdichte gibt uns letztlich das Ni der obigen Überlegungen - wir haben aber ein kleines Problem: Bei der Ableitung der Zustandsdichte über den Phasenraum, haben wir stillschweigend aus diskreten Energieniveaus ein Kontinuum gemacht; es wurde des öfteren schon als "Quasikontinuum" angesprochen. Wir müssen, um die Kombinatorikformeln verwenden zu können, jetzt wieder diskrete Energieniveaus, gekennzeichnet durch den Index "i" einführen, und das tun wir indem wir alle Zustände in einem festen Energieintervall ∆E der in der Mitte des Intervalls sitzenden Energie Ei zuschreiben. Aus der Definition der Zustandsdichte D(E) haben wir 1 D(Ei) = dN(E) ≈ · V ∆N(E) 1 dE · ∆E V Damit können wir die Zahl Ni der Plätze für Elektronen auf dem artifiziellen Energieniveau beiEi wie folgt schreiben Ni = ∆N(Ei) = V · D(Ei) · ∆Ei Wir können also die Formeln wie oben geschrieben verwenden, müssen dann aber gelegentlichNi durch V · D(Ei) ·∆E ersetzen. Das Ganze ist im wesentlichen nur ein mathematischer Trick, denn wir müssen für die diversen Näherungen, die wir später brauchen werden, sicherstellen, daß Ni nicht zu klein wird. Hier steckt aber, und das sei deutlich gesagt, ein Stückchen Willkür. Allerdings spielt diese Willkür im Endergebnis keine Rolle - wir werden sehen. Wir schreiben nun den Energie- und Entropieterm mit Hilfe der Fermi Verteilung. Dazu müssen wir nur ni ersetzen durch Ni · f(EF, T). In Worten, weil das so wichtig ist: Die Zahl ni der Elektronen, die Ni Plätze bei der Energie E und Temperatur T besetzen, ist gleich der Zahl Ni der vorhandene Plätze mal der Wahrscheinlichkeit, daß sie besetzt sind. Damit erhalten wir für Entropie und Energie S = k · ln P = k · ln ∏ i Ni! = ni! · (Ni - ni)! k · ln ∏ i Ni! {Ni · f(Ei, T)}! · {Ni - Ni · f(Ei, T)}! E = ΣNi · f(Ei, T) · Ei Damit können wir die freie Enthalpie G = E – TS hinschreiben - wir verzichten aber darauf, das ganze sieht auch so schon schön schaurig aus. Wie geht es weiter? Die freie Enthalpie hängt jetzt von einer unbekannten Funktion ab; sie ist ein Funktional. Wir suchen die spezielle Funktion f(E, T), für die G(E, T) ein Minimum wird. Das ist die gute alte Minimum-Maximum Kurvendiskussion auf einer höheren Ebene - die zugehörige mathematische Disziplin heißt Variationsrechnung und führt nicht auf algebraische Gleichungen, sondern auf Differentialgleichungen. Wer das in Mathe nicht gelernt hat (oder schon wieder vergessen hat) schaut schnell im " Feynman" nach (Band II, Kapitel 19). Aber das Prinzip ist ganz einfach: Wir "wackeln" ein bißchen an G, und schauen, wie G darauf reagiert. Das "Wackeln" macht man, indem man die Variablen in G differentiell ein wenig ändert. Ändere ich zum Beispiel die Zahl ni der Elektronen im E-Niveau Ei ein wenig, wird sich die Änderung oder Variation δG von G nach den allgemeinen Prinzipien der Differentialrechnung so darstellen: MaWi 2 Skript - Page 55 ∂G δG = · δni ∂ni Wir benutzen ein extra Zeichen (das "δ") für "Variation", aber es ist im Grunde nichts anderes als das totale Differential. Die entscheidende Erkenntnis ist nun: Falls δG ≠ 0 ist, haben wir kein Minimum. Denn das bedeutet, daß die freie Enthalpie sich vergrößert oder verkleinert, falls wir die Teilchenzahl im i-ten Niveau etwas ändern; G kann also nicht im Minimum sein. Das gilt für alle i; die Forderung nach dem Minimum der freien Enthalpie ist also ∂G Σ δG = i · δni = 0 ∂ni Das ist im übrigen nicht neu - wir hatten das schon in etwas anderem Zusammenhang. Wir gehen jetzt aber einen Schritt weiter, und schauen uns das Ganze im einfachst möglichen Modellsystem an - ein Gebilde mit nur zwei E-Niveaus, d.h. i "läuft" von 1 bis 2 Damit gilt für das Gleichgewicht ∂G ∂G · δn1 · δn2 = – ∂n1 ∂n2 Das reicht aber noch nicht, denn wir müssen zusätzlich berücksichtigen, daß die Elektronenzahl konstant ist. Was ich aus Niveau 1 herausnehme, muß ich in Niveau 2 hineintun, und umgekehrt. Wir haben also als Nebenbedingung δn1 = – δn2 Daraus folgt sofort als andere Form der Gleichgewichtsbedingung: ∂G ∂G = ∂n1 = const. = µ ∂n2 Die das Gleichgewicht charakterisierende Größe µ heißt "Chemisches Potential" - auch das hatten wir schon. Wir können jetzt schnell von 2 E-Niveaus auf beliebig viele verallgemeinern: Da wir ohne Beschränkung der Allgemeinheit alle δn2 bis auf zwei immer = 0 setzen können, muß im Gleichgewicht immer gelten ∂G = const. = µ ∂ni Das hat eine überaus wichtige Konsequenz für uns: Die Gleichung sagt, daß das chemische Potential der Elektronen in allen Energiezuständen überall im Kristall gleichgroß sein muß. Das "überall im Kristall" bezieht sich jetzt explizit auf den Ort. Egal wo die Elektronen sich herumtreiben, ihr chemisches Potential ist im Gleichgewicht überall dasselbe. Big Deal! Was nützt das? Woher kennt man das chemische Potential und was nützt dieser Spruch? - Geduld; wir kommen gleich dazu. Wir könnten jetzt zur Lösung der Variationsaufgabe schreiten, wobei wir nicht nur die Formel für die freie Enthapie in voller Schönheit aufschreiben und differenzieren müßten, sondern auch nochTeilchenzahlkonstanz (und darüberhinaus noch Gesamtenergiekonstanz bei der gewählten Temperatur) als Nebenbedingungen berücksichtigen müssen. MaWi 2 Skript - Page 56 Das kann man zwar mit der Methode der "Lagrangeschen Parameter" relativ elegant machen; aber der Rechenaufwand ist doch ziemlich heftig; außerdem muß man noch ein paar tiefe Kenntnisse thermodynamischer Zusammenhänge hineinstecken. Wir springen deshalb direkt zum Ergebnis und erhalten eine der wichtigsten Formeln der Materialwissenschaft und Physik 1 ni = Ni · exp Ei – µ + 1 kT In Worten: Die Zahl ni (oder, fallls wir durch das Volumen V dividieren, die Volumendichte) der Elektronen die im thermodynamischen Gleichgewicht Ni Plätze (oder Platzdichten) bei der Temperatur T besetzen, ist gleich der Zahl (oder Dichte) der vorhanden Plätze mal einer Funktion, die als Variablen nur die Energie Ei der betrachteten Plätze und die Temperatur T enthält sowie als Parameter das chemische Potential µ des betrachteten Systems. Darüber hinaus erhalten wir noch eine weitere wichtige Beziehung die zwar nicht ganz allgemein gilt, aber für alle uns interessierende Fälle sehr gut stimmt: µ = EF Dabei ist mit EF durchaus die für T = 0 K definierte Fermienergie gemeint, also eine wohldefinierte Größe. Wir sind also das chemische Potential, das uns leichtes Unbehagen verursacht, schon wieder losgeworden. Allerdings auf Kosten der ganz großen Allgemeinheit, da die obige Gleichung nicht in voller Strenge gilt, sondern nur für die uns hier interessierenden Fälle. Mehr zum chemischen Potential findet man in einem eigenen Modul Vergleichen wir das Ergebnis mit der Definition der Fermi Verteilung wie sie implizit in einer der obigen Formeln steckt, erhalten wir das Endergebnis 1 f(E, T) = exp E – EF kT MaWi 2 Skript - Page 57 + 1 Einige Bemerkungen zur Fermiverteilung und ihrer Herleitung Die Fermiverteilung enthält nicht ∆E, das etwas willkürlich gewählte Energieintervall, um vom Quasikontinuum der Energiezustände in der Zustandsdichte zu diskreten Niveaus zu kommen. Wir haben damit also kein Problem mehr, die Fermiverteilung gilt willkürfrei ganz allgemein und in voller Strenge. Die mathematische Form der Fermiverteilung ist die einfachste Formel, die man sich denken kann um eine Funktion zu beschreiben, die bei T = 0 K sprungartig von 1 auf 0 übergeht, bei endlichen Temperaturen aber "sanft", wie oben qualititativ gezeigt. Sie hat einfach all die Eigenschaften, die wir uns schon qualitativ klar gemacht haben. Es dürfte schwer sein, eine einfachere Formel zu finden, die diesen Sachverhalt ausdrückt. Wir müssen Mutter Natur also dankbar sein, daß sie den mathematischen Aufwand minimiert hat. Daran wollen wir uns erinnern, wenn wir die mathematischen Tücken zu spüren bekommen, die dann schon noch kommen werden. Mit der Fermiverteilung können wir die Fermienergie EF jetzt neu definieren: EF folgt aus 1 f(EF, T) = 2 Auch das haben wir uns schon qualitativ überlegt. Diese Definition ist viel allgemeiner als die alte Definition, nach der Fermienergie identisch ist mit der Energie des bei T = 0 K letzten besetzten Platzes. Beide Werte für EF sind aber für halbwegs "normale" Kristalle identisch, wie wir im nächsten Unterkapitel sehen werden. Für die Ausnahmen gibt es einen eigenen Modul. Fragebogen / Questionaire Multiple Choice Fragen zu 2.3.2 MaWi 2 Skript - Page 58 2.3.3 Eigenschaften Fermi-Dirac Statistik und erste Anwendungen Zunächst betrachen wir das Grenzverhalten für T ⇒ 0 K Wir bekommen 1 Für E – EF = ∆E < 0 : f(E, 0K) = = 1 exp (– ∞) + 1 1 Für E – EF = ∆E > 0 : f(E, 0K) = = 0 exp (+ ∞) + 1 Das ist genau das, was wir brauchen. Es ist nun verhältnismäßig einfach, die Fermiverteilung für eine gegebene Temperatur und Fermienergie auszurechnen. Man erhält eine Kurve wie folgt: Das Rechteck bei T = 0 K bekommt mit steigender Temperatur zunehmend eine weiche Flanke; genauso wie wir es vorhersagen konnten. Der "weiche" Bereich oder die "Aufweichungszone" hat dabei eine Breite von ungefähr 4 kT. Auch das entspricht der Vorhersage - aber jetzt können wir es ausrechnen; wir wollen das auch in einer Übungsaufgabe tun. Wir können weiterhin vermuten, daß der "Hochenergieschwanz" der Fermiverteilung durch die Boltzmannverteilung approximiert werden kann. Für E >> EF gilt E – EF f(E,T) ≈ exp – kT Das diese Beziehung stimmt, wird ebenfalls in der folgenden Übungsaufgabe gezeigt. Übung 2.3-1 Eigenschaften der Fermiverteilung Wir wollen eine Grundeigenschaft der Fermieverteilung noch mal wiederholen: Sie regelt die Verteilung von Fermionen auf verfügbare Energieplätze im Gleichgewicht. Daraus folgt im Umkehrschluß 1. Die Fermiverteilung und damit insbesondere die Fermienergie (ein anderes Wort für chemisches Potential) ist nur für das Gleichgewicht überhaupt definiert. 2. Damit muß im Gleichgewicht die Fermienenergie überall im Material konstant sein. Eine weitere, mehr abstrakte Eigenschaft soll noch angesprochen werden: MaWi 2 Skript - Page 59 Wir haben die Fermienergie definiert als die Energie, bei der f(EF,T) = ½. Damit ist die Wahrscheinlichkeit, daß ein Energieniveau bei der Fermienergie besetzt ist, genau ½. Es ist aber grundsätzlich möglich, daß es in der Umgebung der Fermienergie gar kein Energieniveau gibt. In anderen Worten: Die Fermienergie kann ohne weiteres in einem Energiebereich liegen, in dem die Zustandsdichte "zufällig" gerade = 0 ist. Oder noch mal anders formuliert: Die Fermiverteilung gibt nur die Wahrscheinlichkeit an, daß die bei der Energie E vorhandenen Plätze besetzt sind. Wie groß die Zahl der Plätze ist, vielleicht sogar Null, hat mit der Fermiverteilung nichts zu tun. Die Volumendichte n(E) = N/V der Teilchen die auf den Plätzen bei E sitzen, oder die Zahl N(E) ist immer gegeben durch Dichte der Plätze mal Wahrscheinlichkeit der n(E) = Besetzung mal Energieintervall = N(E) = D(E) · f(E,T) · ∆E D(E) · f(E,T) · ∆E · V Das ist eine Schlüsselformel! Sie gilt für alle Systeme mit Fermionen! Wir schreiben sie mal genau so pompös auf, wie früher die Boltzmanverteilung: Falls ein thermodynamisches System vieler freier Elektronen verschiedene Energiezustände E hat, mit D(E) besetzbaren Plätzen bei E, dann ist im thermodynamischen Gleichgewicht die (differentielle) Teilchendichte d(n(E)) /dE bei der Energie E gegeben durch 1 dn(E) = dE · D(E) · exp Ei – EF kT +1 Dabei ist D(E), die Zustandsdichte, eine für das System charakteristische Funktion, und EF, die Fermienergie, eine für das System charakteristische Energie (= Zahl). Die Anwendung dieser Gleichung auf das Modell des freien Elektronengases liefert die folgende Graphik und Formel (2 · me)3/2 · E 1/2 n(E) = 2 · π2 · MaWi 2 Skript - Page 60 3 · ( exp Ei – EF kT + 1) Wir erkennen ein gewisses Problem: Obwohl die Materie glasklar ist, und die entsprechenden Graphiken leicht zu konstruieren sind, werden die Formeln schon für den allereinfachsten Fall des freien Elektronengases etwas unhandlich! Das soll uns aber nicht schrecken, denn um mit länglichen Formeln einfach umgehen zu können, haben die Materialwissenschaftler den Si-Chip erfunden und auf Höchstleistung trainiert! Jeder handelsüblichePC oder Laptop mit einem einfachen Matheprogramm macht das mit Links! Wir können jetzt sofort die entscheidenden Gleichungen für alles weitere aufschreiben: Die Gesamtzahl N bzw. die Dichte n aller Elektronen im System muß per definitionem gegeben sein durch ∞ n = ⌠ D(E) · f(E,T) · dE ⌡ 0 Die Zahl N(E1, E2) bzw. Dichte n der Elektronen, die sich im Energieintervall (E1, E2) befinden, ist entsprechend E2 ⌠ D(E) · f(E,T) · dE ⌡ n(E1, E2) = E1 Die gesamte Energie Eges(E1, E2), die auf die Elektronen im Energieintervall (E1, E2) entfällt ergibt sich damit (pro Volumen) ganz einfach zu E2 ⌠ E · D(E) · f(E,T) · dE ⌡ Eges(E1, E2) = E1 Oben hätte man auch gesamte Energiedichte schreiben können aber dann ist nicht so klar welche Dichte man meint: pro Energieeinheit oder pro Volumen? Zum Schluß noch zwei auf den ersten Blick etwas seltsame anmutende Beziehungen, die wir aber noch oft brauchen werden: Die Wahrscheinlichkeit wh dafür, daß ein Platz bei der Energie E nicht besetzt ist, wird gegeben durch wh = 1 – f(E,T) Die Dichte n× an "Teilchen", die nicht auf verfügbaren Plätzen sitzen, oder wir könnten auch sagen die Dichte der Nichtteilchen, oder schlicht die Dichte der noch freien Plätze, ist E2 n×(E1, E2) = ⌠ D(E) · (1 – f(E,T) · dE ⌡ E1 Wir schauen uns das noch schnell in einer Graphik an: MaWi 2 Skript - Page 61 Damit haben wir jetzt ein erstes mächtiges Werkzeug, um den elektronisch bedingten Eigenschaften der Materialien nachgehen zu können. MaWi 2 Skript - Page 62 2.3.4 Zusammenfassung Kapitel 2.3 Vorbemerkungen: Hier sind absichtlich keine Links gesetzt. Wer hier etwas nicht sofort versteht, tut gut daran selbst aktiv zu suchen! Die Zustandsdichte eines Systems sagt uns, wieviele Plätze in einem gegebenen Energieintervall da sind. Die Frage die wir jetzt stellen ist: Wieviele der vorhandenen Plätze sind (mit Elektronen) besetzt? Genauer fragen wir: Wie groß ist die Wahrscheinlichkeit f(E,T), daß Plätze bei E besetzt sind. Für die Zahl, oder genauer Volumendichte der besetzten Plätze im Intervall n(E1, E1 + ∆E) gilt dann E1 + ∆E ⌠ ⌡ n(E1, E1 + ∆E) = D(E) · f(E,T) · dE ≈ D(E1) · f(E1,T) · ∆E E1 Die letzte Beziehung gilt für ∆E die so klein sind, daß D(E) und f(E,T) im betrachteten Intervall näherungsweise konstant sind. Drei Fragen drängen sich auf: 1. Ist die Verteilungsfunktion f(E,T) systemspezifisch (wie die Zustandsdicht), oder universell? Antwort: f(E,T) ist universell. Sie gilt für jedes fermionische System im thermodynamischen Gleichgewicht. Sie ersetzt schlicht die uns (im Prinzip) schon geläufige, ebenfalls universelle Boltzmann Verteilung, die für klassische Teilchen galt. 2. Wie kann man f(E,T) herleiten? Antwort: Mit ziemlich großer Mühe: Wir schreiben die freie Enthalpie des Systems auf - sie wird über die Entropie von der Zahl der Möglichkeiten, die vorhandenen Plätze besetzen zu können abhängen. Die entsprechende Formel enthält also f(E,T); wir haben ein Funktional (eine Funktion, die als "Variable" eine ander Funktion hat). Mit Hilfe der Variationsrechnung suchen wir nun diejenige Funktion f(E,T), für die das freie Enthalpiefunktional ein Minimum hat - unter Bachtung der Nebenbedingung Teilchenzahl- und Energieerhaltung! Das geht - aber nicht in drei Zeilen! 3. Was ist das Ergebnis? Das Ergebnis ist eine der ganz wichtigen Kurven der Materialwissenschaft: Die Fermi-Dirac Verteilung: 1 f(E, T) = exp E – EF kT +1 Die wesentlichen Eigenschaften der Fermi Verteilung sind: MaWi 2 Skript - Page 63 f(EF,T) = ½ Definiert die Fermienergie "Aufweichungsbereich" E – EF f(E,T) ≈ 4 kT "Boltzmannnäherung" für E > EF ≈ exp – kT Daß die Fermieverteilung in etwa so aussehen muß wie sie sich aus der Herleitung ergibt, läßt sich auch durch scharfes Nachdenken ohne Rechnung zeigen. Mit (materialspezifischer) Zustandsdichte und (universeller) Fermiverteilung lassen sich einige wichtige allgemeine Formeln hinschreiben: Volumendichte n der Teilchen, die auf den Plätzen bei E sitzen, ist immer Dichte der Plätze mal Wahrscheinlichkeit der n(E) = Besetzung mal differentielles Energieintervall = D(E) · f(E,T) · ∆E Die Dichte n aller Elektronen im System muß per definitionem gegeben sein durch ∞ n = ⌠ D(E) · f(E,T) · dE ⌡ 0 Die Dichte n der Elektronen, die sich im Energieintervall (E1, E2) befinden, ist E2 ⌠ D(E) · f(E,T) · dE ⌡ n(E1, E2) = E1 Die gesamte Energiedichte, E(E1, E2) die auf die Elektronen im Energieintervall (E1, E2) entfällt ergibt sich damit zu E2 E(E1, E2) = ⌠ E · D(E) · f(E,T) · dE ⌡ E1 Die Wahrscheinlichkeit wh dafür, daß ein Platz bei der Energie E nicht besetzt ist, wird gegeben durch wh = 1 – f(E,T) MaWi 2 Skript - Page 64 2.3.5 Merkpunkte Kapitel 2.3 Fermi-Dirac Verteilungsfunktion f(E, EF, T) = Wahrscheinlichkeit dafür, daß ein Platz bei der Energie E in einem System mit Fermienergie EF und Temperatur T besetzt ist. Damit Wahrscheinlichkeit für Nichtbesetzung 1 – f(E, EF, T) Die "Fermi Verteilung" oder "Fermi Statistik" hat die nebenstehende Gestalt: 1 f(E, T) = f(E, EF, T) ist eine universelle Funktion die für alle fermionischen Systeme im thermodynamischen Gleichgewicht gilt Für den "Hochenergieschwanz" darf man die Boltzmannverteilung verwenden E – EF exp kT + 1 E – EF für E > EF f(E, T) ≈ exp – kT f(E = EF) = ½ definiert die Fermienergie Der "Aufweichungsbereich" liegt in der Größenordnung kT Wichtige Formeln sind ∞ n = Gesamtvolumendichte der Elektronen des Systems. n = ⌠ D(E) · f(E,T) · dE ⌡ 0 n(E1, E2) = Volumendichte der Elektronen im gegebenen Energieintervall E(E1, E2) = Gesamtenergie(volumendichte) im gegebenen Energieintervall E2 ⌠ D(E) · f(E,T) · dE ⌡ n(E1, E2) = E1 Dies Gleichungen gelten immer, d.h. nicht nur für das freie Elektronengas. Im realen Kristall unterscheidet sich hier nur die Zustandsdichte von der des freien Elektronengases. MaWi 2 Skript - Page 65 E2 E(E1, E2) = ⌠ E · D(E) · f(E,T) · dE ⌡ E1 2.4 Erste Anwendungen der Fermiverteilung 2.4.1 Wärmekapazität des freien Elektronengases Definition der Wärmekapazität Mit dem Modell des freien Elektrongases und der Fermiverteilung haben wir bereits ausreichende Kenntnisse, um einige erste Rätsel der klassischen Festköperphysik lösen zu können. Das erste Rätsel ist die Wärmekapazität des freien Elektronengases. Es ist war nicht besonders prickelnd - nicht mal für hard-core Materialwissenschaftler - aber am einfachsten zu lösen. Außerdem zeigt es sehr schön, daß selbst die einfachsten Probleme auf zwar triviale, aber trotzdem sehr lästige mathematische Schwierigkeiten stoßen. Hier lernen wir dann, wie man damit zurecht kommt. Aber jetzt zur Wärmekapazität des freien Elektronengases. Zunächst mal müssen wir definieren, was damit gemeint ist: Führt man einem (festen) Körper eine kleine Wärmemenge ∆Q zu, so kommt es zu einer (kleinen) Temperaturerhöhung ∆T. Für kleine ∆T gilt immer eine lineare Beziehung: ∆Q = c · m · ∆T Dabei ist m = Masse des Körpers, c = spezifischeWärme oder Wärmekapazität des Materials (massenbezogen) Die (massenbezogene) spezifische Wärme c des Materials ist also die Energie (in Joule), die man einem kg des Materials zuführen muß, um es um ein Grad Kelvin zu erwärmen. Als Definition von c haben wir 1 c = dQ · m dT Die Einheit ist [c] = J / (kg · K) Spezifische Wärmen als Materialparameter sind natürlich nur sinnvoll, wenn sie auf eine bestimmt Menge des Materials bezogen werden. In der obigen Definition war das die Masse, wir können aber als Bezugsgröße auch ein Mol der Substanz nehmen. Dann erhalten wir die molare Wärmekapazität C aus ∆Q = C · n · ∆T Dabei ist n = Anzahl der Mole in der Substanz, und C die molare Wärmekapazität Molare Wärmekapazitäten sind besonders gut geeignet für Vergleiche zwischen simplen Materialien, aber nicht so gut für reale Materialien. Wieviel kg hat ein Mol Beton? Oder Styropor? Die zugeführte Wärmemenge führt zunächst zu einer Erhöhung der inneren Energie (oder, bei konstantem Druck, Enthalpie) des Festkörpers. Dies geschieht auf zwei unabhängige Weisen: Die zugeführte Wärmeenergie erhöht die mittlere Amplitude der Gitterschwingung, d.h. der mittleren Amplitude aller vibrierenden Atome. Dieser Mechanismus ist bei allen Temperaturen und für alle Festkörper von Bedeutung: Metalle, Isolatoren, Halbleiter,....; amorphe und kristalline Materialien. Bei Materialien mit freien Elektronen, d.h. bei Metallen, können auch die freien Elektronen Energie aufnehmen. Dabei erhöht sich ihre mittlere kinetische Energie. Experimentell findet man, daß in Metallen bei tiefen Temperaturen der Beitrag der Elektronen den des Gitters überwiegt, während er bei höheren Temperaturen vernachlässigt werden kann. Klassische Berechnung der Wärmekapazität von Metallen Die Wärmekapazität eines Festkörpers läßt sich mit Hilfe der inneren Energie berechnen - wir haben das schon mal gemacht. Pro Atom des Festkörpers ist die Wärmemenge, die in Form von Gitterschwingungen aufgenommen wird = 3kT (denn die Zahl der Freiheitsgrade ist f = 6). Dementsprechend ist die innere Energie des Festkörpers auf Grund von Gitterschwingungen pro Mol: MaWi 2 Skript - Page 66 UGitter = AV · 6 · ½ kT = 3AV · kT Dabei ist AV die Avogadrokonstante, d.h. AV = 6.022 · 1023 mol– 1 Die molare Wärmekapazität auf Grund von Gitterschwingungen ist daher dUGitter CGitter = = 3k · AV = 3R dT denn das Produkt k · AV ist per definitionem die allgemeine Gaskonstante R = 8.314 J · K –1 · mol–1. Das ist ein ziemlich "heißes" Ergebnis! Das darin ausgedrückte "Gesetz" hat auch einen Namen, es heißt "DulongPetitsche Regel". Es hat macht zwei weitreichende Vorhersagen: 1. Alle Festkörper haben dieselbe molare Wärmekapazität. 2. Die molare Wärmekapazität ist konstant; sie hängt insbesondere nicht von der Temperatur ab. Das kann doch wohl nicht stimmen! Nun - im Zweifel gilt das Experiment. Im Link findet man einige Daten dazu. Aber Stimmigkeit hin oder her - wir haben jetzt den klassischen Beitrag des Gitters und wollen als nächstes den klassischen Beitrag der freien Elektronen zur Wärmekapazität bestimmen. Klassisch, d.h. ohne Berücksichtigung der Quantenmechanik und insbesondere auch ohne Berücksichtigung des Pauli Prinzips, würde man bei Metallen einen hohen Beitrag zur Wärmekapazität erwarten, da die freien Elektronen viel Energie aufnehmen können. Da die freien Elektronen nur kinetische Energie besitzen, ist die innere Energie pro Elektron nur halb so groß wie die Energie pro Atom auf Grund von Gitterschwingungen. Bei einer klassischen Betrachtung wäre also die innere Energie der freien Elektronen bezogen auf ein Mol: Ue = NA · (3/2) · kT Mit NA = Zahl der Elektronen pro Mol. Nehmen wir der Einfachheit halber an, daß pro Atom des Metalls ein freies Elektron vorhanden ist (einwertige Metalle), erhalten wir Ue = 3/2 · RT Die klassische molare Wärmekapazität der Elektronen ist also Ce = 3/2 · R; immerhin halb so groß wie die des Gitters. Demnach wäre bei klassischer Betrachtungsweise die gesamte molare Wärmekapazität eines (einwertigen) Metalls C = Ce + CGitter = 9/2 · R Das ist schlicht und ergreifend falsch. Die molare Wärmekapazität aller Metalle liegt bei hoher Temperatur dicht bei 3R, bei tiefen Temperaturen ist sie immer nur kleiner. Sie kommt niemals auch nur in die Nähe von 4,5R In klassischer Betrachtungsweise ist das Problem nicht reparabel; es gehört zu den fundamentalen "Stolpersteinen" am Anfang des 20. Jahrhunderts, die erst durch die Quantentheorie beseitigt wurden. Der Grund liegt im Pauli-Prinzip. Denn wie wir vom Modell des freien Elektronengases wissen, sitzen die meisten unserer Elektronen auf vollbesetzten Zuständen oder anders ausgedrückt, auf Plätzen im k-Raum bei denen alle Nachbarplätze besetzt sind. Das sieht man am besten wenn man sich Zustandsdichte mal Fermiverteilung anschaut, d.h. die Dichte der Elektronen über der Energie. MaWi 2 Skript - Page 67 Wenn ein Elektron Energie aufnehmen will, muß es dazu auf einen anderen Platz bei einer höheren Energie "springen". Falls es aber bei dieser höheren Energie keine freien Plätze gibt, kann der Sprung nicht erfolgen - so einfach ist das! In der Graphik oben gilt dies für alle Elektronen, die bei Energien etwas unterhalb des gelben Bereiches sitzen. Sie müßten schon sehr große Energien absorbieren, um auf die freien Plätze im schraffierten Bereich oder jenseits davon zu gelangen. Oberhalb des gelben Bereiches gibt es zwar viele freie Plätze, aber keine Elektronen mehr. Im Klartext heißt das: Nur die Elektronen im gelben Bereich, d.h. in der "Aufweichungszone" der Fermiverteilung sind überhaupt thermisch anregbar. Da bei "normalen" Temperaturen diese Aufweichungszone sehr klein ist (« 4 kT « 1/10 eV bei Raumtemperatur), sind die meisten Elektronen des Metals energetisch "nicht ansprechbar" - und können damit auch nicht zur Wärmekapazität beitragen. Qualitativ ist der "fehlende" Beitrag der Elektronen zur spezifischen Wärme also leicht verstehbar. Jetzt wollen wir aber mal sehen, ob wir das ganze auch quantitativ durchziehen können. Richtige Berechnung der Wärmekapazität der Elektronen in Metallen in Näherung Wir betrachten zunächst im "Schnellverfahren" eine extrem simple Näherung. Nur die Elektronen können thermisch angeregt werden, d.h. Energie aufnehmen (oder abgeben), die Energien in der Nähe der Fermi-Energie besitzen; denn nur dort sind genügend freie Elektronenzustände vorhanden. Alle anderen Elektronen (der größte Teil) sind sozusagen "eingefroren". In der Gleichung für Ce dürfen wir daher nur die thermisch anregbaren Elektronen berücksichtigen, d.h. wir müssen die eigentliche Anzahl der Elektronen Ne durch eine effektive Anzahl Neff ersetzen. Wie groß ist Neff? Betrachten wir die Dichte der besetzen Zustände in obiger Graphik, können wir näherungsweise nach "Gefühl" - sofort schreiben Neff ≈ L3 · D(EF) · kT Wir haben der Einfachheit halber das Aufweichungsintervall statt mit 4kT nur mit kT eingebracht, schließlich sind bei weitem nicht alle Zustände im Aufweichungsintervall besetzt. Die Zustandsdichte bei der Fermienergie kennen wir auch schon, sie ist 1 3Ne D(EF) = V 2EF Damit erhalten wir für die effektive Anzahl der Elektronen in der gemachten Näherung 3Ne Neff ≈ · kT 2EF Die innere Energie des Elektronengases ist jetzt 9Ne · (kT)2 Ue ≈ Neff · 3/2 kT = 4EF MaWi 2 Skript - Page 68 Und damit ergibt sich für die molare Wärmekapazität des freien Elektronengases 9NA kT · k2T Ce ≈ = 9/2 R · 2EF EF Wobei wir mit NA statt Ne jetzt wieder ausdrücken, daß wir jetzt die Zahl der Eektronen pro mol meinen. Wir haben also - bis auf einen Faktor 3 - das alte klassische Ergebnis, aber multipliziert mit kT/EF « 1. Die Wärmekapazität des freien Elektronengases in quantenmechanischer Betrachtung ist also: 1. Erheblich kleiner als bei klassischer Betrachtung. 2. Nicht mehr konstant, sondern linear mit der Temperatur ansteigend. 3. Sehr gut zu experimentellen Ergebnissen passend. Cool. Aber - wir haben ziemlich heftig "nach Gefühl" genähert. Was sagt die korrekte Rechnung dazu? Damit wollen wir uns jetzt ein wenig beschäftigen. Berechnung der Wärmekapazität des freien Elektronengases in voller Schönheit Was folgt muss man nicht "können", aber der Rechengang zeigt doch sehr schön einige (mathematische) Spezifika des Rechnens mit Fermiverteilungen, die in vielen anderen Zusammenhängen in ähnlicher Form auftauchen werden. Es lohnt sich deshalb schon, das Ganze zumindest der Spur nach mal zu verfolgen. Die gesamte Energie(dichte), die im freien Elektronengas steckt ist ∞ E = ⌠ E · D(E) · f(E,T) · dE ⌡ 0 Bei Integralen dieser Art, ist es immer zweckmäßig, als Variable (E – EF) zu benutzen, denn das steht immer im Exponent der Fermi Verteilung. Wir machen also eine Umschreibung wie folgt: ∞ E = ∞ ⌠ (E – EF) · D(E) · f(E,T) · dE ⌡ + EF · 0 ⌠ D(E) · f(E,T) · dE ⌡ 0 ∞ = ⌠ (E – EF) · D(E) ·f(E,T) · dE ⌡ + Ne · EF 0 Denn das 2. Integral ergibt genau die Gesamtzahl der Elektronen Ne Für die Wärmekapazität erhalten wir jetzt ∞ dE C = = dT ⌠ (E – EF) · D(E) ⌡ 0 df(E,T) · dE dT Fertig. Es ist eine Differentiation auszuführen und ein bestimmtes Integral auszurechnen - das ist "nur" noch Mathematik, denn die beteiligten Funktionen kennen wir. Aber ganz so einfach ist es nicht. Wer will, kann sich ja mal daran versuchen. Wir knacken den Ausdruck indem wir wieder Näherungen machen - aber jetzt weniger "nach Gefühl", sondern mathematisch wohlbegründet. Zunächst stellen wir fest, daß die Ableitung der Fermiverteilung nach der Temperatur nur im Aufweichungsinterval ≠ 0 ist. Das sieht man nicht sofort. Was man sofort sieht ist, dass die Ableitung nach der Energie nur um EF herum von Null verschieden ist. MaWi 2 Skript - Page 69 Denn wenn man in dem den Graph der Fermiverteilung aber statt derEnergie E den Ausdruck 1/T als Abszisse nimmt, bleibt der Graph unverändert, und wir haben df(E, T) df(E,T) = dT d(1/T) · d(1/T) df(E,T) 1 = – dT · T2 d(1/T) Die Ableitung df(E,T)/dT ist also tatsächlich nur im Aufweichungsintervall von Null verschieden. Damit wird auch das Integral überall = 0; außer im Energiebereich um die Fermienergie. Wiederum können wir dann näherungsweise D(E) durch D(EF) ersetzen und erhalten ∞ C ≈ D(EF) · ⌠ (E – EF) · ⌡ 0 1 dE dT exp (– (E – EF)/kT) + 1 d Auch jetzt ist das Integral nicht ganz einfach zu knacken - aber es geht. Nach länglicher und ziemlich mühsamer Rechnung ergibt sich schlicht der Wert (π2k2T)/3. Das ist bei Integralen dieser Art - sogenannten Fermiintegralen - häufiger der Fall: Nach immer mühsamer Rechnung ergibt sich für den numerischen Faktor oft ein Wert nahe 1 - z.B. (π/3)½. Wir erhalten damit als Endergebnis (wieder mit D(EF) = 3NA/2E F) π2 Ce ≈ · k2T · 2 π2R NA EF = · 2 π2 kT = T ·R· EF 2 TF wobei wir die Fermi-Temperatur TF, definiert über kTF = EF verwendet haben. Wenn wir dem Elektronengas eine "interne" Temperatur so zuordnen, daß die klassische Betrachtung wieder gilt, sehen wir einen simplen Zusammenhang: Die Fermi-Temperatur ist genau die Temperatur, die ein klassisches Elektronengas haben müßte, damit es die freie Energie enthält, die das "richtige" Elektronengas hat. Sie liegt - bedingt durch das Pauli Prinzip - sehr viel höher als übliche Temperaturen. Für typische Fermi-Energien im eV-Bereich erhält man Fermi-Temperaturen im Bereich von 104 K. Bei Raumtemperatur (T ≈ 300 K) ergibt sich daher ein verschwindend geringer Beitrag der Elektronen zur Wärmekapazität eines Festkörpers. Die ganze, hier gar nicht detailliert ausgeführte Rechnerei, ersetzt also lediglich den Faktor 9 durch π2 - unsere "gefühlsmäßige" Näherung war also ganz gut. Es lohnt sich, alle drei Ergebnisse nochmals zu vergleichen und die Unterschiede zu diskutieren. Wir hatten 3 Ce(klassisch) = ·R 2 9 Ce(QT, "Gefühl") ≈ T ·R· 2 TF π2 Ce(QT, "korrekt") ≈ T ·R· 2 TF Der Faktor T/TF kann auch so interpretiert werden, daß das Elektronengas bereits eine extrem hohe Temperatur hat, und ein bißchen Energiezufuhr daran kaum was ändert. Eine letzte Bemerkung ist von Interesse: Wie groß ist der Fehler, den wir durch die Konstantsetzung der Zustandsdichte im Integral gemacht haben? MaWi 2 Skript - Page 70 Die Antwort ist "Who cares"? Denn bei Verwendung der Zustandsdichte des freien Elektronengases machen wir durch diese Näherung zwar sicherlich einen (kleinen) Fehler - aber der Fehler den wir machen, weil wir die unrealistische Zustandsdichte des freien Elektronengases nehmen und nicht die Zustandsdichte des realen Materials, ist viel größer! Im übrigen ist die Verwendung der Formel für die Zustandsdichte bei der Fermienergie nicht so schlecht! Denn dieser Ausdruck ist allgemeiner als die Zustandsdichte des freien Elektronengases - er gilt auch noch bei Zustandsdichten, die in ihrer genauer Form stark von der des freien Elektronengases abweichen. Das sollte man sich mal selbst klar machen. Experimentell ist die quantenmechanische Behandlung der Wärmekapazität fester Stoffe glänzend bestätigt. Der elektronische Antreil ist nur bei extrem tiefen Temperaturen vorhanden, bei denen der Gitterbeitrag praktisch = 0 ist, und folgt dann genau der obigen Formel. Fragebogen / Questionaire Multiple Choice Fragen zu 2.4.1 MaWi 2 Skript - Page 71 2.4.2 Elektrische Leitfähigkeit des freien Elektronengases Die richtige Formel Die klassische Formel für die spezifische Leitfähigkeit war: n · e2 σ = n · e2 · l l ≈ · m 2(v0 + vD) 2m · v0 Das Problem war, daß nur viel zu kleine Werte für die mittlere freie Weglänge l zu vernünftigen Zahlenwerten für σ führten. Wie löst sich jetzt das Problem? Ganz einfach: Die klassische thermische mittlere Geschwindigkeit v0 des freien Elektronengases, klassisch definiert durch v02 = 3kT 1/2 m muß durch die wirkliche mittlere Geschwindigkeit ersetzt werden. Im Link kann man sich das noch illustriert anschauen Das Pauli Prinzip verlangte ja, daß auch die Energieniveaus bei hohen Energien besetzt werden müssen, und da die Energie unseres freien Elektronengas rein kinetisch ist, heißt das, daß die mittlere Geschwindigkeit der Elektronen hoch ist. Wir können das auch daran sehen daß wir formal ja eine sehr hohe Temperatur für das Elektronengas ansetzen müßten, nämlich die Fermitemperatur TF = EF/k, um die klassischen Formeln benutzen zu können. Wie groß ist die quantenmechanische mittlere Geschwindigkeit v0q? Das ist jetzt nicht schwer zu "raten", wir nehmen als Größenordnung einfach die halbe "Fermigeschwindigkeit" v0q = 1/2 · vF = EF 1/2 2me Wieder eine Näherung "nach Gefühl" - aber damit haben wir ja bereits gute Erfahrungen gemacht. Wir haben damit auch die sogenannte Fermi-Geschwindigkeit vF definiert, einfach über EF = ½ m e(v F)2. Und als Mittelwert der Geschwindigkeit aller Elektronen nehmen wir die Hälfte der Fermi-Geschwindigkeit; das kann nicht ganz daneben liegen. Für die Leitfähigkeit erhalten wir damit n · e2 · l σ = m e · vF Da vF sehr viel größer ist als v0(klassisch), erhält man jetzt die richtige Größenordnung für die mittlere freie Weglänge: Bei Metallen liegt sie im Bereich von l ≈ 102 nm. Müßten wir jetzt nicht auch noch die Dichte der Elektronen auf die effektive Dichte im Aufweichungsintervall der Fermiverteilung reduzieren? Nein! Denn alle Elektronen tragen zur Leitfähigkeit bei. Die meisten können zwar keine Energie aufnehmen, aber sie stehen ja nicht still, sondern laufen in Richtung ihres Wellenvektors durch den Kristall. Damit trägt jedes Elektron zum Stromfluß bei. Allerdings wird es zu den meisten Elektronen, die in k-Richtung fliegen, welche geben, die in entgegengesetzte Richtung laufen, d.h. der Nettostrom wird klein (und ohne äußere Spannung = 0) sein. Aber diesen Effekt haben wir in der Formel bereits berücksichtigt als wir die Driftgeschwindigkeit, und nicht die aktuelle Geschwindigkeit des Elektronenensembles in der Beschreibung der Leitfähigkeit verwendeten. MaWi 2 Skript - Page 72 Der Einfluß von Temperatur und Defekten auf die Leitfähigkeit Wir haben eigentlich zwei grundlegende Formeln für die Leitfähigkeit erhalten, und in beiden Formeln muß sich die Temperatur- und Defektabhängigkeit widerspiegeln. Die beiden Formeln waren: 1. σ = Σ qi · ni · µi i ni · e 2 · l 2. σ = m e · vF In der ersten Gleichung schauen wir auf summarische Eigenschaften von Teilchen einer Sorte i mit der Ladung qi, nämlich auf die Konzentration ni und die Beweglichkeit µi. In einer Erweiterung der früheren Formel steht jetzt noch ein Summenzeichen - damit erfassen wir die Möglichkeit, daß verschiedene Teilchensorten sich am Stromfluß beteiligen. Die Verschiedenheit kann sich auf alle drei Größen beziehen. In einem (flüssigen) Elektrolyten wird man z.B immer mindestens zwei verschiedene Ionensorten haben, die sich in allen drei Größen unterscheiden können; aber auch Elektronen mit z.B. verschiedenen Beweglichkeiten müssen wir als verschiedene Teilchen auffassen. Im allgemeinen müssen wir damit rechnen, daß die Konzentration und die Beweglichkeit von Defekten und der Temperatur beeinflußt werden; damit haben wir einen ersten Ansatz zur Beschreibung von σ(T, Defekten). In der Praxis nutzt man das auch - indem man gemessene n(T, Defekten) und µ(T, Defekten) angibt. In der Theorie ist es schwieriger. Im Moment wissen wir nicht so recht, wie ni und µi von T und Defekten abhängen. Für ni werden wir das (für Halbleiter) noch detailliert behandeln; für die µi ist es (in der Theorie) immer schwierig. Die zweite Gleichung (die natürlich völlig äquivalent zur ersten ist) macht die Theorie etwas einfacher; in der Praxis ist sie eher ungebräuchlich. Sie sagt uns, wie die Leitfähigkeit von dem Verhalten eines einzelnen "gemittelten" Ladungsträgers abhängt (meistens, aber nicht notwendigerweise, ein Elektron). Die Empfindlichkeit auf T und Defekte steckt jetzt in n (wie zuvor) und in l. Falls wir uns erst mal nur auf Metalle beschränken, wird die Konzentration n der freien Elektronen ziemlich konstant sein - sie ist nur durch die Art des Metalls und der Bindung bedingt. Interessant ist also die Beweglichkeit µ oder alternativ die mittlere freie Weglänge l - und zu l haben wir ein unmittelbareres Verhältnis als zu µ. Da die mittlere freie Weglänge einfach der mittlerer Abstand zwischen zwei Stößen war, müssen wir uns jetzt damit beschäftigen, wie die Stoßerei von Temperatur und Defekten abhängt - in anderen Worten, wie sich die Temperatur auf die Stoßpartner auswirkt. Die möglichen Stoßpartner haben wir schon mal aufgelistet, wichtig waren nur die Phononen als wirkliche, teilchengewordene Gitterschwingungen, und Defekte, wie Fremdatome, Leerstellen oder Versetzungen. Damit haben wir schon ein erstes wichtiges Unterscheidungskriterium: Extrinsische Defekte sind fest gegeben - ihre Konzentration hängt nicht von der Temperatur ab. Sie werden die mittlere freie Weglänge selbstverständlich stark beeinflussen, aber primär über ihre vorgegebene Konzentration. Intrinsische Defekte, d.h. in allen Metallen ausschließlich die Leerstellen, spielen nur bei sehr hohen Temperaturen eine (kleine) Rolle, und selbst dann ist ihre Konzentration in realen Materialien viel kleiner als die aller anderen Defekten - wir wollen sie hier schlicht "vergessen". Phononen, d.h. Gitterschwingungen enthalten die thermisch Energie des Gitters. Bei 0 K gibt es keine Gitterschwingungen und damit auch keine Phononen, mit zunehmender Temperatur wird es dafür mehr und mehr Phononen geben müssen - hier muß die wesentliche Temperaturabhängigkeit der Leitfähigkeit bzw. des spezifischen Widerstandes stecken. Wir können also frohgemut den folgende einfachen Ansatz machen (traditionell, weil am einfachsten, für den spezifischen Widerstand ρ = 1/σ und nicht für σ). ρ = ρP + ρD Dabei sei ρP = spez. Widerstand verursacht durch Stöße mit Gitterschwingungen (Phononen). ρD = spez. Widerstand verursacht durch Stöße mit Gitterdefekten. Lange bevor man das so einfache postulieren konnte, war genau dieses Verhalten schon experimentell beobachtet worden, es hat sogar einen Namen und heißt Matthiesen-Regel. Ein Beispiel zeigt das folgende Bild, die drei Kurven stehen für verschiedene Verunreingungs- bzw. Defektkonzentrationen. MaWi 2 Skript - Page 73 Man erkennt, daß der spezifische Widerstands bei ≈ 0 K, der "Restwiderstand", ein indirektes Maß für die Qualität im Sinne von Defektfreiheit eines Materials ist. Man kann das Verhältnis zum (nicht mehr defektdominierten) Widerstand bei Raumtemperatur bilden; das resultierende "Restwiderstandsverhältnis" ist dann ein gutes Qualititätsmaß und wird auch viel benutzt, Bei "höheren" Temperaturen (in obigen Beispiel so ab T ≥ 20 K) findet man eine lineare Temperaturabhängigkeit des spezifischen Widerstandes, d.h. ρ ≈ ρ0 (1 + αT) Der Faktor α heißt "Temperaturkoeffizient oder Temperaturbeiwert, typische Werte sind: Material α [10– 3 K– 1] Die elementaren Metalle unterscheiden sich also nicht so sehr - das würden wir auch "gefühlsmäßig" so erwarten. Ag 3,8 Als Faustregel erkennt man für metallische Elemente Al 3,9 Au 3,4 0,4% ∆ρ ≈ Cu 3,9 Ni 6,0 Na 4,0 Pb 3,9 W 4,5 Konstantan (Cu-NiLegierung) 0,0 0C Das ist viel! Für den Glühfaden einer Glühbirne (ausW), die so bei T ≈ 2500 0C "brennt, hätte man nach dieser Faustregel eine Widerstandsänderung von 1000 % zu erwarten, d.h. der Widerstand sollte sich verzehnfachen. In Wahrheit steigt er sogar um einen Faktor 19, oder andersherum ausgedrückt: Im Moment des Einschaltens fließt der 19-fache Strom relativ zum Dauerstrom! Das Beispiel "Konstantan", (das hier als Extremfall stellvertretend für Legierungen steht), zeigt aber auch, daß sich in der Temperaturabhängigkeit des spezifischen Widerstands von "gemischten" Materialien noch einige Dinge verstecken, die wir an dieser Stelle noch nicht verstehen. In "reinen" Elementmetallen ist der temperaturunabhängige Defektwiderstand ρD klein, denn wir haben wenig Defekte. In allen "Mixturen", d.h. Legierungen, gilt das nicht mehr. Die Legierung AxBy können wir zunächst für den Fall x >> y so interpretieren, daß sich im "Wirtskristall" A jetzt viele atomare Defekte der Sorte B mit der Konzentration cD = y/(x + y) % befinden. Wie ist dann der Widerstand? Auch dafür gibt es eine "Regel", die Nordheim Regel: m e · vF ρ = cD · ne · e 2 a Mit ne = Elektronenkonzentration, cD = Defekt-Konzentration (in Atomprozent) und a = Gitterparameter des Metalles MaWi 2 Skript - Page 74 Das ist eine sehr traurige Regel, denn sie besagt, daß unser normales Wundermittel zur Verbesserung von Materialeigenschaften für die Leitfähigkeit nicht wirkt: Einführung und Manipulation von Defekten in jeder denkbaren Abwandlung macht den spez. Widerstand immer nur schlechter! Es gibt keine Möglichkeit, unter den Wert von sehr perfektem Silber zu kommen! (Wir schließen dabei die Supraleiter natürlich aus). Wie man durch Vergleich mit unserer " Mastergleichung" sofort erkennt, etabliert die Nordheim Regel folgende Beziehung a l(cD) = cD Das ist, wenn man ein bißchen darüber nachdenkt, eine eigentlich überraschende Gleichung. Denn zunächst wäre man doch wohl geneigt anzunehmen, daß die mittlere freie Weglänge l proportional zum mittleren Abstand lD der Defekte ist. Und für lD gilt eine andere Beziehung, nämlich a lD = (cD)1/3 Der Widerspruch ist, mit etwas Nachdenken, leicht zu lösen - wir tun das in einer Übungsaufgabe Übung 2.4-1 Defekte und mittlere freie Weglänge Wenn wir jetzt auch hohe Konzentrationen cD der Defekte zulassen, gilt (empirisch): m e · vF ρ = cD · (1 – cD) · ne · e 2 a1D Damit bekommt man schon ganz gute Näherungen für den spezifischen Widerstand ρ einer Legierung. Das sieht dann so aus Damit lassen wir es an dieser Stelle gut sein. Wir haben die Grundgleichungen für den spezifischen Widerstand, wir haben das Grundverständnis, und wir wissen, daß wir immer zwei Grundaufgaben lösen müssen: 1. Was bestimmt die Dichte der beweglichen Ladungsträger? Bei den Metallen war es die "Chemie", in Form der Metallbindung, aber wir können andere Mechanismen natürlich nicht ausschließen. 2. Was bestmmt die Beweglichkeit bzw. mittlere freie Weglänge der Ladungsträger? Hier fragen wir Stoßmechanismen, nach Mechanismen, die die im elektrischen Feld gewonnene Energie der Ladungsträger dissipieren, d.h. ans Gitter abführen. Fragebogen / Questionaire Multiple Choice Fragen zu 2.4.2 MaWi 2 Skript - Page 75 2.4.3 Zusammenfassung Kapitel 2.4 Vorbemerkungen: Hier sind absichtlich keine Links gesetzt. Wer hier etwas nicht sofort versteht, tut gut daran selbst aktiv zu suchen! Die molare Wärmekapazität C jedes Festkörpers ist in der klassischen Physik zwangsweise und unabänderbar 9/2 R. Dabei entfallen 6/2 R auf das Gitter und 3/2 R auf die freien Elektronen. Das ist aber zweifach falsch: 1. ist C maximal 3 R, d.h. der Beitrag der Elektronen ist nicht da, und 2. geht C mit sinkender Temperatur immer auf Null. Das Problem der fehlenden spezifischen Wärme der Elektronen löst sich sofort in der Quantentheorie: Elektronen unterhalb der Aufweichungszone der Fermiverteilung können keine Energie aufnehmen, da sie dazu ihren Zustand ändern müssten, d.h. auf einen anderen Platz in Zustandsraum "springen" müssten. Da es in ihrer energetischen Umgebung keine freien Plätze gibt, kann ein "Energieänderungsprozess" nicht erfolgen. Nur dieElektronen im Aufweichungsbereich der Fermiverteilung sind energetisch flexibel; das sind aber bei normalen Temperaturen nur sehr wenige. Eine schnelle überschlägige Berechnung unter der Annahme, dass die verfügbare Zahl der Elektronen gegeben wird durch Neff ≈ L 3 · D(EF) · kT, liefert sofort das einfache (und zu Experimenten sehr gut passende) Ergebnis 9NA kT · k2T Ce ≈ = 9/2 R · 2EF 9 = EF T ·R· 2 TF Eine genauere Rechnung führt in haarige, aber rein mathematische Probleme bei der Auswertung bestimmter Integrale, und liefert nahezu dasselbe Ergebnis ∞ Ce ≈ D(EF) · ⌠ (E – EF) · ⌡ 0 1 dE dT exp – (E – EF)/kT π2 d ≈ T ·R· 2 TF Die spezifische Wärme der Elektronen ist zwar nicht von großer technischer Bedeutung, aber das einfachste und klarste Beispiel für das Wirken von Zustandsdichte und Fremiverteilung. Außerdem illustriert es sehr schön die zwar von der Sache her trivialen, aber doch sehr lästigen mathematischen Probleme mit "Fermiintegralen". Die Thematik "Leitfähigkeit" ist jetzt einfach zu fassen. Die klassische Betrachtung kommt zu völlig falschen Werten für die mittlere Geschwindigkeit der Elektronen. Nehmen wir aber wieder überschlagsmäßig als Mittelwert die Hälfte der Fermigeschwindigkeit (1/2 m · vF2 = k · T F), lösen sich alle Probleme in Wohlgefallen auf. Da vF relativ konstant ist, wird die bestimmend Größe für die Leitfähigkeit die mittlere freie Weglänge zwischen Stößen. Streuprozesse an Defekten und Phononen dominieren die Temperatur- und Gefügeabhängigkeit, daraus lassen sich leicht einige Regeln ableiten bzw. historische Regelen und "Gesetze" begründen: Matthiesen Regel: Der spez. Widerstand hat einen temperaturunabhängigen, durch Defekte gegebenen Anteil, und einen mit T wachsenden, durch Phononen bestimmten Anteil. Der Widerstand wächst linear mit der Temperatur, es gilt ρ ≈ ρ0 (1 + αT) 0,4% ∆ρ ≈ 0C α ≈ 4 · 10– 3 K– 1 für alle "normalen" Metalle Nordheim Regel: Bei Legierungen nimmt der Widerstand immer (zunächst linear) mit der Konzentration des Legierungselements zu. MaWi 2 Skript - Page 76 MaWi 2 Skript - Page 77 2.4.4 Merkpunkte Kapitel 2.4 Molare Wärmekapazität Metall ist klassischtheoretisch immer C = Ce + CGitter = 6/2 · R + 3/2 · R = 9/2 · R Das ist experimentell doppelt falsch: 1. Gitteranteil geht ⇒ 0 für T ⇒ 0 K 2. Elektronenanteil immer << 3/2 · R Fehler bei Elektronen: Pauli Prinzip nicht berücksichtigt Richtig ist: Nur Elektronen mit freien Plätzen in der Nachbarschaft im k-raum können Energie aufnehmen. !!! Sehr wichtiges Prinzip !!! Das sind nur die Elektronen im "Aufweichungsbereich" der Fermivertteilung Richtige Formel Strickmuster ist immer: Zustandsdichte mal Fermiverteilung = Dichte Elektronen bei E; mal E = gesamte Energie der Elektronen bei E, Aufsummieren (= integrieren) ∞ E = ⌠ E · D(E) · f(E,T) · dE ⌡ 0 ∞ C = dE/dT ≈ d 1 D(EF) · ⌠ (E – EF) · dE ⌡ dT exp – (E – EF)/kT 0 π2 T ≈ ·R· 2 TF Rechnerei trickreich; braucht Näherungen. Schnelle Abschätzung gibt 9NA Merke: Mathe kann schwierig sein, Physik ist aber klar. 2EF Bei klassischer Leitfähigkeit ebenfalls Fehler weil kein Pauli Prinzip berücksichtigt. kT · k2T Ce ≈ = 9/2 R · T = 9/2 R · EF 1/2 m · vF2 = k · T F Dadurch ist die mittlere Geschwindigkeit v0 viel zu klein "Reparatur" klassischer Formel: Ersetze v0(klassisch) durch "Fermigeschwindigkeit vF" Damit größere freie Weglängen; grundsätzliches Verständnis möglich. Genauer Betrachtung der mittleren freien Weglänge als Funktion von Temperature, Defekten, Legierung usw. ergibt die klassishen "Reglen" und "Gesetze" für die Leitfähigkeit der Metalls. Matthiesen Regel: ρ ≈ ρ0 (1 + αT) α ≈ 4 · 10– 3 K– 1 Nordheim Regel: ρ ∝ Konz. Legierungselement MaWi 2 Skript - Page 78 TF 2.5. Eigenschaften von Wellen und Teilchen 2.5.1 Mathematische Beschreibung Generelle Beschreibung von Schwingungen und Wellen Mit dem Ausdruck "Eine Welle" beschreibt man Schwingungsvorgänge im Raum und in der Zeit. Schauen wir uns zunächst den Begriff Schwingung näher an. Eine "Schwingung" allgemeiner Art nur im Raum liegt immer vor, wenn sich irgendeine Eigenschaft periodisch im Raum ändert. Das kann die Farbe beim Zebrastreifen sein, es kann aber auch z.B. das periodische Potential U(x) eines Kristalls sein. Die Grundeigenschaften einer Schwingung sind in einem extra Modul dargestellt. In allgemeinster Form können wir jeden periodischen Vorgang als Fourierreihe beschreiben und erhalten z.B. für ein periodisches Potential U(x) 2π · x U(x) = U1 · sin 2π · 2x + U2 · sin a 2π · 3x + U3 · sin a + ... a Mit a = Gitterkonstante = Wellenlänge der "Grundfrequenz". Ganz allgemein bezeichnen wir als Schwingung alles, das wie im Beispiel oben nur den Ort als Variable sowie eine Wellenlänge als Parameter enthält, auch wenn das nicht dem allgemeinen Sprachgebrauch entspricht (niemand redet im täglichen Leben von der Geländerstangenschwingung oder von Zebraschwingungen bei Fußgängerüberwegen). Hier zwei Beispiele: Links die langweilige symbolische Darstellung einer Sinusschwingung; rechts eine sehr hübsche Schwingung, für die man schon eine sehr komplizierte zweidimensionale Fourierdarstellung braucht (wir würden dazu natürlich unseren alten Trick benutzen und diese Schwingung unendlich ausgedehnt machen, indem wir sie periodisch für beide Richtungen ins Unendliche fortsetzen). Statt dem Ort als Variable können wir aber auch nur die Zeit nehmen (Ort und Zeit kombinieren wir dann als nächstes). Eine Schwingung nur in der Zeit liegt beispielsweise vor, wenn wir die Amplitude A einer stehenden (mechanischen, elektromagnetischen, quantenmechanischen oder ... ) "Welle" am Punkt r messen. Wir haben in der Fourierreihendarstellung. Ar(t) = Ar, 0 · sin ω · t + Ar, 1 · sin 2ωt + .. Aussehen kann das so: Wir haben eine stehende Welle (eigentlich müßten wir "stehende Schwingung" sagen), wie man sie z.B bekommt wenn man ein dickes Seil an der Wand festmacht und dann kräftig "schüttelt"). MaWi 2 Skript - Page 79 Außer der im Raum definierten Wellenlänge, haben wir jetzt auch noch eine Frequenz ν zu berücksichtigen, definiert als der Kehrwert der Zeit die vergeht bis eine Periode durchgeführt ist, d.h. eine beliebige Ausgangsposition wieder erreicht ist. Es ist gut, sich hier klar zu machen, daß Wellenlänge und Frequenz in diesem Beispiel vollkommen unabhängig wählbar sind, sie sind durch keine allgemeine Beziehung gekoppelt. Für eine konkrete physikalische Anwendung kann es natürlich eine Beziehung zwischen Wellenlänge und Frequenz geben, das ist dann die Dispersionsfunktion des jeweiligen Systems. Eine Welle kombiniert im allgemeinen Raum und Zeit. Allerdings unterscheidet niemand, auch nicht Wissenschaftler, immer sklavisch "Schwingungen" und "Wellen" in voller Strenge - wir haben das gerade eben auch nicht getan und von stehenden Wellen geredet. Bei einer "richtigen" Welle gibt es also sowohl periodische zeitliche Änderungen von was auch immer an einem festen Punkt im Raum, als auch bei einem gegebenen Zeitpunkt periodische Änderungen entlang einer Richtung im Raum. Das hört sich kompliziert an, aber jeder weiß was gemeint ist - denn jeder hat schon genügend laufende Wellen gesehen. Und wenn wir Wellen sagen, meinen wir im allgemeinen laufende Wellen, im Gegensatz zu den in der Zeit oder im Raum stationären Schwingungen oder auch stehenden Wellen. Aber wie gesagt: So ganz sauber wird selten unterschieden; Schwingungen sind der Grenzfall von Wellen, und meistens weiß man aus dem Kontext oder aus der Formel eh' was gemeint ist. Die Entstehung einer Welle verdeutlicht man (und frau) sich am besten bei der Betrachtung von Wellen im Ozean, von Schallwellen (die aber nicht so ganz gut zu sehen sind, wohl aber zu hören) oder aber im schon stark abstrahierten (dafür aber sehr einfachen) Fall von gekoppelten Pendeln Oben (a): System von gekoppelten Pendeln. Das erste Pendel wird in die gezeigte Richtung ausgelenkt, die Welle pflanzt sich senkrecht zur Auslenkungsrichtung fort (Transversalwelle). Unten (b): Momentaufnahmen zu verschiedenen Zeiten (t0 < t15) des Pendelsystems. Die räumliche Periode der Welle ist λ, ihre Amplitude ist A. Einfache Wellen, i.d.R. solche mit kleinen Auslenkungen oder Amplituden, lassen sich oft durch eine Sinus-Funktion beschreiben. Die Auslenkung ψ als Funktion von Ort und Zeit lautet dann in der mathematisch einfachst möglichen Darstellung ψ(x, t) = A · sin x 2π · λ Die Gleichung enthält die drei Bestimmungsstücke einer Welle: Die Amplitude A. MaWi 2 Skript - Page 80 – ν·t Die Wellenlänge λ . Die Frequenz ν oder die PeriodendauerT = 1/ν. Das Argument der Sinusfunktion ist die Phase der Welle. Man erkennt an der Phase, daß sich die Amplitude der Welle bei einer festen Zeit t mit der Wellenlänge λ wiederholt. Die Frequenz der Welle ist die reziproke Zeit, die von der Welle benötigt wird, um sich um eine Wellenlänge fortzupflanzen. Es ist sehr wichtig sich klar zu machen, dass bei dieser einfachst möglichen Sinuswelle die Wellenlänge und die Frequenz nicht mehr unabhängige Größen sind. Es gibt eine Beziehung zwischen diesen Parametern, die (notwendigerweise) noch eine 4. Kenngröße der Welle, nämlich ihre Ausbreitungsgeschwindigkeit (Besser Phasengeschwindigkeit) v enthält. Dies Beziehung ist leicht herzuleiten: In der Periodendauer T = 1/ν hat sich die Welle offenbar genau um eine Wellenlänge λ fortgepflanzt. Damit definiert sich die Phasengeschwindigkeit v der Welle als λ = ν·λ v = T Phasengeschwindigkeit deswegen, weil es ja nur die Phase ist, die "läuft". Die Welle selbst hat in unserer mathematischen Idealisierung kein Anfang und kein Ende - sie ist überall schon da. Das einzige was sich "bewegt", ist die Phase. Man denke an eine Welle auf dem Meer, die in Richtung Strand auf einen zuläuft: Es sind nicht die Wasser"teilchen" die laufen, auch wenn das so aussieht, es ist die Phase der Welle. Die Wasserteilchen bleiben in Laufrichtung ortsfest, sie bewegen sich nur auf und ab (außer bei Tsunamis!). Für elektromagnetische Wellen im Vakuum haben wir natürlich (???) v = c = Lichtgeschwindigkeit im Vakuum. Für andere Wellensorten muß die Ausbreitungsgeschwindigkeit aber aus unabhängigen Größen ermittelt werden. Die Schallgeschwindigkeit ist beispielsweise keine Naturkonstante oder sonstwie "gegeben", sondern eine spezifische Eigenschaft des betrachteten Mediums, die sich aus der Wechselwirkung der Atome oder Moleküle ergibt (bei Festkörpern also mal wieder aus den Bindungen). Bei gleicher Frequenz laufen Schallwellen deshalb verschieden schnell durch verschiedene Materialien. Anstelle der Frequenz ν wird aus schreibtechnischen Gründen häufig die Kreisfrequenz ω verwendet; es gilt ω := 2πν So wie man statt der Periodendauer T auch die Kreisfrequenz ω = 2π/T verwenden kann, nimmt man statt der Wellenlänge auch gerne den Wellenvektor k, definiert durch 2π |k| = k = λ Der Wellenvektor k wird spätestens bei zweidimensionalen Problemen benutzt, da er zusätzlich zur Wellenlänge λ auch noch die Ausbreitungsrichtung der Welle angibt (die Richtung des Wellenvektors liegt in der jeweilige Ausbreitungsrichtung). Damit schreibt sich die Gleichung einer eindimensionalen Welle in x-Richtung. ψ(x, t) = A · sin (k · x – ω · t) Der Übergang zu drei Dimensionen, in denen sich dann "unsere" Welle in irgendeine räumliche Richtung fortbewegt (und noch ganz andere Wellen möglich werden) ist jetzt einfach: Wir verwenden Vektoren, ersetzen x durch den Ortsvektor r = (x, y, z) und k durch k = (kx, ky, kz ), und erhalten ψ(r, t) = A · sin (k · r – ω · t) Die mit dieser Formel beschriebene Welle heißt auch laufende ebene Welle oder kurz ebene Welle; siehe unten. MaWi 2 Skript - Page 81 Räumliche Darstellung einer ebenen Welle. Die Wellenfront pflanzt sich überall in gleicher Weise senkrecht zum Wellenvektor fort. Ebene Wellen dieser Art haben einige wichtige allgemeine Eigenschaften: Entlang einer Wellenfront, die per definitionem senkrecht zum k-Vektor verläuft und unendlich ausgedehnt ist, herrscht immer die gleiche Amplitude, da auf der Ebene der Wellenfront das Skalarprodukt k · r konstant ist. Wer das nicht sofort nachvollziehen kann, sollte sich den Modul über Vektorrechnung genau ansehen. Eine mathematische ebene Welle hat keinen Anfang und kein Ende - weder in der Zeit noch im Raum. Sie kann damit immer nur eine Näherung an eine reale Welle sein. Die Ausbreitungsgeschwindigkeit ist v = ν · λ, wie oben schon festgehalten - aber das gilt nur für simple ebene einfache "Sinus"wellen. Es gilt im Allgemeinen nicht mehr für die Überlagerungen mehrerer Wellen. Das kann man am besten einsehen, wenn man sich zwei ebene Wellen vorstellt, die sich nur im Vorzeichen der Ausbreitungsrichtung unterscheiden und dann überlagern. Das Ergebnis ist eine stehende Welle, mit einer Ausbreitungsgeschwindigkeit von Null - obwohl die beiden Teilwellen für sich mit jeder beliebigen Geschwindigkeit laufen können! Aber auch für einfache ebene Wellen muß die Ausbreitungsgeschwindigkeit keinewegs eine Konstante sein. Für elektromagnetische Wellen ist c zwar die Lichtgeschwindigkeit, aber die ist nur im Vakuum eine absolute Konstante. Im allgemeinen kann v von der Wellenlänge bzw. Frequenz abhängen. Der funktionale Zusammenhang zwischen λ und ν für eine einfache Sinuswelle, d.h. die Funktion ν(λ) heißt Dispersionsrelation. Die Bestimmung der Dispersionsrelation für die interessierenden Wellen in einem Material ist immer das erste Ziel einer Theorie. Man kann statt der Beziehung zwischen Frequenz und Wellenlänge genausogut die Beziehungen zwischen Kreisfrequenz und Wellenvektor, oder Energie (proportional zur Kreisfrequenz) und Wellenvektor, oder ... nehmen. Großzügig nennen wir die jeweilige Beziehung immer Dispersionsrelation. Eine mathematisch elegantere Darstellung einer ebenen Welle benutzt die komplexen Zahlen; wir erhalten durch Verwendung der Eulerschen Beziehung die Darstellung ψ(r , t) = A · exp [i · (k · r + ω · t)] = A · exp [i · k · r] · exp [i · ω · t] Dabei wird in der klassischen Physik bzw. in der Elektrotechnik stillschweigend vereinbart, daß immer nur der der Real- bzw. der Imaginärteil die real meßbare Situation beschreibt. Dies gilt nicht mehr in der Quantentheorie! Es ist eben eine der Merkwürdigkeiten der Quantentheorie, daß die Wellenfunktion eine "reale" komplexe Größe ist. Mutter Natur kümmert sich nicht darum, ob wir das verstehen; es ist halt so. Das ist vielleicht schwer zu akzeptieren, aber das galt für die die irrationalen Zahlen auch mal. Pythagoras ließ einen seiner Schüler sogar hinrichten, weil der Ketzer behauptete, daß es irrationale Zahlen wirklich gäbe. Heute ist es viel ungefährlicher, seinem Professor zu widersprechen, und auch das ist im Wesentlichen eine Errungenschaft der Naturwissenschaft/Technik und nicht der Philosophie. MaWi 2 Skript - Page 82 Beziehung zwischen Wellen und Teilchen (de Broglie-Relation): Nach de Broglie gilt, daß es zwischen Teilchen und Wellen eine Beziehung gibt, insbesondere für massebehaftete Teilchen atomarer Größenordnungen. So gibt es Experimente, die sich nur durch die Beschreibung eines Elektrons als Welle verstehen lassen, andere aber nur durch die Beschreibung als Teilchen. Zwischen dem Wellenaspekt (ausgedrückt in der Wellenlänge λ), und dem Teilchenaspekt (ausgedrückt als Impuls p) gilt der Zusammenhang: h p = λ Mit h = Plancksches Wirkungsquantum = 6.6262 · 10– 34 J · s (oft benutzt als "h quer" = 34 J · s). = h/π = 1.0546 · 10 – Mit Hilfe des Wellenvektors k kann diese Beziehung auch vektoriell formuliert werden: p = ·k Schlußendlich haben wir noch die Heisenbergsche Unschärferelation ∆ px · ∆ x ≥ h Sie sagt uns, wie genau wir eine von zwei komplentären Größen kennen (nicht nur messen!) können, falls die Andere mit einer gegebenen Genauigkeit ("∆") bekannt ist. Aus der Quantenmechanik ist weiterhin die ganz allgemeine Energieformel bekannt, die für alle Wellen gilt und als E immer die (konstante) Gesamtenergie angibt. E = h·ν Damit haben wir einen Satz von Beziehungen zwischen Welleneigenschaften, Teilcheneigenschaften, Energie und Impuls. Sie ergeben sich aus der Schrödingergleichung und fließen in die quantenmechanische Beschreibung von "Materiewellen" und anderer Wellen ein. MaWi 2 Skript - Page 83 2.5.2 Verschiedene Wellensorten Laufende ebene Wellen In Kapitel 2.2.2 haben wir für periodische Randbedingungen für die Wellenfunktion des Elektrons eine laufende, ebene Welle bekommen, beschrieben durch. ψ(r,t) = A · exp[i · k · r] · exp [i · ω · t] = A · exp[i · k · r + i · ω · t] Betrachten wir diese Funktion nun etwas näher. Falls wir nur den Realteil verwerten, erhalten wir Re ψ(r,t) = A · cos[ k · r + ω · t] Es handelt sich also offensichtlich um eine laufende ebene Welle, da die Phase sich linear mit der Zeit ändert. Zu jedem Zeitpunkt ti sieht man eine Momentaufnahme der Welle; etwas später zum Zeitpunkt ti + ∆t, hat sich der Sinus etwas "verschoben" - die Welle "läuft"; wie weiter unten dargestellt. Für den Imaginärteil gilt natürlich in Prinzip dasselbe. In der Quantenmechanik betrachten wir nicht nur den Realteil, denn die Wellenfunktion ist eine intrinsisch komplexe Funktion, d.h. nicht nur aus Gründen der Schreibökonomie. Physikalische Bedeutung hat aber (für uns) nur das Betragsquadrat der Wellenfunktion, ψ · ψ*; und das ist eine reelle Funtion oder Zahl. Wir erhalten: ψ · ψ* = AA* Das Betragsquadrat dieser Wellenfunktion ist also eine Konstante, r und t "fliegen raus". Damit ist die Aufenthaltwahrscheinlichkeit des Elektrons im betrachteten Raum überall gleich - wir haben das bereits besprochen. Unten ist die Wellenfunktion für zwei verschiedene Zeiten und die Aufenthaltswahrscheinlichkeitsdichte |ψ|2 dargestellt. MaWi 2 Skript - Page 84 Stehende Wellen Falls wir feste Randbedingungen gewählt hätten, werden wir als Lösung der Schrödingergleichung stehende Wellen bekommen. Die Formel dazu sieht so aus: ψ(r,t) = exp[+ i · k · r] · exp [i · ω · t] ± exp[– i · k · r] · exp [i · ω · t] Eine stehende Welle ergibt sich danach, falls man zwei Wellen die in entgegengesetzte Richtung laufen überlagert. Wie man das macht ist egal - daher das ± Zeichen. Wir haben immer eine hin- und eine zurücklaufenden Welle. Sowohl für die hin- als auch für die rücklaufende Welle werden wir die gleiche Kreisfrequenz finden. Dies liegt an der Inversionssymmetrie, die für alle (pysikalisch sinnvolle) Systeme gilt, also ω(k) = ω(-k). Betrachten wir den Fall mit der + Überlagerung der beiden Wellen, so ergibt sich ψ(r,t) = 2 · cos[k · r] · exp [i · ω · t] Der Realteil dieser Funktion zeigt wiederum die Eigenschaften dieser Welle: Re ψ(r,t) = 2 · cos[ k · r] · cos [ ω · t] Das Betragsquadrat der Wellenfunktion, also die quantenmechanische Aufenthaltwahrscheinlichkeit von z.B einem Elektron. ist nun nicht mehr konstant im Raum, sondern gegeben durch |ψ|2 = 4 · cos2(k · r) Und das sieht für zwei stehende Wellen ψ1 und ψ2, mit Frequenz ν1 und ν2 = 2ν1 (oder k2 = 2k1) so aus: Die Wahrscheinlichkeitsdichte hat jetzt Maxima und Minima an denen sie = 0 ist. MaWi 2 Skript - Page 85 Kugelwellen Kugelwellen sind Wellen, die sich von einem Punkt aus in alle Richtungen gleichförmig ausbreiten. Zweidimensional kennt das jede und jeder, die/der schon mal einen Stein ins Wasser geworfen hat. In der Welt der Physik/Materialwissenschaft treten Kugelwellen aber auch auf wenn man z.B. Licht (oder Elektronenwellen oder Phonen (= Gitterschwingungen) oder ...) an einem "punkt"förmigen Streuzentrum (ein Atom, ein anderes Elementarteilchen, eine Ausscheidung ...) , nun ja, halt streut. Jedes denkbare Streuzentrum ist hinreichend punktförmig, wenn es viel kleiner ist als die Wellenlänge der Welle die gestreut wird. Die gestreute Welle wird im Nahfeld, d.h. in der Nähe des Streuzentrums, beschrieben durch 1 ψ (| r |, t) = · exp [i · (|k | · | r| + ωt)] |r| Und das sieht so aus: Elektron als Wellenpaket Wie beschreibt man nun ein einzelnes Elektron, Proton, Neutron (oder, falls wir gleich verallgemeinern: ein Atom, viele Atome; Herrn Schröder, das Universum); das wir nicht als Lösung der Schrödingergleichung bekommen, sondern von dem wir einfach wissen, daß es sich irgendwo, d.h. an einem halbwegs definierten Ort befindet, und keinesfalls überall gleichzeitig sein kann. Außerdem wird es evtl. auch noch mit einem halbwegs definierten Impuls herumlaufen. Eine unendlich ausgedehnte ebene Welle mit konstanter Aufenthaltswahrscheinlichkeit überall kann das einfach nicht leisten. Wir beschreiben das so, dass wir den ebenen Wellenterm exp(ikr) behalten, aber das Teilchen trotzdem halbwegs lokalisieren. Wir betrachten jetzt also ein Elektron das aus irgendwelchen Gründen nicht mehr gleichmäßig über den ganzen Raum verschmiert ist, sondern in einem mehr oder weniger präzise definierten Raumbereichlokalisiert ist. Es hat dann keinen reinen Wellencharakter mehr, sondern verhält sich auch wie ein Teilchen, da es nur in einem bestimmten Raumbereich eine endliche Aufenthaltswahrscheinlichkeit hat. Rein mathematisch beschreiben wir das mit einem Wellenpaket, das wir durch eine Überlagerung von ∞ vielen Wellen erhalten. . Dazu nehmen wir Wellenvektoren mit verschiedenen Amplituden; d.h. A = A(k) aus einem Intervall [k – ∆k/2 , k + ∆k/2] Die ∞ vielen Wellen werden aufaddiert oder integriert; wir erhalten k + ∆k/2 ψ(| r |, t) = ⌠ ⌡ A(k) · exp[i · (k · r + ω · t)] · dk k – ∆k/2 Jetzt müßte es im Kopf klingeln: Das sieht nicht nur wie eine Fouriertransformierte aus, sondern das ist dei Fouriertransformiert des "Spektrums", der Verteilung der Amplituden auf die k-Werte (und damit auch auf die Frequenzwerte). Was dabei rauskommt so etwa so aus: MaWi 2 Skript - Page 86 Elektron als Wellenpaket zu verschiedenen Zeiten. Der Realteil der Wellenfunktion ist durchgezogen dargestellt, die Wahrscheinlichkeitsdichte gestrichelt. Kann man das einfach verstehen? Ja - wir brauchen nur einen Haufen Sinüsse mit verschiedenen Wellenlängen zu nehmen, die wir so überlagern, daß bei x = 0 alle den Wert 1 haben. Die Überlagerung produziert dann bei x = 0 einen ziemlich großen Wert, aber etwas entfernt davon, gibt es nur noch ein wildes Gewusel aller möglichen Werte, die sich gegenseitig aufheben. Etwas vornehmer ausgedrückt: Die Fouriertransformierte einer Deltafunktion enthält alle Frequenzen von0 bis ∞ mit gleicher Amplitude. Engen wir den Frequenzraum ein (indem wir z.B. die Amplitude mit wachsendem Abstand von einer Grundfrequenz auf 0 fahren, ergibt sich ein Wellenpaket. Das Wellenpaket hat also eine Unschärfe des Wellenvektor von ∆k, und damit eine Impulsunschärfe. Nach der Unschärferelation ist das Elektron daher auf einen endlichen Raumbereich ∆x beschränkt, im Gegensatz zum Elektron als laufende Welle, das im gesamten Raum verteilt ist. Ein gewisses Problem eines Wellenpaketes ist, daß es im Laufe der Zeit auseinanderlaufen kann (je nach Dispersionsrelation). Dies ist im obigen Bild extrem übertrieben dargestellt (für ein Elektron, das nur so durchs Universum läuft, wären mehrere Alter des Universums erforderlich, bevor es so auseinanderläuft wie dargestellt). MaWi 2 Skript - Page 87 Merkpunkte Kapitel 2: Elektronen in Festkörpern Ohmsches Gesetz 1 I ∝ U = ·U R besser: j = σ E Elektrischer Strom je = mechanischer Strom jT geladener Teilchen q = Ladung des Teilchens je = q · jT jT = Zahl Teilchen N pro Fläche F und Zeit t N = F·t Es zählt nur der Nettostrom = Differenz der Teilströme. Der Nettostrom ist bestimmt durch die Driftgeschwindigkeit vD j = q · n · vD Damit ergibt sich die "Mastergleichung" für die Leitfähigkeit; µ ist der Materialparameter "Beweglichkeit" = vD/E σ = q·n·µ Die Existenz einer konstanten Driftgeschwindigkeit trotz einer konstante Kraft erfordert die Existenz von "Reibung" = Stöße im Mikroskopischen. E·e·τ vD = – m Stoßpartner für die Elektronen sind Phononen, Kristallgitterdefekte und andere Elektronen. l = µ = 2τ(v 0 + vD) e·τ vD Die entscheidenden Parameter sind die mittlere Stoßzeit τ und die damit verknüpfte mittlere freie Weglänge l = E m n · e2 · τ Es ergeben sich die nebenstehenden Beziehungen. σ = = m Die mittlere thermische Geschwindigkeit v0 folgt aus der klassischen Thermodynamik: n · e2 · l 2 · m · (v0 + vD) E = Ekin = ½ m · v02 = 3/2 kT v0 = MaWi 2 Skript - Page 88 3 kT 1/2 m Für Metalle mit bekannter Konzentration n der Elektronen und gemessenen Leitfähigkeiten lassen sich die interessanten Größen ausrechnen; man erhält v0 ≈ 5 · 104 m/s τ ≈ 4 · 10–14 s Das kann nicht stimmen - insbesondere l ist viel zu klein! vD ≈ 6 · 10–1 m/s Offenbar ist Quantentheorie erforderlich! l ≈ 3 nm Der Hall Effekt betrachtet Stromfluß im Magnetfeld Bz . Bei orthogonaler Geometrie wird senkrecht zu Ex und Bz eine Hallspannung Ey · Breite induziert. Ey = – µ · Ex · Bz = RHall · Bz · jx µ Damit sind Beweglichkeiten direkt meßbar; das Vorzeichen der Hallkonstante gibt direkt das Vorzeichen der fließenden Ladungen. RHall = ± σ Gelegentlich findet man positive Ladungen; klassisch nicht erklärbar.Offenbar ist Quantentheorie erforderlich! Näherung (= Modell) des freien Elektrongases Nur ein Elektron; Potential V = const = 0 im Kristall der Länge L; periodischen Randbedingungen Ergebnis: Welle mit Amplitude (1/L)3/2 ψ(r) = 1 3/2 · exp (i · k · r) L Aufenthaltswahrscheinlichkeit überall gleich! Das Elektron ist "ausgeschniert". ψ · ψ* = 1/L 3 Entscheidende Größe ist der Wellenvektor k. Er bestimmt direkt: kx = ± Die "Nummer" (= Quantenzahlsatz) der Lösung. Den Impuls p = ny · 2π ky = ± L ny · 2π kz = ± L L k. Die Gesamtenergie E ∝ k2. Die Wellenlänge λ = 2π/k. Die Energie ist bezüglich der Quantenzahlen entartet. Die Zustandsdichte D(E) mißt, wieviel Zustände ∆Ne sich in einem Energieintervall ∆E und im Volumen V befinden. ∆Ne = D(E) · ∆E · V Die Zustandsdichte ist über Abzählen im Phasenraum (= Raum der Wellenvektoren) leicht zu berechnen. (2 · m)3/2 · E 1/2 D(E) = 2· Beim Auffüllen der Zustände mit Elektronen (bei T = 0 K), wird bei einer definierten Energie - der Fermienergie EF - das letzte Elektron MaWi 2 Skript - Page 89 3 · π2 nz · 2π Beim Auffüllen der Zustände mit Elektronen (bei T = 0 K), wird bei einer definierten Energie - der Fermienergie EF - das letzte Elektron untergebracht sein. 2 2/3 2 3π · ne 2me EF = Für eine bekannte Elektronendichte ne ist die Fermienergie leicht berechenbar. Zustandsdichte und Fermienergie sind für die elektronischen Eigenschaften realer Kristalle die wichtigsten Kenngrößen überhaupt! Sie sind immer noch wohl definiert, auch wenn die einfachen Modellformeln des freien Elektronengases für reale Kristalle modifiziert werden müssen! Fermi-Dirac Verteilungsfunktion f(E, EF, T) = Wahrscheinlichkeit dafür, daß ein Platz bei der Energie E in einem System mit Fermienergie EF und Temperatur T besetzt ist. Damit Wahrscheinlichkeit für Nichtbesetzung 1 – f(E, EF, T) Die "Fermi Verteilung" oder "Fermi Statistik" hat die nebenstehende Gestalt: 1 f(E, T) = f(E, EF, T) ist eine universelle Funktion die für alle fermionischen Systeme im thermodynamischen Gleichgewicht gilt Für den "Hochenergieschwanz" darf man die Boltzmannverteilung verwenden E – EF exp kT + 1 E – EF für E > EF f(E, T) ≈ exp – kT f(E = EF) = ½ definiert die Fermienergie Der "Aufweichungsbereich" liegt in der Größenordnung kT Wichtige Formeln sind ∞ n = Gesamtvolumendichte der Elektronen des Systems. n = ⌠ D(E) · f(E,T) · dE ⌡ 0 n(E1, E2) = Volumendichte der Elektronen im gegebenen Energieintervall E(E1, E2) = Gesamtenergie(volumendichte) im gegebenen Energieintervall E2 ⌠ D(E) · f(E,T) · dE ⌡ n(E1, E2) = E1 Dies Gleichungen gelten immer, d.h. nicht nur für das freie Elektronengas. Im realen Kristall unterscheidet sich hier nur die Zustandsdichte von der des freien Elektronengases. MaWi 2 Skript - Page 90 E2 E(E1, E2) = ⌠ E · D(E) · f(E,T) · dE ⌡ E1 Molare Wärmekapazität Metall ist klassischtheoretisch immer C = Ce + CGitter = 6/2 · R + 3/2 · R = 9/2 · R Das ist experimentell doppelt falsch: 1. Gitteranteil geht ⇒ 0 für T ⇒ 0 K 2. Elektronenanteil immer << 3/2 · R Fehler bei Elektronen: Pauli Prinzip nicht berücksichtigt Richtig ist: Nur Elektronen mit freien Plätzen in der Nachbarschaft im k-raum können Energie aufnehmen. !!! Sehr wichtiges Prinzip !!! Das sind nur die Elektronen im "Aufweichungsbereich" der Fermivertteilung Richtige Formel ∞ Strickmuster ist immer: Zustandsdichte mal Fermiverteilung = Dichte Elektronen bei E; mal E = gesamte Energie der Elektronen bei E, Aufsummieren (= integrieren) E = ⌠ E · D(E) · f(E,T) · dE ⌡ 0 ∞ C = dE/dT ≈ d 1 ⌠ D(EF) · (E – EF) · dE ⌡ dT exp – (E – E )/kT F 0 π2 T ≈ ·R· 2 TF Rechnerei trickreich; braucht Näherungen. Schnelle Abschätzung gibt 9NA Merke: Mathe kann schwierig sein, Physik ist aber klar. Ce ≈ 2EF Bei klassischer Leitfähigkeit ebenfalls Fehler weil kein Pauli Prinzip berücksichtigt. kT · k2T = 9/2 R · T = 9/2 R · EF 1/2 m · vF2 = k · T F Dadurch ist die mittlere Geschwindigkeit v0 viel zu klein "Reparatur" klassischer Formel: Ersetze v0(klassisch) durch "Fermigeschwindigkeit vF" Damit größere freie Weglängen; grundsätzliches Verständnis möglich. Genauer Betrachtung der mittleren freien Weglänge als Funktion von Temperature, Defekten, Legierung usw. ergibt die klassishen "Reglen" und "Gesetze" für die Leitfähigkeit der Metalls. Matthiesen Regel: ρ ≈ ρ0 (1 + αT) α ≈ 4 · 10– 3 K– 1 Nordheim Regel: ρ ∝ Konz. Legierungselement MaWi 2 Skript - Page 91 TF 3. Struktur von Kristallen 3.1 Grundbegriffe 3.1.1 Wiederholung 3.2 Beugung von Wellen in Kristallen 3.2.1 Elektronen- und andere "Materiewellen" 3.2.2 Das Bragg-Gesetz 3.2.3 Zusammenfassung Kapitel 3.2 3.2.4 Merkpunkte Kapitel 3.2 3.3 Das reziproke Gitter 3.3.1 Formale Definition und Eigenschaften 3.3.2 Die Ewald Konstruktion der Beugung 3.3.3 Zusammenfassung Kapitel 3.3 3.3.4 Merkpunkte Kapitel 3.3 3.4 Die Intensität der gebeugten Wellen 3.4.1 Der Strukturfaktor 3.4.2 Strukturfaktoren einiger wichtiger Kristalle 3.4.3 Zusammenfassung Kapitel 3.4 3.4.4 Merkpunkte Kapitel 3.4 3.5 Experimentelle Methoden zur Kristallstrukturanalyse 3.5.1 Beugungsverfahren 3.5.2 Elektronenmikroskopie 3.5.3 Zusammenfasuung Kapitel 3.5 MaWi 2 Skript - Page 92 3. Struktur von Kristallen 3.1 Grundbegriffe 3.1.1 Wiederholung In diesem sehr kurzen Unterkapitel werden nur die wichtigsten Dinge aufgezählt (und verlinkt), die wir über Kristalle bereits gelernt haben. Betrachten wir zunächst den Idealkristall Ein Idealkristall definiert sich über Kristall = Gitter = + Basis + oder Das Gitter ist ein mathematisches Konstrukt; eine sinnvolle Klassifizierung nach Symmetrien benutzt die 14 Bravais Gitter Jeder Vektor T des Gitters läßt sich durch eine geeignete Kombination der im Ortsraum definierten Basisvektoren ai darstellen: T = n1 · a1 + n2 · a2 + n3 · a3 Dabei sind die ni ganze Zahlen (inkl. der Null). Ein so definierter Vektor T endet immer auf einem Gitterpunkt und heißt auch Translationsvektor des Gitters weil eine Verschiebung des Gitters um T das ideale, d.h. ∞ ausgedehnte Gitter unverändert läßt. Man muß aber zur Beschreibung eines Kristalls nicht unbedingt eine auf Bravaisgitter oder primitiven Gittern beruhende Elementarzelle nehmen, es gibt auch noch eine andere Optionen: Die Wigner-Seitz Elementarzelle wird hier wichtig werden; wir schauen sie mal kurz an. Gegeben sei ein beliebiges Gitter (schwarz; hier zweidimensional). Von einem willkürlichen Gitterpunkt aus ziehen wir Strecken zu benachbarten Gitterpunkten (blau), auf denen wir Mittelhalbierende errichten (rot). Die Mittelhalbierenden bilden einen geschlossenen Polygonzug sobald wir genügend viele Strecken konstruiert haben. Im Dreidimensionalen resultiert ein Polyeder - die Wigner-Seitz Elementarzelle. Das resultierende (etwas unelegante) Gitter ist zur Konstruktion eines Kristalls genau so gut geeignet wie das ursprüngliche Gitter, wir müssen nur vereinbaren, dass wir die Basis in das Zentrum der Wigner-Seitz Zelle setzen. Die Konstruktion mag die vorhandenen Symmetrien verbergen und unelegant erscheinen - aber sie ist universell und wird sich als nützlich erweisen. Die Basis beschreibt die Konfiguration der Atome; d.h. ihre Art, Zahl und Anordnung im Raum. Eine Basis kann sehr einfach sein, z.B ein Atom der Sorte i auf den Koordinaten (0 0 0) eines cartesischen KOSystems. Sie kann aber auch sehr kompliziert sein und viele Atome verschiedener Sorten umfassen. Wir haben dann j Sätze von Vektoren ri die zu den Atomen einer Atomsorten i führen; und soviel Sätze j wie Atomsorten. Im Gegensatz zum Idealkristall besteht ein Realkristall meist aus sehr vielen kleinen Kristalliten, die wiederum Gitterdefekte enthalten. Grob klassifiziert unterscheiden wir vier Defekttypen: MaWi 2 Skript - Page 93 0-dimensionale Defekte; z.B Atomare Fehlstellen. 1-dimensionale Defekte; das sind die Versetzungen. 2-dimensionale Defekte; z.B. Korngrenzen oder Phasengrenzen. 3-dimensionale Defekte; z.B. Ausscheidungen. Beschreibung von Richtungen und Ebenen in Kristallen: Grundsätzlich wird im Koordinatensystem des durch die Basisvektoren definierten Gitters gearbeitet. In nichtkubischen Kristallen (d.h. nicht-cartesischen Systemen) ist dann bei den vertrauten Formeln der Vektorrechung Vorsicht geboten! Grundsätzlich werden für die Beschreibung von Richtungen und Ebenen dieMiller-Indizes verwendet. Die Beschreibung bezieht sich immer auf das Gitter. Die Zentren einzelner Atome müssen deshalb nicht auf Richtungen oder Ebenen liegen. Die Konvention für die Richtungs- und Ebenenindizierung ist: <u v w> = Gesamtheit der kristallographisch gleichwertigen Richtungen. [u v w] = Spezifische Richtung. {h k l} = Gesamtheit der kristallographisch gleichwertigen Netzebenenscharen. (h k l) = Spezifische Netzebenenschar. Fragebogen / Questionaire Multiple Choice Fragen zu 3.1.1 MaWi 2 Skript - Page 94 3.2 Beugung von Wellen in Kristallen 3.2.1 Elektronen- und andere "Materiewellen" Grundsätzlich interessieren wir uns jetzt für das Verhalten von Wellen in Kristallen, wobei nur Wellen interessieren, deren Wellenlängen λ = 2π/|k| nicht sehr viel größer sind als die Gitterkonstante a des Kristalls. Wir gewöhnen uns schon mal daran, dass wir anstelle der Wellenlänge λ zunehmend den Wellenvektor k der betrachteten Welle verwenden. Damit reden wir nicht über "Licht" mit Wellenlängen im 1 µm Bereich; auch nicht über ultraviolettes Licht mit Wellenlängen im 0,x µm Bereich, wohl aber über Röntgenstrahlung und "Materiewellen". Warum diese Einschränkung? Weil Wellen mit zu kleinen Wellenvektoren (und damit zu großen Wellenlängen) die Periodizität des Kristalls gar nicht spüren können (wir werden noch sehen warum). Für diese Wellen ist der Kristall schlicht ein homogenes Medium; für Lichtwellen z.B. hinreichend charakterisiert durch den Brechungsindex n = (εr)½ oder die (relative) Dielektrizitätskonstant εr. (Elementarformeln wie diese werden übrigens nicht mehr erklärt!) Wir haben schon viel über Elektronenwellen gelernt, die als Lösung der Schrödingergleichung (für das Modell des freien Elektronengases) im Kristall herumlaufen. Jetzt fragen wir uns, was geschieht, wenn wir Elektronen(wellen) von außen in den Kristall "hineinschießen". Die Antwort auf diese Frage wurde zuerst theoretisch gegeben, heute ist sie in jedem (Durchstrahlungs)elektronenmikroskop (transmission electron microscope, TEM) experimentell implementiert. Schauen wir uns das Prinzip des TEM ein bißchen genauer an. (im Link gibt es zusätzliche Details). In einer "Elektronenkanone" wird ein halbwegs gebündelter Elektronenstrahl erzeugt. Dazu werden durch Glühemission aus einer Kathode Elektronen freigesetzt und elektrostatisch durch eine positiv geladenen Anode beschleunigt. Mit "Wehnelt Zylindern" oder anderen elektrostatischen oder magnetischen "Linsen" wird der erzeugte Elektronenstrahl gebündelt und fokussiert. Das generelle Prinzip wird auch in jeder Fernseh- oder Monitor-Bildröhre genutzt - entscheidend für die Wellenlänge der Elektronenstrahlwelle ist die Höhe der Beschleunigungsspannung Ue; sie bestimmt Energie Ee, Impuls pe, und damit auch die Wellenlänge λe des Elektronenstrahls Die Energie Ee ist natürlich schlicht Ee = e · Ue d.h. die Elektronen im Elektronenstrahl haben genau (± thermisches Rauschen im 1 eV Bereich) die Energie in [eV] die der Beschleunigungsspannung entspricht - so war die Energieeinheit [eV] schließlich definiert. Diesen Elektronenstrahl jagen wir durch die Probe hindurch (sie muß dann natürlich sehr dünn sein; siehe unten). Die Wechselwirkung des Elektronenwellenstrahls mit der Struktur der Probe (inklusive der Defekte in dieser Struktur) führt zu einer Modulation der Intensität (oder besser Amplitudenquadrat) des austretenden Strahls an der Unterseite der Probe. Die Intensitätsverteilung wird mit einem elektronenoptischen System stark vergrößert auf den Bildschirm projeziert voilà, das Bild der Struktur! Die Wellenlänge erhalten wir sofort über die de Broglie Beziehung und über die Beziehung zwischen Energie und Wellenvektor, die wir vom freien Elektronengas kennen, und die wir hier mit mehr Berechtigung anwenden dürfen als in einem Kristall. 2π pe = ·k = λe 2 · k2 Ee = = e ·Ue 2me Als Ergebnis erhalten wir die schlichte (aber auch nicht-relativistische!) Formel MaWi 2 Skript - Page 95 h λe = (2me · e · Ue)½ Damit sind Zahlenwerte leicht zu errechnen: Ue [V] λe [nm] 10 0.388 1 000 0.0388 10 000 0.0123 Gebräuchliche Elektronenstrahlsysteme verwenden typische Spannungsbereiche wie folgt: Cathode Ray Tube (Bildröhre) CRT U ≈ 20 kV RasterElektronenMikroskop REM U = (1 - 20) kV TransmissionsElektronenMikroskop TEM U = (100 - 400) kV "High Voltage" TransmissionsElektronenMikroskop (diese Mikroskope sind immer als TEM aufgebaut) HVTEM U ≈ (1 - 3) MV Für übliche Spannungen sind die Wellenlängen damit immer deutlich kleiner als die Gitterkonstanten. Neben den Elektronen können zur Strukturanalyse auch Neutronen, Photonen (d.h. also Röntgenstrahlung) und Atome eingesetzt werden. Die Wellenlängen ergeben sich nach der Formel von oben; wir müssen nur die jeweilige Masse und statt e ·Ue die jeweilige Teilchenenergie einsetzen. Für Neutronen und Atome erwarten wir aufgrund der sehr viel höheren Masse (ungefähr Faktor 2 000) eine entsprechend kleinere Wellenlänge. Soweit es die Welleneigenschaften der Teilchen betrifft, sind zunächst alle Teilchen "gleich" - wir haben immer für die (Momentaufnahme) jeder ebenen Welle immer die Formel ψ(r) = ψ0 · eikr Neben der in k "versteckten" Wellenlänge, unterscheiden sich die diversen Teilchenwellen aber grundsätzlich in der Art ihrer Wechselwirkung mit Materie. Und zwar insbesondere in einer Art von Wechselwirkung die uns hier weniger interessiert, nämlich in der Absorption. Wir haben folgendes Verhalten: Röntgenstrahlung durchdringt auch dickere Proben (z.B. Ihren Körper); einige mm sind immer drin. Schwere Atome absorbieren stärker als leichte, und energiereiche Strahlung kommt weiter. Röntgenanlagen sind relativ billig, so um € 100.000. Fast jeder Arzt hat eine Röntgenanlage, und jedes materialwissenschaftliche Institut hat mehrere. Neutronenstrahlen; üblicherweise aus einem Kernreakor "abgezapft", können sehr durchdringend sein, wiederum sind leichte Elemente tendenziell weniger absorbierend. Allerdings können hier kernphysikalische Spezialphänomene zuschlagen - bestimmte Isotope können sehr stark absorbierend wirken (das ist z.B wichtig für die Steuerung eines Kernreaktors). In manchen Fällen kann man viele cm eines Materials durchstrahlen. Neutronenstrahlen sind naturgemäß extrem teuer; in Deutschland gibt es < 6 Einrichtungen an denen "Neutronenstreuung" möglich ist. Elektronenstrahlen werden in allen Materialien sehr stark absorbiert, sie kommen nicht weit - Größenordnung µm. Die Präparate für TEM müssen dementsprechend sehr dünn sein - einige µm für HVTEM und ca. 10 nm für höchste Auflösung. Die Wechselwirkung von Welle und Materie bietet 3 grundsätzlich verschiedene Arten von Informationsbeschaffung über das Material: 1. Messung der lokalen Dicke/Materiedichte über die Absorption. Das macht der Arzt in der Schattenprojektion des Körpers mit Röntgenstrahlen - nicht weiter spannend. 2. Strukturbestimmung mittels Beugungsphänomenen. Das entscheidende Stichwort ist Interferenz - zwischen Welle und periodischem Objekt. Dies ist die eigentliche Domäne der Strukturbestimmung mit Wellen. 3. Direkte Strukturabbildung. Das ist die Domäne der Elektronenmikroskopie, in der man ein Bild der Struktur enthält. Hinter dem "Bild" steckt aber wiederum die Beugung der Wellen. Die im folgenden abgeleiteten Beziehungen zur Strukturbestimmung vernachlässigen die Absorption und gelten für alle Wellen; sie sind jedoch insbesondere nützlich für Elektronen- und Röntgenstrahlen. MaWi 2 Skript - Page 96 Fragebogen / Questionaire Multiple Choice Fragen zu 3.2.1 MaWi 2 Skript - Page 97 3.2.2 Das Bragg-Gesetz Vorbemerkungen Wellen sind Wellen sind Wellen sind Wellen sind... . Das klassische Youngsche Experiment mit Lichtwellen und Schlitzen in einer Blende gilt für jede Welle. Am jedem Schlitz (Kratzer im Glas, Hindernis, Atom, ...) werden von der einfallenden ebenen Welle Kugelwellen angeregt. Dabei soll in einer ersten Näherung nur ganz wenig Energie in die Kugelwellen fließen - die einfallende Welle wird also nicht nennenswert geschwächt. Wir wissen aber aus der "allgemeinen menschlichen Erfahrung" (die das Finanzamt immer gerne zitiert), daß ein einziges Atom einen Röntgen- oder Elektronenstahl auch nicht merklich beeinflussen kann; so ganz schlecht wird die Näherung also nicht sein. Die von vielen Atomen erzeugten Kugelwellen interferieren miteinander; das Ergebnis der Interferenz produziert irgendwelche neuen Wellen die neben der einfallenden (und in dieser Näherung ungeschwächt weiterlaufenden) Welle jetzt zusätzlich beobachtet werden können. Im klassischen Experiment mit 2 Spalten sieht das so aus Die von den zwei "Schlitzen" ausgesandten Sekundärwellen (= Halbkugelwellen) verstärken sich durch konstruktive Interferenz in bestimmten Richtungen, in anderen Richtungen hingegen löschen sie sich gegenseitig aus. Nehmen wir viele Spalten oder "Kratzer" auf einem Glasstück, die in konstanten Abständen angeordnet sind, erhalten wir ein (zweidimensionales) optisches Gitter. Sekundärstrahlung wird für eine gegebene Wellenlänge nur noch in wenigen ganz bestimmten Richtungen auftreten; wir erhalten "Reflexe". Hochenergetische Elektronen, die als dünner (Primär)strahl von außen in einen Kristall geschossen werden, verhalten sich im Kristall genauso wie außerhalb - nämlich als Wellen. Da ihre Wellenlänge zu den Dimensionen der Atome "paßt", regen sie diese zur Aussendung von Kugelwellen an. Die von den Atomen ausgesandten Kugelwellen verstärken sich durch konstruktive Interferenz in bestimmten Richtungen, in anderen Richtungen hingegen löschen sie sich gegenseitig aus. Alles wie oben - nur daß wir jetzt dreidimensional sind. Experimentell finden wir, daß nur in einige wenige Richtungen Sekundärstrahlen auftreten, d.h. Elektronenstrahlen den Kristall verlassen. Es erscheint als ob der Primärstrahl in bestimmte Richtungen reflektiert wird, auf einem Bildschirm um den Kristall herum erscheinen einige scharfe Reflexe. Diese in Richtungen der Beugungsmaxima gefundenen Reflexe werden auch als Bragg-Reflexe bezeichnet. Sie lassen sich z.B. mit Hilfe eines Leuchtschirms nachweisen. Die Beugung von Wellen am Kristallgitter wurde 1912 erstmals von Max von Laue nachgewiesen (allerdings für Röntgenstrahlung). MaWi 2 Skript - Page 98 Herleitung der Bragg Bedingung Zunächst machen wir uns klar, was wir ableiten wollen: Wir lassen eine ebene Welle unter irgendeinem Winkel Θ auf einen Kristall fallen. Nach dem bereits Gesagten müssen wir erwarten, daß sie einerseits einfach durch den Kristall läuft, andererseits aber auch vielleicht an Netzebenen des Kristall reflektiert wird, dabei gilt dann Einfallswinkel = Ausfallswinkel Diese Situation ist unten mal vereinfacht gezeigt; die betrachtete Netzebenenschar des Kristalls wirkt in diesem Bild auf die einfallende Welle wie ein Spiegel auf Licht. Im Grunde brauchen wir für die prinzipielle Betrachtung gar keine Atome, aber man darf sich getrost auf jedem Gitterpunkt mal ein Atom vorstellen. Bragg Bedingung erfüllt: Reflektion Die einfallende Welle hat den Wellenvektor k, die reflektierte Welle den Wellenvektor k'. Der Netzebenenabstand ist dhkl; wir können ihn leicht aus den Miller Indizes berechnen; b ist der Gangunterschied zwischen zwei Netzebenen. Die roten Linien markieren die Wellenfront in dem hier interessanten Bereich; im Prinzip sind sie natürlich genau wie die Netzebenen ∞ ausgedehnt (strichliniert angedeutet). Im Gegensatz zu normalem Licht und einem normalen Spiegel wird jedoch nicht jede Welle reflektiert, sondern nur Wellen die einen ganz bestimmten Einfallswinkel Θ = ΘBragg = ΘB haben oder, wie man auch sagt, bezüglich des Winkels eine sigenannte "Bragg.Bedingung" erfüllen. Warum das so ist, machen wir uns sofort klar. Vorher nochmal das Bild von oben; nur der Einfallswinkel Θ wurde leicht geändert - die Bragg Bedingung sei jetzt nicht mehr erfüllt Bragg Bedingung nicht erfüllt: Durchgang Das Bragg-Gesetzes oder die Bragg-Beziehung, die wir herleiten möchten, muß uns also sagen für welche speziellen Winkel Reflektion erfolgt und was diese Bragg-Winkel bestimmt. Die Herleitung des Bragg-Gesetzes ist verhältnismäßig einfach; insbesondere genügt es, nur zwei Netzebenen aus der ganzen Netzebenenschar zu betrachten. Wir nehmen die eingezeichneten horizontalen Netzebenen um das Bildchen einfach zu halten, wir könnten aber jede beliebige Netzebenenschar nehmen und was wir herleiten gilt auch für jede beliebige Netzebenenschar {hkl}. MaWi 2 Skript - Page 99 Betrachten wir die reflektierte Welle mit Wellenvektor k', so sehen wir, daß konstruktive Interferenz dann und nur dann auftreten wird, wenn der Gangunterschied 2b zwischen den an zwei benachbarten Netzebenen reflektierten Wellen genau ein Vielfaches der Wellenlänge λ beträgt. Das war's schon. Wir müssen die obige Prosa nur noch als Formel hinschreiben: 2·b = n·λ n = 1, 2, 3,.. b = dhkl · sinΘ Damit ergibt sich für den spezifischen Winkel ΘB bei dem, und nur bei dem Reflektion stattfindet die gesuchte Bragg-Beziehung 2 · dhkl · sinΘB = n·λ n·λ sinΘB = 2 · dhkl Eine simple, aber bemerkenswerte Gleichung! Zunächst fällt auf, daß für n · λ > 2 · dhkl keine Lösungen existieren, d.h. für Wellenlängen die größer sind als 2 mal die Gitterkonstante a gibt es schlicht keine Möglichkeit der konstruktiven Interferenz an Kristallen (denn das größtmögliche dhkl = a haben wir für die {100} Ebene). Für sehr kleine λ liegen die möglichen Reflexe sehr dicht beisammen; damit verwischt sich der Effekt der Beugung. Dann haben wir immer eine ganze Reihe von passenden Winkeln, oder Ordnungen von Reflexen, je nachdem welche ganze Zahl n wir wählen. Das ist ein bißchen störend, denn hier scheint ein Stück Unbestimmtheit vorzuliegen: Eine Ebenenschar macht viele Reflexe - wie soll man dann von den Reflexen auf die Ebene zurückschließen? Ist aber kein Problem. Denn für n = 1,2,3,... können wir auch schreiben dhkl, ½dhkl, (1/3)dhkl usw. Alles was wir jetzt tun müssen, ist die Reflektion 2. Ordnung (d.h. n = 2) nicht der Ebenenschar {hkl} zuzuschreiben, sondern der Schar {2h 2k 2l}, die Reflektion 3. Ordnung (d.h. n = 3) der Schar {3h 3k 3l} usw.; die Abstände stimmen dann automatisch. Auch deswegen wurde bei der Einführung der Miller Indizes das "Kürzen" nicht erlaubt, d.h. wir unterscheiden zwischen der {111}-Ebene und der {222}-Ebene usw. Schließlich bemerken wir noch, daß die Bragg-Bedingung für jede denkbare Ebenenschar gilt. Reflexe könne also - wir sind dreidimensional - in alle möglichen Richtungen auftreten, auch nach unten, durch den Kristall hindurch - immer vorausgesetzt, daß für die betrachtete Ebenenschar die Bragg-Bedingung erfüllt ist. Ist sie nicht erfüllt, passiert schlicht nichts. Im Umkehrschluß stellen wir fest, daß experimentell ermittelte Reflexe Aussagen über die Abstände von Ebenen enthalten und damit, wenn auch etwas indirekt, Aussagen über das Gitter. Mit geeigneten Beugungsexperimenten können wir also bestimmen, was für ein Bravaisgitter mit welcher Gitterkonstante vorliegt - wir haben das Universalinstrument der Strukturanalyse gefunden! Das Beugungsbild definiert als Endpunkte der erlaubten k'-Vektoren besteht also ggf. aus Punkten im Raum. Es ist noch wichtig festzuhalten, was uns die Bragg- Bedingung nicht sagt: Kein Wort über die Intensität der Reflexe! Aus der Bragg-Bedingung folgt bei Kenntnis der Geometrie lediglich, in welchen Raumrichtungen wir Reflexe erwarten dürfen, aber keinesfalls wie intensiv diese Reflexe sein werden. Und das ist auch gut so! Denn bisher haben wir nur mit dem Gitter des Kristalls gearbeitet; Atome waren formal gar nicht nötig. In realen Beugungsexperimenten erwarten wir aber schon, daß sich die Ergebnisse trotz gleichem Gitter unterscheiden werden, falls wir verschiedene Kristalle, d.h. verschiedene Basen und damit verschiedenen Atome haben. Und das Unterscheidungsmerkmal kann dann nur noch in den Intensitäten der Reflexe liegen! Bevor wir jetzt aber weitermachen mit der Diskussion der Konsequenzen der Bragg-Bedingung, wollen wir sie erst auf eine viel elegantere und mächtigere Form bringen. Dazu müssen wir eine neue Beschreibungsart von Gittern kennenlernen, das sogenannte reziproke Gitter, das sich zum Raumgitter etwa so verhält wie das Frequenzspektrum eines periodischen Signals zu der Darstellung über die Zeit. MaWi 2 Skript - Page 100 Wir werden das reziproke Gitter erst anschaulich, und danach mathematisch-formal einführen. Bragg Bedingung in Vektorschreibweise Das Bragg-Gesetz in obiger Formulierung ist eine Skalargleichung, in der statt dem Wellen vektor die skalare Wellenlänge steht. Eine Vektorgleichung wäre automatisch sehr viel allgemeiner und mächtiger; wir wollen deshalb jetzt das Bragg-Gesetz auf Wellenvektoren umschreiben. Das machen wir zunächst etwas unmathematisch durch eine Plausibilitätsbetrachtung. Dazu betrachten wir nochmals das Prinzipbild oben und unten. Wir haben eine einfallende Welle, vollständig charakterisiert durch ihren Wellenvektor k (und noch die hier uninteressante Amplitude), und eine gebeugte Welle k'. Da wir nur elastische Streuung betrachten, d.h. keine Energieänderungen zulassen, gilt immer |k| = |k'| Eine Vektorbeziehung zwischen k und k' kann im einfachsten Fall dann nur so aussehen k – k' = G |k| = |k'| Dabei ist G ein zunächst noch undefinierter Vektor, in dem aber "irgendwie" das Gitter stecken muß. Da die Wellenvektoren aber nicht im "normalen" Raum definiert sind, sondern im "Zustandsraum", muß auch G ein Vektor in diesem Raum sein. Falls wir zeigen können, daß ein Vektor G immer so definiert werden kann, daß unter allen Umständen für eine gegebene Geometrie (inkl. Gitter) die skalare Bragg Bedingung erfüllt ist, haben wir die gesuchte Vektorformulierung gefunden. Das ist einfach. Wir müssen nur die obige Vektorgleichung in Komponenten hinschreiben (das Bild unten hilft dabei), um sofort zu sehen, wie sich G bestimmt. Wir haben (zweidimensional) kx kz – k'x k'z = Gx Gz = 0 Gz = 0 k · sinΘ + k · sinΘ = 0 2k · sinΘ da in der gewählten Geometrie offensichtlich kx = – k'x gelten muß. Das schauen wir uns nochmal genau an: Für sinΘ haben wir in der bereits abgeleiteten skalaren Bragg-Beziehung schon eine Formel gefunden, die wir verwenden können. MaWi 2 Skript - Page 101 Ersetzen wir noch die Wellenlänge λ durch λ = 2π/|k| = 2π/k, erhalten wir für die z-Komponente des Vektors G λ Gz = 2k · sinΘ = 2π 2k · = 2 · dhkl k· 2π = k · dhkl dhkl Die z-Komponente des Vektors G ist aber identisch mit dem Vektor G selbst, da G offenbar immer senkrecht auf der betrachteten Ebene {hkl} stehen muß. Damit haben wir unseren Ansatz gerechtfertigt, das Ergebnis (das wir gleich dreidimensional verallgemeinern) ist erstaunlich einfach; wir schreiben es nochmals auf: Die Bragg-Bedingung in vektorieller Form lautet k – k' = Ghkl |k| = |k'| In Worten bedeutet das: Ein beliebiger Wellenvektor k wird an der Ebenenschar {hkl} dann und nur dann gebeugt, falls die Differenz von einfallendem und reflektiertem Wellenvektor identisch ist zu einem Vektor Ghkl, der die Ebenenschar {hkl} symbolisiert. Dabei hat Ghkl zwei einfache Eigenschaften, die diesen Vektor aber eindeutig bestimmen: 1. Ghkl steht senkrecht auf der Ebenenschar {hkl}. 2. Die Länge von Ghkl ist proportional zum reziproken Abstand der Netzebenen, es gilt immer 2π |Ghkl| = dhkl Wer bei dieser "Herleitung" das mathematische Bauchweh bekommt, schaut sich den Link an. Unabhängig davon muss aber noch eine Anmerkung gemacht werden: Der Abstand zwischen den Ebenen dhkl einer Ebenenschar definiert nur den Betrag von G. Die Richtung haben wir, wenn man das genau betrachtet, völlig willkürlich gewählt. Das bedeutet, dass wir im Bild oben bei G die Richtung auch undrehen könnten. Dann lautet die Bragg Bedingung: k' – k = Ghkl. Sobald wir eine formale Definition von G haben, sind die Vorzeichen dann festgelegt. Das reziproke Gitter MaWi 2 Skript - Page 102 Wir haben mit der vektoriellen Formulierung der Bragg-Bedingung einen außerordentlich weitreichenden Schritt gemacht. Wir haben Netzebenenscharen durch Vektoren repräsentiert. Nehmen wir nun alle möglichen Netzebenen eines gegebenen Gitters, konstruieren die jeweiligen Vektoren Ghkl, und tragen all diese Vektoren von einem gemeinsamen Ursprung an auf, werden die Endpunkte aller Vektoren ebenfalls ein Gitter definieren. Dieses Gitter nennen wir das reziproke Gitter, die Vektoren G heißen reziproke Gittervektoren. Ihre Einheit ist [G] = m– 1. Denn da alle Netzebenen eines Gitters durch die Angabe von drei Basisvektoren eindeutig definiert sind, werden auch drei Basisvektoren im reziproken Gitter ausreichen (müssen), um alle Vektoren des reziproken Gitters darstellen zu können. Das reziproke Gitter läßt sich in eineindeutiger Weise aus den Raumgitter konstruieren; die Umkehrung gilt auch. Das reziproke Gitter ist damit vollkommen äquivalent zum Raumgitter, d.h. es enthält exakt dieselbe Information wie das Raumgitter. Es ist aber für alle Phänome die sich mit Wellen in Kristallen befassen ungleich wichtiger als das Raumgitter, da sich die Mathematik sehr viel einfacher gestaltet (oder überhaupt nur im reziproken Gitter durchziehen läßt). Wir werden uns deshalb im nächsten Unterkapitel ausführlich mit dem reziproken Gitter befassen. Fragebogen / Questionaire Multiple Choice Fragen zu 3.2.2 MaWi 2 Skript - Page 103 3.2.3 Zusammenfassung Kapitel 3.2 Die Wechselwirkung von Kristallen mit Wellen, die Wellenlängen im Bereich der Gitterkonstante oder kleiner haben, ist das Rückgrat der gesamten Strukturanalytik. "Beliebt" sind Röntgenstrahlen, Elektronenstrahlen und Neutronenstrahlen. Mathematisch sind sie in der einfachsten Form alle durch eine Welle der Form ψ = ψ0 · exp(ikr) beschrieben. Grundlegende Phänome der Wechselwirkung sind Absorption (hier uninteresant) und Interferenz. Die Interferenz einer Welle mit dem periodischen Gitter des Kristalls wird zunächst durch das Bragg-Gesetz beschrieben. In qualitativer Form (und im Rückblick) besagt es: 1. Zu betrachten ist die spezielle Wechselwirkung einer ebenen Welle mit irgendeiner Netzebenenschar {hkl} des Kristalls. Die gesamte Wechselwirkung mit allen individuellen Ebenen ist die Summe der einzelnen Wechselwirkungen. 2. Die Wechselwirkung mit einer gegebenen Ebenenschar hat genau zwei Möglichkeiten Entweder es passiert überhaupt nichts - die Welle "ignoriert" {hkl} und läuft einfach weiter. Oder sie wird an {hkl} reflektiert (mit Einfallswinkel = Ausfallswinkel) 3. Die zweite Möglichkeit (Reflektion ) erfolgt dann, und nur dann, wenn der Einfallswinkel der Welle auf {hkl} einen ganz bestimmten Wert ΘB hat (den "Bragg-Winkel") 4. Der Bragg-Winkel ist einfach zu bestimmen: Er ist der Winkel bei dem konstruktive Interferenz auftritt; man erhält durch simple Geometrie: λ sin(ΘB) = 2 · dhkl Mit dhkl = Abstand zwischen den {hkl} Ebenen (aus Kenntnis des Gittertyps und der h, k, l berechenbar!); λ = Wellenlänge. Außerdem denken wir daran, dass z.B. die {111}, {222} oder {333} Ebenen verschieden sind! Damit läßt sich für einen gegebenen Kristall und eine gegebene Welle exakt ausrechnen, in welchen Raumrichtungen überhaupt reflektierte, oder besser gesagt gebeugte Wellen auftreten können. Das Bragg Gesetz verknüpft zwei Vektoren - den Wellenvektor k der einfallenden Welle, und den Wellenvektor k' der eventuell gebeugten Welle. Damit liegt nahe, es als Vektorgleichung zu formulieren. Es ergibt sich eine extrem einfache Beziehung: Beugung erfolgt dann, und nur dann, falls gilt k – k' = Ghkl Mit G = ausschließlich durch das Gitter definierter Vektor, genannt "rezipoker Gittervektor", mit den Eigenschaften 1. G steht senkrecht auf der betrachteten Ebenenschar {hkl} 2. |G| = 2π/dhkl Abgesehen von der hier noch unwichtigen Richtung ist der reziproke Gittervektor damit eindeutig charakterisiert. Zum Schluß sollte man sich noch klar machen, daß Mutter Natur hier wieder mal die einfachstmögliche Formulierung eines komplexen Problems gewählt hat: Aus logischen Gründen braucht man mindestens die beiden Wellenvektoren und eine Gittereigenschaft. Eine einfachere Gleichung als die obige Vektorgleichung ist logisch nicht möglich. MaWi 2 Skript - Page 104 3.2.4 Merkpunkte Kapitel 3.2 Kristalle untersucht man durch Wellen mit geigneten Wellenlängen λ (passend zur Gitterkonstanten). Röntgen-, Elektronen- und Neutronenwellen bzw. -Strahlen. Reflektion an Ebene {hkl} unter Bragg-Winkel ΘB falls Bragg-Bedingung für konstruktive Interferenz erfüllt ist. λ sin(ΘB) = 2 · dhkl dhkl ist der Abstand der Ebenen {hkl} Vektorielle Form der Bragg-Bedingung mit reziprokem Gittervektor Ghkl k – k' = Ghkl Ghkl ist ein reziproker Gittervektor mit den Eigenschaften 1. G steht senkrecht auf der betrachteten Ebene {hkl} 2. |G| = 2π/dhkl MaWi 2 Skript - Page 105 3.3 Das reziproke Gitter 3.3.1 Formale Definition und Eigenschaften Geometrische Konstruktion Wir benutzen zunächst die rein geometrische Definition der reziproken Gittervektoren um eine rein geometrische Konstruktion des reziproken Gitters durchzuführen. Die bereits gemachte Definition soll zunächst hier wiederholt werden. Ein reziproker Gittervektor Ghkl hat folgende Eigenschaften: 1. Ghkl steht senkrecht auf der Ebenenschar {hkl}. 2. Die Länge von Ghkl ist proportional zum reziproken Abstand der Netzebenen, es gilt immer 2π |Ghkl| = Ghkl = dhkl Das läßt nur noch das Vorzeichen der Richtung offen; wir bräuchten dazu noch eine weitere Vereinbarung. Da aber die Richtung (d.h. wohin der Pfeil zeigt) reine Konventionssache und damit zunächst belanglos ist, schauen wir hier großzügig darüber hinweg bzw. lassen Ghkl und -Ghkl zu. Damit haben wir alles, um für ein beliebiges Raumgitter das zugehörige reziproke Gitter zu konstruieren; dies ist im folgenden gezeigt und erläutert. Raumgitter Reziprokes Gitter Links ist das (zweidimensionale) Raumgitter gemalt - das sind die rosa Punkte. Weiterhin sind einige Ebenenscharen eingezeichnet; jede Schar hat eine eigene Farbe. Auf einer Ebene der Ebenenschar, die durch ihre Miller Indizes (hk) gegeben ist, wird der reziproke Gittervektor konstruiert und eingezeichnet. Die Länge dieses ersten reziproken Gittervektors können wir (noch) willkürlich wählen (damit legen wir die m – 1 Skala fest), die restlichen müssen sich an die dann definierte Skala halten. Wir wiederholen die Prozedur auf den restlichen Ebenen; damit bekommen wir einen Satz von Vektoren, den wir allgemein mit Gij bezeichnen. Alle Gij zeichnen wir jetzt von einem gemeinsamen Ursprung aus ein. Rechts im Bild ist das gemacht: Alle reziproken Gittervektoren sind von einem gemeinsamen Ursprung aus eingezeichnet. Ihr Endpunkte definieren zwangsläufig das reziproke Gitter. Für Puristen: Es ist natürlich in dieser Konstruktion nicht unmittelbar klar und bewiesen, daß der gewählte Satz von reziproken Gittervektoren ein Gitter aufspannt, in dem sich dann alle anderen möglichen reziproken Gittervektoren wiederfinden. Oder anders ausgedrückt: Dass alle reziproken Gittervektoren sich als Linearkombination von zwei "elementaren Basisvektoren" darstellen lassen. Schließlich würden die Endpunkte eines Satzes beliebiger Vektoren, von einem gemeinsamen Ursprung aus aufgetragen, nur einen beliebigen Punkthaufen definieren. Wenn man aber bedenkt, daß nach der Wahl zweier (niederindizierten) Ebenenscharen alle anderen Ebenenscharen festliegen, ist zumindest plausibel, dass das auch für die reziproken Gittervektoren gilt. Man kann das mit ein bißchen Geometrie leicht zeigen: nach der Wahl von G01 und G10 kann G11 nur noch als G11 = G01 + G10 dargestellt werden. usw. Das Bild verdeutlicht: Raumgitter und reziprokes Gitter sind in eindeutiger Weise korrelliert; hat man das eine, kann man das andere konstruieren. Außerdem wird die Indizierung der (gelben) Gitterpunkte des reziproken Gitters klar: Jeder Gitterpunkt symbolisiert eine Ebenenschar des Raumgitters. MaWi 2 Skript - Page 106 Damit bekommen wir eine erste Ahnung, warum das reziproke Gitter manche Dinge einfach macht: Alle niedrig indizierte Ebenen - und das sind in der Regel die wichtigen - finden sich in den ersten paar Gitterpunkten um den Ursprung wieder- was "weiter draußen" liegt, kann man oft schlicht vergessen. Formale Definition und Eigenschaften Formal definiert man das reziproke Gitter, indem man seine drei Basisvektoren gi; i = 1,2,3 angibt. Es gilt folgende Definition für drei Raumdimensionen: Wenn a1, a2, a3 die primitiven Translationsvektoren des Kristallgitters (= Raumgitter) sind, dann lassen sich die primitiven Translationsvektoren g1, g2, g3 des reziproken Gitters nach folgender Vorschrift bestimmen: a2 × a3 g1 = 2π · a2 × a3 = 2π · a1 · (a2 × a3) V a3 × a1 g2 = 2π · a3 × a1 = 2π · a1 · (a2 × a3) V a1 × a2 a1 × a2 g3 = 2π · = 2π · a1 · (a2 × a3) V Das Spatprodukt im Nenner gibt dabei das Volumen der Elementarzelle an. Damit ist auch die Richtung der reziproken Gittervektoren eindeutig definiert. Jetzt müssen wir natürlich zeigen, dass die geometrische und die formale Definition identisch sind. Das machen wir, indem wir systematisch die Eigenschaften der formalen Definition bestimmen. Formal definierte reziproke Gittervektoren haben folgende Eigenschaften (die wir in einerÜbung beweisen): 1. Jeder Punkt des reziproken Gitters kann durch einen Translationsvektor G des reziproken Gitters erreicht werden; G ist dabei wie üblich durch eine Linearkombination der Basisvektoren gi darstellbar. Sinnvollerweise machen wir das in dem Koordinatensystem, das durch die oben definierten gi aufgespannt wird. Damit gilt Gh,k,l = (h · g1 + k · g2 + l · g3) h,k,l = ganze Zahlen = Miller Indizes der zu Gh,k,l gehörenden Ebenenschar Die h,k,l = ganze Zahlen sind dann die Miller Indizes der zu G gehörenden Ebenenschar (siehe Punkt 2.). Falls wir reziproke Gittervektoren in Komponenten darstellen, benutzen wir natürlich runde Klammern (hkl) für spezifische reziproke Gittervektoren und geschweifte Klammern {hkl} für alle kristallographisch gleichwertigen reziproke Gittervektoren. Auch lassen wir zukünftig den Index "h,k,l" am G eher weg um Schreibarbeit zu sparen. Wir werden natürlich niemals den Miller Index "k" mit dem Betrag des Wellenvektors k verwechseln! Weiterhin müssen wir uns bewußt sein, daß die gi nicht notwendigerweise ein cartesisches KO System aufspannen und daß ihre Länge im von ihnen aufgespannten KO System zwar per definition = "1" ist, nicht aber, wenn wir sie in cm–1 messen. Nehmen wir als einfachstes Beispiel ein kubisches Raumgitter mit |ai| = 1 cm. Das reziproke Gitter ist dann ebenfalls kubisch mit den Basisvektoren gi und |gi| = 2π cm–1. Translationsvektoren in beiden Gittern schreiben sich dann so Raumgitter Basissystem cm System T = (u, v, w) T = (u, v, w) cm Reziprokes Gitter Basissystem cm–1 System G = (h, k, l) G = 2π · (h, k, l) cm–1 MaWi 2 Skript - Page 107 Während wir im (kubischen) Raumgitter also in beiden Systemen die formal gleiche Darstellung haben, gilt das nicht für das reziproke Gitter. Bildet man beispielsweise ein Skalarprodukt zwischen einem reziproken Gittervektor und einem Wellenvektor (der ja auch die Dimension cm–1 hat, d.h. im Raum des reziproken Gitters definiert ist, darf man den Faktor 2π nicht vergessen! 2. Der reziproke Gittervektor G = (h,k,l) steht senkrecht auf der Netzebenenschar des Raumgitters mit den MillerIndizes {h k l}. Die Richtung ist jetzt durch die formale Definition ebenfalls festgelegt, aber immer noch ziemlich uninteressant, da die Ebenen {hkl} und {–h–k–l} im Gitter identisch sind Das gilt übrigens nicht immer, falls wir reale Kristalle betrachten. Falls Vorzeichen so gewählt sind, dass z.B. auf der {111} Ebene von GaAs die Ga Atome liegen wenn man auf den Kristall "draufschaut", liegen auf der {-1, -1, -1} Ebene (der Rückseite des realen Kristalls) automatisch die As Atome. Die physikalischen Eigenschaften dieser "{111}" Kristalloberflächen können grundverschieden sein! 3. Der Abstand dhkl zweier Ebenen der Netzebenenschar mit den Miller Indizes {h k l} ist 2π dhkl = |Ghkl| 4. Es gilt immer ai · gj = 2 πδij Dabei ist δij = Kronecker Symbol, d.h. δij = { 1 für i = j 0 für i ≠ j Man kann das auch umdrehen und die erste Gleichung als Definition des reziproken Gitters betrachten. Sie hat den Vorteil dass sie nicht nur im Dreidimensionalen gilt, sondern für alle Dimensionen, z.B. auch für Kristalle in sechsdimensionalen Räumen. Wer das für abwegig hält, hat in MaWi I den diesbezüglichen Fortgeschrittenenmodul nicht angeschaut. 5. Es gilt immer G·T = 2π·n und damit e i · G · T = ei · 2 π · n = 1 Mit n = ganze Zahl und T = beliebiger Translationsvektor des Raumgitters. Das ist, wie wir noch sehen werden, eine extrem wichtige Eigenschaft! Jetzt wird es aber Zeit, die Behauptungen 1. - 6. auch zu beweisen - in einer Übung: Übung 3.3-1 Eigenschaften des reziproken Gitters Eine letzte Eigenschaft, eigentlich die Haupteigenschaft die alles andere umfaßt, sei hier nur angedeutet: 6. Das reziproke Gitter ist die Fouriertransformierte des Raumgitters. Mehr dazu findet sich im Link. Das bedeutet schlicht, daß jede im Kristall (jetzt nicht mehr nur im Gitter!) periodische Funktion (z.B. die Elektronendichte ρ(r) = ρ(r + T)) nach durch das reziproke Gitter vorgegebene "Ortsfrequenzen" Ghkl entwickelt werden kann. MaWi 2 Skript - Page 108 Was das bedeutet wollen wir uns verdeutlichen indem wir danach fragen, wie wir vom reziproken Gitter als Repräsentation des Raumgitters zum Kristall kommen: Wir haben bereits festgehalten, daß reziprokes Gitter und Raumgitter äquivalent sind; eines kann aus dem jeweils anderen in eindeutiger Weise konstruiert werden. Aber aus den Raumgitter kann ich einen Kristall machen - indem ich z.B. im einfachsten Fall auf jeden Gitterpunkt ein Atom setze. Es ist natürlich sinnlos, auf einen reziproken Gitterpunkt ein Atom zu setzen. Der dann erhaltene Kristall ist halt irgendein Kristall, er hat aber mit dem zum betrachteten Raumgitter gehörenden Kristall nichts zu tun. Stattdessen setze ich auf jeden reziproken Gitterpunkt die zugehörige Fourierkomponente der betrachteten Kristalleigenschaft. Ein "Atom" ist z.B durch die lokale Elektronendichte ρ(r) für viele Zwecke hinreichend definiert. In Formeln sieht die Fourierentwicklung von z.B. der Ladungsdichte ρ(r) nach Komponenten bei reziproken Gitterpunkten G so aus G Σ ρ(r) = nG · exp (i · G · r) G Die Fourierkoeffizienten nG erhält man aus 1 nG = · V ⌠ ⌡ ρ(r) · exp – (i · G · r) · dV V Das Bild unten zeigt schematisch, was das für ein einfaches Beispiel bedeutet Wir haben in irgendeine beliebige Richtung x eine periodische Funktion für die Elektronendichte ρ(x). In eine andere Richtung sieht ρ anders aus, ist aber immer periodisch. Die Fourierentwicklung produziert für jeden reziproken Gitterpunkt eine FourierkomponentenG , deren Wert durch die Größe der blauen Kreise angedeutet ist. Das reziproke Gitter plus die Fourierkomponenten der im Raumgitter + Basis = Kristall betrachteten (und im Raumgitter periodischen) Eigenschaft enthält jetzt exakt dieselbe Information wie eine komplette Darstellung des Kristalls - aber oftmals in viel kompakterer und eleganterer Form. Wie im Bild schon angedeutet, werden die Fourierkomponenten rasch klein für große G-Vektoren, d.h. für nicht "niedrig-indizierte Ebenen". Es reicht also für viele Zwecke, nur einen kleinen Ausschnitt aus dem reziproken Gitter zu betrachten um genügend genau rechnen zu können. Aber das gilt alles nur für periodische Eigenschaften. Für nichtperiodische Eigenheiten eines Gitters - zum Beispiel für seine Gitterdefekte - ist das reziproke Gitter ziemlich witzlos. Zum Schluss noch eine verhältnismäßig einfache, aber gehaltvolle Übung: Übung 3.3-2 Das reziproke Gitter der einfachen Bravaisgitter MaWi 2 Skript - Page 109 Fragebogen / Questionaire Multiple Choice Fragen zu 3.3.1 MaWi 2 Skript - Page 110 3.3.2 Die Ewald Konstruktion der Beugung Nachdem wir jetzt das reziproke Gitter verstanden haben, wollen wir es auch benutzen. Die erste Anwendung betrifft die sogenannte Ewald Konstruktion der Beugung. Es handelt sich dabei um eine an Einfachheit nicht mehr zu überbietende geometrische Umsetzung der vektoriellen Bragg Bedingung. Gegeben sei ein Wellenvektor k und ein Gitter; beide haben eine feste räumliche Orientierung zueinander. Denn obwohl der Wellenvektor die Dimension cm– 1 hat, d.h. im Ortsraum eigentlich gar nicht definiert ist, legt er doch über Amplitude = A(r) = A0 · eikr die Richtung der Welle im Ortsraum eindeutig fest. Wir fragen, welche der unendlich vielen Netzebenenscharen des Gitters die Bragg-Bedingung erfüllen. Dazu zeichnen wir einfach das reziproke Gitter in der exakten Orientierung relativ zu dem Wellenvektor (beide können in dasselbe KO System eingezeichnet werden, da beide die Maßeinheit m – 1 haben). Die Spitze des Wellenvektors lassen wir auf dem Nullpunkt des reziproken Gitters enden. Danach zeichen wir einen Kreis mit Mittelpunkt am Anfangspunkt von k und Länge |k|. Dreidimensional wird das natürlich eine Kugel, die sogenannte Ewald Kugel. Das war's. Offenkundig, wie unten zu sehen, erfüllen alle Ebenen, deren reziproke Gitterpunkte von der Ewaldkugel geschnitten werden, die (zweite Variante der) Bragg -Bedingung. (Nicht vergessen: Jeder Punkt im reziproken Gitter steht für eine Ebenenschar des Raumgitters!) k' – k = G Die ganze Konstruktion ist unten gezeigt; die möglichen k' Werte sind eingezeichnet. Es drängt sich natürlich eine Frage auf: Ein mathematischer Kreis schneidet einen mathematischen Punkt nie, da sowohl Linie als auch Punkt unendlich "dünn" sind. Was also heißt "...geschnitten werden..." in unserem Fall? Einfach nur, daß Ewald Kugel und reziproker Gitterpunkt sich nahe genug kommen. Aha! Und was heißt nahe genug? Nun ja, eine echte Welle hat nie eine exakte Wellenlänge, sondern eine bestimmte Frequenz- und Wellenlängenverteilung, und damit auch einen k-Vektor mit einer gewissen Längenverteilung ∆k. Unsere Kreislinie ist also keine Linie, sondern ein dünnes Band - und damit kann man einen Punkt schon "schneiden". Außerdem sind unsere reziproken Gitterpunkte bei echten Kristallen auch keine mathematischen Punkte, sondern haben eine endliche Ausdehnung, die proportional zu den reziproken Dimensionen des realen Kristalls sind. Nur ∞ große Kristalle haben ∞ kleine reziproke Gitterpunkte. Damit kann man, wenn man will (und kann) "nahe genug" beliebig genau quantifizieren. Wir wollen (und können) das aber nicht - glauben es aber trotzdem. Man kann die Ewald Konstruktion natürlich sofort erweitern und zum Beispiel untersuchen: Was passiert, wenn die einfallende Welle nicht monochromatisch ist, sondern einen bestimmten Bereich an Wellenlängen abdeckt? Klar: Viele Kugeln einzeichnen (ein Kontinuum); eine trifft einen gegeben Punkt des reziproken Gitters immer, wir bekommen Reflexe von (fast) allen Ebenen. Was passiert, wenn die einfallende Welle monochromatisch ist, wir aber den Kristall drehen. Klar: Bei einem definierten Drehwinkel wird ein herausgegriffener Punkt des reziproken Gitters "reflektieren", d.h. die Ewald Kugel schneiden. Damit sind wichtige Methoden zur Strukturuntersuchung schon angedeutet, wir werden darauf später noch näher eingehen. MaWi 2 Skript - Page 111 3.3.3 Zusammenfassung Kapitel 3.3 Reziproke Gittervektoren Ghkl werden formal definiert als Translationsvektoren imreziproken Gitter. Das reziproke Gitter ist in eineindeutiger Weise aus einem beliebigen Raumgitter mit den Basisvektoren ai konstruierbar; seine Basisvektoren gi sind (im dreidimensionalen) gegeben durch a2 × a3 a2 × a3 g1 = 2π · = 2π · a1 · (a2 × a3) V a3 × a1 a2 × a3 g2 = 2π · = 2π · a1 · (a2 × a3) V a1 × a2 a2 × a2 g3 = 2π · = 2π · a1 · (a2 × a3) V Das reziproke Gitter ist die Fouriertransformierte des Ortsgitters. Es hat wichtige Eigenschaften: 1. Ghkl = h · g1 + k · g2 + l · g3 steht senkrecht auf der Ebene des Raumgitters mit dem Miller Indizes (hkl) 2. |Ghkl| = 2π/dhkl; dhkl ist der Abstand der Netzebenen. 3. Das Skalarprodukt zwischen einem beliebigen Translationsvektor T des Raumgitters und einem beliebigen Translationsvektor des zugehörigen reziproken Gitters ist immer (mit n = 0, 1, 2, 3, ...). G·T = 2π·n 4. Es gilt immer (mit δij = Kronecker Symbol) ai · gj = 2 π δij = { 1 für i = j 0 für i ≠ j Das reziproke Gitter ist von größter Wichtigkeit, da es für Rechnungen aller Art sehr viel häufiger benötigt wird als das Raumgitter. Es erlaubt aber auch rein geometrische Konstruktionen von Beugungsexperimenten mit großer Aussagekraft. Die gilt insbesondere für die "Ewaldkugel" Eine Kugel mit dem einfallenden, mit der Spitze am Nullpunkt des reziproken Gitteres befestigten Wellenvektor als Radius, schneidet "automatisch" alle reziproken Gitterpunkte, deren zugehörige Ebenen den einfallenden Strahl reflektieren, d.h. die Bragg-Bedingung erfüllen. Damit lassen sich sehr leicht alle möglichen Fallunterscheidungen "durchdeklinieren"; (z.B. kleine/große Wellenvektoren, monochromatische/polychromatische Wellen, Einkristall/Polykristall; ortsfester/bewegter Kristall; ...); die Ewald Konstruktion ist also sehr hilfreich bei der Visualisierung dessen was passieren kann (und wird). MaWi 2 Skript - Page 112 3.3.4 Merkpunkte Kapitel 3.3 Formale Definition reziprokes Gitter im 3D: a2 × a3 Liefert identische Vektoren wie die geometrische Konstruktion (plus Vorzeichen) g1 = 2π · a2 × a3 = 2π · a1 · (a2 × a3) V Einfacher (und allgemeiner) ist: a3 × a1 g2 = 2π · ai · gj = 2 πδij = { 1 für i = j 0 für i ≠ j a2 × a3 = 2π · a1 · (a2 × a3) V a1 × a2 a2 × a2 g3 = 2π · = 2π · a1 · (a2 × a3) V Wichtige Eigenschaften des reziproken Gitters: Das reziproke Gitter ist die Fouriertransformierte des Ortsgitters Ghkl senkrecht auf d(hkl). |Ghkl| = 2π/dhkl; dhkl G · T = 2 π · n. Ewaldkugel-Konstruktion für Beugung: Erlaubt schnelle und einfache Betrachtung aller Varianten von Beugungsexperimenten. Hier für monochromatische Strahlung gezeigt. MaWi 2 Skript - Page 113 3.4 Die Intensität der gebeugten Wellen 3.4.1 Der Strukturfaktor Die Streuamplitude Wir wissen es schon: Das Bragg-Gesetz k – k' = G gibt nur die Lage der Reflexe an, nicht aber deren Intensität. In anderen Worten: Haben wir einen Kristall, eine einfallende Welle und einen Bildschirm irgendwo, so sagt uns die Bragg-Beziehung zwar wo auf unserem Bildschirm wir überhaupt damit rechen können, daß gebeugte Wellen auftreffen; aber keineswegs wie groß die Intensität der dort möglichen Wellen, kurz die Intensität des Reflexes sein wird. Schon rein logisch ist klar: Ein mathematisches Gitter wird eine reale Welle überhaupt nicht beeinflussen, die Streuung von Wellen erfolgt nicht am Gitter, sondern an Atomen. Anders ausgedrückt: Die Intensität eines möglichen Reflexes ist durch die Basis bedingt, d.h. durch die Atome die aus einem Gitter einen Kristall machen; sie kann zunächst mal jeden Wert annehmen. Insbesondere kann die Intensität auch = 0 sein - d.h. der Reflex ist zwar durch die Bragg-Bedingung erlaubt, aber man sieht ihn nicht! Die Reflexintensitäten werden durch den sogenannten Strukturfaktor bestimmt. Der Strukturfaktor wiederum ist abhängig von der Art und Verteilung der Atome in der Elementarzelle - d.h. von der Basis. Zu seiner Berechnung müssen wir etwas Aufwand treiben. Dazu betrachten wir die Streuung einer einfallenden ebenen Welle mit Wellenvektor k an einem beliebigen Streuvolumen V eines beliebigen Körpers. Das ist unten schematisch gezeigt. Wir betrachten jetzt die Wechselwirkung der einfallenden ebenen Welle mit den Atomen des Kristalls in einem differentiell kleinen Volumenelement dV des Streuvolumens am Aufpunkt r. Dabei mag eine Kugelwelle oder irgendetwas angeregt werden. Was auch immer vondV ausgestrahlt wird, wir interessieren uns erstmal ausschließlich für die Komponente, die mit dem Wellenvektor k' in k' Richtung läuft. An dieser Stelle ist k' aber noch nicht definiert - wir könnten jede beliebige Richtung und jeden beliebigen Betrag betrachten. Um einfach weiterzukommen, müssen wir jetzt aber Annahmen machen bzw. spezielle Fälle betrachten. Die erste Eingrenzung ist noch einfach: Wir wollen hier nur elastische Streuung betrachten, d.h. die Energie der Wellen soll sich nicht ändern und damit muß gelten |k| = |k'| Wir beschreiben jetzt die einfallende Welle mit Wein = eikr, d.h aus Gründen der Einfachheit mit einer Amplitude = 1. Dabei ist es noch gleichgültig, um was für Wellen es sich handelt. Alles was "wellen" kann, ist in der Gleichung erfaßt. Der aus unserem Volumenelement dV kommende in k' Richtung laufende Teil der gebeugten Welle W ' muß dann so aussehen dW ' = F 'loc(r) · exp (ik'r) MaWi 2 Skript - Page 114 F 'loc(r) nennen wir die lokale Streuamplitude des Ortes r. Sie wird natürlich davon abhängen, was genau am Ort r sich befindet. Den gesamten aus V kommenden in k' Richtung laufenden Teil der gebeugten Welle W ' schreiben wir jetzt einfach als W ' = A · exp (ik'r) Zur gesamten Amplitude A tragen alle Volumenelemente dV bei; wir können A in k' Richtung also durch Aufsummieren bzw. -integrieren der lokalen Streuamplituden F 'loc(r) erhalten: A = const. · ⌠ F 'loc(r) · dV ⌡ v Die Konstante vor dem Integral ist hier noch ziemlich witzlos und dient nur der Schreibökonomie, da wir sie in späteren Gleichungen dann nicht mehr in F'loc berücksichtigen müssen. Der entscheidende Faktor ist also die lokale Streuamplitude F 'loc. In ihr stecken wiederum zwei Teile: 1. Ein Term der die Wechselwirkung mit der in dV enthalten Materie beschreibt. Darüber wissen wir a priori nichts - wir müssen also eine Annahme machen. Die Annahme ist einfach für Elektronen- und Röntgenwellen: Die Wechselwirkung der Atome mit diesen Wellen ist proportional zur Elektronendichte ρ(r) in dV. Atome mit hoher Ordnungszahl und damit mit höherer (mittlerer) Elektronendichte streuen diese Wellen also stärker als leichte Atome - das ist offenkundig keine abwegige Annahme. 2. Ein Term exp[i · ϕ(r)], der die Phase ϕ der gestreuten Welle enthält. Wer das nicht auf Anhieb versteht, betätigt den Link Das ist vielleicht nicht auf Anhieb einsichtig, aber wie obiges Bild zeigt, ist die Phase der in k' Richtung gestreuten Welle von Ort zu Ort verschieden - und wir müssen das berücksichtigen! Damit können wir die lokale Streuamplitude schreiben als F 'loc(r) = const. · ρ(r) · exp [i · ϕ(r)] = const. · Floc(r) Wir machen jetzt also einen Übergang zu einer "ungestrichenen" lokalen Strukturamplitude da wir die (uninteressante) Proportionalitätskostante wie schon angedeutet vor dem Integral verstecken (und vergessen) können. Das ist die entscheidende Gleichung. Der Rest ist jetzt (ziemlich trickreiche) Mathematik. Floc(r) und die Phasenverschiebung ϕ(r) sind Funktionen des Ortes; wir müssen sie kennen um das Integral auszurechnen. Die Phasenverschiebung ist leicht auszurechnen; sie ergibt sich aus der Summe der Längen a und b in obigem Bild, die ihrerseits geschrieben werden können als a = |r| · sin α b = |r| · sin β Die Länge a wird zu einer Phase ϕa über die elementare Beziehung a/λ = ϕa/2π, damit erhalten wir 2·a·π ϕa = 2π · |r| · sin α = λ λ Der Faktor 2π/λ ist natürlich nichts anderes als |k|; wir können also auch schreiben ϕa = |k| · |r| · sin α = |k| · |r| · cos(90o – α) ϕb = = k ·r – k' · r MaWi 2 Skript - Page 115 Die Phasen ergeben sich also einfach aus den Skalarprodukten der Wellenvektoren mit dem Ortsvektor (wobei wir die Herleitung der Beziehung für ϕb der Eigeninitiative überlassen; wer zu faul ist schaut in den Link). Die gesamte Phasenverschiebung ϕ = ϕa + ϕb ist also ϕ(r) = r · (k – k') Wir erhalten damit für die lokale Streuamplitude Floc(r) Floc(r) = ρ(r) · exp [i · r · (k – k')] und für die gesamte Streuamplitude F F = ⌠ Floc(r) · dV ⌡ V = ⌠ ρ(r) · eir · (k – k') · dV ⌡ V Das sieht nun sehr wir eine Fouriertransformierte der Ladungsdichte ρ(r) aus; es ist nur nicht ganz klar welche Bedeutung dann der neuen Variablen k – k' zukommt. Hier begänne die ernsthafte Herleitung der Beugung in Kristallen. Wir wollen aber nur die wesentlichen Schritte skizzieren, um dann mit unserem bereits vorhanden Wissen weiterzumachen. Wer will, kann diesen blauen Block überspringen. Zunächst überlegt man sich, daß ρ(r) immer eine im Raumgitter periodische Funktion sein muß, d.h. ρ(r + T) = ρ(r). Damit muß rein mathematisch eine Fourierentwicklung in einem "reziproken" Raum möglich sein. Wenn man die mathematische Analyse durchführt, "entdeckt" man zwangsläufig das reziproke Gitter als Fouriertransformierte des Raumgitters. ρ(r) wird damit zu ρ(r) = Σ nG · ei(G · r) 1 nG = ⌠ ⌡ ρ(r) · e – i(G · r) · dV V V Setzt man das in die Gleichung für die Strukturamplitude F ein , erhält man nach einiger Rechnung, daß nur für k – k' = G ± ∆k die Strukturamplitude wesentlich verschieden ist von 0. In anderen Worten: Man erhält die Bragg-Bedingung, noch verziert mit einer zulässigen Abweichung im Wellenvektor, die quantitativ die früher schon besprochene Ausdehnung der reziproken Gitter"punkte" angibt. 2π ∆k ≈ L L = Ausdehnung des Kristalls. Damit hat man den Punkt erreicht, an dem wir jetzt weitermachen. MaWi 2 Skript - Page 116 In der Formel für die Streuamplitude steht im Exponenten der Ausdruck k – k', und für k' sind noch beliebige Richtungen zugelassen (nur der Betrag liegt fest, da wir elastische Streuung behandeln). Wir wissen aber bereits, daß für alle k' Werte die nicht der Braggbedingung k – k' = G, und |k| = |k'| genügen, keine Beugung stattfindet und damit auch die Amplitude der gebeugten Welle automatisch = 0 ist. Präziser ausgedrückt: Was auch immer lokal in jedem dV in "falsche"; d.h. nicht der Bragg-Bedigung genügende k' Richtungen gestreut wird - und Streuung findet immer statt! - wird sich schlicht "weginterferieren" Das ist sehr praktisch! Denn wir müssen die Formel für die Streuamplitude also nicht für alle möglichen k' auswerten, sondern nur noch in der Form F = ⌠ ρ(r) · exp (i · r · G) · dV ⌡ V Das ist eine enorme Vereinfachung, da wir jetzt nur noch für eine endliche Anzahl von reziproken Gittervektoren rechnen müssen (wie schon mehrmals angedeutet, können wir i.d.R. die "großen" G vernachlässigen). Wir nennen F jetzt auch nicht mehr Streuamplitude, sondern Strukturamplitude Fs, da wir jetzt nur noch Kristalle betrachten (die Formeln für die Streuamplitude gelten für alle Materialien - amorph, inhomogen, was auch immer). Den Index "s" lassen wir später aus Bequemlichkeit dann auch noch weg. Aufzupassen ist aber noch an einer Stelle: Die Intensität IG der an der Netzebenenschar mit dem reziproken Gittervektor G gebeugten Welle ist durch das Quadrat der Amplitude gegeben, d.h. wir haben I = |FG |2 und dabei müssen wir berücksichtigen, daß die Strukturamplitude eine komplexe Größe ist. Eigentlich hätten wir auch "∝" (proportional) statt "=" (gleich) schreiben müssen, aber das bringt nur wieder eine für's Prinzip unwichtige (und auch von der größe von V ) abhängige Konstante. Berechnung der Strukturamplitude Die Integration läuft über einen Kristall mit dem Volumen V. Das Integral kann man nun stark vereinfachen, indem man zunächst nur über das Volumen einer Elementarzelle (EZ) integriert, und anschließend über alle EZ summiert, d.h. den erhaltenen Wert mit der Zahl der Elementarzellen multipliziert. Das können wir tun, denn das Integral muß für jede EZ denselben Wert liefern; sie sind ja alle identisch. Schematisch machen wir folgende Aufspaltung ⌠ ⌡ V = Σ ⌠ = ⌡ EZ V · VEZ ⌠ ⌡ EZ Dabei ist natürlich nur das Integral über die Elementarzelle von Interesse, denn der Rest liefert mal wieder nur eine lästige Konstante, die wir "vergessen". Um das verbleibende Integral auszuwerten, kommen wir nun nicht umhin, j Atome in die EZ "einzufüllen", d.h. eine Basis zu definieren. Der Index j ist damit eine ganze Zahl, die die Atome numeriert und ihre Art kennzeichnet. Eine beliebige Basis definieren wir jetzt also, indem wir einen Nullpunkt wählen (zweckmäßigerweise eine Ecke der EZ), und den j Atomen je einen Vektor rj zuweisen, der die Lage des Atoms in der EZ definiert. Damit bekommen wir einen Satz von rj , der (zusammen mit einer Tabelle der Atomsorten) die Basis eindeutig definiert. Das klingt abstrakt, ist aber ganz einfach. Die nachfolgenden Beispiele illustrieren dies: MaWi 2 Skript - Page 117 Kristall Gittertyp rj Atom bcc r1 = (0 0 0) r2 = (½ ½ ½) Fe Fe fcc r1 = (0 0 0) r2 = (½ ½ 0) r3 = (½ 0 ½ ) r4 = (0 ½ ½ ) Al Al Al Al fcc diamond r1 = (0 0 0) r2 = (½ ½ 0) r3 = (½ 0 ½ ) r4 = (0 ½ ½ ) r5 = (¼ ¼ ¼ ) r6 = (¾ ¾ ¼) r7 = (¾ ¼ ¾ ) r8 = (¼ ¾ ¾ ) Si Si Si Si Si Si Si Si fcc diamond r1 = (0 0 0) r2 = (½ ½ 0) r3 = (½ 0 ½ ) r4 = (0 ½ ½ ) r5 = (¼ ¼ ¼ ) r6 = (¾ ¾ ¼) r7 = (¾ ¼ ¾ ) r8 = (¼ ¾ ¾ ) Ga Ga Ga Ga As As As As Fe Al Si GaAs Aber Materialwissenschaftler geben nicht so leicht auf und haben noch Tricks auf Lager: Wir vereinfachen die Integration über die Elementarzelle! Wir führen die Integration innerhalb der EZ nur in einer Kugel um die diversen Atome durch; mit Kugeldurchmesser ≈ Atomradius, und summieren dann einfach die isgesamt j "Kugel"-Integrale. Das ist im Bild unten für 2 Atome illustriert. Die Einzelintegrationen laufen jetzt über eine Hilfsvariable r', die die Umgebung eines Atoms "abtastet". Damit haben wir natürlich den Bereich zwischen den Atomen nicht berücksichtigt. Aber dort ist die Elektronendichte sowieso = 0 oder zumindest klein, es wird also nicht viel fehlen. Wir erhalten dann näherungsweise für die Strukturamplitude Fs aus einer EZ Fs = ρ(r + r' ) · exp[i(rj + r'j) · G] · dV' Σ⌠ ⌡ j j j V' Fs = ρ(r + r' ) · exp[i · r'j · G] · dV' Σ exp[i · rj · G] · ⌠ ⌡ j j j V' Damit sind wir am Ende der allgemeinen Überlegungen. Weiter kommt man nur noch für spezifische Kristalle.Was ist nun konkret zu tun? Erstmals noch eine ganze Menge, wir listen das mal kurz auf: MaWi 2 Skript - Page 118 1. Wir wählen den gewünschten Reflex; d.h. einen bestimmten G-Vektor, z.B. G = (111). Das bedeutet, daß wir jetzt die Intensität der an {111} Ebenen gebeugten Strahlung bestimmen wollen. In unserer "Versuchsanordnung" ist dabei die Bragg-Bedingung erfüllt, denn das haben wir in die Formel hineingesteckt - nur dafür gilt sie. 2. Wir wählen den gewünschten Kristall, d.h. Gittertyp und Basis. Damit ist der rj-Satz festgelegt und die Elektronendichte um rj herum - in der jeweils verfügbaren Näherung. Falls wir über die Elektronendichte eines gebenen Atoms nichts genaues wissen, nehmen wir in nullter Näherung eine konstante Dichte (= Zahl der Elektronen durch Atomvolumen); in einer ersten Näherung eine kugelsymmetrische, aber nicht mehr konstante Dichte, und in einer zweiten Näherung eine Dichte die die Bindungen berücksichtigt - z.B. die Keulen der sp3 Hybridorbitale. 3. Wir führen jetzt die einzelnen Integrationen durch - zunächst für alle Arten von Kristallen und Beugungsvektoren. Dabei fällt uns aber auf, daß in der Nullten und ersten Näherung für viele Strukturenimmer dasselbe herauskommt (bis auf eine Konstante) - unabhängig vom gewählten Kristall. Schließlich integrieren wir im wesentlichen nur in einer Kugel herum - wo diese Kugel in der EZ sitzt und wieviele andere Kugeln noch da sind, ist völlig unerheblich. Das heißt, wir machen diese Integration nur einmal - für alle 92 Atome und für die halbwegs niedrig indizierten reziproken Gittervektoren. Genauer gesagt - wir machen diese Integration gar nicht, denn das wurde längst gemacht und die Werte sind tabelliert. Wir definieren deshalb einfach einen Atomformfaktor f, gegeben durch das bestimmte Integral fj = ⌠ ρ(r'j) · exp [i · r'j · G] · dV' ⌡ V und erhalten damit als vereinfachte Formel für die Strukturamplitude Fs = Σ fj · exp [i · rj · G] j 4. Damit berechnen wir jetzt die Strukturamplitude für den gewählten Reflex durch Aufsummieren der Komponenten. Heureka! Die Strukturamplitude ist nun verhältnismäßig einfach auszurechnen - immer vorausgesetzt, man kennt die Atomformfaktoren fi. Aber wir sind immer noch nicht fertig: Wenn man dieses Programm wirklich ausführt, finden sich sogar noch ein paar ganz allgemeine und extrem nützliche Regeln, die wir im nächsten Unterkapitel anschauen wollen. Dabei muß man noch nicht mal immer die Atomformfaktoren wirklich ausrechnen. Vorher aber noch ein letztes Wort zu den wirklich gemessenen Intensitäten. Wir müssen nicht nur eine bisher nicht näher erläuterte Proportionalitätskonstante bedenken (die z.B. für Elektronen- oder Röntgenstrahlen sehr verschieden sein wird, sondern auch das beugende Volumen V. In der Praxis kommt der gebeugte Strahl aber fast nie aus dem gesamten Volumen der Probe, denn entweder wird unser einfallender (dünner) Strahl gar nicht das gesamte Volumen anregen, oder die gebeugte Intensität kommt nur aus einigen Körnern unbekannter Größe eines Polykristalls (da nur dort die Bragg-Bedingung erfüllt ist), oder beides zusammen. Außerdem hängt die Intensität noch davon ab, wie exakt wir die Bragg-Bedingung erfüllen. Die Formel für die Strukturamplitude gilt nur für exakte Erfüllung, wir erhalten aber auch noch Intensität wenn wir knapp danebenliegen. In der Praxis sind deshalb die absoluten Intensitäten nicht so wichtig. Viel wichtiger sind die Intensitätsverhältnisse zwischen den Reflexen, und das ist es was man mißt und auswertet. MaWi 2 Skript - Page 119 3.4.2 Strukturfaktoren einiger wichtiger Kristalle Auslöschungsregeln Wir berechnen jetzt mal den Strukturfaktor des kubisch raumzentrierten Eisens. Die notwendigen Basisdaten hatten wir schon notiert; wir können die alte Tabelle jetzt noch um den Atomformfaktor fFe erweitern und bekommen Kristall Gittertyp rj Atom fj Fe bcc r1 = (0 0 0) r2 = (½ ½ ½) Fe Fe fFe fFe Wie groß auch immer der Atomformfaktor für ein Eisenatom bezüglich eines bestimmten Reflexes G auch sein mag, beide Eisenatome haben denselben Atomformfaktor - in jeder Näherung - da vollständige Symmetrie vorliegt; sie unterscheiden sich in nichts. Wir können gleich noch eine weitergehende Aussage machen. Da der Atomformfaktor im wesentlichen von der Elektronendichte bestimmt wird, werden sich die Atomformfaktoren ähnlicher Elemente - z.B. Fe, Mn, Co allenfalls ein bißchen unterscheiden können. Einsetzen in die Formel für die Strukturamplitude liefert 2 Fs (Fe) = Σ fj · exp[i · ri · G] = fFe · { exp[i · (0 0 0) · G] + exp[i · (½ ½ ½) · G] } j=1 Jeder reziproke Gittervektor kann in Komponenten als G = 2π · (h · g1 + k · g2 + l · g3) geschrieben werden. Setzen wir diese Form für G ein, ergibt sich Fs(Fe) = fFe · 1 + exp[2iπ · (h k l) · (½ ½ ½)] = f Fe · 1 + exp[iπ · (h + k + l)] Daraus ergibt sich eine interessante allgemeine Auslöschungsregel die nicht nur für Fe, sondern offensichtlich für alle einatomige bcc Kristalle gilt Die Strukturamplitude Fs(bcc) ist = 0 falls h + k + l = ungerade Zahl nug Warum? Weil immer gilt exp[iπ · nug] = – 1 Wer das nicht kennt, braucht sich nur die Eulersche Formel hinschreiben: exp[iπ · nung] = cos (n · π) + i · sin (n · π) Falls n ungerade ist, wird der Sinus = 0 und der Cosinus = – 1 - q.e.d. Die Auslöschungsregel für bcc Kristalle sagt im Klartext: Die Ebenen {100}, {300},....{111}, {333},....{120}, {240},.... usw. des Kristalls werden eine einfallende Welle nicht beugen, obwohl die Bragg-Bedingung für das Gitter erfüllt ist. Die Intensität im gebeugten Strahl ist immer = 0. Ein Beugungsbild, z.B in einem Elektronenmikroskop, wird also so aussehen: MaWi 2 Skript - Page 120 Ein Beugungsbild, z.B in einem Elektronenmikroskop, wird also so aussehen: Die feinen Punkte markieren Reflexe, die zwar erlaubt sind, aber per Auslöschungsregel nicht auftreten. Die roten Kreise vermitteln einen Eindruck der auftretenden Intensität. Die äußert sich zwar nicht im Durchmesser der Beugungspunkte, sondern in ihrer "Lichtstärke" auf dem Leuchtschirm, aber das kann man graphisch nicht leicht wiedergeben. Die Auslöschungsregel des bcc Gitters ist auch geometrisch leicht zu verstehen. Wir müssen nur unser ursprüngliches Bild, das wir zur Herleitung der Bragg-Bedingung verwendet haben, für einen bcc Kristall zeichnen: Die roten Atome kommen dazu - wir haben einfach doppelt so viele, aus Sicht des Kristalls identische Ebenen, wie im simplen kubischen Gitter. Die an den roten Atomen der zusätzlichen Ebenen reflektierte Welle ist genau in Antiphase zur Welle eins drüber und wird also immer für Auslöschung sorgen. Für die oben betrachteten {100} Ebenen des Gitters wird die Intensität der Reflexe also im bcc Fall = 0 sein - wie berechnet. Für all die anderen Ebenen mit ungerader Indizessumme kann man die Auslöschungsregel ähnlich visualisieren - aber eine Formel ist eben doch viel praktischer. Falls wir statt eines Eisenatoms jetzt eine beliebig komplizierte Basis auf die Gitterpunkte setzen, erhalten wir dasselbe Ergebnis - geändert hat sich letztlich nur der Vorfaktor; statt fFe haben wir jetzt einen mehr oder weniger komplizierten Ausdruck. Die Auslöschungsregel für das bcc Gitter (und auch für das gleich betrachtete fcc Gitter) gilt also immer. Wir könnten jetzt andere Gittertypen probieren um zu sehen, ob wir vielleicht ebenfalls simple Auslöschungsregeln finden. Das werden wir jedoch in einer kleinen Übung tun, hier nur einige Ergebnisse Auslöschungsregel für fcc Gitter: F ≠ 0 für { h, k, l alle gerade h, k, l alle ungerade Reflexe von z.B {100}, {110}, {120}, ... oder {110}, {120}, ... Ebenen treten demgemäß nicht auf (0 zählt als gerade Zahl). Auslöschungsregel für Diamant Gitter (mit lauter identischen Atomen). F ≠ 0 für { h + k + l = 4n; n = 0,1,2,3... und alle Indizes gerade h, k, l alle ungerade und ≠ 0 MaWi 2 Skript - Page 121 Reflexe von z.B {100}, {200}, {300},... oder {110}, {330}, ..Ebenen treten demgemäß nicht auf. Diese Auslöschungsregel gilt nicht immer - in voller Strenge nur für gleiche Atome in der Basis. Haben wir verschiedene Atome, betrachten wir ein fcc Gitter mit einer etwas komplizierteren Basis. Falls die Atome nicht sehr verschieden sind (z.B. beim GaAs), können wir erwarten, dass die fcc Auslöschungsregel absolut gilt, und die Diamantgitter Auslöschungsregel ungefähr. Damit erwarten wir für die Reflexe, die bei fcc erlaubt, bei Diamant aber verboten sind, eine geringe Intensität - und schon wieder haben wir eine qualitative Regel, die uns wertvolle Hinweise für eine Analyse unbekannter Kristalle gibt. Mit ein bißchen Übung kann man also schon aus der Grundstruktur eines Beugungsbilds auf den Gittertyp schließen. Übung 3.4-1 Auslöschungregeln Strukturanalyse aus Beugungsexperimenten Wenn wir die Rechnerei von oben fortsetzen , d.h. für die Atomformfaktoren Zahlenwerte einsetzen, ist es nur noch ein relativ kleines (numerisches) Problem, alles wünschenswerte über die Beugung von Wellen an einem gegebenen Kristall auszurechnen. Auch für noch so komplizierte Kristalle ist das kein großes Problem; allenfalls muß man sich über die Konsequenzen der gemachten Näherungen Gedanken machen. Wie ist die Umkehrung des Verfahrens? Wir kennen den Ausgang eines Beugungsexperiments, aber nicht was für einen Kristall wir verwendet haben. Können wir aus den Beugungsdaten die Kristallstruktur ermittteln? Das ist natürlich die wirklich interessante Fragestellung. Die Antwort ist schwierig und umfaßt zwei Teile: 1. Es ist einfach, den Gittertyp (welches Bravaisgitter?) und die Gitterkonstanten eindeutig zu bestimmen. Das ist der aus dem Bragg-Bedingungen folgende Teil der Strukturanalyse. 2. Es ist schwierig, und nicht immer eindeutig, die Basis zu ermitteln. Das ist der aus den Intensitäten folgende Teil der Analyse. Der Grund ist klar: Viele verschiedene Funktionen können denselben Wert eines bestimmten Integrals liefern; aus dem Zahlenwert selbst sind keine eindeutigen Rückschlüsse auf die integrierte Funktion möglich. Außerdem haben wir in den Intensitäten die Phaseninformation verloren. Wir brauchen also Zusatzinformationen. Diese können sein: Wir kennen die Intensitäten mehrerer Reflexe. Die Basis ist groß oder klein - je nach Gitterkonstante. Zum Beipiel können in einem fcc Gitter mit 0,3 nm Gitterkonstante nicht viel Atome sitzen, während ein triklines Gitter mit Gitterkonstante um die 10 nm nach sehr vielen Atomen verlangt. Es müssen Atome mit ähnlichen Atomformfaktoren beteiligt sein, denn Auslöschungsregeln sind fast, aber nicht ganz erfüllt. Es sind Atome der Sorte x beteiligt - wir wissen das aus anderen Analysen. Und so weiter. Das Problem ist nun: Wie bringt man diese Zusatzinformation ein? Es gibt schlicht kein Generalrezept (im Sinne einer mathematischen Formel oder eines Algorithmus). Trotzdem ist es heute möglich, auch extrem komplexe Strukturen (z.B Proteine) mit hunderten von Atomen in der Basis durch Beugungsexperimente eindeutig zu charakterisieren - es gibt große Software Pakete, die das "können". Man geht dabei auch "invers" vor: Mit Hilfe des Rechners werden verschiedene vermuteten Modelle der Struktur ausgewertet und an die gemessenen Intensitäten angepaßt. Bei Übereinstimmung ist die Struktur ermittelt. Die Kunst liegt immer mehr in der Präparation, d.h. in Verfahren die aus kleinsten Mengen hochkomplexer Moleküle einen Kristall zu formen können - denn nur in kristalliner Form kann die Analyse überhaupt greifen. Das Bild unten zeigt ein beliebiges Beispiel des heute möglichen - rechts der (Protein)kristall, links die Basis. Die gelben und blauen Ketten deuten die Molekülstruktur nur an. MaWi 2 Skript - Page 122 Nicht vergessen sollte man in diesem Zusammenhang daß vor genau 50 Jahren (1953) Francis Crick und James Watson (und Rosalind Franklin und Maurice Wilkins) die Struktur der DNA entdeckt haben. Eigentlich hat Rosalind Franklin die entscheidenden Röntgenbeugungsexperimente gemacht, aber es blieb Watson vorbehalten, durch maßstäblichen Modellbau mit den bekannten Bausteinen der DNA auf die Doppelhelix zu stoßen, die dann in der Rückwärtsrechnung die gemessenen Reflexe ergab. Mehr dazu im Link. Fragebogen / Questionaire Multiple Choice Fragen zu 3.4.1 und 3.4.2 MaWi 2 Skript - Page 123 3.4.3 Zusammenfassung Kapitel 3.4 Die Bragg Bedingung spezifiziert, wo im Raum ein Reflex überhaupt auftreten kann; sie sagt nichts über die Intensität der dort möglichen Strahlung aus. Die Intensität der Bragg-Reflexe werden durch die Atome des Kristalls bestimmt, d.h. der Basis des (für BraggBedingung) betrachteten Gitters. Eine allgemeine Betrachtung der von einem Körper in eine beliebige Richtung elastisch gestreuten Amplitude bei einem gegebenen einfallenden Wellenvektor k liefert in mehrerern elemntaren Schritten eine einfache Formel für die Intensität der Reflexe bei Beugung einer ebenen monchromatischen Welle (charakterisiert durch k) an einem Kristall. 1. Die in eine beliebige Richtung laufende an einem Volumenelement bei r gestreute ebene Welle mit Wellenvektor k' Und |k'| = |k| unterscheidet sich (abgesehen von der Richtung) nur in Betrag und Phase von k; wir haben in der Wellengleichung einen Phasenfaktor exp [i · ϕ(r)]. 2. Die lokale Streuamplitude F 'loc wird weiterhing proportional zur Elektronendichte ρ(r) am Aufpunkt r sein; wir haben also F 'loc(r) = const. · ρ(r) · exp [i · ϕ(r)] = const. · Floc(r) 3. Die Phase ϕ läßt sich aus der Geometrie des Aufpunktes bei r einfach bestimmen; sie ist ϕ(r) = r · (k – k') 4. Die gesamte Streuamplitude F erhält man durch Integration über alle Volumenelemente; im Integranden erscheint ρ(r) · exp ir · (k – k'). 5. Für Kristalle gilt immer die Bragg-Bedingung; der Integrand ist deshalb immer = Null außer für k – k' = G; wir haben F = ⌠ ρ(r) · exp (i · r · G) · dV ⌡ V 6. Die Integration über den gesamten Kristall ist identisch zur Integration über eine Elementarzelle mal Zahl der EZ, da jede EZ exakt denselben Beitrag liefert.. Wir betrachten also nur noch das Integral über die EZ; es heißt Strukturamplitude Fs. 7. Die Integration in der EZ wird näherungsweise ersetzt durch j Integrationen um die Umgebung (= Kugel in erster Näherung mit Volumen V') jedes der j Atome in Basis bei rj und eine Aufsummierung aller Teilintegrale. Wir erhalten Fs = Σ exp[i · rj · G] · ⌠ ρ(r'j) · exp[i · r'j · G] · dV' ⌡ j V' 8. Die Teilintegrale können für alle sinnvollen Kombinationen der 92 Atome und reziproker Gittervektoren durchgeführt und tabelliert werden; diese Werte heißen Atomformfaktoren fj. 9. Damit ist die Strukturamplitude für eine gegebenen Kristall relativ leicht berechenbar. Das Gitter definiert die reziproken Gittervektoren die zu betrachten sind; die Atome in der Basis die Atomformfaktoren, und die Geometrie der Basis gibt die Ortsvektoren der Atome und erlaubt damit die Summation. Die Strukturamplitude ergibt sich zu Fs = Σ fj · exp [i · rj · G] j Die Berechnung der Strukturfaktoren einfacher Kristalle ist jetzt einfach. Dabei stößt man auf eine letzte mögliche Verallgemeinerung; die Auslöschungsregeln Die Intensität bestimmter Reflexe ist immer = Null; welche Reflexe das sind bestimmt die vom Bravais Gittertyp abhängige Auslöschungsregel. Wir haben z.B. MaWi 2 Skript - Page 124 bcc Gitter: Keine Intensität falls: h+k = +l ungerade Zahl n ug alle gerade fcc Gitter: Nur Intensität falls: h, k, l = MaWi 2 Skript - Page 125 { oder alle ungerade 3.4.4 Merkpunkte Kapitel 3.4 Die Bragg-Bedingung legt fest in welcher Raumrichtung bei gegebenem Gitter und einfallendem Wellenvektor k überhaupt Reflexe auftreten können, die Strukturamplitude Fs bestimmt, welche Intensität dieReflexe haben. Fs = Σ fj · exp [i · rj · G] j Die Strukturamplitude enthält die Art (" j") und ""Anordnung (rj) der Atome der Basis desKristalls. Ein Teil dieser Information steckt in den (tabellierten) Atomformfaktoren fj. Die Auswerung der Formel für die Strukturamplitude führt zu Auslöschungregeln für einige Gittertypen. bcc Gitter fcc Gitter Es ist verhältnismäßig einfach dasBeugungsbild eines gegebenen Kristalls zu errechen. Die Umkehraufgabe ist sehr schwierig: Aus einem gegebenen Beugungsbild ist der vorliegende Kristall nicht einfach zu errechnen. Sofern jedoch noch Zusatzinformationen vorliegen, kann das Problem heute routinemäßig gelöst werden. MaWi 2 Skript - Page 126 h+k+l = h, k, l = ungerade Zahl nug { alle gerade alle ungerade 3.5 Experimentelle Methoden zur Kristallstrukturanalyse 3.5.1 Beugungsverfahren Allgemeine Bemerkungen Die verschiedenen Meßmethoden zur Kristallstrukturanalyse unterscheiden sich zunächst durch die verwendeten Sondenteilchen. Üblicherweise benutzt werden: Photonen (inkl. Röntgenstrahlung) Elektronen Neutronen. Weiterhin kann man die Verfahren noch danach einteilen, ob sie bildgebend sind, oder nur eine Beugungsstruktur liefern. Bildgebend heißt, daß man im übliche Wortsinn ein Bild der Struktur im "Ortsraum" bekommt - sei es als Bild der Atomreihen des Kristalls, oder auch z.B als Bild von Defekten im Kristall. Dabei ist aber immer die Beugung von Wellen am Gitter des Kristalls der zugrundeliegende " Kontrastmechanismus ", d.h. der Mechanismus, der die Dinge sichtbar macht. Bildgebende Verfahren sind in erster Linie die Transmissionselektronmikrosokopie (TEM) und die Röntgentopographie. Lichtmikroskopie zählt nicht dazu, da hier zwar die Beugung von Licht an Gefügestrukturen ausgenützt wird, aber keine Beugung an Gitterstrukturen stattfindet. Verfahren, die eine Beugungstruktur oder Beugungsbild produzieren, liefern Informationen darüber, welche Ebenen eine Welle wie stark reflektieren. Wenn man so will, liefern sie ein (Teil)bild des reziproken Gitters (mit Auslöschungsregeln und Intensitätsmerkmalen). Beugungs"bilder" oder - Diagramme sind ziemlich unempfindlich auf Kristallgitterdefekte; sie liefern direkte Aussagen über den Kristalltyp (welches Bravaisgitter liegt vor?), quantitative Werte für die Gitterkonstanten, und indirekte Werte für die Basis. Ansonsten ist die experimentelle Arbeit (im Gegensatz zur Theorie), natürlich stark unterschiedlich für unterschiedliche Wellensorten. Wir haben im wesentlichen Röntgenstrahlung: Hat eine relative große Eindringtiefe in das Material und ist verhältnismäßig billig. Die Strukturuntersuchung mit Röntgenstrahlung ist die Standardmethode in vielen Labors. Will man sehr intensive und monchromatische Röntgenstrahlung, ist eine normale "Röntgenröhre" überfordert. Abhilfe liefert die Synchrotronstrahlung, ein "Abfallprodukt" der Elementarteilchenforschung. Es handelt sich dabei einfach um die Strahlung, die extrem hochenergetische Elektronen, die in großen Sychrotonbeschleunigern auf eine Kreisbahn gezwungen (und dadurch beschleunigt) werden, automatisch emittieren. Billig ist das allerdings nicht mehr. Neutronenstrahlen : Damit ist man in der Lage, große Probenvolumina zu untersuchen (dies folgt einerseits aus der ebenfalls großen Eindringtiefe von Neutronen in Materie, andererseits aber auch aus dem großen Querschnitt des Neutronenstrahls). Neben der Strukturuntersuchung kann man mit Neutronen auch Defekte (Ausscheidungen) und Texturen von Materialien untersuchen, und insbesondere auch magnetische Eigenschaften von Festkörpern. Da man einen kompletten Kernreaktor braucht (oder eine auch nicht unter einigen 100 Mio € zu habende "Spallationsquelle"), ist das Verfahren nicht besonders populär, wird aber in einigen Großforschungszentren intensiv betrieben. Elektronenstrahlen Die Wechselwirkung der durchstrahlten Materie mit den Elektronen ist sehr stark. Es lassen sich daher nur dünne Schichten oder Oberflächen mit Elektronen untersuchen. Dies geschieht meist in einem Transmissionselektronemikroskop (TEM), dem das nächste Unterkapitel gewidmet ist. Ein TEM kann beides: Beugungsbilder und -Strukturbilder liefern Im folgenden werden einige Standardmethoden mit Röntgenstrahlung kurz gestreift. Man kann dabei noch unterscheiden ob die Methode für Poly- oder Einkristalle geeignet ist, und ob monochromatische oder "farbige" Strahlung zum Einsatz kommt. MaWi 2 Skript - Page 127 Standardverfahren mit Röntgenstrahlung Am einfachsten ist das Laue-Verfahren. Der einfallende Röntgenstrahl ist polychromatisch (breites Wellenlängenspektrum; billig herzustellen), die Probe liegt als Einkristall vor. Der Strahl fällt auf die Probe; vor (und bei dünnen Proben evtl. auch hinter) der Probe sind (für Röntgenstrahlen empfindliche) Photoplatten (oder on-line Detektoren), die einen Teil der gebeugten Strahlen detektieren. Aus dem breiten Röntgenspektrum gibt es für die verschiedenen Netzebenen immer einen Wellenevektor, der die Bragg-Bedingung erfüllt; jede Kristallebene reflektiert damit einen Teil des einfallenden Strahls. Die Strahlung in den Reflexen ist jetzt monochromatisch, aber das ist einer Photoplatte egal. Das Ganze sieht dann so aus (links der Aufbau; rechs ein typische Beugungsdiagramm (von Si)) Das Laue-Verfahren ist einfach, aber nicht sehr präzise. Man benutzt es daher meist nur zur Orientierung von Einkristallen. Präziser und vielseitiger ist das Diffraktometer in einer seiner vielen Ausprägungen; die einfachste Variante ist unten schematisch dargestellt. Der monochromatische Röntgenstrahl wird auf die (einkristalline) Probe gelenkt, die durch Schrittmotoren mit Computersteuerung um mehrere Achsen drehbar ist. Ein Detektor steht unter einem (wählbaren) Winkel in einer günstigen Position im Raum. Durch den einfallenden Wellenvektor k, die Richtung des Detektors und den Kristall ist die Diffraktionsebene (siehe Zeichnung) festgelegt. Durch systematische Variation der Winkel ϕ, ω und χ wird immer wieder ein reziproker Gittervektor in der Streuebene zu liegen kommen, der die Bragg-Bedingung erfüllt. Der Detektor registriert dann eine gewisse Intensität an Strahlung. Da die Winkel sehr genau einstellbar sind, erhält man sehr genaue Ergebnisse. Die Intensität als Funktion der drei Winkel enthält alle Information über den Kristall, die man überhaupt durch Beugung ermitteln kann. Die Durchführung und Auswertung des Experiments war in der Matwiss-Antike (bis 1980) ziemlich mühselig; heute geht es vollautomatisch per Computer. Hat man eine polykristalline Substanz zu analysieren (das ist der Normalfall), wählt man das Debye-ScherrerVerfahren. Die Probe ist pulverförmig oder ein (relativ dünner) Polykristall. Auf die von einem für Röntgenstrahlen empfindlichen Film vollständig umgebene Probe wird ein monochromatischer Röntgenstrahl gelenkt. Von den vielen Kristalliten der Probe sind immer einige bezüglich des Primärstrahls so orientiert, daß das BraggGesetz für eine bestimmte Netzeben {hkl} erfüllt werden kann. Die an diesen Netzebenen reflektierten Röntgenstrahlen liegen für jeden Reflex auf einem Kegelmantel, der den Film schneidet. An der Schnittlinie wird der Film geschwärzt - je nach Intensität mehr oder weniger. Der Streukegel hat den Öffnungswinkel 2ϑ, wobei ϑ der Bragg-Winkel ist. Eine Rückrechnung von den Linien auf dem Film auf Ebenenabstände ist also leicht möglich. Das folgende Bild zeigt die Anordnung schematisch und in der Realität sowie einen belichteten Film (mit Reflexen von Si). MaWi 2 Skript - Page 128 Es gibt noch viele Varianten und Spezialitäten. Die Röntgen- und Neutronenstrukturanalyseverfahren sind eine ganze Wissenschaft für sich, deren praktische Bedeutung kaum überschätzt werden kann. Nahezu alles was wir über die Struktur der Materie wissen, stammt von Beugungsverfahren. Sie sind nach wie vor das Rückgrat jeder Strukturanalytik. Alle Verfahren (und noch einige mehr) gibt es in modifizierter Form auch für Neutronenbeugung. Die Durchführung der Experimente ist jedoch aufwendig und deshalb auf Fragen begrenzt, die mit Röntgenstrahlung nicht zu beantworten sind. Das nachfolgende Bild gibt einen kleinen Eindruck des Aufwands; wir blicken in die Experimentierhalle einer Neutronenbeugungseinrichtung. Freundlicherweise überlassen von GKSS Geesthacht MaWi 2 Skript - Page 129 3.5.2 Elektronenmikroskopie Ein Elektronenstrahl ist nicht nur eine (gute Näherung an eine) ebene Welle, sondern - im Gegensatz zu Röntgen- und Neutronenstrahlen - auch ein elektrischer Strom geladener Teilchen. Damit kann der Strahl durch elektrische und/oder magnetische Felder abgelenkt werden - und das eröffnet die Möglichkeit elektromagnetische Linsen zu bauen. Obwohl aus sehr prinzipiellen Gründen nur Sammellinsen möglich sind, kann man damit trotzdem ein Mikroskop bauen - ein Elektronenmikroskop. Elektronenmikroskope kommen in zwei grundverschiedenen Varianten: 1. Das Rasterelektronenmikroskop (REM oder englisch SEM für "Scanning Electron Microscope") "rastert" lediglich einen mit elektromagnetischen Linsen fein fokussierten Elektronenstrahl im Zick-Zack über die Probe (wie im CRT Bildschirm). Registriert wird in einem geeigneten Detektor, wieviele Sekundärelektronen (oder sonstwas) freigesetzt werden. Das Bild ist im wesentlichen eine "dreidimensionale" Wiedergabe der Oberflächentopographie, mit einer Schärfentiefe und Auflösung, die um Größenordnungen besser ist als im Lichtmikroskop. Der Link führt zu Beispielen. REMs haben noch sehr viel mehr Anwendungsmöglichkeiten - sie machen aber grundsätzlich nicht von der Wellennatur des Elektronenstrahls Gebrauch und sollen uns hier nicht weiter interessieren. 2. Das Transmissionselektronenmikroskop (TEM). Hier wird der Elektronenstrahl möglichst ohne Absorption durch die sehr dünne Probe geführt und was immer unten herauskommt durch elektromagnetische Linsen auf einen Bildschirm abgebildet. Dabei hat man durch einfaches Umschalten immer zwei Möglichkeiten: 1. Man erzeugt ein Beugungsbild. Das ähnelt dann dem Beugungsbild einer Laue-Aufnahme in Transmission - obwohl die Welle hier monochromatisch ist. Dass trotzdem sehr viele Reflexe angeregt werden liegt daran, daß k sehr lang ist, so daß die Ewaldkugel praktisch als Ebene durchs reziproke Gitter der Probe läuft und alle reziproken Gitterpunkte schneidet die in einer Ebene senkrecht zum Elektronenstrahl liegen. Da die reziproken Gitter"punkte" bei sehr dünnen Proben eher ausgedehnt sind, trifft die Ewaldkugel relativ viele davon. Das nachfolgende Bild zeigt einige Beispiele dessen was man auf dem Bildschirm zu sehen bekommt. Al Einkristall Schichtfolge Si - NiSi; das NiSi ist weitgehend polykristallin Schichtfolge Si - NiSi - NiSi2 Epitaktisches Wachstum, d.h. Einkristallinität bleibt weitgehend erhalten Polykristallines PtSi Die Bilder lassen sich selbstverständlich quantitativ auswerten; auch damit ist eine Strukturbestimmung möglich. 2. Man erzeugt ein Bild der an der Unterseite der Probe lokal vorhandenen IntensitätIg eines gebeugten Strahls, oder des Primärstrahls dessen lokale Intensität einfach ( I0 – gesamte lokal gebeugte Intensität) sein muß. Mit der zweiten Variante kann man Kristallgitterdefekte abbilden, wir schauen uns das mal schematisch für eine Stufenversetzung an. Zunächst orientieren wir die Probe mit einer Stufenversetzung wie gezeigt relativ zum Elektronenstrahl derart, daß die Bragg-Bedingung für die gezeichneten Ebenen fast, aber nicht exakt erfüllt ist. Der blaue Strich deutet an, wie die Probe orientiert sein müßte, damit die Bragg-Bedingung exakt erfüllt ist. Die Zeichnung übertreibt mächtig. MaWi 2 Skript - Page 130 Um die Versetzung herum ist das Gitter lokal verbogen; in dem angedeuteten Bereich ist die Bragg Bedingung erfüllt, oder jedenfalls besser erfüllt, als weg von der Versetzung. Damit wird an der Unterseite der Probe, entlang der Projektion der Versetzungslinie, viel Intensität des einfallenden Elektronenstrahls in den abgebeugten ("blauen") Strahl "umgeleitet" (und zwar immer nur auf einer Seite der Versetzung). Mit einer geeignet plazierten Blende kann man den gebeugten Strahl ausblenden und ein stark vergrößertes Bild der Intensitätsverteilung des Primärstrahls an der Unterseite der Probe machen. Die Versetzung wird dann als leicht verschwommene dunkle Linie erscheinen. Da die Auflösung eines Mikroskops - d.h. die Größe der kleinsten noch beobachtbaren Strukuren - immer in der Größenordnung der Wellenlänge der verwendeten Strahlung liegen, ist bei Lichtmikroskopen bei etwa 0,5 µm das Ende der Fahnenstange erreicht. Elektronenmikroskope verwenden typischerweise Beschleunigungsspannungen von 100 kV - 1,5 MeV und können damit ohne weiteres atomare Auflösung im nm Bereich erreichen (es ist die Qualität der elektomagnetischen Linsen, nicht die Wellenlänge, die hier problematisch wird). Genauso ist es auch - das nachfolgende Bild zeigt ein Beispiel Wir sehen eine ganze Schar von (ungefähr parallelen) Versetzungen. Die Probe ist leicht verbogen; links sind wir relativ weit weg von der exakten Bragg-Bedingung, rechts dicht dran. Der Versetzungskontrast nimmt von links nach rechts deutlich zu; gleichzeitig werden die Linien breiter und unschärfer, wie wir das erwarten würden. Das TEM ist ein außerordentlich mächtiges Intrument zur Strukturbestimmung mit lokaler Auflösung. Man kann kleinste Defekte (bis hinunter zu einzelnen Atomen) sichtbar machen und analysieren. Allerdings ist es nicht ausgesprochen billig (Standardgeräte so um 1 Mio €; Spitzengeräte um die 7 Mio €), schwer zu bedienen (man braucht, typischerweise im Rahmen einer Doktorarbeit so 1 - 2 Jahre bevor man TEM "kann"), und nur einsetzbar für winzigste Pröbchen! Atome sind einfach klein. Das gesamte bisher weltweit mit TEM untersuchte Probenvolumen liegt deutlich unter 1 mm3 Mehr zum TEM in Kurzfassung im Link. Wer es noch genauer wissen will (und viele Beispiele anschauen möchte), geht zum entsprechenden Kapitel im Hyperskript "Defects" MaWi 2 Skript - Page 131 3.5.3 Zusammenfasuung Kapitel 3.5 Gebräuchliche Strahlungsarten für Strukturuntersuchungen an Kristallen sind Röntgen-, Elektronen- und Neutronenstrahlen. Röntgenanlagen sind relativ billig und weit verbreitet. Elektronenstrahlanlagen sind mehrheitlich Transmissionselektronenmikroskope; in Deutschland gibt es ca. 30 Geräte. Neutronenbeugung ist auf "Reaktorbesitzer" beschränkt. Man könnte die (Röntgen)techniken sortieren nach folgenden Kriterien: Probe: Monokristallin oder polykristallin. Röntgenstrahl: Monchromatisch oder polychromatisch. Verfahren: Statisch (nichts bewegt sich) oder dynamisch (Strahlung aus mehreren Richtungen oder Probe dreht sich um 1 - 3 Achsen. Abbildung: Beugungsbild (= Bild des reziproken Gitter) oder Strukturbild (= Bild im Ortsraum). Für jede denkbare Kombination liefert die Ewald Konstruktion sofort die grundsätzlichen Beugungsmuster und damit den möglichen Einsatzbereich. Wichtige Vertreter der möglichen Untergruppen sind: Laue Verfahren: Polychromatisch, Monokristall, Statisch; Beugungsbild. Schnelle Bestimmung der Einkristallorientierung. Debye-Scherrer Vefahren: Monchromatisch, Polykristallin, Statisch, Beugungsbild. Strukturbestimmung an Pulvern (d.h. jede "gemahlenene" Probe; immer möglich). (Drehkristall)diffraktometer Monochromatisch, Monokristall oder Polykristall, dynamisch (Probe dreht sich automatisch), Beugungsbild. Präzisionsmessungen aller Art. Transmissionselektronenmikroskop: Monochromatisch, Monokristall oder Polykristall, dyamisch (Probe wird gezielt gedreht), Beugungsbild und Strukturbild. Verfahren sind komplex, aber weitgehend automatisiert. Die Qualtät der Analyse hängt überwiegend nur noch von der Qualität der Probe ab. Selbst die Strukturbestimmung von extrem komplexen Eiweißkristallen ist heute möglich. MaWi 2 Skript - Page 132 4. Elektronische Energiebänder 4.1 Erweiterung des Modells der freien Elektronen durch das periodische Gitterpotential 4.1.1 Freies Elektronengas und Bragg-Bedingung 4.1.2 Brillouin Konstruktion der Beugung und Brillouin Zonen 4.1.3 Zusammenfassung Kapitel 4.1 4.1.4 Merkpunkte Kapitel 4.1 4.2 Banddiagramme 4.2.1 Konstruktion von Banddiagrammen und Zustandsdichte 4.2.2 Materialklassen und Banddiagramme 4.2.3 Zusammenfassung Kapitel 4.2 4.2.4 Merkpunkte Kapitel 4.2 4.3 Band - Band Übergänge 4.3.1 Grundsätzliche Überlegungen und reduziertes Bandschema 4.3.2 Direkte und indirekte Halbleiter 4.3.3 Zusammenfassung 4.3 4.3.4 Merkpunkte 4.3 MaWi 2 Skript - Page 133 4. Elektronische Energiebänder 4.1 Erweiterung des Modells der freien Elektronen durch das periodische Gitterpotential 4.1.1 Freies Elektronengas und Bragg-Bedingung Ein Elektron des freien Elektronengases, das mit ψ(k, r) = ψ0 · eik ·r beschrieben wird, ist eine ebene Welle - und ebene Wellen werden an der periodischen Kristallstruktur gebeugt, falls die Bragg-Bedingung erfüllt ist. Das gilt für alle Elektronenwellen - nicht nur für solche, die wir von außen "hineinschießen". Sobald wir also in unserem Modell des freien Elektronengases ein noch so kleines periodisches Potential "einschalten", bewegen sich die Elektronen jetzt in einem Kristall, und wir müssen mit (noch so kleinen) Beugungseffekten rechnen. Man kann das Problem jetzt auf zwei Weisen angehen: 1. Wir gehen voll quantitativ vor und lösen die Schrödingergleichung für ein periodische Potential, das die reale Situation in einem Kristall wiederspiegelt. Das tut man am besten, indem man das periodische Potential in eine Fourierreihe entwickelt, und damit in die Schrödingergleichung eingeht. Man hat dann immer die Option, die Terme höherer Ordnung zu vernachlässigen, wenn man mathematisch nicht recht klar kommt. Wie das aussieht kann man sich im Link anschauen. Die Beugerei muß in den Lösungen enthalten sein, und das ist sie auch. Aber der dazu nötige Aufwand ist erheblich. Für unsere Zwecke reicht es, die Lage mehr qualitativ zu betrachten: 2. Wir betrachten also die Situation zunächst nur qualitativ mit wenigst möglichen Änderungen relativ zum freien Elektronengas. Dazu denken wir uns zwar ein periodisches Potential eingeschaltet, aber nur ein ganz kleines. So klein, daß wir nur mit kleinen Korrekturen zu den Lösungen für ein konstantes Potential rechnen müssen, aber nicht mit grundsätzlich neuen Dingen. Das wird dann nicht die Realität widerspiegeln, aber vielleicht doch generelle Hinweise auf die zu erwartenden Änderungen geben. Denn auch mit einem kleinen periodischen Potential werden wir Beugung haben. Wir müssen zwar erwarten, daß die Amplituden der gebeugten Wellen dann vielleicht klein sind; aber dafür interessieren wir uns zunächst noch nicht. Wir betrachten ausschließlich die generellen Effekte, die durch Beugung zustande kommen. Und darüber hinaus machen wir uns klar, dass all die Elektronen, die keine Beugungsbedingung erfüllen, gar nichts tun. Sie benehmen sich nach wie vor wie die Elektronen des freien Elektronengas Modells. Wie es sich zeigen wird, reicht die 2. Vorgehensweise im wesentlichen aus, um alles abzuleiten was wir hier wissen müssen. Zur Wiederholung, und um eine ersten Eindruck zu bekommen, was uns erwartet, stellen wir die bisherigen Erkenntnisse (im wesentlichen freies Elektrongas) den zu erwartenden Änderungen gegenüber. Warum die zu erwartenden Änderungen erwartet werden können, wird uns in den nächsten Unterkapiteln beschäftigen. Es ist aber nicht verboten, schon jetzt mal selbst ein bißchen darüber nachzudenken. Potential V(x,y,z) Freies Elektronengas Freies Elektronengas mit Beugung V = const = 0 Vx = V0 · cos (2πx/a1) Vy = V0 · cos (2πy/a2) Vz = V0 · cos (2πz/a3) V0 → 0 Wellenfunktion ψ(x,y,z) ψ = 1 L 3/2 · eikr ψ = 1 L 3/2 · eikr außer für Wellenvektoren kB die gebeugt werden Wellenvektoren k kx = ± nx · 2π / L ky = ± ny · 2π / L kx = ± nx · 2π / L ky = ± ny · 2π / L kz = ± nz · 2π / L kz = ± nz · 2π / L ni = 0, ±1, ±2, ... ni = 0, ±1, ±2, ... MaWi 2 Skript - Page 134 Energie E Gesamtenergie = const = Ekin Dispersionsfunktion E(k) Gesamtenergie = const = Ekin außer für Wellenvektoren kB die gebeugt werden, denn dann kommt etwas potentielle Energie ins Spiel 2k2 2k2 E = E = 2m 2m außer für Wellenvektoren kB die gebeugt werden Zustandsdichte D(E) (2m e)3/2 (2m e)3/2 E1/2 D(E) = E1/2 D(E) = 2 3π2 2 3π2 als erste Näherung. Könnte sich aber auch kräftig ändern Besetzungswahrscheinlichkeit f(E,T) 1 1 f(E, T) = f(E, T) = exp Ei – EF kT +1 exp Ei – EF kT +1 gilt immer ! Im wesentlichen können wir für alle Funktionen, die k als Variable haben, irgendwelche Änderungen erwarten, falls k die Bragg-Bedingung ungefähr erfüllt. Für alle Wellenvektoren, die das nicht tun, sollten eigentlich die Formeln des freien Elektronengases weiter gelten Obwohl es selbstverständlich ist, soll noch extra darauf hingewiesen werden, daß die Besetzungswahrscheinlichkeit eines Energieniveaus E(k) immer durch die Fermiverteilung gegeben ist. Damit sind auch alle wesentlichen Formeln, die wir im Zusammenhang mit der Fermiverteilung erhalten haben unverändert gültig. Man muß nur die richtige Formel für die Zustandsdichte einsetzen, denn hier müssen wir mit Änderungen rechnen Fragebogen / Questionaire Multiple Choice Fragen zu 4.1.1 MaWi 2 Skript - Page 135 4.1.2 Brillouin Konstruktion der Beugung und Brillouin Zonen Die Brillouin Konstruktion der Beugung In vorhergehenden Unterkapitel haben wir uns klar gemacht, daß wir bei einer Übertragung des freien Elektronengasmodells auf Kristalle in einer ersten Näherung nur bei den Wellenvektoren, die der Bragg-Bedingung genügen, Änderungen im Verhalten der zugehörigen Elektronenzuständen erwarten müssen. Jetzt müssen wir uns fragen: Welche Wellenvektoren sind das denn? Wir nennen sie mal kB. Schön wäre eine simple Formel oder Konstruktion, die für ein gegebenes Gitter die betroffenen WellenvektorenkB aus der Menge aller möglichen Wellenvektoren k heraussiebt. So etwas gibt es, wir betrachten dazu die Brillouin Konstruktion der Beugung. So wie die Ewald Konstruktion uns einfach zeigt, was sich für die Beugung im Falle eines fixen Wellenvektors und eines variablen Gitters ergibt, zeigt uns die Brillouin Konstruktion, was man für ein fixes Gitter und variable Wellenvektoren erhält. Im Prinzip können wir alle Wellenvektoren, die als Lösung der Schrödingergleichung für das freie Elektronengas auftreten, in das reziproke Gitter einzeichnen; wir wollen also auch hier das reziproke Gitter als Darstellungsraum für die Brillouin Konstruktion wählen. Alles was wir dann noch zu tun haben ist, auf jede Strecke, die vom Ursprung zu einem reziproken Gitterpunkt führt, die Mittelhalbierende zu zeichnen. Zweidimensional ist das eine Strecke, dreidimensional eine Fläche. Alle Wellenvektoren, die auf einer dieser Flächen enden, erfüllen die Bragg-Bedingung! Das schauen wir uns in einer simplen Graphik eines zweidimensionalen Gitters an; die obige Aussage ist dann elementar zu beweisen. Direkt sichtbar ist, daß jeder k-Vektor, der auf einer der rosa Mittelhalbierenden endet, einen Wellenvektor k' produzieren "darf", der die Bragg-Bedingung k – k' = G erfüllen kann. Eingezeichnet sind der Einfachheit halber die –k Vektoren. Dreidimensional haben wir Flächen - und diese Flächen werden sich schneiden und ein System von ineinandergeschachtelten Polyedern bilden. Das kleinstmögliche Polyeder ist natürlich nichts anderes als die Wigner-Seitz Elementarzelle des reziproken Gitters! Wir führen jetzt einen alternativen Namen für die Wigner-Seitz Elementarzelle des reziproken Gitters ein, wir nennen sie die erste Brillouin Zone, abgekürzt 1. BZ. Das hat keinen tieferen Grund, sondern macht nur die Systematik leichter: Nach der 1. BZ kommt die 2. Brillouin Zone, danach die 3. BZ und so weiter - wir betrachten einfach die sich ergebende Abfolge von ineinandergeschachtelten Polyedern, die sich automatisch ergibt, wenn man das Mittelhalbierenden-Rezept konsequent fortsetzt. Leicht gesagt, nicht ganz so leicht dreidimensional durchgeführt. Aber schon früh hat man Doktoranden gequält und perspektivische Zeichnungen erstellen lassen - in diesem Fall war es 1965 Herr Lück (und damals gab es noch keine Computergraphik!). MaWi 2 Skript - Page 136 Es ist schon ganz erstaunlich, wie man von einem einfachen Würfel durch sukzessive Anwendung eines einfachen Rezepts zu recht komplizierten Edern kommt. Aber das soll uns nicht stören; niemand muß diese Strukturen auswendig können. Wir sehen jedoch eine erste Konsequenz für die Darstellung von Funktionen im k- Raum: Die beim freien Elektronengas noch vorhandene Kugelsymmetrie geht verloren, dafür bekommen wir Symmetrielemente des Gitters. In anderen Worten: Bisher war es völlig egal, in welche exakte Richtung im k- Raum die k- Achse zeigte, Funktionen wie E(k) oder D(k) sahen immer gleich aus. Jetzt schneidet eine beliebige k- Achse eine Brillouin Zone nach der anderen - und wo diese Schnittpunkte liegen hängt von der Richtung von k ab und damit davon, in welche Richtung im reziproken Gitter wir gucken! Da wir erwarten, daß immer dann wenn k die Bragg-Bedingung erfüllt (und dann kBr oder kB heißt und niemals mit k oder kB, der Boltzmannkonstanten verwechselt wird ) - und das heißt jetzt eine BZ schneidet - mit E(kBr) oder D(kBr) etwas "passiert", wird dieses "etwas" jetzt in verschiedenen Richtungen der reziproken Gitters bei verschiedenen (Beträgen der) Wellenvektoren stattfinden müssen. Was immer auch geschieht, wir verlieren die Kugelsymmetrie des freien Elektronengases und erhalten dafür die Symmetrie des reziproken Gitters. Und das ist ein erstes allgemeines Ergebnis, das ganz offensichtlich immer gilt - auch für die korrekte Lösung des Problems. Stehende Wellen als Ergebnis der Beugung Betrachten wir den einfachen Fall einer Welle die im obigen Bild in G1 Richtung läuft und die Bragg-Bedingung erfüllt: Offenkundig erfüllen auch die Wellenvektoren kB' die Braggbedingung - es wird also ständig hin- und rückgebeugt Für den speziellen Fall (Wellenvektor kBauf kx-Achse) wie oben gezeigt) muß nun gelten MaWi 2 Skript - Page 137 G1 Wellenvektor kB der "hin"laufenden Welle: kB= 2 G1 Wellenvektor kB' der "rück"laufenden = gebeugten Welle: k 'B = – 2 Die Wellenfunktion für diese hin-und-hergebeugten Elektronen ergeben sich konsequenterweise durch eine Überlagerung der Wellenfunktionen der hin- und rücklaufenden Wellen. Das muß man hier einfach so hinnehmen, aber es ist bei Elektronenwellen auch nicht anders als bei Wasserwellen: Wenn eine Wasserwelle ans Ufer läuft und dort reflektiert ("gebeugt") wird, überlagern sich hin- und rücklaufende Wellen. Wiederum ein nur quantenmechanisch zu verstehendes Phänomen. Wenn ein "hin"laufendes klassisches Teilchen an einer Mauer reflektiert ("gebeugt") wird, läuft es anschließend zurück. Aber es überlagert sich nichts: Es ist entweder hin- oder rücklaufend, nicht aber beides irgendwie gleichzeitig. Das Ergebnis der Überlagerung zweier in entgegengesetzten Richtungen laufender ebener Wellen ist elementar einfach und bekannt: Wir erhalten eine stehende Welle. Das können wir sofort mathematisch nachvollziehen indem wir ψ(kBr, r) = ψ0 · eikBr · r und ψ(– k, r) = ψ0 · e– ik · r überlagern, d.h. addieren oder subtrahieren (und dabei der Einfachheit halber die Amplituden = 1 setzen). Br Welches Vorzeichen ist das richtige? Zwar behaupten manche Leute, daß geben seeliger denn nehmen sei, aber mathematisch sind + und – jedoch gleichberechtigt. Die Antwort ist also: Beide Vorzeichen sind richtig und gleichberechtigt - es gibt außerhalb der Theologie keinen Grund eines zu bevorzugen. Beide Überlagerungen liefern gleichberechtigte Lösungen für die Schrödingergleichung mit "eingeschalteter Beugung". Das ist natürlich ein qualitatives Argument (das auch noch ein paar Tücken hat, wenn man genau hinschaut); aber es ist trotzdem richtig. Verallgemeinern wir noch ein bißchen mehr, stellen wir fest, daß wir für alle Elektronen mit Wellenvektoren, die auf den Rändern irgendeiner Brillouinzone liegen, zwei mögliche Lösungen der Schrödingergleichung gibt, die wir mit ψ+ und ψ– bezeichnen wollen. Sie lauten: ψ+ ∝ ψ– ∝ exp exp i· i· G ·x 2 G ·x 2 + exp – exp –i· –i· ·x ·x G 2 G 2 G ist dabei der reziproke Gittervektor, der das jeweilige Stück Brillouinzone beschreibt. Hübsch, aber noch etwas inhaltsleer. Das ändert sich aber sofort, wenn wir für die mit ψ+ und ψ– beschriebenen Elektronen jetzt mal schnell die Aufenthaltswahrscheinlichkeit ausrechnen, d.h. |ψ+|2 und |ψ–|2 bilden. Das tun wir in in einer Übungsaufgabe: Übung 4.1-1 Aufenthaltswahrscheinlichkeiten Wir erhalten folgendes Ergebnis MaWi 2 Skript - Page 138 |ψ+|2 ∝ cos2 |ψ–|2 ∝ sin2 G G ·x ·x 2 2 Wir haben jetzt Maxima und Minima der Aufenthaltswahrscheinlichkeit für die Elektronenen deren Wellenvektoren die Bragg-Bedingung erfüllen, während für all die Elektronen, die von der Beugung nichts merken, die Aufenthaltswahrscheinlichkeit nach wie vor überall konstant ist. Für die Stellen im Gitter bei denen die Maxima/ Minima liegen gilt: Maxima ψ+ Elektronen: x+max = 2n π n = 0, 1, 2, 3,... G Maxima ψ– Elektronen: x–max = (2n +1)π G n = 0, 1, 2, 3,... Was bedeutet das? Im einfachsten Fall nehmen wir für den reziproken Gittervektor in einem kubischen Gitter G = {100}. Der Betrag ist dann |G| = 2π/a; a ist die Gitterkonstante. Damit erhalten wir für die maximale Aufenthaltswahrscheinlichkeit der Elektronen, die als Welle in den Grundrichtungen der Elementarzelle laufen und die Bragg-Bedingung erfüllen: x+max = n·a n = 0, 1, 2, 3,... x–max = n · a + a/2 n = 0, 1, 2, 3,... Machen wir nun aus dem Gitter den einfachstmöglichen Kristall, indem wir auf jeden Gitterpunkt ein Atom setzen, erhalten wir ein bemerkenswertes Ergebnis: Die ψ+ Elektronen haben ihre maximale Aufenthaltswahrscheinlichkeit am Ort der Atome, die ψ– Elektronen genau dazwischen. Das Ganze sieht dann so aus: Die lila Kurve unten zeigt den tatsächlichen Verlauf der potentiellen Energie V(x) entlang von z.B. einer <100> Richtung. Die roten und blauen Kurven entsprechen den beiden Lösungen |ψ+|2 und |ψ–|2 und beschreiben damit die Aufenthaltswahrscheinlichkeit der Elektronen. MaWi 2 Skript - Page 139 Das hat jetzt weitreichende Konsequenzen für die Energie dieser Elektronen. Sie "spüren" das Potential, d.h. ihre Gesamtenergie ist wohl noch konstant, aber nicht mehr rein kinetisch, im Gegensatz zu den "ebenenWellen" Elektronen, für die sich das Potential sozusagen wegmittelt. Dabei "sehen" die ψ– und ψ+ Elektronen aber verschiedene Potentiale; das wird sich dann in ihrer Gesamtenergie bemerkbar machen. Wenn man genauer hinschaut sieht man, dass die ψ+ Elektronen noch die starke Bindungskräfte des Atoms "spüren", sie sind gewissermaßen noch halb gebunden; die ψ– Elektronen sind dagegen freier, sie spüren keine oder zumindest nur stark verringerte Kräfte. Anders ausgedrückt: Die effektive potentielle Energie der beiden Elektronensorten ist anders. Nochmal anders ausgedrückt: Die zum durch kB charakterisierten Zustand gehörende Gesamtenergie ist nicht mehr eindeutig, sondern nimmt zwei Werte an! Da wir aber immer noch fast konstantes Potential voraussetzen, das nur mit einer ganz kleinen periodischen Komponente moduliert ist (im Gegensatz zu obigem Bild), kann die potentielle Energie bei uns nicht sehr verschieden sein. Im realem Kristall ist die Modulation aber kräftig. Das ändert aber nicht die generelle Beobachtung, daß bei Elektronen mit Wellenvektoren auf den Grenzen einer BZ zwei Energieeigenwerte auftreten werden, sondern nur die Größe der Aufspaltung und evtl. auch noch das Verhalten in der Nähe der BZ. Das ist die zweite wesentliche Konsequenz aus dem "Einschalten" eines periodischen Potentials: Die Energie für Wellenvektoren auf den Rändern der BZ nimmt zwei Werte an; wir haben eine Energieaufspaltung. Das sind die wesentlichen und fundamentalen Erkenntnisse, die sich qualitativ relativ zwanglos aus dem freiem Elektronengas plus einem ganz kleinem periodischem Potential, dem Modell des leeren Gitters, ableiten lassen. Wir werden also in jedem Fall die Energie als Funktion des Wellenvektors an all den Stellen, an denen die Wellenvektoren auf den Rändern (und in der Nähe) einer BZ liegen, modifizieren müsen. Für verschiedene Richtungen im reziproken Gitter wird das an verschiedenen Stellen geschehen - die Kugelsymmetrie ist nicht mehr vorhanden! Das kann qualitativ, in einer Art "Prinzipkurve", nur so aussehen 1): Das ist ein sehr wichtiges Bild. Es vereinigt die beiden wesentlichen Erkenntnisse und führt zwangsweise auf eine dritte: Aufgetragen ist die Gesamtenergie als Funktion des Wellenvektors (immer mit der k-Achse in die jeweilige reziproke Gitterrichtung genommen). Um die jetzt bestehende Verschiedenheit der Richtungen anzudeuten, schauen wir nach rechts in eine (100) Richtung des reziproken Gitters, nach links in eine (111) Richtung. Die beiden kleinsten reziproken Gittervektoren und die Ränder der Brillouinzonen sind eingezeichnet. Die E(k) Funktion (die Dispersionsfunktion) des freien Elektronengases ist in Orange eingezeichnet. Sie kennt keine Richtungsabhängigkeit; sieht also nach rechts und links gleich aus. An den Schnittpunkten der E(k) Kurve mit den Rändern der BZ müssen wir zwei Energiewerte haben. Falls wir keine pathologisch-unstetige Funktion haben wollen, kommen wir nicht umhin, die Parabel wie gezeichnet zu modifizieren. Damit gewinnen wir, sozusagen mit dem Bleistift, eine dritte Erkenntnis: In einer gewissen Umgebung um dem Rand einer BZ müssen wir bei der Dispersionskurve Abweichungen von der einfachen Parabel des freien Elektronengases erwarten. Das ist auch verständlich, denn die Bragg-Bedingung ist ja nicht beliebig "scharf", sondern auch noch für Wellenvektoren eingermaßen erfüllt, die nicht exakt auf dem Rand der BZ liegen. Viel mehr kann man aus der Kombination "freies Elektronengas + Beugung" nicht lernen. Wie groß die Energieaufspaltung in einer gegeben Richtung ist, wie die Dispersionkurve genau aussieht - das ergibt nur die komplette Rechnung mit halbwegs richtigen Potentialen und einigem (mathematisch-numerischen) Aufwand. Allenfalls könnten wir noch die einfachste Näherung abhandeln, das sogenannte Kronig-Penny Modell. Wie das geht, ist aber in einem extra Modul gezeigt. Wir machen uns nur noch eine "dramatische" Konsequenz aus dem Vorhandensein einer Energieaufspaltung klar: MaWi 2 Skript - Page 140 In einem Realkristall müssen wir erwarten, daß es für die freien Elektronen Energiewerte gibt, die sie grundsätzlich nicht annehmen können. Wir haben im Spektrum der möglichen Energiewerte eine Energielücke. Fragebogen / Questionaire Multiple Choice Fragen zu 4.1.2 1) Das Bild ist ein klein wenig geschönt. Falls der Nullpunkt der potentiellen Energe in beiden Fällen identisch wäre, müßten die Kurven etwas in Energierichtung verschoben sein. Sie haben für k = 0 nur dann exakt dieselbe Energie (= 0), wenn man für das freie Eektronengas den Nullpunkt auf den Mittelwert des periodischen Potentials setzt. MaWi 2 Skript - Page 141 4.1.3 Zusammenfassung Kapitel 4.1 Falls man im Modell des freien Elektronengases ein periodisches Potential einbaut, kann man weiterkommen indem man: 1. Die zugehörige Schrödingergleichung löst - sofern man das kann - und dann eine vollständigequantitative Beschreibung des Verhaltens der Elekronen erhält. 2. Das Wissen um die Beugung von Elektronenwellen an periodischen Potentialen einsetzt und dann einige fundamentale Erkenntnisse sowie eine qualitative Beschreibung der Unterschiede zum freien Elektronengas mit konstantem Potential gewinnt Hier wird der zweite Weg beschritten. Dazu muß man sich zunächst klar machen, dass die exp(ikr) Elektronenwellen des freien Elektronengases genauso an einem Gitter/Kristall gebeugt werden wie von außen "hineingeschossene" und ebenfalls durch exp(ikr) beschriebene ebene Wellen. Für ein sich im Zustand k befindliches und dann durch exp(ikr) beschriebenes Elektron des Kristalls gibt es jetzt zwei Möglichkeiten: 1. Es erfüllt für irgendeine Ebenenschar {hkl} des jetzt vorhandenen Gitters die Beugungsbedingung k – k' = Ghkl, dann wird es an dieser Ebenenschar gebeugt (d.h. reflektiert) und macht damit etwas was im Modell des freien Elektronengases nicht vorkommt. 2. Es erfüllt keine Beugungsbedingung, dann spürt es das jetzt vorhandene Gitter überhaupt nicht und verhält sich weiterhin wie ein Elektron des freien Elektronengases. Die erste wichtige Schlußfolgerung ist damit, daß wir unser altes Modell für die meisten k-Zustände weiterhin quantitativ verwenden können; nur eben nicht mehr für die Untermenge derjenigen Zustände kB (k "Bragg", nicht zu verwechslen mit kB, k Boltzmann!), für die eine Beugung auftreten wird. Die Schlüsselfrage ist jetzt: Wie kann man diese "speziellen" Zustände kB aussortieren? Die Antwort gibt die Brillouin Konstruktion der Beugung: Wir tragen alle Zustände k in das reziproke Gitter des betrachteten Gitters ein; dann werden nur diejenigen kBr "gebeugt", die auf den Mittelhalbierenden eines reziproken Gittervektors enden (man darf den Index "B" also auch als "k Brillouin" lesen; aber hier nie als "Boltzmann"!) Die Mittelhalbierenden in einem dreidimensionalen reziproken Gitter sind Flächen; die Gesamtheit dieser Flächen bildet ein System geschachtelter "Polyeder", die nach Größe durchnumerierbar sind. Der kleinstmögliche Polyeder heißt 1. Brillouinzone (BZ); der nächstgrößte 2. BZ usw. Bei näherer Betrachtung der gebeugten Elektronenwellen (besonders einfach fallskB, kB' und G kolinear sind; dann muß kB = G/2 gelten) erkennt man, dass wir jetzt eine Überlagerung von hin- und rücklaufenden Elektronenwellen haben, da auch die exp–(ikBr) Welle automatisch dieselbe Bragg-Bedingung erfüllt wie die hinlaufende Welle und durch Reflektion wieder zu exp(ikBr) wird. Es gibt grundsätzlich zwei Arten der linearen Überlagerung; für den einfachen Fall der Kolinearität alle Vektoren sind das ψ+ ∝ ψ– ∝ exp exp G i· ·x 2 G i· ·x 2 + – exp exp – ·x ·x G –i· 2 G –i· 2 Es ergeben sich zwei stehende Wellen, mit Maxima am Ort der Gitterpunkte /Atome oder genau dazwischen. Da das periodische Potential an diesen beiden Positionen per definitionem verschieden ist, hat der Zustand mit kBr = G/2 jetzt zwei Energiewerte. Das gilt ganz allgemein für alle Zustände die auf den Rändern einer Brillouin Zone liegen. Wir erwarten also für die Dispersionskurve E(k) eine Aufspaltung überall dort, wo die "alte" Parabel eine Brillouinzone schneidet. Das kann nur so aussehen: MaWi 2 Skript - Page 142 Dabei haben wir stillschweigend angenommen, daß auch in der Nähe einer Brillouin Zone Abweichungen vom idealen freien Elektronengas zu erwarten sind - ziemlich wahrscheinlich, denn es gibt in der Natur eher keine echten Singularitäten. Wichtig ist außerdem, dass die Kugelsymmetrie des freien Elektronengases nicht mehr vorhanden ist. Die Dispersionskurve sieht in jeder Richtung des (reziproken) Raumes anders aus - die Aufspaltung ist bei jeweils anderen Werten, wobei jetzt aber die Symmetrie des reziproken Gitters auftauchen wird. In der Grafik ist das symbolisch durch zwei verschiedene Äste dargestellt: Rechts in die (100) Richtung, links in die (111) Richtung des reziproken Raums; d.h. senkrecht zu den (100) bzw. (111) Ebenen des realen Raumes. MaWi 2 Skript - Page 143 4.1.4 Merkpunkte Kapitel 4.1 Auch die Elektronen(wellen) des Kristall werden gebeugt; es gilt die Bragg-Bedingung: k – k' = G Die Bragg-Bedingung ist für alle Zustände (= kB; nicht mit Boltzmannkonstant kB verwechseln!) erfüllt, die auf den Rändern einer Brillouinzone liegen Brillouinzonen sind die ineinandergeschachtelten Polyeder im reziproken Gitter, die man mit der "Mittelhalbierenden" Konstruktion erhält. Die 1. BZ ist die Wigner-Seitz EZ des reziproken Gitters. Die Untermenge der gebeugten Elektronenwellen überlagern sich zu stehenden Wellen; es gibt grundsätzlich zwei Möglichkeiten: ψ± = exp(ikBr) ± exp(–ikBr) Die Maxima der stehende Wellen liegen bei oder zwischen den Gitterpunkten/Atomen (a = Gitterkonstante). ψ+max = n·a n = 0, 1, 2, 3,... Die zugehörigen Energien müssen verschieden sein; wir erhalten auf den Rändern der Brillouinzonen eine Energieaufspaltung der E(k)-Parabel. ψ–max = n · a + a/2 n = 0, 1, 2, 3,... Das kann nur so aussehen: Nur in der Nähe einer BZ ist die freie Elektronengas Dispersionskurve "verbogen"; direkt auf der BZ macht sie einen Sprung, d.h. erlaubt zwei Energiewerte für ein k. Qualitativ bleibt in dieser Betrachtung nur die Größe der Aufspaltung und der Verlauf in der Nähe der BZ. MaWi 2 Skript - Page 144 4.2 Banddiagramme 4.2.1 Konstruktion von Banddiagrammen und Zustandsdichte Wir basteln ein Banddiagramm Im vorhergehenden Kapitel haben wir uns klar gemacht, wie die E(k) - Kurve eines realen Kristalls prinzipiell aussehen muß. Wir nehmen nun diese Kurve und fragen uns, wie sie wirklich aussieht. Dazu müssen einige prinzipielle Erkenntnisse einfließen, die von der Festkörperphysik mit harten Rechnungen erarbeitet wurden. Um das zu verstehen, stellen wir einfach die alte "Prinzip"kurve und die reale Kurve eines realen Kristalls einander gegenüber: Im Grunde brauchen wir nur zwei, "irgendwie" auch ohne lange Rechnung verständliche Verallgemeinerungen: 1. Die Größe der Aufspaltung, d.h. die Breite der Energielücke, ist kristall- und richtungsspezifisch. Das ist im linken Ast für die Kurve in der 1. BZ angedeutet. Das heißt, z.B. daß die Energielücke in der {100}-Richtung des Si verschieden sein wird von der im Ge, oder GaAs, oder ..., (immer im reziproken Gitter natürlich). Es heißt auch, daß die Energielücke in der {100}-Richtung des Si verschieden sein wird von der Energielücke in der {111}-Richtung des Si, oder der {110}-Richtung, oder der {hkl}-Richtung. Allerdings sind natürlich Kristallsymmetrien gewahrt, d.h. die geschweiften Klammern sind absichtlich gesetzt. 2. Der genaue Verlauf der E(k) Kurve kann sich kräftig von der einfachen Parabel des freien Elektronengases unterscheiden. Das ist im rechten Ast für die Kurve in der 2. BZ angedeutet. Insbesondere muß das Minimum oder Maximum des Energiewertes für irgendeinen Zweig, so wie im rechten Ast gezeigt, nicht unbedingt auf dem Rand einer BZ liegen. Das wird weitreichende Konsequenzen haben. Unterstellen wir einfach, daß die richtigen Kurven für einen gegebenen Kristall in allen Details bekannt sind (falls nicht gerechnet, dann wenigsten gemessen), dann haben wir alles was wir brauchen. Das Problem ist nur: Viele Kurven in all diese Richtungen - es wird unübersichtlich. Wir gehen deshalb über zu einer stark vereinfachten Darstellung der Elektronen in Kristallen: Wir betrachten nur noch, welche Energiewerte erlaubt, und welche verboten sind - für beliebige Richtungen. Das Ergebnis ist dann ein Banddiagramm. Wie man vorgeht ist im nächsten Bild schematisch gezeigt; wir bedienen uns der Kurve aus dem obigen Bild. Wir projezieren einfach alle erlaubten Energiewerte für alle Richtungen auf ein E(k) Diagramm, wobei wir aber den jeweiligen k-Wert gar nicht mehr betrachten. Gezeigt ist die Projektion von zwei Ästen der Dispersionskurve, die zwei Teilbänder ergeben. Wir können die Vorgehensweise natürlich "leicht" auf alle Äste ausdehnen, die dadurch erhaltenen "Bänder" aller möglichen Energiewerte geben dem Diagramm den Namen: Es heißt Banddiagramm. Die Energielücke ist prominent zu sehen, wir nennen sie ab jetzt auch Bandlücke, oder in Denglisch "Bandgap". MaWi 2 Skript - Page 145 Wir haben zwar nach wir vor zu jeder beliebigen herausgegriffen Energie (mehrere) bestimmte k-Werte, aber die interessieren uns nicht mehr. Falls wir das Banddiagramm als stark vereinfachte Darstellung der Gesamtheit der E(k) Kurven betrachten, steht an der x-Achse natürlich k. Wir können aber die Achsenbezeichnung im Moment auch weglassen, da sie keinerlei Information enthält. Wir können noch einen Schritt weitergehen und z.B auch " x" oder "z" oder <110> an die Abszisse schreiben , d.h. eine Darstellung der erlaubten Energien im Ortsraum wählen - das Banddiagramm sieht genau so aus. Das sieht wirklich nach einer massiven Vereinfachung aus. Aber das werden wir auch brauchen, denn aus dem hier noch einfachen Banddiagramm wird schnell genug wieder ein kompliziertes Gebilde werden. Zahl der Zustände in einem Band Wieviele Zustände NB gibt es in einem Band? Dazu muß man nur die Zustandsdichte über die Energie von der Bandunterkante bis zur Bandoberkante integrieren - leider kennen wir die Zustandsdichte nicht mehr. Die Frage ist trotzdem ganz leicht zu beantworten - wenn wir ein bißchen nachdenken. Man kann sogar eine Antwort aus zwei grundverschiedenen Betrachtungsweisen finden, die wir beide kurz anschauen: 1. Abzählen der möglichen Wellenvektoren in einer BZ, und 2. Betrachtung der Aufspaltung der Energieniveaus der Einzelatome bei der Bildung eines Kristalls. Im ersten Fall betrachten wir nochmals die Dispersionskurve wie gehabt; schauen aber etwas genauer auf die k-Achse Dort finden wir diskrete Werte für die erlaubten k-Vektoren. Sie haben auf den k-Achsen, die der <100> Richtung in reziproken Gitter entsprechen, immer den Abstand 2π ∆k = L - daran hat sich nichts geändert. Jedes Band entsteht durch die Überlagerung diverser Teilbänder, die jedoch alle aus derselben Brillouin Zone stammen. Die Breite 2kBZ der Brillouin Zone in Richtung der <100> Achsen des reziproken Gitters ist aber immer die halbe Länge des reziproken Gittervektors {100} mal 2 d.h 2·π 2kBZ = a a ist die Gitterkonstante des Raumgitters. Damit passen 2π NB = 2π : a L = L = Zahl der EZ a Zustände in ein Band. Das ist ein einfaches Ergebnis. Wir haben genau so viel Zustände in jedem Band, wie wir Elementarzellen im Gitter haben. Schauen wir uns das noch in der 2. Betrachtung an MaWi 2 Skript - Page 146 Wir formen einen Na Kristall, indem wir gedanklich die Potentialtöpfe der Na Atom überlagern. Das Bild dazu kennnen wir schon und zeigen es nicht nochmal. Hier betrachten wir diesen Vorgang etwas quantitativer, indem wir die Größe der Aufspaltung, d. h. die Differenz zwischen höchster und niedrigster Energie in dem entstehenden Band, über den Abstand der Atome auftragen. Aus jedem der bei großem Abstand diskreten Niveaus wird ein Band; die einzelnen Teilbänder mögen sich bei einem bestimmten Abstand überlappen oder auch nicht. Im gezeigten Beispiel Na ist das letzte besetzte Niveau das 3s1 Niveau; wir erwarten den Gleichgewichtsabstand r0 (= Gitterparameter) im Minimum des 3s Bandes (Warum wohl?). Die Bandstruktur ergibt sich wie gezeichnet, indem man die jeweiligen Energiewerte der "Bänder" bei r0 in ein Banddiagramm einzeichnet. Der Name "Bänder" ist nicht zufällig derselbe wie beim freien Elektronengas + Beugung - es sind dieselben Bänder, über die wir hier reden. Nur können wir hier die Enstehung aus diskreten Energieniveaus der Atome nachvollziehen und damit auch sofort sagen, wieviele Zustände in einem Band vorliegen: NB = Zahl der Atome mal Zahl der Zustände in den diskreten Niveaus, aus denen sich das Band zusammensetzt. Wie so ein Diagramm für Si aussieht, kann man im Link anschauen. Das ist natürlich nicht dasselbe, wie die Zahl der Zustände im ersten Ansatz. Das kann es aber auch nicht sein, denn im ersten Fall hatten wir ein "leeres Gitter" im zweiten Fall einen realen Kristall. Jedenfalls aber halten wir fest: Die Gesamtzahl der Zustände in einem Band ist eine feste Größe, die unmittelbar aus Gitter, Basis und Bindungsverhältnissen folgt. Sie liegt in der Größenordnung der Zahl der beteiligten Atome. Zustandsdichte in Bändern Zu Beginn dieses Kapitels haben wir uns gefragt, was bei "Einschalten" eines periodischen Potentials aus der Zustandsdichte des freien Elektronengases wird und vermutet, daß es an den Rändern der BZ Änderungen geben muß. Das können wir ein bißchen vertiefen, wenn wir uns das Banddiagramm anschauen, wobei wir zunächst mal nur das Banddiagramm eines einzigen "Zweigs" betrachten Zwei Schlußfolgerungen können gezogen werden - die erste leicht verständlich, die zweite etwas indirekter 1. In der Banddlücke gibt es per definitionem keine Zustände, also muß die Zustandsdichte = 0 sein. Da wir aber keine Zustände verlieren - wir haben die Zahl der k-Vektoren schließlich nicht geändert - müssen die Zustände, die vorher in einem Energiebereich waren, der jetzt der Bandlücke entspricht, irgendwie in die Zustände im Band "gequetscht" werden. In der Zeichnung ist das angedeutet; es könnten beispielsweise "Spitzen " in der Nähe der Bandkanten auftreten. Aber genaue Aussagen kann man qualitativ darüber nicht machen 2. Das freie Elektronengasmodell hat den Nullpunkt der Energie auf einen willkürlichen Wert gelegt. Im Grunde war das Kriterium, daß für E > 0 die Elektronen frei sein sollen. Niemand hält uns nun davon ab, den "Boden" eines Bandes als Nullpunkt der Energie zu nehmen, d.h. jedes Band als eigenes System in der freien Elektronengasnäherung zu betrachten. Da jedes Minimum (und Maximum) des Bandes E(k) in erster Näherung durch eine nach oben (bzw. nach unten) geöffnete Parabel beschrieben werden kann, erhalten wir zumindest in der Nähe der Bandkanten weiterhin eine Dispersionsrelation wie beim freien Elektronengas, d.h. wir können z.B. auch die Zustandsdichten in der Nähe der Bandkanten weiterhin sehr gut durch MaWi 2 Skript - Page 147 eine Wurzelfunktion D(E) = const. E beschreiben. Nur wird sich im Allgemeinen die Konstante von der des freien Elektronengases unterscheiden. Dann hat jedes Band als Zustandsdichte modifizierte Wurzelfunktionen an den Bandkanten und möglicherweise recht komplizierte Strukturen dazwischen - so wie eingezeichnet. Aber es lohnt sich gar nicht, auf die Komplikationen in einem der vielen Teilbänder einzugehen. Denn wenn wir jetzt die gesamte Zustandsdichte in einem Band betrachten, das durch Überlagerung vieler Teilbänder zustande kam, erhalten wir die Überlagerung vieler mittelkomplizierter Zustandsdichten - das Gesamtergebnis kann beliebig kompliziert sein; das folgende Bild zeigt die (gemessene) Zustandsdichte von Germanium zusammen mit dem relevanten Teil der Bandstruktur Damit ist die (theoretische) Lage (fast) hoffnungslos- aber für uns ist das Leben einfacher geworden: Zustandsdichten muß/kann man messen und hinnehmen! Wir merken uns nur zwei Dinge Hinter jedem Banddiagramm verbirgt sich immer noch eine i.d.R. komplizierte Zustandsdichte Die Grundformeln aus dem 2. Kapitel sind aber nach wie vor gültig. Wir müssen nur (numerisch) die richtige Zustandsdichte einsetzen. Für analytische Näherungen nutzt man weiterhin die Ergebnisse des Freien Elektronengases mit angepaßten Konstanten vor der Wurzelfunktion. In der Nähe einer Bandkante sind alle Zustandsdichten noch "Wurzelfunktionen"; das sieht man in dem Beispiel oben ganz gut. Fragebogen / Questionaire Multiple Choice Fragen zu 4.2.1 MaWi 2 Skript - Page 148 4.2.2 Materialklassen und Banddiagramme Elektrische Leitfähigkeit in einem Band Wir haben gesehen, daß es immer eine definierte Zahl von Zuständen in einem Teilband oder Gesamtband gibt. Diese Zustände wollen wir jetzt mit Elektronen besetzen. Damit die Sache einfach bleibt, wählen wir zunächst T = 0 K . Damit steht keine thermische Energie zur Verfügung, die Fermiverteilung ist kastenförmig, und die Elektronen besetzen die vorhandenen Zustände energetisch "von unten kommend" bis alle untergebracht sind. Dies läßt für das letzte Band, in dem noch Elektronen untergebracht werden müssen, nur zwei Möglichkeiten zu: Alle Zustände im Band sind besetzt, wir haben ein vollbesetztes oder "volles" Band. Nicht alle Zustände im Band sind besetzt; wir haben ein teilbesetztes Band. Trivial, aber wirkungsvoll. Betrachten wir die folgenden Behauptungen 1. Elektronen in vollbesetzten Bändern können nicht zur elektrischen Leitfähigkeit beitragen. 2. In teilbesetzten Bändern können alle Elektronen mit leeren Plätzen in der Nachbarschaft (im k-Raum!) zur elektrischen Leitfähigkeit beitragen. 3. Falls eine ungerade Zahl von Elektronen auf ein Band zu verteilen sind, ist es immer nur teilbesetzt. Hier versteckt sich offenbar eine Klassifizierung aller Materialien in Leiter und Nichtleiter wobei nur einige wenige grundlegende Eigenschaften der Bandstruktur gefragt sind. Machen wir uns zunächst die Punkte 1. - 3. klar: Zu 1. Das kennen wir eigentlich schon. Bei der Betrachtung der spezifischen Wärmekapazität des freien Elektronengases haben wir schon gelernt: "Wenn ein Elektron Energie aufnehmen will, muß es dazu auf einen anderen Platz bei einer höheren Energie "springen". Falls es aber bei dieser höheren Energie keine freien Plätze gibt, kann der Sprung nicht erfolgen - so einfach ist das!" Das gilt natürlich auch, falls die Energieaufnahme durch Beschleunigung in einem elektrischen Feld erfolgen soll, d.h. wenn das Elektron elektrischen Strom leiten soll. In einem voll besetzten Band gibt es per definitionem keine leeren Plätze; die Elektronen in diesem Band können also auf nichts (???) reagieren. Die Fragezeichen schränken "das Nichts" etwas ein; wir werden sie später klären. Diese Aussagen sind eine direkte Folge der Tatsache, daß Elektronen Fermionen sind, also dem Pauli Prinzip unterliegen. Für Bosonen, also z.B. Photonen, gilt diese Einschränkung (natürlich) nicht. Man stelle sich einmal vor, was passieren würde, wenn man in einen gegebenen Raum nurein Photon mit einer bestimmten Frequenz hineinpacken dürfte! Zu 2. Das versteht sich jetzt von selbst. Wir können das sogar ein bißchen genauer fassen, denn wir wissen schon, daß die Zahl der reaktionsfähigen Elektronen mit der Aufweichungszone der Fermiverteilung zusammenhängen. Zu 3. Jeder Zustand eines Atoms kann zwei Elektronen aufnehmen - eines mit Spin "up", und eines mit Spin "down". Das gilt auch für die Zustände in einem Band, die man sich ja aus den Atomzuständen durch Aufspaltung entwickeln kann. Damit passen immer 2 mal Zahl der Zustände Elektronen in ein Band - eine immer gerade Anzahl. Auch wenn man vom freien Elektronengasmodell her kommt: Auf jedem Zustand, gekennzeichnet durch den Wellenvektor k, haben zwei Elektronen Platz - Spin rauf und Spin runter. Damit müßten alle Elemente mit einer ungeradzahligen Anzahl von Elektronen, d.h. mit einer ungeradzahligen Ordnungszahl, im kristallinem Zustand Leiter sein. Na ja - ein Blick auf das Periodensystem hilft weiter. Stimmt schon - außer vielleicht für die kristallinen Halogene; aber da werden bei der Kristallisation auch keine "richtigen" Bindungen eingegangen. Aber: Die meisten Elemente mit einer geradzahligen Anzahl von Elektronen sind auch Leiter - also ein besonders tolles Kriterium ist das nicht. Immerhin, wir haben erste Zusammenhänge zwischen Bandstruktur und elektronischen Eigenschaften. Klarer wird das ganze erst, wenn wir die Energielücken ins Spiel bringen. Das schauen wir uns schnell an: MaWi 2 Skript - Page 149 Links ist eine beliebige Bandstruktur mit mehreren Bändern gezeigt; nochmals unterteilt in die zwei Varianten: Letztes besetztes Band ist teilbesetzt bzw. vollbesetzt. Orange symbolisiert hier besetzte Plätze, im Grünen ist noch was frei. Wir treffen jetzt zwei einfache Vereinbarungen: 1. Das letzte besetzte Band heißt Valenzband. Dabei ist es unerheblich, ob es voll- oder teilbesetzt ist. Das Band direkt darüber heißt Leitungsband. Es ist (zunächst noch) immer leer. Das ist eine etwas vereinfachte Definition; aber für unsere Zwecke ausreichend. 2. Bänder unterhalb des Valenzbandes zeichnen wir nicht mehr. Die dort sitzenden Elektronen können sowieso nichts tun, sie sind uninteressant und wir lassen sie zukünftig einfach weg. Damit erhalten wir die rechts gezeigte Bandstruktur, mit der wir zukünftig arbeiten wollen. Isolatoren, Halbleiter und Metalle Wir brauchen nur noch eine Zutat, um die in der Überschrift genannten Materialklassen im Bändermodell sortieren zu können: Wir müssen Band-Band-Übergänge betrachten. In anderen Worten: Erhält ein Elektron soviel Energie von irgendwoher, daß es die Energielücke überwinden kann, dann kann es unter Umständen vom Valenzband ins Leitungsband springen. Und dort kann es jetzt munter Strom leiten - was es im Valenzband, falls es voll besetzt war, nicht konnte. Solche Band-Band-Übergänge, initiiert z.B. durch thermische Energie, ändern somit die elektronischen Eigenschaften des Materials. Sie sind der Dreh- und Angelpunkt der gesamten Halbleitertechnik, und wir werden uns noch heftig damit beschäftigen. Hier reicht es völlig, einen simplen Zusammenhang qualitativ zu verstehen (Quantitativ machen wir das in Kürze): Ist die Energielücke sehr groß, wird es bei normalen Temperaturen kaum möglich sein, sie durch thermische Anregung zu überwinden, ist sie sehr klein, ist es einfach. Damit haben wir zwanglos folgende Klassifikation von Isolatoren, Halbleitern und Leitern anhand von Banddiagrammen: Isolatoren sind alle Materialien, die ein vollbesetztes Valenzband und eine große Bandlücke haben. Die angegebenen Zahlen sind natürlich nur Richtwerte, keine scharfen Definitionen. Selbst bei hohen Temperaturen werden es die Elektronen nicht schaffen ins Leitungsband zu wechseln; Stromfluß kann nicht stattfinden. Der spezifische Widerstand liegt bei (1010 - 10 20) Ωcm (wie mißt man sowas?). Quarzglas ( SiO2) soll bei 10 19 Ωcm liegen, Phenolharze ("Pertinax") schaffen nur (109 - 10 11) Ωcm. Ein volles Valenzband und ein mittelgroßes "Bandgap" ergibt Halbleiter. Die thermische Energie bei Raumtemperatur reicht aus, um einigen wenigen Elektronen den Sprung ins Leitungsband zu ermöglichen - etwas Stromleitung kann stattfinden. Wir erwarten, daß die Zahl der Elektronen im Leitungsband und damit die Leitfähigkeit mit wachsender Temperatur stark zunimmt. Perfekte Halbleiterkristalle haben bei Raumtemperatur Widerstände von (104 - 10 8) Ωcm; Si liegt z.B bei etwa 3 · 105 Ωcm; GaAs bei 108 Ωcm. Das sind aber keine besonders tiefschürfende Zahlen, da sie stark temperaturabhängig und extrem stark "dreck"abhängig sind. Bei T = 0 K ist die Leitfähigkeit = 0. Ein entweder sehr kleines Bandgap, oder ein nicht voll besetztes Valenzband, oder ein Überlapp zwischen vollbesetztem Valenzband und Leitungsband (was man auch als nur teilbesetztes Valenzband auffassen kann) ergibt Leiter, d.h. in der Regel Metalle (bzw. im erstem Fall Halbmetalle). Wir haben (im ersten Fall bei nicht zu kleinen Temperaturen) immer genügend Elektronen, die bewegungsfähig sind. Der spezifische Widerstand liegt bei Raumtemperatur im Bereich 10–6 Ωcm; z.B MaWi 2 Skript - Page 150 ρAg = 1,63 · 10– 6 Ωcm ρCu = 1,7 · 10– 6 Ωcm ρZn = 5.9 · 10– 6 Ωcm ρHg = 95,8 · 10– 6 Ωcm (bester Leiter) aber ρMessing = 5,2 · 10– 6 Ωcm . Einfach und sehr flächendeckend. Aber: Wir betrachten nach wie vor perfekte Kristalle. Wie die Bandstruktur eines realen Polykristalls aussieht, der voll ist mit Defekten aller Art, steht noch auf einem anderen Blatt. Die typischen Halbleiter Si und Ge wurden früher (ca. 1. Hälfte 20. Jahrhundert) auch eher den Metallen zugerechnet, da ihre Leitfähigkeit so schlecht nicht war. Das war aber eine Folge der zwar faszinierenden, aber nicht so recht faßbaren und deshalb in der deutschen Physik etwas verpönten " Dreckeffekte". Diese Dreckeffekte enthalten aber die Grundlagen der Halbleitertechnik, wir werden sie noch ausführlich kennenlernen. Wie kann man die Leitfähigkeit eines gegebenen Materials manipulieren? Wie kann man für technische Anwendungen das herstellen, was man braucht? Offenbar nur durch gezielte Nutzung der "Dreckeffekte". Die Bandstruktur eines perfekten Kristalls ist was sie ist die Leitfähigkeit liegt fest und ist allenfalls noch durch die Temperatur beeinflußbar. Aber die Temperatur wird bei Isolatoren und Metallen nicht viel vermögen. Die Konzentrationen der beweglichen Elektronen sind dicht an Null oder hoch; viel läßt sich daran nicht ändern. Auch Kristallgitterdefekte werden bei Isolatoren und Metallen nicht furchtbar viel tun können. Selbst einige leitende Ausscheidungen in Isolatoren werden die Leitfähigkeit nicht erhöhen, solange keine leitende Pfade zwischen den Ausscheidungen bestehen; und Defekte in Metallen werden zwar die Beweglichkeit etwas herabsetzen, aber das sind verhältnismäßig "kleine" Effekte - maximal 2 Größenordnungen. Das ist klein, wenn man bedenkt, daß die Leitfähigkeit einen Bereich von gut 25 Größenordnungen umfaßt! Letztlich erhalten wir für Metalle genau das Verhalten, das wir schon früher besprochen haben. Damit können wir sie hier als abgehakt betrachten. Auch Isolatoren können wir mit Blickrichtung auf die Leitfähigkeit abhaken (sie werden später wieder mit Blickrichtug auf die Dielektrizitätskonstante erscheinen). Was bleibt sind die Halbleiter. Sie werden uns für den Rest dieser Vorlesung beschäftigen Fragebogen / Questionaire Multiple Choice Fragen zu 4.2.2 MaWi 2 Skript - Page 151 4.2.3 Zusammenfassung Kapitel 4.2 Wichtig ist, das folgende Bild in allen Details zu verstehen: Links eine reale Dispersionskurve. Der wesentliche Unterschied zu den aus freiem Elektronengas + Beugung konstruierten Kurven ist: 1. Die Größe der Energielücke (weiterhin auf Rändern der Brillouinzone) ist wohldefiniert und für einen gegebenen Kristall gegeben (und tabelliert). 2. Der Verlauf der Dispersionskurve zwischen 2 Brillouinzonen kann deutlich von der freien Elektronengasparabel abweichen, insbesondere müssen die Maxima und Minima nicht immer auf den Rändern der BZ liegen. In jeder reziproken Gitterrichtung sieht die Dispersionskurve anders aus. Aus allen Dispersionkurven läßt sich das stark abstrahierende Banddiagramm bilden. Je nach Ausprägung der Dispersionkurven findet man eineEnergieoder Bandlücke mit einer mehr oder weniger großen Bandlückenenergie EG ("G" steht für engl. "Gap" = Lücke). Die Zahl der Zustände in einem Ast der Dispersionskurve (der Bereich zwischen zwei BZ) ist genau die Zahl der Elementarzellen des Gitters. Die Zahl der auf die Zustände zu verteilenden (mehr oder weniger freien, d.h. durch Bandstrukturen zu beschreibenden) Elektronen ist damit Zahl der EZ mal Zahl der durch die Atome der Basis eingebrachten freien Elektronen. Damit steht im Prinzip fest, wieviele Bänder man braucht um alle (freien) Elektronen unterzubringen. Das letzte mit Elektronen (voll- oder teilbesetzte) Band heißt Valenzband, das darüberliegende (leere) Band Leitungsband. Die Zustandsdichte muß ebenfalls modifiziert werden. In der Bandlücke des (perfekten!) Kristalls ist die Zustandsdichte per definitionem = 0. Entlang eines Astes einer Dispersionskurve sind die nötigen Modifikationen zwar nicht dramatisch; in einem aus der Überlagerung vieler Äste gewonnenem Band kann die Zustandsdichte dann aber aber ziemlich bizarr werden. Reale Zustandsdichten sind deshalb für analytische Formeln nicht mehr geeignet; entweder muß man jetzt nähern oder numerisch rechnen. Die Banddiagramme realer Kristalle erlauben einfache Definitionen von Materialklassen: Da in "vollen" Bändern (d.h. alle vorhandenen Zustände sind mit Elektronen besetzt) die dort "sitzenden" Elektronen ihren Zustand grundsätzlich nicht ändern können, tragen volle Bänder nicht zur Leitfähigkeit bei. Damit ergibt sich folgende Klassifikation: Metalle (und Halbmetalle) sind Materialien mit Bandstrukturen die entweder keine oder nur eine kleine (EG ≤ 0,5 eV) Bandlücke haben. Halbleiter sind Kristalle mit voll besetztem Valenzband und einer Bandlücke im Bereich von 0,5 eV EG ≤ 2,5 eV. Isolatoren sind Kristalle mit voll besetztem Valenzband und EG ≥ 2,5 eV. MaWi 2 Skript - Page 152 4.2.4 Merkpunkte Kapitel 4.2 Reale Dispersionskurven können auch zwischen BZ von der idealen "freien Elektronengasparabel" abweichen Insbesondere müssen die Maxima und Minima nicht immer auf der BZ liegen. Die Größe der Energieaufspaltung ist ein Materialparameter Ein Banddiagramm ist die stark vereinfachte Pauschaldarstellung der erlaubten Energien. Nur Valenzband (letztes mit Elektronen teiloder vollbesetztes Band) und das darüberliegende Leitungsband sind wichtig Ein Band hat genau so viele Zustände wie die Zahl der EZ im Kristall Die Bandstruktur ist ein "Materialparameter"; wichtig ist die Größe der Energielücke EG . Allein die Größe der Energielücke entscheidet darüber, ob ein (perfekter) Kristall ein Leiter (= Metall; Halbmetall), Halbleiter oder Isolator ist. MaWi 2 Skript - Page 153 4.3 Band - Band Übergänge 4.3.1 Grundsätzliche Überlegungen und reduziertes Bandschema Energieerhaltung beim Band - Band Übergang Wir betrachten jetzt nur noch Halbleiter. Sie unterscheiden sich von Isolatoren zunächst nur durch die Möglichkeit, daß die bei Raumtemperatur verfügbare thermische Energie kTRT ≈ 1/40 eV ausreicht, um einigen Elektronen den Sprung vom (vollen) Valenzband ins Leitungsband zu ermöglichen. Der Übergang von Elektronen vom Valenzband ins Leitungsband sowie der umgekehrte Prozeß, der Übergang von Elektronen im Leitungsband zu freien Plätzen im Valenzband, sogenannte Band-Band-Übergänge, sind also unmittelbar verantwortlich für die elektrische Leitfähigkeit der Halbleiter. Wir müssen sie etwas näher betrachten. Jeder solcher Übergang bedeutet einen Wechsel von einem Zustand mit einem Wellenvektork zu einem neuen Zustand mit einem Wellenvektor k'. Dabei ändert sich die Energie und der Impuls des Elektrons. Da aber der Energie- und Impulserhaltungssatz auch in der Quantentheorie gilt, müssen wir uns mit den damit verbunden Konsequenzen beschäftigen. Wir betrachten zunächst den Energieerhaltungssatz. Um von der etwas undeutlichen "thermischen Energie" wegzukommen, nehmen wir Photonen, also Licht, mit der eindeutig definierten Energie EPhoton = h · ν, um Elektronen aus dem Valenz- ins Leitungsband zu lupfen. Wir betrachten nun das Schicksal eines von einem Photon getroffenen Elektrons im Detail, sowohl im E(k)Diagramm als auch im Banddiagramm. Das Photon trifft ein Elektron irgend"wo" im Valenzband. Das "wo" bezieht sich dabei sowohl auf den Ort im Ortsraum als auch im k-Raum. In der Zeichnung hat das "getroffene" Elektron den Zustand k; damit ist alles über den Zustand "vorher" gesagt. Es gibt nun zwei Möglichkeiten: 1. Die Energie des Photons hν reicht aus, um das Elektron mindestens bis zur Leitungsbandunterkante zu heben. Dann wird das mit einer gewissen Wahrscheinlichkeit auch passieren. Im Bild reicht die Energie sogar um ein Elektron deutlich über die Leitungsbandkante zu heben (roter Pfeil nach oben). Im E(k)-Diagramm gibt es aber hν über dem Zustand k gar keinen Zustand; wir müssen das Elektron also in den energetisch passenden Zustand in der 2. BZ "transferieren" (roter Pfeil nach rechts). Dadurch hat das Elektron jetzt aber einen anderen (größeren) Wellenvektor. Wir folgen den beiden roten Pfeilen; das Elektron sitzt nun im Zustand k'1 im sonst leeren Leitungsband. Es gibt jetzt jede Menge freie Plätze bei kleineren Energien für unser Elektron - es wird also nicht lange auf seinem ersten Platz bleiben, sondern sich von Platz zu Platz "nach unten" sinken lassen, bis es das Energieminimum des Leitungsbandes bei k'2 erreicht hat; angedeutet durch die kleinen roten Pfeile nach unten. Die Überschußenergie geht dabei portionsweise ins Gitter - der Kristall wird ein bißchen wärmer. In der Zeichnung ist das formal-abstrakt so dargestellt, daß das Elektron beim Hinunterhüpfen ins Leitungsband Phononen emittiert. Dieser Prozeß heißt Thermalisierung oder dielektrische Relaxation. Er erfolgt sehr schnell - in (10– 11 - 10– 13) s ist alles vorbei. 2. Die Energie des Photons ist zu klein; sie reicht nicht aus, um einen Übergang Valenzband - Leitungsband zu induzieren. Dies bedeutet, daß es für hν < EG keine Absorption des Photons geben kann. Für Photonen mit kleinerer Energie ist der (perfekte) Kristall komplett durchsichtig. Wir haben also auch fundamentale optische Eigenschaften im Banddiagramm enthalten! Die Darstellung im Banddiagramm rechts ist natürlich viel einfacher, weil wir uns nicht um die k-Werte kümmern. Wir können dafür eine andere wichtige Sache besser wiedergeben als im E(k)-Diagramm: MaWi 2 Skript - Page 154 Das ins Leitungsband transferierte Elektron hinterläßt einen unbesetzten Platz im Valenzband, ein "Loch"; als kleines blaues Quadrat eingezeichnet. Das gibt dem energetisch direkt über dem Loch sitzenden Elektron die Möglichkeit, energetisch etwas tiefer zu sinken, indem es den freien Platz besetzt. Die freiwerdende Energie geht wieder als Wärme ins Gitter. Das Loch ist jetzt energetisch eins höher gerutscht. Das direkt darübersitzende Elektron.... - der Prozeß wiederholt sich, bis das Loch an der Valenzband oberkante sitzt. Im Banddiagramm haben wir jetzt ein Elektron an der Leitungsbandkante (wir meinen dann immer die untere Kante) und ein Loch an der Valenzbandkante (wir meinen dann immer die obere Kante). Die Position von Loch und Elektron ist dann irgend"wo" - denn die Ordinate des Banddiagramms trägt keine Bezeichnung; wir lassen alles unspezifiziert. Das ist auch richtig, denn obwohl Elektron und Loch gleich nach der Generation einen definierten Ort besitzen, sind sie ja beweglich und laufen - per "random walk" - irgendwo hin. Damit haben wir energetisch alles im Griff. Der Energiesatz ist in jedem Moment erfüllt, die Energie des gesamten System aus Photon, Elektron und Kristall (mit Phononen) ist konstant. Wie steht es mit dem Impulserhaltungssatz? Impulserhaltung beim Band - Band Übergang Wir müssen nun den Impuls des Systems vorher und nachher betrachten. Das ist erheblich schwieriger als die Betrachtung der Energie, da der quantenmechanische Impuls von Photon, Kristall und Elektron nicht so unmittelbar klar ist wie die Energie. Wir müssen hier etwas an der Oberfläche bleiben, und werden einige "Dinge" einfach postulieren. Trotzdem läßt sich eine wichtige Beziehung leicht verständlich machen. In der Quantenmechanik ist der Impuls immer gegeben durch Impuls = p = ·k - und das gilt für Elektronen, Photonen und Phononen. Da die Wellenlängen von (Licht)Photonen immer sehr viel gößer sind als die der Elektronen und Phononen (Photonen liegen im 1 µm Bereich, Elektronen und (die hier wichtigen) Phonen eher im nm Bereich); der Wellenvektor dann entsprechend viel kleiner, können wir den Impuls der Photonen in 1. Näherung schlicht vernachlässigen. Im Link ist das ein bißchen genauer aufgeführt. Es ist hilfreich, sich in diesem Zusammenhang schlicht folgende Regel zu merken: Photonen haben Energie, aber kaum Impuls. Phononen haben Impuls, aber kaum Energie. Elektronen haben Impuls und Energie. Damit können wir den Impuls der Photonen erst mal "vergessen"; und Phononen sind bei der primären Generation auch noch nicht beteiligt. Es geht damit nur noch um den Impuls des Elektrons vorher (im Valenzband; Wellenvektor k) und nachher (im Leitungsband; Wellenvektor k'); dafür schreiben wir ∆p, die Differenz des Impulses vorher – nachher. Wir haben ∆p = · (k – k') Diese Differenz ist auf jeden Fall ungleich Null, d.h. der Impulserhaltungssatz ist für das Elektron ohne dritten Partner nicht zu erfüllen. Der dritte Partner in einem perfekten Kristall kann aber nur der Kristall selbst sein. Er hat die Masse ∞ verglichen mit einem Elektron, und könnte eigentlich damit jeden beliebigen Impuls aufnehmen - so wie die Hauswand beim Ballspiel. Kann er aber nicht. In der Quantenmechanik sind die Dinge gequantelt, und die Differenz (k – k') kann nur diskrete Werte annehmen. Welche das sind können wir hier nicht herleiten. Wir können aber das Ergebnis, auch als Kristallimpulserhaltungssatz bekannt, zur Kenntnis nehmen; es lautet k – k' = G G = reziproker Gittervektor Das sollte uns nun sehr bekannt vorkommen. Es ist die gute alte Bragg-Bedingung mit einer Verallgemeinerung: MaWi 2 Skript - Page 155 |k| = |k'| muß nicht mehr erfüllt sein!, wir lassen jetzt auch inelastische Streuung zu. Das ist nun wirklich einfach, hat aber einschneidende Konsequenzen. Wenn wir die Darstellung des Band-Band-Übergangs im E(k)-Diagramm oben wieder betrachten, bedeutet Impulserhaltung nun, daß der nach rechts weisende rote Pfeil die Länge eines reziproken Gittervektors haben muß. Das hat er aber sicher nicht, denn in der Zeichnung wäre der kürzestmögliche reziproke Gittervektor so lang wie beide Brillouinzonen zusammen (man betrachte ein früheres Bild, falls das nicht unmittelbar einsichtig ist). Die Konsequenz is einfach: der oben gezeichnete Band-Band-Übergang kann gar nicht stattfinden, er verletzt den Kristallimpulserhaltungssatz! Um Energie- und Kristallimpulserhaltung gleichzeitig zu erfüllen. müssen wir nun im E(k)- Diagramm solange mit zwei vorgegeben Strecken (den beiden roten Pfeilen) an der Dispersionskurve rauf- und runterfahren, bis wir einen k-Wert finden, bei dem alles paßt. Das tun wir aber nicht, sondern wir lassen uns etwas einfallen, was die Arbeit sehr stark erleichtert: Wir benutzen ab sofort ein reduziertes Bandschema oder Banddiagramm. Reduziertes Banddiagramm Die E(k)-Diagramme wie schon mehrfach gezeigt, lassen sich sehr viel platzsparender zeichnen, wenn man eine kleine Vereinbarung bezüglich eines zeichentechnischen "Tricks" trifft: Wir malen alle Zweige der E(k) Kurven in den diversen Brillouin Zonen in die 1. Brillouin Zone. Man weiß ja, zu welcher BZ irgendein Ast gehört - man muß nur von unten kommen abzählen. Praktisch geht das ganz einfach: Wir verschieben jeden Ast solange um reziproke Gittervektoren nach innen, bis er in die 1. BZ fällt. Das sieht so aus: Diese "Spar"version der Dispersionkurven heißt reduzierte Darstellung oder reduziertes Banddiagramm. Nebenbei erwähnt: Die reduzierte Darstellung des Banddiagramms ist nicht nur ein Zeichentrick, sondern geht etwas tiefer. Man kann zeigen, dass die Addition eines reziproken Gittervektors zum Wellenvektor einer beliebigen Kristallwellenfunktion (fast) nichts ändert. Das ist hier aber nicht so wichtig, wer will kann sich das Ganze im Link noch etwas genauer anschauen. MaWi 2 Skript - Page 156 Damit sparen wir nicht nur eine Menge Platz, sondern die von Impuls- und Energieerhaltungssatz aus erlaubten Übergänge liegen jetzt einfach senkrecht übereinander. Das ist leicht einzusehen: Jeder Übergang der energetisch paßt, erfüllt automatisch den Kristallimpulserhaltungssatz, denn die diversen Äste der E(k) Kurve unterscheiden sich ja genau durch einen reziproken Gittervektor. Die Absorption eines Photons sieht jetzt also so aus wie links dargestellt. Die Länge des Pfeils mit der Energie hν muß nur noch an die passende Stelle zwischen den zwei Ästen gezeichnet werden. Wir wollen diese Vereinbarung, für Band-Band-Übergänge das reduzierte Bandschema zu verwenden, zukünftig automatisch einhalten. Sie ist im übrigen auch durch die harte Theorie zu rechtfertigen, die unter der Bezeichnung "Bloch Theorem" bekannt ist. Band-Band-Übergänge zeichnen wir zukünftig auch im einfachen Banddiagramm nur noch senkrecht nach oben - und nach unten. Die typischen Kurve eines reduzierten Banddiagramms wie nebenstehend gezeigt, taucht in der Natur häufiger auf. Wir beobachten sie bei genauem Hinsehen auch bei Objekten, die der Halbleiterphysik eher fern stehen. Ein aufmerksamer Betrachter kann auch noch Hinweise auf Komplikationen finden, die wir erst in den folgende Kapiteln behandeln werden. Denn alles was wir bisher gelernt haben gilt selbstverständlich nicht nur für die Generation von Elektronen, d.h. für die Schaffung eines Elektron-Loch Paares durch den Übergang eines Elektrons vom Valenz- ins Leitungsband, sondern auch für die Rekombination, die Wiedervereinigung von Elektron und Loch. Versuchen wir, das im obigen Bild einzutragen, bekommen wir ein Problem. Nach der Thermalisierung von Elektron und Loch, sitzen sie im gezeichneten Beispiel nicht mehr senkrecht übereinander! Ein Übergang nach unten und damit Rekombination ist ohne Verletzung des Kristallimpulserhaltungssatzes nicht möglich! Das ist eine ziemlich aufregende Erkenntnis - mit weitreichenden Konsequenzen. Wir werden ihr ein eigenes Unterkapitel widmen. Fragebogen / Questionaire Multiple Choice Fragen zu 4.3.1 MaWi 2 Skript - Page 157 4.3.2 Direkte und indirekte Halbleiter Zwei Möglichkeiten des Banddiagramms Zeichen wir ein E(k)-Diagramm in einem reduzierten Bandschema, gibt es genau zwei Möglichkeiten für dieBandkanten: 1. Das Maximum des Valenzbandes (definiert die Lage der Valenzbandkante) sitzt im k-Raum genau unter dem Minimum des Leitungsbandes (Die Maxima und Minima definieren dann die Lage der Leitungsbandkante). 2. Das Maximum des Valenzbandes und das Minimum des Leitungsbandes liegen bei verschiedenen k -Werten. Wir schauen uns mal an, wie das (schematisch) in realen Materialien aussieht: In der oberen Reihe sind Minima und Maxima übereinander; wir nennen Materialien mit dieser Eigenschaft direkte Halbleiter. Das freie Elektronengas als Referenz gehört formal auch dazu. Die untere Reihe zeigt die indirekten Halbleiter (wir zählen den Diamant mal dazu, obwohl er eigentlich ein Isolator ist). Man beachte, daß auch Germanium ein indirekter Halbleiter ist, denn Maximum und Minimum liegen eben nicht beim selbem k-Wert und lassen sich auch nicht durch Addition oder Subtraktion von reziproken Gittervektoren untereinander bringen. Möglichkeiten der Rekombination Wie kommt ein Elektron im Leitungsband wieder zurück ins Valenzband? Muß es überhaupt wieder zurück? Wir machen ein Gedankenexperiment und bestrahlen einen Halbleiter dauerhaft mit Licht. Jedes Photon wirft ein Elektron ins Leitungsband, und es gibt keine Rekombination. Dann sind irgendwann alle Elektronen im Valenzband "ausgeräumt" und befinden sich im Leitungsband, wo sie auch bleiben. Das Material hat jetzt eine gute Leitfähigkeit und würde sie auch auch nach Abschalten des Lichts behalten. Falls das Material bei Tageslicht eine Zeit lang herumlag, wäre es für immer ein Leiter. Das klingt sehr, sehr unwahrscheinlich. Während wir beleuchten haben wir zwar eine gewisse Leitfähigkeit σL (wir könnten jetzt also schon einen Photowiderstand bauen), aber sobald das Licht ausgeschaltet wird, geht sie erfahrungsgemäß sehr schnell wieder auf den Dunkelwert σD zurück. Ab Ausschaltzeitpunkt finden wir dann das übliche exponentielle Abklingen mit σ(t) = σD + t σL · exp – τ Wie schnell ist schnell? In anderen Worten wie groß ist die Zeitkonstante τ des Prozesses und was bestimmt sie? Da das Abklingen der Leitfähigkeit das Verschwinden der Elektronen im Leitungsband via Rekombination widerspiegelt, ist τ schlicht und ergreifend die mittlere Lebensdauer der Elektronen im Leitungsband. In anderen Worten: Nachdem ein Elektron ins Leitungsband befördert wurde, (wobei es natürlich nicht darauf ankommt, wie genau das geschah) wird es sich dort (im Mittel) eine gewisse Zeit lang herumtreiben (im Ortsraum, es ist ja beweglich), und dann per Rekombination wieder verschwinden. Und diese Zeit des Verbleibens im Leitungsband heißt passenderweise "Lebensdauer". MaWi 2 Skript - Page 158 Für die Löcher im Valenzband gilt natürlich exakt dasselbe. Ihre Lebensdauer ist identisch zu der der Elektronen. Soweit ist eine Beobachtung beschrieben - und sie gilt für direkte und indirekte Halbleiter. Rekombination wird erfolgen, und wir können auch schon eine erste Zahl damit verbinden. Wie genau erfolgt nun Rekombination und was passiert dabei? Wir haben immer noch Energie und Kristallimpulserhaltungssatz zu beachten. Für direkte Halbleiter ist die Antwort einfach: Elektron und Loch können sich jederzeit nach der Thermalisierung wieder vereinigen; der Kristallimpulserhaltungssatz ist gewahrt. Die freiwerdende Energie ist auch kein Problem: Sie wird zu Licht, d.h. zu einer elektromagnetischen Welle. Es gibt auch keinen Grund, warum das nicht recht zügig passieren soll - die Lebensdauer der Elektronen ist entsprechend klein und liegt im Nanosekundenbereich. Wir können für direkte Halbleiter den Kreis jetzt also schließen: Wenige Nanosekunden nachdem ein Photon mit irgendeiner Energie ≥ EG ein Elektron - Loch Paar generiert hat, ist es auch schon wieder verschwunden - unter Aussendung eines Photons mit der präzisen Energie hν = EG . Die Differenz der Photonenenergien vorher - nachher geht als Wärme ins Gitter. Wir reden auch dann von Rekombination - und es ist wichtig, sich darüber klar zu sein - wenn irgendein Elektron aus dem Leitungsband mit irgendeinem Loch imValenzband rekombiniert. Wie die Elektronen und Löcher ursprünglich entstanden sind ist unerheblich. Spätestens nach der Thermalisierung gibt es keine "Erinnerung" mehr an den Entstehungsprozeß. Was für photogenerierte Elektronen (und Löcher) gilt, gilt für jedes Elektron (und Loch)! Wir merken uns: In direkten Halbleitern kann man durch Rekombination von Elektronen und Löchern Licht erzeugen. Direkte Halbleiter sind die Materialien der Optoelektronik! Wie sieht der gesamte Prozeß in einer Bandiagrammdarstellung aus? Das kommt darauf an, was für eine Variable man an die Abszisse schreibt. Schaun' mer mal: Links eine Auftragung über den Wellenvektor. Dann sieht das Ganze ähnlich aus wie im Bild oben mit den Dispersionskurven. Rechts nehmen wir als Abszisse mal den Ort (oder die Zeit). Und realisieren, dass Elektron und Loch nur im kRaum "ortsfest" sind. Im realen Raum werden sie herumvagabundieren, in einem uns bereits bekannten "random walk". Bis zur Rekombination vergeht im Mittel die Zeit τ; die zurückgelegte Strecke ist eine Diffusionslänge L. Das ist so richtig nicht darstellbar, wir behelfen uns mit den "gezackten" Kurven. Wir werden diese Thematik weiter unten noch einmal aufgreifen. Schon das Vorhandenseins eines Wellenvektors bedeutet ja, daß die "Elektronenwelle" sich i. a. bewegt. Was wir hier aber stillschweigend gemacht haben, ist der Übergang vom Wellenbild (des freien Elektronengases) zum Teilchenbild der Banddiagramme. Das kann man schlicht ignorieren; beide "Bilder" sind gleichberechtigt, welches man nimmt ist Geschmackssache oder eben durch Zweckmäßigkeit diktiert. Mehr dazu in einem extra Modul. MaWi 2 Skript - Page 159 Beide Übergänge müssen wieder senkrecht nach oben oder unten stattfinden, denn beide beteiligte Teilchen müssen zur selben Zeit am selben Ort sein, damit sie was miteinander haben können. Im rechten Bild ist sofort klar, daß der Rekombinationspartner eher nicht der Generationspartner war. Denn es ist ziemlich unwahrscheinlich, dass die beiden sich jemals wieder begegnen. Im Bild ist deshalb auch ein anderes Loch - woher auch immer stammend - gezeigt. Unser Elektron interessiert sich aber auch gar nicht dafür, mit welchem Loch es sich vereinigt, denn alle Elektronen und damit auch alle Löcher sind gleich, sie sind prinzipiell ununterscheidbar. Nur der Zustand, in dem sie sich befinden, kann unterschiedlich sein! Zunächst aber: Was aber passiert in indirekten Halbleitern? Offenbar muß es auch in diesen Materialien Mechanismen der Rekombination geben. Einfach: Wenn zwei Teilchen miteinander agieren sollen, das aber aus (Kristall)impulserhaltungsgründen nicht können, braucht man eben einen dritten Partner. Der Kristall kann es nicht sein; bleiben nur noch Kristallgitterdefekte. Genau so ist es auch: In Si, Ge, und so weiter, erfolgt Rekombination über Defekte, vorzugsweise Fremdatome. Der Defekt kann Impuls und Energie aufnehmen; es wird dann aber kein Licht emittiert. Wir können sofort eine Vorhersage machen: Bei indirekten Halbleitern ist die Lebensdauer von Elektronen im Leitungsband tendenziell hoch und wird unmittelbar und stark von der Defektkonzentration abhängen. Genauso ist es. Im handelsüblichen sehr perfekten und ultrareinem Silizium ist die Lebensdauer τ von Unendlich kaum zu unterscheiden (aus Sicht des Elektrons): Sie liegt bei einigen Millisekunden. In dieser extrem langen Zeit (aus Sicht eines Elektrons), läuft das Elektron in einem "random walk" durchs Gitter. Dabei kommt es sehr weit. Bis zu seinem Ableben nach (im Mittel) τ Sekunden legt es (im Mittel) eine Strecke L zurück, die Diffusionslänge heißt L = D · τ 1/2 e,h zurück; De,h ist der formal immer definierbare Diffusionskoeffizient der Elektronen oder Löcher; ein neuer Materialparameter wenn man so will. Wir können aber schon jetzt erwarten, daß der hiermit eingeführte Diffusionkoeffizient der Elektronen und Löcher irgenwie mit der schon früher definierten Beweglichkeit μ und ihrer mittleren Geschwindigkeit v0 zusammenhängt - all diese Größen beschreiben ja "irgendwie" die Bewegung der Teilchen. Einen Zusammenhang zwischen μ und v0 hatten wir im übrigen schon mal gefunden. Die gemessenen Werte für L liegen für ultrareines Si in der Größenordnung Millimeter - wahrlich eine lange Strecke für ein kleines Elektron! In direkten Halbleitern, in denen die Elektronen und Löcher selbstverständlich auch herumdiffundieren, liegt die Diffusionslänge im nm Bereich. In völlig verdrecktem, d.h. nach chemischer Nomenklatur aber evtl. immer noch höchstreinem Si, sind Lebensdauer und Diffusionlänge reduziert auf µs und µm; und dies wird unmittelbare Auswirkungen auf Halbleiterbauelemente wie z.B Solarzellen haben. Wir merken uns: Indirekte Halbleiter sind nicht als Leuchtquellen geeignet. Die Rekombination wird sehr stark von Kristallgitterdefekten beeinflußt. Kann ich einem Stück Halbleiter "ansehen" ob es eine direkte oder indirekte Bandlücke hat? Nun ja - mit Einschränkungen schon. Ich muß nur schauen, wie die Lichtabsorption als Funktion der Frequenz läuft. Setzt sie bei einer bestimmtem Frequenz schlagartig und kräftig ein, habe ich einen direkten Halbleiter. Denn sobald hν = EG wird Absorption möglich. In einem indirekten Halbleiter kann bei hν = EG nicht kräftig absorbiert werden, denn es gibt bei dieser Energie ja keinen direkten Übergang. Erst bei höheren Photonenenergien, die hνdirekt, dem direkten Übergang mit der kleinsten Energie entsprechen, wird Absorption kräftig einsetzen. Im Frequenzbereich zwischen hν = EG und hνdirekt wird zwar auch absorbiert (über komplexere Mechanismen), aber eher verhalten. Messungen des Absorptionskoeffizientens α sehen so aus; α definiert sich über das übliche "Abklinggesetz": Intensität(x) = Intensität(x = 0) · exp –α · x MaWi 2 Skript - Page 160 Si und Ge sind die einzigen indirekten Halbleiter in diesem Diagramm, man sieht den weichen Einsatz der Absorption sehr deutlich. Fragebogen / Questionaire Multiple Choice Fragen zu 4.3.2 MaWi 2 Skript - Page 161 4.3.3 Zusammenfassung 4.3 Band-Band Übergänge werden möglich, falls ein Elektron im Valenzband mindestens die Energie EG "zur Verfügung" hat. Dies folgt aus dem Energieerhaltungssatz. Die notwendige Energiezufuhr kann sowohl von Phononen (= thermische Energie kT) als auch von Photonen (= Licht) stammen. Das dann im Leitungsband "sitzende" Elektron kann sich über die vielen freien Plätze sehr schnell " nach unten" in das Leitungsbandenergieminimum begeben; die Überschußenergie geht als Wärme ans Gitter. Dieser Prozeß heißt "Thermalisierung" oder dielektrische Relaxation; er benötigt typischerweise 10–12 s. Im Valenzband ist jetzt ein freier Platz; ein "Loch". Diese Loch wandert ebenfalls sehr schnell " nach oben" zum Valenzbandenergiemaximum - indem Elektronen "nach unten" in das Loch fallen. Bei Band-Band-Übergängen ist aber wie immer außer der Energieerhaltung auch die Impulserhaltung zu beachten. Die Differenz aus Impuls vorher - Impuls nachher ist proportional zuk – k'; sie muß vom Kristall "übernommen" werden. Der (quantenmechanische) Kristallimpulserhaltungssatz ist einfach die Braggbedingung aber jetzt auch für unelastische Streuung:: k – k' = G |k| ≠ |k'| G = reziproker Gittervektor Damit sind Band-Band-Übergänge in der Dispersionkurvendarstellung "geometrisch" festgelegt; nur Übergänge zwischen exakt definierten Zuständen sind möglich. Das läßt sich graphisch sehr leicht darstellen indem man die Dispersionskurven in ein reduziertes Banddiagramm einträgt. Jeder Zweig der Dispersionkurve wird um den zur BZ gehörenden reziproken Gittervektor Richtung Ursprung verschoben; dann landet jeder Zweig in der 1.BZ Man spart damit nicht nur Platz, sondern hat eine einfache Darstellung der Kristallimpulserhaltung: Nur "senkrechte" Übergänge sind erlaubt. Je nach genauer Struktur der Dispersionkurven gibt es für die reduzierte Bandstrukturdarstellung zwei grundsätzlich verschiedene Grundstrukturen: 1. Valenzbandenergiemaximum und Leitungsbandenergieminimum liegen senkrecht übereinander. Das sind dann die direkten Halbleiter. 2. Valenzbandenergiemaximum und Leitungsbandenergieminimum liegen nicht senkrecht übereinander. Das sind dann die indirekten Halbleiter. Elektronen werden nicht für ewig im Leitungsband bleiben - sie rekombinieren nach einer typischen Zeit die Lebensdauer heißt mit einem Loch im Valenzband. Auch für diese Rekombination gilt der Energie- und (Kristall)impulserhaltungsatz. Für direkte Halbleiter ist Rekombination problemlos möglich. Impulserhaltung ist gegeben, da der Rekombinationsübergang senkrecht nach unten führt, Energieerhaltung wird durch Aussendung eines Photons gewährleistet. Der gesamte Kreisprozeß aus Generation, Thermalisierung und Rekombination ist im Bild unten in allen Details dargestellt. MaWi 2 Skript - Page 162 Nach der Thermalisierung steht das Elektron (und das Loch ) nicht still, sondern "diffundiert" mit einem "random walk" durch den Kristall. Wir sind jetzt im "Teilchenbild", aber auch im "Wellenbild" läuft das Elektron hin und her; der "Zufall " des Random walks kommt durch ständige Streuprozesse an den im realen Kristall vorhandenen Defekten. Das Teilchenbild ist jetzt vorteilhafter als das im freien Elektronengas bemühte Wellenbild. Nochmal: Während ihrer Lebensdauer τ stehen die Teilchen nicht still, sondern laufen in einem "random walk" durch den Kristall. Es gelten die alten Beziehungen zwischen Zeit der Wanderung (= Lebensdauer τ), Diffusionskoeffizient De,h (ein neuer Materialparameter) und Diffusionslänge L (= zurückgelegte Strecke zwischen Geburt und Tod) L = D · τ 1/2 e,h Bei indirekten Halbleitern ist τ und L klein (ns und nm), bei indirekten Halbeitern tendenziell groß (ms und mm). Allerdings sind beide Größe extrem sensitiv auf geringste Spuren von Defekten/Verunreinigungen; "dreckiges" Si (mit Verunreingigungsgehalten im ppb - ppm Bereich) hat sehr viel kleinere Lebensdauern und Diffusionslängen. Ob ein Halbleiter direkt oder indirekt ist, zeigt sich auch in seinem Absorptionsverhalten als Funktion der Wellenlänge. MaWi 2 Skript - Page 163 4.3.4 Merkpunkte 4.3 Bei Band-Band Übergängen gelten Energie- und (Kristall)impulserhaltungssatz e–(V) + E ⇒ e–(L) + h+(V) E ≥ EG Energiezufuhr: Thermisch oder Photonen; Energieabgabe: Thermisch oder Photonen k – k' = G Kristallimpulserhaltungssatz: Auf inelastische Stöße verallgemeinerte Braggbedingung. Verhindert Großteil der energetisch erlaubten Übergänge. |k| ≠ |k'| G = reziproker Gittervektor Reduzierte Banddarstellung: Zeichentechnischer "Trick" erlaubt einfachste Darstellung der möglichen Übergänge. Nur Übergänge senkrecht nach oben (= Generation) oder nach unten (= Rekombination) sind erlaubt. Direkte und indirekte Halbleiter: Rekombination (nach Thermalisierung) einfach beziehungsweise "unmöglich" (= schwer). Direkte Halbleiter (GaAs, GaAlAs, InP, GaN, ...) sind Materialien der Optoelektronik/ Photonik. Direkte Halbleiter (Si, Ge, ..) sind Materialien der Mikroelektronik Lebensdauer τ: Zeit zwischen Generation und Rekombination. Direkte Halbleiter: Lichtemission bei Rekombination IndirekteHalbleiter: Strahlungslose Rekombiation (über Defekte) Direkte Halbleiter: τ; L klein: ns bzw nm. Indirekte Halbleiter: τ; L groß; stark defektabhängig; bis zu s bzw. mm. Diffusionlänge L = (Dτ)½: Im Mittel zurückgelegte Strecke τ und L sind sehr wichtige Materialparameter. MaWi 2 Skript - Page 164 5. Halbleiter 5.1 Intrinsische Halbleiter 5.1.1 Ladungsträgerdichte im thermischen Gleichgewicht 5.1.2 Lage der Fermienergie im intrinsischen Halbleiter 5.1.3 Die Leitfähigkeit der intrinsischen Halbleiter 5.1.4 Zusammenfassung Kapitel 5.1 5.1.5 Merkpunkte Kapitel 5.1 5.2 Dotierung 5.2.1 Defekte und Zustände in der Bandlücke 5.2.2 Die Konzentrationen von Ladungsträgern im Leitungs- und Valenzband in dotierten Halbleitern 5.2.3 Quantitative Berechnung der Fermienergie bei dotierten Halbleitern 5.2.4 Massenwirkungsgesetz und Ladungsträgerdichten 5.2.5 Zusammenfassung Kapitel 5.2 5.2.6 Merkpunkte Kapitel 5.2 5.3 Vom idealen zum realen Halbleiter 5.3.1 Beweglichkeit und Leitfähigkeit bei dotierten Halbleitern 5.3.2 Generation, Rekombination, Lebensdauer und Diffusionslänge 5.3.3 Zusammenfassung Kapitel 5.3 5.3.4 Merkpunkte Kapitel 5.3 5.4 Übersicht 5.4.1 Vergleich idealer, dotiert-idealer und realer Halbleiter 5.4.2 Formeln und Daten im Überblick MaWi 2 Skript - Page 165 5. Halbleiter 5.1 Intrinsische Halbleiter 5.1.1 Ladungsträgerdichte im thermischen Gleichgewicht Bestimmung der Elektronenkonzentration im Leitungsband Wir werden jetzt relativ zügig die in Kapitel 4 gewonnenen Erkenntnisse anwenden und vor allem quantitative Betrachtungen anstellen. Die entscheidende Größe für die Leitfähigkeit war die Dichte an beweglichen Ladungsträgern im Valenz- und Leitungsband. Bei Halbleitern ist sie bei T = 0 K gleich Null. Bei endlichen Temperaturen wird die thermische Energie ausreichen, um einige Elektronen vom Valenzband ins Leitungsband zu befördern,. Diese werden zwar nach nach Ablauf der Lebensdauer wieder rekombinieren, aber die thermische Generation erzeugt ja auch ständig wieder neue Elektron-Loch Paare. Zwischen Generation und Rekombination wird sich ein thermisches Gleichgewicht einstellen, mit (im Mittel) konstanter Konzentration an Elektron-Loch Paaren. Und für das thermische Gleichgewicht in intrinsischen Halbleitern haben wir fertige Formeln! Der Terminus "intrinsisch" steht hier wie zuvor für "ohne Hilfe von außen". Damit ist schlicht und einfach gemeint, daß wir über ideale, perfekte Kristalle sprechen, deren Eigenschaften "von innen" kommen, d.h. immer da sind. Wir ventilieren jetzt nämlich ganz offenbar die Frage, wieviele der Plätze (= Zustände) im Leitungsband bei der Temperatur T besetzt sind. Die Antwort darauf gibt immer dieselbe Fundamentalformel: Die Zahl (oder Volumendichte) n(E,T) der besetzten Plätze bei der Temperatur T und Energie E pro Energieintervall ∆E ist gegeben durch: Zustandsdichte D(E) mal Fermiverteilung f(E,T). ne(E, T) = D(E) · f(E, T) ·∆E Das "oder Dichte" bezieht sich immer darauf, ob wir die Zustandsdichte als Zustände pro Energieintervall (entpricht Zahl), oder pro Energieintervall und Volumenelement (entspricht Dichte) angeben. Die Gesamtzahl (oder Dichte) nL(T) aller Elektronen im Leitungsband ist dann ∞ neL(T) = ⌠ ⌡ D(E) · f(E, T) · dE EL Dabei ist EL die Energie der Leitungsbandkante. Wir haben schon eine kleine Näherung eingebaut, weil wir bis ins Unendliche integrieren statt bis an die obere Leitungsbandkante. Aber weiter oben im Leitungsband drückt die Fermiverteilung sowieso alles auf Null, die obere Integrationsgrenze ist damit unerheblich. Wir haben jetzt zwei Probleme Wir kennen die wirkliche Zustandsdichte des jeweiligen Materials nicht, und falls wir sie kennen würden, wäre das Integral nur noch numerisch zu knacken (man betrachte z.B die Zustandsdichte von Ge). Wir kennen die Fermienergie EF (noch) nicht. Aber das sind Scheinprobleme, die wir einfach lösen können: Wir nehmen 1. als Näherung für die Zustandsdichte die Zustandsdichte des freien Elektronengases (normiert auf E – EL) , und lassen 2. die Fermienergie als freien Parameter einfach erst mal stehen. Damit erhalten wir ∞ neL(T) = ⌠ ⌡ EL (2m e)3/2 · (E – EL)1/2 2 3π2 . exp E – EF kT + 1 –1 · dE Das sieht auch noch nicht so prall aus, obwohl man dieses bestimmte Integral vielleicht sogar exakt lösen könnte - wer weiß? Wir werden jetzt wird natürlich nähern: MaWi 2 Skript - Page 166 Statt f(E,T) nehmen wir die Boltzmann-Näherung, d.h. wir setzen f(E,T) ≈ exp–(E – EF)/kT. Das können wir machen falls EL – EF » kT. Dann erhalten wir ∞ (2m e)3/2 ⌠ ⌡ neL(T ) = 2 3π2 E – EF (E – EL)1/2 . exp – · dE kT EL Das sieht nicht nur lösbar aus, das ist auch lösbar - aber auch nur mit viel Mühe! Helfen wird, daß es Nicht-Mathematikern nicht verboten ist, bei der Lösung einer Matheaufgabe physikalisch zu denken. Hier überlegen wir erst mal, was die entscheidende Variable für die Ladungsträgerkonzentration bei einer gegebenen Temperatur sein wird. Dazu stellen wir die Integrationsaufgabe mal graphisch dar. Wir haben links die Zustandsdichte des freien Elektronengases, in der Mitte die Fermiverteilung, und rechts das Produkt aus beiden. Die Fläche unter dieser Kurve gibt den Wert des bestimmten Integrals. Falls wir gedanklich die Zustandsdichte durch die wirkliche Zustandsdichte ersetzen, wird das den Wert des Integrals etwas ändern. Die wirkliche Zustandsdichte ist aber eine Art Materialkonstante, damit nicht variabel, und für den Wert des Integrals als Funktion von z.B. der Temperatur nicht so wichtig. Die entscheidende Größe, die den Wert des Integrals massiv beinflussen kann, ist ganz klar die Größe des im Leitungsband liegenden "Zwickels" der Fermiverteilung. Damit ist - immer bei gegebener Temperatur - der Abstand der Fermienergie von der Leitungsbandkante die entscheidende Variable. Man wird also jetzt und in künftigen Fällen gut daran tun, EL – EF als neue Variable einzuführen. Das ist einfach. Wir setzen E – EF = E – EL – (EF – EL); außerdem erweitern wir den (E – EL)1/2 Term mit (kT)½/ (kT)½ und ziehen ein (kT)½ vor das Integral - damit haben alle Energieterme die gleiche Form. Dann machen wir noch die naheliegende Substitution EF – EL = x dE = kT · dx kT Alles zusammen eingesetzt in das Integral (und das zusätzliche kT aus dem dx vorgezogen) ergibt (2m e · kT)3/2 neL(T) = · exp 2π2 3 EL – EF – kT ∞ · ⌠ ⌡ x½ · e –x · dx 0 Das verbleibende bestimmte Integral ist (immer noch mit Mühe) lösbar, sein Wert ist ½ · π½ - also wie gehabt dicht bei 1. Wir erhalten schlußendlich (wer's nicht glaubt, muß nachrechnen) neL(T) = m e · kT 21/3 · π 2 oder, falls wir was üblich ist, 3/2 EL – EF EL – EF = const. · T 3/2 · exp – · exp – kT durch h/2π ersetzen: MaWi 2 Skript - Page 167 kT neL(T) = 2 · 2π · m e · kT h2 3/2 EL – EF EL – EF = const. · T 3/2 · exp – · exp – kT kT Das ist ein fundamentales Ergebnis! Es sagt aus, daß wir fast - bis auf den Faktor T 3/2 - eine altbekannte Arrheniusbeziehung haben. In der Konstanten steckt im wesentlichen die Zustandsdichte des freien Elektronengases. Man kann diesen Vorfaktor natürlich ausrechnen (Mit T in K eingesetzt) und erhält EL – EF neL(T) = 4.59 · 1015 · T 3/2 · exp – cm–3 kT Konzentration der Löcher im Valenzband Nachdem wir jetzt die Konzentration der Elektronen im Leitungsband kennen, fragen wir uns, wie groß ist nV, die Konzentration der Löcher im Valenzband? Die Antwort ist natürlich sehr einfach: Genauso groß wie die Konzentration der Elektronen im Leitungsband, denn für jedes Elektron im Leitungsband ist ja genau ein Loch in Valenzband entstanden. Nun stellen wir uns aber kurz mal unwissend und fragen, wie man nV ausrechnen würde, falls man nL nicht schon kennt. Die Antwort muß lauten Die Zahl (oder Volumendichte) n(E,T) der nichtbesetzten Plätze (= Löcher) bei der Temperatur T und Energie E pro Energieintervall ∆E ist gegeben durch: Zustandsdichte D(E) der Elektronen mal Wahrscheinlichkeit für Nichtbesetzung (= 1 – f(E, T)). In Formeln: nh(E, T) = D(E) · [1 – f(E, T)] · ∆E Die Auswertung läuft sehr ähnlich zum Fall der Elektronen, wir erhalten für die Löcherdichte nhV(T) im gesamten Valenzband EL nhV(T) = ⌠ D(E) · [1 – f(E, EF, T)] · dE = 4.59 · 1015 · T 3/2 · exp – ⌡ –∞ EF – EV cm–3 kT Der einzige Unterschied ist, daß die im Boltzmannfaktor wirksame Energiebarriere jetzt durch EF – EV gegeben ist; dem Abstand der Fermienergie von der Valenzbandkante. Das ist aber auch zu erwarten; wir können ja exakt die gleiche Überlegung, die wir für die Elektronen im Leitungsband schon durchgeführt haben, auch für die Löcher im Valenzband machen. Zwei Fragen drängen sich jetzt auf 1. Wie groß ist die Fermienergie EF ? Ohne eine Zahl können wir nichts ausrechnen - wir wissen noch nicht einmal ob die Boltzmann-Näherung überhaupt berechtigt war. 2. Wie groß ist der Einfluß des T 3/2 - Terms? In anderen Worten, wie groß ist bei realen Hableitern die Abweichung der log (nL) über 1/T Kurve von einer Arrheniusgeraden? Die zweite Frage läßt sich beantworten, nachdem wir die erste geklärt haben. Wir widmen uns deshalb jetzt zum ersten mal einer der Zentralfragen der Halbleitertechnologie: Wo liegt (im Banddiagramm) die Fermienenergie? Was genau bestimmt die Lage der Fermieenergie? Wie kann ich sie ausrechnen Wir werden uns diese Frage mehrmals stellen. Die erste Antwort wird im nächsten Unterkapitel gegeben. Fragebogen / Questionaire Multiple Choice Fragen zu 5.1.1 MaWi 2 Skript - Page 168 5.1.2 Lage der Fermienergie im intrinsischen Halbleiter Wo liegt die Fermienenergie? - Erster Teil Die wesentliche Definition der Fermienergie EF war 1 f(E = EF) = 2 Damit kann man sich sofort - ohne Rechnung - überlegen, wo die Fermienergie beim intrinsischen Halbleiter liegen muß. Wir müssen lediglich darauf achten, daß wir bei der Verteilung von "Teilchen" auf die Bänder einen "Erhaltungssatz" nicht verletzen: Der Kristall bleibt elektrisch neutral, d.h. ungeladen - wir haben immer eine Neutralitätsbedingung. Falls wir nL Elektronen ins Leitungsband befördern, haben wir jetzt eine Ladungsdichte e · nL an negativen Ladungen im Leitungsband. Die Neutralitätsbedingung fordert dann, daß wir genauso vielepositive Ladungen im Valenzband haben müssen. Das ist hier noch ziemlich trivial. Da das vollbesetzte Valenzband elektrisch neutral ist, wird jedes Elektron, das das Valenzband verläßt, dort eine unkompensierte positive Ladung zurücklassen, Die Forderung nach Ladungsneutralität in intrinsischen Halbleitern bedeutet deshalb nicht mehr oder weniger, als daß die Dichte der Elektronen im Leitungsband identisch ist zur Dichte der Löcher im Valenzband. Wir sind uns dabei natürlich immer im klaren, daß Ausdrücke wie "im Valenzband" sich nicht auf einen Ort beziehen, sondern auf eine Energie. Diese Aussagen hätten wir natürlich auch gleich machen können - schließlich treten Elektronen im Leitungsband und Löcher im Valenzband bisher immer nur paarweise auf. Die Betrachtung über Elektroneutralität ist jedoch allgemeiner und wird noch mal nützlich werden. Um jetzt die Lage der Fermienergie zu erhalten müssen nur das frühere Bild komplettieren - mit Leitungs- und Valenzband, und mit einem der Löcherkonzentration entsprechendem "Zwickel" im Valenzband. Das ist rechts gezeigt. Sofern die Zustandsdichten im Leitungs- und Valenzband auch nur ungefähr gleich "groß" sind, müssen auch die "Zwickel" gleich groß sein. Damit liegt wegen der Symmetrie der Fermiverteilung die Fermienergie fest: Sie muß in der Mitte des verbotenen Bandes liegen, d.h. EF ≈ ½ · (EL + EV) Wir bekommen diese Ergebnis sofort auch in Formeln; wir müssen nur die notwendige Gleichheit der beiden Ladungsträgerdichten berücksichtigen, d.h. nL = nV := ni = intrinsische Ladungsträgerdichte Damit erhalten wir über die schon abgeleitete Formel für die Dichten der Elektronen/Löcher MaWi 2 Skript - Page 169 EL – EF EF – EV EL + EV ⇒ = kT EF = kT 2 Da beide Ladungsträgerdichten im intrinsischen Fall gleich groß sein müssen, haben wir eine neue Abkürzung eingeführt, die intrinsische Ladungsträgerdichte ni(T). Sie ist natürlich stark temperaturabhängig, aber trotzdem ein essentieller Materialparameter. Effektive Zustandsdichten Das war einfach - aber es wird schon noch komplizierter! Für intrinsische Halbleiter können wir jetzt die 2. Frage des vorigen Unterkapitels beantworten, indem wir für die Energie der BandlückeEG relevante Werte einsetzen (z.B. EG = 1,1 eV für Si). Die Antwort ist: Der Faktor T 3/2 verursacht für "normale" Temperaturen keine nennenswerte Abweichung von einer Arrheniusgeraden; im Link ist das graphisch gezeigt. Damit können wir uns das Leben nun sehr stark vereinfachen: Wir ziehen zur Berechnung der Ladungsträgerdichten alle Faktoren inklusive der Temperatur vor dem Boltzmannterm zu einer integralen effektiven Zustandsdichte Neff zusammen. Wir erhalten eine (im Prinzip schwach temperaturabhängige) Zahl. Damit lassen sich die Ladungsträgerdichten im Leitungs- bzw. Valenzband um T = 300 K in sehr einfacher Weise ausdrücken: NL nL(T) = ni(T) = eff · exp – EL – EF kT NVeff · exp – nV(T) = ni(T) = EF – EV kT Will man es ein bißchen genauer haben, läßt man den Faktor T 3/2 noch außen vor und schreibt Neff = N*eff . T 3/2 Ein Beispiel zu Zahlenwerten und der Temperaturabhängigkeit der effektiven Zustandsdichte. Für Silizium gilt N*eff ≈ 4.59 · 1015 cm –3 · T 3/2, daraus ergibt sich für die effektive Zustandsdichte Neff T [K] 100 200 300 500 1000 Neff [cm–3] 4.59 · 1018 1.30 · 1019 2.39 · 1019 5.13 · 1019 1.45 · 1020 Für eine Änderung der Temperatur um eine Größenordnung erhalten wir also eine Änderung von Neff um etwas mehr als eine Größenordnung. Für eine Bandlücke EG von zum Beispiel 1 eV ändert sich aber der Exponentialterm von 4 · 10 –51 auf 9 · 10 –6 falls man die Temperatur um eine Größenordnung variiert - man wird also keinen großen Fehler machen, wenn man im Bereich der Raumtemperatur mit einer ungefähr konstanten effektiven Zustandsdichte Neff = 2.4 · 1019 cm –3 rechnet. Die Frage ist jetzt natürlich, wie gut die obigen Zahl für die effektive Zustandsdichte ist? Wir können Sie ja über die Ladungsträgerkonzentration auch messen. Die Antwort ist: Ziemlich gut (siehe unten). Gemessene Werte für Si liegen so um einen Faktor zwei unerschiedlich - das ist aber eher Zufall; bei den vielen Näherungen im freien Elektronengasmodell hätte auch ein Faktor10 noch nicht zur Beunruhigung führen müssen. Wichtig ist: Diese Gleichungen gelten immer (natürlich im Rahmen der gemachten Näherungen; im wesentlichen die Boltzmann Näherung für die Fermiverteilung). MaWi 2 Skript - Page 170 Für die effektiven Zustandsdichten nehmen wir natürlich nicht theoretische Näherungswerte, sondern schlicht die gemessenen Werte. Es ist dann ganz natürlich, daß wir für die effektive Zustandsdichte des Leitungsbands NLeff etwas andere Werte bekommen als für die effektive Zustandsdichte des Valenzbandes NVeff- schließlich sind auch die realen Zustandsdichten unterschiedlich. Was bedeutet das für die Lage der Fermienergie? Nur eine kleine Änderung. Wir erhalten EF wieder aus der Gleichsetzung von nL und nV und erhalten jetzt EL + EV kT ln (NLeff) – (EL – EF) = kT ln NVeff – (EF – EV) ; EF = kT ln (NVeff /NLeff) + 2 2 Dabei sind natürlich für die effektiven Zustandsdichten nur die Zahlenwerte einzusetzen; die Maßeinheit ist egal. Die effektiven Zustandsdichten müßten also (?? nachprüfen) schon ziemlich verschieden sein, bevor sich EF stark ändert. Die folgende Tabelle gibt einige Beispiele (aus der Internet Resourcehttp://www.ioffe.rssi.ru/SVA/NSM/Semicond/.. Um den Wert bei Rauntemperatur zu erhalten, multipliziert man mit 2903/2 ≈ 5 · 103. Effektive Zustandsdichte [cm–3] Halbleiter Leitungsband Valenzband Silizium Si 6,2·1015 · T 3/2 Germanium Ge 1,98·1015 · T 3/2 9,6·1014 · T 3/2 Galliumarsenid GaAs komplex 1,83·1015 · T 3/2 Galliumphosphid GaP 3,4·1015 · T 3/2 3,6·1015 · T 3/2 Zinc Blende 3 · 1014 · T 3/2 Wurtzite 48,9 · 1014 · T3/2 Zinc Blende 8,0 · 1014 · T 3/ 1,1·1014 · T 3/2 2,2·1015 · T 3/2 ≈ 1020 ≈ 1019 Wurtzite 4,3 · 1014 · T 3/ Galliumnitrid GaN Indiumantimonid InP 3,5·1015 · T 3/2 2 2 Silziumcarbid SiC Diamant C Fragebogen / Questionaire Multiple Choice Fragen zu 5.1.2 Nur zur Illustration: mann kann natürlich immer noch ein bißchen besser nähern; lange Formeln sind im Zeitalter der PC kein Problem mehr. Für GaAs ist z.B. folgender Ausdruck gebräuchlich: Nc(GaAs) = 8.63·10 13·T3/2 · [1-1.9310-4·T - 4.19·10-8·T2 + 21·exp(-EΓL/(2kbT)) + 44·exp(-EΓX/(2kbT)) [cm-3] MaWi 2 Skript - Page 171 5.1.3 Die Leitfähigkeit der intrinsischen Halbleiter Die spezifische Leitfähigkeit des Leitungsbandes Elektronen im Leitungsband haben jede Menge freie Plätze in der (Energie)-Nachbarschaft, sie können also auf Kräfte durch Änderung ihres Wellenvektors (= Zustand) reagieren. Die damit verbunden spezifische Leitfähigkeit σL im Leitungsband ist durch unsere immer gültige Formel gegeben: σ L = e · μ · nL Mit e = Elementarladung, μ = Beweglichkeit, nL = Konzentration der Elektronen im Leitungsband. Wir verzichten auf das Vorzeichen bei der Ladung, da die Leitfähigkeit immer positiv ist (Das Vorzeichen sagt nur aus, ob die Teilchenstromrichtung und elektrotechnische Stromrichtung identisch sind oder nicht). Wir kennen nL für intrinsische Halbleiter. Wie steht es aus mit der Beweglichkeit μ? Falls wir auch dafür Werte herleiten können, haben wir die Schlüsselfrage der Halbleitertechnik beantwortet. Wir hatten uns bereits überlegt, welche physikalischen Prozesse die Beweglichkeit bestimmen, und kamen zu dem Schluß, daß es im wesentlichen die mittlere freie Weglänge zwischen Stößen ist. Die wesentlichen Stoß"partner" waren Phononen und Defekte. Defekte gibt es im perfekten intrinsischen Halbleiter nicht, und Stöße mit Phononen können (und wollen) wir hier nicht behandeln. Wir werden hier also keine Herleitung der Beweglichkeit leisten können und trösten uns damit, daß wir zumindest wissen, daß sie nicht sehr temperaturabhängig ist. Woher wissen wir das? Durch kurzes Nachdenken! Denn was immer auch Phononen genau sind, sie enthalten die thermische Energie des Kristalls. Die steigt aber bestenfalls linear mit der Temperatur - die Wärmekapazität eines Kristall haben wir, wenn auch etwas indirekt, behandelt. Also wird die Zahl der Phononen allenfalls mit irgendeiner niedrigen Potenz der Temperatur ansteigen vielleicht mit T, mit T 3/2 oder auch T 2. Wie auch immer - der Clou an der Sache ist, daß wir die Temperaturabhängigkeit der Beweglichkeit kaum merken werden, verglichen mit der exponentiellen Zunahme der Ladungsträgerdichte mit der Temperatur! Die Beweglichkeit ist damit an dieser Stelle einfach nicht so spannend. Das heißt aber nicht, daß die Beweglichkeit grundsätzlich uninteressant wäre. Für Halbleiterbauelemente, die auch noch bei höchsten Frequenzen arbeiten sollen, ist sie ein extrem spannender Materialparameter - Si verliert hier beispielsweise das Rennen gegen GaAs. Falls wir jetzt aber unterstellen, daß wir einen experimentellen Zahlenwert für die Beweglichkeit haben, und dann die Leitfähigkeit des Leitungsbandes ausrechnen, würden wir (in einem Idealexperiment) eine interessante Beobachtung machen: Die gemessene Leitfähigkeit ist ziemlich genau doppelt so groß wie die für das Leitungsband berechnete Leitfähigkeit! Aha! Alles klar? Wir müssen natürlich jetzt auch die Leitfähigkeit im Valenzband betrachten! MaWi 2 Skript - Page 172 Löcher und die spezifische Leitfähigkeit des Valenzbandes Ein voll besetztes Valenzband hat die Leitfähigkeit Null. So viel ist sicher. Das Valenzband ist aber nicht mehr voll besetzt, falls Elektronen im Leitungsband sitzen. Für jedes Elektron im Leitungsband fehlt eines im Valenzband; wir haben die freien Plätze bereits früher Löcher genannt. Das bedeutet jetzt aber, daß für jedes Elektron im Leitungsband jetzt auch genau ein Elektron im Valenzband seinen Zustand ändern kann, indem es in ein benachbartes Loch "springt". Das ist formal sehr ähnlich zum Leerstellendiffusionsmechanismus, nur daß die Löcher jetzt nicht nur Löcher im Ortsraum sind (wie die Leerstellen), sondern auch (und das ist wichtiger) im k-Raum bzw. Zustandsraum. Wir schauen uns diese "Löcher" in einem extra Modul etwas genauer an, hier nehmen wir einfach zur Kenntnis, daß es auch im Valenzband genau nL Ladungsträger gibt, die auf äußere Kräfte reagieren können. Ob wir diese Ladungsträger "negativ geladene Elektronen, die in ein Loch hüpfen können" nennen, oder "positiv geladenen Löcher" ist Geschmackssache. Da Geschmäcker verschieden sind, gibt es auch Leute die dazu Defektelektronen sagen. Ob wir dann sagen, daß sich unter dem Einfluß eines elektrischen Feldes eine ganze Kaskade, ein ganzes irgendwie korreliertes Ensemble von (negativ geladenen) Elektronen via Löcher zum Pluspol bewegt, oder die individuellen positiv geladenen Löcher zum Minuspol, ist ebenfalls Geschmackssache. Weiterhin gibt es keinen Grund, warum die Elektronen im Valenzband ganz andere Beweglichkeiten haben sollten als die im Leitungsband - alle Elektronen stoßen sich schließlich mit denselben Phononen oder Defekten. Die Lochfetischisten schließen daraus, daß die Beweglichkeit der Löcher (und damit auch ihre Masse) dieselbe ist wie die der Elektronen. In vornehmen Kreisen ist unbestritten, daß guter Geschmack die unauffällige Eleganz präferiert, das anscheinend Einfache. Das sind hier ganz klar die Löcher, wir werden also ab sofort folgende Aussage verinnerlichen und anwenden: Die freien Plätze im Valenzband heißen Löcher. Löcher benehmen sich im Kristall für alle praktischen Zwecke wie positiv geladene Elektronen. Damit ist klar: Die Leitfähigkeit des Valenzbandes σV ist in intrinsischen Halbleitern ungefähr gleich groß wie σL, die Leitfähigkeit im Leitungsband. Die gesamte Leitfähigkeit σ des intrinsischen Halbleiterkristalls wird damit σ = σL + σV = e · μL · nL + e · μV · nV ≈ 2σL Darstellung der Stromleitung im Banddiagramm Im Banddiagramm läßt sich die Stromleitung, d.h. der Transport elektrischer Ladungen von hier nach da, sehr gut und einleuchtend darstellen. Um elektrische Ströme zu erhalten, brauchen wir ein elektrisches Feld E, bzw eine Spannung U, bzw. eine Potentialdifferenz ∆V zwischen hier und da. Falls wir "da" erden, ist ∆V = V. Wir ersparen uns hier den üblichen Krampf mit den limitierten Buchstaben und benutzen den Buchstaben E auch für das elektrische Feld - aber dann in Magenta! Bleiben wir eindimensional wie auch sonst, haben wir nun ein Stück Halbleiter mit verschiedenem elektrischem Potential bei x = 0 und x = L. Im Banddiagramm betrachten wir die Energie der Elektronen im Kristall. Was bedeutet es, wenn jetzt ein elektrisches Potential V(x) vorliegt? Ganz einfach: Wir müssen zu der aus den Bindungen im Kristall kommenden Energie E, die wir bisher ausschließlich betrachtet haben, noch die elektrostatische Energie – e · V(x) addieren, und erhalten jetzt eine ortsabhängige Energie E(x). Denn das elektrische Potential mal der betrachteten Ladung gibt ja gerade die potentielle Energie dieser Ladung in dem zu V gehörenden elektrischem Feld an. Den Zusammenhang zwischen Ladungen ρ(x,y,z), elektrischem Potential V(x,y,z) und elektrischem Feld E(x,y,z) gibt dabei immer die Poisson Gleichung MaWi 2 Skript - Page 173 ∂ 2V ∆V = ∂ 2V + ∂x2 ∂ 2V ∂y2 ρ = ∇·E= – + ∂z2 εε0 Aber das müssen wir hier gar nicht so genau wissen. Wir betrachten einfach ein Stück Halbleiter, an dessem einen Ende (x = 0) das elektrische Potential den Wert V(0) = – V0 hat, während das andere Ende (x = L) geerdet ist, d.h. V(L) = 0. Die Maßeinheit ist natürlich Volt. Damit ergibt sich ein Banddiagramm, das wir erst mal zur Kenntnis nehmen, und dann diskutieren. Das Bild zeigt eine Fülle von Einzelheiten, die wir jetzt im Detail diskutieren: Im oberen Teil ist perspektivisch das Material gezeigt - mit den elektrischen Kontakten und dem Stromkreis. Man sollte niemals ein Banddiagramm und eine Darstellung im Ortsraum verwechseln - auch wenn auf einer hohen Abstraktionsebene beides nur noch ein Rechteck ist. Eingezeichnet ist ebenfalls, wie sich negativ und positiv geladene Teilchen bewegen werden. Wichtig dabei ist, daß trotz unterschiedlicher Teilchenstromrichtung, beide Ladungen dieselbe elektrische Stromrichtung ergeben. Weiterhin ist klar, daß bei konstanter Leitfähigkeit der Spannungsabfall im Material linear erfolgt. Dies bedeutet, daß das lokale elektrische Potential V(x) linear von V0 auf 0 abnimmt. Damit kann man das Banddiagramm zeichnen: Links sind Valenz- und Leitungsband um – e · V0 angehoben; rechts ist alles beim alten. Dazwischen nimmt die Energieanhebung linear ab - wie gezeichnet. Nach wie vor betrachten wir die Energie von Elektronen in den beiden Bändern - man erhält sie immer durch Addition der "Kristallenergie" und des lokal vorliegenden elektrostatischen Potentials. Wir haben damit eine fundamentale Sache eingeführt, die sogenannte Bandverbiegung. So nennen wir es, wenn Leitungs- und Valenzband nicht exakt horizontal verlaufen. Gleichzeitig erkennen wir eine fundamental Regel: Bandverbiegungen sind immer mit elektrischen Feldern im Material gekoppelt. Denn ein elektrisches Feld ist schlicht der Gradient des elektrischen Potentials , und ohne Gradient im Potential gibt es keine Bandverbiegung. Rein graphisch wird schon anschaulich was nun geschieht: Die Elektronen im Leitungsband werden sich zur tiefsten Energie begeben - sie laufen in einem Energiediagramm immer bergab. Da sie beweglich sind, wird das auch geschehen. Die Elektronen im Valenzband werden sich auch zur tiefsten Energie begeben. Da aber nur ein kleiner Teil beweglich ist - die mit einem Loch als Nachbar - laufen die Löcher entgegengesetzt, immer den Energieberg hinauf. Das ist eingezeichnet. Falls viele Elektronen "unten" wären, gäbe es unten einen Überschuß an negativer Ladung, oder, im Umkehrschluß, es gäbe oben einen Überschuß an positiver Ladung. Zeichnen wir nicht den Fluß der negativen Ladung nach unten ein, müssen wir den Löchern jetzt eine positive (Elementar)ladung nach oben mitgeben. Das ist eingezeichnet. Wir sehen also auch im Banddiagramm, daß jetzt Ladungen fließen. Wir sehen es sogar viel anschaulicher als im Ortsraum. Wo aber liegt nun die Fermienergie? Sie ist nicht eingezeichnet !? Das hat einen einfachen, aber sehr wichtigen Grund: Es gibt im strengen Sinn keine Fermienergie mehr - denn wir haben nicht mehr Gleichgewicht Mit Stromfluß haben wir Ungleichgewicht. Denn Stromfluß bedeutet immer Ungleichgewicht oder Nicht-Gleichgewicht. Es gibt zeitliche Änderungen von Systemparametern: Der Halbleiter wird warm, in der Batterie ändert sich die chemische Zusammensetzung, usw. MaWi 2 Skript - Page 174 Die Fermienergie war aber nur für Gleichgewicht definiert; sie existiert nicht für Nicht-Gleichgewicht. Ein letzter Punkt: Das Banddiagramm zeigt nicht, was mit den Elektronen und Löcheren geschieht, wenn sie bei ihrer Berg- und Talfahrt an das Ende des Kristall gelangen. Wir wissen aber, was geschehen muß: Die Spannungsquelle ist eine Ladungspumpe, sie befördert die Elektronen die bei x = L ankommen, durch den äußeren Stromkreis wieder zurück nach x = 0. Löcher allerdings, kann die Spannungsquelle nicht durch einen Metalldraht pumpen. Sie wird deshalb bei x = 0 Elektronen ins Valenzband geben, die mit den Löcher rekombinieren, und bei x = L diese Elektronen herausnehmen, d.h. Löcher injizieren. Das mag hier noch ein bißchen seltsam erscheinen, wir werden diese Prozesse aber bald besser verstehen. Die Zeichnung zeigt die Ströme im Halbleiter und im Draht; die Pfeile geben dabei die Bewegungsrichtung der Teilchen an, nicht die techische Stromrichtung. Für Löcher sind beide Richtungen identisch, für Elektronen sind sie umgegekehrt. Wir haben jetzt einen ersten Eindruck bekommen, wie man mit Banddiagrammen arbeiten kann. Wer testen möchte, wieweit er das verstanden hat versucht mal, sich die folgende Frage zu beantworten, bevor die Lösung angeklickt wird: Was passiert im Banddiagramm, wenn wir wie oben eine Spannung anlegen, aber die Kontaktelektroden mit einer "unendlich dünnen" isolierenden Schicht überziehen? Das bedeutet, wir haben zwar den Potentialunterschied zwischen x = 0 und x = L, aber Stromfluß kann dank der Isolierschicht nicht stattfinden. Die Antwort auf diese Frage findet sich in einem eigenen Modul, den man unbedingt konsultieren sollte Fragebogen / Questionaire Multiple Choice Fragen zu 5.1.3 MaWi 2 Skript - Page 175 5.1.4 Zusammenfassung Kapitel 5.1 Intrinsische Halbleiter Die Ladungsträgerdichte im Energieintervall ∆E bestimmt sich immer aus der "Master"gleichung n(E, T) = D(E) · f(E, T) ·∆E Die gesamte Elektronendichte im Leitungsband ist damit 3/2 ∞ nL(T) = ⌠ D(E) · f(E, T) · dE ⌡ EL = me · kT π 2 EL – EF EL – EF = 4.8 · 1015 · T 3/2 · exp – · exp – kT cm– 3 kT Wobei wir zum "Knacken" des bestimmten Integrals die Zustandsdichte des freien Elektronengases und die Boltzmannnäherung für die Fermiverteilung verwendet haben. Für den Zahlenwert der Elektronendichte ist also der "Schwanz" der Fermiverteilung im Leitungsband viel wichtiger als die genaue Zustandsdichte; das macht man sich am besten mit dem "Zwickelbild" der Ladungsgträgerdichte klar: Die Dichte der Löcher im Valenzband muß zwar im intrinsischen Halbleiter genau so groß sein wie die der Löcher im Leitungsband, wir können sie aber auch unabhängig durch die entsprechende Formel für Löcher errechnen und erhalten ∞ nhV(T) = ⌠ ⌡ EF – EV D(E) · [1 – f(E, T) ] · dE = 4.8 · 1015 · T 3/2 · exp – cm– 3 kT EL Die Ladungsträgerdichten ändern sich jedenfalls exponentiell mit der Fermienergie; die Lage der Fermienergie ist also der entscheidende Parameter. Sowohl die Rechnung (aus neL(EF) = nhV(EF) oder allgemeiner: aus Ladungsneutralität) als auch die Anschauung im "Zwickelbild führt sofort zur Erkenntnis: Die Fermienergie des intrinsischen Halbleiters muß in der Mitte der Bandlücke liegen. Ein realer intrinsischer Halbleiter hat natürlich eine reale Zustandsdichte, die von der Zustandsdichte des freien Elektronengases abweicht. Dies wird einfach durch die Angabe einer (gemessenen) (noch temperatureabhängigen) effektiven Zustandsdichte über alles Neff berücksichtigt; für Si liegt sie z.B. im Bereich (3 · 10 19 – 1 · 1021) cm– 3 Die Ladungsträgerdichte bestimmt im wesentlichen die Leitfähigkeit, insbesondere ihre exponentielle Temperaturabhängigkeit, da die Beweglichkeit relativ konstant ist. Wichtig ist, die "Löcherleitung" im Valenzband zu berücksichtigen. Dies führt auf eine sehr wichtige Erkenntnis: Löcher verhalten sich für alle praktischen Zwecke wie positiv geladene Elektronen; man kann ihnen Ladung, Masse, Beweglichkeit, Stöße mit Phononen etc. zuschreiben genau wie Elektronen auch. Die Darstellung der Stromleitung im Banddiagramm führt auf eine fundamental neue Erkenntnis: MaWi 2 Skript - Page 176 Die elektrostatische potentielle Energie, die immer mit der für Stromleitung notwendigen Spannung = Potentialdifferenz = Gradient eines elektrischen Feldes verbunden ist, addiert sich lokal zur Gesamtenergie mit der Konsequenz, daß die Bänder jetzt "verbogen" sind. Damit ergibt sich ein ungeheuer wichtiger Merksatz inkl. Umkehrung: Elektrische Felder verursachen Bandverbiegungen Verbogene Bänder enthalten ein elektrisches Feld Die Graphik suggeriert exakt was geschehen wird: Elektronen laufen den Berg hinunter in Richtung kleinere Energie, Löcher laufen nach oben. Eine Fermienergie im strengen Sinne gibt es nicht mehr, da kein Gleichgewicht mehr vorliegt. Damit der obige Zustand zeitlich stationär sein kann, muß jetzt eine Ladungspumpe (= Spannungsquelle) die Elektronen am rechten Ende aufnehmen und nach rechts oben "zurückschaufeln". Für die Löcher geht das nicht. Hier muß die Spannungsquelle Elektronen bereitstellen, die die ankommenden Löcher aufnehmen und per Rekombination "vernichten". MaWi 2 Skript - Page 177 5.1.5 Merkpunkte Kapitel 5.1 Dichte der Elektronen im Leitungsband: Erster Teil der Formel gilt immer ∞ nL(T) = ⌠ D(E) · f(E, T) · dE ⌡ EL – EF = 4.8 · 1015 · T 3/2 · exp – EL Zweiter Teil der Formel enthält div. Näherungen cm– 3 kT Dichte der Löcher im Valenzband Löcher verhalten sich wie positiv geladene Elektronen Löcher haben eine positive Elementarladung, tragen Strom, haben eine Masse und eine Beweglichkeit. ∞ nhV(T) = ⌠ D(E) · [1 – f(E, T) ] · dE ⌡ EL Ein elektrisches Feld "verbiegt" die Bänder um die jeweilige elektrostatische Energie, d.h. um e · V, V = elektrostatisches Potential. Die lokale Bandverbiegung zeigt die Richtung des induzierten Teilchenflusses: Elektronen "abwärts", Löcher "aufwärts". Bei Stromfluß herrscht Nichtgleichgewicht; damit gibt es streng genommen keine Fermienergie mehr. MaWi 2 Skript - Page 178 EF – EV = 4.8 · 1015 · T 3/2 · exp – cm– 3 kT 5.2 Dotierung 5.2.1 Defekte und Zustände in der Bandlücke Defekte und Zustände in der Bandlücke Die bisher behandelten intrinsischen Halbleiter sind zwar faszinierende Materialien zur Entwicklung der vollen Theorie der elektronischen Eigenschaften von Festkörpern, aber nicht so furchtbar spannend für Anwendungen. Das hat zwei Gründe 1. Die Leitfähigkeit ist extrem temperaturabhängig. Das ist sehr nachteilig für Anwendungen - außer man will ein Thermometer bauen. 2. Man muß die intrinsischen Halbleiter nehmen wie man sie bekommt - die Eigenschaften sind was sie sind. Das ist natürlich auch ganz schlecht - wir wollen schließlich Eigenschaften in möglichst weiten Grenzen so einstellen, wie wir sie haben möchten (das nennt man Technologie). Der zweite Punkt ist sogar zweifach schlecht. Erstens, weil wir die Eigenschaften des idealen intrinsischen Kristalls (über den wir hier immer noch reden) so nehmen müssen wie sie sind, und zweitens, weil wir gar keinen idealen Kristall bekommen, sondern immer einen mit mehr oder weniger viel Defekten. Und was fürelektronische Eigenschaftsänderungen mit den Defekten mitgeliefert werden, wissen wir noch nicht. Wir kommen also nicht umhin, uns den elektronischen Eigenschaften eines Kristalls mit Defekten zu widmen, den Eigenschaften des Realkristalls. Dabei können uns maximal drei Fälle unterlaufen: 1. irgendwelche Defekte (Leerstellen, Fremdatome, Korngrenzen, ...) beeinflussen Ladungsgträgerdichte und Beweglichkeiten gar nicht oder kaum. Nicht sehr wahrscheinlich, aber auch nicht verboten. 2. Defekte nehmen Einfluß - in einer Art und Weise, die uns nicht gefällt. Das hört sich nicht nur realistisch an, das ist sehr real! 2. Defekte nehmen Einfluß - in einer Art und Weise, die uns gefällt. Das gibt es glücklicherweise auch - hier liegt die Quelle der gesamten Festkörperelektronik. Der Einbau einer genau passenden Menge einer geeigneten Defektart in den richtigen Teilbereich eines Halbleiterkristalls heißt "den Kristall dotieren"; alles andere heißt "den Kristall versauen". Man kann es gar nicht drastisch genug ausdrücken: Dotieren, das A und O der Halbleitertechnik, ist eine schwierige Sache, auch wenn es dafür inzwischen viele ausgereifte Techniken gibt. Versauen, dagegen, ist immer einfach. Dotiert wird (fast) immer bei allen Halbleitern, indem substitutionelle Fremdatome eingebaut werden, die Dotieratome. Wir betrachten aber im folgenden nur noch Silizium, um die Übersichtlichkeit zu gewährleisten. Das Prinzip ist aber für alle Halbleiter gleich. Das Prinzip besteht darin, ein Si Atom durch ein Gruppe III oder Gruppe V Atom zu ersetzen. In anderen Worten: Es wird ein Atom eingebaut, das ein Elektron weniger oder mehr hat als ein Si Atom. Und damit auch ein Elektron zu wenig oder eins zu viel um die sp3 Hybridorbitale absättigen zu können. Das schauen wir uns in einem schematischen Kristallbindungsbild mal an Selbstverständlich ist Si kein Kristall mit einer Atomanordnung in der Fläche wie gezeigt ( sondern ???), aber so lassen sich die zwei Elektronen in den vier Bindungen am besten zeichnen (als Strich). Wo immer nun ein Gruppe V Atom sitzt - und in der Si Praxis werden das immer entweder ein P- oder ein As-Atom sein; eher selten mal noch Sb - gibt es ein Elektron zuviel. Dieses überzählige Elektron ist noch (locker) an das Dotieratom gebunden Falls wir diesem Elektron einen Stoß geben, z.B. durch thermische Energie, wird es sich losreißen können - und dann gehört es nicht mehr zum Dotieratom, sondern zum Kristall und ist frei beweglich. In anderen Worten: Wird genügend Energie zugeführt, um das Überschußelektron aus seiner noch bestehenden Bindung herauslösen zu können, "sitzt" es jetzt im Leitungsband - wo sonst? Denn nur im Leitungsband gibt es überhaupt freie Plätze für Elektronen - und ein Elektron ist ein Elektron ist ein Elektron - der Kristall weiß nicht, wem es mal "gehörte". Sitzen tut es im übrigen nur energetisch - auf einem Platz in Zustandsraum - ansonsten kann sich "frei" bewegen. MaWi 2 Skript - Page 179 Zurück bleibt ein einfach positiv geladenes P+- oder As+- Ion. Es ist ortsfest (wir vernachlässigen Diffusion). Ladungsneutralität ist jetzt nur noch für den Gesamtkristall gewahrt; nicht mehr lokal. Wo immer nun ein Gruppe III Atom sitzt - und in der Si Praxis wird das immer nur ein B-Atom sein - gibt es ein Elektron zu wenig. Dieses freie Bindung ist am Dotieratom lokalisiert. Falls wir aber einem der Elektronen in einer benachbarten Bindung einen Stoß geben, z.B. durch thermische Energie, wird es auf den freien Platz in der Nachbarbindung springen können. Der freie Platz ist jetzt in der Nachbarbindung und nicht mehr am B-Atom. In den normalen Bindungen aber, können Elektronen einfach so zwischen den 4 sp3 Keulen hin- und herwechseln, denn die 8 zur Verfügung stehenden Elektronen sind ja nicht einer der Keulen fest zugeordnet. Dier freie Platz, der jetzt in einer Si-Si Bindung liegt, und den wir jetzt mal ganz vorsichtig ein Loch nennen, ist also frei beweglich. In anderen Worten: Wird einem Elektron im Valenzband genügend Energie zugeführt, um die freie Bindung beim BAtom abzusättigen, haben wir jetzt ein Loch im Valenzband, das dort (per Elektron-hüpf-kette) frei beweglich ist. Denn die Elektronen in den Bindungen sind natürlich nichts anderes als unsere Valenzelektronen. Man kann das sehen, indem man entweder die Entwicklung des Valenzbandes aus den bindenden Zuständen der sp3 Hybridorbitale anschaut (das Leitungsband ensteht aus den antibindenden Zuständen), oder schlicht konstantiert: "Wo sonst sollen diese Elektronen sitzen?" Zurück bleibt ein negativ geladenes ortsfestes B–-Ion. Ladungsneutralität ist wiederum nur noch für den Gesamtkristall gewahrt; nicht mehr lokal. Das wollen wir jetzt im Banddiagramm darstellen. Wenn man von der kleinen lokalen Störung der Kristallparameter einmal absieht, haben wir durch dotieren lediglich für ein paar zusätzliche Zustände für Elektronen gesorgt; Zustände, die es vorher nicht gab. Bezeichnen wir die Konzentration an Dotieratomen mit ND für die Gruppe V Elemente, und mit NA für die Gruppe III Elemente, haben wir jetzt ND zusätzliche Plätze irgendwo unterhalb der Leitungsbandkante , und NA zusätzliche Plätze oberhalb der Valenzbandkante. Das "irgendwo" wird dabei durch die jeweilige noch vorhandene Bindungsenergie gegeben. Im Banddiagramm erhalten wir folgende Darstellung Wo immer auch ein Dotieratom sitzt, gibt es einen zusätzlichen Platz in der Bandlücke, jeweils um ein dotieratomspezifisches ∆E unterhalb der Leitungsbandkante oder oberhalb der Valenzbandkante. ∆ED ist dabei genau die Energie, die man aufwenden muß, um dem Fremdatom ein Elektron wegzunehmen; ∆EA ist die Energie die man gewinnt, falls ein zusätzliches Elektron am Fremdatom gebunden wird. Das ist sehr ähnlich zu den guten alten Ionisationsenergien bzw. Elektronenaffinitäten der Atome. Das bringt uns natürlich auf einen Gedanken. So wie jedes Atom eine Ionsiationsenergie hat (nicht aber unbedingt eine positive Elektronenaffinität), müßte man eigentlich auch jedem Fremdatom, oder wenn man weiter denkt sogar jedem Defekt, ein Elektron entreissen können, wenn man nur genügend Energie ∆ED hineinsteckt. Dem ist auch so - leider. Denn man kann eben nicht nur mit Dotieratomen dotieren, sondern mit allen möglichen Defekten den Kristall versauen - siehe oben. MaWi 2 Skript - Page 180 Donatoren und Akzeptoren Wir haben also grundsätzlich zwei Möglichkeiten, um mit atomaren Fehlstellen, die wir bei Halbleitern Störstellen nennen, die Ladungsträgerkonzentration im Leitungs und /oder Valenzband zu beeinflussen: Wir können Donatoren einbauen, die in der Lage sind, eine Elektron in das Leitungsband abzugeben. Dabei ist es zunächst unerheblich, wo genau sich das Donatorniveau befindet, d.h. wie groß ∆ED ist. Wir können Akzeptoren einbauen, die in der Lage sind, eine Elektron vom Valenzband zu "akzeptieren", d.h. aufzunehmen. Dabei ist es zunächst unerheblich, wo genau sich das Akzeptorniveau befindet, d.h. wie groß ∆EA ist. Um gezielt zu dotieren, sind natürlich Donatoren und Akzeptoren von Vorteil, deren ∆E Werte so klein sind, daß die thermische Energie bei Raumtemperatur schon deutliche Effekte zeigt. Das ist für die bereits genannten technisch wichtigen Dotierelemente auch gegeben; die folgende Tabelle gibt Zahlenwerte für Si (Elemente in Klammern werden technisch nicht benutzt). ∆E [eV] Donatoren Akzeptoren P 0.045 B 0.045 As 0.049 (Al) 0.057 Sb 0,039 (Ga) 0,065 (Li) 0,033 (In) 0,16 (Mn) 0,53 (Cu) 0,49 "Flache" Störstellen "Shallow levels" "Tiefe" Störstellen "Deep levels" Zum Vergleich: kTRT ≈ 0.025 eV Für technisches Dotieren sind nur die flachen Störstellen interessant. Die tiefen Störstellen, von denen nur zwei Beispiele gezeigt sind, können zwar dotieren (wenn auch bei Raumtemperatur nur mit Mühe), sie haben aber andere Effekte und müssen unbedingt vermieden werden, d.h. ihre Konzentration sollten allenfalls im ppqt (???) Bereich liegen. Im übrigen muß die Störstelle nicht immer unbedingt substitutionell eingebaut werden, interstitielle Störstellen produzieren auch Energieniveaus in der Bandlücke, tendenziell aber eher "tiefe" Niveaus. In einem Illustrationsmodul findet sich eine Zusammenstellung der Energieniveaus vieler Störstellen in einigen Halbleitern Wir haben jetzt einen Teil des eingangs beschriebenen Programms abgehandelt: Wir wissen, daß atomare Fehlstellen zusätzliche Plätze für Elektronen in der Bandlücke bereitstellen, wir "wissen", wo diese Plätze energetisch liegen und ob sie Elektronen abgeben (d.h. Donatoren sind) oder aufnehmen (d.h. Akzeptoren sind). Fein. Aber was bedeutet das für die Leitfähigkeit? Oder präziser gefragt: Für die Elektronendichte nL im Leitungsband, die Löcherdichte nV im Valenzband und die jeweiligen Beweglichkeiten µL bzw. µV ? Wer halbwegs aufgepaßt hat, sollte die prinzipielle Antwort bezüglich der Konzentrationen jetzt wissen. Also: Kurz nachdenken, dann zum nächsten Unterkapitel weiterklicken. Fragebogen / Questionaire Multiple Choice Fragen zu 5.2.1 MaWi 2 Skript - Page 181 5.2.2 Die Konzentrationen von Ladungsträgern im Leitungs- und Valenzband in dotierten Halbleitern Konzentration und Zustandsdichte mit Dotierung Für die Konzentration der Ladungsträger im Leitungsband gilt nach wie vor und auch sonst immer: ∞ nL(T) = ⌠ ⌡ D(E) · f(E, EF ,T) · dE EL ???????? Bedeutet das, eine Dotierung ändert nichts an den Ladungsträgerkonzentrationen? Nein - das bedeutet es ganz sicher nicht! Denn wir haben zwar dieselbe Grundformel wie im intrinsischen Fall - und auch sonst immer - aber wir haben jetzt, erstens, andere Zustandsdichten, und wo die Fermienergie jetzt liegt, ist zweitens auch nicht unmittelbar klar. Das ist in der Formel oben angedeutet, indem wir die Fermienergie EF als Variable in die Fermiverteilung schreiben. Betrachten wir nun die möglichen Änderungen bei Zustandsdichte und Fermienergie. Wie sich die Zustandsdichte mit Dotierung ändert, ist einfach zu sehen: In den Bändern ändert sich nichts; es gibt genau so viel Plätze für Elektronen wie ohne Dotierung. Wir verwenden deshalb einfach die effektiven Zustandsdichten weiter. In der Bandlücke sieht es anders aus. Im intrinsischen Halbleiter war die Zustandsdichte in der Bandlücke überall (d.h. bei jeder Energie) = Null; jetzt aber haben wir ND Zustände bei E = EL – ∆ED und NA Zustände bei E = EV + ∆EA. Die zusätzlichen Zustandsdichten in der Bandlücke sind also identisch mit der Dichte der eingebrachten Störstellen (von gewissen kleinen Komplikationen, die uns hier aber nicht interessieren, mal abgesehen). So weit so einfach. Die entscheidende Frage ist jetzt aber: Wo liegt die Fermienergie?. Wir schauen uns das in mehreren Schritten an; sowohl qualitativ, als auch quantitativ. Wo liegt die Fermienergie - zweiter Teil Qualitativ gehen wir genauso vor wie beim ersten mal, als wir uns diese Frage gestellt haben. Wir betrachten einen Halbleiter, der Donatoren mit der Dichte (oder Zahl) ND enthalten soll, die ein Energieniveau für Elektronen bei ED (d.h. ED – EL = ∆ED) in die Bandlücke einführen. Weiterhin betrachten wir nur technisch relevante Donatoren, d.h. ∆ED << EG . Bei T = 0 K werden dann die Donatorniveaus die letzten mit Elektronen besetzten Zustände sein; nach der "naiven" Definition der Fermienergie wäre dann EF = ED MaWi 2 Skript - Page 182 Naiv, aber immerhin: Die Fermienergie ist jetzt ganz woanders als im intrinsischen Halbleiter, wo sie in Bandmitte lag. Nun wärmen wir den Kristall ein kleines bißchen auf. Die dann zur Verfügung stehende thermische Energie kT wird ausreichen, um einige Elektronen vom Donatorniveau ins Leitungsband zu heben, während vom Valenzband sehr, sehr viel weniger kommt - diesen Beitrag können wir erst mal vernachlässigen. In der "Zwickelbetrachtungsweise" der Fermiverteilung erhalten wir jetzt folgende Formel: Zwickelhöhe im Leitungsband · NLeff = Zwickelhöhe auf Donatorniveau · ND. Wir haben nicht mehr die Flächen der Zwickel, sondern nur noch die Zwickelhöhen, d.h. den Wert der Verteilungsfunktion bei der betrachteten Energie, denn die Integration über die "Zwickelfläche" im Leitungsband ist ja in der effektiven Zustandsdichte schon enthalten. Den Zwickel unterhalb des Donatorniveuas brauchen wir gar nicht aufzuintgrieren, denn nur bei ED gibt es überhaupt Zustände. Im Leitungsband dürfen wir zur Berechnung der Zwickelhöhe statt der Femiverteilung auch die Botlzmann Näherung nehmen, da EL – EF >> kT für "normale" Umstände. Für das Donatorniveau dürfen wir das aber nicht, da der Abstand von Fermienergie zu ED beliebig klein werden kann. Tatsächlich wird die Fermienergie sogar durch das Donatoniveau "durchrutschen" müssen, wenn man die Temperatur erhöht, wie wir gleich sehen werden. Bei kleinen T liegt EF oberhalb von ED, bei Raumtemperatur aber unterhalb. Wie auch immer, der Zeichnung entnimmt man zwanglos, daß bei halbwegs vergleichbaren effektiven Zustandsdichten NLeff und ND (angedeutet durch die Dicke der Balken), die Fermienergie jetzt, d. h. bei sehr kleine T, zwischen EL und ED liegen muß. Das können wir sofort quantifizieren. Unter der für kleine Temperaturen sicher richtigen Annahme, daß weitaus überwiegend alle Elektronen im Leitungsband von Donatoren kommen, muß gelten Zahl (oder Volumendichte) nL(T) der besetzten Zustände im Leitungsband = Zahl (oder Volumendichte) der nicht mehr besetzten Zustände N+ D(T) bei den Donatoratomen. Dabei haben wir davon Gebrauch gemacht, daß für jedes Elektron, das sein ursprüngliches Donatoratom verlassen hat, ein positiv ionisiertes Donatoratom zurückbleibt, d.h. nL(T) = N+ D(T). Wenn wir uns nun zum letzten Mal im Langtext vergegenwärtigen, daß die Zahl von besetzten Zuständen immer gegeben ist durch Integral über Fermiverteilung mal Zustandsdichte oder, einfacher, effektive Zustandsdichte mal Wert der Boltzmannverteilung, dann ist nL(T), die Zahl der Elektronen im Leitungsband nL(T) = NLeff · exp–(EL – EF )/kT Die Zahl der noch von Elektronen besetzten Donatorzuständen N0D(T) (die "0" bei N0D(T) steht für ungeladen) wäre dementsprechend N0D(T) = ND – NLeff · exp–(EL – EF )/kT Wir wollen uns aber gar nicht erst mit der Näherung aufhalten, dass alle Elektronen im Leitungsband von den Donatoren stammen, sondern schreiben in voller Allgemeinheit mit Hilfe der Fermiverteilung N0D(T) = ND · f(ED, EF, T ). Die Zahl N+D(T) der nicht mehr mit Elektronen besetzten Donatorzustände ist, ebenfalls in voller Allgemeinheit: N+D(T) = ND · {1 – f(ED, EF, T ). Das können wir sofort mit Formeln hinschreiben: nL(T) NLeff · exp–(EL – EF )/kT) = N+ D(T) = ND · {1 – f(ED, EF, T )} EF ist rot markiert, denn es ist die einzige Unbekannte in obiger Gleichung. Wir haben also eine transzendente Gleichung mit einer Unbekannten - der Fermienergie. Diese Gleichung ist damit die Bestimmungsgleichung für die Fermienergie für den Spezialfall, daß alle Elektronen im Leitungsband nur von den Donatoren kommen. Ob man diese Gleichung wohl analytisch lösen kann, d.h. einen geschlossen Ausdruck EF = EF(ND, NLeff , T) hinschreiben kann? Rezepte zur Lösung transzendenter Gleichungen gibt es zwar nicht, aber man kann ja mal probieren: MaWi 2 Skript - Page 183 Übung 5.2-1 Fermienergie ausrechnen Das Ergebnis ist genau wie oben qualitativ beschrieben: Die Fermienergie liegt zwischen EL und ED. Aber das gilt nur für kleine Temperaturen, bei denen der Anteil der Elektronen, die es aus dem Valenzband ins Leitungsband schaffen, gegenüber den Elektronen aus Donatorniveaus vernachlässigbar ist. Immerhin, wir haben eine völlig neue Sache gefunden: Wir haben immit Donatoren dotierten Halbleiter unter diesen Umständen ("kleine" Temperaturen) sehr viel mehr Elektronen im Leitungsband als Löcher im Valenzband! Klar? Nein? Na dann: Wie groß ist jetzt nV, die Konzentration der Löcher im Valenzband? Richtig: Integral über Zustandsdichte mal (1 – Fermiverteilung) oder gleich effektive Zustandsdichte mal Wert der Boltzmannverteilung bei der gewählten Energie. EF – EV nV ≈ NVeff . exp – kT Da in mit Donatoren dotierten Halbleitern die Fermienergie aber "hochgerutscht" ist, ist EF – EV jetzt aber viel größer als im intrinsischen Fall; statt ungefähr EG /2 haben wir jetzt ungefähr EG . Wir haben also in mit Donatoren dotierten Halbleitern (bei nicht zu hohen Temperaturen) tatsächlich sehr viel mehr Elektronen im Leitungsband als Löcher im Valenzband. Das ist so eine fundamental neue Sache, daß wir für die damit verbunden Eigenschaften zwei allgemeine Bezeichnungen erfinden: 1. Wir nennen alle Halbleiter, die mehr Elektronen im Leitungsband als Löcher im Valenzband haben "n-dotiert" oder n-leitend, da negative (bewegliche) Ladungen überwiegen. Den umgekehrten Fall (mehr Löcher als Elektronen) nennen wir "p-dotiert" oder p-leitend, da positive (bewegliche) Ladungen überwiegen. Die Kleinschreibung von "n" und "p" ist extrem wichtig, da ein P-dotierter Halbleiter ein mit Phosphor (P) dotierter Halbleiter ist - und der ist dann n-leitend, denn Phosphor ist ein Donator! Verwechslungen von n- und p-dotierten Scheiben sind dann vorprogrammiert, und das ist so ungefähr der GAU in der Halbleitertechnologie. 2. Wir nennen diejenigen Ladungsträger, die die Mehrheit haben, die Majoritätsladungsträger oder kurz Majoritäten. Die anderen sind dann die Minoritätsladungsträger oder kurz Minoritäten. In mit P dotiertem n-leitendem Si sind also die Elektronen im Leitungsband die Majoritäten, die Löcher im Valenzband die Minoritäten. Bevor wir dieser spannenden Sache weiter nachgehen, betrachten wir aber erstmal noch, was bei hohen Temperaturen in dotierten Halbleitern geschieht. Dazu suchen wir uns einfach eine Temperatur aus, die garantiert mehr Elektronen aus dem Valenzband ins Leitungsband schaufelt, als wir überhaupt Donatoren haben, d.h. wir postulieren nV » ND Das ist leicht trickreich formuliert, aber die Zahl der Löcher im Valenzband ist zumindest nie kleiner als die Zahl der Elektronen, die aus dem Valenzband kommen (ob sie größer sein kann, werden wir noch sehen). Damit ist dann aber auch nL ≈ nV, und damit muß die Fermienergie wie im intrinsischen Fall ungefähr in Bandmitte liegen Man kann das auch so verstehen: Bei genügend hohen Temperaturen kann das Valenzband immer sehr viel mehr Elektronen ins Leitungsband schicken als jede mögliche (sinnvolle) Dotierung, da wir einfach immer sehr viel mehr Kristallatome haben als Fremdatome = Dotierungsatome Damit ist der Unterschied zu intrinsischem Verhalten bei hohen Temperaturen praktisch nicht wahrnehmbar, und die Fermienergie ist zwangsläufig wieder in Bandmitte. Wie hoch die "hohe" Temperatur sein muß, um den Beitrag der Donatoren zu den Elektronen im Leitungsband zu überwältigen, wird ganz klar von der Konzentration ND an Donatoren abhängen. Bei kleinen Konzentrationen reichen schon mittlere Temperaturen; bei hohen Konzentration muß man kräftig heiß machen. Damit haben wir aber auch schon die indirekt gestellte Frage beantwortet: Wo liegt die Fermienergie bei mittleren Temperaturen? MaWi 2 Skript - Page 184 Bei tiefen T liegt sie zwischen EL und ED, also dicht unterhalb der Leitungsbandkante, bei hohen Temperaturen liegt sie in der Bandmitte - bei mittleren Temperaturen kann sie nur irgendwo dazwischen liegen. Damit erwarten wir qualitativ, aber logisch zwingend, folgenden Verlauf der Fermienergie mit der Temperatur: Es bleiben nur noch zwei Fragen: Wie ist die Lage, wenn wir nicht Donatoren, sondern Akzeptoren einbauen? Oder beide gleichzeitig? Die zweite Frage stellen wir etwas zurück; die erste ist einfach zu beantworten: In p-dotiertem Material werden wir bei kleinen Temperaturen viele Löcher im Valenzband generieren, weil die thermische Energie ausreicht, um Elektronen aus dem Valenzband auf die Akzeptorniveaus zu befördern. Die Fermienergie muß zwischen Akzeptorniveau and Valenzbandkante sitzen. Wir haben jetzt sehr viel mehr Löcher im Valenzband als als Elektronen im Leitungsband, Löcher sind jetzt die Majoritätsladungsträger. Bei hohen Temperaturen wird alles wieder intrinsisch, die Fermienergie liegt in Bandmitte. Wir erwarten folgenden Verlauf der Fermienergie mit der Temperatur: Alles ist ziemlich symmetrisch, wie es auch sein sollte. Aber genug der qualtitativen Betrachtungen. Wie sieht das ganze quantitativ aus? Das schauen wir uns in einem eigenen Unterkapitel an. Fragebogen / Questionaire Multiple Choice Fragen zu 5.2.2 MaWi 2 Skript - Page 185 5.2.3 Quantitative Berechnung der Fermienergie bei dotierten Halbleitern Wo liegt die Fermienenergie - Dritter Teil Wir lassen beliebige Konzentrationen an Akzeptoren und Donatoren zu; betrachten aber nur zwei zusätzliche Niveaus in der Bandlücke bei ED und EA Die zugehörigen Zustandsdichten sind identisch mit den Konzentrationen der Dotieratome, d.h. wir haben ND und NA Plätze für Elektronen bei den zugehörigen Energien. Wir zeichnen das alles einfach mal in ein Banddiagramm und schauen uns an, wieviele der angebotenen Plätze besetzt sind bei einer Fermiverteilung mit zunächst noch willkürlich gewählter Fermienergie. Das ist jetzt einfach zu machen und schaut so aus: Die farbigen Balken symbolisieren (von oben nach unten) die Zustandsdichten NeffL bei EL ND bei ED NA bei EA NeffV bei EV Was wir jetzt zu beachten haben, um die Fermienergie bestimmen zu können, ist Elektroneutralität - nur mit der Gleichsetzung zweier Konzentrationen wie bisher kommt man nicht weiter. Was für Ladungen haben wir zu beachten? Wo hat sich etwas geändert (immer im Vergleich zu T = 0K)? Schauen wir uns also die Bilanz an, getrennt nach negativen und positiven Ladungen. Wir schreiben das Ganze in fast voller Allgemeinheit mit der Fermiverteilung, nur die effektiven Zustandsdichten lassen wir zu um die unhandliche Integrale zu vermeiden. Negativ Positiv Art Formel Art Formel Elektronen in L nL = NeffL · f(EL , EF , T) Löcher in V nV = NeffV · {1 – f(EV , EF , T)} negativ ionisierte Akzeptoren N–A = NAL · f(EA , EF , T) positiv ionisierte Donatoren N+D = ND · {1 – f(ED , EF , T)} Alles was wir nun zu tun haben, ist Ladungsneutralität in der Form Σ neg. Ladungen = Σ pos. Ladungen aufzuschreiben, d.h. folgende Gleichung: NeffL · f(EL , EF , T) + NA · f(EA , EF , T) = NeffV · {1 – f(EV , EF , TV)} + ND · {1 – f(ED , EF , T)} Voilá - eine Gleichung für die eine Unbekannte EF - das hatten wir schon mal. Wir müssen nur nach EF auflösen - fertig! Ob man diese Gleichung wohl analytisch lösen kann? Nun - vergiß es! MaWi 2 Skript - Page 186 Es geht nicht; und wir müssen nun zu Fallunterscheidungen und Näherungen Zuflucht nehmen - oder zum PC, den wir ja zur Betrachtung dieses Hyperskripts schon haben. Denn die numerische Lösung der obigen Gleichung für beliebige Parameter ist kein großes Problem; wir können die Fermienergie jetzt also immer ausrechnen. Und wenn wir die Fermienergie haben, können wir sie benutzen um (ebenfalls numerisch) alle gewünschten Konzentrationen als Funktion aller vorgegebenen Parameter auszurechnen. Das tun wir mal - in einem eigenen Modul mit einem entsprechenden JAVA Applet, das die Numerik für uns übernimmt. Was man erhält sieht beispielsweise so aus: Gezeigt ist: Die Fermienergie als Funktion der Temperatur (obere Kurve) Der log der Konzentration von Elektronen im Leitungsband als Funktion der Temperatur (mittlere Kurve). Der log der Konzentration von Löchern im Valenzband als Funktion der Temperatur (untere Kurve) für eine Konzentration an Akzeptoren von 1015 cm –3 mit den roten Linien, und für eine Konzentration an Donatoren von 1017 cm –3 mit den blauen Linien. Eigentlich ist damit alles gesagt. Da wir uns aber für prinzipielle Betrachtungen mit analytischen Formeln viel leichter tun als mit der Numerik, wird sich das nächste Unterkapitel mit einigen sehr nützlichen analytischen Formeln für die Ladungsträgerkonzentrationen beschäftigen. Fragebogen / Questionaire Multiple Choice Fragen zu 5.2.3 MaWi 2 Skript - Page 187 5.2.4 Massenwirkungsgesetz und Ladungsträgerdichten Massenwirkungsgesetz Die beiden relevanten Ladungsträgerdichten sind die Konzentration der Elektronen im LeitungsbandnL und die Konzentration der Löcher nV im Valenzband. Sie sind immer gegeben durch EL – EF EF – EV nL = NeffL · exp – nV = NeffV · exp – kT kT Dotierung oder Defekte ändern "nur" die Fermienergie EF; aus dem vorhergehenden Unterkapitel wissen wir auch wie. Wenn wir nun das Produkt aus nL und nV bilden, erhalten wir folgende Formel (EL – EF) + (EF – EV) EL – EV nL · nV = NeffL · NeffV · exp – NeffL · NeffV · exp – = kT = ni2 kT Diese Beziehung heißt Massenwirkungsgesetz für Elektronen und Löcher; ist sehr wichtig, und muß diskutiert werden! Zunächst müssen wir uns klar machen, wieso hier ni2 auftaucht, das Quadrat der intrinsischen Ladungsträgerdichte. Aber das ist leicht zu sehen: Die Formel gilt immer, d.h. auch für nL = nV = ni. Ganz nebenbei erhalten wir damit auch eine sehr brauchbare Formel für den Fall, daß EF für einen intrinischen Halbleiter nicht genau in der Bandmitte liegt (weil die Neff verschieden sind). Wir schreiben einfach: ni = (ni2)½ = NeffL · NeffV 1/2 EL – EV · exp – 2kT Das ist sehr viel einfacher, als die korrekte Fermienergie auszurechnen und einzusetzen - obwohl wir das könnten. Jetzt fragen wir uns natürlich warum das ganze Massenwirkungsgesetz heißt; welche Massen wirken hier wie? Keine. Es heißt halt so, weil die Bezeichnung aus dem in der Chemie unverbrüchlich verankerten Massenwirkungsgesetz für chemische Reaktionen kommt (und dort gibt die Bezeichnung auch einen gewissen Sinn). Formal kann man aber auch die Abgabe oder Aufnahme von Elektronen als "chemischen Reaktion" zwischen Dotieratomen, Elektronen und Löchern schreiben. Wenn man dann diese "chemischen" Reaktionsgleichungen hinschreibt (und vorher die Symbolik in nicht ganz einfacher Art und Weise erweitert auf Dinge, die nicht Atome sind), kann man tatsächlich die Beziehung nL · nV = ni2 direkt ableiten. Wer's nicht glaubt betätigt den Link. Wir knirschen einmal leise mit den Zähnen und akzeptieren dann, daß die obige Gleichung auch in der Halbleiterei und überall auf der Welt eben als Massenwirkungsgesetz (engl. "Mass action law") bekannt ist. Mit dem Massenwirkungsgesetz für Löcher und Elektronen haben wir eine ungeheuer wichtige Beziehung! Sie sagt nämlich klar und deutlich, daß wenn man die Konzentration einer Ladungsträgersorte kennt und noch den Halbleiter mit dem man arbeitet (das bestimmt ni), dann kennt man auch die Konzentration der anderen Sorte. Und zwar exakt! Es stecken hier keine neuen Näherungen drin. Näherungsformeln für die Ladungsträgerdichte mit Dotierung Die einfachste Näherung haben wir indirekt schon gemacht. Wir setzen die Fermienergie zwischen Leitungs- oder Valenzbandbandkante und Dotierniveau. Dann erhalten wir in einer sehr simplen Näherung für tiefe Temperaturen ∆E nL,V (kleineT) = NDot · exp – 2kT MaWi 2 Skript - Page 188 Dies gilt aber nur halbwegs exakt, solange die Fermienergie noch zwischen Dotierniveau und Bandkante liegt, also maximal die Hälfte der Dotieratome ionisiert ist ( warum wohl???). Eine etwas bessere Näherung berücksichtigt, daß die Fermienergie genausowenig wie im intrinischen Fall in der Mitte zwischen Dotierniveau und Bandkante liegt, falls die beiden Zustandsdichten NDot und Neff verschieden sind. Das kann man exakt wie im oben dargestellten intrinsischen Fall berücksichtigen. Wir müssen uns dazu nur klarmachen, daß für tiefe Temperaturen das Dotierniveau entweder die Rolle des Valenzbandes übernimmt (bei Donatoren, denn von dort, und nur von dort kommen die Elektronen ins Leitungsband) oder die Rolle des Leitungsbandes bei Akzeptoren. Wir müssen in der Formel für die intrinsische Ladungsträgerkonzentration also nur die jeweilige effektive Dichte durch die Dotierkonzentration ersetzen, und statt EG /2 im Exponenten ∆E /2 nehmen um eine Tieftemperaturnäherung für den dotierten Fall zu erhalten. Das Ergebnis ist nL,V (kleineT) = NeffV · NDot ∆E 1/2 · exp – 2kT Ebenfalls einfach ist es, eine Näherung für hohe Temperaturen zu finden, bei denen nL » nD gilt. Dann sind wir wieder mehr oder weniger intrinsisch und haben nL (großeT) ≈ ni = NeffL · NeffV 1/2 EL – EV · exp – 2kT Es bleiben die "mittleren" Temperaturen. Die Definition von "mittlerer Temperatur" ist, daß wir zwar immer noch das Valenzband vernachlässigen können, d.h. wir nehmen an, daß die weitaus überwiegende Anzahl der Elektronen im Leitungsband von den Donatoren kommt, aber daß die Fermienergie jetzt auch unterhalb oder oberhalb des Dotierniveaus liegen kann, d.h. daß mehr als die Hälfte der Dotieratome ionisiert ist Klar? Das ist die Umkehrung der Frage von oben. Wer nach kurzem Nachdenken nicht selbst darauf kommt, warum die Fermienergie unterhalb des Donatorniveaus bzw. oberhalb des Akzeptorniveaus liegen muß, falls mehr als 50% der Dotieratome ein Elektron abgegeben bzw. aufgenommen haben, der betätigt (beschämt) den Link. Das ist einerseits der schwierigste, andererseits der einfachste Fall. Beginnen wir mit dem schwierigen Teil. Wir betrachten nur Donatoren (für Akzeptoren ist alles symmetrisch) und gehen immer davon aus, daß alle Elektronen im Leitungsband von den Donatoren kommen, d.h. die Dichte der Elektronen im Leitungsband ist identisch zur Dichte der nicht mit Elektronen besetzten Donatorzustände. Wir haben n L (mittlereT) = ND · 1 1 – 1 + exp (ED – EF)/kT Leider fehlt die Fermienergie um weiterzukommen. Aber wir haben ja immer noch eine weitere Gleichung für die Ladungsträgerdichte im Leitungsband! EL – EF nL (alleT) = NLeff · B(EL ,EF, T) ≈ NLeff · exp – kT Das gilt schließlich immer, vorausgesetzt wir können die Boltzmannnäherung gebrauchen! Das ist aber im Leitungsband zumindest eher möglich als bei den Donatorniveaus, da wir uns auf jedem Fall eher im "Hochenergieschwanz" der Fermiverteilung befinden. Daraus können wir exp (EF/ kT) destillieren und weiter oben einsetzen. Wir haben EF exp nL = kT EL · exp NLeff kT Einsetzen in die Ausgangsgleichung ergibt nach der üblichen etwas zähen Rechnung mit den Exponentialfunktionen MaWi 2 Skript - Page 189 2ND nL (mittlereT) = 1+ 4 · ND 1 + EL – Ed · exp NL kT eff 1/2 Das ist eine ziemlich gute Formel, die immer gilt - auch bei kleinen Temperaturen - solange kein nennenswerter Beitrag zur Elektronendichte vom Valenzband kommt. Ihr asymptotisches Verhalten ist leicht zu sehen: Wir unterscheiden die Fälle "Kleine" Temperaturen, d.h. EL – Ed » kT ⇒ exp(EL – Ed)/kT » 1 "Mittlere" Temperaturen, d.h. EL – Ed « kT « (EL – EV)/2 ⇒ exp( EL – Ed)/kT ⇒ 0 Damit erhalten wir EL – Ed Kleine Temperaturen nL (kleineT) = (ND · NLeff )½ · exp – 2kT Mittlere Temperaturen nL (mittlereT) = ND Wir erhalten also für kleine Temperaturen dasselbe Ergebnis wie zuvor, und für mittlere Temperaturen eine ungeheuer wichtige, weil so einfache Näherung: nL (mittlereT) ≈ ND nV (mittlereT) ≈ NA Dabei ist definiert, was "mittlere" Temperaturen bedeutet: T ist unterhalb des massiven Einsatzes der intrinsischen Leitfähigkeit, aber so hoch, daß praktisch alle Dotieratome ionisiert sind. Für Si ist diese mittlerer Temperatur so ungefähr Raumtemperatur (290 K) ± 100 K. Das ist toll!. Denn damit können wir die Leitfähigkeit von Si im interessierenden Temperaturbereich durch Dotierung einstellen und ziemlich temperaturunabhängig halten. Und das sind schlicht und einfach die absoluten Grundvoraussetzungen jeder Halbleitertechnologie. Bei anderen Halbleitern können wir bereits hier in Probleme laufen. Germanium, z.B. hat eine kleinere Bandlücke als Si und wird schon bei niedrigen Temperaturen intrinsisch, d.h. zu leitfähig. Obwohl der Beginn der Halbleitertechnik noch von Ge dominiert war (im wesentlichen die 60er Jahre des 20. Jahrhunderts), hat sich Si, obwohl viel schwieriger herzustellen, doch bald durchgesetzt. Bei Diamant, im anderen Extrem, ist die Bandlücke sehr groß; es ist undotiert ein guter Isolator. Leider sind brauchbare Dotierniveaus soweit von den Bandkanten entfernt, daß wir bei Raumtemperaur noch im Tieftemperaturbereich liegen, und die Dotierung nicht richtig wirksam wird. das gilt im großen Ganzen auch für alle anderen Isolatoren. Es gibt noch mehr Näherungsformeln für die Ladungsträgerdichten in dotierten Halbleitern (darunter auch ziemlich falsche). Hier schauen wir uns abschließend nur die prinzipielle Darstellung an; wobei die Zahlenwerte nur der Groborientierung dienen. Im Link sind einige graphische Darstellungen mit Erläuterungen zu besichtigen. MaWi 2 Skript - Page 190 Das ist genau das, was der JAVA-Modul uns auch ausrechnet - nur daß dort an den Achsen Zahlen stehen. Hier ist ein Beispiel für Dichten von ND = (10 15 bzw. 1017) cm –3 in Si: Damit können wir uns dem wirklich wichtigen Parameter zuwenden, der spezifischen Leitfähigkeit. Fragebogen / Questionaire Multiple Choice Fragen zu 5.2.4 MaWi 2 Skript - Page 191 5.2.5 Zusammenfassung Kapitel 5.2 Dotierung Alle Kristallgitterdefekte haben elektronische Zustände, die lokal von denen des Wirtskristalls verschieden sind. Diese Zustände können auch in der Bandlücke liegen; Elektronen können dann am Ort des Defekts Gesamtenergien haben, die sonst nicht erlaubt sind. Die elektronischen Effekte von substitutionellen Fremdatomen der Gruppe III oder VI sind besonders leicht zu verstehen: Gruppe V Atome (gebräuchlich sind P und As in Si) haben ein Elektron zuviel, das nach Absättigung der Bindungen mit den 4 Si Nachbarn nur noch ganz lose an das Gruppe V Atom gebunden ist. Eine geringe Energiezufuhr wird ausreichen, um das 5. Elektron zu lösen = ins Leitungsband zu transferieren. Damit ist einsichtig, daß Gruppe V Atome ein Energieniveau dicht unterhalb der Leitungsbandkante einführen, das entweder mit einem Elektron besetzt ist (das Gruppe V Atom ist dann elektrisch neutral) oder, nach Abgang des Elektrons ins Leitungsband, nicht besetzt ist (dann ist das Gruppe V Atom einfache positiv ionisiert). Gruppe III Atomen (gebräuchlich in Si ist nur B) fehlt ein Elektron, sie werden unvermeidlich ein Loch im Valenzband "mitbringen". Die Konzentration von Löchern und Elektronen im Leitungs- bzw. Valenzband berechnet sich nach wie vor mit unserer Hauptformel ∞ nL = ⌠ ⌡ EL – EF ≈ NLeff . exp – D(E) · f(E, EF ,T) · dE EL = B(EL – EF, T) kT EL nV = NLeff ⌠ D(E) · [1 – f(ED, EF, T)] · dE ⌡ EF – EV ≈ NVeff . exp – –∞ = NVeff B(EF – EV, T) kT , wobei B(EL – EF, T) die Bolzmann-Verteilung ist Der einzige Unterschied zum intrinsischen Fall ist: Wir haben jetzt Zustände für Elektronen in der Bandlücke; einfach gegeben durch die Konzentraion der Dotieratome und ihre energetische Lage in der Bandlücke. Die Lage der Fermienergie in der Bandlücke ändert sich. MaWi 2 Skript - Page 192 Lage der Fermienergie Die Fermienergie ergibt sich im Prinzip einfach durch eine Gleichung mit der einzigen Unbekannten Fermienergie weil (globale) Ladungsneutralität immer eingehalten werden muß. Die zu betrachtenden Ladungen sind die negativ geladenen (beweglichen) Elektronen im Leitungsband, die positiv geladenen (beweglichen) Löcher im Valenzband, die positiv geladenen (ortsfesten) Donatoratome, die ihr Elektron ins Leitungsband gegeben haben, und die negative geladenen (ortsfesten) Akzeptoratome, die ein Elektron aus dem Valenzband aufgenommen haben (und damit ein Loch ins Valenzband gegeben habe). In Formeln: Negativ Positiv Art Formel Art Formel Elektronen in L nL = NeffL ·B(EL – EF, T) Löcher in V nV = NeffV · B(EF – EV, T) negativ ionisierte Akzeptoren N–A = NAL · f(EA , EF , T) positiv ionisierte Donatoren N+D = ND · {1 – f(ED , EF , T)} Die resultierende transzendente Gleichung für EF ist aber analytisch nicht lösbar; über Näherungen oder Numerik ergibt sich aber das grundsätzliche Verhalten: Bei kleinen/mittleren Temperaturen liegt die Fermieergie im Bereich des dominierenden Dotierstoffniveaus; mit zunehmender Temperatur wandert es in Richtung Bandmitte. Quantitativ sieht das (für Donatoren) etwa so aus: Definitionen; Massenwirkungsgesetz und Näherungen Dotierte Halbleiter enthalten grob verschiedene Elektronen- und Löcherkonzentrationen; die dominierende Ladungsträgersorte heißt Majoritäts(ladungsträger), die andere entsprechend Minoritäts(ladungsträger). Halbleiter mit mehr Elektronen als Löcher heißen n-Typ, n-dotiert oder n-leitend Halbleiter mit mehr Löcher als Elektronen heißen p-Typ, p-dotiert oder p-leitend Wir können verschiedene Näherungen für die Konzentrationen der Ladungsträger verwenden: Die Konzentration der Majoritäten ist im "mittleren" Temperaturbereich (alle Dotieratome ionisiert, aber noch keine nenneswerte Generation ausdem Valenzband) gleich der Konzentration der Dotieratome; damit ist die Lage extrem einfach geworden. Die Kozentration der Minoritäten ergibt sich immer aus dem Massenwirkungsgesetz: nL · nV = ni2 ni2 nmin = NDot Es gibt eine Reihe von Näherungsformeln für die Majoritätskonzentration (Aufpassen; oft falsch), die beste ist MaWi 2 Skript - Page 193 2NDot nMaj (mittlereT) = 1+ 4 · NDot 1 + (–) EL (V)– ED (A) · exp NeffL, V MaWi 2 Skript - Page 194 kT 1/2 5.2.6 Merkpunkte Kapitel 5.2 Dotieren: gezieltes Einbringen von Defekten, die in der Bandlücken Zustände für Elektronen nahe den Bandkanten erzeugen. ∞ nL = EL – EF ≈ NLeff . exp – D(E) · f(E, EF ,T) · dE kT EL Donatoren: leichte Elektronenabgabe ins Leitungsband (P und As für Si) Akzeptoren: leichte Elektronenaufnahme (= Löcherabgabe ans) aus dem Valenzband (B in Si) ⌠ ⌡ EV nV = ⌠ D(E) · [1 – f(ED, EF, T)] · dE ⌡ EF – EV ≈ NVeff . exp – kT –∞ Ladungsträgerdichten aus "Master"formel; aber jetzt mit Zuständen im Bandgap (Zustandsdichte = Dotierstoffdichte bei E-Niveau des Dotierstoffs) und verschobener Fermienergie Fermienergie aus Ladungsneutralität. Resultierede transzendente Gleichung nicht analytisch lösbar. Näherungen sind einfach und ergeben: EF ungfähr beim Dotierstoffniveau für kleine und mittlere Temperaturen. EF wandert mit zunehmender Temperatur in Richtung Bandmitte. Mit Dotierung werden Majoritäten und Minoritäten erzeugt, die Halbleiter werden n- oder p-leitend. Es gilt immer das Massenwirkungsgesetz; Kenntnis einer Konzentration ermöglicht Berechnung der jeweils anderen. Art Formel Elektronen in L nL = NeffL · f(EL , EF , T) negativ ionisierte Akzeptoren N+A = NA · f(EA , EF , T) Löcher in V nV = NeffV · {1 – f(EV , EF , T)} positiv ionisierte Donatoren N–D = ND · {1 – f(ED , EF , T)} nL · nV Graphik = ni2 ni2 nmin = NDot Bei mitttleren Temperaturen ( ≈ RT bei Si) ist die Majoritätskonzentration in etwa gleich der Dotierstoffkonzentration; damit ergeben sich besonders einfache Verhältnisse. MaWi 2 Skript - Page 195 5.3 Vom idealen zum realen Halbleiter 5.3.1 Beweglichkeit und Leitfähigkeit bei dotierten Halbleitern Beweglichkeit Um von der Ladungsträgerdichte n zur Leitfähigkeit σ = q · n · µ zu kommen, brauchen wir noch die Beweglichkeit µ der Ladungsträger. Die Beweglichkeit µ wurde schon mehrfach angesprochen; wir hatten: 1. Die Definition von µ. 2. Den Zusammenhang zwischen µ und fundamentalen Größen wie Driftgeschwindigkeit, mittlere freie Weglänge oder Zeit zwischen zwei Stößen. 3. Die Berechnung von µ für mehrere gleichzeitig vorliegende Stoßprozesse. 4. Die experimentelle Bestimmung von µ mit Hilfe des Hall Effekts. 5. Den Zusammenhang zwischen maximaler Frequenz eines Bauelementes und µ. Ebenfalls angesprochen wurde, daß die Beweglichkeit ein fundamentaler Materialparameter ist, und nicht nur in Formeln für die Leitfähigkeit vorkommt. Außerdem haben wir bereits bedauert, daß wir hier nicht in der Lage sind, Formeln für Beweglichkeiten zu finden. Dies alles, plus einige weiterführende Betrachtungen sind in einem eigenen Modul noch einmal zusammengestellt. Wie auch immer, hier müssen wir nur zwei Dinge betrachten: 1. Die Beweglichkeit nimmt mit zunehmender Temperatur ab. Das haben wir bereits für den intrinsischen Fall betrachtet, und daran wird sich auch bei dotierten Halbleitern nicht viel ändern können. 2. Die Beweglichkeit wird durch Stöße mit Fremdatomen verringert. Dotieratome sind Fremdatome, wir müssen uns also fragen ob Dotierung die Beweglichkeit beeinflußt. Die Antwort auf die Frage in Punkt 2 ist: Ja!. Die Beweglichkeit wird durch Dotieren herabgesetzt (das ist schlecht, da wir damit offenbar auch die Grenzfrequenz eines Bauelementes herabsetzen). Aber gleichzeitig wird die Temperaturabhängigkeit der Beweglichkeit verringert, da Stöße mit Phononen mit zunehmender Dotierkonzentration eine immer kleinere Rolle spielen. Was wir insgesamt erhalten, sieht typischerweise so aus: Die Beweglichkeit wird durch Dotieren bei Raumtemperatur im Extremfall um etwa eine Größenordnung reduziert; dabei ist die Abnahme von µ erst bei höheren Dotierstoffkonzentrationen (> 1017 cm –3) richtig spürbar. Die Kurven für Elektronen sind ähnlich, aber im Absolutwert kann schon mal ein Faktor 10 auftauchen - je nach Halbleiter und detaillierter Bandstruktur. Die Beweglichkeit der Elektronen im Silizium ist beispielsweise ungefähr einen Faktor 3 größer als die der Löcher. MaWi 2 Skript - Page 196 Leitfähigkeit Nehmen wir die ungefähr lineare Abhängigkeit der Ladungsträgerdichte, und die vergleichweise kleine, aber nichtlineare Abhängigkeit der Beweglichkeit von der Dotierstoffkonzentration und multiplizieren beides miteinander, erhalten wir die spezifische Leitfähigkeit σ oder den spezifischen Widerstand ρ = 1/σ als Funktion der Dotierstoffkonzentration. Für Silizium sieht das dann so aus: Das sind so mit die wichtigsten Kurven der modernen Menschheit. Auf ihnen beruht die komplette Silizium Technologie. Jede Produktherstellung in der Si Technologie beginnt mit einer sorgfältigen Überlegung, mit welchem Dotiertyp und welcher Grunddotierung man startet (i.d.R. so im Bereich (10 - 0,5) Ωcm) Bei der Herstellung eines Chips, also einer integrierten Schaltung, wird dann lokal noch bis zu 10 mal anders dotiert - darauf beruht die Funktion der Bauemente. Die Funktion des Systems, nur um das hier gleich mal zu unterscheiden, beruht dann darauf, wie man die Bauelemente miteinander verbindet. Das findet dann im wesentlichen nicht mehr im Si statt, sondern auf dem Si. Fragebogen / Questionaire Multiple Choice Fragen zu 5.3.1 MaWi 2 Skript - Page 197 5.3.2 Generation, Rekombination, Lebensdauer und Diffusionslänge Generation- und Rekombinationsrate Als wir uns mit Band-Band-Übergängen beschäftigt haben, haben wir bereits den Begriff der Ladungsträgerlebensdauer kennengelernt. Dazu haben wir den Elementarprozeß der Erzeugung oder Generation eines Elektron-Lochpaares, der anschließenden Thermalisierung und Rekombination angeschaut. Diese beiden Begriffe sind neben der Dotierung der Schlüssel zur Halbleiterphysik und -technik. Es schadet nicht, an dieser Stelle die beiden früheren Unterkapitel noch einmal durchzulesen. Wir betrachten jetzt aber dotierte Halbleiter, d.h. wir haben Minoritäts- und Majoritätsladungsträger mit sehr verschiedenen Konzentrationen, und wir müssen die Stichworte "Generation", "Rekombination", "Lebensdauer" und "Diffusionslänge" unter diesem Aspekt noch einmal betrachten. Es lohnt sich, für diesen Fall noch einmal den gesamten Zyklus von der Geburt bis zum Tod eines Ladungsträgers zu betrachten. Wir führen dazu eine Bildbetrachtung durch und interpretieren das Banddiagramm des Lebenslaufs einer Minorität in einem p-Typ Halbleiter. Aus einer eingehenden Kontemplation dieses Bildes lassen sich folgende Schlußfolgerungen ziehen: 1. Es enthält redundante Information. Sowohl die Lage der Fermienergie, als auch die symbolisch eingezeichneten Majoritätsladungsträger "Löcher", als auch die Beschriftung sagen alle dasselbe: Wir haben einen p-Typ Halbleiter. 2. Das Verhältnis Majoritäten : Minoritäten ist ungefähr 4 : 1. Damit hätten wir nur eine sehr schwache Dotierung. Es liegt damit nahe, daß der Künstler die Zahl der Löcher und Elektronen symbolisch meint. Denn ein realistisches Verhältnis von z.B. 1 000 000 : 1 ist in dieser Kunstform offenbar nicht darstellbar. 3. Im linken Bereich ist ein Generationsereignis zu sehen. Während der neu erzeugte Minoritätsladungsträger - das Elektron - eindeutig zu identifizieren ist, bleibt der zugehörige Majoritätsladungsträger "Loch" anonym, er ist in der Masse der anderen Löcher nicht zu identifizieren. Der Künstler will wohl einen Hinweis darauf geben, daß sich bei einer leichten Abweichung vom Gleichgewicht bei den Majoritäten so gut wie nichts ändert, während bei den Minoritäten die Änderungen deutlich spürbar sind. 4. Im Zentrum des Bildes folgen wir dem Schicksal des frisch generierten Minoritätsladungsträger. Nachdem er sich eine Länge L von seinem Geburtsort entfernt hat, geht er durch Rekombination wieder ins Nirwana ein - das Elektron ist (im Leitungsband) spurlos weg. Wiederum fehlt jeder Hinweis auf den Rekombinationspartner aus der Masse der Löcher. 5. Es läßt sich noch ein letzter Hinweis auf die Vorgänge in und zwischen den Bändern finden: Alle Minoritäten (und auch die Majoritäten) sind sich völlig gleich - wir sehen rote Kreise, die für sich genommen völlig ununterscheidbar sind. Soviel Information steckt in einem simplen Banddiagramm - man muß sie nur zu interpretieren wissen! Nüchtern betrachtet nehmen wir jetzt folgende Punkte zur Kenntnis: 1. Ganz offensichtlich ist das, was sich bei den Minoritäten abspielt, viel wichtiger als die Vorgänge bei den Majoritäten. Denn jede Änderung bei Ladungsträgerkonzentrationen bewirkt bei den Minoritäten immer sehr viel größere Abweichungen vom Gleichgewicht, als bei den Majoritäten. Und es sind immer die Abweichung vom Gleichgewicht, die Reaktionen aller Art antreiben! 2. Obwohl wir bisher immer nur einen Generationsvorgang mit anschließender Rekombination betrachtet haben, muß uns doch klar sein, daß wenn ein wie auch immer generiertes Elektron nach einer Zeit τ rekombiniert, das dann notwendigerweise für alle Elektronen gelten muß! Denn alle Elektronen sind gleich und keine sind gleicher! Damit würden praktisch alle Minoritätsladungsträger nach ein paar Lebensdauern τ verschwunden sein (denn die "Abbaurate" folgt natürlich dem allgemeinen Gesetz zum Zerfall angeregter Zustände). Die Rekombinationsrate R, d.h. die Zahl der pro Sekunde (und cm –3) rekombinierenden Minoritätsladungsträger, ist damit einfach MaWi 2 Skript - Page 198 nMin R = τ Da aber im Gleichgewicht die Konzentration aller Ladungsträger konstant sein muß, können wir eine erste, sehr wichtige Schlußfolgerung ziehen: Im Gleichgewicht muß die Generationsrate G, d.h. die Zahl der pro Sekunde (und cm –3) generierten Minoritätsladungsträger genau gleich groß sein wie die Rekombinationsrate , d.h. nMin GGG = RGG = τ Das läßt sich leicht verstehen: Wenn von einem Bankkonto ein bestimmter Betrag pro Zeiteinheit abgehoben wird z.B 1 € pro Tag oder 1 000 000 € pro Tag - dann wird der Kontostand (im Mittel) nur dann konstant bleiben (im Mittel), wenn genausoviel Geld pro Zeiteinheit überwiesen wird. Das hatten wir übrigens schon mal in einem anderen Zusammenhang! Das Beispiel paßt genau! Und es sagt uns darüberhinaus ganz plastisch, daß aus der Größe der Ab- und Zuflüsse kein wie auch immer gearteter Schluß auf den Kontostand gezogen werden kann, wie auch umgekehrt ein wie auch immer gearteter unveränderter Kontostand nichts über die Höhe der Zu- und Abflüsse aussagt. Damit haben wir im (nur so rumliegenden) Halbleiter nicht nur ein Gleichgewicht, wir haben immer ein dynamisches Gleichgewicht. Jeder Minoritätsladungsträger wird irgendwann (und irgendwo) generiert, läuft (im Mittel) eine Diffusionslänge durch den Kristall, und verschwindet dann wieder durch Rekombination. Das gilt natürlich im Prinzip auch für die Majoritätsladungsträger. Von denen ist aber die weitaus überwiegende Anzahl im (dynamischen) Gleichgewicht mit den Dotieratomen und die paar, die sich mit Minoritäten abgeben, spielen für die Gesamtanzahl keine Rolle. Lebensdauer, Diffusionslänge und Beweglichkeit Zum obigen Thema haben wir schon früher (und einige Zeilen weiter oben) schon viel gelernt. Wir wiederholen obige Aussage mal etwas ausführlicher: Jeder Minoritätsladungsträger wird generiert, und läuft dann (im Mittel) eine Diffusionslänge L durch den Kristall. Dazu braucht er (im Mittel) die Zeit τ, die wir ab jetzt Minoritätsladungsträgerlebensdauer oder kurz Lebensdauer nennen, und verschwindet dann wieder durch Rekombination. Der Zusammenhang zwischen Lebensdauer und Diffusionslänge wird dabeiwie bei jedem "Random walk" durch die folgende Beziehung gegeben: L = (D · τ)½ D ist dabei der Diffusionskoeffizient der Elektronen oder Löcher. Den Diffusionskoeffizienten der Elektronen oder Löcher haben wir schon mal kurz kennengelernt, er wurde als "formal immer definierbar" bezeichnet. Aber das ist nun doch ein wenig unbefriedigend. Einge Fragen drängen sich auf: Wieso diffundieren die Elektronen oder Löcher jetzt? Bisher haben wir ihre Bewegung im Kristall ganz anders, nämlich auf zwei Weisen betrachtet: 1. Elektronen wurden durch ebene, stehende, oder sonstige Wellen beschrieben. Dabei haben wir nur Aufenthaltswahrscheinlichkeiten betrachtet; eine Bewegung war allenfalls indirekt über den mit dem Wellenvektor k verknüpften Impuls vorhanden. "Random walk" kam gar nicht vor. 2. Elektronen wurden als Teilchen betrachtet, die wegen des Pauli Prinzips mit mit relativ hoher Geschwindigkeit durch den Kristall rasen müssen. "Random walk" kam indirekt vor: Bei jedem "random" Stoß, wechseln sie "random" Richtung und Geschwindigkeit. Die entscheidende Größe war aber die Driftgeschwindigkeit vD, die wiederum mit der treibenden Kraft "elektrisches Feld" E über die Materialkonstante Beweglichkeit μ verknüpft war vD = μ · E MaWi 2 Skript - Page 199 Die Beweglichkeit war eine Materialkonstante, die pauschal die im jeweiligen Material vorliegende Situation bezüglich der Stöße von Elektronen mit z.B. Defekten und Phononen wiedergab. Mehr zu diesem durchaus nicht trivialem Thema im Link. Die Diffusionkonstante, wie wir sie bei der Beschreibung der Diffusion durch die Fickschen Gesetze kennengelernt haben, macht aber im Grunde dasselbe für irgendein Teilchen, das sich in einem Medium bewegt und als treibende Kraft einen Konzentrationsgradienten sieht. Es bedurfte des Genies von Albert Einstein, um zu erkennen, daß ein Diffusionskoeffizient oder eine Beweglichkeit im Grunde dasselbe Elementarphänomen beschreiben: Sie sind einfach Zahlen, in denen alle Einflüsse statistisch zusammengefaßt sind, die ein Teilchen spürt, das unter der Wirkung irgendeiner treibenden Kraft in einem Material herumgeschubst wird. Einstein (und Nernst, und Smoluchowski) leitete dann mit einigem, aber überschaubarem Aufwand folgende einfache Beziehung ab (bekannt als Einstein Beziehung, Einstein-Smoluchowski Beziehung, oder auch Einstein-Nernst Beziehung) kT D = ·µ e Abgesehen von dem Faktor kT/e sind Diffusionskoeffizient und Beweglichkeit also identisch. Wer sich die Herleitung anschauen möchte, kann das über den Link tun. Da wir µ kennen, kennen wir jetzt auch D. Damit können wir bei Kenntnis von L oder τ die jeweils andere Größe berechnen. Was noch bleibt, ist eine etwas quantitativere Vorstellung davon zu bekommen, wie groß L oder τ in einem gegebenen Material sein wird. Unsere Grunderkenntnis von Kapitel 4 gilt natürlich immer noch: In direkten Halbleitern ist τ klein (Größenordnung ns); in indirekten Halbleitern ist sie groß (Größenordnung ms). Wie groß oder klein genau? Das ist eine der "guten" Fragen, die nicht so leicht zu beantworten ist. Wer sich traut schaut via Link in eine Vorlesung für Fortgeschrittene, der Rest (und die Mutigen) merkt sich nur einen einzigen Zusammenhang: Die Lebensdauer in indirekten Halbleitern, inbesondere also in Silizium, ist extrem sensitiv auf Kristallgitterdefekte, insbesondere atomare Fehlstellen. Wir schauen uns das an einem Beispiel an Die Lebensdauer verringert sich linear mit der Goldkonzentration. Selbst bei der kleinen Konzentration von 1014 cm –3 (≈ 2 ppb) beträgt sie nur 1 µs. Bis zu einer Lebendauer von 1 ms (das war die Behauptung) fehlen noch drei Größenordnungen - die Goldkonzentration müßte also bei 2 ppt liegen, um die Millisekunde zu erreichen. So ist es auch! "Life time killer" wie Gold (und viele andere metallische Fremdatome, am schlimmsten Fe, Ni, Cu) sind allesamt "tiefe Störstellen" mit Energieniveaus für Elektronen, die tief in der Bandlücke liegen. Der Halbleitertechnologe fürchtet sie wie der Teufel das Weihwasser. An dieser Stelle liegt eine der Wurzeln der extremen Reinheits- und Perfektionsanforderungen der Si-Technologie. Kristalle verschmutzen gern (bei höherer Temperatur). Der Kampf für Reinheit ist deshalb immer ein Kampf gegen die Entropie - und das kostet Energie (und vor allem viel Geld). Hier steckt auch das Grundproblem der Si-Solarik: Gute Solarzellen kann man nur aus Si mit möglichst großer Diffusionslänge und damit Lebensdauer machen. Und diese Sorte Si kann einfach nicht billig sein! Fragebogen / Questionaire Multiple Choice Fragen zu 5.3.2 MaWi 2 Skript - Page 200 5.3.3 Zusammenfassung Kapitel 5.3 Die Beweglichkeit der Ladungsträger ist ein Maß für die Stöße mit Defekten aller Art (inkl. "Phononen", den Quasipartikeln der quantisierten thermischen Vibrationen). Dotieratome sind Defekte, die Beweglichkeit wird also mit steigender Dotierstoffkonzentration abnehmen (das ist schlecht). Gleichzeitig wird aber die Temperaturabhängigkeit schwächer (das ist gut). Die Leitfähigkeit σ = q · n · µ ist damit fast nur noch von der (Majoritäts)ladungsträgerdichte abhängig; es ergeben sich für Si die folgenden (für die Menschheit sehr wichtigen) Kurven für den spez. Widerstand ρ = 1/σ. Bei der Betrachtung von Generations und Rekombinationsprozessen zwischen Valenz- und Leitungsband sind jetzt die Minoritätsladungsträger viel interessanter als die Majoritäten, da bei letzeren die Konzentrationsänderungen durch diese Prozesse viel kleiner sind. Im Gleichgewicht gilt nach wie vor nMin GGG = RGG = τ Während ihrer Lebensdauer τ entfernen sich die Minoritäten im Mittel um die Diffusionslänge L von ihrem "Geburtsplatz", es gilt wie bei jedem "random walk" L = (D · τ)½ Die in dieser Gleichung formal auftauchende Diffusionskonstante D spiegelt wie die Beweglichkeit µ die Stoßprozesse wieder, denn ohne viele (statistische) Stöße gibt es keinen "random walk". Beweglichkeit und Diffusionkonstante müssen deshalb korreliert sein, es gilt die Einstein-Smoluchowski Beziehung kT D = ·µ e Lebensdauern, und damit Diffusionslängen, sind in indirekten Halbleitern sehr stark von Defekten bestimmt und in vielen Größenordnungen variierbar. Konzentrationen von atomaren Fehlstellen im ppt (= 10–12) Bereich können bereits die Lebensdauer von Halbleiter (i.d.R. Si) "versauen", d.h. so stark reduzieren, dass die Bauelementfunktion leidet. MaWi 2 Skript - Page 201 5.3.4 Merkpunkte Kapitel 5.3 Beweglichkeit µ: Wird durch Dotierung reduziert. Spez. Leitfähigkeit bzw. Widerstand: Im wesentlichen durch Dotierstoffkonzentration bestimmt. Generation und Rekombination zwischen den Bändern: Bei Minoritäten sehr viel stärker "fühlbar" als bei Majoritäten nMin GGG = RGG = τ Nach wie vor Gleichheit der Raten im Gleichgewicht. Lebensdauer τ (der Minoritäten) und Diffusionslänge L weiterhin direkt gekoppelt. L = (D · τ)½ kT Zwischen Beweglichkeit und Diffusionskonstante D existiert immer die einfache EinsteinSmoluchowski Beziehung MaWi 2 Skript - Page 202 D = ·µ e 5.4 Übersicht 5.4.1 Vergleich idealer, dotiert-idealer und realer Halbleiter In diesem Unterkapitel wollen wir noch einmal die wichtigsten Formeln und Begriffe zusammenstellen und insbesondere die Unterschiede zwischen idealen, dotiert-idealen und realen Halbleitern herausarbeiten. Wir beginnen mit dem idealen Halbleiter Idealer (intrinsischer) Halbleiter Der ideale, unendlich ausgedehnte Halbleiter mit keinen wie auch immer gearteten Defekten ist natürlich immer auch ein intrinsischer Halbleiter. Er hat folgende Grundeigenschaften: Größe der Bandlücke EG Gegeben durch Material und Gittertyp. Nicht leicht berechenbar. Wissen muß man: EG (Si) ≈ 1,1 eV Elektronendichte nL im Leitungsband und Löcherdichte nV im Valenzband. In voller Strenge gilt ∞ ⌠ ⌡ nL(T) = D(E) · f(E,T) · dE = ni EL EV ⌠ ⌡ nV(T) = D(E) · [1 – f(E,T)] · dE = ni –∞ Dabei ist ni die intrinsische Ladungsträgerkonzentration; sie ist eine (stark temperaturabhängige) Materialkonstante. In der Praxis gilt EL – EF nL(T) = ni(T) = NLeff · exp – kT EF – EV nV(T) = ni(T) = NVeff · exp – kT Die effektiven Zustandsdichten Neff sind dabei experimentell ermittelte Größen (mit oder ohne den T 3/2 Anteil). Die Fermienergie EF ergibt sich aus der Neutralitätsbedingung; sie liegt ungefähr in der Mitte der Bandlücke EL + EV EF(intrinsisch) = kT 2 EL + EV ln (NV/NL) ≈ + 2 Massenwirkungsgesetz Aus nV(T) · nL(T) folgt unabhängig von der Lage der Fermienergie immer nV · nL = (ni)2 Damit ergibt sich eine einfache Bestimmungsgleichung für ni MaWi 2 Skript - Page 203 2 ni = (ni2)½ = NeffL · NeffV 1/2 EL – EV · exp – 2kT Lebensdauer τ und Diffusionslänge L Die Lebensdauer ist hoch in indirekten Halbleitern, z.B. Si (Größenordnung ms) und klein in direkten Halbleitern, z.B. GaAs (Größenordnung ns). Sie ist nicht leicht zu berechnen. Die zugehörige Diffusionlänge L ist (für "random walk" immer) gegeben durch L = (D · τ)½ kT D = ·µ e Dabei verknüpft die zweite Gleichung, die sog. Einstein Beziehung, den Diffusionkoeffizienten D mit der Beweglichkeit µ. Die Beweglichkeit µ ist ein Maß für die Größe der erreichbaren Driftgeschwindigkeit eines Ladungsträgerensembles unter der Wirkung einer treibenden Kraft (= elektrische Feldstärke). Sie subsummiert die Wirkung von Stößen der Ladungsträger mit Gitterschwingungen (= Phononen) oder anderen Defekten. Die Beweglichkeit µ oder der Diffusionskoeffizient D sind Materialkonstanten; sie sind nicht leicht zu berechnen. Generation und Rekombination, Ladungsträger rekombinieren nach Verstreichen ihrer Lebensdauer τ. Die Rekombinationsrate R ist gegeben durch ni R = τ Aus der Bedingung für (dynamisches) Gleichgewicht folgt, daß die Generationsrate G gleichgroß sein muß. ni G = R = τ MaWi 2 Skript - Page 204 Dotierter idealer Halbleiter Der ideale, dotierte Halbleiter mit keinen wie auch immer gearteten Defekten außer den Dotieratomen hat folgende Eigenschaften: Größe der Bandlücke EG Wie der ideale Halbleiter. Elektronendichte nL im Leitungsband und Löcherdichte nV im Valenzband. In voller Strenge gilt immer noch die alte Gleichung - nur die Fermienenergie hat jetzt einen anderen Wert. Es lassen sich drei sinnvolle Näherungsgleichungen angeben 1. Hohe Temperaturen: Es ist alles wie im intrinsischen Fall 2. Mittlere und tiefe Temperaturen. Es gilt 2ND nL (mittlereT) = 1+ 4 · ND 1 + EL – Ed · exp NLeff kT 1/2 3. Mittlere Temperaturen in vielen Fällen; insbesondere Si um Raumtemperatur. Wir erhalten eine extrem einfache Gleichung für beide Ladungsträgerarten; für die 2. Gleichung wird das Massenwirkungsgesetz verwendet nMaj (mittlereT) ≈ ND (ni)2 nMin (mittlereT) ≈ ND Da wir uns jetzt nur noch mit Si bei Raumtemperatur beschäftigen wollen, unterstellen wir ab jetzt immer diesen Fall. Die Fermienergie EF ergibt sich nach wie vor aus der Neutralitätsbedingung, aber jetzt müssen auch die ionisierten Dotieratome berücksichtigt werden. Die entsprechende Bilanzgleichung ist zwar einfach aufzustellen, aber als transzendente Gleichung nicht analytisch lösbar. Numerische Lösungen sind aber nicht allzu schwer. Das Massenwirkungsgesetz gilt immer; es erlaubt, wie oben schon gezeigt, aus der Kenntnis der Dotierstoffkonzentration beide Ladungsträgerkonzentrationen leicht zu berechnen Lebensdauer τ und Diffusionslänge L Sowohl L und dann automatisch auch τ sind etwas kleiner als im intrinsischen Fall, da der Kristall nicht mehr absolut defektfrei ist. Die (ionisierten) Dotieratome wirken als Streuzentren für die Elektronen, damit sind L, τ und auch µ etwas reduziert. Für nicht zu große Dotieratomkonzentrationen ist das aber kein sehr großer Effekt. Generation und Rekombination Nach wie vor gilt die Bedingung für (dynamisches) Gleichgewicht: Generationsrate G und Rekombinationsrate R sind gleichgroß. MaWi 2 Skript - Page 205 Dotierter realer Halbleiter Reale dotierte Halbleiter sind Halbleiter die außer den Dotieratomen noch weitere Kristallgitterdefekte haben: Die Oberfläche, Versetzungen, Korngrenzen, Ausscheidungen, atomare Fehlstellen aller Arten. Alles, was wir unter Kristallgitterdefekten behandelt haben, findet sich in realen Halbleitern wieder - und dann gibt es noch einige spezielle Defekte. Das führt im wesentlichen zu drei Unterschieden gegenüber idealen dotierten Halbleitern: 1. Die Defekte haben in der Regel auch Zustände in der Bandlücke - und das bedeutet, daß sie als Donatoren oder Akzeptoren wirken können. Die Konzentration der Ladungsträger wird dann im Extremfall durch die Defekte bestimmt und hat mit der Konzentration der gezielt eingebrachten Dotieratome nichts mehr zu tun. Das Material ist immun gegen Dotierung und nutzlos. Das ist leider die traurige Wahrheit für die weitaus überwiegende Mehrheit der bekannten Halbleiter! Denn es gibt nicht nur die paar Halbleiter, die wir alle nutzen (und hoffentlich kennen), im wesentlichen Si, Ge, GaAs, GaP, InP, SiC, GaN, sondern es gibt sehr viel mehr - der Link zeigt einige Beispiele aus der Klasse der binären und ternären Verbindungen. Zur Zeit gibt es jedoch nur die oben gezeigte kleine Zahl an Halbleitermaterialien, die so perfekt hergestellt werden können, daß die noch vorhandenen Defekte eine gezielte Dotierung nicht unmöglich machen. Dort stoßen wir auf den zweiten Effekt der noch vorhanden Defekte: 2. Die Defekte reduzieren die Lebensdauer τ (und damit automatisch auch die Diffusionslänge L) der indirekten Halbleitern (sie tun das auch bei direkten Halbleitern, aber da ist der Effekt nicht so merkbar). Das ist fast immer unerwünscht (obwohl es Ausnahmen gibt). Das Problem liegt darin, daß schon kleinste Konzentrationen an bestimmten Fremdatomen deutlich spürbar werden. Das kann dann nicht nur der Grund dafür sein, dass das Baulelement schlicht nicht richtig funktioniert, sondern auch dafür (und das ist viel schimmer) dass es nach zu kurzer Betriebsdauer den Geist aufgibt. 3. Der dritte Punkt soll nur gestreift werden: Zunächst vorhandene und nicht furchtbar störende (kleine) Defekte können während der Prozessierung eines Bauelements miteinander reagieren und zu "großen" prozessinduzierten Defekten heranreifen. Wenn man Pech hat, wird aus einigen ppqt Fe-Atomen im Laufe der Zeit eine z.B. 5 nm "große" FeSi2 Ausscheidung, die im "Gateoxid" eines Transistors sitzt und denselben schlicht umbringt. Device kaputt - wiederum hilft nur äußerste Sauberkeit und Defektfreiheit. MaWi 2 Skript - Page 206 5.4.2 Formeln und Daten im Überblick Formeln Hier jetzt kommentarlos die wichtigsten Formeln Intrinsische Ladungsträgerdichte ni = NeffL · NeffV 1/2 EL – EV · exp – 2kT Massenwirkungsgesetz: nL · nV = (ni)2 Intrinsisch vernachlässigbar 2ND nL (mittlereT) = 1+ Majoritätsladungsträgerkonzentration "Mittlere" Temperaturen Intrinsisch überwiegt Minoritätsladungsträgerkonzentration 4 · ND 1 + EL – Ed · exp NLeff nMaj ≈ NDot nMin = ni kT (ni)2 "Mittlere" Temperaturen nMin ≈ NDot Klein in direkten HL Diffusionslänge: L = (D · τ)2 Groß in indirekten HL = Σ neg. Ladungen NeffV · {1 – f(EV)} + NDV · {1 – f(ED)} = Σ pos. Ladungen NeffL · f(EL) + NA · f(EA) Fermienergie aus Ladungsneutralität: = Wichtige Daten wichtiger Halbleiter MaWi 2 Skript - Page 207 1/2 Eigenschaften (Bestwerte) Si GaAs InP In 0,53Ga0,47As GaP Kristall Dichte [g/cm3] 2,33 5,32 5,49 5,49 Kristall Typ Diamant Zinkblende Zinkblende Zinkblende Gitterkonstante [nm] 0,5431 0,56533 0,5867 0,5867 Zinkblende Elektronische Eigenschaften Energielücke [eV] 1,12 1,42 1,34 0,75 2,26 Typ Indirekt Direkt Direkt Direkt Indirekt NeffL [1018cm–3] 28 (32) 0,47 0,54 0,21 Neff [1018cm–3] 10 (18) 7 2,9 7,4 ni [106 cm–3] 6 600 2,2 5,7 63 000 Beweglichkeit (undotiert) [cm2/Vs] µn 1 500 µh 450 8500 450 5 000 200 14 000 400 Lebensdauer [µs] 0,01 0,005 0,02 2500 MaWi 2 Skript - Page 208 300 150 6 Halbleiterkontakte und Bauelemente 6.1 Bandverbiegung und Raumladungszone 6.1.1 Grundsätzliches 6.1.2 Oberflächenzustände und Bandverbiegung 6.1.3 Bandverbiegung und Raumladungszone 6.1.4 Zusammenfassung Kapitel 6.1 6.1.5 Merkpunkte Kapitel 6.1 6.2 Der pn-Übergang 6.2.1 Grundsätzliches 6.2.2 Ströme im pn-Übergang im Gleichgewicht 6.2.3 Die Kennlinie des pn-Übergangs 6.2.4 Der Beitrag der Raumladungszone zur Kennlinie des pn-Übergangs 6.2.5 Zusammenfassung Kapitel 6.2 6.2.6 Merkpunkte Kapitel 6.2 6.3 Halbleiter-Metall Kontakt 6.3.1 Bandstruktur des Halbleiter-Metall Kontakts 6.3.2 Schottky Kontakte und Ohmsche Kontakte 6.3.3 Zusammenfassung Kapitel 6.3 6.3.4 Merkpunkte Kapitel 6.3 6.4 Einfache Bauelemente 6.4.1 Solarzellen 6.4.2 Bipolare Transistoren 6.4.3 MOS Transistoren 6.4.4 Zusammenfassung Kapitel 6.4 6.4.5 Merkpunkte Kapitel 6.4 MaWi 2 Skript - Page 209 6 Halbleiterkontakte und Bauelemente 6.1 Bandverbiegung und Raumladungszone 6.1.1 Grundsätzliches Der Kontakt als Solcher Es gibt keine Halbleiterbauelemente ohne Halbleiterkontakte! Eine vielleicht verblüffende Behauptung. Aber man muß sich nur klarmachen, daß selbst ein popeliger Photowiderstand - also ein Stück Halbleiter, dessen Widerstand mit zunehmender Beleuchtung zwangsweise kleiner wird - zwei Anschlußdrähte braucht, und Drähte sind normalerweise aus Metall. Wir haben also minimal zwei Kontakte zwischen dem Halbleiter und einer (oder zwei) Metallsorten. Es wäre schon sehr naiv, jetzt anzunehmen, daß der Kontakt Halbleiter-Metall keine besondere Eigenschaften hat, d.h. daß Elektronen ungehindert vom Halbleiter ins Metall strömen können oder umgekehrt. Spätestens wenn man sich überlegt wie das mit Löchern wäre, muß man ins Grübeln kommen. Was ist ein Kontakt? Idealerweise sowas: Wir haben einen geometrisch einfachen und sauber definierten Übergang zwischen einem MaterialI und einem Material II (das im Extremfall des "Gases" auch ein stark verdünntes Gas oder sogar Vakuum sein kann). Wir betrachten weiterhin den strukturellen Defekt Phasengrenze als elektronisch uninteressant, d.h. die strukturellen Einflüße der Phasengrenzenstruktur auf Elektronen und Löcher vernachlässigen wir hier. Das ist, um es deutlich auszudrücken, ein massiver Fehler bei fast allen Kontakten - nur nicht bei denen, die wir hier behandeln. Wir betrachten auch Kontakte, die ein bißchen abstrakt sind, zum Beispiel den "Kontakt" des Volumens eines Halbleiters mit seiner eigenen Oberfläche. Das ist sinnvoll, falls die dünne Schicht der oberflächennahen Atome andere elektronische Eigenschaften hat als das Volumen. Da wir über eine gewisse Allgemeinbildung verfügen, wissen wir natürlich schon, daß die gesamte Festkörperelektronik von Kontakten beherrscht wird (oder von "Übergängen", nur ein anderes Wort für Kontakt). Die zugehörigen Stichworte sind: Der pn-Übergang, der Kontakt zwischen verschiedenen Dotierungstypen desselben Halbleiters: In anderen Worten: Die klassische Diode und, für zwei aufeinanderfolgende pn-Übergänge, der klassische "bipolar" Transistor. Der MOS Kontakt; die Materialfolge Metall - Oxid - Halbleiter (= Semiconductor); zusammen mit pnÜbergängen gibt das einen MOS Transistor, das Arbeitspferd der MOS- und CMOS-Technik, d.h. fast aller integrierten Schaltungen. Der Schottky Kontakt, etwas unbekannter; aber einfach ein Halbleiter-Metallkontakt der Diodeneigenschaften hat. Der Ohmsche Kontakt, normalerweise nicht besonders erwähnt, aber besonders wichtig: Ein MetallHalbleiter Kontakt, der keine Diodeneigenschaften hat, sondern eine lineare Strom-Spannungskurve mit kleiner Steigung, d.h. kleinem Widerstand zeigt. Die Heteroübergänge, also der Kontakt zwischen zwei verschiedenen Halbleitern (mit verschiedener Bandlücke), ohne die es keine vernünftige Optoelektronik gäbe. Wir sehen ganz klar: Wir müssen uns mit Halbleiterkontakten intensiv beschäftigen! Das tun wir Schritt für Schritt - es ist nicht unbedingt einfach! Zum Beispiel wird ein quantitatives Verständnis eines MOS-Transistors hier unsere Kräfte überfordern, aber den pn-Übergang können wir packen - im 4. Schritt. Vorher aber überlegen wir ansatzweise, wie ein realer Kontakt aussehen wird. MaWi 2 Skript - Page 210 Der reale Kontakt Wer sich bis hierher sein (oder ihr) kindliches Gemüt noch bewahrt hat, darf natürlich auch jetzt noch annehmen, daß ein pn-Kontakt hergestellt wird, indem man zum Beispiel ein Stück n-Si nimmt und auf ein Stück p-Si drückt. Das gibt zwar schon einen Kontakt, aber halt keinen pn-Kontakt. Wir müssen hier die Dinge auf atomarer Ebenen betrachten, und ein solcher Kontakt sieht dann so aus ⇒ Wir haben eine wilde Mischung aus allem möglichen - sicherlich erstmal einen Oxid-Oxid-Kontakt, da Si (und auch sonst jeder Halbeiter) an Luft immer mit einer dünnen Oxidschicht bedeckt ist, die ca. 2 nm dick sein wird (damit ist auch der Maßstab in nebenstehendem Bild definiert). Da die Oberflächen nie atomar eben sein werden, berühren sich die Materialien sowieso nur punktuell; in den Zwischenräumen finden wir automatisch die in der Luft herumschwebenden Staubteilchen - und dazu zählen auch die nur sehr schwer faßbaren "Partikel" mit nur einigen nm Größe. Da das Oxid unkontrolliert an Luft entstanden ist, wird noch so mancher Dreck eingebaut sein; atomar oder in Form kleiner Partikel. Auch bei allen anderen Kontaktsorten, die wir in dieser Art herstellen würden, müssen wir ähnliche Probleme erwarten. Wir würden immer einen Halbleiter - Dreck - Material II Kontakt erhalten. Andere Leute jedoch, die uns schon einiges voraus haben und wissen was sie tun, erhalten mit dieser "Technik" manchmal etwas sinnvolles - siehe den Link. Was für elektronische Eigenschaften können wir bei so einem Kontakt erwarten? Richtig! Jedenfalls nichts was man einigermaßen einfach verstehen kann. Ein Gutteil der Halbleitertechnologie beschäftigt sich deshalb damit, wie man vernünftige reale Kontakte herstellt, die dem gewünschten idealen Verhalten wenigstens nahe kommen. Das ist oft ziemlich schwierig oder gar unmöglich, und viele im Prinzip spannende Bauelemente scheitern an der Kontaktproblematik. Wir betrachten jetzt als einziges Beispiel, wie man einen realen pn-Übergang herstellt. Wir starten mit einem Si-Wafer (d.h. einer sehr perfekten einkristallinen Si Scheibe), der eine bestimmte Grunddotierung hat - im Beispiel ist es Bor (B); der Wafer ist also p-leitend. Wir wollen dicht unter der linken Oberfläche einen pn-Übergang realisieren. In der Realität integrierter Schaltungen gilt für die Tiefe xpn des pnÜbergangs beispielsweise xpn<< 1 µm. Da es keine sinnvolle Möglichkeit gibt, das Bor lokal wieder herauszuholen (wer eine weiß, wird ganz schnell sehr reich), haben wir nur eine Option: Wir bringen mehr As (oder P) in den Kristall ein als Boratome vorhanden sind. Als Dotierung wirkt nämlich immer nur (näherungsweise) die Differenz der Donator- und Akzeptorkonzentration. Wer das nicht glaubt, probiert es mit dem JAVA Modul aus. Die As-Atome werden implantiert, d.h. mit einer Ionenkanone (und Energien im Bereich 1 kV - 200 kV) regelrecht in den Kristall hineingeschossen. Dieser Prozeß heißt Ionenimplantation. Dabei wird aber das Kristallgitter kurz- und kleingeschlagen - wenn das Material nicht sogar amorph geworden ist, enthält der Kristall jetzt untolerierbar viele Kristallgitterdefekte. Die müssen "ausgeheilt" werden - durch längeres Erhitzen. Dabei diffundieren aber die As-Atome munter durch die Gegend, das implantierte Konzentrationsprofil wird verschmiert, und der pn-Übergang verschiebt sich zunehmend in die Tiefe. Falls das ziemlich kompliziert klingt, liegt das daran, daß es ziemlich kompliziert ist; außerdem muß man viele Parameter optimieren. Aber so und nicht anders wird's (fast immer) gemacht - mit entsetzlich vielen Varianten und Komplikationen. Wenn alles richtig gemacht wurde, erhalten wir einen pn-Übergang, der sich nahezu exakt so verhalten wird, wie wir es in Kürze theoretisch vorhersagen werden! MaWi 2 Skript - Page 211 Fragebogen / Questionaire Multiple Choice Fragen zu 6.1.1 MaWi 2 Skript - Page 212 6.1.2 Oberflächenzustände und Bandverbiegung Es mag ein bißchen abwegig erscheinen, als ersten Kontakt den etwas abstrakten Übergang Volumen - Oberfläche zu betrachten; aber es ist einer der einfachsten Kontakte, an dem alle wichtigen Begriffe ziemlich einfach erarbeitet werden können. Zunächst müssen wir uns überlegen, warum sich die Eigenschaften von Volumen und Oberfläche überhaupt unterscheiden. Die Eigenschaften des Volumens kennen wir schon - es sind die Eigenschaften des idealen Halbleiters. Was ist an der Oberfläche anders? Was ist überhaupt " die Oberfläche" eines Kristalls genau? Die letzte Frage läßt sich leicht beantworten: Zunächst gibt es an Luft überhaupt keine Halbleiteroberfläche - bestenfalls eine Halbleiter- Halbleiteroxid Grenzfläche. Genau betrachtet meinen wir mit "Oberfläche also die Grenzfläche Halbleiter - Halbleiteroxid. Aber diese Feinheiten sind für diese Betrachtung egal; wir nehmen einfach zur Kenntnis: "Die "Oberfläche" oder Grenzfläche umfaßt alle Atomschichten (von der Oberfläche aus gerechnet), deren Bindungsverhältnisse oder Bindungssymmetrien anders sind als im Volumen. Die erste Atomlage gehört auf jeden Fall dazu, meist aber auch noch die 2. und 3. Lage. Unsere Oberflächen haben also eine Dicke von ca. 0,3 nm - 1 nm. In dieser Oberflächenschicht gibt es nicht abgesättigte Bindungen, Bindungen mit anderen Atomen, Bindungen mit anderen Bindungsenergien - alles mögliche. In anderen Worten: Elektronen in Zuständen, die von den Volumenzuständen irgenwie verschieden sind. Und die Kurzform, um all diese Möglichkeiten elegant auszudrücken, ist schlicht und einfach die Aussage: In der Energielücke der Oberfläche(nschicht) gibt es Zustände, eben Oberflächenzustände, die im Volumen nicht vorhanden sind. In anderen Worten: Während wir davon ausgehen, daß die "Oberfläche" noch die grundsätzliche Bandstruktur des Volumens hat, werden den Elektronen aber viel mehr Möglichkeiten von Energiezuständen geboten - und einige davon werden bestimmt in der Bandlücke liegen. Damit können wir der Oberfläche eine Bandstruktur zuschreiben wie nebenstehend gezeigt. Wir wissen natürlich nicht, wieviele Zustände sich bei welcher Energie befinden, aber das ist für das folgende auch gar nicht so wichtig. Wir wissen aber eines - und das ist schon eingezeichnet: Wenn es nicht zu wenige Zustände sind, wird die Fermienergie mitten in den Zuständen liegen müssen; ob noch ein paar Dotierungsatome da sind, spielt keine Rolle mehr. Warum? Bitte erst nachdenken; danach klicken Im übrigen gilt das natürlich (qualitativ) genauso für interne Grenzflächen wie Kornund Phasengrenzen. Was geschieht nun, wenn wir das Volumen und die Oberfläche in Kontakt bringen? Mit der Antwort auf diese Frage erschließen wir uns die Halbleitertechnik; wir wollen uns deshalb die Antwort detailliert in mehreren Stufen erarbeiten. Zunächst betrachten wir die Banddiagramme vor dem Kontakt. Gottseidank ist es im Gedankenversuch problemlos möglich, die Oberfläche getrennt vom Volumen zu betrachten (in der Praxis geht das nicht). Wir haben folgende Ausgangssituation: MaWi 2 Skript - Page 213 Links ist ein n-Typ Halbleiter eingezeichnet, die grünen Kreise und blauen Quadrate symbolisieren fast wie zuvor die Majoritäts- und Minoritätsladungsträger; also Elektronen und bzw. Löcher. Das "fast" bezieht sich auf die mit konstanter Bosheit geänderten Farben der Elektronen, Löcher, Bandkanten etc. Damit wird nämlich eine wichtige Eigenschaften der Elektronen und Löcher symbolisch zum Ausdruck gebracht: Sie sind nicht wirklich grün, rot oder blau; sie sind einfach nur. Rechts ist die Oberfläche wie gehabt. Nun bringen wir die Oberfläche in direkten "idealen" Kontakt zum Volumen, und betrachten was dabei passiert: So sieht es in der Sekunde Null beim Kontakt aus. Der entscheidenden Punkt ist nun, daß die (frei beweglichen) Elektronen im Leitungsband des Volumens jetzt plötzlich neue Plätze zur Verfügung haben, auf die sie sich setzen können: Die noch freien Plätze der Oberflächenzustände. Diese Plätze liegen energetisch tiefer; und es gibt eine ganze Menge davon. Man hat auch - als Elektron im Leitungsband - kein Problem mit der Impulserhaltung wie beim Sprung auf einen freien Platz (ein Loch) im Valenzband; denn an der Oberfläche muß der Kristallimpulserhaltungssatz nicht beachtet werden. Noch besser: Selbst wenn man sich als direkter Halbleiter um den Kristallimpulserhaltungssatz sowieso nicht zu kümmern braucht, muß man jetzt auch nicht auf der Lauer liegen, bis man mal im Ortsraum auf ein Loch trifft, man muß nur zur Oberfläche gehen; dort sind die freien Plätze ortsfest immer vorhanden - sie können nicht weglaufen wie Löcher im Valenzband, die Oberfläche ist schließlich ziemlich gut lokalisiert. Es gibt also viele gute Gründe, warum Elektronen aus dem Leitungsband sich auf die freien Plätze der Oberflächenzustände setzen werden; dies ist durch den Pfeil symbolisiert. Aber für all diese Vorteile ist ein Preis zu bezahlen: Besetzt ein Elektron einen freien Platz in den Oberflächenzuständen, ist es nicht mehr frei - es ist jetzt ebenfalls lokalisiert und unbeweglich! Dadurch ist die Oberfläche jetzt negativ geladen, denn es gibt keine Verschiebungen von positiven Ladungen, die diesen Effekt kompensieren könnten. Denn die wenigen Minoritätslöcher, die irgendwo herumvagabundieren, können nur wenig bewirken. Eine negativ geladene Oberfläche hat aber einen klaren Effekt auf die Elektronen des Volumens: Sie werden elektrostatisch abgestoßen; d.h. ins Volumeninnere getrieben. Anders, aber völlig äquivalent ausgedrückt, können wir auch sagen: Ihr elektrostatisches Potential, d.h. ihre Gesamtenergie, wird in dem von den Oberflächenladungen ausgehenden elektrischen Feld erhöht. Nachdem sich also das erste Elektron auf einen der bequemen Plätze an der Oberfläche gesetzt hat, muß das zweite Elektron, das dahin will, schon ein bißchen Energie aufwenden um gegen die elektrostatische Abstoßung des ersten Elektrons dahinzugelangen. Es wird sich also möglichst weit weg vom ersten Elektron auf einen Platz an der Oberfläche begeben und dadurch immer noch einen Nettoenergiegewinn haben. Für jedes weiter Elektron wird es jetzt immer ein bißchen schwieriger. Es muß immer mehr Energie aufgebracht werden, um ins gelobte Land zu kommen. Irgendwann wird der Punkt erreicht sein, wo sich die Reise nicht mehr lohnt: Die Energie, die man hineinstecken muß um gegen die elektrostatische Abstoßung zur Oberfläche zu gelangen, ist identisch zur Energie, die man gewinnen kann, indem man einen energetisch tiefer liegenden Platz besetzt. Den Elektronen wird es dann gleichgültig sein, wo sie sich befinden. In Formeln ausgedrückt bedeute das, daß sich die freie Enthalpie G des Systems nicht mehr ändern wird, falls wir an der Zahl nV der Elektronen im Volumen und der Zahl no der Elektronen in den Oberflächenzuständen leicht wackeln, oder ∂G ∂G · δnV ∂nV · δnO = – ∂nO Das kennen wir aber schon! In ganz leicht anderer Form hatten wir dieselbe Situation bei der erstmaligen Einführung des chemischen Gleichgewichts auf, und obige Formel stammt aus Kapitel 2.3.2. Die partiellen Ableitungen der freien Enthalpie nach der Teilchenzahl der Sorte i war aber nichts anders als das chemische Potential der Elektronen, und chemisches Potential heißt hier Fermienergie. MaWi 2 Skript - Page 214 Im Gleichgewicht des Volumens mit seiner Oberfläche muß also schlicht und ergreifend die Fermienergie überall denselben Wert haben. Auch das ist nicht neu. Wie kann man die Gleichheit der Fermienergien erreichen? Sie sind ja im Beispiel deutlich verschieden. Der erste Gedanke ist vielleicht, sie im Volumen etwas herunterzusetzen, und in der Oberfläche etwas hinauf - bis es halt paßt. Fragt sich nur wie. Denn das würde z.B. bedeuten, daß sich überall im Volumen jetzt die Ladunsgträgerdichte ändert - auch km weit weg von der Oberfläche. Das ist nicht nur beliebig unwahrscheinlich, es ist auch vollkommen unklar wie das gehen soll. Also so geht es nicht. Wir müssen berücksichtigen, daß wir jetzt elektrische Felder haben! Ladungsneutralität ist nicht mehr überall lokal gewährleistet, sondern nur noch global. Lokal ist unser Halbleiter jetzt geladen. Die Oberfläche ist eindeutig negativ aufgeladen, und irgendwo im Kristall müssen die positiven Gegenladungen sein, denn global haben wir natürlich immer noch Ladungsneutraltät. In einem elektrischen Feld erfährt eine Ladung aber eine Kraft – q · E, und damit muß Arbeit geleistet werden um die Ladung zwischen zwei Punkten x1 und x2 zu verschieben. Die dazu notwendige Arbeit entspricht der potentiellen elektrostatischen Energie Eel, sie ist gegeben durch x2 Eel = –q ⌠ ⌡ E · dxO = – q · U1-2 x1 Dabei ist U1-2 die Spannung zwischen den Punkten x1 und x2. Legen wir einen Punkt ins Unendliche (im Halbleiter), dann ist U1-2 einfach das elektrische Potential V beim anderen Punkt, der natürlich auf der Oberfläche liegt. Wir müssen also die Banddiagramme lokal um den Betrag – q · V verschieben; wir müssen die Bänder verbiegen auch das hatten wir schon. Wir schauen uns mal an, was wir erhalten und diskutieren es dann. Wir haben in Oberflächennähe eine Bandverbiegung, dort muß ein elektrisches Feld vorhanden sein. Da wir Gleichgewicht haben, ist die Konzentration der Elektronen und Löcher überall im wesentlichen durch den Abstand der jeweiligen Bandkante von der Fermienergie gegeben; die Elektronenkonzentration nimmt dementsprechend im Bereich der Bandverbiegung sehr schnell ab. Die Bandverbiegung zeigt graphisch unmittelbar, direkt, und quantitativ richtig die Höhe der Energiebarriere, die ein Elektron bewältigen muß um zur Oberfläche zu gelangen. Sie zeigt es auch für den Rückweg; beide Barrieren sind gleich hoch, wenn auch verschieden geformt. Angedeutet ist weiterhin, daß dynamisches Geichgewicht vorliegt. Einigen Elektronen pro Zeiteinheit wird der Sprung über die Barriere gelingen; wir erwarten einen zeitlich konstanten Elektronenstrom (und damit auch einen elektrischen Strom), der vom Volumen zur Oberfläche fließt. Aber wir werden einen genau gleichgroßen Strom haben, der von der Oberfläche ins Volumen fließt - der Nettostrom ist = 0. Bei den Löchern passiert vorzeichengedreht dasselbe. Es spielt hier aber keine große Rolle, weil wir in diesem Beispiel nur wenige Löcher haben. Zu einem elektrischen Feld gehört immer ein Potentialunterschied; schließlich ist ein elektrisches Feld schlicht der Gradient eines Potentials. Beim Kontakt Volumen - Oberfläche entwickelt sich also ein Kontaktpotential oder eine Kontaktspannung, die direkt durch die Differenz der Fermienergieen (dividiert durch Elementarladung) gegeben ist. Das gilt, wir ahnen es, im Prinzip für jeden Kontakt. Jetzt drängt sich (hoffentlich) die Frage auf: Kann man diese Kontaktspannung messen? Indem man die zwei Tastspitzen eines Voltmeters an die beiden Enden hält? MaWi 2 Skript - Page 215 Die Antwort kann nur sein: Nein!!! Denn wenn das Voltmeter ausschlagen würde, könnte man auch elektrische Leistung entnehmen, und dann hätten wir ein Perpetuum mobile! Wir würden schon deshalb keine Spannung messen, weil an der Oberfläche am anderen Ende natürlich genau dieselbe Kontaktspannung ensteht, die Differenz der Potentiale zwischen den Oberflächen ist dann Null. Aber man kann sich leicht Fälle ausdenken, bei denen das nicht so klar ist. Wenn man nicht einfach blind dem ersten Haupsatz der Thermodynamik trauen will ("Es gibt kein Perpetuum mobile"), ist es gar nicht so einfach zu verstehen, warum man eine Kontaktspannung nicht so einfach messen kann. Mehr dazu im Link. Vielleicht hat es nicht jede/jeder gemerkt: Wir haben uns damit ein fundamentales Rezept erarbeitet, um das Banddiagramm beliebiger Übergänge im Gleichgewicht kostruieren zu können! 1. Zeichne die Fermienenergie als horizontale Linie; markiere den Kontakt. 2. Zeichne "weit" links vom Kontakt das Banddiagramm von Material 1; weit rechts das von Material 2; immer relativ zu der bereits festgelegten Fermienergie. 3. Verbinde Leitungs- und Valenzband durch eine "gefühlsmäßig" gezeichnete Bandverbiegung. Das klappt immer! Und da wir unser "Gefühl" jetzt ganz schnell kräftig schärfen werden; wird die Bandverbiegung gar nicht so falsch werden. So weit so gut. Aber zwei Fragen müßten sich jetzt aufdrängen: 1. Was bestimmt, wie tief das elektrische Feld ins Volumen eindringt; also die Ausdehnung der Bandverbiegung? 2. Was bestimmt die Form der Bandverbiegung - warum ist sie gekrümmt und nicht z.B. linear gezeichnet? Die eine oder der anderen hat vielleicht sogar noch ein paar weitere Fragen. Wenn nicht jetzt, dann später. Die Antworten darauf finden sich - je nachdem - im Link. Fragebogen / Questionaire Multiple Choice Fragen zu 6.1.2 MaWi 2 Skript - Page 216 6.1.3 Bandverbiegung und Raumladungszone Die einfache Sichtweise Um die genaue Form der Bandverbiegung berechnen zu können, tun wir gut daran, uns die Situation ausnahmsweise mal nicht im Banddiagramm, sondern im gewöhnlichen Ortsraum anzuschauen. Berechnen heißt, die Poissongleichung, in der die Ladungsdichte mit dem elektrischen Potential verknüpft wird, für den betrachteten Fall zu lösen. Dazu müssen wir erstmal wissen, wo sich die diversen Ladungen befinden. Die beweglichen Elektronen sind in Oberflächennähe zurückgedrängt (soweit die Bandverbiegung eben reicht), die wenigen Löcher können wir vergessen - aber was immer bleibt, sind die ortsfesten Dotieratome, in unserem Fall positiv geladene ionisierte Donatoren. Offenbar sind diese ortsfesten positiven Ladungen die Partner der in die Oberfläche gewanderten ehemaligen Volumenelektronen: Von ihnen gehen die Feldlinien aus, die auf den negativen Ladungen der Oberfläche enden. Im Bereich der Bandverbiegung haben wir also noch eine feste, zeitlich unveränderlicheVerteilung von Ladungen im Raum, wir nennen das ganz Gebilde von nun an Raumladungszone RLZ (engl.. Space Charge Region; SRC). Die Raumladungszone ist ein fundamentaler Begriff der Halbleitertechnologie; der in den elementaren Wortschatz gehört. Die Ausdehnung oder Breite dRLZ der Raumladungszone (= Ausdehnung der Bandverbiegung) ist also letztlich dadurch bestimmt, wie weit man ins Innere des Materials gehen muß, bis man genügend positive geladenen Donatorionen gefunden hat, um die negativen Oberflächenladungen zu kompensieren. Es ist also jetzt schon klar, daß in nur leicht dotierten Halbleitern (= wenig Dotieratome) die Raumladungszone breiter sein muß, als in stark dotierten. Die Ausdehnung oder Breite dRLZ der Raumladungszone läßt sich auf zwei Arten berechen 1. Wir lösen die zugehörige Poisson Gleichung. Das werden wir auch - aber noch nicht sofort. 2. Wir denken scharf nach und greifen auf etwas zurück, das wir bereits kennen. Das werden wir als erstes versuchen. Was wir bereits kennen, ist ein Plattenkondensator: Zwei Platten mit der Fläche F im Abstand d enthalten die Ladung ±Q; dazwischen ist noch ein nichtleitendes Material mit der Dielektrizitätskonstaten εr . Der Kondensator hat die Kapazität C, gegeben durch εr · ε0 · F C = d Dabei ist ε0 die dielektrische Suszeptibilität des Vakuums. Zwischen den Platten ist dann ein elektrisches Feld E = -dU/dx; U ist die anliegende Spannung ??? - was nützt das? Nun ja - das Bild oben zeigt bei genauer Betrachtung eine Anordnung, die ziemlich viel Ähnlichkeiten mit einem Plattenkondensator aufweist. Rechts ist negative Ladung auf einer dünnen "Platte". Links ist positive Ladung; allerdings nicht auf einer Platte, sondern "verschmiert". Das entpricht einer "Verschmierung" des Abstands d der Platten zwischen d = 0 und d = dRLZ; eine Platte ist sozusagen aus Wellblech. Zwischen den "Platten" ist ein Material, das nur sehr schlecht leitet - denn in der RLZ gibt es kaum freie Ladungsträger. Im Material zwischen den "Platten" ist ein elektrisches Feld. Mit ein bißchen Nachdenken erkennt man also: Eine Raumladungszone ist einem Kondensator nicht nur ähnlich sie ist ein Kondensator, oder allgemeiner gesagt, sie hat eine in Farad meßbare Kapazität. MaWi 2 Skript - Page 217 Das einzige Problem ist der "verschmierte" Plattenabstand. Wir trauen uns einfach mal und beschließen: In so einem Fall nehmen wir einfach einen mittleren Plattenabstand <d>= ½ · dRLZ. Für die Kapazität unseres RLZ-Kondensators haben wir jetzt zwei Gleichungen: 2 · εSi · ε0 · F CRLZ = dRLZ Q CRLZ = Q = UK e2 · (ND · F · dRLZ) e · (ND · F · dRLZ) = = ∆EF/e ∆EF/e ∆EF Die 1. Gleichung ist klar, die 2. bis nach dem ersten Gleichheitszeichen auch. Was danach kommt, muß vielleicht erklärt werden: 1. Wir kennen die an unserem Raumladungskondensator anliegende SpannungU, hier genauer mit UK = Kontaktspannung bezeichnet. Denn die Spannung zwischen zwei Punkten ist die Differenz des elektrostatischen Potentials der beiden Punkte, und damit der Unterschied in der elektrostastischen Energie dividiert durch die Ladung (= e in unserem Fall). Der Unterschied in der elektrostastischen Energie ist aber gerade der Unterschied der Fermienergien vor dem Kontakt (= ∆EF), denn genau um diesen Betrag haben wir ja die Energieachsen verschoben. Damit gilt UK = ∆EF/e. 2. Wieviele Ladungen Q haben wir auf unseren "Platten"? Von den negativen Ladung auf der Oberfläche wissen wir es nicht, aber von den positiven Ladungen in der Raumladungszone wissen wir es schon: Es sind genau so viele Elementarladungen, wie wir ionisierte Dotieratome in der RLZ haben. Falls alle Dotieratome ionisiert sind (wovon wir jetzt ja immer ausgehen), braucht man also nur die Dichte ND mit dem Volumen F · dRLZ der Raumladungszone zu multiplizieren, um die Zahl der in der RLZ enthaltenen ionisierten Dotieratome zu erhalten; damit es eine Ladung wird muß noch mit e multipliziert werden. Was wir jetzt im Kasten oben haben sind 2 Gleichungen für die 2 Unbekannten CRLZ und dRLZ. Die Lösung ist beliebig einfach, wir erhalten dRLZ CRLZ /F = = 2 · εr · ε0 · ∆EF e2 ·ND 2 · εr · ε0 · e2 ·ND ∆EF ½ ½ Das war nicht so schwer! Und wir haben eine relativ einfache Formel für die Weite der RLZ erhalten. Wie vorhergesagt, nimmt dRLZ zu, wenn die Dotierkonzentration abnimmt - mit (1/ND)1/2, um genau zu sein. Weiterhin nimmt dRLZ zu, wenn die Differenz der Fermienergien größer wird - auch das ist klar. Allerdings stehen zwei Fragen im Raum. Erst die einfachere der beiden: Frage 1: Stimmt das überhaupt? Immerhin haben wir aus der RLZ nur durch Tricksen einen Plattenkondensator machen können. Oder anders herum gefragt: Wie gut ist die Gleichsetzung des "mittleren" Abstands der Kondensatorplatten mit der halben RLZ Weite? Antwort: Die Formel stimmt exakt! Das weiß "man" (und wir gleich auch), aus der Lösung der Poissongleichung für diesen Fall - wir erhalten nämlich das gleiche Ergebnis. Frage 2: Was ist denn die Dielektrizitätskonstante εr von Si? Si ist ja schließlich ein Halbleiter und kein Dielektrikum? Antwort: Jedem Material kann man eine Dielektrizitätskonstante zuschreiben - es ist nur nicht immer sinnvoll, es in einen Kondensator zu stecken. Wir haben das in einem extra Modul auch schon mal angesprochen. Wir wollen uns das Leben aber nicht unnötig schwer machen, sondern uns zwei Möglichkeiten zur eindeutigen Messung der Dielektrizitätskonstante eines beliebigen Halbleiters überlegen: MaWi 2 Skript - Page 218 1. Wir stecken das Material bei T = 0 K in den Plattenkondensator. Dann fließt garantiert kein Strom, da alle Halbleiter jetzt Isolatoren sind. Die Dielektrizitätskonstante ist eindeutig meßbar; selbst wenn wir ein bißchen aufwärmen sollte es noch klappen; wir müssen nur zur Auswertung der Messung dem "reinen" Kondensator den durch die beginnende Leitfähigkeit gebildeten Widerstand parallel schalten und entsprechend berücksichtigen. 2. Wir erinneren uns, daß alle Halbleiter für Licht mit h ν < EG vollständig durchsichtig sind - und dann einen Brechungsindex nOpt haben, der (wie wir wissen sollten) durch folgende Gleichung gegeben wird: nOpt = ε 1/2 Halbleiter Der Brechungsindex ist also nur eine etwas andere Form der (frequenzabhängigen) Dielektrizitätskonstante. Spätestens damit läßt sich unser gesuchtes εr auch bei hohen Temperaturen bestimmen. Was wir finden werden ist, daß Halbleiter typischerweise relativ große Dielektrizitätskonstanten haben - sie liegen irgendwo zwischen 10 - 20. Damit haben wir eigentlich die Raumladungszone - ihr Zustandekommen und ihre Ausdehnung - schon ziemlich gut verstanden. Was noch fehlt ist die formale Berechunung und die genaue Form der Bandverbiegung. Jetzt muß eben doch die Poisson Gleichung gelöst werden. Die formale Sichtweise Die Poisson Gleichung verkoppelt Ladungsdichten ρ(x, y, z) und das elektrostatische Potential V(x, y, z), sie lautet ρ ∆V = – εε0 ∆ ist der Delta Operator; ∆ = ∂ 2/∂x2 + ∂ 2/∂y2 + ∂ 2/∂z2 ; ρ(x, y, z) ist die lokale Ladungsdichte; immer als (vorzeichenrichtige) Summe von positiven und negativen Ladungen im Volumenelement dV bei (x, y, z) zu nehmen. Für gegebenes ρ(x, y, z) erhält man durch zweimalige Integration der Differentialgleichung das elektrostatische Potential, einmalige Integration (oder Differentiation des Potentials) liefert die elektrische Feldstärke E(x, y, z) = – V(x, y, z) Das ist für unseren eindimensionalen Fall eine einfache Übung - so einfach, daß wir es in einer Übungsaufgabe machen.. Übung 6.1-1 Lösung der Poissongleichung MaWi 2 Skript - Page 219 Hier schauen wir uns nur an, wie die Lösung prinzipiell aussehen muß: Wir haben in der RLZ eine konstante Ladungsdichte ρ(x, y, z) = ND; das ist durch das hellblaue Rechteck angedeutet. Außerhalb der RLZ ist sie (im Halbleiter) = 0. Die negativen Ladungen auf der Oberfläche bilden eine Art Delta-Funktion (grün angedeutet); wir brauchen sie hier aber erstmal nicht zu berücksichtigen. Natürlich wird die Ladungsdichteverteilung nicht streng rechteckig sein sondern, wie angedeutet, eine weiche Flanke haben. Aber auch das ignorieren wir erstmal, da es nur minimalen Einfluß auf die Lösungen nimmt. Zu lösen ist also die eindimensionale Differentialgleichung für eine Ladungskonzentration ND zwischen x = 0 und x = dRLZ d2V e ND(x) =– dx2 ε ε0 Dazu müssen wir nur zweimal integrieren. Die erste Integration liefert die Feldstärke; wir erhalten eine Gerade wie mit der roten Kurve qualitativ angedeutet. Für die quantitativen Parameter müssen wir die Übungsaufgabe machen Die zweite Integration liefert das elektrostatische Potential oder die Kontaktspannung, falls wir das linke Ende auf UK = 0 setzen. Wir erhalten eine Parabel. Damit wäre die Form der Bandverbiegung jetzt auch klar. Zur quantitativen Berechnung braucht man zwei Randbedigungen. Eine davon ist auch unmittelbar klar: Die gesamte Potentialdifferenz muß ∆EF/e sein, denn das ist die Potentialverschiebung, die bei Gleichgewicht vorliegen muß. Über die zweite denken wir selbst ein bißchen nach auch sie ist in der Zeichnung enthalten. Die Breite der Raumladungszone ergibt sich letztlich aus den Randbedingungen. Qualitativ ist im rechten Bild zwar alles klar, aber um obige Formel zu erhalten muß man jetzt halt rechnen. Wie versprochen, haben wir aus unserem etwas seltsamen Kontakt von Volumen und Oberfläche eine ganze Menge Honig gesaugt. Aber es ist noch mehr davon da! Und darauf wollen wir schnell noch einen kurzen Blick werfen. MaWi 2 Skript - Page 220 Volumen - Oberflächenkontakt mit zusätzlicher externer Spannung Was passiert, wenn wir sowohl das Volumen, als auch die Oberfläche mit einem ohmschem Kontakt versehen, und dann eine äußere Spannung Uex anlegen? Wie wir das tun, d.h. wie wir Volumen und Oberfläche kontaktieren, müssen wir beim Gedankenversuch nicht wissen. Um die Lage einfach zu machen, erden wir das Volumen (d.h. wir definieren VVol = 0), so daß nur an der Oberfläche die zusätzliche Spannung ±Uex anliegt. Mit dem ± Zeichen soll angedeutet werden, dass man die gesamte Spannung vergrößern oder verkleinern kann - je nach Vorzeichen der angelegten externen Spannung. Je nach Vorzeichen der Spannung muss das Vorzeichen des Potentials gewählt werden. Man kann die Konventionen auswendig lernen, oder sich schlicht daran halten, dass pos. Spannung die Elektronen "anzieht", d.h. das Potential senkt. Das bedeutet, dass man in den nachfolgenden Formeln nur das – Zeichen braucht falls man U mit Vorzeichen einsetzt; eine negative Spannung führt dann zum +. Damit haben wir aber auch die zusätzliche elektrostatische Energie – e ·Uex für die Elektronen. Und was das bedeutet wissen wir schon: Wir müssen das Banddiagramm der Oberfläche lokal um den Betrag – e ·Uex verschieben; dazu müssen wir die Bänder zusätzlich verbiegen Solange kein Strom fließt ist alles wie gehabt, wir müssen nur die externe Spannung Uex zur Kontaktspannung UK = – ∆EF/e addieren, um die gesamte am Kontakt anliegende Spannung U zu erhalten : ∆EF U = – Uex –e Je nach Vorzeichen von U wird also die insgesamt anliegende Spannung vergrößert oder verkleinert. Alle Formeln können beibehalten werden, wir müssen nur UK durch U ersetzen und erhalten dRLZ CRLZ /F = = 2 · εSi · ε0 · (∆EF – e ·Uex) e2 · ND 2 · εSi · ε0 · e2 · ND ∆EF – e · Uex ½ ½ Das ist schon mal nicht schlecht! Wir könnten einen abstimmbaren Kondensator bauen! Durch die Größe der anliegenden Gleichspannung kann man die Kapazität des Kontakts ändern, und dann das Wechselspannungsverhalten gezielt einstellen, z.B. die Resonanzfrequenz eines Schwingkreises. Aber halt! Leider nur im Gedankenversuch! Wir wollen aber nicht nur gedanklich Radio hören und Fernsehn gucken, sondern real. Dazu müssen wir dann aber in den nächsten Unterkapiteln reale Kontakte machen. Es bleibt noch mindestens eine Frage, die sich jetzt wieder mit Macht aufdrängen müßte: Kann man die Kontaktspannung UK messen - im Gedankenversuch natürlich! Wird ein Voltmeter an unseren ja bereits vorhandenen Kontakten eine Spannung anzeigen? Noch härter gefragt: Kann man mit der Kontaktspannung einen Strom durch einen externen Widerstand treiben? Dann hätten wir ein Perpetuum mobile! Damit ist die Antwort auf obige Fragen klar: Nein, und nochmals nein! Nur: Warum die Antwort nein sein muß, ohne den 1. Haupsatz zu bemühen, ist nicht so recht klar. Die Antwort findet sich in einem extra Modul. Aber erst selbst nachdenken! Hinweis: Man kann Gedankenversuche auch überstrapazieren. Wir wollen aber an dieser Stelle jetzt nicht mehr tiefer in die Materie eindringen, sondern dies bei realen Kontakten tun, die wir tatsächlich herstellen und kontaktieren können, nicht nur im Gedankenversuch. Fragebogen / Questionaire Multiple Choice Fragen zu 6.1.3 MaWi 2 Skript - Page 221 6.1.4 Zusammenfassung Kapitel 6.1 Kontakte Es gibt viele verschiedene Arten von Kontakten; das elektrische Verhalten (Strom-Spannungskennlinie) ist aber nicht unmittelbar klar. Ein realer Kontakt ist i.d.R. viel komplizierter als ein idealer Kontakt. Ohne besondere Vorsichtsmaßnahmen wird man deshalb nicht die Eigenschaften eines Metall - Halbleiterkontaktes messen, sondern die Eigenschaften des Kontakts Metall - Zwischenschicht (Dreck und Reaktionsprodukte) - Halbleiter. Das gilt insbesondere für den Kontakt p-Typ Halbleiter - n-Typ Halbleiter. Die technische Realisierung des resultierenden pn-Übergangs ist recht komplex. Die Oberfläche eines Kristalls kann aus guten Gründen als ein spezielles Material betrachtet werden; der immer vorhandene "Kontakt" Halbleitervolumen - Halbleiteroberfläche ist ein recht einfaches Modellsystem für einen allgemeinen Kontakt. Die Oberfläche wird andere Zustände für Elektronen haben als das Volumen; insbesondere sind viele Zustände in der Bandlücke zu erwarten, da nicht optimal abgesättigte Bindungen vorliegen. Dadurch wird die Fermienenergie in diesen Zuständen liegen, ziemlich unabhängig von ihrer Lage im Volumen. Die Fermienergie wird durch viele Zustände in der Bandlücke "gepinnt". Beim gedanklichen Kontakt Volumen - Oberfläche werden Elektronen zu den energetisch niedriger liegenden Zuständen der Oberfläche wandern; die Oberfläche wird dadurch so lange geladen, bis das sich aufbauende elektrische Feld weiteren Energiegewinn kompensiert. Für Löcher gilt dasselbe, nur "anders herum". Im Banddiagramm sieht das dann so aus: Vor Kontakt Kontakt bei t = 0 Gleichgewicht Als generellen Effekt bei allen Kontakten im Gleichgewicht haben wir: 1. Konstante Fermienenergie überall. 2. Ladungsverschiebungen im Bereich der Grenzflächen. 3. Bandverbiegungen = Raumladungszonen = elektrische Felder im Bereich der Grenzflächen Als generelles Rezept zur Erstellung von Banddiagrammen (im Ortsraum) haben wir 1. Zeichne die Fermienenergie als horizontale Linie; markiere den Kontakt. 2. Zeichne "weit" links vom Kontakt das Banddiagramm von Material 1; weit rechts das von Material 2; immer relativ zu der bereits festgelegten Fermienergie. 3. Verbinde Leitungs- und Valenzband durch eine "gefühlsmäßig" gezeichnete Bandverbiegung. Die Raumladungen in der Raumladungszone sind die ortsfesten geladenene Dotieratome; auf der Oberflächenseite sind es die dort sitzenden Überschußelektronen Die RLZ hat damit eine überschlagsmäßig über die Kondensatorformel leicht zu errechnende Kapazität (pro Flächeneinheit); dadurch ist auch die Weite der Raumladungszone sehr leicht bestimmbar. Die quantitative Berechnung mit Hilfe der Poisson-Gleichung führt auf exakt dieselben Formeln; bei Berücksichtigung einer zusätzlich angelegten externen Spannung ergibt sich MaWi 2 Skript - Page 222 dRLZ CRLZ /F = = 2 · εSi · ε0 · (∆EF – e ·Uex) e2 · ND 2 · εSi · ε0 · e2 · ND ∆EF – e · Uex Danmit sind die wesentlichen Eigenschaften der RLZ zurückgeführt auf 1. Die Grundeigenschaften der beiden Materialien (EF und εr). 2. Technologieparameter (NDot und Uex). MaWi 2 Skript - Page 223 ½ ½ 6.1.5 Merkpunkte Kapitel 6.1 Kontakte zwischen verschiedenen Materialien sind wichtig; in Stromkreisen sind sie unvermeidbar. Die IU-Kennlinie kann kompliziert sein; sie ist nicht notwendigerweise "Ohmsch", d.h. linear. Reale Kontakte sind nicht die "idealen" Kontakte der Theorie: Nicht verwechseln! Halbwegs "ideale" pn-Übergänge sind nicht leicht herzustellen Die Oberfläche hat eine andere Bandstruktur als das Volumen, insbesondere gibt es viele Zustände in der Bandlücke. Auch der Übergang Halbleiter - Oberfläche ist damit ein Kontakt! Grundprinzip bei Kontakt: Ladungen verschieben sich in Richtung möglicher Energiegewinn. (Elektronen "nach unten"; Löcher "nach oben"). Dadurch entstehen elektr. Felder, Potentialunterschiede und Bandverbiegungen zwischen links - rechts. Im Gleichgewicht: Energiegewinn (= ∆EF) = Potentialunterschied links- rechts. Einfaches Rezept für Konstruktion Banddiagramm bei Kontakten ⇒ 1. Zeichne die Fermienenergie als horizontale Linie; markiere den Kontakt. 2. Zeichne "weit" links vom Kontakt das Banddiagramm von Material 1; weit rechts das von Material 2; immer relativ zu der bereits festgelegten Fermienergie. 3. Verbinde Leitungs- und Valenzband durch eine "gefühlsmäßig" gezeichnete Bandverbiegung. Wesentliche Größe: Raumladungszone (RLZ) Weite dRLZ der Raumladungszone ist verhältnismäßig leicht versteh- und errechenbar ("Kondensatormodell"). dRLZ skaliert grundsätzlich mit (Potentialunterschied)1/2 und (Dotierung/Ladungsträgerdicht)– 1/2 MaWi 2 Skript - Page 224 6.2 Der pn-Übergang 6.2.1 Grundsätzliches Das Banddiagramm im Gleichgewicht Der pn-Kontakt oder pn-Übergang ist ein Kontakt zwischen einem p- und einem n-dotierten Halbleiter derselben Sorte Also ein Kontakt p-Si/n-Si, oder p-GaAs/n-GaAs, nicht jedoch aber z.B. ein Kontakt p-Si/n-GaAs - das nennen wir einen Heteroübergang. Und das ist gut so! Heteroübergänge sind nämlich schwierig, und pn-Übergänge sind einfach - vergleichsweise, jedenfalls. Wenn man überlegt, was uns das 20. Jahrhundert so alles beschert hat, wird der Transistor, und damit der pn-Übergang als "Paradigma" in jeder Liste ziemlich weit vorne stehen - bei der Atombombe, der Antibabypille und dem Automobil. Damit verbunden sind die Namen John Bardeen (1908 - 1991), Walter Brattain (1902 - 1987) und William Shockley (1910 - 1979); alles Nobelpreisträger; einer sogar zweifacher. Wir benutzen jetzt einfach unser Rezept zur Konstruktion beliebiger Kontakte und konstruieren uns das Banddiagramm eines pn-Übergangs 1. Zeichne die Fermienenergie als horizontale Linie; markiere den Kontakt 2. Zeichne "weit" links vom Kontakt das Banddiagramm von Material 1; weit rechts das von Material 2; immer relativ zu der bereits festgelegten Fermienergie. Links ist also p-Si, rechts ist n-Si. Die Dotierung links und rechts ist vergleichbar, angedeutet durch gleich viele Majoritätsladungsträger. 3. Verbinde Leitungs- und Valenzband durch eine "gefühlsmäßig" gezeichnete Bandverbiegung Die Elektronen und Löcher sind beweglich, sie können jetzt im Prinzip von einer Seite zur anderen fließen (nicht jedoch die ortsfesten geladenen Dotieratome). Sie tun das auch - unser "Rezept" beruht ja gerade darauf, daß sich Ladungen verschieben. Aber auch nachdem die notwendigen Verschiebungen stattgefunden haben, werden Elektronen und Löcher noch von einer Seite zur anderen fließen - sie diffundieren schließlich ziellos durch die Gegend und "wissen" nichts von einem pn-Übergang; sie spüren nur das damit verbundene elektrische Feld. Es fließen als ständig Ströme. Das ist im Bild schon berücksichtigt; wir haben Strompfeile eingemalt, die andeuten sollen, daß es sich um ein dynamisches Gleichgewicht handelt, wie schon besprochen. Auch die Weite der Raumladungsgzone ist angegeben. MaWi 2 Skript - Page 225 Soweit das Rezept. Wir haben damit relativ schmerzlos das Banddiagramm eines pn-Übergangs konstruiert. Aber was ist denn eigentlich physikalisch passiert? Welche Ladungen sind in der Raumladungszone? Wie soll man sich das ganze vorstellen? Nun - genauso wie beim Kontakt Volumen-Oberfläche. Nur daß die vielen Elektronen in n-Si jetzt überall im p-Si viele freie, energetisch tiefer liegende Plätze finden, nicht mehr nur in einer dünnen Schicht wie zuvor. Für die Löcher des p-Si ist es genau umgekehrt. Die Möglichkeit, durch Besetzung der energetisch tiefer liegenden Plätze Energie zu gewinnnen, ist also genauso da wie beim Oberflächen-Volumen Kontakt, und das kann man als treibende Kraft für Eindringen der jeweiligen Majoritätsladungsträger in die andere Si-Hälfte betrachten. Wir können die Situation aber auch ein bißchen weniger pauschal, und ein bißchen mehr aus Sicht der Ladungsträger betrachten. Das ist sehr nützlich zum tieferen Verständnis und für spätere Berechnungen Dazu müssen wir und klar machen, daß Elektronen und Löcher ziemlich beschränkt sind - sie wissen nichts von Konzentrationen und Konzentrationsgradienten, von freier Enthalpie und Plätzen niedrigerer Energie, von ihrer Sterblichkeit via Lebensdauer oder, wie, wann, wo und weshalb sie generiert wurden - also ein bißchen so wie bei Erstsemestern oder Geisteswissenschaftlern. Ein Elektron (und ein Loch genauso) läuft nur ziemlich stur durch den Kristall und stößt sich mit dieser und jenem. Falls diese oder jener gerade paßte, rekombiniert es mit ihm. Ansonsten spürt es allenfalls noch vorhandene elektrische Felder, die in seiner Bewegung wie bergauf- oder bergab Situationen wirken. Warum dann der Drang zu den energetisch tieferen Plätzen? Einfach: Weil dort weniger Kollegen sind. Und jede Zufallsbewegung produziert nun mal ganz automatisch einen Diffusionsstrom in Richtung der kleineren Konzentration, obwohl jedes Teilchen für sich völlig "random" läuft. Das haben wir uns ausführlich angesehen! Kollektivphänome sind eben nicht nur bei Menschen, sondern auch bei Teilchen oft nicht aus dem Verhalten einzelner Mitglieder einer Gruppe unmittelbar zu erkennen. Und auch bei Ladungsträgern muß man genau darauf achten, ob man die Einzelgänger, oder das Kollektiv betrachtet; ein relevantes Beispiel dazu findet sich im Link. Es ist also nur der Konzentrationsgradient, der die Elektronen ins p-Gebiet, und die Löcher ins n-Gebiet treibt. Hätten wir neutrale Atome, also ein typisches Diffusionsproblem, wäre nach einiger Zeit die Konzentration ausgeglichen und hätte überall denselben Wert. Bei unseren (geladenen) Teilchen verhindern dies aber zwei Faktoren: 1. Falls sich ein Elektron ins p-Si begibt, gibt es dort keine Ladungskompensation für die zusätzliche negative Ladung, denn positiv geladene Donatoren gibt es im n-Si eben nicht. Zwar haben wir viele positiv geladene Löcher, aber die sind bereits mit den negativ geladenen Akzeptoren austariert und können keine Zusatzladungen kompensieren. Wir haben jetzt zuviel negative Ladungen im p-Si und, wegen der Symmetrie mit den Löchern, zuviel positive Ladungen im n-Si. Wiederum verschieben sich die Potentiale, und wir bauen ein elektrisches Feld auf. Die Diffusion erfolgt jetzt "bergauf", irgendwann käme sie zum Stillstand. 2. Die ins p-Si gewanderten Elektronen und die ins n-Si gewanderten Löcher sind dort Minoritätsladungsträger, sie addieren sich zu den bereits vorhandenen Minoritäten, die in der jeweiligen Gleichgewichtskonzentration vorliegen. Wiederum gilt aber: Alle Ladungsträger sind gleich, sie werden also genau wie die bereits vorhandenen Minoritäten nach Ablauf ihrer Lebensdauer τ rekombinieren und weg sein - sie verschwinden einfach; der Berg wird flacher, Nettodiffusion kann wieder stattfinden. Selbstverständlich wird sich jetzt ein Gleichgewicht einstellen, und es werden genausoviele Elektronen und Löcher per Diffusion nachgeliefert, wie per Rekombination verschwinden. Denn die Generationsrate, die uns sonst die Minoritäten produziert, hat keinen Grund sich zu ändern. Der letzte Satz enthält einen tiefen Gedanken, dem wir hier aber nicht weiter nachgehen wollen - wer Tiefdenken will, betätigt den Link. Es fließt also ein ständiger Strom an Elektronen vom n-Si ins p-Si, und der muß - immer im Gleichgewicht - durch einen entgegengesetzt gleichgroßen Strom kompensiert werden, soviel ist klar. Man könnte natürlich auch sagen: Was soll's - der Gesamtstrom ist = 0, das wissen wir; warum die ganze Philosophie um gleichgroße Hin- und Rückströme und so weiter? Das ist zwar nicht falsch, aber genauso ungeschickt wie zu sagen: Solange sich mein Kontostand nicht ändert, findet kein Geldtransfer statt, es wird nichts eingezahlt und abgehoben. Das wäre nicht nur in der Regel nachweislich falsch, es wäre auch eine kurzsichtige Denke; inbesondere, wenn Einzahlungen und Abhebungen recht groß sind. Denn auch wenn sie sich im Gleichgewicht genau kompensieren - eine kleine Störung, und die Effekte werden sofort drastisch. Es ist schon besser, die Teilströme immer im Auge zu behalten. Das wird uns noch ausführlich beschäftigen, jetzt wollen wir aber erst mal ein Ortsdiagramm des pn-Übergangs anschauen. MaWi 2 Skript - Page 226 In Grunde alles wie gehabt - aber, wie schon gesagt, die Ströme werden uns noch ausführlich beschäftigen. Um genauere Aussagen über das Banddiagramm zu bekommen, müssen wir natürlich wieder die Poisson Gleichung lösen. Qualitativ ist das wieder ganz einfach; es ist in einem eigenen Modul behandelt. Quantitativ bringt es gegenüber der alten Übung nur mehr Rechenarbeit, aber nichts wirklich neues. Was wir aber auch so mit großer Gewißheit vermuten können, ist: Die Form wird sich wohl aus Parabeln zusammensetzen lassen. Aber das ist eigentlich ziemlich egal, denn die Form einer Energiebarriere - und um eine solche handelt es sich ja - hat uns noch nie besonders interessiert. Die Gesamtausdehnung d wird wohl wieder mit (1/N )½ skalieren - nur für die Dotierkonzentration N , die ja RLZ D D links und rechts verschieden sein kann, müssen wir wohl eine Art Mittelwert verwenden. So ist es; was herauskommt ist einfach 1 dRLZ = e 2 ·εSi · ε0 · ∆EF · 1 1 + NA ND ½ Wie groß ist nun so eine Raumladungsgzone unter realistischen Umständen? Nun - man kann's mit der Formel leicht ausrechnen, man kann aber auch die Illustration anschauen. Wir merken uns nur: Sie kann im Extremfall 100 µm oder auch nur 10 nm breit sein. Der typische Wert ist aber um 1 µm. Bevor wir uns jetzt den Strömen widmen, wollen wir aber noch schnell die Konzentrationen der Ladungsträger im Gleichgewicht qualitativ anschauen. Wir beginnen wieder mit dem fertigen Bild, und schauen ob wir per Bildbetrachtung eine sinnvolle Interpretation hinbekommen. Links gibt es viele Löcher und wenige Elektronen; das ist eindeutig das p-dotierte Gebiet. Rechts ist entsprechend das n-Gebiet. Da die Elektronenkonzentration im n-Gebiet höher ist als die ;Löcherkonzentration im p-Gebiet, muß die n-Seite höher dotiert sein als die p-Seite; der pn-Übergang ist also asymmetrisch. In der Raumladungszone gehen die Konzentrationen "irgendwie" vom hohen auf den niedrigen Wert. Unvermeidlich müssen sie sich aber in einem Punkt schneiden. Dieser Punkt ist mit "ni" markiert, also mit der intrinsischen Ladungsträgerkonzentration. Warum? Weil wir immer noch Gleichgewicht haben, und damit das Massenwirkungsgesetz immer gilt. Gleichheit von Elektronen- und Löcherkonzentration kann damit nur bei ni vorliegen. In der Raumladungszone sind immer noch alle Dotieratome vorhanden, aber nicht mehr durch eine entsprechende Anzahl von Majoritätsladungsträger elektrisch neutralisiert. Im Grunde ergeben sich natürlich alle Konzentrationen aus dem Abstand der Fermienergie zu den jeweiligen Bändern; der Abstand ergibt sich aus der Bandverbiegung, und diese aus der Lösung der Poisson Gleichung - wer will kann sich ans Werk machen, mit oder ohne Näherungen, für jede Temperatur. Viel Spaß! Aber was wollen wir eigentlich ausrechnen? In erster Linie eigentlich die Strom-Spannungs Kennlinie eines pn-Übergangs. MaWi 2 Skript - Page 227 Das bekommen wir aber mit dieser Art von Rechnung gar nicht. Stromfluß heißt nämlich Nichtgleichgewicht - wir müssen erstmal wieder scharf nachdenken! Das tun wir jetzt aber im nächsten Unterkapitel - aber erst nachdem wir ein wenig geübt haben Übung 6.2-3 Raumladungszone Fragebogen / Questionaire Multiple Choice Fragen zu 6.2.1 MaWi 2 Skript - Page 228 6.2.2 Ströme im pn-Übergang im Gleichgewicht Die Herkunft der Teilströme Im vorhergehenden Unterkapitel haben wir betont, daß über einen pn-Übergang ständig Ströme fließen, und daß wir in der Außenwelt davon nur nichts merken, weil sie sich gegenseitig aufheben. Wir haben auch festgehalten, daß es genauso naiv (um nicht zu sagen falsch wäre) zu behaupten, daß dann eben keine Ströme fließen, wie es falsch ist zu behaupten, daß bei unverändertem Kontostand keine Einzahlungen und Abhebungen erfolgt sind. Wir müssen uns also die diversen Ströme etwas genauer anschauen. Dazu betrachten wir nochmal das zuständige Banddiagramm, und geben dann den diversen Teilströmen erstmal Namen. Betrachten wir erstmal die Elektronen im Leitungsband. Rechts ist das nGebiet, und wir haben einen jF(L) genannten Elektronenstrom eingezeichnet, der energetisch bergauf fließt. Das ist der durch den Konzentrationsgradienten der Elektronen getriebene Strom, wir nennen ihn deshalb gerne auch Diffusionsstrom. Die "bergauf" Situation ergibt sich, weil er "gegen" das elektrische Feld in der RLZ des pn-Übergangs fließen muß. Die diesen Strom tragenden Elektronen finden sich nach ihrer bergauf Wanderung als Minoritätsladungsträger im p-Gebiet wieder, wo sie noch eine Weile herumwandern (für im Mittel τ Sekunden, um genau zu sein) und dabei (im Mittel) eine Diffusionlänge L weit kommen. Letztlich verschwinden sie durch Rekombination, deswegen nennt man den Diffusionsstrom auch gerne Rekombinationsstrom. Das ist aber nur ein anderer Name für dieselbe Sache. In Kürze sind wir ein bißchen schlauer und wissen, daß dieser Strom der wesentliche Anteil an dem Vorwärtsstrom einer aus einem pn-Übergang gefertigten Diode ist. Deswegen nennt man ihn auch Vorwärtsstrom (engl. forward current). Welche Bezeichnung man benutzt ist reine Geschmackssache. Unser Geschmack tendiert zum "Vorwärtsstrom", abgekürzt jF(L) , und diese Bezeichnung werden wir von nun an beibehalten. Das "L" deutet an, daß wir über den aus dem Leitungsband kommenden Vorwärtsstrom reden, d.h. einen Elektronenstrom. Für die Löcher gilt exakt dieselbe Überlegung; man darf nur nicht vergessen, daß für Löcher die bergab Bewegung die energetisch schwierigere ist - sie wollen immer nach oben! Den Löcher Diffusions- Rekombinations oder Vorwärtsstrom kürzen wir mit jF(V) ab, damit ist klar, daß er aus dem Valenzband stammt. Den in die jeweils entgegengesetzte Richtung fließenden Strom im Leitungs- und Valenzband haben wir bisher nicht groß beachtet. Das wird sich gleich ändern, aber vorher wollen wir ihn benennen. Die wenigen Elektronen und Löcher, die von der p- oder n-Seite ins n- bzw. p-Gebiet fließen, werden von dem elektrischen Feld in der RLZ nicht behindert, sondern im Gegenteil beschleunigt - sie fließen energetisch bergab bzw. bergauf. Deswegen heißt dieser Strom auch Feldstrom. Vergleichen wir die Situation mit der Bewegung von "Elektronenschwärmen" im elektrischen Feld, dann erkennen wir (hoffentlich), daß das elektrische Feld des pn-Übergangs den hier betrachteten Ladungsträgern, die ansonsten nur planlos durch den Gegend ziehen, eine Driftgeschwindigkeit verleiht - deswegen nennt man diesen Strom auch Driftstrom. Die Ladungsträger, die uns den Feld- oder Driftstrom liefern, sind in ihrer jeweiligen Ursprungsheimat die Minoritätsladungsträger. Da wir Gleichgewicht haben, müssen alle, die auf ihrer (Zufalls) Wanderung an den Rand der RLZ kommen, und dann unweigerlich den Berg hinunterfallen (bzw., falls es Löcher sind: hinauffallen), ersetzt werden. Das kann nur durch (thermische) Generation im Ursprungsgebiet erfolgen. Deswegen nennen wir diesen Strom auch gerne Generationsstrom. Schließlich, falls wir konsequent sind, muß unser Feld-, Drift- oder Generationsstrom wohl auch der Rückwärtsstrom sein (engl. "reverse current"), schließlich brauchen wir einen Gegenpart zu dem Vorwärtsstrom, den wir bereits eingeführt haben. Welche Bezeichnung man benutzt ist immer noch reine Geschmackssache. Unser Geschmack tendiert unbeirrbar zum "Rückwärtsstrom", abgekürzt jR(L) oder jR(V), je nachdem ob wir das Leitungs- oder Valenzband betrachten; und diese Bezeichnung werden wir von nun an beibehalten. MaWi 2 Skript - Page 229 Die Eine oder der Andere bekommt jetzt vielleicht etwas Teilchensortierungsbauchweh. Da behaupten wir gerade eben, daß uns durch den Rückwärtsstrom Minoritäten abhanden kommen, die wir per Generation ersetzen müssen - aber ein paar Zeilen weiter oben haben wir festgestellt, daß wir zuviel Minoritäten haben, weil der Vorwärtsstrom ständig welche liefert? Wat denn nu? Das ist keine Trivialfrage. Wir transmutieren sie mal in ein bekannteres Terrain: Verringern ständige Abhebungen nun den Kontostand, oder tun sie es nicht, falls völlig unabhängig auch Einzahlungen erfolgen? In der richtigen Wissenschaft muß man sehr sorgfältig darauf achten, die Dinge nicht mehrfach zu mischen. In der Systematik getrennter Vorwärts- und Rückwärtsstrombetrachtungen, wird nur einmal gemischt, nämlich dann, wenn wir die vier Teilströme (vorzeichenrichtig) addieren. Ansonsten aber müssen wir aber bei Betrachtungeines Teilstroms die anderen immer vergessen, sonst wird doppelt gemoppelt. Selbstverständlich fließen nicht vier säuberlich getrennte Teilströme, sondern Elektronen wandern in dem Kristall herum (es gibt nur einen; die Kristallatome wissen nicht ob sie zur p- oder n-Seite gehören). Und was sie individuell als Funktion ihrer Position und der dort herrschenden Bedingungen machen, mittelt und addiert sich statistisch zu Strömen (die ja immer Mittelwerte über viele Ladungsträger, Zeit und Raum sind). Einen klar definierten Teil der wandernden Elektronen haben wir schon abstrahiert und durch Löcher ersetzt; jetzt machen wir eine weitere Abstraktionen und ordnen definierte Teile der Elektronen jeweils einer Stromsorte zu. Die Trennung in Teilströme ist letztlich nur ein buchhalterischer Trick, man könnte es auch anders machen; die Freiheit hat man. Was man aber nicht darf, ist die möglichen Bilanzierungssysteme oder die Einzelposten in einem System willkürlich oder absichtlich zu mischen. Denn dann sind willkürliche (oder auch absichtliche) Ergebnisse möglich. Die trickreiche Vermischung von verschieden Bilanzierungssystemen ist durchaus weit verbreitet; gerade jetzt (Mitte 2002) herrscht an der Börse und bei Anlegern eine gewisse Verwunderung darüber, daß Firmen, die gerade noch in ihrere Bilanz große Gewinne hatten, jetzt plötzlich komplett bankrott sind. Ende 2007 und 2008 ("subprime loan crisis") ist die Verwunderung noch größer - irgenwie sind hunderte von Milliarden € weg, die die Banken kurz vorher noch glaubten zu haben. Falls wir das tun, sind wir aber keine Ingenieure mehr, sondern Meister der Geschäftsverwaltung (vornehm "Master of Business Administrations" oder MBA), wenn nicht sogar Politiker. Wollen wir das? Eben! Wir halten unsere Bilanzen ehrlich, die Teilströme säuberlich getrennt, und müssen uns dann auch nicht darüber streiten, ob wir jetzt zuviel oder zuwenig Einwanderer haben. Formeln für Vorwärts- und Rückwärtsstrom im Gleichgewicht Wie groß sind denn nun unsere Vorwärts-und Rückwärtsströme? Hmmmm - für den Vorwärtsstrom ist das nicht so einfach zu sagen. Wir reden über den Anteil eines Gewusels von Elektronen/Löchern, die, falls sie zufällig gegen den Energieberg in der RLZ anrennen, genug Schwung haben, um die Steigung hinaufzukommen. Die Höhe des Bergs, d.h. die Höhe der Energiebarriere, wird dabei sicher eine entscheidende Rolle spielen. Wir können erwarten, daß der übliche Boltzmannfaktor exp –∆E/kT auftaucht - aber so ganz klar sind die Verhältnisse noch nicht. Deshalb schauen wir uns jetzt mal den Rückwärtsstrom an - vielleicht sind die Verhältnisse da einfacher. Was wir bei genauer Betrachtung sehen sind relative wenige Minoritätsladungsträger, die fast überall im Material geboren werden (durch Generation), ziellos durch den Kristall wandern (per "random walk"), und nach Ablauf ihrer (mittleren) Lebensdauer τ durch Rekombination sterben - an einem Ort, der (im Mittel) eine Diffusionslänge L von ihrem Geburtsort enfernt ist. Im feldfreien Bereich des Kristalls laufen diese Ladungsträger energetisch auf einer Ebene. Einige dieser Ladungsträger werden aber auf ihrer Wanderung zufällig an den Rand der RLZ geraten. Was dann geschieht ist exakt dasselbe, was einem besoffenen Radfahrer passiert, der auf einer Ebene in Schlangenlinien durch die Gegend fährt, und plötzlich an eine Abhang gerät: Er fährt hinunter! Und zwar immer! Und zwar völlig unabhängig davon, wie weit hinunter es geht. Wir brauchen keinen Boltzmannfaktor oder sonst was, um den energetisch bergab fließenden Strom zu berechnen. Es reicht völlig aus, zu wissen wieviele besoffene Radfahrer - sorry, Elektronen oder Löcher -pro Sekunde an die Kante des Abhangs gelangen. Damit liegt folgender Ansatz für den Rückwärtsstrom nahe: Der Rückwärtsstrom ist proportional zur Ladungsträgerkonzentration, d.h. jR(L) ∝ – e · nL jR(V) ∝ + e · nV MaWi 2 Skript - Page 230 Die nL,V sind die Konzentrationen der (Minoritäts)elektronen im Leitungsband bzw. Löcher im Valenzband; die Elementarladung e brauchen wir, um aus einem Teilchenstrom einen elektrischen Strom, d.h. Ladungstransport zu machen Dieser Ansatz ist falsch!!!! Warum denn? Die Proportionalität zur Konzentration ist doch offensichtlich? Schon, aber betrachten wir doch noch mal das Radfahrerbild ganz genau: Überall auf der Energiehochebene fahren besoffene Radfahrer "random" durch die Gegend - bis sie nach Ablauf ihrer Lebensdauer τ vom Fahrad fallen oder den pn-Abhang runter sausen und (als Fahrradfahrer) nicht mehr existieren. Das hat aber eine einschneidende Konsequenz: Nach ein paar τ gibt es keine Fahrradfahrer mehr! Um eine konstante Dichte zu erreichen, müssen wir wohl ein paar Kneipen postulieren, die mit konstanter Generationsrate immer neue Radfahrer auf die Reise schicken. Damit haben aber nur die Jungs (und Mädels), die in der Nähe des Abhangs aus der Kneipe kommen, überhaupt eine "Chance", innerhalb ihrer Lebenszeit zufällig an die Kante zu gelangen. Wir können eine Art "Einzugsgebiet" definieren, das natürlich proportional zur Diffusionslänge L sein muß. Der Rückwärtsstrom der Berg runter Fahrenden muß deshalb proportional zu L sein; das ist einsichtig. Aber was ist mit der Konzentration nL,V? Sie nützt gar nichts. Wenn wir in Onkel Dagoberts Geldspeicher ein Loch bohren, ist der daraus abfließende Geldstrom nur für kurze Zeit proportional zur Geldkonzentration im Speicher; nach kurzer Zeit ist er Null - der Speicher ist leer. Sobald alle Radfahrer im Einzugsbereich der RLZ -Kante den Berg hinuntergerauscht oder sowieso vom Rad gefallen sind, ist der Strom versiegt. Damit ist klar: Für "steady state", d.h. konstanten Strom, kann man immer nur soviel pro Sekunde abziehen, wie neu generiert wird. Mehr Radfahrer als im Einzugbereich pro Sekunde aus den Kneipen kommen, können nicht pro Sekunde den Berg hinunterfallen: Der Strom muß also proportional zur Generationsrate sein, nicht zur Konzentration! Die Generationsrate G (im Gleichgewicht) kennen wir aber: Sie ist genauso groß wie die Rekombinationsrate R, wir hatten folgende Formel: (ni)2 nMin GGG = RGG = = τ NDot · τ Die letzte Gleichsetzung muß erklärt werden: Sie folgt aus dem Massenwirkungsgesetz, das uns für die Minoritätsladungsträgerdichte die Beziehung nMin · nMaj = (ni)2 liefert, und aus der üblichen Näherung nMaj ≈ NDot für die Majoritätsladungsträgerdichte bei "mittleren" Temperaturen . Berücksichtigt man, daß die Elektronen im Leitungsband aus dem p- in den n-Bereich in positiver x-Richtung fließen und dementsprechend die Löcher im Valenzband von n- in den p-Bereich in negativer x-Richtung fließen, so erhalten wir schließlich für die Rückwärtsströme – e · L · (ni)2 – e · L · nMin(L) jR(L) = = τ NA · τ – e · L · (ni)2 – e · L · nMin(V) jR(V) = = τ ND · τ Eigentlich müßte statt dem Gleichheitszeichen "=" ein Proportionalitätszeichen "∝" stehen, denn wir wissen nur, daß jR(L,V) proportional zur Diffusionslänge L ist. Wir wissen aber auch, daß die entsprechende Proportionalitätskonstante nicht sehr verschieden von 1 sein kann. "Richtige" Rechnungen zeigen nun, daß sie exakt = 1 ist - wir dürfen also getrost das Gleichheitszeichen benutzen. nMin(L,V) kennzeichnet dabei die Minoritätsladungsträgerdichte im Leitungsband (dann sind es Elektronen) oder im Valenzband (dann sind es Löcher). Die zugehörige Dotierkonzentration ist die der Akzeptoren (für die Elektronen) und die der Donatoren (für die Löcher) - hier muß man etwas aufpassen! MaWi 2 Skript - Page 231 Das war gar nicht so schwer - jedenfalls leichter, als den Vorwärtsstrom zu berechnen. Aber das müssen wir auch gar nicht mehr tun - denn im Gleichgewicht müssen Vorwärts- und Rückwärtsströme in jedem Band für sich identisch sein: – e · L · (ni)2 jR(L) = – jF(L) = NA · τ – e · L · (ni)2 jR(V) = – jF(V) = ND · τ Das ist doch schon was! Wir haben Gleichungen für Ströme, in die die wesentlichen Kenngrößen der Halbleiter eingehen: ni definiert bei gegebener Temperatur die Energielücke, und damit das Grundmaterial, τ sagt was über die Art der Bandstruktur (direkt/indirekt) und über die Perfektion des Kristalls, und NDot sagt was über die Technologie aus was wir mit dem Material gemacht haben. Man beachte, daß die Elektronenströme und die Löcherströme verschieden groß sein werden - sie skalieren direkt mit der Dotierkonzentration. Das wird noch mal sehr wichtig werden! Fragebogen / Questionaire Multiple Choice Fragen zu 6.2.2 MaWi 2 Skript - Page 232 6.2.3 Die Kennlinie des pn-Übergangs Herleitung der "idealen" Kennlinienformel Was geschieht im (idealen) pn-Kontakt wenn wir, wie beim Volumen-Oberflächen Kontakt, jetzt eine externe Spannung anlegen? Im Gegensatz zu dem bereits erfolgten Gedankenversuch in dieser Richtung, sollten wir das jetzt wirklich tun. Dafür gibt es zwei Gründe: 1. Das geht! Ein Stück Si kann man kontaktieren (wir übrigens auch bald). Sowohl zu p- als auch zu n-Si können reale Ohmsche Kontakte gemacht werden; es gibt weder technische noch begriffliche Schwierigkeiten. 2. Wir erwarten, daß durch eine Diode Strom fließen wird (und dann kein Gleichgewicht vorliegen wird), und dazu braucht man selbst in einem Gedankenversuch einen geschlossenen Stromkreis mit Kontakten. Unsere frühere Überlegung, was geschieht, wenn ein externes Potential Uex angelegt wird, bleibt aber unverändert: Wir müssen die linke und rechte Seite des Kontakts um eUex verschieben. Die Fermienergie ist dann aber nicht mehr konstant; im strengen Sinne gibt es sie gar nicht mehr ! Wir können also nicht mehr mit Schritt 1 des Gleichgewichtsrezepts beginnen. Andererseits wird weit weg vom pn-Übergang nicht viel passieren, was vom Gleichgewichtszustand sehr verschieden ist. Falls jetzt Strom fließt, sind die Gebiete weit weg vom pn-Übergang simple Leiter oder besser gesagt Ohmsche Widerstände, und ihr Banddiagramm ist schlimmstenfalls leicht gekippt wie für diesen Fall bereits betrachtet. Wir verlieren durch diese Bahnwiderstände links und rechts vom pn-Übergang also allenfalls einen kleinen Teil der angelegten Spannung, dies werden wir erstmal schlicht ignorieren. Damit können wir links und rechts vom pn-Übergang die Bandstruktur wie gewohnt zeichen, wir können sogar die Fermienergie wieder einzeichnen, um anzudeuten, daß wir nicht weit weg vom Gleichgewicht sind. Gegenüber der Gleichgewichtskonstruktion für Uex = 0 V müssen wir also nur eines der Bänder zusätzlich um eUex verschieben und die beiden Bänder dann wieder "nach Gefühl" verbinden. Das sieht dann so aus: Falls wir rechts den Minuspol der Spannungsquelle anschließen, erhöhen wir das Potential der Elektronen, die n-Seite rutscht um – e ·Uex = +e ·|Uex| nach oben (oder die p- Seite nach unten; wir sind frei bei der Wahl des Nullpunkts). Die Raumladungszone wird kleiner - "gefühlsmäßig", oder nach Formel - falls wir statt ∆EF wieder ∆EF – e · Uex einsetzen (für diesen Fall ist Uex also positiv). Die Energiebarriere wird kleiner. Der Vorwärtsstrom wird sich also deutlich erhöhen; es haben jetzt viel mehr Elektronen im nSi und Löcher im p-Si genügend Energie, um vom eigenen Schwung getragen über den Berg zu kommen. Der Rückwärtsstrom bleibt jedoch unverändert. Die Zahl der pro Sekunde an die RLZ Kante kommenden Minoritäten ist unverändert, und wie tief es hinuntergeht spielt keine Rolle. Die Vorwärtsströme in den jeweiligen Bändern sind also mit wachsender Spannung schnell deutlich größer als die Rückwärtsströme (die wir dann vernachlässigen können), wir haben einen Nettostromfluß in "Vorwärtsrichtung" jF(ex) im äußeren Stromkreis, der ziemlich heftig (vermutlich wohl exponentiell) von der externen Spannung abhängen wird und immer gegeben ist durch jF(ex) = j (L) F – jR(L) + j (V) F – jR(V) Falls wir die Polarität umdrehen, erhalten wir folgendes Banddiagramm Das Potential der Elektronen (also die n-Seite) rutscht um e · Uex nach unten (oder die p-Seite nach oben). MaWi 2 Skript - Page 233 ≈ jF(L) + jF(V) Das Potential der Elektronen (also die n-Seite) rutscht um e · Uex nach unten (oder die p-Seite nach oben). Die Raumladungszone wird größer - "gefühlsmäßig", oder nach Formel, falls wir statt ∆EF wieder ∆EF – e ·Uex einsetzen (für diesen Fall ist also Uex negativ). Die Energiebarriere wird größer. Der Vorwärtsstrom wird also deutlich kleiner; wir können ihn vernachlässigen. Der Rückwärtsstrom bleibt jedoch unverändert. Die Zahl der pro Sekunde an die RLZ Kante kommenden Minoritäten ist unverändert, und wie tief es hinuntergeht spielt keine Rolle. Als Nettostromfluß jR(ex) im äußeren Stromkreis bleibt in "Rückwärtssrichtung" also nur noch der Rückwärtsstrom. Er ist konstant und gegeben durch jR(ex) = j (L) F – jR(L) + j (V) F – jR(V) j (L) R ≈ – + jR(V) Nicht unflott! Wir haben ein typisches Diodenverhalten: Für eine Spannungspolarität fließt ein mit der Spannung rasch zunehmender Vorwärtsstrom durch die Diode; für die andere Polarität ein konstanter spannungsunabhängiger Rückwärtsstrom. Vorwärtsrichtung ist für negative Spannung am n-Bereich, positive Spannung am p-Bereich - leicht zu merken. Ob die Energie für eine gegeben Polarität rauf- oder runtergeht, ist ebenfalls leicht zu merken: In Flußrichtung der Elektronen wird eine Energiebarriere niedriger, falls auf der anderen Seite ein positives Potential dazukommt; für Löcher natürlich umgekehrt. Alles was uns noch fehlt ist eine weitere Gleichung - wir müssen die Spannungsabhängigkeit des Vorwärtsstromes beschreiben. Das können wir aber ziemlich einfach tun. Wir kennen zwei essentielle Eigenschaften des Vorwärtsstromes: 1. Er fließt über eine Energiebarriere (oder Energieschwelle) der Höhe ∆EF ± e|Uex|. Er fließt überhaupt, weil die stromführenden Teilchen eine durch die Temperatur bedingte Energieverteilung haben und es einige damit schaffen können die Energiebarriere zu überwinden. Damit muß er der allgemeinen Formel für diesen Fall gehorchen, und sich wie folgt schreiben lassen ∆EF – eUex jF(Uex) = j0 · exp – kT Wir brauchen irgendeinen Vorfaktor j0, und den entsprechenden Boltzmannfaktor , der die von der externen Spannung Uex abhängige Energiebarriere ∆EF – eUex enthält. 2. Ohne äußere Spannung, d.h. im Gleichgewicht für Uex = 0, muß der Vorwärtsstrom in jedem Band für sich gleich dem (negativen) Rückwärtsstrom sein, d.h. jF(Uex = 0) = – jR. Damit haben wir für jF(Uex) ∆EF – eUex jF(Uex) = j0 · exp – ∆EF = j0 · exp – kT + eUex · exp kT kT || j(Uex = 0) = – jR + eUex jF(Uex) = – jR · exp kT Das war's. Wir müssen jetzt nur noch alles zusammensetzen und erhalten eine erste Form der Diodengleichung MaWi 2 Skript - Page 234 j(Uex) = – jR(L) + jR(V) · eUex exp – 1 kT An dieser Stelle müssen wir die Konvention für die Vorzeichen der Ströme und Spannungen in der Diodengleichung berücksichtigen: Ströme in Durchlaßrichtung werden immer als positiv betrachtet. Spannungen in Durchlaßrichtung werden immer als positiv betrachtet Somit ergibt sich grundsätzlich ein Vorzeichenwechsel zwichen der über der Diode extern angelegten Spannung Uex und der über dem pn-Kontakt ohne Stromfluß abfallenenden Spannung Ubi, mit der man z.B. die Weite der Raumladungszone berechnet. Zusätzlich wissen wir auch schon, wie groß die Rückwärtsströme sind: Generationsrate (= Rekombinationsrate = nMin(L)/ τ) mal Einzugsgebiet (= L) mal Ladung (±e). Einsetzen ergibt die klassische Diodengleichung j(Uex) = e · L · nMin(L) e · L · nMin(V) + τ τ · eUex exp – 1 kT Schreiben wir die Minoritätsladungsträgerdichte mit Massenwirkungsgesetz und Dotierung als nMin = (ni)2 / NDot, erhalten wir j(Uex) = e · L · (ni)2 e · L · (ni)2 + NA · τ ND · τ · eUex exp –1 kT Da die Diffusionslänge L und die Lebensdauer τ eng verwandt sind, kann man über die fundamentale Beziehung L = (D · τ)½ oder τ = (L2 / D) natürlich einen der beiden herauswerfen, und erhält zum Beispiel Bei Elimination von τ j(Uex) = e · D · (ni)2 e · D · (ni)2 + NA · L ND · L · eUex exp – 1 kT Bei Elimination von L haben wir j(Uex) = e · (ni)2 NA D τ ½ e · (ni)2 + ND D τ ½ · eUex exp – 1 kT Und so weiter - man kann den Vorfaktor, der die Rückwärtsström enthält, in noch mehr Varianten schreiben - das kann man auch als intellektuelles Spiel sehen. Die erste Version ist vielleicht am klarsten bezüglich der Natur der Ströme, die letzte bezüglich der entscheidenden Parameter. Schauen wir uns die wesentlichen Parameter noch einmal einzeln an: Der Diffusionskoeffizient D der Ladungsträger ist primär eine Materialkonstante. Er ist über die Einstein Beziehung mit der Beweglichkeit µ gekoppelt, und damit etwas von Defekten, der Temperatur und der Dotierung abhängig. Die intrinsische Ladungsträgerkonzentration ni ist eine echte Materialkonstante - sie spiegelt die Bandlücke wieder - und natürlich sehr stark die Temperatur. Die Diffusionslänge L ist zunächst eine Funktion des Bandtyps (direkt oder indirekt), und dann ein Maß für die Kristallperfektion. Die Dotierkonzentration NDot ist der Technologieparameter - der einzig absichtliche! Mit ihm können wir hier nicht furchtbar viel bewirken; aber das wird sich noch ändern. Die Temperatur T steht explizit und implizit in der Formel. Einmal über ni, ein zweites Mal über D bzw. µ, ein dritte Mal über NDot - bei tiefen Temperaturen bricht die "mittlere Temperaturnäherung" zusammen! Auch wenn nicht jeder Informatiker und Elektrotechniker es gerne hört: Realisierte Informations- und MaWi 2 Skript - Page 235 Kommunikationstechnologie ist angewandte Thermodynamik (und selbstverständlich Quantentheorie). Die externe Spannung Uex ist, wenn man so will, die Inputgröße, und die Stromdichte j(Uex) die Outputgröße der Diode. Eigenschaften der Kennlinie Zunächst halten wir erstmal fest: Ein pn-Kontakt ist immer eine Diode. Strom fließt nur falls die Polarität der angelegten Spannung "stimmt". Das ist inzwischen fast eine Trivialität, aber wir haben inzwischen die Ebene des Gedankenversuchs verlassen und sollten und darüber klar werden: Jeder von uns hat zu Hause so um die 10 000 000 000- 1 000 000 000 000 pnÜbergänge um sich herum, die als unsichtbare (aber nicht immer wirklich stumme) Diener für uns arbeiten (ein ordentlicher Mikroprozessor hat schon > 1 · 109 Transistoren). Hätten wir nicht inzwischen eine intime Beziehung zur Kennlinienformel, könnte man sie fast für furchteregend halten. Wir aber verstehen sofort die möglichen einfachen Näherungen: Für positive Spannungen am p-Si (leicht zu merken), ist der Exponentialterm sehr schnell sehr viel größer als 1; wir können die "– 1" vergessen und erhalten für den Vorwärtsstrom einer Diode in guter Näherung jF ≈ jR(L) + jR(V) · eUex exp kT In anderen Worten: Eine simple Exponentialfunktion. Für eUex = kT (oder U ≈ 1/40 V) ist der Vorwärtsstrom um einen Faktor e größer als der Rückwärtsstrom jR, d.h. immer noch ziemlich klein; aber für U ≈ 1 V ist er schon sehr viel größer (um e40!). In Rückwärtsrichtung wird der Exponentionalterm schnell gegen Null tendieren, d.h. wir haben die extrem einfache Beziehung für den Rückwärtsstrom: jR ≈ jR(L) + jR(V) Einfacher geht's nicht - außerdem wird spätensten hier klar, warum wir den Ausdruck " Rückwärtsstrom" für die beiden Teilstromkomponenten bevorzugen, die mansonst ja auch "Generationstrom", "Driftstrom" oder "Feldstrom" nennt. Wie die Kennlinie jetzt aussieht, ist also hinreichend klar. Hier zwei Arten der Darstellung Zuerst die einfache lineare Auftragung. Hier die wesentlich aussagekräftigere Darstellung mit logarithmischer Stromdichte (und Beträge von Spannung und Strom) MaWi 2 Skript - Page 236 Zahlen sind absichtlich nicht eingefügt, denn die erarbeiten wir uns in Übungsaufgaben. Es lohnt sich, in diese (Monster)aufgabe reinzuschauen, denn sie enthält auch Anworten auf Fragen, die wir noch gar nicht gestellt haben - die man sich aber stellen sollte. Übung 6.2-1 Diodenkennlinie So ganz langsam sollte jetzt eine ganz wichtige Frage hochkommen: Stimmt das auch alles? Was sagt das Experiment - denn nur das zählt! Das Experiment sagt: Es kommt darauf an - und zwar auf ziemlich viele Dinge. Zunächst haben wir den fundamentalen Unterschied: Ideale Diode - Reale Diode. Gerechnet haben wir die ideale Diode. Hier sind die Unterschiede Ideale Diode Reale Diode Geometrie "Unendlich" ausgedehnt ab Kontakt, zumindest sind alle Abmessungen >> L Sehr klein; alle Abmessungen << L Dotierung Konstant Variiert stark mit Entfernung vom Kontakt Bahnwiderstände Keine Immer vorhanden Parallelwiderstände ("lokale Kurzschlüsse") Keine Je nachdem Einfluß Oberflächen Keine Potentiell groß, da immer nahe zum Kontakt Zulässige Spannungen Alle Wird bei Durchlaßspannungen >> wenige V zu heiß; knallt durch bei zu hohen Sperrspannungen. Generation/ Rekombination in RLZ Keine Immer vorhanden Alle Punkte bei der Realdiode mit Ausnahme des letzten könnten wir eliminieren, falls wir uns Mühe geben, und eine (technisch nutzlose) Diode bauen, die unserer Idealdiode nahe kommt. Was wir dann erhalten, läßt sich pauschal wie folgt ausdrücken Für Halbleiter mit relativ kleinen Bandlücken ( < ca. 0,8 eV; z.B. Ge) stimmt die Theorie ziemlich gut. Für Halbleiter mit relativ großen Bandlücken ( > ca. 1eV; z.B. Si) stimmt die Theorie ziemlich schlecht. Insbesondere ist der Sperrstom viel zu hoch und leicht spannungsabhängig. Der wesentliche Grund ist, daß wir all die Ladungsträger, die in der RLZ generiert werden (oder rekombinieren), einfach ignoriert haben. Aber Generation findet auch in der RLZ ständig statt. Je nach Überschußenergie und Impulsrichtung, wird der irgendwo in der RLZ neugeborene Ladungsträger den Berg hinauflaufen oder hinunterfallen - es werden also sowohl Vorwärts- als auch Rückwärtsstromkomponenten in der RLZ erzeugt. Das ist genau wie im richtigen Leben: Auch entlang des Abhangs gibt es Kneipen, die besoffene Radfahrer generieren, die je nach Anfangsschwung und Richtung oben oder unten enden werden, und Radfahrer die "im Berg" vom Rad fallen, also in der RLZ rekombinieren. Die Berechnung dieser Stromkomponenten gilt i.a. als sehr schwierig; selbst im Rahmen der schon selbst nicht übermäßig einfachen Shockley-Read-Hall Theorie ist einiger Rechenaufwand mit zahlreichen Annahmen und Näherungen notwendig. Deswegen wollen wir hier nur zwei Anmerkungen machen: 1. Falls man die Raumladungszone in die Strombilanzen einbezieht, erhält man eine Gleichung für die Kennlinie, die sehr gut stimmt - für alle Halbleiter. 2. Es ist aber gar nicht so schwer, die Teilströme aus der RLZ zu berücksichtigen. Qualitativ ist es kein besonderes Problem, und mit ein bißchen intelligentem Raten erhält man sogar sofort die richtigen Gleichungen. Das schauen wir uns im nächsten Unterkapitel mal an Fragebogen / Questionaire Multiple Choice Fragen zu 6.2.3 MaWi 2 Skript - Page 237 6.2.4 Der Beitrag der Raumladungszone zur Kennlinie des pn-Übergangs Der Strombeitrag der Raumladungszone Was wissen wir über die in der Raumladungszone generierten Ströme? Es wird an jeder Stelle eine Generationsrate geben, und die insgesamt pro Sekunde generierten Ladungsträger können als Ströme abfließen - zwei Teilströme im Leitungsband (Vorwärts und Rückwärts), und dasselbe nochmal im Valenzband. Schematisch sieht das so aus: Um ein Gefühl für die Größenordnung des Effekts zu bekommen, fragen wir uns zunächst: Falls alle Teilströme in eine Richtung fließen würden - wir groß wäre die Summe, der maximale Strom jmax(RLZ) der überhaupt aus der RLZ kommen könnte, im Gleichgewicht? Einfache Frage, einfache Antwort: jmax(RLZ) wird gegeben sein durch die Breite dRLZ multipliziert mit der Generationsrate GRLZ in der RLZ, denn das gibt uns die Zahl (immer pro cm2da wir Stromdichten betrachten) der pro Sekunde zur Verfügung stehenden Ladungsträger; wir haben jmax(RLZ) = 2e · dRLZ · GRLZ Der Faktor 2 ist der erste (noch ziemlich bescheidene) Trick: Wir zählen beide Ladungsträger im Zweifel als Minoritäten, d.h. sowohl die Elektronen als auch die Löcher können Strombeiträge liefern. Wenn wir uns die Ladungsträgerdichten in der RLZ nochmals anschauen (Bild unten), sehen wir, daß das einerseits natürlich nicht stimmt, andererseits kann aber auch ein Majoritätsladungsträger in der RLZ zumindest zum Rückwärtsstrom beitragen, falls er energetisch "nach oben" läuft. Viel gravierender ist aber, daß die Generationsraten nach wie vor durchG = nmin /τ gegeben ist. Da aber die Konzentration der Minoritätsladungsträger sich in der RLZ über viele Größenordnungen ändert und überdies sogar der Typ "umschlägt", haben wir jetzt ein massives Problem: Wir wollen die Gesamtzahl aller generierten Ladungsträger, und das involviert jetzt ein kompliziertes Integral, eine Aufsummation über die lokale Generationsrate G(x) - einerseits. Andererseits, was immer herauskommen würde - es läßt sich immer durch eine gemittelte Generationsrate GRLZ ausdrücken, die dann eine gemittelte Ladungsträgerdichte <nRLZ>braucht , d.h. <GRLZ>= <nRLZ>/ τ. Falls wir eine sinnvolle mittlere Dichte <nRLZ>erraten können, sind wir einen Schritt weiter. Was sollen wir nehmen? Genau! Ein Blick auf die Ladungsdichteverteilung macht deutlich, daß sich ganz natürlich die intrinsische Ladunggsträgerdichte ni als Mittelwert anbietet; sie liegt notgedrungen zwischen den Extremwerten links und rechts; und was besseres können wir nicht erraten. Wir setzen also erstmal für den maximalen Strom aus der RLZ MaWi 2 Skript - Page 238 ni jmax(RLZ) = 2e · dRLZ · τ Das ist doch schon mal ein Anfang. Wir wissen aber noch mehr. Im Gleichgewicht fließt nach wie vor kein Nettostrom , und das bedeutet, daß sich der Strom aus der Raumladungszone genau hälftig auf die Vorwärts- und Rückwärtsrichtung aufteilen muß, wir haben jmax | jF |(RLZ) = | j |R(RLZ) = ni = e · dRLZ · τ 2 Damit kennen wir bereits den Rückwärtstrom im Gleichgewicht, d.h. ohne äußere Spannung. Was passiert nun, wenn wir eine externe Spannung Uex anlegen und damit die Höhe der Energieschwelle ändern? Genau dasselbe wie bei der Betrachtung der Volumenbeiträge: Wie zuvor, nehmen wir einfach an, daß dem Rückwärtsstrom die Höhe der Energieschwelle ziemlich egal ist. Das ist zwar nicht ganz richtig, denn für große Sperrspannungen wird letzlich praktisch alles was in der RLZ generiert wird den Berg hinunterfließen, d.h. der Rückwärtsstrom wird gleich dem Maximalstrom aus der RLZ sein, und nicht nur die Hälfte davon - aber das macht gerade mal einen Faktor 2 aus. Im Rahmen unserer Trickserei können wir das großzügig ignorieren. Einen wesentlichen Unterschied zur Betrachtung der Rückwärtsströme aus dem Volumen gibt es aber schon: Die RLZ wird mit zunehmender Spannung größer - wir erwarten also, daß der Rückwärtsstrom aus der RLZ mit zunehmender Spannung zunimmt (mit der Wurzel aus Uex , um genau zu sein). Nun zur Vorwärtsrichtung. Die gesamte Energieschwelle ist wieder um – eUex kleiner als im Gleichgewicht für Uex = 0 V. Aber wir haben einen großen Unterschied zur Volumensituation: Je nachdem ob ein bestimmter Ladungsträger eher am Fuße oder eher am oberen Ende des Energiebergs generiert wurde, muß er fast den ganzen Energieberg überwinden, oder nur ein letztes kleines Reststück. In anderen Worten: Die Höhe der Energieschwelle für den Vorwärtsstrom ist - wie die Generationsrate - stark ortsabhängig. Wiederum müßten wir über die ortsabhängigen Boltzmannfaktoren aufsummieren, und wiederum verwenden wir denselben Trick: Wir nehmen einfach eine "mittlere" Energiebarriere, den Mittelwert aus maximaler Energieabsenkung (= eUex ) und minimaler Energieabsenkung (= 0 eV), also eUex /2. Damit können wir sofort den aus der RLZ stammenden Vorwärtsstrom hinschreiben: eUex jRLZ, F(Uex ) = jRLZ, R · exp – e · ni · dRLZ = eUex · exp τ 2kT 2kT Der gesamte Strom jRLZ(Uex) ist wie zuvor durch die Differenz jRLZ, F – jRLZ, R gegeben (mit einer Faktor 2 Unsicherheit), wir erhalten e · ni · dRLZ jRLZ(Uex ) = τ eUex · exp 2kT –1 Das ist - bis auf einen Faktor 2 - genau die Gleichung, die man bekommt, wenn man "richtig" rechnet. Damit erhalten wir die vollständige Diodengleichung in voller Schönheit (damit die Gleichung nicht zu lang wird verzichten wir auf die Indizes) j = e · L · ni 2 e · L · ni 2 + τ · NA τ · ND · eU exp – 1 kT e · ni · d(U) + τ eU exp – 1 2kT Die Größen L und τ beziehen sich auf die jeweiligen Teilchensorten (im ersten Summand die Elektronen, im zweiten die Löcher), denn sie können im Prinzip für Löcher und Elektronen verschieden sein. MaWi 2 Skript - Page 239 Das ist jetzt eine nicht mehr auf den ersten Blick zu überschauende Gleichung; wir müssen sie diskutieren. Zuerst betrachten wir die Vorwärtsrichtung. Sobald wir die "–1" vernachlässigen können, ergibt sich der Vorwärtsstrom in halblogarithmischer Auftragung als die Überlagerung zweier Geraden mit relativer Steigung 1 und ½. Für kleine Spannungen gewinnt dabei immer die kleine Steigung; dies ist im folgenden Diagramm leicht zu sehen. Für kleine Spannungen und damit auch Ströme "gewinnt" der Vorwärtsanteil der Raumladungszone. Was dabei "klein" heißt, hängt von der Diffusionslänge bzw. Lebensdauer ab. Kleine Diffusionslängen, d.h. schlechte kristalline Qualität, führt zur Ausdehnung der "Steigung ½" Zone Auch der Einfluß der Temperatur ist für den Volumen- und RLZ Anteil verschieden. Aber das ist alles Stoff für Übungsaufgaben. Insgesamt erwarten wir eine (logarithmische) Kennlinie mit einem "Buckel" in Vorwärtsrichtung. Die Größe des Buckels ist ein indirektes Maß für die kristalline Qualität des Materials. Der Faktor 2 im Nenner war mehr oder weniger geraten. In der Realität kann er andere Werte haben. Oft nennt man den gemessen Zahlenwert den Idealitätsfaktor n der Diode. "Ideale" Dioden hätten dann n = 1. Wie sieht es in Rückwärtsrichtung aus? Dazu bilden wir einfach das Verhältnis aus den Rückwärtsströmen des Volumens (jR(Vol)) und der Raumladungszone (jR(RLZ)), und bekommen e · (ni)2 · L τ · NDot jR(Vol) = jR(RLZ) ni · L = e · ni · dRLZ NDot · dRLZ τ Der entscheidende Faktor ist ni/NDot. Mit zunehmender Energielücke nimmt ni exponentiell ab; der Volumenanteil des Rückwärtsstroms wird bei "großen" Bandlücken gegenüber dem Raumladungszonenanteil zu vernachlässigen sein. Mit zunehmender Temperatur nimmt ni exponentiell zu (während NDot, die Konzentration der ionisierten Dotieratome ziemlich konstant bleibt). Damit wird bei hohen Temperaturen wieder das Volumen dominieren. Damit können wir jetzt einen Blick auf gemessene Kennlinien werfen: MaWi 2 Skript - Page 240 Das sieht doch schon ganz gut aus: Beim Ge spielt der Einfluß der Raumladungszone keine große Rolle (d.h. ni >> NDot); die gemessene Kennlinie würde der gezeigten theoretischen Kennlinie ganz gut folgen. Beim Si, mit einer Energielücke bei der sich offenbar der Anteil der Raumladungszone deutlich bemerkbar macht, ist der "Buckel in Vorwärtsrichtung klar zu erkennen; in Rückwärtsrichtung ist der Sperrstrom weit größer als die simple Theorie vorhersagt und leicht spannungsabhängig - paßt! Daß noch einige zusätzliche Effekte dazukommen - bei zu hoher Spannung in Rückwärtsrichtung wird es irgendwann knallen, ohmsche Widerstände (= Bahnwiderstände) werden sich bei hohen Strömen bemerkbar machen, etc. - wen wundert's. Aber das soll uns hier nicht weiter beschäftigen. Wir haben damit ein ziemlich umfassendes Verständnis des pn-Übergangs erreicht - ohne ein einziges Mal richtig gerechnet zu haben. Aber dafür haben wir jetzt Material für Übungsaufgaben! Übung 6.2-2 Diodenkennlinie mit RLZ Fragebogen / Questionaire Multiple Choice Fragen zu 6.2.4 MaWi 2 Skript - Page 241 6.2.5 Zusammenfassung Kapitel 6.2 Intrinsische Halbleiter Das Banddiagramm des pn-Übergangs erhält man nach "Rezept": In der mit der Bandverbiegung immer verbundenen Raumladungszone (RLZ) sitzen die ortsfesten ionisierten Dotieratome. Die beweglichen Elektronen und Löcher fehlen in der Raumladungszone - falls einer dieser Ladungsträger sich dorthin verirrt, wird er sofort durch das elektrische Feld "hinausgeworfen". Die damit verbundenen Ströme müssen im Mittel = 0 sein, dies ist im rechten Diagramm angedeutet. Im Ortsbild sieht ein pn-Übergang und die Konzentration der beweglichen Ladungsträger wie folgt aus: Die über den pn-Übergang fliessenden Ströme kann man für Löcher und Elektronen getrennt betrachten. Für jede Ladungsträgerart gibt es immer zwei gegenläufige Komponenten: Majoritätsladungsträger fließen energetisch "aufwärts"; diese Stromkomponente heißt Diffusionsstrom, Rekombinationsstrom oder Vorwärtsstrom jF. Nur wenigen der vielen Majoritäten wird es gelingen, die Energiehürde zu überwinden und zu diesem Strom beizutragen. Minoritätsladungsträger fließen energetisch "abwärts", diese Stromkomponente heißt Feldstrom, Driftstrom, Generationsstrom oder Rückwärtsstrom jR. Alle der wenigen Majoritäten, die an die Kante der RLZ gelangen, werden den Energieberg "hinunterfallen". Im Gleichgewicht müssen beide Ströme gleich groß sein; jF = – jR. Für den Rückwärtsstrom kann man sofort eine Formel angeben. Er muß proportional sein zum Einzugsgebiet der RLZ und damit zur Diffusionlänge L (nur Minoritäten, die während ihres "random walk" überhaupt bis zur RLZ kommen, können "hinunterfallen") und zur Generationsrate G = nR/τ (es kann nicht mehr abfließen als was nachgeliefert wird). Im Gleichgewicht (keine äußere Spannung und damit kein Nettostrom) haben wir unter Verwendung des Massenwirkungsgesetzes, der Annahme, daß alle Dotieratome ionisiert sind und des "übergeordneten" Wissens, dass die Proportionalitätskonstante = 1 ist – e · L · (ni)2 – e · L · nMin(L) jR(L) = – jF(L) = = τ NA · τ – e · L · (ni)2 – e · L · nMin(V) jR(V) = – jF(V) = = τ ND · τ Mit einer externen Spannung Uex wird die Energiehürde größer oder kleiner - je nach Vorzeichen. Das hat aber nur Auswirkungen auf den Vorwärtsstrom - seine Größe relativ zum Gleichgewichtsfall ändert sich mit einem entsprechenden Boltzmannfaktor; wir haben MaWi 2 Skript - Page 242 eUex jF(Uex) = jF(Uex = 0) = – jR · exp kT Die (vorzeichenrichtige) Addition aller 4 Teilströme unter Berücksichtigung der Vorzeichenkonvention Ströme in Durchlaßrichtung werden immer als positiv betrachtet Spannungen in Durchlaßrichtung werden immer als positiv betrachtet ergibt die (elementare) Diodengleichung j(Uex) = e · L ·nMin(L) e · L ·nMin(V) + τ τ · eUex exp – 1 kT Diese Gleichung läßt sich in vielen Varianten schreiben, je nachdem welche Parameter man bervorzugt (L und τ wie oben, oder D und τ, oder .... . Graphisch sieht das in linearer oder (besser) halblogarithmischer Auftragung so aus: In der Formel stecken jedoch viele Idealisierungen, die bei realen Dioden zu kurz greifen. Insbesondere werden auch in der RLZ Ladungsträger generiert (oder rekombiniert). Das läßt sich nur mit erheblichem Aufwand (und vielen Näherungen) halbwegs sauber quantitativ fassen; jedoch gibt auch schon eine simple Plausibilitätsbetrachtung die richtige Formel für den Diodenstrom unter Berücksichtigung der RLZ Komponenten: j = e · L · ni 2 e · L · ni 2 + τ · NA τ · ND · eU exp – 1 kT e · ni · dRLZ(U) + τ eU exp – 1 2kT Für das Verhältnis der Rückwärtsströme nur aus dem Volumen und nur aus der RLZ folgt e · (ni)2 · L τ · NDot jR(Vol) = jR(RLZ) ni · L = e · ni · dRLZ NDot · dRLZ τ Damit wird für alle Halbleiter mit "großer" Bandlücke oder ni << NDot der Rückwärtsstrom (= Leckstrom) durch den RLZ Anteil dominiert. Damit ist der RLZ Anteil zum Diodenstrom technisch sehr wichtig. Insbesondere ist Si in diesem Zusammenhang ein Halbleiter mit großer Bandlücke, dies zeigt sich in dem (immer noch stark idealisiertem) Vergleich der Theorie und des Experiments MaWi 2 Skript - Page 243 MaWi 2 Skript - Page 244 6.2.6 Merkpunkte Kapitel 6.2 Banddiagramm pn-Übergang im Gleichgewicht: Ströme in jedem Band sind entgegengesetzt gleich groß. Zwei grundsätzliche Sorten: Majoritätsladungsträger fließen "bergauf" = Vorwärtsstrom jF (Diffusionsstrom, Rekombinationsstrom). Minoritätsladungsträger fließen "bergab" = Rückwärtsstrom jR (Feldstrom, Driftstrom, Generationsstrom). Im GG gilt jR = – jF. Rückwärtsstrom jR sofort verständlich; Proportional zum "Einzugsgebiet, d.h. Diffusionslänge L. Proportional zur Generationsrate G = nMin/τ. – e · L · (ni)2 – e · L · nMin jR = – jF = = τ NA · τ "Radfahrermodell" zur Veranschaulichung Mit externer Spannung Uex ändert sich die Höhe der Energiebarriere. eUex jF(Uex) Nur der Vorwärtsstrom ändert sich (mit einem Boltzmannfaktor). Die komplette Strombilanz führt sofort auf die (elementare) Diodengleichung. kT j(Uex) = Gilt nur für ideale Diode ohne Berücksichtigung von Ladungsträgergeneration in der RLZ. Berücksichtigung RLZ ist tricky, aber leicht zu veranschaulichen: Ein weiterer Term ist zur Stromgleichung zu addieren. Konsequenz: Für Halbleiter mit "großer" Bandlücke (schon für Si) dominiert der RLZ Term in Rückwärtsrichtung; d.h. der Leckstrom einer Si Diode wird durch den RLZ Beitrag dominiert. = – jR · exp j = e · L ·nMin(L) e · L ·nMin(V) + τ τ e · L · ni 2 e · L · ni 2 + τ · NA e · ni · dRLZ(U) + τ MaWi 2 Skript - Page 245 τ · ND eU exp – 1 2kT · exp exp · eUex – 1 kT eU – 1 kT 6.3 Halbleiter-Metall Kontakt 6.3.1 Bandstruktur des Halbleiter-Metall Kontakts Konstruktion der Banddiagramme Die Eigenschaften des Halbleiter-Metall Kontakts definieren sich, wie wir inzwischen gelernt haben, weitgehend aus dem Banddiagramm. Die Konstruktion des Banddiagramms ist jetzt relativ problemlos - wir verwenden unser altes Rezept. Einige zusätzlich notwendige Spezialitäten diskutieren wir sobald sie auftauchen. Wir brauchen die Fermienergie des jeweiligen Metalls. Das ist aber nichts anderes als die Austrittsarbeit W; wir gehen davon aus, daß sie bekannt ist. Wir müssen uns allerdings für eine der vier möglichen Varianten entscheiden: Halbleiter (HL) Fermienergie Metall relativ zum HL im Banddiagramm Austrittsarbeit W Höher WHL < WMe Niedriger WHL > WMe Höher WHL < WMe Niedriger WHL > WMe n-Typ p-Typ Die Spalte mit den Austrittsarbeiten erinnert auch daran, daß eine Fermienergie, die im Banddiagramm "höher" liegt, eine kleinere Austrittsarbeit hat, da die absolute Energieskala mit Nullpunkt "im Unendlichen" von oben nach unten läuft. Warum diese Fallunterscheidungen sinnvoll sind, werden wir sehen, sobald wir die Konstruktion versuchen. Das Banddiagramm des Halbleiters kennen wir, das Banddiagramm eines Metalls eigentlich nicht. Uneigentlich aber schon - es ist einfach ein bis zur Fermikante gefülltes Kontinuum. Wir behandeln mal die beiden Fälle zum n-Typ Halbleiter parallel, exakt so wie wir es beim pn-Übergang gemacht haben. Wir müssen aber einen Punkt "0" vorschalten: Die Ausgangssituation hat sich geändert! Wir haben jetzt einen "Hetero"kontakt (im Gegensatz zu dem bisher behandelten Si - Si "Homo"kontakt. Es gibt also nicht mehr auf beiden Seiten eine im Material immanent vorhandene Referenzenergie, z.B. die Valenzoder Leitungsbandkante, die wir als Nullpunkt oder auch nur als gemeinsamer Referenzpunkt der Energieskala auf beiden Seiten benutzen können. Wir müssen jetzt eine gemeinsame Referenzenergie, einen Energienullpunkt zusätzlich einführen. Das ist die Vakuumenergie, d.h. die Energie die ein aus dem Material entferntes Elektron im "Unendlichen" haben wird; sie ist per definitionem = 0. Damit können wir jetzt versuchen, die Banddiagramme für die beiden möglichen Fälle paralle zu konstruieren. WHL < WMe 0. Ausgangssituation Die Vakuumenergie ist jetzt auch eingezeichnet, um die Austrittsarbeiten verdeutlichen zu können. Die von Elektronen besetzten Zustände sind lindgrün markiert Was beim Kontakt geschehen wird ist klar: Links werden (netto) Elektronen vom Halbleiter ins Metall wandern und das Metall negativ aufladen, rechts ist es genau umgekehrt. 1. Zeichne die Fermienenergie als horizontale Linie; markiere den Kontakt MaWi 2 Skript - Page 246 WHL > WMe 2. Zeichne "weit" links vom Kontakt das Banddiagramm von Material 1; weit rechts das von Material 2; immer relativ zu der bereits festgelegten Fermienergie. Unvermeidliche Konsequenz: Die Nullpunktslinie muß eine Kinke bekommen! Etwas seltsam - aber klar!?? Nein? Dann den Link betätigen! Hier nur soviel: Gleichgewicht für das System mit vielen Elektronen wird in Banddiagrammen charakterisiert durch ein fiktives Elektron mit einer überall konstanten Fermienergie. Betrachtet man aber einen energetisch Null ergebenden Kreisprozeß für ein reales Elektron, läßt sich das nicht ohne eine gewisse Inkonsistenz, eben eine "Kinke" in der Energienulllinie, in ein- und derselben Zeichnung darstellen. Das hat aber keine Bedeutung; wir haben nur ein weiteres Beispiel, dass hochverdichtete abstrakte Schemata gegentlich an Grenze stoßen. 3. Verbinde Leitungs- und Valenzband durch eine "gefühlsmäßig" gezeichnete Bandverbiegung. Ein erstes Problem taucht auf: Es gibt kein Leitungs- und Valenzband auf der anderen Seite. Was wird verbunden? In diesem Fall gilt: Verbinde korrespondierende Zustände für Elektronen (und oder Löcher). Auf jeden Fall müssen wir eine Bandverbiegung im Halbleiter konstruieren, der für Elektronen wie ein Potentialberg der Höhe ∆EF wirkt; denn es gilt das Gleichgewichtsprinzip: Ein Elektron gewinnt keine Energie mehr durch einen Übergang vom Halbleiter ins Metall (links) bzw. vom Metall in den Halbleiter (rechts). Raumladungszone Akkumulation - neu! Warum keinen Potentialberg im Metall? Im Prinzip sollte (und wird) auch im Metall ein Potential"gefälle" sein. Aber die "Dicke" (= Debye Länge) ist immer so klein, dass diese Potentialbarriere kein Rolle spielt; die Ladungsträger tunneln einfach durch. Falls das Gefühl immer noch nicht reicht: Wir wissen immer, auf welcher Seite die Elektronen zurückgedrängt oder "angezogen" werden. Das Band muß dann immer so gebogen werden, daß der Abstand Fermienergie Leitungsbandkante sich entsprechend vergrößert oder verkleinert. Wir haben auch "Vorwärts"- und "Rückwärts"ströme (grüne und blaue Pfeile), die notgedrungen betragsmäßig gleichgroß sein müssen. Wir wissen bloß nicht so recht, welche Farbe vorwärts bzw. rückwärts symbolisiert. Die jeweiligen Ladungsüberschüsse sind angedeutet: Links eine Flächenladung von Elektronen auf der Metallseite (die Gegenladungen der positiv ionisierten Donatoren sind aus Gründen der Übersichtlichkeit nicht eingezeichnet); rechts eine positve Flächenladung auf der Metallseite und eine Anhäufung von Elektronen auf der Halbleiterseite. Im linken Fall bildet sich also eine Raumladungszone wie gehabt, im rechten Fall aber haben wir etwas neues; das wir kurz besprechen müssen MaWi 2 Skript - Page 247 Akkumulation als neues Phänomen Wir haben offensichtlich die Dichte der Majoritätsladungsträger lokal erhöht. Das ist neu - bisher wurde sie durch Kontakte immer nur erniedrigt. Es gibt aber keinen Grund, warum das nicht auch passieren kann. Die Fermienergie liegt jetzt sogar für ein kurzes Stückchen im Leitungsband - auch dagegen spricht vom Grundsatz her nichts. Obwohl das ein prinzipiell völlig normales Verhalten ist, spricht man in solchen Fällen von "entarteten Halbleitern" (engl. "degeneration"). Eine Entartung kann auf mannigfaltige Weise erreicht werden. Im Gleichgewicht zum Beispiel durch Sehr hohe Dotierung. Kontakte, die so gebaut und/oder vorgespannt sind, daß sie die Majoritätsladungsträger anziehen und damit am Kontakt anreichern - wie im obigen rechten Fall. Man spricht dann von Anreicherung oder Akkumulation. Man kann Akkumulation aber auch im Nichtgleichgewicht erreichen. Das scheint zwar ein Widerspruch in sich zu sein, denn in Nichtgleichgewicht ist die Fermienergie eigentlich gar nicht definiert; Aussagen über ihre Lage sind dann im Prinzip sinnlos. Ladungsträgerkonzentrationen sind aber immer definiert, und man kann sich natürlich die Frage stellen: Wo müßte die Fermienergie liegen, wenn für die vorliegenden Ladunsgträgerkonzentrationen Gleichgewicht herrschen würde? Was herauskommt nennt man "Quasifermienergie". Das ist nicht nur eine sehr sinnvolle Größe, sondern sie kann auch im Leitungs- oder Valenzband des Halbleiters liegen und damit Entartung signalisieren. Machbar ist Entartung in diesem Fall insbesondere, indem man über z.B. über einen pn-Kontakt Unmengen an Ladungssträger in die jeweils ander Seite injiziert. Jeder Halbleiterlaser beruht auf diesem Prinzip; Entartung im Nichtgleichgewicht ist die absolut notwendige Bedingung für sein Funktionieren Noch etwas unklar ist die Ausdehnung der Akkumulationszone. Aber im Grunde sind wir schon einmal auf eine ähnliche Fragestellung gestoßen - sie wurde in einem eigenen Modul behandelt. Die Ausdehnung der Akkumulationszone ist identisch mit der Eindringtiefe eines externen elektrischen Feld in ein Material. Und jedes Feld wird solange in ein Material eindringen, bis jede Feldlinie eine Ladung gefunden hat, auf der sie enden kann. Betrachten wir zum Beispiel ein Metall, dann gibt es entweder sehr viele Elektronen, oder, falls ich die Elektronen nur ein ganz kleines bißchen zurückdränge, sehr viele positiv geladene Metallionen, die jedes Feld auf kürzeste Distanz "absorbieren" oder abschirmen können. Die Dicke dieser "Abschirmschicht" heißt Debyelänge; Details dazu finden sich in in anderen Hyperskripten. In dotierten Halbleitern (und nur in dotierten Halbleitern), muß die Lage differenziert gesehen werden. Für eine Polarität der Feldes wird die Abschirmung durch die beweglichen Majoritätsladungsträger übernommen werden können. Es sind viele, und sie sind beweglich; sie können sich also in Grenzflächennähe anhäufen (= akkumulieren) - die Debyelänge ist entsprechend klein. Polt man das Feld um, muß es jetzt von den unbeweglichen ionisierten Dotieratomen abgefangen werden. Sie sind nicht beweglich, ihre Dichte ist viel kleiner als die der positiv geladenen Metallionenrümpfe, und man muß schon eine größere Zone - eben die Raumladungszone - von den beweglichen Majoritätsladungsträgern freiräumen, um genügend Dotieratome zu "entblößen", die das Feld abschirmen können. Die Debyelänge ist größer als im umgekehrten Fall - nur daß man sie nicht mehr Debyelänge nennt, sonder Raumladungszonenweite. Offenbar nimmt die Debyelänge mit der Konzentraion an verfügbaren Ladunsgträgern ab - in Metallen ist sie typischerweise < 1 nm - man sagt "elektrische Felder können in Metalle nicht eindringen". In Isolatoren geht sie gegen ∞, und in (dotierten) Halbleitern ist sie nicht besonders groß, aber doch deutlich größer als in Metallen. Auch dazu haben wir schon mal einen "advanced" Modul bemüht. Langer Rede kurzer Sinn: Das bißchen Bandverbiegung, das in rechten Fall noch eingezeichnet ist, symbolisiert jetzt die Debyelänge; sie ist auf jeden Fall viel kleiner als die Raumladungszonenweite. So weit so gut. Die Frage ist jetzt natürlich: Was passiert, wenn wir eine externe Spannung anlegen. Dieser Frage werden wir im nächsten Unterkapitel nachgehen Fragebogen / Questionaire Multiple Choice Fragen zu 6.1.3 MaWi 2 Skript - Page 248 6.3.2 Schottky Kontakte und Ohmsche Kontakte Der Halbleiter-Metall Kontakt unter Spannung Im Grunde ist klar was zu tun ist: Wir nehmen die Gleichgewichtsbanddiagramme und verschieben beide Seiten etwas um – eUex; mit Uex als externe Spannung. Dazu müssen wir nur die Bildserie des vorhergehenden Unterkapitels weiterführen. Als erstes schauen wir uns die Gleichgewichtsstruktur noch einmal an: WHL < WMe WHL > WMe Jetzt legen wir den positiven Spannungspol an die Halbleiterseite. Damit sinkt sie im Potential (oder die Metallseite steigt). Das sieht so aus: Hier ist die Energiebarriere aus Sicht der Elektronen des Halbleiters größer; der Strom der Elektronen aus dem Halbleiter in das Metall versiegt. Aus Sicht des Metalls ändert sich nichts. Hier haben die Elektronen des Metalls keine Probleme, in den Halbleiter überzutreten; der entgegengesetzte Strom wird aber schnell auf Null fallen. Netto bleibt jetzt nur der Strom der Elektronen aus dem Metall in den Halbleiter. Er kann nicht sehr groß sein, denn auch er muß über eine Energiebarriere fließen, deren Höhe sich aus der Differenz der Austrittsarbeiten bestimmt. Damit hängt er zwar von der Materialkombination, aber kaum von der angelegten Spannung ab. Stromfluß ist aus Sicht des Kontakts fast unbegrenzt möglich; letztlich werden die ohmschen Widerstände begrenzend wirken. In Dioden"lingo" ist das also der " Rückwärtsstrom". Im wesentlichen "sehen" wir in diesem Ast der Kennlinie einen exponentiell mit der Spannung anwachsenden Strom, nur begrenzt durch den (kleinen) ohmschen Widerstand des Systems. Jetzt polen wir um und legen wir den negativen Spannungspol an die Halbleiterseite. Damit steigt die potentielle Energie der Halbleiterseite (oder die der Metallseite sinkt). Das sieht so aus: Die Energiebarriere sinkt und der Elektronenstrom vom Halbleiter in das Metall steigt, wie beim pnÜbergang, exponentiell mit der Spannung Die Elektronen des Halbleiters haben keine Probleme in das Metall überzutreten; der entgegengesetzte Strom wird auf Null fallen. MaWi 2 Skript - Page 249 Der Rückwärtsstrom vom Metall in den Halbleiter bleibt unverändert; aus Sicht des Metalls hat sich ja nichts geändert. Stromfluß ist aus Sicht des Kontakts fast unbegrenzt möglich; letztlich werden die ohmschen Widerstände begrenzend wirken. Die Situation ist ziemlich ähnlich zum Vorwärtsbetrieb eines pn-Übergangs Im wesentlichen "sehen" wir in diesem Ast der Kennlinie einen (kleinen) ohmschen Widerstand In Summe erhalten wir eine Diodenkennlinie. Wir nennen diese Sorte eines Halbleiter-Metall Kontakts einen Schottky Kontakt oder - in der technischen Ausführung - eine Schottky Diode In Summe erhalten wir die Kennlinie eines Ohmschen Widerstands oder einen Ohmschen Kontakt Wow!!! Eine kleine Zufälligkeit - die Austrittsarbeit ist ein bißchen größer oder kleiner - und schon ist das elektronische Verhalten des Metall-Halbleiter Kontakts grundverschieden. Und nochmal: Wow!!! Konstruiere das Banddiagramm nach relativ einfachen Regeln - und wir wissen, wie das Verhalten sein wird. Jedoch: Während die Vorhersage "Schottky" oder "Ohm" noch einfach zu machen ist, gilt das nicht mehr so ganz für die Formel der Kennlinie. Wer die Herleitung der pn-Kontakt Kennlinie verinnerlicht hat, wird keine großen Probleme haben, sich eine Formel für Schottky Kontakte herzuleiten. Für Ohmsche Kontakte ist es hoffnungslos, da hier Bahnwiderstände, und damit geometrische Faktoren dominieren. Wir wollen das hier aber nicht tun, sondern nur noch kurz weitere Aspekte der Halbleiter-Metall Kontakte behandeln. Die erste Frage ist natürlich nach den beiden anderen der vier Fälle: Wir starten mit p-dotierten Halbleitern Das ist zunächst eine sehr anspruchsvolle Übungsaufgabe. Anspruchsvoll, weil wir nun Löcher im Halbleiter mit Elektronen im Metall in Beziehung setzen müssen - es gibt keine Löcher im Metall. Aber man kann sich sehr gut selbst testen, wie weit man die Konstruktion von Banddiagrammen verstanden hat. Auch wer diese Übung nicht machen will, sollte sich unbedingt per direktem Link das Ergebnis anschauen! Übung 6.3-1 Schottky Kontakt mit p-Halbleiter Was man erhält ist in der nun erweiterten Ausgangstabelle festgehalten: Halbleiter (HL) Fermienergie Metall relativ zum HL im Banddiagramm Austrittsarbeit W Typ Höher WHL < WMe Schottky Niedriger WHL > WMe Ohmsch Höher WHL < WMe Ohmsch Niedriger WHL > WMe Schottky n-Typ p-Typ Das läßt sich am besten graphisch darstellen: MaWi 2 Skript - Page 250 Ein Metall, das zu n-Si einen Ohmschen Kontakt macht, wird also automatisch mit p-Si einen Schottky Kontakt produzieren und umgekehrt. Bei einem Metall, das zu einer Sorte HL einen Schottky Kontakt macht, muss man ein bißchen genauer hinschauen. Das ist von überragender technischer Bedeutung! Denn ohne Schottky Kontakte würde zwar ein kleiner Teil der Elektronikindustrie Schwierigkeiten haben, aber ohne Ohmsche Kontakte wäre die ganze Industrie schlicht nicht möglich Die Herstellung "guter" ohmscher Kontakte ist ein wichtiges, und durchaus schwieriges Thema der Halbleiterelektronik. Wir wollen deshalb ganz kurz die Praxis der Halbleiter-Metall Kontakte beleuchten Was bedeutet das in der Praxis? Einfach: Für ohmsche Kontakte zu p-Si oder generell zu p-Halbleiter nehmen wir Metalle mit großer Austrittsarbeit, d.h. Metalle die ihre Elektronen ungern hergeben. Das sind natürlich in erster Linie Edelmetalle, die uns auch sonst ganz lieb sind weil sie im Betrieb nicht "wegrosten". Bei n-Si oder generell n-Halbleitern haben wir ein Problem. Am besten wären Materialien, die Elektronenüberschuss haben, d.h. relativ leicht ein Elektron hergeben. Also die Alkali- oder Erdalkalimetalle (die kleinste Austrittsarbeit überhaupt hat Cs). Aus (hoffentlich) offensichtlichen Gründen sind diese Materialien aber nicht so toll für Anwendungen. Also schauen wir mal auf's Periodensystem mit eingetragenen Austrittsarbeiten: OK - wir haben ein Problem. In der Realität werden tatsächlich Kontakte aus z. B. Ba oder Ca verwendet - mit erheblichen techischen Problemen. Aber das wird uns in einer anderen Vorlesung beschäftigen. MaWi 2 Skript - Page 251 Halbleiter-Metall Kontakte in der Praxis Wir nehmen einen Halbleiter, verpassen ihm eine "perfekte" (= hochpolierte defektfreie) Oberfläche, reinigen sie sorgfältig und bringen dann eine Metallschicht auf. Dazu gibt es eine ganze Reihe von Verfahren, z.B. "Aufdampfen", die uns hier aber nicht weiter interessieren sollen. Dann messen wir die Kennlinie. Führt man diesen Versuch real aus, läuft man in eine ganze Reihe von Problemen: 1. Wir brauchen auf der anderen Seite des Halbleiters einen richtig guten ohmschen Halbleiter-Metall Kontakt damit wir den Meßkreis schließen können. Falls das nicht sicher gestellt ist, wissen wir gar nicht, welchen der immer erforderlichen beiden Kontakte wir eigentlich messen. Eine typische Lösung dieses Problems besteht darin, die Rückseite extrem hoch zu dotieren. Damit wird jede Raumladunsgzone so dünn, daß die Ladungsträger im Zweifelsfall durchtunneln können. In anderen Worten: Selbst wenn der Kontakt eigentlich sperren sollte, wird er es nicht tun. 2. Das Ergebnis der Messung wird fast nie mit der Theorie übereinstimmen - weder quantitativ, noch qualitativ. Egal wie die Austrittsarbeiten sich vergleichen, wir werden fast immer ein mehr oder weniger ausgeprägtes Diodenverhalten bekommen - auch wenn ganz klar Ohmsches Verhalten angesagt ist. Der Grund dafür ist, daß wir keinen Halbleiter-Metall Kontakt haben, sondern einen Halbleiter-Halbleiteroxid/DreckMetall Kontakt - wie beim naiven pn-Übergang. Man muß schon im Ultrahochvakuum (normales Hochvakuum genügt nicht) irgendwie die Oberflache in situ reinigen, um eine "nackte" Halbleiteroberfläche zu bekommen, sonst ist sie immer mit Oxid oder sonst was bedeckt. 3. Wenn man das tut, und dann in situ das gewünschte Metall aufbringt, wird die Kennlinie immer noch nicht der Theorie folgen. Denn fast alle Hableitermaterialien sind chemisch sehr reaktiv - sie sind immer nur durch ihren Oxidüberzug geschützt. Bringt man ein Metall in unmittelbaren Kontakt mit z.B. Silizium wird sich sofort ein Silizid, eine SilziumMetall Verbindung bilden. Die Reaktion wird bei Raumtemperatur zwar schnell zum Erliegen kommen (mangels Diffusion), aber wir haben zumindest eine dünne Silizidschicht - z.B. PtSi, Ni2Si oder PdSi2. Damit messen wir die Eigenschaften des Kontakts Silizium-Silizid-Metall. Da die Silizide ganz andere Eigenschaften haben als das beteiligte Metall (das gilt insbesondere auch für die Austrittsarbeit), kann man nicht erwarten, daß das Experiment die Vorhersagen der Theorie wiedergibt. Erst wenn wir die Theorie eines Silizium-Silizid Kontaktes mit der Messung eines solchen (aufwendig hergestellten) Kontakts vergleichen, finden wir eine gute Übereinstimmung. Man sollte sich aber davor hüten, das nur als Problem zu sehen! Im Gegenteil - es eröffnet spannende Möglichkeiten sich diodenartige Kontakte zu generieren, die es "eigentlich" gar nicht geben sollte. Solange die Resultate verläßlich und reproduzierbar sind, wird sich der Praktiker nur am Rande dafür interessieren, was genau die Theorie dazu sagt. Fragebogen / Questionaire Multiple Choice Fragen zu 6.1.3 MaWi 2 Skript - Page 252 6.3.3 Zusammenfassung Kapitel 6.3 Intrinsische Halbleiter Halbleiter - Metallkontakte folgem dem allgemeinen Rezept zur Konstruktion eines Banddiagramms. Es wird jetzt aber eine absolute Energieskala benötigt (da bei Heterokontakten nicht wie bei Homokontakten die Valenz- oder Leitungsbandkante als eine für beide Partner identische Referenzenergie dienen kann). Nach Rezept ergeben sich folgende Bandschemata; als neues Phänomen taucht " Akkumulation" oder "Anreicherung" an Ladunsgträgern auf n-Si Metall RLZ; Verarmung; Schottky Kontakt Keine RLZ, Akkumulation, Ohmscher Kontakt Keine RLZ, Akkumulation, Ohmscher Kontakt RLZ; Verarmung; Schottky Kontakt WHL < WMe WHL > WMe n-Si Metall Mit externer Spannung erhält man, wie angedeutet, entweder Diodenverhalten oder Ohmsche Kontakte. Hier noch eine Gesamtdarstellung: Die Berechnung der Diodenkennlinien ist etwas komplizierter als für den pn-Übergang; folgt aber denselben Grundsätzen. "Ideale" Halbleiter - Metallkontakte sind zwar schwer herzustellen, aber die praktische Bedeutung realer Halbleiter Metallkontakte ist hoch: Ohne Ohmsche Kontakte keine Elektronik! MaWi 2 Skript - Page 253 6.3.4 Merkpunkte Kapitel 6.3 Banddiagramm Metall - Halbleiterkontakten nach Rezept. Austrittsarbeiten definieren den jetzt notwendigen gemeinsamen Nullpunkt. Neues Phänomen: Akkumulation von Ladungsträger (im Halbleiter) and der Grenzfläche. RLZ; Verarmung; Schottky Kontakt Gesamteffekt: Diodenverhalten oder ohmscher Kontakt - je nach Vorzeichen der Differenz Austrittsarbeit Metall - Austrittsarbeit (= Fermienergie) Halbleiter. Damit werden die unersetzlichen ohmschen Kontakte verstanden und systematisch möglich! MaWi 2 Skript - Page 254 Akkumulation, Ohmscher Kontakt 6.4 Einfache Bauelemente 6.4.1 Solarzellen Vorbemerkungen Aus Sicht der Anwender ist eine Solarzelle ein flächiges Gebilde mit zwei elektrischen Anschlüssen. Fällt Licht auf die Vorderseite der Solarzelle, baut sich zwischen den Anschlüssen eine meßbare Spannung U auf, mit der man einen Strom I durch einen Lastwiderstand R treiben kann. Damit wird Energie umgesetzt; aus hν aller Photonen, die in der Zeit ∆t auf die Solarzelle treffen, wird U · I · ∆t. Es stellt sich automatisch die Frage nach dem Wirkungsgrad η = Eraus / Erein = (U · I · ∆t) / (Σhν), der absoluten Leistung pro Flächeneinheit und dem Preis für die kWh. Aus Sicht der Materialwissenschaft ist eine Solarzelle eine Diode – ob pn-Kontakt-Diode oder Schottky-Diode, ist erstmal egal. Damit stellen sich viele Fragen: 1. Wie funktioniert das generell? 2. Welche Eigenschaften des verwendeten Halbleitermaterials (z.B. Si oder CuInSe2) nehmen Einfluß auf den Wirkungsgrad? Warum? Wie genau? 3. Welche Eigenschaften der mit einem gegebenen Halbleiter hergestellten Diode (inkl. Kontakte, Antireflexschicht,etc.) nehmen Einfluß auf den Wirkungsgrad? Wie genau? 4. Mit den Antworten auf die Fragen 2. und 3. kann man den Wirkungsgrad optimieren. Es bleibt die vielleicht wichtigste Frage: 5. Wie optimiert man das Preis-Leistungs-Verhältnis? Die Rekapitulation der in den letzten 20 Jahren gemachten Anstrengungen zur Beantwortung der Frage 4. und 5. füllt locker ein 100.000 Seiten starkes Buch (die "Proceedings" der jährlichen internationalen Solarkonferenzen füllen alleine einige 1.000 Seiten); wir wollen hier so gut wie nicht darauf eingehen. Einige Anmerkungen zu einem kleinen Unterthema finden sich im Link. Weiter Daten und Informationen finden sich im Hyperskript "Semiconductor Technology" im Kapitel 8. Dort finden sich auch allgemeine Daten und Bemerkungen zum Thema "Du und Dein Energieverbrauch". Maximaler Wirkungsgrad und absolute Energieproduktion Photonen mit einer Energie größer als die Bandlücke werden im Halbleiter absorbiert. Sie befördern ein Elektron aus dem Valenzband ins Leitungsband, generieren also ein Elektron-Loch-Paar. Den grundlegenden Prozeß der Absorption haben wir bereits ausführlich betrachtet; hier ist nochmals das zugehörige Bild: Wie auch immer die Solarzelle funktioniert, wir erkennen sofort wichtige grundsätzliche Beschränkungen für den Wirkungsgrad: 1. Alle Photonen mit hν < EG werden nicht absorbiert; die in diesem Anteil des Sonnenspektrums enthaltene Energie ist verloren. Das spricht natürlich dafür, ein Material mit relativ kleiner Energielücke zu wählen. 2. Die Differenz hν – EG von Photonenenergie und Energielücke geht als Wärme ans Gitter, da die generierten Ladungsträger sich durch Thermalisierung sehr schnell zur Bandkante begeben. Das spricht natürlich dafür, ein Material mit relativ großer Energielücke zu wählen. MaWi 2 Skript - Page 255 Wir haben ein klassisches Dilemma (griechisch; Zwangslage; Wahl zwischen zwei Übeln). Politiker vermeiden in so einem Fall eine Entscheidung und fangen zur Ablenkung einen Krieg an (oder zerreden das Problem bis zur Unkenntlichkeit); Theologen postulieren, dass durch göttliche Intervention irgendwie doch beides gleichzeitig geht (Kinder haben und Jungfrau bleiben!). Ingenieure wissen, daß jetzt nur noch die Optimierung hilft: Wir machen das Beste daraus. Dazu muß man aber erstmal die Zusammensetzung des auf die Solarzelle fallenden Lichtes kennen, also das solare Spektrum – für terrestrische Anwendungen (als Abgrenzung zur Raumfahrt) so wie es bei uns auf dem Grund des Luftozeans ankommt. Das ist natürlich bekannt; in einem Illustrationsmodul kann es in allen Details betrachtet werden Letztlich erhält man folgendes Ergebnis: 1. Die optimale Bandlücke EG opt liegt bei ca. 1,4 eV (also gerade noch im Infraroten); GaAs würde als Material gut passen. 2. Der zugehörige maximale Wirkungsgrad ist ηmax(EG opt) ≈ 30%. Mehr ist aus einer Solarzelle aus einem Optimalmaterial nicht herauszuholen. 3. Für Si mit einem nicht optimalen Bandgap von 1,1 eV erhält man ηmax(Si) ≈ 28% . Real erzielbare Wirkungsgrade in einer Massenproduktion sind niedriger. ηreal (Si) ≈ (15 - 17) % kann derzeit (2009) als guter Wert gelten. (Nachtrag: Im Jahr 2016 gilt ein Wirkungsgrad um die 20 % als Standard.) Die absolute Leistungsdichte der Sonnenstrahlung (Äquator, "high noon", keine Wolken) liegt ganz grob (und leicht zu merken) bei 1 kW/m 2. Daran wird auch noch soviel Forschung nichts ändern. Allenfalls die Zerstörung der Ozonschicht (O3) bringt hier Fortschritte, wie ein Blick ins Spektrum zeigt; aber zu Risiken und Nebenwirkungen sollten sie hier wirklich dringend ihren Arzt und Apotheker befragen (und eventuell ihren Politiker schlagen)! Der maximale Output einer Solarzelle mit η = 10% liegt demnach (Faustregel!) bei 100 W/m2. Da aber auch am Äquator nachts die Sonne nicht scheint und in höheren Breiten noch ein cos des Breitengrades einberechnet werden muß, wird man als Mittel über alles (Tag/Nacht, Sonne/Regen, Sommer/Winter, Tropen/Arktik) ganz ganz grob allenfalls 10 % der Peakleistung im Jahresmittel ernten, also gerade mal 10 W/m 2. Das sind aber alles glattte "Zehnerzahlen" zum Merken; in Wahrheit liegen wir günstiger; derzeit ( 2006) etwa bei mittleren 13 W/m 2. Es kann also nur darum gehen, das prinzipiell Mögliche erst mal überhaupt, und dann auch noch billig zu erreichen. Es wird Zeit für eine Übungsaufgabe Übung 6.4-1 Solarenergie quantitativ Grundsätzliche Funktionsweise einer Solarzelle Wie macht eine Diode Strom aus Licht? Zunächst produzieren wir durch die Photonen zusätzliche Elektron-Loch-Paare, d.h. wir erhöhen im Gebiet der Lichtabsorption die Generationsrate. Damit erhöhen wir insbesondere die Minoritätsladungsgträgerkonzentration signifikant gegenüber der Gleichgewichtskonzentration; bei den Majoritäten wird es (prozentual) sehr viel weniger ausmachen. Diese zusätzlichen Minoritätsladungsträger diffundieren im Halbleiter herum; nach der Zeit τ werden sie per Rekombination wieder verschwinden – falls sie nicht an die Kante der Raumladungszone gelangen und als zusätzlicher Feldstrom jFeld(solar) den Abhang hinunterfallen (bzw. bei Löchern hinauf). Denn da wir eine Diode haben, haben wir auch immer eine RLZ. Wir halten fest: Der Anteil an photogenerierten Minoritätsladungsträgern, der per Zufallswanderung an die Kante der Raumladungszone gelangt, erzeugt einen zusätzlichen Feldstrom, der zunächst nicht durch einen entsprechend großen Durchlaßstrom kompensiert wird. Dieser Anteil wird von der Absorptionstiefe und der Diffusionslänge der Minoritäten im betreffenden Material abhängen: Minoritäten, die tief im Inneren des Halbleiters generiert werden, haben keine große Chance, innerhalb ihrer Lebensdauer bis an die Raumladungszone zu gelangen – es sei denn, die DiffusionlängeL ist entsprechend groß. MaWi 2 Skript - Page 256 Damit wird der schon einmal kurz eingeführte Materialparameter "Absorptionskoeffizient" α interessant. Die mittlere Tiefe, in der ein Photon der Wellenlänge λ in einem Halbleiter absorbiert wird, kann für Licht mit Energien in der Nähe der Bandkante relativ hoch sein – insbesondere beim indirekten Halbleiter Si. Wir brauchen also große Diffusionslängen (= perfektes, teures Material), um die photogenerierten Ladungsträger überhaupt zurRLZ zu bekommen. Es ist inzwischen hoffentlich auch ohne direkten Hinweis klargeworden, daß nur der zusätzliche Feldstrom jFeld(solar) = jPhoto als externer Strom zur Verfügung steht. Das schauen wir uns jetzt etwas genauer an: Das (infra-)rote Licht dringt tief ein; das generierte Elektron im ( p-dotierten) Volumen der Diode kann per Rekombination im Volumen oder an der Rückseite "sterben". Es kann aber auch bis zur Vorderseite gelangen und dort als Photostrom ausgekoppelt werden, falls die Diffusionslänge groß genug ist. Das violette Licht wird dagegen in oder dicht unter der (dünnen, ca. 0,5 µm) n-Schicht absorbiert und trägt dann fast immer zum Photostrom bei. Der Photostrom ist immer ein zusätzlicher Sperr- bzw. Feldstrom mit der Abkürzung jSC. Was geschieht mit dem zusätzlichen Feldstrom jSC? Wir können das auf zwei Weisen betrachten: Qualitativ oder quantitativ. Letzteres jetzt sogar ohne noch groß nachzudenken – mit Hilfe der Diodengleichung. Aber wir beginnen noch mal qualitativ: Dazu stellen wir uns jetzt vor, daß wir die Diode kurzschließen. Der zusätzliche Feldstrom wird dann durch den äußeren Stromkreis zur Rückseite der Diode fließen und dort mit den zurückgelassenen Majoritäten rekombinieren – denn eine andere Möglichkeit gibt es nicht, die Minoritäten wieder mit den Majoritäten zusammenzubringen. Wir haben damit einen wichtigen Solarzellenparameter definiert: Den Kurzschlußstrom jSC ; "SC" steht für "short circuit". Im anderen Extremfall lassen wir den Stromkreis offen. Damit stören wir die Ladungsverteilung des Gleichgewichts. Da kein Strom fließen kann, wird sich ein neues Gleichgewicht einstellen, indem sich im Beispiel die n-Seite so lange negativ auflädt (ihr Potential erhöht und die Energieschwelle erniedrigt), bis der dann zunehmende Durchlaßstrom den zusätzlichen Feldstrom wieder exakt kompensiert. Die dazu notwendige, über die Kontaktspannung hinausgehende Potentialdifferenz ist jetzt als äußere "Leerlaufspannung" UOC meßbar ("OC" steht für "open circuit"), da sie nicht mehr durch die Summe der anderen Kontaktspannungen kompensiert wird. Viele Worte – quantitativ ist es viel einfacher. MaWi 2 Skript - Page 257 Quantitative Betrachtung Wir müssen nur den zusätzlichen Feldstrom – jFeld(solar) – in unsere Gleichungen schreiben und sind fertig. Wir erhalten als Diodengleichung bei Beleuchtung: j(Uex) = e · L · nMin(L) e · L · nMin(V) + τ τ · eUex ) – 1 – jFeld(solar) exp ( kT Wir müssen nur immer jFeld(solar) abziehen, denn alles andere bleibt unverändert. Damit kann man sofort loslegen und rechnen; einfacher ist es zunächst, sich die resultierende Kennlinie graphisch anzuschauen. Wir nehmen einfach die alte Zeichnung und ziehen – je nach Lichteinfall – einen mehr oder weniger großen konstanten Photostrom ab. Das sieht dann so aus: Alles ist klar und berechenbar; wir erhalten sofort die wesentlichen Solarzellenparameter. Leerlaufspannung, Kurzschlußstrom, was immer wir wollen, wir können es ausrechnen als Funktion der Materialund Technologie Parameter sowie der Temperatur. Zum vollständigen Glück fehlt uns nur noch jFeld(solar) selbst, der zusätzliche beleuchtungsinduzierte Feldstrom. Der ist aber nicht so ganz einfach zu packen. Er hängt zunächst ab von der Tiefenverteilung der generierten Minoritäten, und damit vom Lichtspektrum und dem Absorptionskoeffizienten. Dann von der Diffusionslänge, die uns sagt wie groß die Chance ist, die Entfernung bis zum pn-Übergang zurückzulegen. Weiterhin sind Technologieparameter wichtig; ein Beispiel dazu: Wird die Minorität "reflektiert", falls sie zufällig an der Solarzellenrückseite vorbeikommt (und hat damit eine Chance doch noch nach vorne zu kommen), oder wird sie dort rekombinieren? Das hängt davon ab, wie man den Rückseitenkontakt macht. Wie auch immer: Wir kennen den maximalen Wert jFeldmax(solar): maximal ein Ladungsträger pro absorbiertem Photon fließt ab. Das ist die notwendige (aber nur sehr schwer zu erreichende) Voraussetzung für den maximalen Wirkungsgrad ηmax. Und wir wissen: jFeldmax(solar) erhalten wir nur, falls die Diffusionslänge L sehr groß wird – deutlich größer jedenfalls, als die Absorptionslänge für die langwelligste Strahlung, die wir noch "mitnehmen" wollen. Für Si bedeutet das dann Diffusionslängen von einigen 100 µm – gigantische Distanzen für ein kleines Elektron! Wir haben wieder mal ein schönes Beispiel für praxisorientierte Ausbildung. Die Wirkungsweise der Solarzelle wird einfach und berechenbar mit Hilfe – und nur mit Hilfe – der "Theorie". MaWi 2 Skript - Page 258 Die Praxis Nutzbar zur Energieerzeugung ist nur der 3. Quadrant der Kennlinie - nur dort entsteht eine photogenerierte Spannung. Das schauen wir uns etwas genauer an Die ausgekoppelte Leistung ist Strom mal Spannung; sie ist Null für maximalen Strom oder maximale Spannung Wir müssen also einen optimalen Arbeitspunkt suchen, bei dem die abgegebene Leistung maximal wird. Die Leistung ist für jeden Arbeitspunkt direkt gegeben durch die Fläche des "eingeschriebenen" Rechtecks; sie wird maximal in der Nähe des blauen Arbeitpunkts Wir können also gar nicht den maximal verfügbaren Strom nutzen; denn wir wir müssen auch eine Spannung aufbauen. In den maximalen Wirkungsgrad ηmax geht aber die (fiktive) maximale Leistung ISC · UOC ein; in der Praxis haben wir aber nur IMPP · UMPP; mit MPP bezeichnen wir den optimalen Arbeitspunkt maximaler Leistung (egl. maximum power point). Das Verhältnis (IMPP · UMPP)/(ISC · UOC), also das Verhältnis der beiden Flächen, bezeichnet man als Füllfaktor der Solarzelle. Der Füllfaktor ist ein typischer Technologieparameter; er ist von großer Bedeutung in der Praxis. Er ist offenbar durch die Form der Diodenkennlinie bestimmt – bei idealen, der Theorie gehorchenden Dioden, wäre er ein für allemal fest gegeben. Reale Dioden, vor allem welche mit großen Flächen auf billigem Material, die mit minimalem Aufwand gemacht wurden (eine Solarzellenfabrik muß typischerweisde eine (156 × 156) mm 2 große Solarzelle pro Sekunde produzieren), haben aber keine ideale Kennlinie – und das wirkt sich immer negativ auf den Füllfaktor aus. Besonders schlecht sind zum Beispiel zu große Serienwiderstände – z. B. weil die Kontaktfinger möglicherweise zu dünn waren; machen wir sie aber dicker, schatten sie größere Bereiche der Oberfläche ab – auch nicht so gut. (Was genau ein Kontaktfinger ist, wird in einem Extra-Modul erklärt.) Wiederum haben wir ein Optimierungsproblem – und so geht das immer weiter. Letztlich sind Solarzellen ein schönes Beispiel für angewandte Materialwissenschaft. Die Physik dazu ist komplett verstanden. Es geht ausschließlich darum, den Preis herunterzubringen – also gute Solarzellen schnell und billig herzustellen. Fortschritte darin sind mühsam, und sie sind immer das Ergebnis des Schweißes von Leuten, die ihre Theorie gelernt haben. Kein noch so genialer "Tüftler" hat bisher in seiner Garage irgendeinen Beitrag zur Thematik geleistet. Ein winzig kleiner Ausschnitt aus der laufenden Solarenergieforschung findet sich im Link; hier sind dann noch weiterführende Betrachtungen und einige wirtschaftliche Daten. Wie wichtig das alles ist, wird anhand von Hintergrundinformationen zur Photovoltaik und zur allgemeinen Energiesituationdeutlich (sehr empfehlenswert; bitte diesen Link im Familien- und Freundeskreis verbreiten). Fragebogen / Questionaire Multiple-Choice-Fragen zu 6.4.1 MaWi 2 Skript - Page 259 6.4.2 Bipolare Transistoren Was ist und tut ein Transistor? Ein Transistor ist ein festkörperelektronisches Bauelement, mit dem man Strom zwischen zwei Anschlüssen durch Strom oder Spannung an einem dritten Anschluß ein- und auschalten kann. Wir haben damit immer drei Anschlüsse, das sieht grundsätzlich so aus: Ströme und Spannungen am Ausgang sind immer viel größer als die Spannungen und Ströme, die man zum Steuern, d.h. zum Ein- und Ausschalten braucht. Damit kann man also grundsätzlich eine Leistungsverstärkung erzielen. Man kann das auch analog tun, d.h. die Ausgangsgröße folgt (mit Glück halbwegs linear) der Steuergröße. Aber in dieser Vorlesung sind wir digital, wir schalten den Ausgangsstrom nur ein und aus. Ein elektromechanisches Relais macht im Grundsatz dasselbe. Es ist aber kein Transistor! Und das nicht so sehr weil es kein festkörperelektronisches Element ist, sondern weil es die wesentlichen Sekundärtugenden eines Transistors nicht hat. Diese sind: 1. Alles ist elektronisch - nichts bewegt sich mechanisch. Die gute alte Elektronenröhre, z.B. in der einfachsten Form einer Triode, hat diese Tugend aber auch. 2. Das Ein- und Ausschalten geht sehr schnell. So einige Milliarden mal pro Sekude - d.h. mit > 1 GHZ - sollte es schon sein. Die gute alte Elektronenröhre macht das nicht mehr - die gute neue aber schon (z.B. in der "Mikrowelle"). 3. Sparsamkeit - das ganze funktioniert bei minimaler Leistung, insbesondere im "off" Betrieb. Die Elektronenröhre hat jetzt massive Probleme, da ihre Heizung immer laufen muß. 4. Kleinheit - allenfalls noch 1 µm × 1 µm × 0,3 µm ist der Transistor groß. Die Elektronenröhre ist jetzt out. 5. Integrationsfähigkeit - wir können viele Millionen Transistoren in einem Silizium Chip machen und verbinden, z.B.ca 300 000 000 Transistoren (plus 256 000 000 Kodensatoren) in einem 256 Mbit Speicherchip. Wenige Erfindungen haben die Welt so verändert wie der Transistor. Und unter allen weltverändernden Erfindungen ist er die erste (oder, falls man die Atombombe mitzählt), die zweite, die auschließlich auf "Theorie" beruht und nicht auf "Tüfteln", wie z.B. das Rad, die Schrift, der Buchdruck, die Elektronenröhre, das Auto, die Herstellung von Stahl oder die sexuelle Revolution. Es gibt zwei Transistorgrundtypen: Den MOS-Transistor, und den bipolaren Transistor. Der MOS-Transistor ist der weitaus häufigere, aber für uns noch nicht ganz einfach zu verstehen. Mit dem bipolaren Transistor aber haben wir kein Problem; ihm widmen wir dieses Unterkapitel. Der bipolare Transistor Ein bipolarer Transistor besteht aus zwei hintereinander geschalteteten pn-Übergängen; hat also eine p-n-p oder n-p-n Struktur, wobei die mittlere Schicht sehr dünn sein muß. (Das konnte man sich damals leicht merken: Der p-n-p Transistor hat den gleichen Aufbau wie die Mensa Schnitzel der sparsamen 60er Jahre: Paniermehl - Nichts Paniermehl). Jede Schicht hat einen elektrischen Anschluß. Zwei hintereinandergeschaltete Dioden bilden keinen bipolar Transistor, denn sie sind, erstens, keine p-n-p oder np-n Schichtung sondern z.B. eine p-n-Metall - Metall-n-p Schichtung; und damit ist, zweitens, die mittlere Halbleiterschicht nicht dünn. Ein bipolar Transistor ist schematisch wie unten gezeigt aufgebaut. In der Realität sieht er ziemlich anders aus, das ist in einem extra Modul dargestellt. MaWi 2 Skript - Page 260 Wir unterstellen ohmsche Kontakte zu allen drei Bereichen. Der zu steuernde Strom fließt vom Emitter zum Kollektor, durch die steuernde Basis hindurch. Die Grundbeschaltung ist eingezeichnet: Wir polen immer die Emitter-Basis Diode in Vorwärtsrichtung, und die Basis -Kollektor Diode in Rückwärtsrichtung. Der externe Strom fließt dann von Plus nach Minus, wie eingezeichnet. An dem Basisknoten muß die Summe der Ströme = 0 sein; graphisch heißt das, daß die Gesamtlänge von Kollektor- und Basisstrompfeil gleich sein muß zur Länge des Emitterstrompfeils. Um zu sehen, daß diese Anordnung tatsächlich ein Transistor im obigen Sinne ist, müssen wir jetzt nur das Banddiagramm betrachten. Wir zeichnen es gleich für die beschaltete Anordnung mit Stromfluß; die Fermienergien sind dann nur Markierungshilfen Die Emitter-Basis Diode ist in Vorwärtsrichtung gepolt; es wird also ein großer Vorwärtsstrom jF(BE) fließen müssen. Dieser Vorwärtsstrom besteht aus Löchern, die von dem p-dotierten Emitter in die n-dotierte Basis fließen, und aus Elektronen, die aus der Basis in den Emitter laufen; beide Ströme zusammen bilden den Emitterstrom IE. (Wir verwenden "I " hier für externe , und "j " für interne Ströme oder Stromdichten) Damit gilt als erste Gleichung IE = jF(BE) = j eF(BE) + j hF(BE) Dabei haben wir aber eine kleine Näherung gemacht: Wir haben die Rückwärtströme vernachlässigt. Das machen wir zwar schon ziemlich routinemäßig; aber man sollte sich doch klar darüber sein. Wir wollen das jetzt durchgehend so machen: Alle "kleinen" Ströme lassen wir weg. Der Basis-Kollektor-Kontakt ist in Rückwärtsrichtung gepolt. Hätten wir nur diese Diode, würde ein kleiner Rückwärtsstrom fließen, zusammengesetzt aus den Löchern, die als Minoritätsladungsträger in der Basis vorhanden sind, an die RLZ-Kante kommen und dann die Potentialschwelle hinauffallen sowie den Elektronen des Kollektors, die den Berg hinunterfallen. Der springende Punkt beim Bipolartransistor ist nun aber die Bedingung, daß die Basis dünn sein muß, oder genauer gesagt, die Basisweite dB muß sehr viel kleiner sein als die Diffusionslänge L der Minoritäten in der Basis. Dann werden die meisten der vom Emitter in die Basis emittierten oder injizierten Löcher nach kurzer Wanderung im feldfreien Bereich der Basis an die RLZ-Kante des Basis Kollektorkontakts kommen - und dann selbstverständlich den Berg hinauffallen! In anderen Worten: Der Beitrag der Löcher aus der Basis zum Rückwärtsstrom ist massiv erhöht. Fast alle Löcher, die als Komponente des Vorwärtsstroms vom Emitter in die Basis fließen, werden es bis zum Kollektor schaffen. Der Kollektorstrom IC besteht damit praktisch nur aus dieser Komponente. In anderen Worten: MaWi 2 Skript - Page 261 IK = jR(BK) ≈ j hF(BE) Der Kollektorstrom wird allerdings ein wenig kleiner sein müssen, als die Löcherkomponente des Emitter-Basis Vorwärtsstroms, denn ein paar wenige der in die Basis injizierten Löcher werden dort rekombinieren. Diesen Effekt können wir aber (weiter unten) leicht berücksichtigen. Erst aber schauen wir uns jetzt das komplette Strombild des bipolar Transistors an: Sieht kompliziert aus, aber ist ganz einfach - wieder nur eine Frage der korrekten Strombuchhaltung. Zunächst sehen wir, daß der größte Teil des Löcherstroms des Emitters weiterfließt zum Kollektor, und dort den ganzen externen Strom IC verursacht. Die einzige offene Frage ist allenfalls, wie aus einem Löcherstrom im Halbleiter jetzt ein Elektronenstrom im Metall wird. Das ist aber einfach: Das Metall injiziert Elektronen ins Valenzband, die dort mit den Löchern rekombinieren es ist schließlich mit dem negativen Pol der Spannungsquelle (= Elektronenpumpe) verbunden. Im Link ist das noch ein bißchen ausführlicher erläutert. In der dünnen Basis rekombiniert nur ein kleiner Teil der Löcher und Elektronen; dies ist schematisch gezeigt. Im Emitter fließt aber auch noch der aus der Basis kommende Vorwärtsstrom der Elektronen. Er wird jetzt wichtig. Sobald die aus der Basis kommenden Elektronen im p-dotierten Material des Emitters sind, werden sie als Minoritäten rekombinieren. Im Abstand von etwa L von der Basis sind sie verschwunden, und es fließt jetzt ein reiner Löcherstrom. Der Emitterkontakt rekombiniert wieder alle Löcher durch Elektroneninjektion; am Basiskontakt werden die benötigten Elektronen durch den Kontakt direkt geliefert. Auch im Banddiagramm sind die Ströme eingezeichnet. Es wäre jetzt auch kein Problem mehr, die "kleinen" Ströme noch mitzunehmen - aber es wird nicht viel ändern. Die Steuerfunktion ist jetzt klar. Mit einer relativ kleinen Vorwärtsspannung an der Emitter-Basis Diode ( ≈ 1 V), kann man einen relativ großen Strom (< 10 A/cm2) über einen relativ großen Potentialunterschied schicken (Die BasisKollektor Spannung kann bis zu 1000 V betragen!). Damit kann man erhebliche Leistungen mit kleinem Aufwand ein- und ausschalten, oder auch analog steuern (wenn auch nichtlinear). Aber wir müssen einen Preis dafür zahlen: Leistungslos funktioniert die Steuerung nicht - denn wir brauchen immer auch einen Basis-Emitter Strom! Damit erhebt sich die Frage nach der erreichbaren Stromverstärkung in einem bipolaren Transistor, dem Verhältnis von Kollektorstrom zu Basisstrom. Stromverstärkung des bipolaren Transistors Die Stromverstärkung β ist definiert als MaWi 2 Skript - Page 262 j hR(BK) IK β = j hF(BE) = IB = j eF(BE) j eF(BE) Das ist nun einfach auszurechnen. Wir nehmen die Formeln für die Vorwärtsströme aus der (einfachen) Diodengleichung und setzen sie ein. Damit erhalten wir e · D · (ni)2 eUex exp – 1 ND(B) · L kT β = NA(E) · = e · D · (ni)2 ND(B) eUex exp NA(E) · L – 1 kT Dabei haben wir großzügigerweise die DiffusionslängenL, die Diffusionkoeffizienten D (und damit die Beweglichkeiten µ) in der Basis und im Emitter gleichgesetzt, was zwar nicht ganz korrekt ist, aber die Sache doch sehr vereinfacht. Wir haben ein monumentales Ergebnis: Die Stromverstärkung in einem bipolar Transistor ist in guter Näherung nur durch das Verhältnis der Dotierstoffkonzentration in Emitter und Basis gegeben! Wir brauchen einen hochdotierten Emitter und eine schwach dotierte Basis, um eine große Stromverstärkung zu erzielen. Das ist einfach zu machen; β > 100 ist leicht zu erzielen. Da die Leistungsverstärkung durch β · UBK/UEB gegeben ist, kommen wir hier schnell auf Werte β > 1000. Wir brauchen also eine möglichst asymmetrische Diode, mit möglichst großem Unterschied in den Vorwärtsstromkomponenten. Das kommt nicht nur dem Bauprinzip der realen Diode entgegen, sondern ist auch für andere Bauelemente wichtig. Man hat deshalb dem Verhältnis der Vorwärtsströme einen Namen gegeben, es heißt Injektionsverhältnis, weil ja jede Komponente für sich als Injektion von Minoritätsladungsträgern in das jeweils andere Gebiet aufgefaßt werden kann. Der Vorwärtsstrom einer Diode wird damit zu der Summe der beiden Injektionsströme. Jetzt wollen wir aber noch schnell ausrechnen was passiert, falls die Basis nicht dünn genug ist. Dann wird der Kollektorstrom gegeben sein durch den Injektionstrom des Emitters (man kann doch flüssiger schreiben mit diesen Begriffen) minus dem Rekombinationsstrom in der Basis. Der Anteil der Minoritäten, die durch die Basis durchwandern können, ist aber einfach 1 – dB/L - man muß nur das "Rekombinationsdreieck" im Emitter im obigen Bild auch für die Basis betrachten und durch eine Formel beschreiben. Damit bekommen wir für die Stromverstärkung NA(E) β = · ND(B) dB 1– L Eine noch bessere Formel ist sinnlos, denn bei realen Transistoren überwiegen sowieso die nicht berücksichtigten Einflüsse der extrem endlichen Größe in allen Dimensionen. Insbesondere darf man die "kleinen" Ströme, also die jeweiligen Rückwärtsströme, nicht ganz vernachlässigen. Zwar spielen sie für den "Ein" Zustand des Transistor-Schalters keine Rolle, wohl aber für den "Aus" Zustand. Denn auch wenn alle 100 Millionen oder so Transistoren auf dem Chip "aus" sind, zieht der Chip noch Strom - 108 mal die Rückwärtsströme der Dioden. Und das addiert sich dann so allmählich schon zu einem Problem. Trotzdem, von den oben erwähnten Kriterien hat der bipolar Transistor alle erfüllt - außer vielleicht der Forderung nach Geschwindigkeit. Wie schnell kann man einen bipolar Transistor hin- und herschalten? Das ist eine nicht ganz triviale Frage, aber eines ist sicher: Man muß nach dem Abschalten mindestens so lange bis zum Wiederanschalten warten, wie die Minoritäten brauchen, um durch die Basis zu laufen. MaWi 2 Skript - Page 263 Wie "schnell" sind die Minoritäten? Ihre "Durchschnitts"geschwindigkeit über alles ist jedenfalls vMin = L/τ, denn nach ihrer Lebensdauer τ sind eine Diffusionlänge L weit gekommen. Mit entsprechenden Umrechnungen erhält man kB · T · μ vMin = )½ ( e·τ Obwohl die Geschwindigkeitskomponente in Richtung Kollektor sicher kleiner ist als die oben ausgeführte ungerichtete Geschwindigkeit, gibt diese Gleichung doch Hinweise: Wir wollen eine möglichst hohe Beweglichkeit μ und eine möglichst kleine Lebensdauer τ - außerdem hohe Temperaturen? In Prinzip ja - aber: Kleine Lebensdauern bedingen kleine Diffusionlängen und das bringt Probleme. Hohe Temperaturen erst recht. Was bleibt ist: Die maximalen Schaltfrequenzen steigen mit der Beweglichkeit. Damit ist für extrem hohe Frequenzen GaAs dem Si überlegen (und wird auch für Hochgeschwindigkeitsschaltungen verwendet). Aber auch mit Si lassen sich mühelos die Gigahertze erreichen - denn die Transitzeit, die Zeit um durch die Basis zu wandern, ist halt auch immer umgekehrt proportional zur Dicke der Basis- und die ist sehr sehr klein! Fragebogen / Questionaire Multiple Choice Fragen zu 6.4.2 MaWi 2 Skript - Page 264 6.4.3 MOS Transistoren Der Metall-Oxid-Semiconductor Transistor; allgemein als MOS Transistor bekannt, gehört nicht mehr zum "Pflicht"bereich der Vorlesung. Da er aber der mit großem Abstand häufigste Transistor ist, wollen wir ihn kurz ansprechen. Von seiner prinzipiellen Funktion her ist er fast komplementär zum bipolaren Transistor: Leicht qualitativ zu verstehen - aber schwer quantitativ in Formeln zu gießen. Am einfachsten ist es, sich den Aufbau eines realen MOS Transistors anzuschauen, und sich daraus das Funktionsprinzip abzuleiten. Hier ist ein vereinfachter, aber korrekter Querschnitt durch einen MOS Transistor einer integrierten Schaltung: Die drei Elektroden oder Anschlüsse, die ein Transistor haben muß, sind klar zu erkennen: Der Strom fließt von der "Source", also der Quelle zum "Drain", dem Abfluß. Gesteuert wird er durch das "Gate", das Tor. Wer aber jemals die hier gebrauchten (oder andere) deutsche Bezeichnungen verwendet, "outet" sich als Ahnungslose(r) und muß Journalist werden. Der Transistor funktioniert folgendermaßen: Falls die Gatespannung im "Ein" Bereich liegt, ist auch der Transistor "ein" - Strom fließt fast verlustfrei von Source zu Drain. Anders ausgedrückt: Der Source- Drain Widerstand ist klein. Falls die Gatespannung im "Aus" Bereich liegt, ist auch der Transistor "aus"; es fließt kein Source-Drain Strom. Anders ausgedrückt: Der Source- Drain Widerstand ist sehr hoch. Das funktioniert aber nur, falls die Gatespannung die richtige Polarität hat (im obigen Beispiel muß sie negativ sein) und die Versorgungsspannung, d.h. die Source-Drain Spannung USD nicht zu klein ist (die Polarität ist eher egal). In der Elektronikantike, so bis 1985, hatte sie den Standardwert 5 V, seither sinkt sie und wird bald den 1 V Bereich erreicht haben. Außerdem muß das Gatedielektrikum extrem dünn sein (so um 10 nm, heutzutage (2006) eher 2 nm), und die Eigenschaften aller beteiligten Materialien müssen extremen Qualitätsansprüchen genügen. Wie funktioniert nun der "ideale" MOS Transistor? Dazu nüssen wir uns anschauen, was bei angelegter Gatespannung im Halbleiter unter dem Gate passiert. So etwas ähnliches haben wir schon ansatzweise behandelt, es lohnt sich, im betreffenden Modul schnell nachzuschauen. Zunächst überlegen wir uns, was passiert, falls wir zwar eine Source-Drain Spannung USD anlegen , aber keine Gatespannung; UG = 0 V. Was wir dann haben ist: Ein n-Typ Si Substrat mit einer bestimmten Gleichgewichtsdichte an Majoritätselektronen ne(UG = 0) - überall, auch unter dem Gate; und ein paar wenigen Löchern als Minoritäten. Zwei p-dotierte Gebiete mit einer bestimmten Gleichgewichtsdichte an Löchern, die durch die Größe der Dotierung bestimmt ist. Zwei pn-Kontakte. Einer ist in Vorwärtsrichtung polarisiert (der mit dem positiven USD Anschluß, der andere in Sperrrichtung. Dies gilt für jede Source Drain-Polarität - ein pn-Übergang ist immer gesperrt. Damit kann kein Source-Drain Strom ISD fließen (von Leckströmen einmal abgesehen). Auch in der in Vorwärtsrichtung gepolten Diode fließt kein Strom - denn das Substrat ist elektrisch nicht beschaltet. Noch einfacher: Wir erden den positiven USD Anschluß und das Substrat. Alles in allem haben wir für UG = 0 V Gleichgewicht, es fließen keine Ströme. Aber jetzt legen wir versuchsweise mal eine negative Spannung ans Gate und überlegen was dann passiert. Die Elektronen im Substrat direkt unter der Gate Elektrode spüren eine abstoßende elektrostatische Kraft; sie werden ins Substratinnere getrieben. Ihre Konzentration direkt unter dem Gate sinkt, und ne (U) wird eine Funktion der Tiefe z unter dem Gate (wir haben natürlich gleichzeitig eine Bandverbiegung): MaWi 2 Skript - Page 265 ne = ne(z) = f[ne (z = 0), U] Wir haben aber immer noch Gleichgewicht, d.h. das Massenwirkungsgesetz gilt. Damit erhält man für die Löcherkonzentration unter dem Gate ne (z) · nh (z) = ni2 = const. nh (z) = ni2/ne (z) In Worten: Falls die Elektronenkonzentration unter dem Gate sinkt, geht die Löcherkonzentration entsprechend hoch. Falls wir die Gatespannung genügend groß machen, erreichen wir irgendwann den Fall, daß nh (z = 0) = ne (z = 0), d.h. die Fermienergie ist in Bandmitte. Die dafür benötigte Spannung ist die Schwellenspannung Uth des Transistor (auch diesen Begriff benutz man im Deutschen eher nicht und sagt dafür "Threshold voltage"). Falls wir dann die Gatespannung noch etwas erhöhen, erhalten wir nh (z) > ne (z) für kleine Werte von z, d.h. für zK >z>0 In Worten: Direkt unter dem Gate gibt es jetzt mehr Löcher als Elektronen. Das ist (für uns) etwas neues, dieser Zustand heißt aus durchsichtigen Gründen Inversion. Was wir jetzt haben ist ein dünner p-leitender Kanal der Dicke zK unter dem Gate - und dieser Kanal verbindet die p-leitenden Bereiche von Source und Drain. Es gibt keine pn-Übergänge mehr in diesem Bereich - Strom kann ungehindert fließen, nur noch begrenzt durch den Ohmschen Widerstand des Kanals. Der Kanalwiderstand wird mit wachsender Kanaldicke abnehmen; wir können ihn also durch die Gatespannung einstellen. Fall wir die Polarität der Gatespannung umdrehen, werden die Elektronen jetzt angezogen; ihre Konzentration unter dem Gate steigt. Das beschert uns den schon bekannten Zustand der Akkumulation. Die pn-Übergänge bleiben existent; einer ist gesperrt, wir bekommen keinen Stromfluß. Es ist klar: Falls wir einen MOS Transistor mit einer positiven Gatespannung anschalten wollen, müssen wir ein pdotiertes Substrat mit n-dotierten Source/Drain Gebieten verwenden. Damit haben wir zwei MOS-Transistor Grundtypen: Den p- oder n-Kanal MOS-Transistor, je nach der Art der Ladungsträger im Kanal bei erfolgter Inversion. Für die wesentlichen Kennlinien erwarten wir folgende Kurven Die Abhängigkeit des Source-Drain Stroms ISD von der Gatespannung UG ist qualitativ klar. Die Abhängigkeit von ISD von der Source- Drain Spannung USD ist vielleicht nicht so ganz klar, aber doch halbwegs einsichtig: Kein Strom ohne Spannung - falls USD zu klein wird, muß der Strom sinken. Was können wir nun quantitativ zum MOS Transistor aussagen? Was genau bestimmt (Uth), die Threshold Spannung, oder die Form der ISD(Uth) Kennlinie? Wie hängen die wesentlichen elektrischen Parameter von den Material- und Technologieparametern ab? Warum muß das Gatedielektrikum dünn sein oder wie genau beeinflußt seine Dicke die Parameter? Viele Fragen; keine ganz einfachen Antworten (oder Formeln). Letztlich muß man die Poisson Gleichung für das System aufstellen und lösen - und das geht analytisch nur mit einigem Aufwand mit Näherungen und Fallunterscheidungen. Aber ein bißchen was geht immer - und zwar in einem " advanced" Modul. Fragebogen / Questionaire Multiple Choice Fragen zu 6.4.3 MaWi 2 Skript - Page 266 6.4.4 Zusammenfassung Kapitel 6.4 Solarzelle Solarzellen sind großflächige pn-Übergänge mit einer (im Jahre 2003) (0.3 - 0.5) µm dicken p-Si-Seite und einer dünnen (<< 1 µm) n-Si-Schicht. Alle Photonen mit E = h · ν > EG werden im Halbleiter absorbiert wobei ein Elektron-Lochpaar gebildet wird. Alle Photonen mit kleinerer Energie werden nicht absobiert; ihre Energie geht "verloren". Die photogenerierte Elektronen landen als zusätzliche Minoritätsladungsträger im Leitungsband des p-Halbleiter. Die bei kurzwelligen Photonen vorhandene Überschußenergie EG – h · ν geht bei der Thermalisierung der Ladungsträger "verloren", d.h. macht nur die Solarzelle wärmer. Damit gibt es ein fundamentales Dilemma: Halbleiter mit kleinem Bandgap abbsorbieren zwar mehr Photonen, verlieren aber einen Großteil der Überschußenergie; Halbleiter mit großem Bandgap tun das nicht, aber lassen viele Photonen durch. Konsequenz: Relativ zum gegebenen Sonnenspektrum (= wieviel Photonen gibt es bei welcher Energie) muß es ein optimales Bandgap EG opt geben mit maximalem Wirkungsgrad η = (Energie aus Solarzelle / Energie im Licht) · 100%. EG opt liegt bei ≈ 1,5 eV (≈ GaAs); ηmax ist dann ≈ 30 %. Für Si Solarzellen (EG = 1,1 eV) ist der theoretisch maximale Wirkungsgrad zwangsläufig etwas kleiner und liegt bei ≈ 25%. Reale Wirkungsgrade sind immer kleiner, 15 % ist für ein kommerzielles Solarzellenmodul bereits ein sehr guter Wert. Damit ist die Energie"produktion" im Mittel über alles begrenzt auf (ganz grob /Faustregel) 100 W/m2. Ein Blick auf die grundsätzliche Funktionsweise macht klar, warum die Diffusionlänge, und damit kristalline Perfektion, der Schlüsselparameter zum Erfolg ist (und Si Solarzellen niemals beliebig billig sein werden). Elektrisch wird die Solarzelle komplett beschrieben durch die Diodengleichung mit einem zusätzlichem Term für den (Rückwärts) Photostrom j(Uex) = e · L · nMin(L) e · L · nMin(V) + τ τ · eUex exp – 1 kT – jr(solar) Die graphische Darstellung ist einfach und aufschlußreich: Sie definiert direkt die Schlüsselparameter Kurzschlußstrom (ISC); Leerlaufspannung (UOC), Füllfaktor (FF) und optimaler Arbeitspunk (AP). MaWi 2 Skript - Page 267 Bipolar Transistor Ein bipolar Transistor ist eine Sequenz aus npn oder pnp-dotiertem Si, wobei der mittlere Teil (die Basis) sehr dünn sein muß (genauer: dB << L) Ein Bild definiert die wichtigstem Terme: Das Prinzip ist einfach: Die in Vorwärtsrichtung geschaltete Emitter-Basisdiode injiziert einen großen Löcherstrom vom Emitter in die Basis und einen Elektronenstrom von der Basis in den Emitter. Da die Basis dünn ist, werden viele der injizierten Löcher bis zur RLZ der in Sperrichtung geschalteten BasisKollektordiode gelangen und dann vom dort herrschenden elektrischen Feld in den Kollektor "gespült". Es ist wichtig (und einfach), den "Stromlaufplan" zu verstehen: Bei Vernachlässigung aller "kleinen" Rückwärtströme und der Voraussetzung, dass j hR(BK) ≈ j hF(BE), ergibt sich sofort die Stromverstärkung in einfachster Weise zu e · D · (ni)2 eUex exp j hR(BK) IK β = = IB j hF(BE) = j eF(BE) ND(B) · L = j eF(BE) – 1 kT NA(E) · = e · D · (ni)2 exp NA(E) · L ND(B) eUex – 1 kT Damit ist die Herstellung eines verstärkenden Elements zurückgeführt auf Geometrie ("Mache ein sehr dünne Basis (plus "Drähtchen nach außen)") und ein extremes Dotierverhältnis! Mikroelektronik wird möglich! MaWi 2 Skript - Page 268 MOS Transistor Nur ein Verständnis des Prinzips ist notwendig und möglich. Dazu reicht es, den prinzipiellen Aufbau zu betrachten: Mit der Gatespannung wird der Stromfluß zwischen Sorce und Drain gesteuert; entscheidend ist die Polarität der Gatespannung. Für den p-Kanal MOS Transistor wie oben gezeigt gilt: Positive Gatespannung "zieht" Elektronen an und erhöht die Elektronenkonzentration unter dem Gate. Unabhängig von der Polarität der an Source - Drain anliegenden Spannung, ist einer der beiden pnÜbergänge immer gesperrt. Es fließt bei jeder Gatespannung immer nur ein (vernachlässigbar) kleiner Source-Drain Leckstrom. Negative Gatespannung stößt Elektronen ab, und verringert die Elektronenkonzentration direkt unter dem Gate. Das Massenwirkungsgesetz sorgt dann für erhöhte Löcherkonzentration. Oberhalb einer "Schwellspannung" erfolgt Inversion, d.h. es bildet sich ein p-leitender Kanal. Es gibt keine sperrenden pnÜbergänge mehr; damit kann ein großer Source-Drain Strom fließen. Die wichtigsten Kurven sehen so aus: Die weitaus überwiegende Anzahl der Trillionen (oder mehr??) pro Jahr hergestellten Transistoren sind MOS Transistoren. MaWi 2 Skript - Page 269 6.4.5 Merkpunkte Kapitel 6.4 Solarzelle = großflächiger pn-Kontakt Lichtabsorption produziert zusätzliche Minoritäten; fließen ab als Photostrom falls sie bis zur RLZ diffundieren können. Damit große Diffusionlsänge erforderlich. Wirkungsgrad begrenzt durch Nicht absorbierte Photonen (Zahl steigt mit zunehmendem EG ) Verlorene Überschußenergie Photon (Wird größer mit abnehmendem EG Optimales EG ≈ 1,5 eV mit ηmax ≈ 30 % Si Solarzellen: ηmax ≈ 25 %; ηtech ≈ 15 %. Bipolar Transistor npn- oder pnp-Struktur mit dünner Basis. Die Emitter-Basisdiode wird in Vorwärtsrichtung betrieben und injiziert die Majoritätsladungsträger des Emitters in die Basis. Dort diffundieren diese Ladungsträger bis zum Kollektor, wo sie durch das elektrische Feld der in Rückwärtsrichtung gepolten BasisKollektordiode "abgesaugt" werden Damit Stromverstärkung möglich mit IK β = NA(E) = IB ND(B) MOS Transistor Prinzip: Schaffung eines Kanals unter dem Gate mit derselben Ladungsträgerart wie Source/Drain. Dazu nötig: Inversion: Reduzierung der Majoritätsladungsträgerkonzentration durch elektrostatische "Abstoßung" direkt unter dem Gate bis (durch Massenwirkungsgesetz) die Minoritätsladungsträger überwiegen. Schwellspannung (Threshold Voltage): Notwendige Spannung zur Erreichung der Inversion; einstellbar durch Technologieparameter (insbesondere Dicke des Gate Dielektrikums). MaWi 2 Skript - Page 270 Kennlinie mit wesentlichen Parametern Leerlaufspannung Kurzschlußstrom Füllfaktor Arbeitspunkt