Materialwissenschaften für Technische Physiker, 5. Semester1 Vorl.-Nr. 138.016 Yb18Pt51.1Si15.1 - Type c b a Pt Yb Si P4/mbm, a=1.86246; c=0.40513 nm E. Bauer, Ch. Eisenmenger-Sittner, J. Fidler Institut für Festkörperphysik, Technische Universität Wien Unterlagen zur Vorlesung an der Technischen Universität Wien Studienjahr 2006/2007 1 Das Titelbild repräsentiert die Kristallstruktur der tetragonalen Verbindung YbPt3 Si, Raumgruppe P4/mbm. . i Einführung “Material, von spätlateinisch materialis – das zur Materie gehörende – allgemein sinnverwandt zu Stoff, Substanz, Werkstoff, im Bereich der Fertigung übliche Bezeichnung für die Roh -, Hilfs - und Betriebsstoffe, . . . , die im Rahmen der Fertigung eingesetzt werden” (Meyers Lexikon). Material ist also fast alles was von Menschen eingesetzt wird um daraus etwas anderes herzustellen. Etwas genauer ist vielleicht der Begriff Werkstoff, der genau dies sagt – der Stoff aus dem man ein Werk herstellt. Heute unterscheidet man bei Werkstoffen häufig zunächst zwei Gruppen: • Funktionswerkstoffe – das sind alle die Materialien, die für einen Zweck jenseits mechanischer Eigenschaften eingesetzt werden; also z.B. das große Gebiet der Halbleiter, Supraleiter, elektrokeramischen Materialien, Magnetwerkstoffe usw. • Strukturwerkstoffe – die Materialien, die für einen im weitesten Sinn mechanischen Zweck, Herstellung einer Struktur eben, eingesetzt werden. Hierzu zählen insbesondere die meisten Einsatzgebiete der Metalle und Polymere, aber auch etwa Beton, Ton, Glas usw. Natürlich ist eine solche Unterscheidung nicht immer streng möglich, denn häufig muss ein Kompromiss verschiedener Eigenschaften gefunden werden, wobei mechanische gegen andere Eigenschaften abgewogen werden. Eine Hochspannungsleitung etwa muss natürlich zunächst einen kleinen elektrischen Widerstand haben, andererseits darf sie nicht zu schwer sein, muss über eine möglichst große Länge ihr Gewicht tragen, muss korrosionsfest sein, etc. In dieser Vorlesung soll die Physik von Materialien behandelt werden, wobei neben den strukturellen auch mechanische, magnetische und thermische Eigenschaften besprochen werden. Die klassische Festkörperphysik behandelt im wesentlichen das Studium perfekter, oder idealisierter Strukturen, während die Materialphysik die realen Strukturen mit ihren Defekten, die für sehr viele Eigenschaften von zentraler Bedeutung sind, untersucht. Dazu kommen dann in der Materialphysik eine Reihe von Anleihen bei der Thermodynamik, statistischen Physik und bei der Chemie, die für das Verständnis von Phasenumwandlungen und Transportprozessen wichtig sind. Weiters wird sich die Vorlesung in vielen Fällen auf metallische Materialien beschränken, denn für diese sind die meisten physikalischen Konzepte häufig entwickelt worden. Allerdings sind sie meist so allgemein, dass sie auch auf andere Werkstoffklassen übertragbar sind. Diese hier vorliegende 1. Ausgabe des Skriptums über Materialwissenschaften beruht in Teilen auf Vorlesungsunterlagen, die an anderen Universitäten verwendet werden (z.B. Prof. Freudenberger, IFW Dresden, Materialwissenschaften and der T.U. Darmstadt), einem ausgezeichnet aufbereitetem interaktiven Kurs über Materialwissenschaften (Prof. Föll, Uni Kiel, http : //www.tf.uni − kiel.de/matwis/amat/generalinfo en/index.html), dem Lehrbuch aus Experimentalphysik 3, Prof. Demtöder, der Einführung in die Festkörperphysik, Ch. Kittel und einige weitere Lehrbücher und Übersichtsartikel. Es gibt natürlich auch spezielle Einführungen in die Materialwissenschaften, die den einen oder anderen Aspekt stärker ii betonen, als es im vorliegenden Skriptum der Fall ist. Verschiedene Forschungsergebnisse der verantwortlichen Autoren, sowie weiterer Mitarbeiter am Institut für Festkörperphysik, haben ebenfalls Eingang in diese Unterlagen gefunden und stellen damit einen Beitrag zur forschungsgeleiteten Lehre dar. Dieses Skriptum soll Ihnen helfen, die knapper gehaltenen Vorlesungsunterlagen, die den Stoffbereich der Prüfung definieren, besser zu verstehen. Es soll Ihnen aber auch den einen oder anderen interessanten Aspekt der Materialwissenschaften näher erläutern. Wir ersuchen Sie höflich, Druckfehler oder sonstige Fehler, sowie Verbesserungsvorschläge den Autoren dieses Skriptums mitzuteilen ([email protected], [email protected], [email protected]). Wien, im Jänner 2006 E. Bauer (Tel. 01 58 801 131 60) Ch. Eisenmenger - Sittner (Tel. 01 58 801 137 74) J. Fidler (Tel. 1 58 801 137 14) Die jeweils aktuelle Version dieses Skriptums sowie Vorlesungsunterlagen können über die Homepage des Instituts für Festkörperphysik kostenlos bezogen und heruntergeladen werden (http://www.ifp.tuwien.ac.at). Inhaltsverzeichnis 1 Kristallstrukturen 1.1 Translationsgitter, Symmetrien . . . . . . . . . . 1.2 Kristallklassen . . . . . . . . . . . . . . . . . . . . 1.3 Miller Indizierung und reziprokes Gitter . . . . . 1.4 Einfache Kristallstrukturen . . . . . . . . . . . . . 1.5 Bindungen . . . . . . . . . . . . . . . . . . . . . . 1.5.1 Ionenbindung – heteropolare Bindung . . . 1.5.2 Kovalente Bindung . . . . . . . . . . . . . 1.5.3 van der Waals-Bindung – Edelgaskristalle 1.5.4 Metallische Bindung . . . . . . . . . . . . 1.6 Kristallgitterdefekte . . . . . . . . . . . . . . . . . 2 Strukturbestimmung 2.1 Einleitung . . . . . . . . . . . . . . . . . . . . . 2.2 Streuung am einzelnen Atom . . . . . . . . . . . 2.2.1 Streuamplitude und Bornsche Näherung 2.2.2 Röntgenstreuung am Atom . . . . . . . . 2.2.3 Elektronen-Beugung . . . . . . . . . . . 2.2.4 Neutronenstreuung . . . . . . . . . . . . 2.2.5 Vergleich der Streulängen . . . . . . . . 2.3 Beugung an periodischen Strukturen . . . . . . 2.4 Grundlagen der Strukturanalyse . . . . . . . . . 2.5 Experimentelle Grundbegriffe . . . . . . . . . . 2.5.1 Röntgenbeugung . . . . . . . . . . . . . 2.5.2 Elektronenbeugung . . . . . . . . . . . . 2.5.3 Neutronenbeugung . . . . . . . . . . . . . . . . . . . . . . . . . 3 Mehrstoffsysteme 3.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . 3.2 Thermodynamische Grundlagen . . . . . . . . . . 3.2.1 Der 1. Hauptsatz der Thermodynamik . . 3.2.2 Entropie, freie Energie und freie Enthalpie 3.3 Konstitutionslehre . . . . . . . . . . . . . . . . . iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 12 13 18 24 25 28 31 33 34 . . . . . . . . . . . . . 49 49 53 54 56 58 59 62 64 66 69 72 78 81 . . . . . 85 85 87 87 91 97 iv INHALTSVERZEICHNIS 3.4 3.5 3.6 3.7 3.8 3.3.1 Die Phasenregel . . . . . . . . . . . . . . . . . . . . . . . 3.3.2 Thermodynamisches Gleichgewicht in Zweistoffsystemen 3.3.3 Ideale Mischung . . . . . . . . . . . . . . . . . . . . . . . 3.3.4 Herleitung binärer Zustandsdiagramme . . . . . . . . . . 3.3.5 Vollmischbare Systeme . . . . . . . . . . . . . . . . . . . Reale Zustandsdiagramme und ihre Interpretation . . . . . . . . 3.4.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2 Eutektische Systeme . . . . . . . . . . . . . . . . . . . . 3.4.3 Kornseigerung . . . . . . . . . . . . . . . . . . . . . . . . 3.4.4 Vollmischbare Systeme . . . . . . . . . . . . . . . . . . . 3.4.5 Systeme mit Mischungslücke . . . . . . . . . . . . . . . . 3.4.6 Peritektische Systeme . . . . . . . . . . . . . . . . . . . . 3.4.7 Allgemeine Systeme . . . . . . . . . . . . . . . . . . . . . 3.4.8 Beispiel: Stahl . . . . . . . . . . . . . . . . . . . . . . . . Diffusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.2 Atomistische Diffusionsmechanismen . . . . . . . . . . . 3.5.3 Diffusion in kontinuierlichen Systemen . . . . . . . . . . 3.5.4 Diffusion und Phasendiagramme . . . . . . . . . . . . . . Entmischungsvorgänge . . . . . . . . . . . . . . . . . . . . . . . 3.6.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6.2 Nukleation . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6.3 Spinodale Entmischung . . . . . . . . . . . . . . . . . . . Oberflächen und Grenzflächen . . . . . . . . . . . . . . . . . . . 3.7.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7.2 Grundlagen der Grenzflächenphysik . . . . . . . . . . . . 3.7.3 Technologische Bedeutung von Grenzflächen . . . . . . . Präparationsmethoden . . . . . . . . . . . . . . . . . . . . . . . 3.8.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 3.8.2 Abscheidung aus der Schmelze . . . . . . . . . . . . . . . 3.8.3 Abscheidung aus der Gasphase . . . . . . . . . . . . . . 3.8.4 Abscheidung aus der Flüssigphase . . . . . . . . . . . . . 3.8.5 Darstellung aus der festen Phase . . . . . . . . . . . . . 3.8.6 Nachbehandlungen . . . . . . . . . . . . . . . . . . . . . 4 Makroskopische Eigenschaften 4.1 Metalle, Halbleiter und Isolatoren 4.1.1 Metalle . . . . . . . . . . 4.2 Halbleiter . . . . . . . . . . . . . 4.2.1 Reine Halbleiter . . . . . . 4.2.2 Gestörte Halbleiter . . . . 4.2.3 Halbleiter-Elektronik . . . 4.3 Mechanische Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 100 101 107 110 117 117 118 122 124 124 125 127 130 132 132 133 138 142 147 147 148 154 156 156 157 160 162 162 162 163 163 164 165 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 167 167 181 181 184 188 192 INHALTSVERZEICHNIS 4.4 4.5 4.3.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Elastische Grundgrößen . . . . . . . . . . . . . . . . . . 4.3.3 Kristallstruktur und elastische Eigenschaften . . . . . . . 4.3.4 Nichtelastische Eigenschaften . . . . . . . . . . . . . . . 4.3.5 Messung mechanischer Eigenschaften . . . . . . . . . . . Thermische Eigenschaften . . . . . . . . . . . . . . . . . . . . . 4.4.1 Spezifische Wärme . . . . . . . . . . . . . . . . . . . . . 4.4.2 Thermische Leitfähigkeit . . . . . . . . . . . . . . . . . . 4.4.3 Thermische Ausdehnung . . . . . . . . . . . . . . . . . . Magnetische Eigenschaften . . . . . . . . . . . . . . . . . . . . . 4.5.1 Magnetisches Moment . . . . . . . . . . . . . . . . . . . 4.5.2 Einteilung der magnetischen Eigenschaften . . . . . . . . 4.5.3 Klassische Theorie des Ferromagnetismus . . . . . . . . . 4.5.4 Magnetisierungsprozesse, Hysteresis und Domänentheorie 4.5.5 Einteilung der magnetischen Werkstoffe . . . . . . . . . . A Modellbildung zur thermischen Ausdehnung 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 192 197 199 204 206 206 216 224 231 232 235 240 244 248 259 6 INHALTSVERZEICHNIS Kapitel 1 Kristallstrukturen 1.1 Translationsgitter, Symmetrien Die Vielzahl der verschiedenen Erscheinungsformen der Festkörper lassen sich nach unterschiedlichen Kriterien in Klassen einordnen. Ein wichtiges Ordnungskriterium ist ihre räumliche Struktur. Man unterscheidet dabei: • Einkristalle, bei denen die Orte der Atome durch ein periodisches Gitter von Raumpunkten beschrieben werden können. Die Periodenlängen des Gitters sind für den jeweiligen Festkörperkristall charakteristisch. Bei einem idealen Einkristall erstreckt sich dieses periodische Raumgitter über den gesamten Kristall. Man sagt dann, dass eine Fernordnung vorhanden ist (Abb. 1.1). Im einfachsten Fall nur einer Atomsorte können wir uns den Festkörper - z.B. die elementaren Metalle, oder einen Diamanten - als Anordnung von Kugeln vorstellen, die sich berühren müssen, d.h. gegenseitige Bindungen aufweisen. Aus der bekannten Position einiger Atome lässt sich die Position aller anderen Atome berechnen. Entlang einer Linie, die durch die Zentren zweier beliebiger Atome führt, lassen sich die Wahrscheinlichkeiten, bei einer beliebigen Position ein Atom zu finden, durch δ - Funktionen angeben. Es existiert eine Nah- und Fernordnung und eine Translationssymmetrie. • Polykristalline Festkörper, die aus vielen kleinen Einkristallen bestehen, deren Größe und relative Orientierung regellos variiert. Die Periodizität der Atomanordnung gilt jeweils nur für jeden einzelnen dieser Mikrokristalle; sie erstreckt sich nicht über den ganzen Festkörper (Abb. 1.2). • Amorphe Festkörper, bei denen die Atome bzw. Moleküle unregelmäßig verteilt angeordnet sind. Es gibt keine strenge Periodizität mehr und daher auch keine Fernordnung (Abb. 1.3). Aus der bekannten Position einiger Atome lässt sich die Position aller anderen Atome nicht berechnen. Entlang einer beliebigen Linie lässt sich die Wahrscheinlichkeit, bei einer beliebigen Position ein Atom zu finden, durch eine radiale Verteilungsfunktion angeben. Es existiert nur eine beschränkte Nahordnung. Es existiert keine Translationssymmetrie. 7 8 KAPITEL 1. KRISTALLSTRUKTUREN Abbildung 1.1: a) Schematische 2-dimensionale Darstellung einer streng regelmäßigen Kristallstruktur. b) Wahrscheinlichkeit, bei einer beliebigen Position ein Atom zu finden Abbildung 1.2: Zweidimensionale Darstellung eines polykristallinen Festkörpers Abbildung 1.3: a) Schematische 2-dimensionale Darstellung einer regellosen amorphen Struktur. b) Radiale Verteilungsfunktion. c) schematische zweidimensionale Darstellung eines amorphen Festkörpers ohne Fernordnung, z.B. von Glas. 1.1. TRANSLATIONSGITTER, SYMMETRIEN 9 • Flüssigkristalle, die sich in einem Zwischenzustand befinden zwischen dem geordneten Zustand eines kristallinen Festkörpers und dem einer isotropen Flüssigkeit mit statistisch variierenden Orten individueller Atome bzw. Moleküle. Je nach Temperatur oder äußerem angelegten Feld lassen sich Flüssigkristalle mit eindimensionaler Periodizität realisieren oder auch eine Anordnung, bei der die Moleküle in einer Ebene eine Fernordnung zeigen, die aber für verschiedene Ebenen ganz verschieden sein kann. Translationsgitter Wir wollen zuerst die einkristallinen Festkörper behandeln. Am einfachsten zu beschreiben sind atomare Kristalle, bei denen an jedem Punkt des Raumgitters genau ein Atom sitzt. Wir wählen den Ort eines dieser Atome als Nullpunkt unseres Koordinatensystems und nennen die Ortsvektoren a1 , a2 , a3 zu den drei Nachbaratomen die Basisvektoren des Gitters. Bei einem rechtwinkligen Gitter zeigen sie in x-, y- und z-Richtung. Wir werden jedoch weiter unten sehen, dass nicht alle Gitter rechtwinklig sind. Der Ortsvektor zu einem beliebigen Gitterpunkt (Translationsvektor) T = u · a1 + v · a2 + w · a3 (1.1) lässt sich dann immer als Linearkombination der Basisvektoren darstellen (u,v,w ganzzahlig). Das Parallelepiped, das sich aus den drei Basisvektoren a, b, c aufbaut, heißt Elementarzelle des Kristalls. Da sich das gesamte Kristallgitter durch Translationen der Elementarzelle aufbauen lässt, nennt man ein solches Gitter auch Translationsgitter. Symmetrie Bedeutet, dass sich Eigenschaften eines Systems unter bestimmten Operationen nicht ändern. Für den kristallinen Aufbau, soweit wir ihn bereits kennen, herrscht offensichtlich Translationssymmetrie. • Translationsymmetrie heißt: Ein Kristall ändert sich nicht, wenn alle Atome um bestimmte Werte x0 , y0 , z0 verschoben werden. In anderen Worten, es ist egal wo wir den Ursprung eines Koordinatensystems hinlegen, solange er an einem Symmetriepunkt sitzt. • Ein Kristall ändert sich möglicherweise auch nicht, wenn man ihn um bestimmte Winkel dreht, an bestimmten Ebenen spiegelt oder relativ zu einem gegebenen Punkt invertiert (d.h. alle Vektoren r vom Aufpunkt aus zu einem Atom durch −r ersetzt). • Wir erwarten damit noch weitere Symmetrien: Rotationssymmetrie, Spiegelsymmetrie, Inversionssymmetrie. • Eine Symmetrieachse Cn heißt n-zählig, wenn der Kristall bei der Drehung um den Winkel ϕ = 2π/n wieder in sich übergeht. In Kristallen treten Symmetrieachsen Cn mit n = 2, 3, 4 oder 6 auf. So gibt es bei einem kubischen Kristall drei Symmetrieebenen parallel zu den Seitenflächen (Abb. 1.4a) und sechs Ebenen durch die Flächendiagonale (Abb. 1.4b). Es gibt drei vierzählige Symmetrieachsen C4 (Abb. 1.4c), vier dreizählige Achsen C3 (Abb. 1.4d) und vier zweizählige Achsen C2 (Abb. 1.4e). Es gibt jedoch für ein Translationsgitter keine Symmetrieachsen mit n = 5 und n ≥ 7. Man kann 10 KAPITEL 1. KRISTALLSTRUKTUREN eine Ebene nicht vollständig mit Fünfecken oder Siebenecken ausfüllen, ohne dass freie Stellen oder Überlappungen auftreten. Abbildung 1.4: Einige Symmetrieebenen (a)-(b) und Symmetrieachsen (c)-(e) eines kubischen Kristalls Quasikristalline Materialien verhalten sich in vielen Experimenten wie ein Kristall mit einer 5-zähligen Symmetrie, d.h. die konventionellen Regeln der Kristallographie gelten nicht. Quasikristalle sind Kristalle, die Symmetrien aufweisen und wo Atome regelmäßig angeordnet sind, ohne dabei ein periodisches Gitter (keine Translationssymmetrie) zu bilden. Man kennt heute eine ganze Reihe von Legierungssystemen (über 60, die meisten auf der Basis von Aluminium oder Titan), die eine oder mehrere quasikristalline Phasen mit 5-, 8-, 10- oder 12zähliger Symmetrie bilden können. Die Mehrheit dieser Phasen ist metastabil, d. h. sie gehen bei höheren Temperaturen in periodisch kristalline Phasen über. Die Herstellung beruht in diesem Fall auf schnellen Abschreckverfahren. Inzwischen hat man auch einige Legierungen hergestellt, in denen stabile quasikristalline Phasen existieren. Aus Legierungen wie AlCuCo oder AlCuFe lassen sich mit klassischen Kristallzuchtverfahren Ein-Quasikristalle von mehreren Zentimetern Größe direkt aus der Schmelze ziehen. Damit sind Kristallstrukturen mathematisch erfassbar. Das Vorgehen dabei ist wie folgt: Zuerst betrachten wir eine rein mathematische Konstruktion: Das Punktgitter oder kurz Gitter. In ihm sind mathematische Punkte so angeordnet, dass sie zumindest eine Translationssymmetrie besitzen. Das Punktgitter ist ein mathematisches Objekt und damit kein Kristall; denn ein Kristall ist ein physikalisches Objekt und bedarf der Atome. Vom Punktgitter zum Kristall kommt man, indem jedem Punkt des Punktgitters ein Baustein des Kristall zugeordnet wird, die so genannte Basis. Das kann ein einziges Atom sein, aber auch Verbände oder Moleküle mit hunderten von Atomen. Damit folgt eine sehr wichtige Definition (Abb. 1.5): Kristall = Gitter + Basis 1.1. TRANSLATIONSGITTER, SYMMETRIEN 11 Abbildung 1.5: Zusammenhang zwischen Kristall, Gitter und Basis Die Einheitszelle mit dem kleinsten Volumen heißt primitive Einheitszelle, wobei das Volumen VE einer Einheitszelle, bzw. Elementarzelle durch das Spatprodukt der Basisvektoren gegeben ist: VE = a1 · (a2 × a3 ) (1.2) Die Seitenlängen |a1 |, |a2 |, |a3 |, der Einheitszelle heißen Gitterkonstanten a, b, c. Mit einer geeignet gewählten Einheitszelle (EZ) oder Elementarzelle kann jeder beliebige Gittertyp beschrieben werden. Ein gegebenes Gitter kann immer mit mehr als einer EZ beschrieben werden. Ein- und dasselbe Gitter kann durch verschiedene EZ generiert werden (Abb. 1.6). Abbildung 1.6: Die 4 eingezeichneten Einheitszellen mit ihren jeweiligen Basisvektoren spannen alle dasselbe 2-dimensionale Gitter auf. 12 1.2 KAPITEL 1. KRISTALLSTRUKTUREN Kristallklassen Man kann alle möglichen Kristallgitter nach ihren Symmetrien in sieben Kristallsysteme einteilen, wobei zu jedem dieser Systeme entweder nur ein einziges primitives Gitter gehört oder zusätzlich noch nichtprimitive Gitter mit mehr als einem Atom pro Einheitszelle. Insgesamt gibt es 14 Gittertypen, die nach dem französischen Physiker Auguste Bravais (1811-1863) die 14 Bravaisgitter heißen. Die sieben Kristallsysteme unterscheiden sich durch die Winkel α, β und γ, welche die Basisvektoren a, b, c miteinander bilden und durch die Längenverhältnisse der Basisvektoren. Wir wollen sie, geordnet nach steigender Symmetrie, kurz besprechen (Abb. 1.8): a) Triklines Kristallsystem a 6= b 6= c und α 6= β 6= γ. Es gibt nur das triklin primitive Gitter. b) Monoklines Kristallsystem a 6= b 6= c und α = γ = 90◦ 6= β Hier gibt es zwei Bravaisgitter: Das monoklin primitive und das monoklin basiszentrierte Gitter, bei dem zusätzlich Gitterpunkte im Zentrum der von den Basisvektoren a und b aufgespannten Flächen liegen. c) Rhombisches Kristallsystem a 6= b 6= c und α = β = γ = 90◦ Hier gibt es vier verschiedene Bravaisgitter: Das rhombisch primitive, das rhombisch basiszentrierte, das rhombisch raumzentrierte und das rhombisch flächenzentrierte Gitter. d) Hexagonales Kristallsystem a = b 6= c und α = β = 90◦ γ = 120◦ Es gibt nur ein Bravaisgitter, nämlich das hexagonal primitive Gitter, dessen Einheitszelle eine rechtwinklige Säule mit einer Raute als Basisfläche ist. e) Rhomboedrisches oder trigonales Kristallsystem a = b = c und α = β = γ 6= 90◦ Es gibt nur das trigonal primitive Bravaisgitter. f) Tetragonales Kristallsystem a = b 6= c und α = β = γ = 90◦ Es gibt zwei Bravaisgitter: Das tetragonal primitive und das tetragonal raumzentrierte Gitter. g) Kubisches Kristallsystem a = b = c und α = β = γ = 90◦ Die zugehörigen drei Bravaisgitter sind das kubisch primitive, das kubisch raumzentrierte und das kubisch flächenzentriertes Gitter. Wenn wir uns die Symmetrien dieser Kristallsysteme anschauen, so erkennen wir, dass das kubische System die höchste Symmetrie hat (Inversionssymmetrie am Mittelpunkt der Einheitszelle, sechs Symmetrieebenen, drei vierzählige Symmetrieachsen C4 , vier dreizählige Achsen C3 , vier C2 -Achsen, Abb. 1.4), während das trikline System die geringste Symmetrie hat (nur eine einzählige Symmetrieachse, d. h. kein echtes Symmetrieelement). Man kann zeigen, dass sich die nicht primitiven Gitter (z.B. das kubisch flächenzentrierte, 1.3. MILLER INDIZIERUNG UND REZIPROKES GITTER 13 fcc, ,,face centered cubic“) auf primitive Gitter mit geringerer Symmetrie und kleinerer Einheitszelle reduzieren lassen (Abb. 1.7). Abbildung 1.7: a) 3D- und b) 2D-Darstellung des kubisch flächenzentrierten (fcc) Kristallgitters. So lässt sich z.B. das kubisch raumzentrierte Gitter (bcc, ,,body centered cubic“) mit den beiden gleichen Atomen A an den Orten {0, 0, 0} und {1/2, 1/2, 1/2} auf eine kleinere primitive Elementarzelle des trigonalen Systems mit den gleich langen Basisvektoren zurückführen. Diese Einheitszelle enthält nur noch ein Atom und ist also halb so groß wie die nicht primitive Elementarzelle des fcc Gitters. Eine weitere Zelle mit nur einem Gitterpunkt erhält man, indem man, von einem Atom ausgehend, die Verbindungsstrecken zu den Nachbaratomen durch Normalebenen halbiert. Das von diesen Ebenen begrenzte Volumen heißt Wigner-Seitz-Zelle. Oft ist es jedoch einfacher, die nichtprimitiven Gitter mit höherer Symmetrie zu behandeln, als die primitiven mit geringerer Symmetrie. 1.3 Miller Indizierung und reziprokes Gitter Wir brauchen eine Notation, die uns erlaubt, bestimmte Richtungen und Ebenen in einem beliebigen Gitter eindeutig anzusprechen, d.h. eine mathematische Formulierung für Aussagen wie “entlang der Flächendiagonalen” oder “auf der Würfelebene”. Man könnte mehrere Arten von Rezepten angeben, mit denen man eine Richtung (d.h. einen Vektor) oder eine Ebene in einem Gitter eindeutig indizieren kann. Es gibt aber ein besonderes System, die sogenannten Miller Indizes, die zwar vielleicht nicht sofort einleuchten, mit denen man aber (später) sehr bequem rechnen kann. Wir betrachten zunächst die Miller-Indizierung für Richtungen. Eine Richtung in einem Gitter wird durch drei ganze Zahlen indiziert, indem • Der Ursprung der EZ in die gewünschte Position gelegt wird. • Ein Vektor in der gewünschten Richtung in kleinstmöglichen ganzzahligen Komponenten der Basisvektoren ausgedrückt wird. • Auftauchende negative Zahlen durch einen Überstrich dargestellt werden. 14 KAPITEL 1. KRISTALLSTRUKTUREN Abbildung 1.8: Die sieben Kristallsysteme mit den 14 Bravaisgittern 1.3. MILLER INDIZIERUNG UND REZIPROKES GITTER 15 • Das erhaltene Zahlentripel uvw in eckige Klammern [uvw] gesetzt wird wenn es sich um eine spezifische Richtung handelt, und in spitze Klammern <uvw>, wenn die Gesamtheit aller kristallographisch gleichwertigen Richtungen gemeint ist. In Abb. 1.9 ist die Indizierung der wichtigsten Richtungen im kubischen Gitter dargestellt. Abbildung 1.9: Die Indizierung der wichtigsten Richtungen im kubischen Gitter. Durch mindestens drei nicht auf einer Geraden liegende Gitterpunkte wird eine Gitterebene definiert (auch Netzebene genannt). Die Orientierung dieser Ebene relativ zu den Kristallachsen a, b, c wird durch die Schnittpunkte der Ebene mit den Achsen festgelegt (Abb. 1.10). Sind diese Schnittpunkte S1 : m1 a, S2 : m2 b, S3 : m3 c. dann bildet man die reziproken Werte 1/m1 , 1/m2 , 1/m3 und multipliziert sie mit einer kleinsten ganzen Zahl p, welche die Kehrwerte zu teilerfremden ganzen Zahlen h= p , m1 k= p , m2 l= p m3 (1.3) macht. Dieses Tripel (hkl) ganzer Zahlen heißt Millersche Indizes. Jedes Tripel definiert eine Schar paralleler Netzebenen. Die Richtung einer Ebene wird durch die Ebenennormale bestimmt. Der Normalenvektor n einer Ebenenschar (hkl) hat die Komponenten in Richtung der Basisvektoren n = [hkl]. Der Normalenvektor der (100)-Ebene zeigt also in Richtung des Basisvektors a bzw. [100]. Die Achsenabschnitte zwischen zwei Nachbarebenen sind ∆a = a b c , ∆b = , ∆c = . h k l (1.4) Verläuft die Ebenenschar parallel zur Kristallachse, so schneidet sie diese Achse nicht. Der entsprechende Millersche Index ist dann Null. In Abb. 1.11 sind zur Verdeutlichung einige Netzebenen dargestellt. Die (100)-Ebenenschar verläuft parallel zu den Achsen b und c, die 16 KAPITEL 1. KRISTALLSTRUKTUREN Abbildung 1.10: Zur Definition einer Netzebene Abbildung 1.11: Einige ausgewählte Netzebenen in einem kubischen Gitter 1.3. MILLER INDIZIERUNG UND REZIPROKES GITTER 17 (110)-Ebene parallel zur c-Achse, aber schräg zu den Achsen a und b. Auf jeder Ebene der Ebenenschar (hkl) liegen gleich viele Gitterpunkte. Die Dichte der Gitterpunkte pro Flächeneinheit hängt jedoch von den Indizes (hkl) ab. Das Zahlentripel hkl wird in runde Klammern (hkl) gesetzt, wenn es sich um eine spezifische Ebene handelt, und in geschweifte Klammern {hkl}, wenn die Gesamtheit aller kristallographisch gleichwertigen Ebenen mit denselben Indizes gemeint ist. Alle äquivalenten Ebenen haben die gleiche Indizierung. Das Kürzel (112) bezeichnet also nicht eine Ebene, sondern unendlich viele parallel laufende Ebenen; {112} mehrere Sätze unendlich vieler parallel laufender Ebenen. Einige Vorteile der Miller-Indizes lassen sich zusammenfassen in: • Kristallographisch äquivalente Richtungen und Ebenen haben immer den gleichen Satz an Miller Indizes. • Die Richtung [hk] steht immer senkrecht auf die Ebene (hkl). • Die Abstände dhkl zwischen zwei benachbarten Ebenen sind direkt aus den Indizes berechenbar. Die Formeln für nichtkubische Gittersysteme können etwas kompliziert sein, aber im kubischen Gittersystem gilt ganz einfach: dhkl = √ h2 a + k 2 + l2 (1.5) Bei der Analyse experimenteller Daten zur Untersuchung der Kristallstruktur erweist es sich als sehr zweckmäßig, das sogenannte reziproke Gitter einzuführen, das durch reziproke Basisvektoren g 1 , g 2 ,g 3 aufgebaut wird. Diese Vektoren werden formal als die Translationsvektoren im reziproken Raum wie folgt definiert: 3 3 g 1 = 2π a1a(a2 ×a = 2π a2V×a 2 ×a3 ) E 1 1 g 2 = 2π a1a(a3 ×a = 2π a3V×a 2 ×a3 ) E 2 2 g 3 = 2π a1a(a1 ×a = 2π a1V×a , 2 ×a3 ) E (1.6) wobei VE das Volumen der Einheitszelle ist. Der Basisvektor g 1 des reziproken Gitters steht senkrecht auf der durch die Vektoren a2 und a3 aufgespannten Ebene des Raumgitters. Das reziproke Gitter ist die Fouriertransformierte des Ortsgitters und es hat wichtige Eigenschaften: • steht senkrecht auf der Ebene des Raumgitters mit den Miller Indizes (hkl) • die Länge von Ghkl ist proportional zum reziproken Abstand der Netzebenen dhkl . • das Skalarprodukt zwischen einem beliebigen Translationsvektor T des Raumgitters und einem beliebigen Translationsvektor des zugehörigen reziproken Gitters ist immer 2πn (mit n = 0, 1, 2, 3, . . .). 18 KAPITEL 1. KRISTALLSTRUKTUREN Es gilt allgemein: Ghkl = hg 1 + kg 2 + lg 3 , G · T = 2πn |Ghkl | = ai · g j = 2πδij , 2π dhkl (1.7) (1.8) wobei die ai die Einheitsvektoren in Richtung a,b,c sind und δij das Kroneckersymbol ist. Das reziproke Gitter zum kubisch raumzentrierten Gitter ist ein kubisch flächenzentriertes Gitter und umgekehrt. Als Beispiel ist in Abb. 1.12 die geometrische Konstruktion eines 2D reziproken Gitters abgebildet. Abbildung 1.12: Zweidimensionales Raumgitter (links) und dazugehöriges reziprokes Gitter (rechts). Eine wichtige Anwendung des reziproken Gitters betrifft die sogenannte EwaldKonstruktion der Beugung. Es handelt sich dabei um eine an Einfachheit nicht mehr zu überbietende geometrische Umsetzung der vektoriellen Bragg-Bedingung. k0i − ki = Gi . (1.9) Alle Ebenen, deren reziproke Gitterpunkte von der Ewaldkugel geschnitten werden, erfüllen die Bragg-Bedingung der elastischen Beugung (siehe Kapitel 2). Jeder Punkt im reziproken Gitter steht für eine Ebenenschar des Raumgitters. =2π/λ ist der Wellenvektor der einfallenden Welle. Die ganze Konstruktion ergibt die möglichen k0 -Werte (Wellenvektor der elastisch gebeugten Wellen) (Abb. 1.13). 1.4 Einfache Kristallstrukturen Alle Kristallstrukturen können durch eines der im vorigen Abschnitt behandelten BravaisPunktgitter beschrieben werden, indem jedem Gitterpunkt die entsprechende Atombasis 1.4. EINFACHE KRISTALLSTRUKTUREN 19 Abbildung 1.13: Ewald Kugel Konstruktion der Braggschen Beugung. zugeordnet wird. Um bei Gittern, die mehr als ein Atom pro Einheitszelle haben, die Lage der Atome innerhalb der Basis anzugeben, legt man den Bezugspunkt (den Gitterpunkt) in den Mittelpunkt des ausgewählten Basisatoms. Die Positionen der anderen Basisatome innerhalb der Einheitszelle werden dann in Bruchteilen der Gitterkonstanten a, b, c angegeben. Hat die Basis mehr als ein Atom, so kann die Symmetrie des Kristallgitters kleiner sein als die des zugehörigen Bravaisgitters. Die Elemente des Periodensystems erstarren alle bei genügend tiefer Temperatur (und bei He nur bei genügend hohem Druck) in feste Körper und diese sind durchwegs Kristalle. Ungefähr 95% aller Elementkristalle haben dabei einen der drei folgenden Gittertypen: Kubisch flächenzentriertes Bravais-Gitter, kfz (fcc für “face centered cubic”) Mit einem Atom in der Basis, das dann auf den Ecken und Seitenmitten des Würfels sitzt, kristallisieren z.B. Al, Ni, Cu, Pd, Ag, Pt, Au sowie alle Edelgase. Mit zwei Atomen in der Basis, eines bei der Position (0,0,0) der Würfelecke, das andere dann bei (1/4, 1/4, 1/4), kristallisieren Si, Ge, C (als Diamant) und Sn unterhalb von 13◦ C. Diese Kristallsorte hat einen eigenen Namen; man spricht vom “Diamantgitter” (obwohl man eigentlich “Diamantkristall” meint). Etwa 30 % aller Elemente kristallisieren in einem fcc-Gitter. Kubisch raumzentriertes Bravais-Gitter, krz (bcc für “body centered cubic”) Mit einem Atom in der Basis, das dann auf den Ecken und im Zentrum des Würfels sitzt, kristallisieren z.B. K, Rb, Cs, V, Nb, Ta, Cr, Mo und W. Etwa 30 % aller Elemente kristallisieren in einem bcc-Gitter. Hexagonal dichteste Kugelpackung, hdp (hcp für “hexagonal close packed”) Die hexagonal dichteste Kugelpackung entsteht, wenn man ein hexagonales BravaisGitter mit einer Basis aus (mindestens) zwei gleichartigen Atomen kombiniert. Das erste Atom sitzt bei (0,0,0), das zweite bei (2/3, 1/3, 1/2); also auf halber c-Achsenhöhe im Zentrum eines Basisdreiecks. Dass mit dieser Anordnung eine dichteste Kugelpackung entsteht, 20 KAPITEL 1. KRISTALLSTRUKTUREN Abbildung 1.14: (a) fcc-Kristallstrukur (b) Diamantstruktur/einatomig Abbildung 1.15: Abbildung 1.15: bcc-Kristallstruktur d.h. dass es keine Möglichkeit gibt, mehr (gleichgroße) Kugeln in ein gleichgroßes Volumen zu packen, werden wir weiter unten sehen. Etwa 35 % aller Elemente kristallisieren in einem hcp-Gitter, darunter beispielsweise Mg, Re, Co, Zn, Cd, C (als Graphit) und N. Die beiden mit A gekennzeichneten Ebenen konstituieren das bekannte hexagonale Bravais-Gitter mit der hexagonalen Basisebene und der hexagonalen Achse in c-Richtung. Die zusätzliche Atome der 2er-Basis des hcp-Kristalls bilden die mit B gekennzeichnete Ebene. Ihre Anordnung ist identisch zu der einer A-Basisebene; sie sind nur lateral verschoben. Man erkennt: Der hcp-Kristall kann auch gebildet werden, wenn man identische Atomebenen oder auch Kristallebenen – aber nicht Gitterebenen! – in einer bestimmten Stapelfolge aufeinander packt. Wir sehen, dass es zunehmend (sprachlich) schwer fällt, die saubere Unterscheidung zwischen Gitter und Kristall aufrechtzuerhalten. Je nach Element wird immer diejenige Kristallstruktur gewählt, die am besten zu den Bindungsverhältnissen passt, d.h. die größte Energieabsenkung zur Folge hat. Viele Elemente kommen aber in mehreren Kristallstrukturen vor – z.B. der Kohlenstoff, der, wie wir wissen, in der Regel als Graphit (hcp-Gitter) und nur selten als Diamant (fcc-Gitter) vorliegt. Bei gegebenem Druck und Temperatur kann allerdings immer nur ein Gitter stabil, d.h. energetisch am günstigsten sein. Diamant 1.4. EINFACHE KRISTALLSTRUKTUREN 21 Abbildung 1.16: hcp Kristallstruktur ist bei Raumtemperatur und Normaldruck eigentlich nicht stabil sondern nur metastabil; glücklicherweise dauert aber die Umwandlung zum stabilen Graphit bei Raumtemperatur nahezu unendlich lange. Bei anderen Elementen, oder ganz allgemein, bei beliebigen Kristallen, ist das aber nicht immer so. Bei bestimmten Temperaturen und Drücken erfolgt eine spontane Umwandlung in ein anderes, bei diesen Zustandgrößen stabiles und nicht nur metastabiles Gitter. Eisen (Fe), unser wichtigstes Metall, erstarrt unterhalb des Schmelzpunktes von 1536 ◦ C in ein bcc-Gitter, das sich aber unterhalb von 1402 ◦ C in ein fcc-Gitter umwandelt. Unterhalb von 723◦ C nimmt es wieder die bcc-Gitterstruktur an. Die Koordinationszahl KZ gibt die Zahl der gleichwertigen nächsten Nachbarn an (KZ für fcc und hcp ist 12 und für bcc 8). Bravaisgitter und dichteste Kugelpackung Neben der Beschreibung eines Kristalls mit Bravaisgittern und Basis ist es manchmal einfacher, sich einen gegebenen Kristall direkt aus Atomen oder Molekülen, die in Ebenen liegen, zu konstruieren. Die Bauelemente sind dann z.B. simple Kugeln für alle Atome, die ungerichtete Bindungen haben, Kugeln mit definierten “Ärmchen”, falls kovalente Bindungen vorliegen, oder auch ganze Moleküle mit ihren noch verfügbaren Bindungsgeometrien, falls wir einen komplexen Kristall bauen wollen. Wir beginnen, indem wir zunächst unsere Kugeln auf einer Ebene zweidimensional möglichst dicht packen. Als nächstes legen wir eine neue Lage von Kugeln auf die bereits vorhandene Ebene. Wir legen nun eine dritte Ebene auf, so dass die Atome wieder in den Kuhlen der 2. Ebene liegen. Dabei gibt es aber zwei unterscheidbare Möglichkeiten. Liegt das Atom in der dritten Ebene in der Projektion exakt über einem Atom der A-Ebene, erhalten wir also wieder eine A-Ebene. Im Fall, dass das Atom aber weder über der A- noch über der B-Ebene liegt, erhalten wir eine neue Ebene, die in unserer Nomenklatur konsequenterweise C-Ebene heißt (Abb. 1.17). Wir haben also zwei Möglichkeiten, einen Kristall mit hcp- und fcc-Struktur in dichtester Kugelpackung zu erzeugen. Wir starten mit einer hexagonalen zweidimensionalen A-Ebene; darauf kommt eine B-Ebene: 22 KAPITEL 1. KRISTALLSTRUKTUREN Abbildung 1.17: Dichteste Kugelpackung mit den zwei möglichen Varianten der 3. Ebene. • Wählen wir als dritte Ebene wieder eine A-Ebene und machen dann periodisch weiter, erhalten wir die Stapelfolge: ABABABABA.... Der Kristall den wir so erhalten, hat die vorher diskutierte hexagonal dichteste Kugelpackung (hcp). • Wählen wir als dritte Ebene aber eine C-Ebene, bekommen wir die Stapelfolge ABC. Wenn wir diese Folge dann immer wieder wiederholen, erhalten wir ABCABCABCABC..., – und dies ist genau das fcc-Gitter wenn wir die Aufeinanderfolge der {111}-Ebenen betrachten. NaCl-Struktur (Abb.1.18) In der Kochsalz oder NaCl-Struktur kristallisieren viele Salze und Oxide, z.B. KCl, AgBr, KBr, PbS, MgO, FeO, ... . Das Gitter ist kubisch flächenzentriert, mit zwei Atomen Na+ und Cl− in der Basis; eines bei (0, 0, 0) und das andere bei (1/2, 0, 0) [gleichwertig: (1/2, 1/2, 1/2)]. CsCl-Strukur (Abb.1.19) In der Cäsiumchlorid-Struktur kristallisieren viele intermetallische Verbindungen, aber auch Salze und andere zweiatomige Verbindungen, z.B. CsCl, TlJ, AlNi, CuZn, ... . Die CsCl-Struktur ist bemerkenswert, denn sie ist kubisch primitiv, aber mit zwei Atomen in der Basis: eines bei (0,0,0) und das andere bei (1/2, 1/2, 1/2). Die Zinkblende-Struktur oder Diamant-Struktur (Abb.1.20) Wir kennen es schon; das fcc-Gitter mit Atomen bei (0, 0, 0) und (1/4, 1/4, 1/4) (Abb. 1.14b). Allgemein heißt dieser Kristalltyp auch ZnS- oder Zinkblende-Struktur. Neben der Kohlenstoffform, die man Diamant nennt, kristallisieren in dieser Struktur Si und Ge, aber auch technisch wichtige Kristalle wie GaAs, InSb, GaP, Gax Al1−x As (mit Ga und Al beliebig austauschbar). Das folgende Bild zeigt die ZnS-Struktur. Die schwarzen Atome könnten In 1.4. EINFACHE KRISTALLSTRUKTUREN Abbildung 1.18: NaCl Kristallstruktur Abbildung 1.19: CsCl-Kristallstruktur 23 24 KAPITEL 1. KRISTALLSTRUKTUREN sein, die weißen Sb – wir hätten Indiumantimonid. Die schwarzen Atome könnten aber auch Ga oder Al sein, die weißen As – wir hätten Gax Al1−x As. Abbildung 1.20: ZnS-Kristallstruktur 1.5 Bindungen Atome, die in einem Festkörper gebunden sind, haben eine niedrigere Gesamtenergie als dieselben Atome in einem großen Abstand voneinander und ohne Wechselwirkung. Die Verringerung der Energie, also die Bindungsenergie, kommt in allen Fällen dadurch zustande, dass die Elektronen im Festkörper mit mehr als einem Atomrumpf in Wechselwirkung treten. Alle Kräfte, die Kristalle zusammenhalten, sind ausschließlich elektrostatischer Natur. Magnetische Kräfte können vernachlässigt werden. Die Coulombkräfte aber wirken sich vielgestaltig aus und haben ganz verschiedene Größenordnungen, je nach Anordnung der Kerne und Elektronen in den “Einheiten”, die das Gitter aufbauen. Die Erfahrung zeigt, dass es zweckmäßig ist, zwischen verschiedenen Bindungstypen zu unterscheiden. Allerdings heißt dies nicht, dass die in der Natur vorkommenden Bindungen sich streng einem dieser Typen zuordnen ließen. • Ionenbindung oder heteropolare Bindung: Man findet sie bei der Bindung zwischen einem metallischen und einem nichtmetallischen Element. Sie hat Sättigungscharakter und ist gerichtet. Die Bindungsenergien liegen bei etwa 1 bis 10 eV. • Kovalente oder homöopolare Bindung: Kovalente Bindungen liegen z.B. bei Nichtmetallen und häufig in der organischen Chemie vor. Besonders ausgeprägt ist dieser Bindungstyp bei Gasmolekülen, wie z.B. H2 oder O2 . Die homöopolare Bindung ist ebenfalls gerichtet und hat Sättigungscharakter. Die Bindungsenergien liegen auch bei etwa 1 bis 10 eV. • van der Waals-Bindung: Es handelt sich dabei um eine Art der chemischen Bindung, die durch zwischenmolekulare Wechselwirkung zustande kommt. Sie ist relativ schwach 1.5. BINDUNGEN 25 (Bindungsenergien zwischen 0.01 bis 0.1 eV) und wird daher meist von anderen Bindungstypen überdeckt. • Metallische Bindung: Sie ist die Bindung von Metallen und Legierungen. Bei ihr sind die bindenden Elektronen quasifrei im Metall beweglich. Ihre Bindungsenergie entspricht etwa den ersten beiden Typen. • Wasserstoffbrückenbindung: Die Wasserstoffbrückenbindung findet man zwischen den elektronegativsten Atomen. Ihre Bindungsenergie kann bis zu 0.5 eV betragen. 1.5.1 Ionenbindung – heteropolare Bindung Typische Vertreter von Ionenkristallen sind Alkalihalogenide, bei denen das Elektron aus der äußeren Schale der Alkaliatome A sich überwiegend beim Halogenatom B (mit einem freien Platz in der äußeren Schale) aufhält. Dadurch entsteht eine elektrostatische Anziehung zwischen den Ionen A+ + B− (vgl. Abb. 1.21). Da die Ionen abgeschlossene Schalen bilden, wie z.B. Na+ (1s2 , 2s2 2p6 ) + Cl− (1s2 , 2s2 6p6 , 3s2 3p6 ), sind ihre Ladungsverteilungen kugelsymmetrisch. Man wird daher bei einem Na+ Cl− Ionenkristall Elektronenverteilungen erwarten, die annähernd kugelsymmetrisch um ihre Ionenrümpfe sind. Dies wird in der Tat durch Röntgenbeugungsexperimente bestätigt (vgl. Abb. 1.22). Um eine Abschätzung der Bindungsenergie zu erhalten, nehmen wir den durch die Röntgenbeugung ermittelten Abstand + − −10 R(Na − Cl ) = 2.81 × 10 m und erhalten die Coulombenergie Abbildung 1.21: Schematische Darstele2 −19 = 9.7×10 J = 6.1 eV lung der elektrostatischen Anziehung Epot (Na − Cl ) = 4π0 R bei Ionenbindung. + − der elektrostatischen Anziehung zwischen den beiden Ionen des Ionepaares. Der experimentelle Wert der Bindungsenergie pro Molekül ist 8.2 eV. Die Anziehung zwischen den nächsten Nachbarn macht also schon einen Großteil der Gesamtenergie aus. Um eine genauere Berechnung der elektrostatischen Energie durchzuführen, müssen wir berücksichtigen, dass wegen der großen Reichweite des Coulombpotentials (∝ 1/R) nicht nur 26 KAPITEL 1. KRISTALLSTRUKTUREN die nächsten Nachbarn (wie beim van der Waals-Potential ∝ 1/R6 ), sondern auch weiter entfernte Ionen durchaus noch einen Beitrag zur Bindung zwischen entgegengesetzt geladenen und zu Abstoßung zwischen gleich geladenen Ionen liefern. Beschreibt man den abstoßenden Teil des Potentials bei Überlappen der inneren Elektronenschalen durch eine Exponentialfunktion (Abb. 1.23), so wird die potentielle Energie zwischen einem beliebig gewählten Ion i und einem anderen Ion j i,j Epot = C exp(−rij /%) ± 1 q2 , 4π0 rij (1.10) wobei % der Abstand ist, bei dem die Abstoßungsenergie auf 1/e gesunken ist und das Abbildung 1.22: Räumliche Dichteverteilung der Elektronen im NaCl Kristall. Pluszeichen für gleichnamige Ladungen von i und j, das Minuszeichen für entgegengesetzte Ladungen gilt. Die Wechselwirkungsenergie des Ions i mit allen anderen ist dann X qi q j i C exp(−rij /%) + Epot = . (1.11) 4π0 rij j6=i Da der abstoßende Teil des Potentials nur über kurze Abstände % wirksam ist, brauchen wir für den ersten Term nur die nächsten Nachbarn mit rij = RnN zu berücksichtigen. Schreibt man rij = pij RnN , so wird bei ZnN aus Glchg. 1.11 mit qj = ±qi i Epot = ZnN C exp(−RnN /%) + q 2 X ±1 αq 2 = ZnN C exp(−RnN /%) − 4π0 j pij RnN 4π0 RnN Die Summe α= X ±1 j pij (1.12) 1.5. BINDUNGEN Kristall Madelungkonstante 27 NaCl CsCl ZnS CaCl CdCl2 ZnO SiO2 Al2 O3 1.748 1.73 1.638 2.365 2.244 1.498 2.219 4.172 Tabelle 1.1: Madelungkonstante für verschiedene binäre Verbindungen. heißt Madelung-Konstante. Ihr Wert hängt von der speziellen Gitterstruktur des Ionenkristalls ab (vgl. Tabelle 1.1). Hat der Kristall N Moleküle, also N positive und N negative Ionen, so ist die gesamte Bindungsenergie i . (1.13) EB = N Epot Beim Gleichgewichtsabstand R0 muß dEB / dR = 0 gelten. Damit erhält man aus Glchg. 1.12 die Bestimmungsgleichung i dEpot N αq 2 N ZnN C N exp(−R0 /%) + =0 =− (1.14) dR R0 % 4π0 R02 für R0 . Die gesamte Bindungsenergie ist dann EB = N αq 2 (1 − %/R0 ). 4π0 R0 (1.15) Sie hängt von dem Abstoßungsparameter % und von der Madelungkonstante α ab. Für den NaCl-Ionenkristall wird die Madelungkonstante α = 1.748, für CsCl 1.763 und für ZnS 1.641. Die Bindungsenergie EB eines Ionenkristalls, die man aufwenden muss, um den Kristall in freie atomare Ionen zu zerlegen, läßt sich experimentell nicht unmittelbar messen, weil z.B. ein NaCl-Kristall beim Verdampfen nicht in freie Ionen, sondern in neutrale Atome zersetzt wird. Deshalb benutzt man folgende Energiebilanz: Bei der Neutralisation von Na+ in Na wird die Ionisierungsenergie frei, während durch den Prozess Cl− → Cl die Bindungsenergie des Elektrons (die Elektronenaffinität) aufgewendet werden muß. Wenn dampfförmiges Na fest wird, gewinnt man dann die Sublimationsenergie ESub , bei der Bildung von Cl2 aus Cl-Atomen die Dissoziationsenergie. Das feste NaCl wird gebildet durch die Reaktion von festem Na mit gasförmigem Cl2 . Dabei Abbildung 1.23: Dominierende wird die Reaktionswärme Q als Energie frei. Potentiale für die Ionenbindung. Insgesamt gibt es folgende Energiebilanz: EBind = +Eion − Eaf f + ESub + EDiss + Q. (1.16) Die Größen auf der rechten Seite lassen sich alle experimentell bestimmen. Abb. 1.24 zeigt schematisch die Energiebilanz eines NaCl-Moleküls und Tabelle 1.2 stellt einige charakteristische Parameter für Ionenkristalle vor. 28 KAPITEL 1. KRISTALLSTRUKTUREN Kristall r0 [Å] LiF 2.014 NaCl 2.82 NaI 3.23 KCl 3.147 RbF 2.815 % [Å] 0.29 0.32 0.35 0.33 0.3 EB /N [eV] 10.92 8.23 7.35 7.47 8.17 Tabelle 1.2: Gleichgewichtsabstände r0 , Abschirmparameter % und Bindungsenergien EB /N pro Molekül für einige Ionenkristalle. Abbildung 1.24: Bildungsenergien des NaCl-Moleküls aus Na und Cl. 1.5.2 Kovalente Bindung Die kovalente Bindung beruht auf der räumlichen Umordnung der Elektronenhüllen, bei der die Elektronendichte zwischen benachbarten Atomen erhöht wird. Die kovalente Bindung ist daher eine gerichtete Bindung. Kovalente Bindungen treten hauptsächlich auf, wenn zwei Atome, die beide keine vollständig gefüllte äußere Schale haben, sich verbinden. Beispiele sind Halogenide in Gasform F2 , Cl2 , Br2 usw., viele typische Gase: O2 , N2 , NH3 (Ammoniak), CO2 usw. Weitere Beispiele für diesen Bindungstyp sind Kohlenstoff und insbesondere Si und Ge, die in der Technik eine herausragende Stellung einnehmen und in der Diamantstruktur kristallisieren. Elektronische Eigenschaften dieser Elemente sind unmittelbar mit der kovalenten Bindung korreliert. In diesen Festkörpern sind die Bindungen zu den nächsten vier Nachbarn entlang der 1.5. BINDUNGEN 29 Abbildung 1.25: Kovalente Bindung im stark vereinfachten Schema des Schalenmodells vier Kanten eines Tetraeders angeordnet. Jedes Atom liefert je ein Elektron in jeder der vier Bindungen (sp3 Hybridisierung), so dass insgesamt 2 Elektronen mit entgegengesetztem Spin die Bindung zwischen zwei Nachbaratomen bewirken (vgl. auch Abb. 1.31). Die daraus resultierende Elektronendichteverteilung ist in Abb. 1.26 dargestellt. Die Raumausfüllung ist bei der Diamantstruktur mit η = 0.34 wesentlich geringer als bei der dichtesten Kugelpackung mit η = 0.74. Dies liegt daran, dass bei der tetraedrischen Anordnung jedes Atom nur 4 nächste Nachbarn hat, bei der fcc-Struktur dagegen zwölf. Qualitativ kann kovalente Bindung der Gruppe IV-Elemente dadurch verstanden werden, dass die Energie, die notwendig ist, um alle vier Valenzelektronen zu entfernen, zu groß ist, um ionische Bindung zu realisieren. Es ist aber möglich, dass diese Elemente ihre äußere Schale vollständig auffüllen, indem sie Elektronen mit ihren Nachbarn teilen. Betrachtet man Kohlenstoff, so hat dieses Element eine gefüllte K-Schale und 4 Elektronen in der L-Schale mit der elektronischen Konfiguration 1s2 2s2 2p2 . Vier weitere Elek- Abbildung 1.26: Elektronendichteverteilung tronen sind notwendig, um die L-Schale auf- im Siliziumkristall zufüllen. Dies wird also dadurch erreicht, dass jeweils ein Atom mit jedem der nächsten 4 Nachbarn ein Elektron teilt, wenn C im festen Zustand ist. Eine Möglichkeit, wie das realisiert werden kann, ist schematisch in Abb. 1.28 gezeigt. Um das zu verstehen, kann die Gestalt der Elektronenwolke (Orbitale) in C betrachtet werden. Die 4 Elektronen der K-Schale wechselwirken sehr stark untereinander und 30 KAPITEL 1. KRISTALLSTRUKTUREN Abbildung 1.27: (a) Keulenförmige Valenzelektronenwolke der kovalenten Bindung des Kohlenstoffatoms; (b) die C-Atome in der Umgebung haben ähnlich geformte Elektronenwolken. modifizieren dadurch die Form der s- und der p-Wellenfunktion, bis sie nahezu (virtuell) ident sind. Die elektrostatische Abstoßung ist so stark, dass jede “einzelne” Elektronenwolke gut separiert von allen anderen ist. Wie in Abb. 1.27 dargestellt, sind alle Orbitale “keulenförmig” und zeigen vom Kern weg. Diese vier sind dann im größtmöglichen Winkel von 109.5◦ zwischen jedem Paar angeordnet und weisen damit in die Ecken eines imaginären Tetraeders. Wegen der starken Abstoßung ist diese Anordnung nur schwer zu deformieren und zu stören. Die C-Atome haben dann ihre Elektronenwolken gegeneinander gerichtet, so dass jedes C-Atom von 8 Elektronen umgeben ist und somit eine stabile Konfiguration bildet. Die Struktur, die so geformt wird, ist sehr stark und fest, eben die Diamantstruktur. Es können keine Moleküle unterschieden werden, aber der Festkörper ist wie ein riesiges Molekül (Makromolekül), da es eine nicht endende Struktur bildet. Man kann immer neue C-Atome anhängen [vgl. Abb. 1.27 (b)]. Abbildung 1.28: Kovalente Bindung Die anderen Elemente der Gruppe IV (Si von C. Die kurzen Striche deuten an, und Ge) kristallisieren in der gleichen Struktur, dass Elektronen eines C-Atoms mit den und Verbindungen von Gruppe III- und Grup- Nachbarn geteilt werden und damit 4 pe V-Elementen formieren in der verwandten Bindungen formen. Zinkblende-Struktur (ZnS). Mathematisch wird die kovalente Bindung durch Überlappung von Orbitalwellenfunktionen beschrieben. In erster Näherung gilt für die Überlagerung der beiden individuellen 1.5. BINDUNGEN 31 Orbitalwellenfunktionen Ψ1 und Ψ2 zu einem Molekülorbital ΨM ol : ΨM ol = A1 Ψ1 ± A2 Ψ2 . Die Ai sind Konstanten, die sich (bis auf eine) aus der Normierungsbedigung ergeben. Nur eines der beiden möglichen Summenorbitale führt zur Energieabsenkung und damit zur Bindung. Das andere führt zur Energieerhöhung; es ist “antibindend”. Diese antibindenden Orbitale erklären das Auflösen von Verbindungen: Bei Energiezufuhr werden Elektronen in das antibindende Orbital angehoben. 1.5.3 van der Waals-Bindung – Edelgaskristalle Kristalle aus Edelgasatomen (Ne, Ar, Kr, Xe) haben eine sehr kleine Bindungsenergie und können deshalb nur bei sehr tiefen Temperaturen als feste Körper existieren (vgl. Tabelle 1.3). Helium wird auch für T → 0 unter Normaldruck nicht fest sondern bildet nur bei einem äußeren Druck von p ≥ 28 bar eine feste Phase. Element Ne Ar Kr Xe EB [eV] 0.02 0.08 0.116 0.17 TS [K] dnN [nm] 24 0.313 84 0.376 117 0.401 161 0.435 Tabelle 1.3: Einige Eigenschaften von Edelgaskristalle; EB : Bindungsenergie pro Atom, TS : Schmelzpunkt, dnN : Abstand nächster Nachbarn. Da die Edelgasatome abgeschlossene Schalen besitzen, aus denen die Elektronen nur unter großem Energieaufwand in höhere Zustände angeregt werden können, kann sich die räumliche Elektronenverteilung der Atome beim Zusammenfügen im Festkörper nur geringfügig verändern. Deshalb können keine Atomelektronen in bindende Orbitale umgelagert werden, wie bei der Valenzbindung des H2 -Moleküls, sondern es kommt bei größeren Abständen nur zu einer geringen Verformung der kugelsymmetrischen Ladungsverteilung der Atome (Polarisation) und damit zu einer schwach anziehenden Wechselwirkung zwischen den induzierten Dipolen (van der Waals-Wechselwirkung), Epot (R) = −C α1 α2 , R6 die proportional zum Produkt der atomaren Polarisierbarkeit ist und mit 1/R6 abfällt. Van derWaals hat folgenden Vorschlag für die Wechselwirkung zwischen solchen Atomen gemacht: Durch die Bewegung der Elektronen um den Kern wird die kugelsymmetrische Ladungsverteilung ständig gestört (diese ist nur im zeitlichen Mittel gegeben), wodurch fluktuierende elektrische Dipole erzeugt werden. Das elektrische Feld des Dipols pA eines 32 KAPITEL 1. KRISTALLSTRUKTUREN Atoms A kann nun in einem benachbarten Atom B ein elektrisches Dipolmoment pB induzieren. Die Wechselwirkung zwischen diesen Dipolen ist anziehend. Die dabei auftretenden Kräfte werden Van der Waals Kräfte genannt. Sie treten in einer quantenmechanischen Störungsrechnung erst in 2. Ordnung auf. Bei kleinen Abständen R < hrA i + hrB i überlappen Elektronenhüllen benachbarter Atome, und es kommt auf Grund der elektrostatischen Abstoßung zu einem repulsiven Teil des Potentials, der näherungsweise durch eine R−12 Abhängigkeit beschrieben werden kann. Insgesamt gibt das Lennard-Jones-Potential V (R) = Abbildung 1.29: Gesamtptential (abstoßend + anziehend) für verschiedene Edelgaskristalle. b a − 6 12 R R (1.17) den Potentialverlauf zwischen benachbarten Edelgasatomen befriedigend wieder (vgl. Abb. 1.29). Die gesamte Bindungsenergie eines van der Waals-Kristalls mit N Atomen ist b 1 X a − 6 (1.18) V (R) = N 12 2 R R ij ij j wobei Rij der Abstand zwischen einem beliebig gewählten Atom i und seinen Umgebungsatomen ist. Der Faktor 1/2 berücksichtigt, dass man bei der Summation über alle Atome jedes Paar doppelt zählt. Die Summen in Glg. 1.18 hängen von der Gitterstrukur ab. Drückt man Rij = pij RnN durch den Abstand RnN zu den nächsten Nachbarn aus, so werden beim fcc-Gitter die Summen X 1 12 X 1 6 = 12.13 = 14.45 (1.19) pij pij j j √ Da im fcc-Gitter jedes Atom 12 nächste Nachbarn im Abstand RnN = a/ 2 hat, folgt aus Glchg. 1.19, dass die nächsten Nachbarn fast den gesamten Anteil zu den Summen liefern, nämlich 12. Die Gleichgewichtsabstände R0 beim Minimum von Epot R betragen R0 = (2a/b)1/6 . Die tot Bindungsenergie Epot (R = R0 ) ergibt sich dann aus Glg. 1.18 zu EBtot = − N b2 . 8a (1.20) Zur negativen potentiellen Energie kommt noch die positive kinetische Energie hinzu, die aus therm der mittleren thermischen Energie Ekin = N (3/2)kB T und der Nullpunktsenergie besteht. tot tot tot Ist die Gesamtenergie E = Epot + Ekin > 0 so schmilzt der Kristall (vgl. Tabelle 1.3). 1.5. BINDUNGEN 1.5.4 33 Metallische Bindung Viele Festkörper sind Metalle und Legierungen. Kennzeichnende physikalische Eigenschaften dieser Stoffe sind u.a. ihre mit hoher Festigkeit verbundene große Dehnbarkeit, ihr großer Absorptions- und Reflexionsgrad sowie ihre hohe elektrische und thermische Leitfähigkeit. Drude zog 1900 daraus den Schluss, dass für die metallische Bindung die vollständige Delokalisierung von Valenzelektronen charaktristisch ist (vgl. Abb. 1.30 und 1.31). (a) (b) Abbildung 1.30: (a) Schalenbild von Na-Atomen im Dampf. Die Atome befinden sich in thermisch induzierter Bewegung. (b) Kleine Na+ Ionenrümpfe eingebettet in das negativ geladenene (rosa) Elektronengas. Die Atomrümpfe sitzen fest auf ihren Plätzen, während die Leitungselektronen sich frei bewegen und nicht mehr einzelnen Ionen zugeordnet werden können. Das Metallgitter wird aus positiven Ionen gebildet, in deren Feld sich die Valenzelektronen quasifrei bewegen können. Man spricht daher auch vom Elektronengas des Metalles. Größenordnungsmäßig kommt auf ein Gitterion etwa ein quasifreies Elektron. Das Elekronengas besitzt also eine enorme Dichte. Mit ihm können typische Eigenschaften der Metalle erklärt werden. Abbildung 1.31: Schematische Darstellung (a) der metallischen Bindung durch delokalisierte Elektronen, (b) der lokalisierten kovalenten Bindung im Siliziumkristall. 34 KAPITEL 1. KRISTALLSTRUKTUREN Aus der vollständigen Delokalisierung der Elektronen des Elektronengases folgt, dass die metallische Bindung weder absättigbar noch gerichtet ist. Die metallische Bindung ist ein Bindungstyp, der ebenfalls nur quantenmechnisch verstanden werden kann. Die Wechselwirkung der räumlich verteilten Leitungselektronen mit den positiven Ionenrümpfen der Metallatome macht bei Metallen einen großen Teil der Bindungsenergie aus. Obwohl sich die Ionen abstoßen, vermittelt das negativ geladene Kontinuum des Elektronengases eine Bindungskraft. Die Bindungsenergie beruht insgesamt auf einer Absenkung der Nullpunktsenergie der Valenzelektronen, die statt einer Atomhülle jetzt das ganze Kristallvolumen zur Verfügung haben. Die Bindungsenergie pro Atom variiert für die verschiedenen Metalle beträchtlich. Während sie für Alkalimetalle etwa 1 eV/Atom ist, beträgt sie bei Eisen 4.3 eV/Atom und bei Wolfram sogar 8.7 eV/Atom. Dies liegt darin, dass bei den Übergangsmetallen wie Fe, Ni, Co unaufgefüllte innere Schalten (d-Schale) vorliegen, deren räumliche Verteilung sich bei der Bindung ändert und damit, ähnlich wie bei der Valenzbindung, zu einer Erhöhung der Elektronendichte zwischen benachbarten Atomen führt. Die Bindungskräfte zwischen den Atomen können ebenfalls mit Hilfe einer Potentialformel beschrieben werden, die auch für die Ionenbindung und die kovalente Bindung gilt: UBind = − B A + m n r r (1.21) Die 4 Konstanten A, B, m, n sind natürlich für die gewählten Atome spezifisch; zwei davon lassen sich durch den Bindungsabstand a0 und die Bindungsenergie EBind ausdrücken. Da in Metallen praktisch keine Richtungsabhängigkeit der Bindung vorliegt, besitzen diese dichte Packungen mit hoher Koordinationszahl (kubisch-flächenzentriert, hexagonal dicht, kubisch-raumzentriert). Verschiebungen der Gitterebenen gegeneinander sind im Gegensatz zu den Ionenkristallen möglich: Den Rumpfionen einer Schicht ist es egal, in welche Täler der Nachbarschicht sie einrasten. Daher lassen sich Metalle unter Erhaltung des Volumens leicht verformen. Welchen Widerstand sie der Verformung entgegensetzen, hängt vor allem vom Beitrag der kovalenten Bindung ab, der bei Übergangselementen besonders groß ist. Bei Legierungen und verunreinigten Metallen verzahnen Fremdatome die einzelnen Gitterebenen ineinander und erschweren ihr Gleiten. 1.6 Kristallgitterdefekte Die in den vorigen Abschnitten behandelten idealen Kristalle mit völlig regelmäßiger Anordnung der Atome sind in der Natur nur näherungsweise realisiert. In realen Kristallen kommen Gitterfehler vor, welche die strenge Periodizität stören. Bei guten Einkristallen sind solche Gitterfehler jedoch selten, d. h. die Zahl der an falschen Plätzen sitzenden Atome ist sehr klein gegen die Zahl der an regulären Gitterplätzen angeordneten Atome. Trotz ihrer kleinen Zahl können Gitterfehler jedoch das mechanische und elektrische Verhalten eines Festkörpers massiv beeinflussen. Denn jeder Kristall hat eine Oberfläche, und für die Atome auf der Oberfläche ist die Umgebung anders als für Atome im Volumen – die Oberfläche ist somit ein Defekt. Reale Kristalle sind damit Kristalle, die Defekte enthalten. Falls um 1.6. KRISTALLGITTERDEFEKTE 35 ein beliebig herausgegriffenes Atom die unmittelbare Umgebung (im zeitlichen Mittel) eine andere prinzipielle Symmetrie hat als die Umgebung eines Referenzatoms in einem perfekten Teil des Kristalls, haben wir am Aufpunkt einen Defekt. Für ein Atom auf der Oberfläche eines Kristalls ist diese Bedingung zweifellos erfüllt. Die einfachsten Fehlordnungen im Kristall sind reguläre Gitterstellen, an denen ein Atom fehlt (Schottkysche Fehlstellen). Solche Leerstellen lassen sich z.B. durch Bestrahlen des Festkörpers mit Neutronen oder schnellen Ionen erzeugen, die ein Atom aus seinem Gitterplatz herausschlagen und an die Oberfläche befördern. Defekte bestimmen z.B., ob ein Stück Eisen sich leicht oder schwer verformt, hart oder weich ist, leicht bricht oder sich zäh verhält, leicht oder schwer korrodiert, sich hart- oder weichmagnetisch verhält, schnell oder nur langsam ermüdet – die Liste wäre verlängerbar. Die gesamte Halbleitertechnologie dreht sich um die Manipulation von Defekten in Halbleitern wie Silizium oder GaAs. Die thermischen Schwingungen der Atome um ihre Gleichgewichtslage zählen nach obiger Definition nicht als strukturelle Defekte – im zeitlichen Mittel sind sie Null. Elastische Verbiegungen des Gitters, also lokal leicht veränderte Gitterkonstanten und damit Bindungslängen, sind ebenfalls keine Defekte, da sich die lokale Symmetrie dadurch nicht im Prinzip geändert hat, sondern allenfalls einige Zahlenwerte, z. B. bei den Translationsvektoren des Gitters. Defekte kann man zunächst in vier große Klassen einteilen, deren Ordnungskriterium die Dimensionalität des Defekts ist. Wir unterscheiden: • Nulldimensionale Defekte (oder Punktdefekte, Punktfehler, atomare Defekte). Symmetrieverletzung nur in Bereichen mit Ausdehnung ca. “Null”, d.h. in einem Bereich mit atomaren Dimensionen. • Eindimensionale Defekte (oder Versetzungen, Liniendefekte). Entlang einer Linie (die nicht gerade verlaufen muß, sondern willkürlich gekrümmt und in sich geschlossen sein kann) ist die Symmetrie verletzt. • Zweidimensionale Defekte (oder Flächendefekte). Auf einer Fläche (beliebig gekrümmt) ist an jedem Punkt die Symmetrie verletzt. • Dreidimensionale Defekte (oder Volumendefekte). In einem beliebigen Volumen liegt an jedem Punkt eine andere Symmetrie vor. Diese noch etwas abstrakte Definition wird sofort klar, wenn wir uns typische Vertreter dieser vier Defekttypen anschauen (Abb. 1.32): Die Leerstelle für nulldimensionale Defekte: Ein Atom fehlt irgendwo im Kristall, der entsprechende Platz ist leer. Die Stufenversetzung für eindimensionale Defekte: Zwischen zwei Kristallebenen ist teilweise eine dritte eingezwängt. Diese zusätzliche Ebene im Kristall endet entlang einer Linie; diese Linie definiert den eindimensionalen Defekt (Stufenversetzung). Die Korngrenze für zweidimensionale Defekte: Zwei beliebig zueinander orientierte Kristalle sind längs einer Ebene – der Korngrenzenebene – verbunden. Die Ausscheidung für dreidimensionale Defekte: In einem Kristall der Sorte 1 sitzt ein Kristall (oder amorpher Körper) der Sorte 2. 36 KAPITEL 1. KRISTALLSTRUKTUREN Abbildung 1.32: Defekte in Kristallen. a) Zwischengitter Fremdatom, b)Stufen Versetzung, c) Zwischengitteratom, d)Leerstelle, e) Ausscheidung, f) Leerstellen Typ VS Loop, g) Zwischengitter Typ VS Loop, h) “Substitutional” Fremdatom Nulldimensionale Defekte Der gebräuchliche Name für nulldimensionale Defekte ist Punktfehler, auf englisch “point defects”. Es gibt dabei zwei Haupttypen: Intrinsische und extrinsische atomare Defekte, je nachdem, ob die Defekte ohne Hilfe von außen erzeugt werden können, sozusagen aus einem gegebenen perfekten Kristall heraus (dann sind sie intrinsisch) oder ob man von außen (extrinsisch) eingreifen muss. Die beiden Grundtypen der intrinsischen Defekte sind: Die Leerstelle [Abb. 1.33 (a)], oder, gebräuchlicherweise auf englisch, “vacancy”. Ein Atom fehlt. Die restlichen Atome werden natürlich nicht starr am Platz sitzen bleiben, wie in der Graphik gezeigt, sondern sich etwas in Richtung auf die Lücke zu festsetzen. Das Eigenzwischengitteratom [Abb. 1.33 (b)], oder, gebräuchlicherweise auf englisch self-interstitial ist die zweite Form eines intrinsischen nulldimensionalen Defekts. Ein Atom der Sorte, aus denen der Kristall besteht, sitzt auf Lücke zwischen den regulären Atomen. Extrinsische atomare Defekte kann man mit Hilfe einer anderen Atomsorte konstruieren: Wir setzen einfach ein “falsches” Atom in einen Kristall. Das kann man auf zwei Arten tun: Ein reguläres Atom des Kristalls wird gegen ein Fremdatom ersetzt oder substitutiert. Wir bekommen als atomaren Defekt ein substitutionelles Fremdatom. Ein Fremdatom wird ins Zwischengitter gezwängt. Wir erhalten ein interstitielles Fremdatom. Bei extrinsischen atomaren Fehlstellen (AF) in einem gegebenen Kristall ist die Herkunft klar (Abb. 1.34): Die als AF vorliegenden Fremdatome stammen aus dem Rohmaterial – d.h. sie waren schon im Ausgangsmaterial vorhanden. Ein weiterer Grund ist die Bearbeitung des Materials. Vom Rohmaterial (z.B. ein Stück Stahlblech) bis zum Produkt führen immer einige Bearbeitungsschritte. Dabei ist es grundsätzlich möglich, dass sich der Gehalt an extrinsischen AF ändert. Neben diesen natürlich vorkommenden atomaren Fehlordnungen in Kristallen gibt es auch bewusste Dotierungen mit Fremdatomen, wo man z.B. bei Halbleitern 1.6. KRISTALLGITTERDEFEKTE 37 Abbildung 1.33: Intrinsische nulldimensionale Defekte. a) Leerstelle, b) Eigenzwischengitter atom Abbildung 1.34: Extrinsische nulldimensionale Defekte. a) substitutionelles Fremdatom, b) interstitielles Fremdatom anderswertige Fremdatome in ein Gitter einbringt, um damit die elektrische Leitfähigkeit zu ändern. Diese Atome können entweder auf Zwischengitterplätzen sitzen oder andere Gitter atome auf regulären Gitterplätzen ersetzen. Man nennt sie Substitutions-Störstellen. Oft geschieht die Dotierung durch Beschuss mit Ionen (Ionenimplantation). Bei dieser Methode kann man gezielt eine geringe Konzentration gewünschter Fremdatome in ein Kristallgitter einbringen. Allerdings wird dabei oft der Bereich des Gitters, in den ein Ion eindringt, gestört, so dass man durch Aufheizen (Tempern) die Schäden am Gitter wieder ausgleichen muss. Durch die Erhöhung der Temperatur wird die Diffusion der Gitteratome erhöht, so dass die Atome des gestörten Gitters leichter ihre reguläre Anordnung, die einem Zustand minimaler Energie entspricht, erreichen können. Jedoch gibt es in jedem Kristall auch ohne äußere Einflüsse im thermischen Gleichgewicht eine von der Temperatur abhängige Zahl von Fehlstellen. Man braucht zwar Energie, um solche Fehlstellen zu erzeugen, aber durch die dadurch vergrößerte Unordnung im sonst regelmäßig angeordneten Kristall erhöht sich die 38 KAPITEL 1. KRISTALLSTRUKTUREN Entropie. Beim thermischen Gleichgewicht befindet sich der Kristall im Zustand minimaler freier Energie. Wo kommen die intrinsischen AF her? Die Antwort führt uns zur statistischen Thermodynamik. Ein Kristall enthält im thermodynamischen Gleichgewicht immer eine bestimmte Anzahl von intrinsischen AF; sie gehören untrennbar zu seiner Struktur. Ihre Konzentration n ist gegeben durch folgende Formel: n = exp − E kB T (1.22) mit a = Konstante (1 cm−3 ), E ist eine für den spezifischen Defekt typische Energie, ≈ (0,5 – 2) eV für Leerstellen und ≈ (2 – 5) eV für Zwischengitteratom. Die Konzentration von Leerstellen und Eigenzwischengitteratomen steigt also exponentiell mit der Temperatur; nur bei T = 0 K wäre sie exakt Null. Am Schmelzpunkt – das ist eine Faustregel – liegt die Konzentration an Leerstellen in Metallkristallen bei ≈ 10−4 ≈ 0.01 %. Die Konzentration von Eigenzwischengitteratomen ist i.d.R. viel niedriger, so dass sie meist vernachlässigt wird. In anderen Kristallen – z.B. in Halbleitern – kann die max. Konzentration am Schmelzpunkt noch einige Größenordnungen kleiner sein. Die Bedeutung der Diffusion, d.h. der Bewegung von Atomen in Kristallen für die Technologie kann kaum überschätzt werden. Betrachten wir als Beispiel die Standardaufgabe der Halbleitertechnik, die Herstellung eines MOS-Transistors (Abb. 1.35). Abbildung 1.35: Querschnitt durch einen einfachen MOS-Transistor Entscheidend ist, dass der Si-Kristall ganz bestimmte substitutionelle Fremdatome enthält – z. B. Phosphor-Atome unterhalb von ,,Source“ und ,,Drain“, Bor-Atome im SiSubstrat in Konzentration um 1 ppm. Diese Fremdatome müssen bei der Herstellung des Transistors in die richtigen Bereiche des Kristall in der richtigen Konzentration eingebracht werden – aber wie? Sie können nur von außen kommen, d.h. sie müssen durch die Oberfläche in den Kristall hinein diffundieren. Nur über Diffusion ist die Bewegung von Atomen auf Gitterplätzen möglich (Abb. 1.36). In der Regel werden die Atome des Kristalls selber in eine benachbarte Leerstelle springen 1.6. KRISTALLGITTERDEFEKTE 39 – man spricht dann von Selbstdiffusion – aber hin und wieder gelingt das auch der kleinen Minorität der substitutionellen Fremdatome. Die Leerstelle selbst muss dabei notwendigerweise auch beweglich sein. Sie sitzt nicht immer am selben Platz, sondern bewegt sich durch das Kristallgitter in völlig statistischer Weise – sie diffundiert, indem Gitteratome mit ihr den Platz wechseln. Damit wird klar, dass die Diffusionsgeschwindigkeit, mit der sich ein Phosphoratom im Si-Gitter bewegen kann (oder jedes andere substitutionelle Fremdatom in jedem anderen Gitter), im Wesentlichen davon abhängt, wie hoch die Leerstellenkonzentration ist und wie schnell sich die Leerstellen selbst bewegen. Die entscheidende Größe für die Mobilität eines Fremdatoms ist seine Sprungfrequenz, d.h. die (mittlere) Zahl von Sprüngen pro Sekunde, mit der sich (im Mittel) eine Leerstelle auf einen Nachbarplatz bewegt. Die Diffusion von interstitiellen Fremdatomen kommt dagegen ohne Leerstellen aus. Hier hüpfen die Atome direkt von einem Zwischengitterplatz zum nächsten. Interstitielle Fremdatome diffundieren deshalb häufig schneller als die substitutionellen. Abbildung 1.36: Leerstellenmechanismus der Diffusion Versetzungen Außer den atomaren Punktdefekten gibt es Störungen der regulären Kristallstruktur, wenn Atome auf einer Gitterebene sich zwischen benachbarte Netzebenen schieben. Dadurch werden die Nachbarebenen in der Umgebung der eingeschobenen Extraebene etwas zusammengedrückt und gekrümmt. Dazu muss gegen die elastischen Kräfte Arbeit geleistet werden (typische Werte sind etwa l eV/Atom der Extraebene). Da die Entropie sich bei solchen Versetzungen wesentlich weniger erhöht als bei Punktdefekten, sind solche Versetzungen seltener als Punktdefekte und außerdem thermodynamisch instabil. Sie werden erzeugt durch äußere Einflüsse (z.B. ungleichmäßige Scherspannungen, Temperaturgradienten beim Kristall Wachstum etc.). Definiert man als Versetzungsdichte (= Gesamtlänge der Versetzungen pro Kristallvolumen) die Anzahl der Versetzungslinien pro Flächeneinheit des Querschnitts, so haben gute Halbleiterkristalle eine Versetzungsdichte von etwa 103 – 105 )/cm2 , während stark deformierte Metalle (z.B. gewalzte Stähle) bis zu 1012 /cm2 erreichen. 1010 cm−2 bedeutet, dass in einem cm3 Kristall insgesamt 1010 cm = 100 000 km Versetzungen vorhanden sind. Versetzungen sind die einzigen eindimensionalen oder linienhafte Defekte in Kristallen; es gibt sie aber in vielen Varianten. Versetzungen sind die 40 KAPITEL 1. KRISTALLSTRUKTUREN für die gesamte plastische Verformung kristalliner Materialien – d.h. aller Metalle – verantwortlichen Defekte. Gäbe es keine Versetzungen in Kristallen, wären alle Kristalle spröde wie Glas! Die gesamte metallverarbeitende Industrie mit all ihren Produkten würde nicht existieren. Andererseits: Versetzungen sind absolut tödliche Defekte für viele Halbleiterbauelemente. Könnte man nicht vollständig versetzungsfreie Siliziumkristalle herstellen, gäbe es keine Mikroelektronik. Die allgemeinste Definition aller möglichen Versetzungen stammt von Volterra, der 1907 aus allgemeinen elastizitätstheoretischen Überlegungen heraus die folgenden Betrachtungen anstellte. Die Versetzung selbst wurde erst 1934 als tatsächlicher Defekt postuliert! Volterra verallgemeinerte den Umgang mit dem fiktiven Messer, das wir auch Volterra-Messer nennen. In moderner Notation sieht das Rezept so aus: • (Fiktiver) Schnitt in den Kristall [Abb. 1.37 (a)]; die Schnittlinie entspricht dem Linienvektor t der zu bildenden Versetzung. Die Schnittlinie im Material definiert die Versetzungslinie; sie kann nicht im Material enden. Der Schnitt bildet immer eine durch einen geschlossenen Ring berandete Fläche. • Verschieben der beiden Schnittebenen um einen beliebigen Translationsvektor des Gitters [Abb. 1.37 (b) und (c)]. Der gewählte Translationsvektor ist für die entstehende Versetzung charakteristisch und heißt Burgersvektor b nach dem Erfinder Burgers. • Wir stellen wieder einen perfekten Kristall her – mit Ausnahme der Umgebung der Versetzgslinie – indem wir die Schnittflächen wieder “verschweißen”. Da der Burgersvektor ein Translationsvektor des Gitters ist, passen die beiden Hälften immer exakt aufeinander. Abbildung 1.37: Allgemeine Definition einer VS nach Volterra. a) Fiktiver Schnitt, b) Stufenversetzung, c) Schraubenversetzung Zur Beschreibung einer Versetzung gehört immer eine Aussage über die Versetzungslinie. Im allgemeinen verläuft diese Linie gerade, aber das ist künstlich. Selbst mit dem fiktiven Messer hätten wir ja auch krumm in den Kristall schneiden können. Eine Versetzung kann nicht im Inneren des Kristalls enden. Der aufgeschnittene Bereich hat immer eine Umrandung (= die Versetzungslinie), die entweder bis zur Oberfläche läuft oder einen geschlossenen 1.6. KRISTALLGITTERDEFEKTE 41 Kreis bildet. Nach dem Schneiden mussten wir die Schnitthälften wieder zusammenfügen; dazu war eine Verschiebung der Schnittebenen nötig. Die Stärke dieser Verschiebung definiert uns die Stärke der Versetzung. Hätten wir zum Beispiel zwei Ebenen herausgeschnitten, hätten wir doppelt so viel verschieben müssen, um die Schnitthälften wieder zusammenzufügen. Entlang der im Material verlaufenden Schnittlinie, der Versetzungslinie entsteht ein eindimensionaler Defekt – eine Versetzung. Die Versetzung ist dabei eindeutig durch ihren Linienvektor t = t(x, y, z) und ihren Burgersvektor b = const. = Translationsvektor definiert mit Linienvektor = Schnittlinie (Burgersvektor = Verschiebungsvektor). Der Burgersvektor ist für eine gegebene Versetzung überall gleich, da es nur eine Verschiebung der Schnittflächen relativ zueinander gibt. Der Linienvektor kann jedoch (als Tangente an die Versetzungslinie = Schnittlinie) an jedem Punkt anders sein, da wir ja auch willkürliche Schnitte machen könnten. Stufen- und Schraubenversetzung [mit einem Winkel α(t, b) = 90◦ bzw. 0◦ zwischen dem Linienvektor t und Burgersvektor b der Versetzung] sind Grenzfälle des allgemeinen Falls einer gemischten Versetzung, mit Winkel α(t, b) = beliebig. Derjenige Vektor, der benötigt wird, um im Referenzkristall wieder zum Startpunkt zu kommen ist der Burgersvektor (Abb. 1.38) Abbildung 1.38: Bestimmung des Burgersvektors einer Versetzung. a) Führe einen beliebig gestalteten geschlossenen Umauf von Gitterpunkt zu Gitterpunkt um die Versetzung durch. b) Führe exakt denselben Umlauf in einem Referenzkristall durch – der Umlauf wird sich jetzt nicht mehr schließen. Der Burgersvektor gibt direkt die Größe der Stufe an, die durch die Erzeugung der Versetzung auf der Kristalloberfläche entstanden ist. Das Verfahren kann umgedreht werden: Ist die atomare Struktur einer Versetzung gegeben (z.B. aus einem elektronenmikroskopischen Bild), kann der zunächst ja nicht bekannte Burgersvektor aus einem Burgersumlauf bestimmt werden. Burgersvektor und Linienvektor spannen die Gleitebene auf. Nur auf dieser Ebene kann sich die Versetzung bewegen ohne dass Material eingefüllt oder herausgenommen werden muss. Das ist leicht einzusehen, denn Versetzungsbewegung heißt, den Schnitt mit dem Volterra-Messer fortzuführen. 42 KAPITEL 1. KRISTALLSTRUKTUREN Plastische Verformung aller Kristalle erfolgt ausschließlich durch die Erzeugung und Bewegung von Versetzungen. Plastische, d.h. bleibende Verformung heißt, dass sich ein Kristall nach Einwirkung einer Kraft bleibend verformt hat. Plastische Verformung bedingt zwangsläufig, dass Teile eines Kristalls sich gegenüber anderen Teilen verschoben haben. Einige Atome sind nicht mehr dort, wo sie früher waren. Die damit verbundenen bleibenden Verschiebungen der Atome werden immer durch den Durchlauf von Versetzungen durch den Kristall erzeugt. Die makroskopische plastische Verformung ist die Summe aller mikroskopischen Versetzungsbewegungen auf den betätigten Gleitsystemen. Es müssen sehr viele Versetzungen zusammenwirken, und auf vielen verschiedenen Ebenen durch den Kristall laufen. Jede Versetzung hat eine Gleitebene; sie wird aufgespannt durch Linien- und Burgersvektor. Die Illustration (Abb. 1.39) zeigt dies für den einfachen Fall einer reinen Stufenversetzung. Versetzungen sind nur auf ihrer Gleitebene relativ leicht beweglich. Bei reinen Schraubenversetzungen sind Burgersvektor und Linenvektor parallel – damit kann jede Ebene eine Gleitebene sein. Abbildung 1.39: Gleitebene einer Stufenversetzung Bevorzugte Burgersvektoren sind die kürzest möglichen Gittervektoren, und bevorzugte Gleitebenen sind die dichtest gepackten Ebenen. Damit gibt es eine vom Kristalltyp abhängige bestimmte Zahl an möglichen Abgleitungen, d.h. der Verschiebung eines Teils eines Kristalls relativ zu einem anderen, gekennzeichnet durch die Ebene, auf der die Verschiebung stattfindet, und die Richtung der Verschiebung auf dieser Ebene. Viele Gleitsysteme in einem Kristall bedeuten, dass es relativ einfach ist, in jede gewünschte Richtung Abgleitung zu produzieren. Entweder ist eines der Gleitsysteme bereits zufällig richtig orientiert, oder man muss einige Gleitsysteme kombinieren. Ein allgemeiner Satz der Topologie sagt, dass man mindestens 5 unabhängige Gleitsysteme braucht, um jede beliebige Verformung durch geeignete Überlagerungen von Abgleitungen auf den verfügbaren Ebenen zu erhalten. Schon hier wird also klar, warum hexagonale Metalle, insbesondere Mg, Zn und Co, vergleichsweise schwer verformbar sind, während sich die fcc-Metalle leicht verformen lassen und deshalb “weich” erscheinen. Abb. 1.40 zeigt eine der vier {111}-Ebenen mit den drei in dieser Ebene enthaltenen Burgersvektoren vom Typ b = (a/2)h110i. 1.6. KRISTALLGITTERDEFEKTE Abbildung 1.40: Gleitsysteme der fcc Kristallstruktur Abbildung 1.41: Vergleich der Gleitsysteme von fcc-, bcc- und hcp-Kristallstrukturen. 43 44 KAPITEL 1. KRISTALLSTRUKTUREN Eine Versetzung hat eine Energie pro Längeneinheit, genannt Linienenergie: EV S ≈ G · b2 , mit G als Schubmodul (1.23) Falls der Kristall seine Versetzungen nicht verschwinden lassen kann, wird er ein metastabiles Gleichgewicht mit minimierter Versetzungsenergie anstreben. Der Burgersvektor hat immer den kleinst möglichen Wert, der für Translationsvektoren des Gitters zugelassen ist. Größere Burgersvektoren dissoziieren in kleinere: [b1 + b2 ]2 > b21 + b22 (1.24) Die Versetzung verläuft möglichst gerade, d.h. minimiert die Länge – sie verhält sich wie ein gespanntes Gummiband. Die Versetzung dreht sich so, dass sie möglichst viel Schraubencharakter hat. Die Versetzungsknoten des Versetzungsnetzwerks sind häufig unbeweglich – das erklärt, warum die Versetzungen den Kristall nicht verlassen können. Mechanische Spannungen üben Kräfte auf Versetzungen aus, wobei nur die Komponente in der Gleitebene senkrecht zur Versetzungslinie wichtig ist, da nur sie zu einer Versetzungsbewegung führt. Flächenhafte Defekte Jeder flächenhafte Defekt ist eine Grenzfläche zwischen zwei Körpern; man kann dem Defekt auch immer eine Grenzflächenenergie analog der Oberflächenenergie zuschreiben. Je nach Art der sich entlang der Grenzfläche berührenden Körper spricht man abgesehen von der Oberfläche im wesentlichen von folgenden zweidimensionalen Defekten: • Phasengrenze: Grenzfläche zwischen zwei verschiedenen festen Körpern • Korngrenze: Grenzfläche zwischen identischen, aber zueinander beliebig orientierten Kristallen • Stapelfehler: Grenzfläche zwischen zwei identischen und sehr speziell zueinander orientierten Kristallen • Antiphasengrenze: Stapelfehler in der Überstruktur • Zwillingsgrenze Phasengrenzen sind wohl die häufigsten und sehr leicht zu verstehende Defekte. Unter einer Phase wollen wir einen homogenen, unterscheidbaren und (im Prinzip) mechanisch abtrennbaren Teil eines gegeben Materials mit gegebener chemischer Zusammensetzung verstehen. Phasengrenzen umfassen eine Unzahl von möglichen Grenzflächen – zum Beispiel die Grenzfläche zwischen kristallinem und amorphem Silizium, zwischen Si und SiO2 oder Pd2 Si (Palladiumsilizid), oder .... Aber auch die Grenzflächen zwischen dem Fe-Kristall und den eingelagerten kleinen Graphitpartikeln des Gusseisens, den Glasfasern und dem Epoxyharz der 1.6. KRISTALLGITTERDEFEKTE 45 Abbildung 1.42: Schematische Darstellung von Phasen- und Korngrenzen. glasfaserverstärkten Kunststoffe, zwischen den Glimmer- und Feldspatteilchen des Granits oder den Bestandteilen von Beton sind Phasengrenzen. Die Phasengrenze zwischen zwei Kristallen identischer Bauart aber verschiedener Orientierung heißt Korngrenze, ihre Geometrie ist damit verständlich. Ein Schemabild (Abb. 1.42) zeigt eine schematische (zweidimensionale) Darstellung von Kristallkörnern in willkürlicher Form mit den zugehörigen Korngrenzen, der Phasengrenze zu einer Ausscheidung und der Oberfläche. ,,Misfit“-Versetzungen kompensieren den Gitterkonstantenunterschied an der Phasengrenze. Korngrenzen sind per definitionem die (meist beherrschenden) Defekte in Polykristallen, während sie – ebenfalls per definitionem – in Einkristallen nicht vorkommen. Fast alle natürlicherweise vorkommenden Kristalle sind Polykristalle. Einkristalle sind selten und dann oft kostbar; man denke an die Edelsteine. Abbildung 1.43: Stapelfehler im fcc-Kristall. a) intrinsischer STF b) extrinsischer STF Stapelfehler entstehen (per Definition), wenn man zwei durch ihre Stapelfolge definierte Kristalle entlang einer Grenzfläche so zusammensetzt, dass beide Kristalle zwar exakt gleich orientiert sind, an der Nahtstelle aber die Stapelfolge nicht stimmt. Die Stapelfolge ABCABC... definiert den fcc-Kristall. Intrinsische oder extrinsische Stapelfehler unterschei- 46 KAPITEL 1. KRISTALLSTRUKTUREN den sich, je nachdem ob eine Ebene fehlt oder zuviel ist (Abb. 1.43). Stapelfehler enden an inneren oder äußeren Oberflächen oder sind durch eindimensionale Defekte (= Partial VS) begrenzt Stapelfehler in dichtestgepackten Kristallen sind sehr prominente Defekte, die sehr häufig auftreten und oft nur schwer zu vermeiden sind. Stapelfehler und Versetzungen sind insbesondere in fcc-Kristallen oft zu etwas Neuem kombiniert (einer aufgespaltenen Versetzung). Ohne auf Einzelheiten einzugehen, soll doch angemerkt werden, dass die Eigenschaften der Stapelfehler damit sehr stark die Versetzungsmechanik und damit die plastische Verformbarkeit dieser Materialien beeinflusst. Stapelfehler in einer geordneten Überstruktur nennt man Antiphasengrenze (Abb. 1.44). Abbildung 1.44: Antiphasengrenze in einem Fe3 Al Kristall. Zwillingsgrenzen bzw. Zwillingskorngrenzen treten häufig in Si (Diamantgitter) und fcc Kristallen auf (Abb. 1.45). Abbildung 1.45: Zwillingskorngrenze in Si. 1.6. KRISTALLGITTERDEFEKTE 47 Dreidimensionale Defekte Dreidimensionale Defekte sind notwendigerweise von zweidimensionalen Defekten begrenzt und können durch Diffusion und Zusammenlagerung (= Agglomeration, “clustern”) von nulldimensionalen Defekten entstehen. Treffen sich viele Leerstellen an einem Platz, entsteht ein Void. Auch hier ist der dreidimensionale Defekt durch den zweidimensionalen Defekt Oberfläche begrenzt. Selbstverständlich können auch substitutionelle oder interstitielle Fremdatome per Diffusion agglomerieren; es resultiert eine Ausscheidung. Voids entstehen z.B. direkt bei der Herstellung, insbesondere beim Sintern von Keramiken, durch die Zusammenballung vieler Leerstellen, durch den Aufstau vieler Versetzungen (das gibt dann Mikrorisse), durch die Agglomeration von ins Gitter (als extrinsische atomare Defekte) eingebaute Gasatome (vor allem Wasserstoff; führt ebenfalls zu Mikrorissen) und insbesondere durch Bestrahlung eines Kristalls mit Teilchen aller Art. Ausscheidungen (engl. “precipitates”) sind einfach vollständig in die Matrix des Wirtskristalls eingebettete andere Phasen, sozusagen gefüllte Voids. In der Regel unterstellt man mit dem Wort “Ausscheidung”, dass sie sich im Kristall erst gebildet hat, z.B. durch Diffusion und Agglomeration von Fremdatomen beim Abkühlen. In anderen Worten: Direkt nach dem Erstarren einer Schmelze sind Ausscheidungen noch nicht vorhanden. In den Kristall eingebettete Teilchen, die schon immer da waren (weil sie z.B. schon in der Metallschmelze gelöst waren und beim Erstarren einfach in das Kristallgitter eingebaut wurden), heißen Dispersionspartikel. Ausscheidungen können also wachsen und schrumpfen – je nachdem, ob die beteiligten Atome zur Ausscheidung hin- oder von ihr wegdiffundieren. Dreidimensionale Defekte sind notwendigerweise von zweidimensionalen Defekten begrenzt. Dies bedeutet, dass bei der Bildung einer Ausscheidung die Energie immer erst anwächst, bevor sie abnimmt. Der energetisch günstigere Zustand kann damit nur durch Überwinden einer Energiebarriere erreicht werden, es bedarf einer Nukleation, einer Keimbildung der Ausscheidung, bevor durch Wachstum der Ausscheidung immer mehr Energie gewonnen werden kann, so dass das Wachstum “von alleine” abläuft. Die Gesamtheit aller strukturellen Besonderheiten eines Materials bezeichnen wir als das Gefüge des Materials. Aussagen wie “polykristallin – einkristallin”, “einphasig – mehrphasig”, “grobkörnig – feinkörnig” sind Aussagen über das Gefüge. 48 KAPITEL 1. KRISTALLSTRUKTUREN Kapitel 2 Strukturbestimmung 2.1 Einleitung Die Streuung von Röntgenstrahlen und von Neutronen ist eine hervorragende Methode, die Struktur und Dynamik im Bereich atomarer Abstände zu erforschen. Methoden mit vergleichbarer Aussagekraft sind nur noch die Beugung und Abbildung mit Elektronen, die Feldelektronen- und Feldionenmikroskopie. Im Folgenden sollen die physikalischen Grundlagen, die experimentellen Methoden und die verschiedenen Anwendungen der Röntgen- und Neutronenstreuung dargestellt und erläutert werden. Das Phänomen der Beugung wurde wohl zuerst von Huygens klar erkannt. Unsere anschaulichste Vorstellung haben wir aus den Interferenzversuchen mit Wasserwellen: Hinter einem Loch in einer Wand, die von vorn mit ebenen Wasserwellen angestrahlt wird, breiten sich ringförmig Wasserwellen aus, vorausgesetzt, das Loch ist genügend klein im Vergleich zur Wellenlänge der Wasserwellen. Bei zwei und mehr Löchern in der Wand bilden sich charakteristische Interferenzmuster, deren Struktur vom gegenseitigen Abstand der Löcher relativ zur Wasserwellenlänge abhängt. Ganz analog ist die Versuchsführung bei der Beugung von Röntgenstrahlen und Neutronen, natürlich mit gewissen kleinen Unterschieden. Erstens lassen wir, grob gesehen, der Welle ihren freien Lauf, wir bringen also keine Wände mit kleinen Löchern in den Strahl, sondern nur die beugenden Objekte. Die entsprechenden Bilder für die ungestörte Welle, die Beugung an einem Streuzentrum und die Beugung an zwei Zentren sind in Abb. 2.1 dargestellt. Abbildung 2.1: Beugung einer ebenen Welle an Streuzentren 49 50 KAPITEL 2. STRUKTURBESTIMMUNG Zweitens, die mittleren Abstände von Atomen in Festkörpern und Flüssigkeiten sind etwa 3 × 10−10 m (0.3 nm). Damit wir Aussagen über die atomaren Anordnungen bekommen, muss die Wellenlänge der verwendeten Strahlung vergleichbar oder kleiner als dieser Wert sein. Die Wellenlänge der CuKα -Strahlung ist 0.154 nm und erfüllt damit ausgezeichnet diese Bedingung. Die Wellenlänge der häufigsten Neutronen im thermischen Geschwindigkeitsspektrum ist 0.18 nm und ebenso vergleichbar mit den atomaren Dimensionen. Beide Arten von Strahlungen können in genügender Menge erzeugt werden. Neuerdings wird zu Röntgenstreuexperimenten auch die Bremsstrahlung von Elektronensynchrotrons und von Speicherringen verwendet. Dies sind Quellen von enormer Leuchtdichte. Für das Verständnis zunächst wichtiger ist aber unsere Vorstellung über den Mechanismus der Streuung am einzelnen Atom. Die Streuung von Röntgenstrahlen am einzelnen Atom ohne Änderung der Energie des Atoms ist zurückzuführen auf die Schwingung“ der ” Elektronenhülle. Eine essentielle Rolle spielt der Beugungsvektor Q, gegeben durch die Differenz der Wellenzahl Vektoren k und k0 der einfallenden und der gebeugten Welle (Abb. 2.2): Abbildung 2.2: Schematische Darstellung der Bragg-Beugung im reziproken Raum. Q = k − k0 (2.1) Der differentielle Streuquerschnitt des einzelnen Atoms ist im Wesentlichen eine Funktion von Q und nicht explizit von k oder k0 abhängig (|k| = 2π/λ, mit λ als Wellenlänge der verwendeten Strahlung). Neutronen werden entweder am Kern des Atoms oder aufgrund ihres magnetischen Moments an der Hülle des Atoms gestreut, sofern diese auch ein magnetisches Moment hat. Im ersten Falle ist die Streuung am einzelnen Atom unabhängig von Q. Die Streuung am einzelnen Atom führt zu einem Wirkungsquerschnitt dσ/ dΩ, der aufgefasst wird als Quadrat einer Streulänge b, die ihrerseits von Q abhängen kann: dσ = b2 (2.2) dΩ Der nächste Schritt ist zu zeigen, dass die Streuung an einem Ensemble von N Atomen die kohärente Überlagerung der Streuwellen der einzelnen Atome ist. Dies führt für das Ensemble zu dem Wirkungsquerschnitt N 2 X dσ = (2.3) bn e iQRn dΩ n=1 2.1. EINLEITUNG 51 n ist der Summationsindex, b die Streulänge des einzelnen Atoms und Rn der Ortsvektor für seinen Schwerpunkt. Je nach Anordnung der Atome hängt dσ/ dΩ in ganz verschiedener Weise von Q ab. Also ist dσ/ dΩ ein Indikator für die Struktur des Festkörpers. Bei periodischer Anordnung der Atome ist dσ/ dΩ sehr groß, wenn Q die Braggbedingung erfüllt, d.h. Q senkrecht auf einer Netzebenenschar steht und sein Betrag 2π geteilt durch den Netzebenenabstand oder sein Vielfaches ist. Diese Q-Werte bilden im Q-Raum ein Gitter, das so genannte reziproke Gitter. Bei streng periodischen Kristallen ist für alle anderen Q-Werte dσ/ dΩ praktisch Null. Für gestörte Kristalle ergibt sich aber auch Intensität zwischen diesen reziproken Gittervektoren. Deshalb können oft Störungen mit Beugungsmethoden gut erfasst werden. Bislang haben wir die Atome so behandelt, als ob sie ortsfest wären. Dies trifft aber für einen Festkörper wegen der so genannten Nullpunktsschwingungen nicht einmal am absoluten Nullpunkt und noch viel weniger bei endlichen Temperaturen zu. Die Bewegung der Atome verändert die Energie bzw. die Wellenlänge der Streustrahlung. Zwei Beispiele sollen dies veranschaulichen: 1. Ein Neutron werde an einem freien, sich bewegenden Proton gestreut. Dies kann, wie folgt, mit einfachen Stoßdiagrammen behandelt werden und führt zu einer Energieänderung des Neutrons bei der Streuung (Abb. 2.3). Abbildung 2.3: Streuung eines Neutrons an einem Proton. 2. Die Streuwelle, die von einem Atom ausgeht, ist proportional b/|R| exp(ikR), wobei das Atom bei R = 0 sitzt. Macht das Atom eine zusätzliche zeitabhängige Auslenkung s(t), so müssen wir mit exp(iQs(t)) multiplizieren und generell die Zeitabhängigkeit der Welle betrachten. Die Streuamplitude ist dann b exp i[kR − ωt] exp i[Qs(t)], R (2.4) wobei ~ω gleich der Energie der Strahlung ist. Man sieht, dass die Streuwelle mit der Frequenz 52 KAPITEL 2. STRUKTURBESTIMMUNG der Auslenkung moduliert wird und man kann z.B. für s(t) = s0 cos(ω0 t − α) und Qs l leicht ausrechnen, dass neben der elastischen Streuung auch zwei energiegeänderte Wellen mit ω − ω0 und ω + ω0 auftreten. Die obige Betrachtung, wie die Bewegung der Atome den Wirkungsquerschnitt verändert, ist klassisch und deshalb nur zur Veranschaulichung verwertbar. Im Speziellen wird der Begriff der Streufunktion eingeführt: S(Q, ω) mit ~Q = ~k − ~k0 und ~ω = E − E 0 (2.5) wobei E und E 0 die Energien der Strahlung vor und nach der Streuung sind. Die charakteristischen Frequenzen ω mit denen sich Atome im Festkörper bewegen, liegen im Bereich 109 bis 1014 s−1 . Dies entspricht ~ω-Werten von 4 µeV bis 500 meV. Die Energie der CuKα Strahlung ist 9 keV, die von einem 0,18 nm-Neutron hingegen nur 25 meV. Es ist ganz klar, dass mit Neutronen die charakteristischen Bewegungszustände in Festkörpern wegen der relativ großen Energieänderungen leicht messbar sein sollten. Mit Röntgenstrahlen ist dies ungleich viel schwieriger und kommt auch deshalb in der Praxis nicht vor. In anderen Worten: Mit Röntgenstrahlen messen wir nur die Struktur, mit Neutronen hingegen die Struktur und die Dynamik von Festkörpern. So ist auch die Technik der Neutronenstreuung – im Gegensatz zu der von Röntgenstrahlen – in vielen Fällen noch zusätzlich auf die Energieanalyse nach der Streuung ausgerichtet. Ansonsten gleichen sich die Techniken in mancher Hinsicht. Die inelastische Neutronenstreuung ist eine der wichtigsten Methoden in der Festkörperphysik. Eine der wichtigsten Anwendungen der inelastischen Neutronenstreuung ist die Bestimmung von sogenannten Phononen-Dispersionskurven und Gitterschwingungsspektren. Wegen ihrer magnetischen Wechselwirkung sehen die Neutronen neben der Bewegung der Atomkerne auch die Bewegung der magnetischen Momente. Hier ist zu unterscheiden zwischen der Änderung der Ortslage des magnetischen Moments und der zeitlichen Änderung seiner Richtung. Die letztgenannte Dynamik der magnetischen Momente führt zu dem Beispiel der Streuung an magnetischen Spinwellen (Abb. 2.4). Diese Spinwellen können verstanden werden als gekoppelte Präzessionsbewegungen der atomaren Gesamtspins um die fest vorgegebene Richtung der mittleren Magnetisierung M. Abbildung 2.4: Schematische Darstellung einer magnetischen Spinwelle 2.2. STREUUNG AM EINZELNEN ATOM 53 Wie bei den Phononen stehen auch hier Frequenz und Wellenlänge in fester Beziehung zueinander, was wiederum zu maximalen Neutronenstreuquerschnitten für die entsprechenden Energie- und Impulsüberträge des Neutrons führt. Der Wirkungsquerschnitt nach Glg. (2.3) ist nur gültig, wenn die gestreute Welle nicht noch einmal gestreut wird; d.h. für das Gesamtwellenfeld soll das Streuensemble nur eine schwache Störung sein. Es lässt sich leicht ausrechnen, dass Kristallite, die diese Bedingung erfüllen, für normale Röntgen- und Neutronenstrahlen kaum größer als 0.1 µm bzw. 5 µm sein dürfen. Im Allgemeinen setzen sich Einkristalle aus kristallinen Blöcken von etwa dieser Größe zusammen, und diese Blöcke sind ohne strenge Phasenbeziehung gegeneinander verkippt. Dies erlaubt bei Anwendung sogenannter Extinktionskorrekturen weiterhin den in Glg. (2.3) angegebenen Wirkungsquerschnitt zu verwenden. Man sagt dann, dass die kinematische Theorie verwendet werden kann. Sind jedoch die Kristalle periodisch über wesentlich größere Distanzen, d.h. hat man es mit großen perfekten Kristallen zu tun, dann muss eine ganz andere Theorie, die sogenannte dynamische Theorie der Beugung, verwendet werden. In dieser Theorie werden die Wellengleichungen für die jeweilige Strahlung in dem jeweiligen Medium gelöst, was mit relativ guter Näherung für periodische Kristalle bei einfachen Randbedingungen (z.B. ebene Begrenzungsflächen) möglich ist. Darüber hinaus kann man dann noch schwache Störungen im Kristall haben und ihren Einfluss auf die dynamische Beugung untersuchen. 2.2 Streuung am einzelnen Atom Atome haben einen Durchmesser, der in der Größenordnung von kleiner als 1 nm liegt. Wenn sie sich zu größeren Molekülen oder im flüssigen bzw. festen Aggregatzustand zusammenlagern, so liegen ihre nächste-Nachbar-Abstände ebenfalls bei Nanometern. Um die Struktur einer solchen Ansammlung von Atomen durch ein Beugungsexperiment zu bestimmen, benötigt man Wellen, deren Wellenlänge ebenfalls von dieser Größenordnung ist bzw. deren Wellenvektor k = 2π/λ im Bereich 1010 – 1011 m−1 liegt. Die wichtigsten Wellentypen für Strukturuntersuchungen sind:. • Röntgenstrahlen: E = 10 keV → λ = 2πc~/E ≈ 0.124 nm • Elektronen: E = 100 eV → λ = 2π~/(2Eme )1/2 ≈ 0.123 nm • Neutronen: E = 50 meV → λ = 2π~/(2Emn )1/2 ≈ 0.128 nm Im Prinzip können natürlich eine Reihe weiterer Materiewellen, z.B. Protonen, zu Strukturuntersuchungen herangezogen werden. Praktisch sind jedoch die oben genannten am wichtigsten. In diesem Kapitel soll zunächst die Streuung der oben genannten Wellen am einzelnen Atom diskutiert werden. Die Wechselwirkung der verschiedenen Wellen mit dem einzelnen Atom ist sehr unterschiedlich. Die Röntgenstrahlung zwingt die Ladungswolke der Atomelektronen zu erzwungenen Schwingungen. Die Elektronen werden am elektrischen Potential des Atoms gestreut. Die Neutronen werden zum einen am Atomkern gestreut, zum anderen an lokalen Magnetfeldern der Elektronenhülle wie sie in magnetischen Substanzen vorkommen. Wir werden also die verschiedenen Mechanismen der Streuung im einzelnen diskutieren. Da 54 KAPITEL 2. STRUKTURBESTIMMUNG die Atome selbst einen Durchmesser haben, der vergleichbar ist mit der Wellenlänge, findet bereits eine Interferenz der elementaren Streuwellen von verschiedenen Teilen des Atoms statt. Dies wird sich im atomaren Formfaktor ausdrücken. (Lediglich bei der Kernstreuung der Neutronen an nicht magnetischen Atomen ist dieser Formfaktor gleich 1, weil die Ausdehnung des Kerns klein ist gegen die Neutronenwellenlänge). Wenn die Atome jetzt zu größeren Verbänden oder Kristallen zusammengelagert werden, so werden wir in der Regel annehmen, dass die eintretende Welle an jedem Atom unabhängig gestreut wird und dass die Atome im Verband genauso streuen wie im isolierten Zustand. Die Streuwellen überlagern sich nun und liefern ein Beugungsbild, das der vorliegenden Struktur entspricht und Rückschlüsse auf die Anordnung der Atome erlaubt. Während die Streuung der verschiedenen Wellentypen am einzelnen Atom recht unterschiedlich ist, wird die Überlagerung am Atomverband für alle Wellen gleich behandelt. Wir werden im Folgenden die Streuung von Röntgen-, Elektronenund Neutronenwellen am Atom im Detail behandeln. Wir beginnen also mit der Frage: Was passiert, wenn eine Welle auf ein Atom trifft? Dabei soll das Atom am Orte 0 fest verankert sein. 2.2.1 Streuamplitude und Bornsche Näherung Zunächst wollen wir diese Frage allgemein, d.h. unabhängig von der speziellen Art der einfallenden Welle für die elastische Streuung diskutieren. Die einfallende Welle e ikr wird am Atom gestreut. Die Streuwelle hat in großen Abständen die Form 1 f (Ω) e ikr r (2.6) Abbildung 2.5: Streuung einer ebenen Welle an einem Atom. Für die Streuung definiert man den partiellen Streuquerschnitt dσ/dΩ. Dieser gibt den 2.2. STREUUNG AM EINZELNEN ATOM 55 Bruchteil der einfallenden Welle an, der in das Raumwinkelelement [Ω,dΩ] gestreut wird. dσ Strom der gestreuten Teilchen in [Ω, dΩ] = . dΩ Stromdichte der einfallenden Teilchen × dΩ (2.7) Da bei der elastischen Streuung die Gruppengeschwindigkeiten von einfallender und gestreuter Welle gleich sind, gilt dσ = |f (Ω)|2 , (2.8) dΩ wobei f(Ω) die Streuamplitude in die Richtung Ω bezeichnet. Als totalen Streuquerschnitt definiert man Z dσ σ= dΩ. (2.9) dΩ Die Streuung kann auch als Übergang vom Zustand k in den Zustand k0 beschrieben werden (Abb. 2.6). Das Matrix-Element der potentiellen Energie sei Uk’k . Abbildung 2.6: Streuung als Übergang vom Zustand k in den Zustand k0 Dann ist die Übergangswahrscheinlichkeit von k nach k0 in Bornscher Näherung: Wk 0 k = 2 2π Uk0 k δ Ek0 − Ek . ~ (2.10) Der Zusammenhang von f(Ω) und Uk’k soll hier in Bornscher Näherung angegeben werden. Die Streuwahrscheinlichkeit vom Zustand k in den Zustand k0 ergibt einen Zusammenhang zwischen Streuamplitude und Matrix-Element: f (Ω) = k Uk0 k V, 2π~vgr mit vgr = dE d (~k) (2.11) 56 KAPITEL 2. STRUKTURBESTIMMUNG V ist das Normierungsvolumen und vgr ist die Gruppengeschwindigkeit. Damit ergibt sich für den differentiellen Streuquerschnitt in Bornscher Näherung dσ k2 = 2 dΩ 4π dE dk −2 |V Uk0 k |2 . (2.12) Für Korpuskularwellen gilt E = ~2 k 2 /2m. Damit finden wir m 2 dσ = |V Uk0 k |2 . dΩ 2π~2 2.2.2 (2.13) Röntgenstreuung am Atom Wir betrachten zunächst die Streuung durch ein klassisches (lokalisiertes) Elektron am Orte 0, auf das eine elektromagnetische Welle (Röntgenwelle) trifft. Die elektromagnetische Welle behandeln wir in diesem Kapitel stets klassisch. Sie besitzt eine Komponente des magnetischen und des elektrischen Feldes. Letztere beschreiben wir durch E = E 0 e i(kr−ωt) . (2.14) Dieses elektrische Feld regt das Elektron zu erzwungenen Oszillationen an, wobei s die Amplitude des Elektrons beschreibt. Das schwingende Elektron ist nun seinerseits ein Hertzscher Dipol. Dieser Dipol emittiert ein elektromagnetisches Feld. Das Verhalten von Streuamplitude E S0 zu Einfallsamplitude E 0 führt zum differentiellen Streuquerschnitt. Im Allgemeinen benutzt man unpolarisierte Röntgenstrahlung. Dann liegt der Vektor E 0 im statistischen Mittel gleichverteilt in der x-y-Ebene. Wenn wir den Winkel zwischen k und k0 mit ϑ bezeichnen, so ergibt die Mittelung über alle Polarisationen des elektrischen Feldes für den differentiellen Streuquerschnitt dσ = r2 dΩ ES E0 2 1 e4 = 4 2 c me 1 + cos2 ϑ 2 . (2.15) Dieser Faktor 1/2(1+cos2 ϑ) tritt stets als Charakteristikum der Dipolstreuung im Endresultat für die Intensität auf. Jetzt betrachten wir das streuende Atom zunächst einmal halbklassisch. Es besteht aus einem positiven Kern und einer elektronischen Ladungswolke mit der Ladungsdichte eρ(r). Der Kern trägt wegen seiner großen Masse kaum zur Streustrahlung bei. Von der Ladungswolke der Elektronen nehmen wir zunächst an, dass sie lokal ohne Behinderung durch atomare Bindungskräfte zu erzwungenen Schwingungen gebracht wird. Dies wird umso besser, je höher die Energie der Röntgenstrahlung im Vergleich zu atomaren Bindungsenergien ist. Jetzt überlagern sich die Streuwellen von verschiedenen Teilen der Elektronenhülle, wie in Abb. 2.7 demonstriert. Die Feldstärke der Welle in Richtung k0 für große Abstände ist − 1 1 e2 E0 Fx (Q) Cϕ (ϑ) mit Q = k − k0 2 r c me (2.16) 2.2. STREUUNG AM EINZELNEN ATOM 57 Abbildung 2.7: Streuung an der Elektronenhülle. dem atomaren Streufaktor Z ρ (R)e iQR d3 R (2.17) Cϕ (ϑ) = [E 0 − (E 0 · r) r] . (2.18) Fx (Q) = und der Elektronendichte ρ(R), sowie Damit ist die Streuamplitude f (Ω) = e2 Fx (Q) Cϕ (ϑ) = rel Fx (Q) Cϕ (ϑ) , me c2 (2.19) wobei rel = 2.8 × 10−13 cm der klassische Elektronenradius ist. In dieser und folgenden Formeln wird f (Ω) oft als Funktion von Q angegeben. Da Q = 2k sin(ϑ/2) ist, gibt Q die Abhängigkeit von Ω = Ω(ϑ, ϕ) an. Bei der bisherigen Betrachtung war sowohl das Wellenfeld der Röntgenstrahlen als auch die Elektronenhülle der Atome klassisch behandelt worden. Diese Betrachtung liefert den für Strukturuntersuchungen wichtigen Anteil der Röntgenstreuung. Dabei ist die Streuung der Röntgenstrahlen elastisch, d.h. ohne Energieverlust. Wir wollen jedoch noch kurz auf inelastische Prozesse eingehen. Die Elektronenhülle kann z.B. einen Röntgenstrahl absorbieren und dabei in einen angeregten Zustand übergehen. In diesem Fall ist die Wellenfunktion vor und nach dem Übergang verschieden. Diese inelastische Streuung kann in Glg. (2.19) inkorporiert werden, indem für die Elektronendichte ein zusätzlicher Operator eingesetzt wird. Eine Quantisierung der Röntgenstrahlung soll hier nicht durchgeführt werden. Sie ist jedoch für die Röntgenstreuung nicht unerheblich. Sie liefert z.B. die Comptonstreuung (Abb. 2.8), 58 KAPITEL 2. STRUKTURBESTIMMUNG bei der ein x-Photon mit einem Elektron kollidiert und Energie und Impuls austauscht. Dabei erfährt der x-Strahl eine Änderung der Wellenlänge um ∆λ = h (1 − cos ϑ) me c (2.20) Abbildung 2.8: Comptonstreuung, schematisch 2.2.3 Elektronen-Beugung Für Elektronen besitzt ein Atom ein Potential u(R). Die Berechnung dieses Potentials ist nicht einfach. Wir werden auf diesen Punkt noch kurz zurückkommen. Für große Abstände sei u(R → ∞) = 0. In diesem Potential hat die einfallende Elektronenwelle eine veränderte Wellenlänge. 2π~ 2π =p (2.21) λ= k 2me [E − u (R)] Die führt zu einer Streuung der Elektronenwelle. Dabei überlagern sich wie zuvor die Streuwellen von verschiedenen Bereichen des Atoms. Nun können wir leicht die Matrix-Elemente für den Übergang von k nach k0 berechnen: Z 0 1 0 uk k = u (R)e i(k−k )R d3 R (2.22) V Entsprechend der Glg. (2.22) hat dann die Streuwelle in Bornscher Näherung die Form: 1 1 me V u 0 e ikr f (Ω) e ikr = r r 2π~2 k k (2.23) Das Potential u(R) setzt sich zum einen aus dem positiven Coulomb-Anteil des Kerns zusammen. Zum anderen enthält es die Coulomb-Abstoßung der übrigen Elektronen sowie die Austauschwechselwirkung mit diesen. Letztere ist nur näherungsweise berechenbar. Dies führt dazu, dass man ein Pseudopotential einführen muss. Diese Schwierigkeiten sind nur numerisch zu lösen. Für viele Elemente kann man die Potentiale tabelliert erhalten. 2.2. STREUUNG AM EINZELNEN ATOM 59 Für hohe Elektronenenergien kann man die Austauschwechselwirkung vernachlässigen. Dann kann man das Potential aus der Ladungsdichte des Atoms berechnen. Damit ergibt sich für die Streuamplitude bei der Streuung von Elektronen: f (Ω) = me e2 1 1 (Z − Fx ) = (Z − Fx ) 2 2 2π~ Q 2πaH Q2 (2.24) wobei aH = 0,53 10−8 cm der Bohr’sche Radius ist. Wenn wir diesen Ausdruck mit Glg. (2.24) für die Röntgenstreuung vergleichen, so tritt zwischen beiden grob gesprochen der Faktor (2πQ2 aH rel )−1 auf. Setzen wir für Q einen typischen Gitterimpuls ein (Q = 0.1 nm), so finden wir grob als Verhältnis der Streuamplituden von Elektronen zu Röntgenstreuung den Faktor 103 – 104 . 2.2.4 Neutronenstreuung Die Wechselwirkung von Neutronen mit Atomen wird durch eine Reihe von Termen beschrieben. Wir beschränken uns auf die Kernkräfte (Nukleon-Nukleon) und die Wechselwirkung des magnetischen Moments vom Neutron mit dem magnetischen Moment der Elektronenhülle bzw. deren Magnetfeld. Alle anderen Terme liefern nur sehr kleine Korrekturen. 1.) Kernstreuung Bei der Streuung niederenergetischer Neutronen am Kern findet man experimentell eine räumlich isotrope Streuung f(Ω) = const. Eine solche reine s-Streuung wird durch ein δförmiges Potential geliefert. Dies soll zunächst in Bornscher Näherung gezeigt werden. Die Wellenlänge der verwendeten Neutronen ist mindestens vier Größenordnungen größer als die Reichweite der Kernkräfte. Bei der Streuung an einem solchen ,,punktförmigen“ Potential kann nur ein zentraler Stoß stattfinden und in Folge dessen kein Bahndrehimpuls übertragen werden. Die Kernstreuung der Neutronen ist daher unabhängig von den Details der Kräfte zwischen den Nukleonen vollkommen isotrop und nur vom relativen Abstand r zwischen Neutron und Kern abhängig. Zur Vereinfachung der später hergeleiteten Gleichungen setzen wir (2.25) u (R) = V0 ūδ (r) . Dabei ist V0 das Volumen des Kerns und ū das mittlere Kernpotential, das auch als FermiPseudopotential bezeichnet wird. In naiver Bornscher Näherung erhält man für das Matrix-Element der Streuung von k nach k0 Z 0 1 V0 uk 0 k = V0 ūe i(k−k )r δ (r) d3 r = ū. (2.26) V V Damit hat die Streuwelle in Bornscher Näherung gemäß Glg. (2.26) die Streuamplitude 1 1 mn a ikr ikr f (Ω) e ikr = V ūe = e . 0 r r 2π~2 r Die Streuung ist isotrop (s-Streuung). Die Konstante m a= V0 ū 2π~2 (2.27) (2.28) 60 KAPITEL 2. STRUKTURBESTIMMUNG nennt man Streulänge. Damit ist f (Ω) = a. (2.29) Der differentielle Streuquerschnitt ist gemäß Glg. (2.29) dσ = a2 . dΩ (2.30) Die hier gegebene Streuung ist in Bornscher Näherung berechnet. Das heißt, dass das Streupotential u(R) nur in erster Potenz in der Streuwelle auftritt. Wenn das Potential jedoch stark ist, so kann man die Bornsche Näherung nicht mehr verwenden. Dies wird im Fall der Neutronenstreuung am Kern, aber auch bei Resonanzstreuung der Elektronen nötig sein. Resonanzstreuung tritt auf, wenn die Energie des einfallenden Neutrons mit einem angeregten Zustand des Systems (Kern oder Atom) übereinstimmt. In diesem Fall verweilt – anschaulich gesprochen – das Neutron (Elektron) eine gewisse Zeit in dem angeregten Zustand und die Wechselwirkung wird so intensiv, dass alle Potenzen des Potentials berücksichtigt werden müssen. In der Praxis bestimmt man die Streulänge experimentell. In Abb. 2.9 sind einige experimentelle Streulängen eingetragen. Abbildung 2.9: Experimentelle Streulängen für Neutronenstreuung. Bisher haben wir den Spin von Neutron und Kern außer acht gelassen. Das beschreibt die Streuung an Kernen mit Spin 0. Wenn der Kern selbst noch einen Spin besitzt, so hängt das Potential vom Gesamtspin ab. Kern und Neutron können einmal den Gesamtspin J = I + 1/2 und J = I – 1/2 bilden. Während des Streuprozesses bleibt der Gesamtspin erhalten. 2.2. STREUUNG AM EINZELNEN ATOM 61 Daher gibt es auch zwei Streulängen a+ und a− . Da verschiedene Isotope eines Elements unterschiedliche Kerne haben, besitzen sie für die Neutronen auch ein verschiedenes Potential und damit eine verschiedene Streulänge. Diese Tatsache spielt eine gravierende Rolle, wenn wir an einem Komplex von Atomen mit verschiedenen Isotopen streuen. Als Beispiel kann aus Abb. 2.9 der Unterschied zwischen Wasserstoff H und Deuterium D entnommen werden. 2.) Magnetische Streuung Da das Neutron ein magnetisches Dipolmoment hat, besitzt es eine Wechselwirkung mit inneren Magnetfeldern eines Atoms, die durch die Hüllenelektronen hervorgerufen werden. Solche Felder tauchen z.B. auf, wenn das Atom ein magnetisches Moment, also ungepaarte Elektronen, besitzt. Die Wechselwirkungsenergie ist umag = −µn B e . (2.31) Das Magnetfeld der Elektronen setzt sich aus einem Spinanteil und einem Bahnanteil zusammen. Allerdings mittelt sich das Bahnmoment der Elektronen in vielen Festkörpern durch den Einfluss kristallelektrischer Felder nahezu gänzlich weg, so dass effektiv nur mehr das Spinmoment der (ungepaarten) Elektronen zur magnetischen Wechselwirkung beiträgt. Unter Vernachlässigung der Bahnanteile kann die magnetische Streuamplitude in Born’scher Näherung durch f (Ω) = p (Q) σ = gn re Se⊥ Fmag (Q) ~σ (2.32) beschrieben werden, worin gn = −1.91 der gyromagnetische Faktor des Neutrons, ~σ der Pauli-Spinoperator, re = (µ0 /4π)e2 /me c2 der klassische Elektronenradius“ und Se⊥ die ” Komponente des Gesamtelektronenspins senkrecht auf die Richtung des Impulsübertrages ~Q bedeuten. Fmag (Q) ist der so genannte magnetische Atomformfaktor, welcher der Fouriertransformierten der Spindichteverteilung der Elektronen entspricht. Als eigentliche magnetische Streulänge wird die Größe p(Q) bezeichnet. Da gn re = −1.08 × 10−12 cm, ist sie von derselben Größenordnung wie die nuklearen Streulängen. Aus Glg. (2.32) erkennt man, dass die magnetische Streuung total unterdrückt werden kann, wenn der Elektonenspin in Richtung des Streuvektors Q orientiert wird (bei der Streuung an einem Vielteilchensystem geschieht dies durch Parallelstellung von Magnetisierung der Probe und Streuvektor, wie in Abb. 2.9 dargestellt). Maximale Streuwirkung ergibt sich dagegen, wenn der Elektronenspin senkrecht zu Q ausgerichtet ist. Dies bedeutet, dass man aus zwei aufeinander folgenden Messungen mit verschiedener relativer Orientierung von Se und Q die Anteile der Kern- und der magnetischen Neutronenstreuung voneinander separieren kann. Verwendet man polarisierte Neutronen (|h~σ i| = 1), so lässt sich die Trennung von nuklearen und magnetischen Intensitätsanteilen auf Grund des Vorzeichenwechsels der magnetischen Streuamplitude aus zwei aufeinander folgenden Messungen mit entgegengesetzter Polarisation durchführen (Abb. 2.10). Die Separation erfolgt dabei generell genauer als im Fall unpolarisierter Neutronen, da dabei die Streulängen im Streuquerschnitt auch linear 62 KAPITEL 2. STRUKTURBESTIMMUNG Abbildung 2.10: Zur Trennung von nuklearen und magnetischen Streubeiträgen auftreten, d.h. ihre gegenseitige Interferenz zu tragen kommt: ∝ (a + p(Q) h~σ i)2 = a2 + p2 (Q) unpolarisiert = a2 + p2 (Q) ± 2ap(Q) polarisiert dσ dΩ (2.33) Grundsätzlich muss auch festgehalten werden, dass Glg. (2.33) in dieser Form selbstverständlich nur dann gilt, wenn die Elektronenkonfiguration des Atoms beim Streuprozess nicht verändert wird. Dies ist etwa bei der störungstheoretischen Berechnung der Streulängen von Röntgenstrahlen von Bedeutung, welche außerdem zum Unterschied von Neutronen auch Terme 2. Ordnung in der Born’schen Reihenentwicklung erfordert. 2.2.5 Vergleich der Streulängen Zusammenfassend sollen nun grob die Größen der Streuamplituden für verschiedene Streumechanismen verglichen werden (Abb. 2.11): a) Röntgenstrahlen Ein charakteristisches Maß für die Stärke der Streuung ist Z . rel = Z · 2.8 × 10−13 cm ≈ 10−11 cm. b) Elektronenbeugung Ein charakteristisches Maß für die Stärke der Streuung ist Z/(2πaH G2 ), wobei G ein reziproker Gittervektor ist. Die Streuamplitude ist um den Faktor 103 – 104 größer als bei 2.2. STREUUNG AM EINZELNEN ATOM 63 Abbildung 2.11: Röntgenbeugungs- und Neutronenbeugungsaufnahmen von Magnetit bei Raumtemperatur. x-Strahlen und etwa 10−8 – 10−7 cm. Da Q2 = 4k 2 sin2 (ϑ/2), ist der totale Streuquerschnitt umgekehrt proportional zur kinetischen Energie der Elektronen. Aus diesem Grunde benutzt man im allgemeinen Elektronstrahlen von 10 eV und mehr zur Strukturuntersuchung, um tief genug in die Materie einzudringen. Dann liegen allerdings die interessanten Reflexe unter kleinen Winkeln. Niedrige Elektronenenergien eignen sich vor allem, um Oberflächen zu untersuchen. c) Neutronenstreuung Für die meisten Elemente liegt die Streulänge bei der Kernstreuung in der Größenordnung ±5×10−13 cm. Bei reiner Spin-Streuung (im Falle der magnetischen Streuung) liegt Fmag (Q) für kleine Q in der Größenordnung 1 (z.B. bei Fe). Wenn Q⊥Q ist, so liegt die charakteristische Länge bei 5 × 10−13 cm. Sie ist also mit der Kernstreuung vergleichbar. 64 2.3 KAPITEL 2. STRUKTURBESTIMMUNG Beugung an periodischen Strukturen (Elastische Streuung an vielen Atomen) Nachdem wir die verschiedenen Wellentypen und ihre Streuung durch das einzelne isolierte Atom diskutiert haben, wollen wir nun einen Schritt hin zur Strukturuntersuchung von einer größeren Anordnung von Atomen machen. Dabei werden wir die Atome als lokalisiert am Orte r betrachten, denn wir werden uns auf die elastische Streuung beschränken. Wir betrachten eine einlaufende Welle e ikr . Die Dämpfung dieser Welle in der Atomanordnung möge so gering sein, dass jedes Atom die einlaufende Welle mit der Amplitude 1 spürt. Jedes Atom streut nun mit seiner Amplitude f (Ω). Die Streuwelle möge so klein in der Amplitude sein, dass eine weitere Streuung der gestreuten Welle einen verschwindenden Beitrag liefert. Das heißt, Mehrfachstreuung wird vernachlässigt. Diese Voraussetzungen sind besonders gut für Neutronen erfüllt. Bei der Elektronenstreuung wird im Kapitel über dynamische Theorie diese Voraussetzung fallengelassen. Wir können nun die Amplitude der gestreuten Welle berechnen, indem wir die Streuamplituden der einzelnen Atome (1/r)f (Ω)e ikr mit den entsprechenden Phasendifferenzen überlagern oder indem wir das Matrix-Element bezüglich des Gesamtpotentials aller Atome bilden. Beide Wege sind äquivalent. Hierbei wird angenommen, dass das Potential bzw. die Ladungsverteilung des Atoms sich durch die Nähe der anderen Atome nicht wesentlich ändert. Wir berechnen das Matrixelement für den Übergang von k nach k0 : Z X 0 1 u (r − r i )e i(k−k )r (2.34) Uk0 k = V i Dabei ist P u (r − r i )das Gesamtpotential. i Verglichen mit der Streuamplitude des einzelnen Atoms bei der Streuung von k nach k0 P ist die Streuamplitude des Atomkomplexes lediglich mit dem Phasenfaktor e iQri multiplii ziert. Die gesamte Information über die Anordnung der Atome liegt in diesem Phasenfaktor. Er ist auch vom Wellentyp gänzlich unabhängig und enthält nur den Übertrag des Wellenvektors Q. Bei der Berechnung der Streuintensität müssen wir die Amplitude quadrieren. Daher ist P iQr 2 i vergrößert. e die Intensität des Atomkomplexes gegenüber dem einzelnen Atom um Wir definieren nun als Strukturfaktor für k 6= 0 1 F (Q) = N 2 X 1 X iQ(ri −rj )ri e iQri = e , N i,j i i (2.35) wobei N die Zahl der streuenden Atome ist. Da man in einem Streuexperiment im Allgemeinen nur die Streuintensität messen kann, ist die Information, die das Streuexperiment liefert, in F (Q) gespeichert. Bei der Analyse müssen wir nun versuchen, aus F (Q) wieder rückwärts die Anordnung der Atome zu entschlüsseln. 2.3. BEUGUNG AN PERIODISCHEN STRUKTUREN Der Strukturfaktor für den periodischen Kristall ist dann X F (Q) = N δQ,G n Gn 65 (2.36) mit Gn als Basis des reziproken Gitters. Diese Beziehung enthält die bekannte Bragg-Bedingung (Abb. 2.12). Wenn D der Netzebenenabstand ist und ϑ der Winkel zwischen k und k0 , dann ist die Phasendifferenz zwischen den an zwei benachbarten Netzebenen gestreuten Wellen ein Vielfaches von 2π, wenn 2D sin oder ϑ =n·λ 2 (2.37) 2D sin ϑ2 2π 2π = n λ D (2.38) k − k0 = G (2.39) oder Abbildung 2.12: Schematische Darstellung der Bragg-Beugung. Für die Streuung von Röntgenstrahlen sind die Elektronen in einem Festkörper, deren Dichte durch eine Funktion ρ(r) beschrieben werden, verantwortlich. Man findet die Amplitude der Streuwelle in Bornscher Näherung, indem man die Streuwellen, die von den einzelnen Punkten des Streukörpers ausgehen, unter Berücksichtigung ihrer Phasenunterschiede aufsummiert: Z Z 0 i(k −k)r F (Q) = ρ (r)e dV = ρ (r)e iQr dV. (2.40) 66 KAPITEL 2. STRUKTURBESTIMMUNG Die gestreute Intensität ist gleich dem Betragsquadrat der Fouriertransformierten der Dichtefunktion I ∼ |F (Q)|2 (2.41) 2.4 Grundlagen der Strukturanalyse Zur Erforschung kleiner Gegenstände bedient man sich am einfachsten eines Mikroskops. Die Abbe’sche Theorie erklärt die Bildentstehung im Mikroskop: Die einfallende Strahlung wird am Objekt gebeugt. Durch das Objektiv werden die Strahlen einer Beugungsordnung in einem Punkt der Brennebene vereint. Die Überlagerung der Strahlen auf ihrem weiteren Weg in der Bildebene ergibt dann ein vergrößertes Bild des Objekts. Für Strahlungen, die wegen ihrer Wellenlänge zur Erforschung des atomaren Aufbaus der Kristalle geeignet sind, für Röntgenstrahlen, Elektronenstrahlen und thermische Neutronen, gibt es noch keine Linsen hinreichender Auflösung: Was man bei diesen Strahlen beobachten kann, sind Beugungsbilder in hinreichend großem Abstand vom Objekt. Diese Bilder entsprechen den Bildern in der Brennebene eines Mikroskops. Obwohl man die Gesetze, nach denen sich die Wellen von der Brennebene zur Bildebene fortbewegen, kennt, kann man aus dem Bild (der Intensitätsverteilung) in der Brennebene nicht das vergrößerte Bild des Objekts berechnen. Man müsste dazu noch die Phasenunterschiede der einzelnen Strahlen in der Brennebene kennen. Ebenso wenig ist es möglich, aus dem Beugungsbild eines Kristalls ohne zusätzliches Wissen die Kristallstruktur zu berechnen. Es fehlen die Phasenbeziehungen zwischen den verschiedenen abgebeugten Strahlen (Phasenproblem der Strukturbestimmung). Trotzdem ist es möglich, aus Beugungsuntersuchungen eindeutig die Kristallstruktur zu bestimmen. In manchen Fällen ist so etwas wie eine experimentelle Phasenbestimmung möglich, indem man weitere Atome in den Kristall einlagert und die Veränderung der Beugungs-Intensitäten beobachtet. In vielen Fällen reicht die Information, die im Beugungsbild steckt, zusammen mit der Kenntnis der Zahl und Art der Atome, die den Kristall aufbauen, für eine Strukturbestimmung aus. Aus den Beugungswinkeln lassen sich die Abmessungen der Elementarzelle entnehmen, die Lage der Atome in der Zelle, die die Elektronendichte bestimmt, äußert sich nur in der Intensität der verschiedenen Bragg-Reflexe. Dies zeigt, dass man bei einer Strukturbestimmung in 2 Schritten vorzugehen hat. 1.) Bestimmung der Gitterkonstanten Die Bestimmung der Gitterkonstanten beruht stets auf Winkelmessungen. Es gibt verschiedene Methoden, um entweder an einzelnen Kristallen oder an Kristallpulvern Gitterkonstanten zu bestimmen. Man kann z.B. Gitterkonstanten an Einkristallen mit Hilfe der Lauebeziehung bestimmen. Ein Röntgenstrahl falle senkrecht auf eine Kristallachse. Strahlen, die an Atomen, die um die Gitterperiode D versetzt sind, gebeugt werden, verstärken sich nur, wenn die Bragg-Bedingung erfüllt ist. Bei monochromatischer Strahlung (λ = konstant) erfolgt aus der Bragg-Gleichung die Bestimmung der Gitterperiode D. Mögliche Reflexe liegen auf Kegeln um die Kristallachse. Diese schneiden einen zylindrisch um den Kristall gelegten Film in Schichtlinien (Drehkristallaufnahme). Aus den Abständen der Schichtlinien lässt sich die Gitterkonstante berechnen. 2.4. GRUNDLAGEN DER STRUKTURANALYSE 67 2.) Bestimmung der Atomlagen Im Fall der Erfüllung der Bragg-Bedingung (G = Qn ) ist die Elektronendichte in einem Kristall gegeben durch 1 X ρ (r) = F (Gn ) e−2π iGn r . (2.42) V Gn Die Phasenwinkel können nicht direkt den Beugungsaufnahmen entnommen werden. Deshalb gibt es auch kein direktes Verfahren, ausgehend von den beobachteten Beugungs-Intensitäten durch Fouriersynthese die Elektronendichte zu berechnen. Es muss dem eine Bestimmung der Phasen vorausgehen. In manchen Fällen kann das experimentell geschehen. Man baut schwere Atome in das Kristallgitter ein und beobachtet die damit verbundenen Änderungen der Beugungsintensitäten. Diese lassen Rückschlüsse auf die Phasen zu. Viele organische Kristallstrukturen sind auf diese Weise ermittelt worden. Oft lässt sich das Phasenproblem“ auch rein rechnerisch lösen, denn man weiß, dass ” die Elektronendichte nicht jede beliebige Gestalt haben kann, da die Kristalle aus Atomen aufgebaut sind. Für die Intensität eines bestimmten Bragg-Reflexes gilt: Z 2 2π iGr IG ∼ ρ (r) e dV . (2.43) Nimmt man punktförmige Atome an, so kann das Integral durch eine Summe ersetzt werden: 2 X 2π i Gr = |F |2 . IG ∼ fi · e G i(Atome/EZ) (2.44) Die fi sind die Atomstreufaktoren der verschiedenen Atome, die r i ihre Lagevektoren innerhalb der Elementarzelle. Zu summieren ist nur über die Atome einer Elementarzelle, denn die Streuwellen der Atome verschiedener Zellen sind in Phase wenn die Bragg-Gleichung erfüllt ist und liefern alle den gleichen Beitrag zur Streuamplitude. Die Bedeutung dieser Formel des so genannten Strukturfaktors F (G) sollen folgende Beispiele erläutern, vergleiche Abb. 2.13: • Kubisch raumzentriertes Gitter (bcc), 2 Atome gleicher Art (0, 0, 0) und (1/2, 1/2, 1/2) Fg = fA · {1 + exp [πi(h + k + l)]} Fg = 0 für h + k + l = 2n + 1 Fg = 2fA für h + k + l = 2n • Kubisch flächenzentriertes Gitter (fcc), 4 Atome gleicher Art (0, 0, 0), (1/2, 01/2), (0, 1/2, 1/2) und (1/2, 1/2, 0) Fg = 0 für h, k, l gemischt, d.h. gerade und ungerade Zahlen Fg = 4fA für h, k, l ungemischt, d.h. entweder gerade oder ungerade 68 KAPITEL 2. STRUKTURBESTIMMUNG • Hexagonal dichteste Kugelpackung (hcp) 2 Atome gleicher Art (0, 0, 0) und (1/3, 2/3, 1/2) Fg = 0 für l ungerade und h + 2k = 3n √ Fg = fA 3 für l ungerade und h + 2k = 3n + 1 Fg = 2fA für l gerade und h + 2k = 3n Fg = fA für l gerade und h + 2k = 3n + 1 Abbildung 2.13: Elementarzellen des hcp-, bcc- und fcc-Gitters. Wieviele Atome in der Elementarzelle sind, lässt sich aus der Dichte des Kristalls, aus der chemischen Zusammensetzung und der Größe der Elementarzelle einfach ermitteln. Aus den Zellparametern lässt sich das Volumen einer Zelle ausrechnen. Ist die chemische Zusammensetzung bekannt, kann man mit Hilfe einer experimentell bestimmten Dichte des Stoffes das Gewicht einer Elementarzelle auf 2 Arten ausdrücken. VZelle ρ = Z · M · 1.66 · 10−24 (2.45) Z . . . Zahl der Moleküle der Elementarzelle, M . . . Molekulargewicht, 1.66 · 10−24 g = Masse in Gramm der chemischen Masseneinheit. Aus dieser Glg. (2.45) bekommt man Z, damit weiß man, wie viele und welche Atome sich in einer Elementarzelle befinden. Da man im Prinzip unendlich viele Intensitäten IG messen kann, müssen sich die endlich vielen Lageparameter r i bestimmen lassen. Aus dem Vergleich des Experimentes mit den berechneten Intensitäten gelangt man zu einer eindeutigen Bestimmung der Kristallstruktur. Um mit Aussicht auf Erfolg die Bestimmung der Atomkoordinaten angeben zu können, muss man die Symmetrie der Kristalle mit einbeziehen. Die Kenntnis der Symmetrie reduziert aber die Zahl der Parameter, die die Struktur bestimmen, ebenso wie die Zahl der unbekannten Phasen in der Fourierdarstellung und ist Voraussetzung für die richtige Wahl der Elementarzelle. 2.5. EXPERIMENTELLE GRUNDBEGRIFFE 2.5 69 Experimentelle Grundbegriffe Streuexperimente am Festkörper liefern sowohl mit Röntgenstrahlen als auch mit Neutronen oder Elektronen sehr direkte Informationen über ihre atomare Struktur, denn in allen drei Fällen können – als generelle Voraussetzung hierfür – immer Wellenlängen im Bereich der zwischenatomaren Abstände gewählt werden. Die wesentlichen Elemente eines Streuexperiments sind Quelle, Probe und ein Nachweissystem für die Streustrahlung (Abb. 2.14): Abbildung 2.14: Schematische Darstellung eines Streuexperimentes. Im Streuexperiment kann der Streuwirkungsquerschnitt gemessen werden, d. h. die Wahrscheinlichkeit, mit der beispielsweise Röntgenstrahlen, Neutronen oder Elektronen einer bestimmten Wellenlänge λ unter einem Streuwinkel ϑ gestreut werden; gegebenenfalls mit geänderten Wellenlängen λ0 bei inelastischer Streuung. Röntgen- und Neutronenquellen emittieren ein ganzes Wellenlängenspektrum. Normalerweise wird daher ein zwischen Quelle und Probe angeordneter Monochromator verwendet, mit dessen Hilfe eine bestimmte Wellenlänge aussortiert werden kann. Im Folgenden sollen die experimentellen Grundlagen und die Frage diskutieren werden, ob die Streuexperimente mit den drei “Festkörpersonden” Röntgenstrahlen, Neutronen und Elektronen gleiche oder unterschiedliche Informationen über den Festkörper liefern. Im Allgemeinen unterscheidet man zwei Fragestellungen: 1.) Die Statik des Festkörpers, d. h. seine atomare Struktur (amorph, gestörter oder perfekter Gitteraufbau). Diese Information erhalten wir aus der elastischen Streuung. 2.) Die Dynamik des Festkörpers, d. h. Energien und gegebenenfalls Dispersionsrelationen möglicher atomarer Bewegungszustände (lokalisierte Schwingungen einzelner Atome oder 70 KAPITEL 2. STRUKTURBESTIMMUNG Atomgruppen, kollektive Schwingungen der Gitteratome). Diese Information erhalten wir aus der inelastischen Streuung. Statik Die an den als unbeweglich vorausgesetzten Atomen des Festkörpers elastisch gestreuten Wellen überlagern sich zu strukturspezifischen Interferenzmustern. Die Amplitude F (Q) der von einem Atom-Ensemble mit N Atomen gestreuten Welle erhält man durch phasenrichtige Aufsummation aller Einzelamplituden a der von den Atomen am Ort r n elastisch gestreuten Wellen. 2 N X fn (Q) e iQrn I (Q) ∼ |F (Q)|2 = (2.46) n=1 Die Streuintensität der elastischen Streuung hängt von der Differenz der Wellenvektoren k und k0 von einfallender und gestreuter Welle, dem Streuvektor Q, ab (Abb. 2.5). Abbildung 2.15: Streuvektor im reziproken Raum. ϑ 4π sin (2.47) λ 2 Durch Wahl von Wellenlänge λ, d.h. Monochromatoreinstellung und Streuwinkel ϑ, d.h. Detektorstellung können mit allen drei Sonden“ die interessierenden Q-Vektoren eingestellt ” und die Streuintensität für diese Vektoren gemessen werden (d.h. Wirkungsquerschnitt als Funktion von Q). Bei der Strukturanalyse muss dann rückwärts versucht werden, die atomare Anordnung zu entschlüsseln. In Bezug auf Informationsgehalt sind die jeweiligen Streumuster jedoch insofern etwas unterschiedlich, als die atomaren Streulängen Q für die drei Sonden stark unterschiedlich sind. Wie Abb. 2.16 zeigt, konnte beispielsweise mit Röntgenstrahlen der (111)-Reflex von KCl wegen fK ≈ fCl nicht gemessen werden, während der im Vergleichsspektrum für KBr (gleicher Gitteraufbau) wegen fK ≈ 0.5fCl gut aufgelöst werden konnte. Im Gegensatz dazu unterscheiden sich die Neutronen-Streulängen auch von K und Cl stark (um einen Faktor 5), so dass mit der Neutronensonde“ auch der mit Röntgenstreuung schlecht messbare ” KCl (111)-Reflex gut detektierbar ist. Auch auf Grund des verschieden starken Abfalls der atomaren Streulängen mit wachsendem Streuvektor kann eine bestimmte Sonde zur Lösung bestimmter Fragestellungen besser als eine andere geeignet sein. Auf einen weiteren Unterschied, der sich aus der verschieden starken Absorption von Röntgenstrahlen, Neutronen und Elektronen ergibt, wird in dieser Vorlesung nicht eingegangen. Q = k − k0 = 2.5. EXPERIMENTELLE GRUNDBEGRIFFE 71 Abbildung 2.16: Vergleich der Röntgenspektren von KCl und KBr. Dynamik Bei der inelastischen Streuung tauschen die gestreuten Röntgenstrahlen, Neutronen oder Elektronen Impuls und Energie mit möglichen Bewegungszuständen des Festkörpers aus (Energiegewinn- oder Energieverluststreuung!). Bei einem durch die Detektorstellung festgelegten Streuwinkel können nur solche Bewegungszustände angeregt oder ”vernichtet”werden, für die sowohl Energie - als auch Impulserhaltungssatz erfüllt ist. Impuls von einlaufender und gestreuter Welle: ~k, ~k0 Impulsübertrag: ~Q = ~k−~k0 (2.48) Bei einem durch die Detektorposition festgelegten Streuwinkel ϑ sind in Abhängigkeit vom Energieübertrag viele Q-Vektoren möglich, vgl. Abb. 2.17. Zusammenhang zwischen Wellenvektor k und Energie E = ~ω |k| = k = |k| = k = 2π λ mv ~ = ωcq f. elektromagnetische Welle = 2mω f. Teilchen ~ (2.49) (c . . . Lichtgeschwindigkeit, m . . . Teilchenmasse, ω . . . Frequenz). Somit ist der Ener- 72 KAPITEL 2. STRUKTURBESTIMMUNG Abbildung 2.17: Schematische Darstellung der elastischen und inelastischen Streuung. gieübertrag: ~ω = E − E 0 = ~c (k − k0 ) el.m. Welle ~2 = 2m k2 −k0 2 Teilchen (2.50) E ist die Energie der einfallenden Welle und E 0 die Energie der gestreuten Welle. Gesucht wird die Wahrscheinlichkeit, dass eine Impulsübertragung ~Q zu einer Energieänderung ~ω in dem betrachteten System führt, d. h. der Wirkungsquerschnitt ( = Streuintensität) mit dem in Abhängigkeit vom Impulsübertrag Energie übertragen wird. Hierzu ist eine Energiemessung der gestreuten Strahlung notwendig, um die übertragene oder absorbierte Energie bestimmen zu können. Wellenlängen und Energien für Röntgenstrahlen, Elektronen und Neutronen (Abb. 2.18) Energieüberträge sind gut messbar für Neutronen (großes ∆E/E !!). Hoffnungslos ist die Situation bei Röntgenstrahlen, wo für meV-Auflösung ein ∆E/E = 10−7 gemessen werden müsste, was jedenfalls zur Zeit noch nicht möglich ist (Auflösung derzeit ∆E/E = 10−4 − −10−5 ). Die Untersuchung von dynamischen Festkörperphänomenen ist eine Domäne der Neutronenstreuung! 2.5.1 Röntgenbeugung Apparaturen zur Beugung von Röntgenstrahlen an Kristallen bestehen meist aus folgenden Elementen: • Quelle 2.5. EXPERIMENTELLE GRUNDBEGRIFFE 73 Abbildung 2.18: Wellenlänge und Energie für Röntgenstrahlen, Elektronen und Neutronen. • (Monochromator) • Streuapparatur • Detektor Röntgenstrahlquellen Abbildung 2.19: Querschnitt durch eine Röntgenröhre für Beugungsexperimente und typische Bremsstrahlungsspektren in Abhängigkeit der Beschleunigungsspannung. 74 KAPITEL 2. STRUKTURBESTIMMUNG Energieverlust der beschleunigten Elektronen (typische Spannungen bei einigen 10 kV) im Anodenmaterial führt u.a. zu: (a) Bremsstrahlung (kontinuierliches Spektrum) (b) charakteristischer Strahlung (Linienspektrum) Bremsstrahlung entsteht durch die Abbremsung der Elektronen durch Wechselwirkung mit den elektrischen Feldern der Targetatome. Die Intensitätsverteilung von einem dicken Target in Abhängigkeit der Beschleunigungsspannung U ist in Abb. 2.19 dargestellt. Das kurzwellige Ende des Bremsstrahlungsspektrums ist gegeben durch: λmin = c vmax = ch 1.234 = (λ in nm, U in kV) . eU U (2.51) Charakteristische Strahlung wird emittiert, wenn Elektronen aus höheren Schalen in tiefere Schalen fallen, aus denen vorher Elektronen durch den Elektronenbeschuss aus der Kathode entfernt wurden. Die Wellenlängen der kurzwelligsten charakteristischen Strahlung der in der Röntgenbeugung verwendeten Anoden liegen etwa zwischen 0,055 nm (Ag) und 0,23 nm (Cr). Am häufigsten wird Cu-Strahlung eingesetzt (0,15 nm). Die charakteristischen Linien können Übergängen zwischen verschiedenen Schalen zugeordnet werden (Abb. 2.20). Abbildung 2.20: Energieniveaudiagramm zur charakteristischen Strahlung und Spektrum der charakteristischen Cu-Strahlung. Eine zweite Art der Erzeugung von Röntgenstrahlung erfolgt durch Synchrotronstrahlung. Dies ist eine magnetische“ Bremsstrahlung, die Beschleunigung der Elektronen er” folgt hier durch das Magnetfeld, das sie auf eine Kreisbahn zwingt und nicht, wie bei der Röntgenröhre, durch Streuung an Atomen, weil velektronen ≈ c und daher die Abstrahlung 2.5. EXPERIMENTELLE GRUNDBEGRIFFE 75 praktisch tangential zur Kreisbahn erfolgt (typischer Radius R einige 10 m, Elektronenenergien E im GeV Bereich). Abbildung 2.21: Erzeugung von Röntgenstrahlung durch Synchrotronstrahlung. Streuapparaturen, Abb. 2.22 Abbildung 2.22: Schematische Darstellung einer Streuapparatur. Geometrische Darstellung der Laue- bzw. Bragg-Bedingung k − k0 = Ghkl wobei |k| = 2π 2π und |Ghkl | = λ dhkl (2.52) Um die Beugungsbedingung zu erfüllen, ist es bei Experimenten erforderlich, eine der drei Größen Θ, λ oder G kontinuierlich verändern zu können. Daraus ergeben sich die drei Hauptmethoden der Röntgenbeugung: 1. Diffraktometeranordnung (Bragg): gestattet Änderung von Θ bei festem λ und G 2. Laue Methode: durch Verwendung weißer“ Röntgenstrahlung wird dem Kristall ein ” ganzer Wellenlängenbereich angeboten 76 KAPITEL 2. STRUKTURBESTIMMUNG 3. Pulvermethode (Debye-Scherrer): der monochromatische Röntgenstrahl trifft auf eine große Zahl kleiner Kristallite, von denen einige so orientiert sein werden, dass sie die Beugungsbedingung erfüllen. Röntgendiffraktometer, vgl. Abb. 2.23, (Bragg 1913) Hier wird die Beugungsbedingung durch Variation der Richtung zwischen einfallendem und gebeugtem Strahl erfüllt. Der Θ−2Θ-“scan” stellt dabei sicher, dass der Detektor immer im gleichen Winkel zur Probe steht wie der einfallende Strahl. Dadurch ist die Diffraktome- Abbildung 2.23: Röntgendiffraktometer teranordnung für Beugungsintensitätsmessungen mit elektronischen Zählern besonders geeignet und findet in zunehmendem Maße Verwendung. Außerdem ist sie relativ intensitätsstark, obwohl sie bei ebenem Kristall nur “parafokussierend” (siehe Abb. 2.23) ist. Wenn nämlich ein schwach divergenter Röntgenstrahl mit einer gewissen spektralen Breite verwendet wird, kommt es ebenfalls zu einem Intensitätsgewinn, da kleine Verdrehungen der Probe bewirken, dass sie die verschiedenen Wellenlängenkomponenten des Strahls zum selben Punkt des Fokussierungskreises beugt (“reflektiert”). Die Hauptanwendung eines Diffraktometers liegt in der Strukturanalyse. Aus den gemessenen Beugungsrichtungen und -intensitäten kann darauf geschlossen werden, welche Atome sich auf welchen Plätzen einer Substanz befinden. Laue-Methode, vgl. Abb. 2.24: λ-Bereich gegeben durch λmin (bestimmt durch Röhrenspannung) und λmax (bestimmt durch Absorption im Strahlengang, ≈ 0.2 nm). Eine Hauptanwendung der Laue-Methode ist die Orientierungsbestimmung von Einkristallen bzw. die Einjustierung einer bestimmten Kristallachse parallel zu einer vorgegebenen Richtung. Der Kristall ist dabei zweckmäßigerweise auf einem Goniometer montiert. Pulvermethode, vgl. Abb. 2.25, (Debye-Scherrer 1916) Die Wellenlänge wird so gewählt, dass möglichst viele Reflexe auf dem Filmstreifen verteilt sind (wenn λ zu klein: alle Reflexe bei Θ = 0, wenn λ zu groß: nur sehr wenige Reflexe). 2.5. EXPERIMENTELLE GRUNDBEGRIFFE 77 Abbildung 2.24: Laue-Methode Abbildung 2.25: Debye-Scherrer-Methode Wenn sehr nahe benachbarte Linien noch aufgelöst werden müssen oder wenn die Linienlagen sehr genau bestimmt werden müssen (z.B. bei Präzisionsgitterparametermessungen), müssen Kristallmonochromatoren verwendet werden. 78 KAPITEL 2. STRUKTURBESTIMMUNG Aus den Beugungswinkeln der verschiedenen Debye-Scherrer-Linien kann man die Netzebenenabstände der entsprechenden Gitterebenen bestimmen und diese zusammen mit den Intensitäten der Linien benützen, um auf die Kristallstruktur der Probe zu schließen. In der Praxis geschieht dies durch Vergleich des Beugungsbildes mit dem ”X-ray Diffraction Data Index”, in dem für viele tausend Elemente und Verbindungen die Bragg-Winkel und die relative Intensität aller wichtigen Debye-Scherrer Linien aufgelistet sind (ASTM-Kartei). Die zweite Hauptanwendung der Pulvermethode liegt in der Gitterparameterbestimmung, insbesondere in der Ausmessung von kleinen Gitterparameteränderungen bei verschiedenen Behandlungen des Materials (Legieren, Bestrahlung, Temperatur- und Druckänderungen usw.). Präzisionsgitterparametermessungen wird man immer bei großen Θ (nahe π/2) vornehmen, da dort der Fehler in d bei vorgegebener Unsicherheit ∆Θ in der Winkelauflösung sehr klein wird. ∆d/d = 10−4 ist leicht erreichbar, mit einigem Aufwand 10−5 , mit sehr großem Aufwand bis 10−6 . 2.5.2 Elektronenbeugung Das Transmissions-Elektronenmikroskop (TEM) ist zu einem wichtigen Forschungsinstrument in der Festkörper- und Metallphysik geworden. Der Grund liegt in der Möglichkeit, gleichzeitig Abbildungs- und Beugungsmethoden anwenden zu können; sowie in der starken Wechselwirkung zwischen Elektronen und Materie, die auf kurze Belichtungszeiten führt. Die Wellennatur der Elektronen bestimmt (wie im optischen Fall) die Abbildungs- und Beugungseigenschaften des TEMs. λ= h h 2m0 eU 1 + eU 2m0 c2 i1/2 (2.53) Die extrem kleinen Wellenlängen λ = 0,0037 nm der Elektronenstrahlen führen zu kleinen Braggwinkeln von Θ ≈ 0.5 bis 1◦ bei Netzebenenabständen von 0,1 nm. Die Streuung erfolgt am Atomkern. Die Intensität der Beugungsreflexe ist ca. 106 -mal stärker als im Fall von Röntgenstrahlen. Die Eindringtiefe von 100 keV Elektronen ist < 1 µm. Das erfasste ProbenVolumen ist in der Größenordnung von 10−9 mm3 (ca. 1 mm3 im Röntgenfall und einige cm3 bei Neutronenstreuung). Bei Elektronenbeugung reflektieren nur Netzebenen, die parallel zu dem Primärstrahl sind (Abb. 2.26). Das Beugungsbild besteht aus den Schnittpunkten der Ewald-Kugel (die hier zu einer Ebene entartet ist) mit dem 3-dimensionalen reziproken Gitter. Das 2-dimensionale Beugungsmuster entspricht dieser Schnittebene. Im Falle kleiner Beugungswinkel (Elektronenbeugung) gilt (Abb. 2.27): λ · L = RH · dH (2.54) R ist der Abstand des Beugungspunktes vom Mittelpunkt im Beugungsbild und L ist die Kameralänge des Mikroskopes. λL wird als Beugungslänge bezeichnet. Die Indizierung eines Beugungsdiagrammes ist einfach. Die Basisvektoren R1, R2 definieren hier den 2-dimensionalen Gitterschnitt. Im Wesentlichen gibt es 2 Typen von Beugungsdiagrammen (Abb. 2.28): 2.5. EXPERIMENTELLE GRUNDBEGRIFFE 79 Abbildung 2.26: Elektronenbeugung Abbildung 2.27: Ableitung der Grundformel der Elektronenbeugung. • Einkristall-Diagramme • Polykristall-Diagramme Das gesamte Beugungsbild entsteht durch Linearkombinationen von 2 Basisvektoren R1, R2. Trifft der Elektronenstrahl auf viele Körner gleichzeitig, so entstehen Ringe im Beugungsbild, die “Debye-Scherrer-Ringe”. Die Ewald-Kugel kann durch mehrere Schichten des reziproken Gitters gehen, dabei wird die 0., 1., 2., “Laue-Zone” abgebildet (Abb. 2.30). Bei Indizierung von Einkristall-Beugungsdiagrammen gilt die Regel der Vektoraddition (Abb. 2.29): R3 = R1 +R2 (2.55) 80 KAPITEL 2. STRUKTURBESTIMMUNG Abbildung 2.28: Elektronenbeugung an Ein- und Polykristallen. Abbildung 2.29: Beispiel für die Regel der Vektoraddition für die vom Nullpunkt (000) zu den Beugungspunkten (hkl) führenden Vektoren Rn . 2.5. EXPERIMENTELLE GRUNDBEGRIFFE 81 Abbildung 2.30: Einfluss der Form der Kristallinität auf das Elektronenbeugungsbild 2.5.3 Neutronenbeugung Thermische Neutronen haben bekanntlich gleichzeitig Wellenlängen und Energien, die vergleichbar sind zu den interatomaren Abständen und zu den kollektiven Anregungen in kondensierter Materie. Somit können Neutronen direkte Informationen über die Streufunktion S(Q,ω) einer Probe liefern. Zweiachsenspektrometer Die Zielsetzung für ein Zweiachsenspektrometer ist die gleiche wie bei einem Röntgendiffraktometer, nämlich die Bestimmung von Strukturen und damit die Messung elastischer, kohärenter Streuung. Abb. 2.31 zeigt den prinzipiellen Aufbau einer derartigen Apparatur. Aus dem ”weißen”, isotropen Neutronenspektrum des Moderators wählt das Strahlrohr eine Richtung aus. Aus diesem Strahl wird per Bragg-Reflexion am Monochromatorkristall ein schmales Wellenlängenband herausreflektiert. Ein zweiter Kollimator verschärft die Richtungsauswahl der auf die Probe treffenden Neutronen und ein Monitor dient als Maß für ihre Anzahl, indem er einen Bruchteil von ihnen registriert. Ein dritter Kollimator wählt für die gestreuten Neutronen eine bestimmte Richtung aus und ein Detektor weist diese Neutronen nach. Der Detektor des Zweiachsenspektrometers sieht“ also alle k-Neutronen“ , die unter ” ” dem Winkel 2Θs gestreut werden. Dreiachsenspektrometer Bei Messproblemen, die sich nicht auf die punktförmige Streufunktion der elastischen, 82 KAPITEL 2. STRUKTURBESTIMMUNG Abbildung 2.31: Zweiachsenspektrometer. kohärenten Streuung beziehen, muss man auf der Kurve ω(Q, ki , Θs ) ein bestimmtes Gebiet auswählen, indem man die gestreuten Neutronen noch nach |k0 | analysiert . Eine Möglichkeit ist die Selektion durch einen Analysatorkristall analog zum Monochromatorkristall. Ein derartiges Spektrometer ist identisch mit dem schon beschriebenen Zweiachsenspektrometer bis auf den Zusatz einer dritten Achse, die den Analysatorkristall trägt. Der prinzipielle Aufbau ist in Abb. 2.32 gezeigt. Die Freiheitsgrade dieses Spektrometers sind die Winkel ΘM , ΘA , Θs , ψ. ΘM und ΘA bestimmen die Längen von k und k0 (bei gegebenem Kristall und Reflex); 2Θs ist der Winkel zwischen den beiden Vektoren, womit das Streudreieck festgelegt ist. Die Probenorientierung relativ zum Vektor k wird durch den Winkel ψ festgelegt. Es gibt eine unendliche Vielfalt von k, k0 -Paaren, um einen Punkt im Q, ω-Raum festzulegen. Deshalb wird den vier Freiheitsgraden ΘM , ΘA , Θs , ψ eine Nebenbedingung auferlegt (ΘM = konstant oder ΘA = konstant). Ein Dreiachsenspektrometer kann im Prinzip jeden “scan“ fahren. Häufige “scans“ sind der ,,constant-Q-scan“ (parallel zur ω-Achse) und der ,,const-E-scan“ (i.a. parallel zu einem Ghkl ). Flugzeitspektrometer Während das Dreiachsenspektrometer k0 über einen Analysatorkristall bestimmt, geschieht dies beim Flugzeitspektrometer über die Messung der Flugzeit des Neutrons. Um die Flugzeit bestimmen zu können, muss ein ,,Startschuss“ gegeben werden; d.h. der Neutronenstrahl muss unterbrochen werden. Dies geschieht mittels eines ,,choppers“. Abb. 2.33 zeigt den prinzipiellen Aufbau eines derartigen Spektrometers. Der zeitliche Abstand der Neutronenpulse hinter dem ,,chopper“ muss so bemessen sein, dass sich die k0 -Spektren der einzelnen Pulse nicht überlappen. Dies bedingt eine Strahlausnutzung von nur < 1% bei kontinuierlichen Neutronenquellen. Diese schlechte Strahlausnut- 2.5. EXPERIMENTELLE GRUNDBEGRIFFE 83 Abbildung 2.32: Neutronen Drei-Achsen-Spektrometer. Abbildung 2.33: Neutronen Flugzeitspektrometer. zung wird z.T. kompensiert durch das Aufstellen vieler Detektoren unter vielen Streuwinkeln Θs . Jeder Detektor tastet dann den Q, ω-Raum entlang einer Kurve ab. Neben den genannten Neutronenspektrometern gibt es auch noch Spektrometer mit hoher Energieauflösung, wie das Rückstreuspektrometer und das Spin-Echo Spektrometer. 84 KAPITEL 2. STRUKTURBESTIMMUNG Kapitel 3 Mehrstoffsysteme 3.1 Einleitung Materialien, die mehr als eine Atomsorte enthalten, werden als Mehrstoffsysteme bezeichnet. Diese sind aus technologischen Anwendungen nicht wegzudenken. Genaugenommen gibt es kaum ein technisches Material, welches in seiner elementaren Form zum Einsatz kommt. Dies ist einsichtig bei metallischen Legierungen wie z. B. Bronze oder Messing, die zu den ersten vom Menschen verwendeten metallischen Mehrstoffsystemen zählen, oder für moderne Stähle, die ein komplexes, wohldefiniertes System aus Eisen und verschiedenen Zusatzstoffen (Ni, Mn, Co, C, O) darstellen. Aber selbst Halbleiter, bei denen auf den ersten Blick die elementare Reinheit und die hohe kristalline Ordnung wesentliche Anwendungskriterien darstellen, erlangen ihre technologisch relevanten Eigenschaften erst durch den Zusatz von Dotierungsstoffen, die die elektronischen Eigenschaften in hohem (und kontrollierbarem) Ausmaß beeinflussen. Keramiken und Polymere sind, als oxidische und organische Verbindungen, bereits auf der molekularen Ebene Mehrstoffsysteme. Von ausschlaggebender Bedeutung für das Verständnis von Mehrstoffsystemen ist daher, in welcher Art und Weise sich ein Ensemble von N Atomen mehrerer Elemente anordnen wird. Wird die Anzahl der Elemente P mit E bezeichnet und die Anzahl der Atome des i-ten Elements mit ni , so muss gelten E Als Konzentration des i-ten Elements, ci , i=1 ni = N . P wird das Verhältnis ni /N bezeichnet und es gilt E i=1 ci = 1. Leider reicht die Kenntnis der Atomzahlen bzw. der Konzentrationen der Einzelelemente nicht aus, um Aussagen über die Atomverteilung im resultierenden Mehrstoffsystem zu treffen, wie ein einfaches Beispiel in Abbildung 3.1 zeigt. Für alle in Abbildung 3.1 dargestellten atomaren Anordnungen gilt zwar N = 100, E = 2, n1 = n2 = 50, d. h. c1 = c2 = 0.5, die Unterschiede zwischen den gezeigten Systemen sind aber deutlich sichtbar. Alle in Abb. 3.1 gezeigten Fälle sind in der Materialwissenschaft wohl bekannt. Abb. 3.1(a) ist der typische Fall einer sogenannten Substitutionslegierung, Abb. 3.1(b) beschreibt ein System, in dem sich die einzelnen Atomsorten bevorzugt in einer Ebene anordnen, wie es z. B. (wenn auch in einer komplizierteren Struktur) bei Hochtemperatursupraleitern der Fall ist. Abb. 3.1(c) ist ein typisches Beispiel für die Bildung von Ausscheidungen, wie sie z. B. bei Stählen beobachtet werden und Abb. 3.1(d) schließlich kann als Beispiel für die vollkommene 85 86 KAPITEL 3. MEHRSTOFFSYSTEME Abbildung 3.1: Unterschiedliche atomare Anordnungen für ein Zweistoffsystem (c1 = c2 = 0, 5): (a) zufällige Atompositionen (b) regelmäßige Atompositionen (c) Ausscheidungsbildung (d) vollkommene Entmischung und Ausbildung einer Grenzfläche Entmischung zweier Materialien unter Ausbildung einer wohldefinierten Grenzfläche dienen. Die Details der atomaren Nah- und Fernordnung im thermodynamischen Gleichgewicht werden einerseits durch die interatomaren Wechselwirkungspotentiale bestimmt, andererseits aber auch durch makroskopische Parameter wie Temperatur, Druck oder die Konzentrationen der einzelnen Komponenten. Während die Ableitung der atomaren Wechselwirkungspotentiale im Wesentlichen auf der Lösung der Schrödingergleichung beruht, so ist die Abhängigkeit von den makroskopischen Parametern durch thermodynamische Potentiale, insbesondere die Gibbs’sche freie Energie oder die freie Enthalpie gegeben. Die Abhängigkeit der Systemkonfiguration von den äußeren Parametern wird als Phasendiagramm bezeichnet. Auf die Ableitung dieser Phasendiagramme aus den entsprechenden thermodynamischen Potentialen soll im Folgenden näher eingegangen werden. 3.2. THERMODYNAMISCHE GRUNDLAGEN 3.2 3.2.1 87 Thermodynamische Grundlagen Der 1. Hauptsatz der Thermodynamik Als Ausgangspunkt betrachtet man die innere Energie eines Teilchensystems. “Innere” heißt, dass man nur die dem System innewohnenden wichtigen Energiebeiträge mitnimmt, die zum Teil schon durch die Wahl eines inneren“ Koordinatensystems bestimmt sind. Wenn wir z.B. ” einen Si-Kristall betrachten, der auf einem Tisch liegt und den wir vielleicht erwärmen oder abkühlen und evtl. noch irgendwelchen Drücken aussetzen wollen, interessiert uns nicht die kinetische Energie, die im Kristall steckt, weil sich die Erde um die Sonne bewegt usw.; diese Beiträge sind auch automatisch eliminiert, wenn wir unser Koordinatensystem am Kristall (oder, in dem Beispiel, am Tisch) festmachen“. In diesem Beispiel interessiert aber auch ” nicht unbedingt die potentielle Energie des Si-Kristalls im Schwerefeld der Erde, weil sie im Vergleich zur kinetischen und elektrostatischen Energie der Atome klein ist und sich vor allem bei geplanten Manipulationen nicht ändert. Von Bedeutung sind nur Energiebeiträge, auf die man Einfluss nehmen kann, die sich also ändern können; z.B. indem man dem System Wärme zuführt. Damit fallen (fast immer) auch die Energien der inneren Elektronen weg; denn die können wir nur beeinflussen, wenn wir (per Kernspaltung) die Atome ändern. Da bei einem ruhenden Stück Si auch keine chemischen Reaktionen stattfinden (im wörtlichen oder im erweiterten Sinn), können wir die Energien der Elektronen auch weitgehend ignorieren. Was für den Si-Kristall (oder jeden anderen festen Körper) bleibt, ist also nur noch die kinetische und potentielle Energie der um ihre Gleichgewichtslage im Gitter schwingenden Atome. Wenn wir ein Gas betrachten, ist es nur die kinetische Energie der im vorgegebenen Volumen sich bewegenden Atome und Moleküle. Bei Molekülen muss man evtl. auch noch die Energie mitbetrachten, die in Rotationen und Schwingungen steckt. Man betrachtet also, was geschieht, wenn man einem solchen System Energie in Form von Wärme zuführt. Abbildung 3.2: Energiemodell für Festkörper und Gase 88 KAPITEL 3. MEHRSTOFFSYSTEME • Festkörper Die Atome schwingen in ihrem Potentialtopf (symbolisiert durch Federn) um die Gleichgewichtslage (angedeutet durch Doppelpfeile). Die Abbildung ist eine Momentaufnahme mit ganz kurzer Belichtungszeit. Wenige Picosekunden später sehen die Doppelpfeile überall anders aus; die in der Bewegung steckende innere Energie (= Summe aus der mittleren kinetischen und potentiellen Energie der Schwingungen) bleibt aber konstant. Temperaturerhöhung führt zur Erhöhung der inneren Energie durch: Erhöhung der mittleren kinetischen Energie der Schwingung und Erhöhung der mittleren potentiellen Energie durch Abweichungen von der Ruhelage im Potentialtopf des Atoms in seiner Bindungsumgebung. Da die potentielle Energie und die Schwingungsenergie im Prinzip unabhängig voneinander sind, hat ein Atom im Kristall 6 Freiheitsgrade um Energie aufzunehmen: 3 für potentielle Energie und 3 für kinetische Energie – je ein Freiheitsgrad pro Raumrichtung. • Gase Die Atome (oder auch Moleküle) fliegen mit konst. Geschwindigkeit (angedeutet durch braune Pfeile) durch den verfügbaren Raum. Die Abbildung ist eine Momentaufnahme mit ganz kurzer Belichtungszeit. Wenige Nanosekunden später sehen die Pfeile überall anders aus, da sich durch Stöße die Vektoren ständig ändern. Die in der Bewegung steckende innere Energie (= Summe der kinetischen Energie der Teilchen) bleibt aber konstant. Bei Temperaturerhöhung: Ausschließliche Erhöhung der kinetischen Energie der Gasteilchen (mit möglichen Energieanteilen in Translation, Rotation und Schwingungen). Ein 1-atomiges Gas hat 3 Freiheitsgrade, es kann Energie nur durch Bewegung in jede der drei Raumrichtungen aufnehmen. Bei einem 2-atomigen Gas wird es komplizierter: Zu den 3 Freiheitsgraden der Translation kommen im Prinzip noch 3 Freiheitsgrade der Rotation (es kann um zwei Achsen senkrecht zur Bindungsrichtung und um die Bindungsachse rotieren) und Freiheitsgrade möglicher Schwingungen. Die Temperatur ist ein Maß für die dem System inne wohnende innere Energie. Der quantitative Zusammenhang ist durch eine einfache Proportionalität gegeben: die Boltzmannkonstante kB . Wir müssen aber beachten, dass es je nach System unterschiedlich viele Möglichkeiten gibt Energie aufzunehmen; die Zahl der unabhängigen Möglichkeiten heißen die Freiheitsgrade f des Systems. Aus der statistischen Thermodynamik ergibt sich ein einfacher Zusammenhang zwischen der Temperatur T und der Energie E, es gilt: E = (1/2)f kB T, (3.1) d.h. 1/2 · kB T pro Freiheitsgrad und Teilchen. Die Energie E ist dabei die innere Energie. Man kürzt sie als spezielle Energie mit U ab. Diese simple Beziehung ist zwar (noch) nicht der 3.2. THERMODYNAMISCHE GRUNDLAGEN 89 erste Hauptsatz, enthält aber seinen Kernpunkt, nämlich den Verbleib der in einen Körper hineingesteckten Wärmeenergie. Nicht alle möglichen Freiheitsgrade werden aber in realen Systemen beobachtet. Dies liegt darin, dass Schwingungen, z.B. gegeneinander in 2-atomigen Molekülen klassisch mit beliebig kleiner Amplitude stattfinden könnten; quantenmechanisch ist aber die Energie gequantelt. Bei kleinen Temperaturen reicht die thermische Energie nicht aus um die Schwingung anzuregen, der Freiheitsgrad ist eingefroren“. ” Wie beobachtet man die Zahl der Freiheitsgrade experimentell? Um das zu verstehen formuliert man zunächst den ersten Hauptsatz der Thermodynamik in der üblichen mathematischen Form (3.2) dU = dQ − dW, mit dU als Änderung der inneren Energie U des betrachteten Systems, dQ als zugeführte (differentiell kleine) Wärmeenergie und dW als nach außen geleistete (differentiell kleine) Arbeit. Das ist der Energieerhaltungssatz unter Einschluss der Wärmeenergie. In Worten besagt Gleichung 3.2: Die (differentielle) Änderung der im System vorhandenen inneren Energie ist gleich der (differentiellen) zugeführten Wärmeenergie minus der nach außen geleisteten (differentiellen) Arbeit. Die nach außen geleistete Arbeit resultiert zum Beispiel aus einer Volumenänderung – ein Kolben bewegt sich in einem Zylinder, z.B. in Wärmekraftmaschinen, Benzin- oder Dieselmotoren. Diese Formulierung war eine monumentale Leistung und gelang Robert Mayer und J. P. Joule (1842). Einfaches Beispiel: Einem (perfekten) Kristall wird Wärme (dQ) zugeführt. Die nach außen geleistete Arbeit ist Kraft mal Weg, oder umgeschrieben, Druck p mal Volumen V . Da wir unseren Kristall nur rumliegen“ lassen, ändert sich der Druck nicht, der Kristall wird ” sich aber etwas ausdehnen, d.h. das Volumen ändert sich. In differentieller Form erhalten wir für die geleistete Arbeit dW (3.3) dW = p dV. Dass hier wirklich Arbeit geleistet wird, kann man sofort sehen, wenn man gedanklich versucht den Kristall an der Volumenausdehnung zu hindern. Man müsste dazu beachtliche Kräfte aufwenden und den Kristall dann unter sehr hohem Druck halten. Oder, andersherum, der sich ausdehnende Kristall kann eine große Kraft auf einem sehr kleinen Weg wirken lassen, d.h. Arbeit leisten. Noch einfacher wird es, wenn wir statt des Kristalls ein Gas nehmen: Alle Wärmekraftmaschinen – von Dampfmaschine über den Ottomoter zum Düsentriebwerk – beziehen die nach außen geleistete Arbeit aus der Ausdehnung von Gasen bei Erwärmung. Lässt man die Ausdehnung nicht zu, so wächst der Druck. Dabei wird aber keine Arbeit nach außen geleistet. In diesem Fall gilt dW = 0 und der erste Hauptsatz reduziert sich für den Fall konstanten Volumens auf dU|V =const = dQ (3.4) Die gesamte zugeführte Wärme geht in die Erhöhung (oder, bei Vorzeichenwechsel, Erniedrigung) der inneren Energie. Für unseren Kristall jedoch, den wir i.A. bei konstantem Druck 90 KAPITEL 3. MEHRSTOFFSYSTEME belassen und dafür eine Volumenausdehnung akzeptieren, schreibt sich der erste Hauptsatz wie folgt: dU|p=const = dQ − p dV. (3.5) Die Enthalpie als neues Energiemaß Bei festen Körpern ist konstanter Druck (im Gegensatz zu Gasen) die weitaus überwiegende Erscheinungsform. Um in vielen Beziehungen den Term −pdV nicht immer mitschleppen zu müssen, führt man eine neue Größe ein, die unter diesen Bedingungen anstelle der (inneren) Energie verwendet wird, die Enthalpie H. Die Enthalpie ist eine Energieform, so wie die kinetische, potentielle oder innere Energie. Sie hängt mit der inneren Energie über eine einfache Gleichung zusammen: H = U + pV. (3.6) Formuliert man den ersten Hauptsatz nun mit der Enthalpie, bildet man zuerst dH; das ist in diesem Fall das totale Differential der Enthalpie H. Man erhält dH = dU + p dV + V dp. (3.7) Mit V dp = 0, weil wir ja konstanten Druck annehmen, und dem ersten Hauptsatz ( dU = dQ − p dV ) ergibt sich dann dH = dQ (3.8) Die gesamte zugeführte Wärme geht jetzt also in die Erhöhung (oder, bei Vorzeichenwechsel, Erniedrigung) der (inneren) Enthalpie des Materials. Wir können die Enthalpie also als die um die Wärmeausdehnung korrigierte innere Energie betrachten. Das führt sofort auf eine wichtige Konsequenz: Da die Wärmeausdehnung bei Festkörpern i.A. klein ist, sind Enthalpie und (innere) Energie dann fast identisch. Man spricht deshalb oft von Energie“, wenn man eigentlich Enthalpie“ meint und macht dabei auch keinen ” ” großen Fehler. Für Gase gilt dies aber nicht! Aus dem 1. Hauptsatz ergeben sich sofort die Wärmekapazitäten C aller Materialien. Sie sind definiert als der (Differential)quotient aus der (differentiellen) Zunahme der Wärmenergie und der (differentiellen) Änderung der Temperatur, in anderen Worten C≡ dQ dT (3.9) für den jeweiligen Körper mit der Masse M . Die Wärmekapazität (mit Index V oder p für die jeweils konstant gehaltene Zustandsvariable) für einen Körper der Masse M sind dann unter Verwendung des 1. Hauptsatzes und der inneren Energie U bzw. Enthalpie H gegeben durch dU CV = (3.10) dT und dH Cp = . (3.11) dT 3.2. THERMODYNAMISCHE GRUNDLAGEN 91 Die innere Energie für einen Kristall folgt aus UAtom = (1/2)f kB T UKristall = N (1/2)f kB T, mit N = Zahl der Atome im Kristall. Ist NA die Avogadrokonstante = Zahl der Teilchen (= Atome oder Moleküle) in einem Mol einer Substanz, definiert man die sog. Gaskonstante R = kB NA = 8.314 J/(mol·K). Damit ergibt sich für die Wärmekapazität von 1 Mol eines beliebigen Kristalls, unabhängig von der Temperatur, immer CKrist,mol = Cp = (1/2)6R = 3R. Das ist das lange vor der Rechnung experimentell gefundene Dulong-Petitsche Gesetz. Die simple statistische Behandlung der Wärme liefert die Formel dazu. Sie ist bemerkenswert, sagt sie doch, dass alle Kristalle – ob mit einfachem oder kompliziertem Gitter, ob mit einfacher oder komplizierter Basis, ob mit mit leichten oder schweren Atomen in der Basis – dieselbe spezifische Wärmekapazität haben wenn man sie auf 1 Mol bezieht. Diese Beobachtung gilt für hohe Temperaturen; für tiefe Temperaturen dagegen tritt eine starke Abnahme ein. Der mikroskopische (quantenmechanische) Grund dafür wird im Kapitel über Thermische Eigenschaften näher erläutert. Zusammenfassung: • Der erste Hauptsatz stellt fest, dass nur thermodynamische Prozesse, bei denen die Energie erhalten bleibt, in der Natur vorkommen können. Er verbietet aber beispielsweise nicht, dass aus einem Wärmereservoir (z.B. den Meeren), mechanische Arbeit entnommen werden kann, wobei sich das Reservoir abkühlt. Auch die Umkehrung des Gedankenversuchs zum thermischen Gleichgewicht wäre prinzipiell möglich: Ein lauwarmer Körper wird an einem Ende heiß, am anderen kalt. Mit dem 1. Hauptsatz allein können wir noch keine Gleichgewichte bekommen. Wir brauchen weitere Prinzipien, den 2. Hauptsatz! 3.2.2 Entropie, freie Energie und freie Enthalpie Makrozustände, Wahrscheinlichkeit eines Makrozustandes und Entropie Der erste Hauptsatz verlangt nur, dass die Energie eines Systems ohne Einwirkung von außen konstant bleibt. Er macht aber keine Aussage darüber, welcher von vielen möglichen Zuständen, die alle dieselbe Energie haben, wirklich vorliegt, d.h. welcher Zustand der wahrscheinlichste ist. Ein Zustand des Systems ist eine der möglichen konkreten Ausformungen des Systems, die mit den Randbedingungen verträglich ist. Jeden denkbaren Zustand, der durch dieselben statistischen Werte für das Gesamtsystem beschrieben werden kann – z.B. durch ein und dieselbe innere Energie, Temperatur oder Druck – nennen wir einen Makrozustand. Die beiden linken Makrozustände (Abb. 3.3, links), in der alle vier (oder in einer etwas komplexeren Zeichnung alle ca. 1024 ) Gasmoleküle mit gleicher Geschwindigkeit parallel 92 KAPITEL 3. MEHRSTOFFSYSTEME Abbildung 3.3: Links: Mögliche Makrozustände in einem Gas mit derselben kinetische Energie und damit Temperatur. Rechts: Mögliche Makrozustände in einem zweiatomigen Kristall mit identischen Bindungsenergien. fliegen oder ob nur ein Molekül sich bewegt, können alle dieselbe Energie haben wie der rechte Makrozustand – aber sie sind offenkundig unwahrscheinlich. Der linke Kristall aus zwei Atomsorten ist in perfekter Ordnung. Falls die Bindungskräfte zwischen den beiden Atomsorten – wie vorausgesetzt – gleich groß sind, ist dies sehr unwahrscheinlich. Wahrscheinlich ist offensichtlich der rechte Zustand. Auch wenn man mit einem unwahrscheinlichen Zustand startet, wird nach kurzer Zeit der rechte Zustand vorliegen: Die ungeordnete Bewegung aller Moleküle. Dass aus einem solchen Zustand von selbst einer der ordentlichen linken Zustände entsteht, ist sehr unwahrscheinlich. Wahrscheinlich ist der rechte Zustand der zufälligen Verteilung der Atome. Die eher ungeordneten, chaotischen Zustände sind meist die wahrscheinlicheren – besonders bei höherer Temperatur. Falls die Bindungskräfte aber verschieden sind, kann auch der geordnete Zustand realisiert werden. Um aus vielen denkbaren Makrozuständen den wahrscheinlichsten auswählen zu können, braucht man ein neues Axiom; der 1. Hauptsatz ist dazu offenbar nicht ausreichend. Als Maß für die Wahrscheinlichkeit des Auftretens eines Makrozustandes definieren wir eine neue fundamentale Größe, die Entropie S des Zustands. Der wahrscheinlichste Makrozustand, die Konfiguration, oder schlicht der Zustand, den man tatsächlich findet, ist dann per definitionem derjenige Makrozustand, der die größte Entropie hat, die unter Beachtung der Randbedingungen möglich ist. Der wahrscheinlichste Makrozustand ist, bezogen auf obige Beispiele, auch der ungeordnetste Zustand. Man sieht damit schon, dass die Entropie auch ein Maß für den Ordnungsgrad eines Zustands ist, und postuliert: • Je ungeordneter ein Zustand, desto größer ist seine Entropie. Auch ohne genaue Details der Entropie zu kennen, kann eine erste (qualitative) Fassung des 2. Hauptsatzes angegeben werden: • Im thermodynamischen Gleichgewicht besitzt ein System eine möglichst große Entropie; sowie: Die Entropie eines abgeschlossenen Systems wird nie von alleine kleiner! 3.2. THERMODYNAMISCHE GRUNDLAGEN 93 Der 2. Hauptsatz definiert irreversible Prozesse: Denn ein Prozess, bei dem die Entropie zunimmt, kann offenbar geschehen, der Rückwärtsprozess jedoch nicht (siehe obige Gasbilder). Die Konsequenz daraus ist: Der 2. Hauptsatz definiert eine Richtung der Zeitachse: Auf der Zeitachse kann man sich nur in Richtung höherer Entropie bewegen. Der 2. Hauptsatz ist im übrigen das einzige Naturgesetz oder Axiom, das eine Zeitrichtung kennt. Wenn man bedenkt, wie fundamental es für uns ist, daß die Zeit immer nur in eine Richtung fließt, ist das schon sehr erstaunlich! Der 2. Hauptsatz definiert den Wärmetod“ des Universums: Irgendwann wird universel” les Gleichgewicht im wahrsten Sinne des Wortes, und damit maximale Unordnung, erreicht sein. Nichts wird sich mehr ändern – das Universum hat den Wärmetod erlitten. Man hat also nun eine neue Bedingung, um Gleichgewichte zu bestimmen. Nach wie vor gilt, dass die Energie, also die innere Energie U oder die Enthalpie H, minimal sein sollte. Für viele Massenpunkte – für Materialien – gilt gleichzeitig, dass die Entropie S des Systems maximal sein soll. Das ist eine komplizierte Bedingung, denn eine Verkleinerung von U kann durchaus eine Vergrößerung von S zur Folge haben; man kann also beide Bedingungen nicht unabhängig voneinander erfüllen. Man sucht also zwei neue Funktionen, die Energie bzw. Enthalpie und die Entropie so verknüpfen, dass diese neuen Funktionen für die bestmögliche Kombination von U (bzw. H) und S ein Minimum haben. Diese neuen Funktionen beschreiben dann den Zustand, d.h. den wirklich realisierten Makrozustand aus der Menge der vielen möglichen Makrozustände des Systems; sie sind Zustandsfunktionen. Wir wollen diesen neuen Zustandsfunktionen folgende Namen geben: • Die freie Energie F verknüpft U und S; • die freie Enthalpie G verknüpft H und S. Aus historischen Gründen heißt die freie Energie auch Helmholtz-Energie, nach Hermann von Helmholtz, einem Physiker des 19. Jahrhunderts; die freie Enthalpie heißt auch Gibbssche Energie, nach Gibbs, einem berühmten amerikanischen Physiker. Freie Energie und freie Enthalpie Die Thermodynamik – in der klasssischen phänomenologischen oder in der statistischen Form – lehrt wie man zu sinnvollen Definitionen der freien Energie und Enthalpie kommt. Man kann auch qualitativ überlegen, wie man diese Funktionen sinnvoll definieren kann. Ein erster naheliegender, aber (falscher!) Ansatz wäre z.B.: F = U − S. (3.12) F wird dann, wie gefordert, minimal, falls U möglichst klein und S möglichst groß ist. Natürlicherweise fehlt aber die Temperatur T , da mit fallender Temperatur die Tendenz für Ordnung zunimmt! Es genügt vollständig, sich ein x-beliebiges Material vorzustellen, und zu überlegen, was mit seinem Zustand passiert wenn man die Temperatur ändert; z.B. von hohen Temperaturen herkommend abkühlt. Aus einem ungeordneten Gas wird eine Flüssigkeit, dann ein Festkörper. Eine Flüssigkeit ist aber geordneter als ein Gas; ein (perfekter) Kristall 94 KAPITEL 3. MEHRSTOFFSYSTEME hätte perfekte Ordnung; und selbst ein Realkristall ist ja wohl ein viel geordneteres System von Atomen als ein Gas. Es gilt ganz allgemein: Mit abnehmender Temperatur steigt die Tendenz für Ordnung, mit zunehmender Temperatur steigt die Tendenz für Unordnung; und das muss berücksichtigt werden! Offenbar spielt der Grad an Unordnung, d. h. der Zahlenwert der Entropie, bei tiefen Temperaturen keine so große Rolle mehr, während die Minimierung der Energie bei allen Temperaturen gleich wichtig ist: Heiße und kalte Objekte fallen z.B. immer gleich schnell nach unten“. Wir müssen die Entropie also mit einem Faktor ” gewichten, der mit der Temperatur ansteigt. Am einfachsten ist es, die Temperatur selbst zu nehmen, also T · S statt nur S. Damit kommen wir zur richtigen Definition der freien Energie und Enthalpie: (3.13) F = U − TS und G = H − T S. (3.14) Das sind unsere gesuchten Zustandsfunktionen, aber sie sind mehr als das: Es sind die thermodynamischen Potentiale, die zur Betrachtung des chemischen Gleichgewichts postuliert werden. Damit ergeben sich allgemeine Bedingungen für das thermodynamische Gleichgewicht, die darüber hinaus noch extrem einfach sind. Wir unterscheiden aus Bequemlichkeitsgründen die beiden Fälle mit konstantem Volumen bzw. konstantem Druck. Daraus ergeben sich folgende Aussagen: • Spontane Vorgänge können dann, und nur dann ablaufen, wenn sich bei konstantem Volumen und gegebener Temperatur die freie Energie F verkleinert; bei konstantem Druck und gegebener Temperatur ist es die freie Enthalpie G. Es gilt also für spontane Vorgänge bei konstantem Volumen bzw. Druck: dF ≤ 0 und dG ≤ 0 (3.15) (3.16) Nach Atkins sind das die wichtigsten Gleichungen der (physikalischen) Chemie, und damit sind sie auch für die Materialwissenschaft von überragender Bedeutung. Das thermodynamische Gleichgewicht ist dann erreicht, wenn ein Zustand mit dF = 0 bzw. dG = 0 erreicht ist, und zwar bezüglich aller Variablen des Systems. Wie das “funktioniert” sieht man sofort, wenn man Salz in Wasser betrachtet: Da die Entropie H bei der Auflösung von Kochsalz von den Teilchenzahlen abhängt, z.B. von der Konzentration der Na+ - und Cl− -Ionen (nN a und nCl ), muß für das chemische Gleichgewicht bei konst. Druck gelten: dG = ∂G ∂G ∂G ∂G dnN a + dnCl + dnN aCl + dT + . . . ∂nN a ∂nCl ∂nN aCl ∂T (3.17) Der Term + . . . berücksichtigt, dass G im Prinzip noch von allen möglichen Größen abhängig sein könnte (z.B. elektrische Felder). Man kann aber im Gedankenversuch alle uninteressan” ten“ Variablen (oder “verallgemeinerte Koordinaten”) von G konstant halten, sie tauchen dann in dG nicht mehr auf. 3.2. THERMODYNAMISCHE GRUNDLAGEN 95 dG bezeichnet das totale Differential von G, ∂G/(...) die partielle Ableitung nach einer Variablen. Zwischen totalen Differentialen und Potentialen besteht ein enger mathematischer Zusammenhang. Die partiellen Ableitungen sind messbare Größen und damit könnte man die Gleichgewichtskonzentrationen ausrechnen. Man muss aber berücksichtigen, dass die Variablen nicht unabhängig sind. Geht eine kleine Menge ( dnN a ) der Na-Ionen in Lösung, wird eine gleichgroße Menge ( dnCl = dnN a ) an Cl-Ionen ebenfalls in Lösung gehen müssen. Gleichzeitig wird der NaCl Anteil, d.h. dnN aCl , um den gleichen Betrag kleiner: dnN aCl = − dnN a , da die Teilchenzahlen in einem geschlossenen System nicht unabhängig voneinander sind; es gilt für dieses Beispiel und ganz allgemein: X dni = 0. i Damit gelten als Gleichgewichtsbedingungen für das chemische Gleichgewicht X ∂G dni = 0 ∂ni i und X dni = 0. i Gleichgewicht liegt also dann vor, wenn den Na+ -Ionen egal“ ist, ob sie im Wasser gelöst ” sind oder noch zum Kristall gehören, denn dann werden im Mittel genauso viele Na+ -Ionen in Lösung gehen wie sich wieder abscheiden – die mittlere Zahl der gelösten und im Kristall gebunden Ionen bleibt konstant. In anderen Worten: Fügt man zu einem System, das chemisches Gleichgewicht erreicht hat, bei konst. Volumen bzw. Druck eine infinitesimale Menge Teilchen ( dn) zu, ändert sich seine freie Energie bzw. Enthalpie nicht, denn falls chemisches Gleichgewicht vorliegt gilt X ∂F dni = 0 (3.18) dF = ∂n i i und dG = X ∂G dni = 0. ∂n i i (3.19) Damit kann nun auch das chemische Potential definiert werden: Das chemische Potential eines Teilchens in einem gegebenen System (üblicherweise abgekürzt mit µ) ist die partielle Ableitung der freien Enthalpie (bei konst. Druck) oder der freien Energie (bei konst. Volumen) nach der Teilchenzahl (oder Konzentration) des betrachteten Teilchens µi |p=const = ∂G ∂ni (3.20) 96 KAPITEL 3. MEHRSTOFFSYSTEME und ∂F (3.21) ∂ni Im chemischen Gleichgewicht muss das chemische Potential eines Teilchens überall gleich groß sein (aber nicht unbedingt Null!), und dG ist bezüglich Änderungen der Teilchenzahlen Null. Ein Wort zum Verständnis der Nomenklatur: Man nennt µ chemisches Potential, obwohl chemisches Gleichgewicht nicht ein Minimum der einzelnen chemischen Potentiale bedingt (wie beim mechanischen Gleichgewicht), sondern nur eine Art ”Kräftegleichgewicht”, d.h. µi |V =const = X ∂G X dni = µi dni ∂n i i i (3.22) Das chemische Potential ist damit eine Art Gewichtsfaktor auf der Balkenwaage der freien Enthalpie: Falls die Summe der chemischen Potentiale der Ausgangsstoffe (z.B. NaCl) gleich der Summe der chem. Potentiale der gebildeten Stoffe (Na+ und Cl+ ) ist, ist die Waage“ ” im Gleichgewicht. Ein Begriff wie Teilchenzahlfaktor“ oder Teilchenkraft“ wäre eigent” ” lich besser. Das eigentliche Potential, dessen Minimum Gleichgewicht bedingt, ist die freie Enthalpie bzw. Energie. Diese Zustandsfunktionen heißen deshalb auch thermodynamische Potentiale. H, TS, G Beispiel zur freien Enthalpie: Wir vergleichen die freien Enthalpien eines beliebigen Materials im festen und flüssigen Zustand, wobei wir zunächst annehmen, dass beide Zustände bei allen Temperaturen existieren könnten. Bei konstantem Druck ist die richtiTSflüssig ge Zustandsfunktion die freie Enthalpie Hflüssig H. Die einzige Variable, die wir zulassen, ist die Temperatur T , wir haben alHfest so G = G(T ). In beiden Zuständen oder Phasen ist der Faktor T S = 0 für T = 0. TSfest Da die Flüssigkeit aber der ungeordnetere Zustand ist, hat sie bei jeder endlichen Temperatur eine größere Entropie als der feste Zustand; T S wird von 0 beginnend für die Flüssigkeit also schnelGfest ler anwachsen müssen als für den festen Gflüssig Zustand. Die innere Energie U , oder besser die Enthalpie H, ist im flüssigen Temperatur Zustand ebenfalls immer größer als im festen Zustand (Bindungen sind nicht Abbildung 3.4: Energien der flüssigen und festen abgesättigt; die Teilchen haben kinetiPhase. sche Energie); in beiden Fällen wächst H mit T (T ist ein Maß für die im System steckende Energie!). Man erhält also folgendes prinzipielles Diagramm (die roten Kurven sind die beiden freien Energien Gf est und Gf l . 3.3. KONSTITUTIONSLEHRE 97 Der Einfachheit halber sind alle Kurven als Geraden gezeichnet und Schnittpunkte für H(T ) und T S(T ) eingezeichnet (damit kennt man die Nullpunkte von G(T ); angedeutet mit den gestrichelten Hilfslinien). Das ist aber völlig irrelevant. Die Schlussfolgerung aus diesem Diagramm gilt für alle monoton ansteigenden Funktionen, ob mit oder ohne Schnittpunkte: Es existiert (fast) immer eine Temperatur Tm , die Schmelzpunktstemperatur, oberhalb der die freie Enthalpie Gf l der flüssigen Phase kleiner ist als Gf est der festen Phase. Anders ausgedrückt: Materialien schmelzen bzw. gefrieren, weil in der jeweilig stabilen Phase die freie Enthalpie am kleinsten ist. Das ist eine ziemlich weitreichende Vorhersage, die wir hier zwanglos erhalten! Wir können noch mehr erahnen: Falls die beiden G(T )-Kurven sich so flach oder noch flacher schneiden, als in der Zeichnung angedeutet, wird die quantitative Berechnung von Schmelzpunkten sehr schwierig sein. Denn die Lage des Schnittpunkts zweier sich flach schneidender Geraden wird sehr stark davon abhängen, wie genau man die Geraden kennt. Das ist in der Tat so; Schmelzpunkte ergeben sich aus dem Vorzeichen der Differenz großer Zahlen. Kleinste Änderungen haben große Effekte, und die Berechnung von Schmelzpunkten aus Daten der Atome des Materials ist nach wie vor schwierig und unbefriedigend. Das Beispiel zeigt schon, dass wir das Minimierungsprinzip der freien Energie oder Enthalpie tatsächlich so interpretieren können, dass eine möglichst kleine Energie bei möglichst großer Entropie angestrebt wird. Mit dieser Interpretation liegt man für alle Anwendungen immer richtig. Wir erkennen auch, daß mit den thermodynamischen Potentialen weitreichende allgemeine Schlussfolgerungen möglich sind, ohne dass wir diese Potentiale genau kennen. 3.3 Konstitutionslehre und Phasendiagramme Neben dem Kristallwachstum reiner Substanzen sind in der modernen Metallkunde und Festkörperphysik mehrkomponentige Systeme von übergeordneter Bedeutung. 3.3.1 Die Phasenregel Materie kann in drei Aggregatzuständen (Phasen) vorliegen: fest, flüssig und gasförmig. Generell existiert immer die Phase im thermodynamischen Gleichgewicht, deren freie Enthalpie die geringste ist. In Abbildung 3.5 sind die freien Enthalpien der drei Phasen in Abhängigkeit von der Temperatur für ein beliebiges System aufgetragen. 98 KAPITEL 3. MEHRSTOFFSYSTEME ∆G gasförmig flüssig fest flüssig fest gasförmig T[K] Abbildung 3.5: Freie Enthalpie der drei Aggregatzustände eines beliebigen Systems. p* p [mbar] p [mbar] Bei hohen Temperaturen ist die freie Enthalpie der Gasphase am geringsten; dieser Zustand liegt im thermodynamischen Gleichgewicht vor. Bei tiefen Temperaturen ist das Material fest. Der Existenzbereich der drei Phasen wird in erster Linie durch die charakteristischen Temperaturen festgelegt: Schmelztemperatur : fest ⇒ flüssig Siedetemperatur : flüssig ⇒ gasförmig Sublimationstemperatur : fest ⇒ gasförmig. Diese Temperaturen sind jedoch druckabhängig. Die Existenz einer Phase wird also im Druck-Temperatur-Phasendiagramm durch einen Bereich beschrieben. Am Knotenpunkt (= Tripelpunkt) sind alle drei Phasen miteinander im Gleichgewicht. Vom Tripelpunkt aus für steigenden Druck und Temperatur ist der Übergang flüssig gasförmig unstetig, bis der so genannte kritische Punkt erreicht ist. Jenseits des kritischen Punktes verläuft der Übergang kontinuierlich. kr. P. 3 fest kr. P. 2 p* flüssig 3 fest flüssig 2 6.11 TP gasförmig 5.01 TP 1 0 gasförmig 1 T* s 273.16 T* b T[K] 0 216.6 T* s T* b T[K] Abbildung 3.6: Druck-Temperatur-Phasendiagramme von Wasser (H2 O) und Kohlendioxid (CO2 ). Die Existenzbereiche der Phasen im Gleichgewicht lassen sich qualitativ mit der Gibbs’schen Phasenregel beschreiben. F =n−P +2 (3.23) Hierin sind: F . . . Freiheitsgrade; P . . . Anzahl der Phasen; n . . . Anzahl der Komponenten. • Komponenten sind die verschiedenen chemischen Elemente (Bausteine), aus denen das System zusammengesetzt ist. 3.3. KONSTITUTIONSLEHRE 99 • Als Phasen bezeichnet man den Zustand von Materie, der durch Homogenität der chemischen Zusammensetzung und des physikalischen Zustandes gekennzeichnet ist. Man spricht von der festen, flüssigen und gasförmigen Phase eines Stoffes, oder von verschiedenen Phasen desselben Stoffes z.B. im festen Zustand (z.B. Phosphor in der schwarzen oder weißen Modifikation). Die Anzahl der Phasen eines Systems ist P . Ein Gas oder Gasgemisch, oder eine Flüssigkeit, oder zwei vollständig mischbare Flüssigkeiten bestehen aus einer einzigen Phase. Für Eis bei normalen Bedingungen gilt auch P = 1. Schneematsch besteht aber aus Wasser und Eis, daher P = 2. Phasen sind also physikalisch einheitliche Substanzen, wobei die chemische Zusammensetzung nicht notwendigerweise einheitlich sein muß. Die Legierung zweier Metalle besteht aus zwei Phasen, P = 2, wenn keine vollständige Mischbarkeit vorliegt; sind sie dagegen vollständig mischbar, so gilt P = 1. Es ist aber nicht immer ganz einfach, die Anzahl der Phasen zu bestimmen! p [mbar] • Die Freiheitsgrade geben die Anzahl der Systemgrößen an, die unter bestimmten Bedingungen noch frei wählbar sind. kr. P. 2 fest 1 0 flüssig 3 TP gasförmig T[K] Abbildung 3.7: Ausgezeichnete Punkte im Zustandsdiagramm von Wasser. Im Einstoffsystem (n = 1) gilt: F = −P + n + 2 i 1 P = 1 ⇒ F = −1 + 1 + 2 = 2 (p und T sind frei wählbar.) 2i P = 2 ⇒ F = −2 + 1 + 2 = 1 (p oder T ist frei wählbar.) 3i P = 3 ⇒ F = −3 + 1 + 2 = 0 (p und T sind fest vorgegeben.) Da Schmelz- und Siedepunkt in Metallen nur schwach von dem äußeren Druck abhängen und der Druck in der Regel der Atmosphärendruck ist, wird die Gibbs’sche Phasenregel in der Form F = n − P + 1 (p = konstant) verwendet, was in der Abbildung 3.7 einem isobaren Schnitt entspricht. Das Aufschmelzen und Verdampfen bei konstantem Druck läßt sich recht einfach aus dem p − T -Phasendiagramm ermitteln. Man braucht lediglich bei dem gesuchten Druck eine horizontale Linie durch das Diagramm zu ziehen (isobarer Schnitt). Diese Linie ist das T Zustandsdiagramm, die im Abbildung 3.8 aufgestellt gezeigt ist. KAPITEL 3. MEHRSTOFFSYSTEME p [mbar] 100 T[K] gasförmig kr. P. flüssig TSm TSi flüssig+gasförmig TSi flüssig fest TP gasförmig TSm fest+flüssig fest 0 T[K] Abbildung 3.8: Zum isobaren Schnitt im Zustandsdiagramm. 3.3.2 Thermodynamisches Gleichgewicht in Zweistoffsystemen Bei binären Systemen ist n = 2. Wenn mindestens eine der beiden Komponenten des Systems ein Metall ist, spricht man von Legierungen. Als möglicher Freiheitsgrad tritt nun neben der Temperatur und dem als konstant betrachteten Druck p auch die Zusammensetzung x auf. Die Zusammensetzung entspricht dabei der Konzentration einer Komponente in der anderen. Die Gibbs’sche Phasenregel wird erst später nach der Einführung der binären Phasendiagramme auf diese Systeme angewendet, wenn auch hier die Details klar sind. Die Gleichgewichtsbeziehung zwischen den Phasen und die vielgestaltigen Zustandsdiagramme von Zweistoffsystemen können am besten aus dem chemischen Potential abgeleitet werden. Ein System verändert sich solange, bis es das thermodynamische Gleichgewicht erreicht hat, wobei die Einstellung des Gleichgewichtes kinetisch möglich sein muß. Das thermodynamische Gleichgewicht ist erreicht, wenn die Entropie ein Maximum einnimmt. Die Entropie entspricht der Zahl von mikroskopischen Realisierungsmöglichkeiten. Das Eta-Theorem (Boltzmann) beschreibt diesen Zusammenhang. Die Entropie bei einer gegebenen Energie ist S = kB ln ω. Hierin ist kB die BoltzmannKonstante und ω die Anzahl der Realisierungsmöglichkeiten. Damit ist die Entropie ein Zustand der Unordnung. Legierungen sind im thermodynamischen Gleichgewicht, wenn die Entropie maximal wird. Wegen G = U + pV − T S wird die freie Enthalpie ein Minimum. Gleichgewichtsbedingung G = min dG = 0 dG = dU + pdV + V dp − T dS − SdT mit T , p = konst. dG = dU − T dS + pdV |{z} (3.24) (3.25) (3.26) (3.27) vernachlässigbar in FK = dU − T dS = 0 (3.28) 3.3. KONSTITUTIONSLEHRE 101 tiefe T : dU wichtig → Festkörper stabil hohe T : T dS wichtig → Unordnung dominiert; flüssig, gasförmig In Legierungen laufen Reaktionen so lange ab, bis dG = 0 ist. ! X X G= µi ni ⇒ dG = d µi n i = 0 i (3.29) i Die Änderung erfolgt um die Zahl n von Atomen der Komponente i. µi ist das chemische Potential der Komponente i. Bis das Gleichgewicht erreicht ist, werden Atome der Komponente i hinzugefügt oder weggenommen und dabei das chemische P Potential geändert. Für ein Zweistoffsystem ist die freie Enthalpie G = i µi xi n (xi = ni /n gibt die Konzentration der Teilchen an; n . . . totale Teilchenzahl), also G = (µ1 x1 + µ2 x2 ) n mit x2 = 1 − x1 bzw. G = [µ1 x1 + µ2 (1 − x1 )] n. (3.30) Dabei sind µ1 und µ2 Funktionen von T , p, und x. Fügt man bei konstanter Temperatur und Druck eine Komponente 1 mit dem chemischen Potential µ10 und eine Komponente 2 mit µ20 in ein durch x gegebenes Verhältnis zusammen und es passiert sonst nichts, so ergibt sich die freie Enthalpie G(x) einfach summarisch G(x) = µ10 x1 + µ20 x2 n, (3.31) sodaß G(x) in einem Diagramm durch eine Gerade zwischen µ10 und µ20 dargestellt wird. Werden beide Komponenten jedoch vermischt ineinander aufgelöst, also zu einer Phase vereinigt, dann treten sie miteinander in Wechselwirkung, weshalb für die freie Enthalpie G = H − T S ein zusätzlicher Term zu berücksichtigen ist. ∆G 0 µ1 G M G = G + |∆G {z } (3.32) aus Mischungsenthalpie und Entropie 0 µ2 −T∆ S ∆GM = ∆H M − T ∆S M G = G + ∆H M − T ∆S M (3.33) (3.34) (3.35) x A B Mischungen, die der Voraussetzung genügen, dass die Wechselwirkung zwischen den Komponenten denen in den reinen Komponenten entsprechen, sodass sich die innere Energie des Systems durch Mischung nicht ändert (∆U M = 0), heißen ideale Mischung (ideale Lösung). Es wird also nicht impliziert, dass es in idealen Mischungen keine Wechselwirkungen zwischen den Komponenten gibt. 3.3.3 G Ideale Mischung Am Modell der idealen Mischung lassen sich viele Grundzüge des Verhaltens von Zweistoffsystemen deutlich machen. Bei einer idealen Mischung tritt beim Vermischen weder ein 102 KAPITEL 3. MEHRSTOFFSYSTEME Volumenzuwachs auf (∆V M = 0), noch gibt es eine Wärmetönung (∆H M = 0), jedoch gibt es einen Entropiezuwachs, da durch das Vermischen die reinen Stoffe in einen Zustand geringerer Ordnung gebracht werden. Damit ergibt sich die freie Enthalpie einer idealen Mischung zu: G = G − T ∆S (3.36) Die Gleichgewichtsbeziehungen von zwei Phasen α und S in einem System aus zwei Komponenten werden aus dem Vergleich der freien Enthalpien der Phasen deutlich (α . . . feste Phase; S . . . Schmelze). Im Allgemeinen hat bei einer gegebenen hohen Temperatur die flüssige Phase eine höhere Energie und damit auch eine höhere Enthalpie aber auch eine höhere Entropie als eine feste Phase (H S > H α ; SS > Sα ). T1 ∆G T2 α T3 T4 T5 α α S S S S S α x A B A x B A α α+S α S x B A x B A x B T T1 α T2 α+S S T3 T4 T5 A x B Abbildung 3.9: Freie Enthalpie Kurven einer festen und flüssigen Phase in Abhängigkeit von der Zusammensetzung für verschiedene Temperaturen. Im unteren Teil ist das daraus konstruierte Temperatur – Konzentrations-Zustandsdiagramm gezeigt. Bei niedrigen Temperaturen ist der Term T S in G = H − T S klein, es überwiegt H, sodaß H α < H S für alle Zusammensetzungen und damit Gα < GS gilt. Das System ist dann fest, da es die geringste freie Enthalpie hat, wenn es ganz aus einer festen Phase besteht (T5 in Abb. 3.9). Im Gegensatz dazu wird bei höheren Temperaturen (T1 ) der Term T S so groß, daß für alle Zusammensetzungen SS > Sα gilt. Dann gilt auch GS < Gα und es ist alleine die flüssige Phase stabil. Dazwischen gibt es einen Temperaturbereich zwischen T2 und T4 , in welchem sich beide Kurven von GS (x) und Gα (x) schneiden. Für sinkende Temperaturen (T1 . . . T2 . . . T5 ) schneiden sich die Kurven bei T2 bei x = 0. Hier sind erstmalig beide Phasen im thermodynamischen Gleichgewicht, die Temperatur entspricht dem Schmelzpunkt der reinen Phase A, während für alle anderen Zusammensetzungen (x 6= 0; T2 ) alleine die Schmelze stabil ist. 3.3. KONSTITUTIONSLEHRE 103 Analog stehen für x = 1 alleine bei T4 beide Phasen im Gleichgewicht, während für x < 1 alleine die feste Phase stabil vorliegt. Durch die Absenkung der Temperatur werden die freie Enthalpie-Kurven der beiden Phasen α und S abgesenkt. Durch den unterschiedlich steilen Verlauf der Kurven in Abhängigkeit von der Temperatur, wie er in Abbildung 3.9 dargestellt ist, wird die freie Enthalpie der festen Phase wesentlich stärker abgesenkt als die der Schmelze, wodurch es zu dem Schneiden der Kurven kommt. Betrachtet man nun ein System mit mittlerer Zusammensetzung x bei einer Temperatur zwischen den beiden eben diskutierten, zum Beispiel T3 (T2 > T3 > T4 ), dann gilt im gezeigten Fall zwar Gα (x) < GS (x) und die Phase α hat die kleinere freie Enthalpie als die Schmelze, jedoch wird dadurch nicht der Gleichgewichtszustand dargestellt. Dieser Sachverhalt wird im Abschnitt über die Doppeltangentenregel erklärt. Die Doppeltangentenregel Ein System mittlerer Zusammensetzung in dem Temperaturbereich zwischen den beiden Schmelzpunkten der reinen Komponenten erreicht seine geringste freie Enthalpie (und damit das Gleichgewicht) in Gestalt eines zweiphasigen Zustandes. Dieser wird aus der Schmelze S und der festen Phase α gebildet. Die Schmelze hat dann die Zusammensetzung xS und die feste Phase xα . xS und xα werden durch eine gemeinsame Tangente an beide freie Enthalpie Kurven bestimmt. Die Konstruktion mit der Tangente an beide freie Enthalpie-Kurven wird als Doppeltangentenregel bezeichnet. Zwischen den beiden Zusammensetzungen xS und xα gibt es keinen einphasigen Zustand, sondern stets eine Mischung aus fester Phase α und Schmelze S, da dies energetisch günstiger ist. ∆G α S α x A α α+S x S x x S B Abbildung 3.10: Zur Konstruktion der Doppeltangentenregel. Es ist anschaulich leicht einzusehen, dass ein zweiphasiges System bestehend aus der Schmelze und der festen Phase energetisch günstiger ist. Die freie Enthalpie dieses zweiphasigen Zustandes wird durch eine lineare Variation der Ausgangswerte bestimmt – dies ist die Gerade zwischen den Werten, die durch die Doppeltangente bestimmt wurde. Aufgrund der Mischungsentropie liegen die tatsächlichen Werte möglicherweise sogar tiefer, als durch die Tangente angegeben. Die Tangente selber liegt aber zwischen den Berührungspunkten in jedem Punkt unter den Gα (x)- oder GS (x)-Kurven und weist damit geringere Werte auf. 104 KAPITEL 3. MEHRSTOFFSYSTEME Beweis des anschaulichen Sachverhaltes Die Phase S bekommt bei xS die Enthalpie GS (xS ) und analog bekommt α bei xα die freie Enthalpie Gα (xα ). Die freie Enthalpie G(x) der zweiphasigen Zustände wird dann durch die gemeinsame Tangente dargestellt. Rückblende: Entropie beim Mischen: S ∆G ∆S = −kB [x1 ln(x1 ) + x2 ln(x2 )] = −kB [x ln x + (1 − x) ln(1 − x)](3.37) A x B Die freie Enthalpie des idealen Gemisches ist: G(x) = µ10 x1 + µ20 x2 n = µ10 x + µ20 (1 − x) n (3.38) (3.39) A G = G − T ∆S x B (3.40) ⇒ G(x) = µ10 x1 + µ20 x2 n + kB T [x ln x + (1 − x) ln(1 − x)] = x µ10 n + kB T ln x + (1 − x) µ20 n + kB T ln(1 − x) (3.41) Dies ist die sogenannte Kettenlinie, ihre Steigung lautet: x ∂G(x) = µ10 − µ20 + kB T ln = µ1 − µ2 . (3.42) ∂x 1−x Die Tangente kann also in beiden Fällen sowohl anhand der Steigung δGα (x)/δx der Kurve Gα (x) an der Stelle xα als auch anhand der Steigung δGS (x)/δx der Kurve GS (x) an der Stelle xS formuliert werden, nämlich: G(x) = Gα (xα ) + [µ1 (xα ) − µ2 (xα )] (x − xα )n (3.43) G(x) = GS (xS ) + µ1 (xS ) − µ2 (xS ) (x − xS )n. (3.44) sowie Mit G = [µ1 x + µ2 (1 − x)]n folgt für Gleichung 3.43: G(x) = [µ1 (xα ) + µ2 (xα )(1 − xα ) + [µ1 (xα )x − µ1 (xα )xα − µ2 (xα )x + µ2 (xα )xα ]](3.45) n α α α = µ1 (x )x + µ2 (x ) − µ2 (x )x = µ1 (xα )x + µ2 (xα )(1 − x) (3.46) In gleicher Weise folgt aus Gleichung 3.44: G(x) = µ1 (xS )x + µ2 (xS )(1 − x). (3.47) Werden die Gleichungen 3.46 und 3.47 gleichgesetzt, so gilt für x = 1 ⇒ µ1 (xα ) = µ1 (xS ) und für x = 0 µ2 (xα ) = µ2 (xS ). Dies bedeutet, daß die chemischen Potentiale in beiden Phasen eben bei den durch die gemeinsame Tangente bestimmten Zusammensetzungen xα und xS gleich sind, wodurch das Gleichgewicht nachgewiesen ist. 3.3. KONSTITUTIONSLEHRE 105 Das Hebelgesetz Führt man nun analoge Betrachtungen auch für die anderen Temperaturen zwischen T2 und T4 (Abb. 3.9) aus, dann ergeben sich im Zustandsdiagramm drei Bereiche: Einen Bereich einphasig flüssiger Zustände (S), der durch die sogenannte Liquiduslinie begrenzt wird, einen Bereich einphasig fester Zustände (α), der durch die sogenannte Soliduslinie begrenzt wird und zuletzt einen linsenförmigen Bereich zweiphasiger Zustände flüssig / fest zwischen Liquidus- und Soliduslinie. T T1 S T2 T3 α α+S T4 T5 α x xS x x A B Abbildung 3.11: Zustandsdiagramm eines vollständig mischbaren Systems Der zweiphasige Bereich bedeutet, dass ein System mit der summarischen Zusammensetzung x bei der Temperatur T3 im Gleichgewicht aus einer flüssigen Phase (S) mit der Zusammensetzung xS und einer festen Phase (α) mit der Zusammensetzung xα besteht. Diese Zusammensetzungen findet man, indem man bei der Temperatur T3 horizontale Linien vom Punkt der Zusammensetzung x zu der Solidus- und Liquiduslinie zieht. Diese Linien heißen Konoden. Es ist trivial, dass bei einer konstanten Konzentration, die nicht einem reinen System entspricht (x = 0 oder x = 1), die Temperatur nicht festgelegt ist, bei der Schmelze und feste Phase im Gleichgewicht stehen; es gibt einen endlichen Schmelzbereich. Bei einer gegebenen Temperatur T3 sind die Zusammensetzungen xα und xS stets die gleichen für jede beliebige Zusammensetzung x zwischen xα und xS . Hierbei entfällt auf die Phase α ein Anteil xS − x (3.48) mα = S x − xα an der Gesamtmenge, während auf die Phase S der Anteil mS = x − xα xS − xα (3.49) entfällt. Zwischen den Anteilen besteht die sogenannte Hebelbeziehung mα xS − x = mS x − xα (3.50) Diese Gesetzmäßigkeiten treffen auf alle Zweiphasengebiete zu, sie gelten also auch für das Mengenverhältnis von zwei festen Phasen. Generell gilt: je dichter eine mittlere Konzentration an der Liquiduslinie ist, desto größer ist der Anteil an flüssiger Phase im Gleichgewicht. 106 KAPITEL 3. MEHRSTOFFSYSTEME Liq uid us Das Entsprechende gilt für eine Konzentration nahe der Soliduslinie. Der Name Hebelgesetz ist aus der Mechanik entliehen: Ein großer Anteil der einen Phase mit einem kurzen Hebel steht im Gleichgewicht, oder hält sich die Waage, mit einem kleinen Anteil der anderen Phase, die jedoch an einem langen Hebel hängt. Die Konzentration der flüssigen Phase kann T T größer oder kleiner sein als die der festen S Liquid S us α+S Phase. Entsprechend fällt die Liquiduslinie α (und die Soliduslinie) mit steigender KonzenKonode Konode tration ab, oder steigt an. us u id l So lid s α+S So α A x B A x B Verlauf der Kristallisation T 2 1 α 4 α+S 3 x2 A S x1 x x4 B Abbildung 3.12: Verlauf der Erstarrung eines zweikomponentigen Systems Ist eine flüssige Phase (S) der Zusammensetzung x1 gegeben und überschreitet sie durch Abkühlung die Liquiduslinie beim Punkt 1i, so entstehen Kristalle der Phase α entsprechend dem Punkt 2imit der Zusammensetzung x2 . In einem geschlossenen System verschiebt sich dadurch die Zusammensetzung der flüssigen Phase im Diagramm nach links. Um den Fortgang der Kristallisation aufrechtzuerhalten, muss die Temperatur weiter herabgesenkt werden und der Zustand der flüssigen Phase verschiebt sich entlang der Liquiduslinie in Richtung Punkt 4i. Der entsprechende Gleichgewichtszustand der Phase α, der den neu entstehenden Kristallen zukommt, verschiebt sich entlang der Soliduslinie in Richtung auf Punkt 3i. Damit befindet sich aber die zuerst entstandene Kristallsubstanz nicht mehr im Gleichgewicht. Um das Gleichgewicht zu bewahren, muss sich auch die Zusammensetzung der vorher entstandenen Kristallsubstanz kontinuierlich entlang der Soliduslinie ändern, das heißt, es muss ein ständiger Stoffaustausch zwischen der bereits ausgeschiedenen Kristallphase und der flüssigen Phase stattfinden (= Diffusion). Unter diesen Umständen hat der letzte Tropfen der flüssigen Phase schließlich entsprechend dem Zustand 4idie Zusammensetzung x4 und die gesamte kristalline Phase α entsprechend dem Zustand 3iwieder die ursprüngliche Zusammensetzung x1 . 3.3. KONSTITUTIONSLEHRE 107 Allerdings findet im Experiment oft der zur Einstellung des Gleichgewichts erforderliche Stoffaustausch mit der bereits kristallisierten Phase aus kinetischen Gründen nicht oder nur unvollständig statt, sodass die Kristallisation mit einer sogenannten Seigerung verbunden ist. Diese Seigerung geht dann über die Punkte 4ibeziehungsweise 3ihinaus, wodurch die Phasen auch Zusammensetzungen aufweisen können, die lokal über die Grenzen von x1 beziehungsweise x4 hinausreichen. 3.3.4 Herleitung binärer Zustandsdiagramme Die überwiegende Zahl metallischer Systeme ist im flüssigen Zustand vollständig mischbar. Daneben gibt es Systeme mit begrenzter Mischbarkeit, sowohl im Festen, als auch im Flüssigen. Ein solches System mit begrenzter Mischbarkeit wird als monotektisch bezeichnet (z. B. Fe – Pb). T S1+S2 S1+β α+β A x B Abbildung 3.13: Beispiel für ein monotektisches System mit begrenzter Mischbarkeit im Flüssigen und Festen. Im Festen tritt viel häufiger der Fall begrenzter Löslichkeit auf. Durch thermische Aktivierung wird nämlich die Tendenz zur Lösung mit steigender Temperatur begünstigt. Liegt die Mischungslücke nur bei tiefen Temperaturen vor, so erstarrt die Schmelze stets zum Mischkristall und erst bei weiterer Abkühlung zerfällt die Lösung in ein Phasengemenge. Liegt die Maximaltemperatur der Mischungslücke oberhalb der Soliduslinie, dann kommt es zu einer neuen Form des Zustandsdiagramms. Am Schnittpunkt der Soliduslinie mit der Grenze der Mischungslücke stehen drei Phasen miteinander im Gleichgewicht und es wird aus der Phasenregel F = n − P + 1: F = 0 Es gibt für im Flüssigen vollständig mischbare Systeme im Prinzip drei Formen für den Koexistenzbereich von flüssiger und fester Phase. Dies ist zum einen der zigarrenförmige (monoton fallende) Verlauf, wie er für ideale Mischungen beschrieben wurde. In diesem Fall kommt es zur Bildung des peritektischen Zustandsdiagramms. 108 KAPITEL 3. MEHRSTOFFSYSTEME T S S TA S TA S+α S+α S+α S+α S+α2 α α α1 x TB TB TB A S TA TA α 1+ α 2 α2 x B A α1 α 1+ α 2 α2 x B A TB α1 α 1+ α 2 α2 x B A B Abbildung 3.14: Entwicklung eines peritektischen Zustandsdiagramms für Systeme mit zigarrenförmigem Koexistenzbereich von Schmelze und fester Phase, sowie steigendem Temperaturbereich der Mischungslücke im Festen und ihre Fortsetzung im Flüssigen. Zum Anderen kann der Verlauf von Solidus- und Liquiduslinie ein Minimum aufweisen. In diesem Fall kommt es zur Bildung des eutektischen Zustandsdiagramms. T S S TA S+α S TA S+α S+α TB S+α S+α1 S+α2 TB TB α α α1 A TA x B A α 1+ α 2 x α2 α1 B A α 1+ α 2 x α2 B Abbildung 3.15: Entwicklung eines eutektischen Zustandsdiagramms für Systeme mit einem Minimum der Solidus- und Liquiduslinie für mittlere Konzentration, sowie steigendem Temperaturbereich der Mischungslücke im Festen und ihre Fortsetzung im Flüssigen. Ein peritektisches System ist dadurch gekennzeichnet, daß eine feste Phase α mit der Konzentration xP bei der peritektischen Temperatur TP unter Zersetzung schmilzt. Das kann durch die peritektische Reaktion S + α1 → α2 beschrieben werden. Die peritektische Temperatur liegt immer zwischen den Schmelztemperaturen der beiden reinen Komponenten. Peritektische Systeme entstehen gewöhnlich dann, wenn die Schmelztemperaturen der beiden Komponenten stark verschieden sind. Ein eutektisches System ist dadurch gekennzeichnet, daß eine mehrkomponentige Schmelze mit der eutektischen Zusammensetzung xE während der Erstarrung bei der eutektischen Temperatur TE in ihre Komponenten zerfällt. Das kann durch die eutektische Reaktion S → α1 + α2 beschrieben werden. Die dritte prinzipiell mögliche Form eines Zustandsdiagramms ist der Fall, dass Solidus- 3.3. KONSTITUTIONSLEHRE 109 und Liquiduslinie ein Maximum zeigen. In diesem Fall besteht die Tendenz zur Bildung einer intermetallischen Phase bei der Erstarrung der Schmelze. T S S TA S+α S+α α TA S+α1 TB α1 S+ α2 S+ S+α 3 T α2 B α2 α3 α’ A x α 1+ α 2 B A α 2+ α 3 x B Abbildung 3.16: Entwicklung eines Zustandsdiagramms mit intermetallischer Phase für Systeme mit einem Maximum der Solidus- und Liquiduslinie für mittlere Konzentration sowie steigendem Temperaturbereich der Mischungslücke im Festen und ihre Fortsetzung im Flüssigen. Die entstehende intermetallische Phase kann in einem weiten Konzentrationsbereich vorliegen oder scheinbar zu einer streng stöchiometrischen Zusammensetzung entarten. Aber schon an dieser Stelle sei darauf hingewiesen, dass es eine Randlöslichkeit gibt, die solche Phasen verbietet. Aufgrund thermodynamischer Überlegungen muss es immer eine Randlöslichkeit und damit für Phasen auch eine endliche Breite geben, auch wenn in realen Phasendiagrammen oft sogenannte Strichphasen eingezeichnet werden. In diesen Fällen ist die Breite der Phase so gering, dass sie entweder nicht gemessen oder nur nicht dargestellt werden kann. Ein Teilchen kann nicht bei kleinen Konzentrationen neben einer imaginären Strichphase ein anderes chemisches Potential haben als bei geringfügig größerer Konzentration (auf der anderen Seite der Strichphase). Der Übergang im chemischen Potential kann beliebig steil werden, aber er muss stetig sein. In Analogie kann eine Randphase nicht rein sein und es gibt immer eine, manchmal geringe, Randlöslichkeit. Alle anderen möglichen Formen von Zustandsdiagrammen, die durchaus kompliziert aufgebaut sein können, lassen sich aus diesen Grundtypen herleiten. In Abhängigkeit von den Wechselwirkungen zwischen den Komponenten findet man für größere Wechselwirkung zwischen den gleichen Komponenten im Vergleich zu zwei verschiedenen (WAB < WAA = WBB ) die Bildung des eutektischen Zustandsdiagramms, während man für den anderen Fall (WAB > WAA = WBB ) die Bildung intermetallischer Phasen beobachtet. Wenn dann noch die Wechselbeziehungen zwischen den Komponenten komplizierterer Natur sind (WAB 6= WAA 6= WBB ) wird die Bildung peritektischer Zustände beobachtet (s. Abb. 3.17). 110 KAPITEL 3. MEHRSTOFFSYSTEME T T T A A B A Mischungs− lücke B mit Phasenbreite WW(AB) =WW(AA) =WW(BB) T A B B A WW(AB) >WW(AA) =WW(BB) T WW(AB) <WW(AA) =WW(BB) Rand− B löslichkeit A B A B A B T A T T A inkongruent schmelzend T B kongru− ent schmel− zend ohne Phasen− breite einfach eutektisch T A T B B Abbildung 3.17: Zustandsdiagramme in Abhängigkeit der Wechselwirkungen zwischen den Komponenten. Thermodynamik der Legierungen Die Zustandsdiagramme lassen sich prinzipiell thermodynamisch herleiten und deuten. Zunächst einmal werden die einzelnen freie Enthalpie-Kurven der festen Phasen zur besseren Übersicht zu einer einzigen zusammengefasst. Gα1 , Gα2 u.s.w., die für jede feste Phase in einem mehrkomponentigen System existieren (also nicht dem gleich als erstes behandelten vollmischbaren System), werden lediglich anhand ihrer gemeinsamen Minimalwerte beschrieben. Die festen Phasen werden von links nach rechts durchnummeriert. ∆G G α1 Gα A 3.3.5 G α2 x B Vollmischbare Systeme Wir betrachten zunächst den Fall der vollständigen Löslichkeit. Bei sehr hohen Temperaturen ist GS < Gα für alle Konzentrationen (in Abb. 3.18 wurde GS durch S und Gα durch α zur besseren Übersicht ersetzt) und das System liegt im gesamten Konzentrationsbereich flüssig vor (T1 ). 3.3. KONSTITUTIONSLEHRE T1 ∆G 111 T2 α T3 T4 T5 α α S S S S S α x A B A x B A α α+S α S x B A x B A x B T T1 α T2 α+S S T3 T4 T5 A x B Abbildung 3.18: Entwicklung des vollständig mischbaren Zustandsdiagramms aus freie Enthalpie Kurven bei verschiedenen Temperaturen. Mit abnehmender Temperatur ist irgendwann der Punkt erreicht, an dem beide freie Enthalpie-Kurven denselben Wert haben, also GS = Gα . Bei dem hier betrachteten Fall mit zigarrenförmigem Koexistenzbereich von Schmelze und fester Phase kann dies nur bei x = 0 oder x = 1 eintreten. In diesem Fall passiert dies bei x = 0 und daraus folgt, daß die freie Enthalpie-Kurven am Schmelzpunkt der reinen Phase A denselben Wert aufweisen. Für diese Temperatur liegt alleine die feste Phase α bei x = 0 vor, während alle anderen Konzentrationen bei der Schmelztemperatur der Phase A, T2 , noch im flüssigen Zustand vorliegen. Bei weiterer Absenkung der Temperatur (z. B. T3 ) erhält man getrennte Konzentrationsbereiche, in denen entweder die Schmelze S oder die feste Phase α die geringere freie Enthalpie haben. Hier befinden sich S und α im thermodynamischen Gleichgewicht. Zwischen diesen Bereichen wird die kleinste freie Enthalpie durch ein Gemenge aus Schmelze und fester Phase (S + α) erreicht (vgl. Doppeltangentenregel). Die Konzentrationen, die durch die Tangente zwischen den G(x)-Kurven der S- und α-Phase bestimmt werden, legen den Solidus- und Liquiduspunkt bei der gegebenen Temperatur fest. Damit entspricht der Existenzbereich der auftretenden Phasen gemäß dem G(x)-Verlauf einem isothermen Schnitt durch das Zweiphasengebiet eines zigarrenförmigen T (x)-Zustandsdiagramms. Bei weiterer Absenkung der Temperatur verlagern sich die Berührungspunkte der Tangente, das heißt der Konzentrationsbereich des Zweiphasengebietes verschiebt sich, bis schließlich bei Erreichen der Schmelztemperatur der niedriger schmelzenden Komponente B (T4 ) die freie Enthalpie der Phase α kleiner als die der Schmelze S für alle mittleren Konzentrationen 0 ≤ x < 1 ist und für x = 1 beide freien Enthalpien gleich sind GS = Gα . Unterhalb dieser Temperatur ist für alle Konzentrationen 0 ≤ x ≤ 1 die freie Enthalpie der festen Phase α kleiner als die der flüssigen Phase S (Gα < GS ). Daraus folgt, daß unter dieser Temperatur (T4 ) alleine die feste Phase α vorliegt; z. B. T5 . Durch konsequente Anwendung dieser Betrachtungen für 112 KAPITEL 3. MEHRSTOFFSYSTEME möglichst viele Temperaturen kann das Zustandsdiagramm konstruiert werden. Auf diese Weise – unter Betrachtung der freie Enthalpie-Kurven der beteiligten Komponenten – werden auch kompliziertere Zustandsdiagramme entwickelt. Diese treten dann auf, wenn es im festen Zustand eine Mischungslücke gibt. Eutektische Systeme Die freie Enthalpie der Schmelze S in Abhängigkeit von der Konzentration x hat einen nahezu parabelförmigen Verlauf. Nun existieren zwei feste Phasen α1 und α2 , die entmischen. Wenn deren freie-Enthalpie-Kurven in ihren Minima und Existenzbereichen ähnliche Werte aufweisen, das heißt, sie liegen T1 ∆G T2 T3 α S α S TE S α S T5 S α α α2 α1 α1+S S x A α1 α1+S x B A T B A S α2 +S x α1 B A α1+α 2 +S x α2 α1 B A α1+α 2 x α2 B T1 S T2 S+ α2 S+ α1 α1 α1+α 2 T3 α2 TE T5 A x B Abbildung 3.19: Entwicklung des eutektischen Zustandsdiagramms aus freien EnthalpieKurven bei verschiedenen Temperaturen. bei jeweils kleinerer und größerer Konzentration im Vergleich zum Minimum der freienEnthalpie-Kurve der Schmelze, dann kommt es zur Bildung des eutektischen Zustandsdiagramms. Im weiteren Verlauf werden beide freie Enthalpie-Kurven der festen Komponenten α1 und α2 zu einer zusammengefasst. Solange die freie Enthalpie der Schmelze S kleiner als die der festen Phasen α ist, liegt die Schmelze bei hohen Temperaturen (z. B. T1 ) vor. Sobald die Schmelztemperatur der höher schmelzenden Komponente unterschritten ist, kommt es zu getrennten Konzentrationsbereichen. Solange nur eine gemeinsame Tangente an die GS - und die Gα -Kurve gelegt werden kann, existieren wie im Fall der vollständigen Mischbarkeit drei Phasengebiete (T2 ). Sobald aber die Gα -Kurve an zwei unterschiedlichen Stellen unter der GS -Kurve liegt, kann eine weitere Tangente an beide Kurven gelegt werden und es kommen zwei neue Phasengebiete hinzu (T3 ). Damit existieren ausgehend von den beiden reinen Komponenten jeweils zwei 3.3. KONSTITUTIONSLEHRE 113 Konzentrationsbereiche mit fester Phase (α1 und α2 ) und Koexistenzbereiche (S + α1 und S+α2 ) neben der Schmelze (S). Bei weiter absinkenden Temperaturen werden diese Bereiche größer, bis irgendwann der in der Mitte schrumpfende Bereich der Schmelze S aufgezehrt ist. An dieser Temperatur (TE ) sind beide Tangenten kollinear, das heißt, die Tangenten liegen an drei Punkten an (einmal an der GS (x)- und zweimal an der Gα (x)-Kurve). Unterhalb dieser Temperatur verschwindet die Schmelze aus dem Zustandsdiagramm, da die GS (x) Kurve für alle Konzentrationen oberhalb der Gα (x) Kurve oder der Tangente an ihren beiden Minima liegt. Die beiden Minima deuten schon auf die eingangs erwähnte Mischungslücke im Festen hin (T5 ). Doch noch einmal zurück zu TE : An dieser Temperatur schneidet die Tangente drei Punkte. An diesem Punkt wird letztmalig eine Tangente an die GS (x)-Kurve gelegt werden können, da für kleinere Temperaturen die freie Enthalpie der Schmelze stets größer als die der festen Phasen ist. Dies ist damit auch die niedrigste Temperatur des Systems, bei der noch Schmelze vorliegt, daher kommt auch der Name; Eutektikum heißt das Niedrigstschmelzende. Im Phasendiagramm gibt es bei dieser Temperatur eine horizontale Linie zwischen den Begrenzungslinien der Randphasen. Monotectic T T S S+ α1 S S+ α1 α1 S1 + S2 S+ α1 S+ α1 S+ α2 B S S+ α1 S+ α2 α1+α 2 Monotectic α1 S+ α1 α2 α1+α 2 x α1 x A B Eutectoid α1 T S S Metatectic α1 S+ α2 α2 α2 α1+α 2 α2+α 3 α1 α3 α1+α 3 A x α1 B S+ α2 S1 S1 +S2 α1+S 2 α1+α 2 α2 α2+α 3 α1+α 3 Eutectoid T α2 S1 +S2 α1 A Eutectic α1+α 2 α2 S+ α1 S+ α2 S2 α3 S S+ α3 α3 α2+α 3 α1+α 2 α1+α 3 x A B Metatectic T T S α2 α1 S α2 S+ α2 α1+α 2 α1 S+ α1 S+ α2 α1+α 2 S+ α3 S+ α1 α3 α1+α 3 A x B A x Abbildung 3.20: Verschiedene ’eutektischartige’ Systeme. Der Unterschied in der Bezeichnung resultiert aus der Art und Anzahl der beteiligten Phasen (flüssig / fest) B An dieser Stelle sei noch auf die verschiedenen Erscheinungsformen “eutektisch-artiger” 114 KAPITEL 3. MEHRSTOFFSYSTEME Zustandsdiagramme verwiesen. Es wird anhand der beteiligten Phasen unterschieden: • Monotektisch ist gekennzeichnet durch zwei flüssige Phasen in Koexistenz. • Eutektoid ist gekennzeichnet als Festphasenumwandlung. • Metatektisch ist gekennzeichnet durch die Reaktion einer festen Phase zu einem Gemisch aus fester und flüssiger Phase. Peritektische Systeme Die beiden freie Enthalpie-Kurven der festen Phasen können jedoch unterschiedlich sein, das heißt, sie haben deutlich unterschiedliche Existenzbereiche. Beide Minima der freienEnthalpie-Kurve der festen Phasen liegen auf einer Seite in Bezug auf das Minimum der freien Enthalpie Kurve der Schmelze. Die Minima weisen darüberhinaus vergleichbare Werte der freien Enthalpie auf. In diesem Fall kommt es zur Bildung des peritektischen Phasendiagramms. T1 ∆G T2 Tp T4 T5 S α α S S S α S x A α1 α1+S B A S x B α α1+α 2 +S x A α S α S+ α2 α2 α1 α1+α 2 B A x S α1 α1+α 2 B A α2 x B T1 T S T2 S+ α1 α1 α1+α 2 A Tp S+ α2 T4 α2 x T5 B Abbildung 3.21: Entwicklung des peritektischen Zustandsdiagramms aus freien-EnthalpieKurven bei verschiedenen Temperaturen. Auch hier gilt: solange die GS -Kurve für alle Konzentrationen den geringsten Wert aufweist, liegt alleine die Schmelze im thermodynamischen Gleichgewicht vor. Bei weiter absinkender Temperatur bricht zunächst ein Minimum der freien Enthalpie-Kurve der festen Phase nach unten durch. Damit werden, wie zuvor besprochen drei Konzentrationsbereiche geschaffen, in denen α, S und das Gemenge aus beiden Phasen vorliegen (T2 ). Für weiter sinkende Temperaturen liegt die Tangente an der GS (x)-Kurve und am Minimum der Gα1 (x)-Kurve an (z.B. T2 ), bis der Fall eintritt (TP ), dass beide Minima der Gα (x)-Kurve, 3.3. KONSTITUTIONSLEHRE 115 also die Minima beider festen Phasen und das Minimum der freien Enthalpie-Kurve der Schmelze, an einer gemeinsamen Tangente anliegen. An dieser Temperatur liegt zum ersten Mal die zweite feste Phase im Gleichgewicht vor, man bezeichnet diese Temperatur als peritektische Temperatur. Für fortan kleiner werdende Temperaturen wird der Konzentrationsbereich der Schmelze immer kleiner und der Bereich der zweiten festen Phase α2 größer (T4 ). An dieser Temperatur kann an die GS (x)- und an das Minimum der Gα2 (x)-Kurve eine gemeinsame Tangente gelegt werden. Eine zweite Tangente liegt zwischen den Minima der freien Enthalpie-Kurve der festen Phasen. Während letztere für kleiner werdende Temperaturen erhalten bleibt, verschiebt sich die erste immer mehr in Richtung der Randphase, wobei der Konzentrationsbereich, den sie überspannt, immer kleiner wird. Unterhalb des Schmelzpunktes der zweiten Komponente, wo beide freie Enthalpie-Kurven den selben Wert zeigen, Gα = GS , existiert keine Schmelze mehr. Intermetallische Phasen Für den Fall, daß die freie Enthalpie-Kurven der beiden festen Phasen stark unterschiedliche Minima aufweisen, und beide auf einer Seite in Bezug auf das Minimum der freien Enthalpie Kurve der Schmelze liegen, oder gar drei feste Phasen vorliegen, es also zwei Mischungslücken im Festen gibt, kommt es zu der Bildung intermetallischer Phasen. T1 T2 ∆G T3 α T5 T4 α α α S S α S S S 0 x A B A 5 2 5 x T1 T T2 S+ α α1 1 S+ α2 S+ α2 T4 α2 α3 T5 α2+α 3 α1+α 2 A T3 S+ α3 x 0 14 0 5 2 B A 5 x 0 1 2 3 4 5 6 7 8 9 0 1 B A 9 2 5 x 0 6 3 1 B A 7 2 x 8 3 B S α1 α2 α3 S + α1 S + α2 S + α3 α1+ α2 α2+ α3 S + α1+ α2 B Abbildung 3.22: Entwicklung eines Zustandsdiagramms mit intermetallischer Phase aus freie Enthalpie-Kurven bei verschiedenen Temperaturen. In diesem Fall besteht das Zustandsdiagramm aus zwei Eutektika. Nacheinander nehmen die Minima der Gαi -Kurven kleinere Werte an, als sie die GS Kurve aufweist. In diesem Fall treten immer für den Fall, daß für ein Minimum GS = Gα gilt, die Phasen in reiner Form das erste Mal auf und für kleiner werdende Temperaturen 116 KAPITEL 3. MEHRSTOFFSYSTEME kommt der Koexistenzbereich mit der Schmelze hinzu. Bemerkenswert ist, daß dieser Koexistenzbereich auf beiden Seiten des Minimums existiert, da auf beide Seiten eine gemeinsame Doppeltangente an die Kurven gezeichnet werden kann. (z. B. T2 für α2 ). Diese Bereiche existieren, bis ein weiteres Minimum durch die GS -Kurve stößt. Für weiterhin kleinere Temperaturen tritt dann der Fall ein, daß zwei Doppeltangenten irgendwann kollinear liegen (T4 für S + α1 + α2 ). Der Ablauf ist dann analog zu dem bisher Betrachteten für eutektische Systeme, mit der Besonderheit, daß in diesem Zustandsdiagramm zwei Eutektika auftreten. Je nach Lage der Minima zueinander erhält man intermetallische Phasen, die entweder direkt aus der Schmelze oder peritektisch erstarren. Im Fall der peritektischen Erstarrung einer intermetallischen Phase liegen zwei Minima der drei freie Enthalpie-Kurven der festen Phasen auf einer Seite des Minimums der GS -Kurve. Die dritte feste Phase hat ihr Minimum auf der gegenüberliegenden Seite. Diese Konstellation führt zu der peritektischen Bildung der Phase α2 (s. Abb. 3.23). T1 T2 ∆G T3 T4 α α T5 α S α S α S S S 1 x A B A 4 0 x 1 9 0 x B A 1 7 2 5 x B A 0 T6 S T α T1 T2 S+ α1 α1 1 7 2 8 x α2 3 B A α3 T6 α2+α 3 x T3 T4 S+ α2 α1 +α2 A S+ α3 B 1 B A T5 7 2 10 x 0 1 2 3 4 5 6 7 8 9 10 3 B S α1 α2 α3 S + α1 S + α2 S + α3 α1+ α2 α2+ α3 S + α1+ α2 S + α2+ α3 Abbildung 3.23: Entwicklung eines Zustandsdiagramms mit intermetallischen Phasen aus freien Enthalpie-Kurven bei verschiedenen Temperaturen. In diesem Fall besteht das Zustandsdiagramm aus einem Eutektikum und einem Peritektikum. Genauso wie bei der einfachen peritektischen Phasenbildung wird die intermetallische Phase gebildet, wenn eine Tangente gemeinsam an die beiden Minima der festen Phasen α1 und α2 sowie an das daneben liegende Minimum der Schmelze gelegt werden kann (T3 ). Bei weiter sinkender Temperatur wird irgendwann auch die letzte feste Phase α3 stabil (T4 ) und es kommt zur Bildung des zwischen Schmelze und Phase α3 liegenden Koexistenzbereichs. In dem Moment, wo eine Tangente an die Minima α2 und α3 gelegt werden kann, erstarrt die Restschmelze eutektisch (T5 ). Bei noch tieferen Temperaturen liegen nur noch feste Phasen α1 , α2 und α3 sowie die dazwischen liegenden Phasengemische vor. 3.4. REALE ZUSTANDSDIAGRAMME UND IHRE INTERPRETATION 3.4 117 Reale Zustandsdiagramme und ihre Interpretation 3.4.1 Grundlagen Reale Zustandsdiagramme werden oft sowohl durch den Massengehalt (Gewichts-Prozent) als auch durch den Stoffmengengehalt (Atom-Prozent) dargestellt. Masse der Komponente A ; Gesamtmasse der Legierung Anzahl der Atome der Komponente A Stoffmengengehalt = ; Gesamtzahl der Atome in der Legierung Massengehalt = mA m nA xA = n wA = (3.51) (3.52) Umrechnung: Komponenten: A, B Stoffmenge der Komponente: nA , nB Stoffmenge der P Legierung: n = nA + nB = Stoffmenge der Komponente: xA = NnA i ni Atomgewicht eines Atoms der Komponente: aA , aB Molgewicht: aA NA , aB NB Masse aller Atome A: mA = aA NA nA = aA NA xA n Gesamtmasse aller Atome: Massengehalte der Komponente: wA = mmA m = aA NA xA n + aB NB xB n wA = xA = aA x A aA xA + aB xB + . . . wA /aA wA /aA + wB /aB + . . . Je stärker die Atommassen der Komponenten voneinander abweichen, um so unterschiedlicher sind die Skalen von Atom- und Masseprozent. Abbildung 3.24 zeigt das Phasendiagramm Sn–Pb als ein Beispiel für ein typisches eutektisches Phasendiagramm. Angegeben sind ausgezeichnete Temperaturen, das sind die Schmelztemperatur von (reinem) Sn (232◦ C), von (reinem) Pb (327◦ C) sowie die eutektische Temperatur (183◦ C). Darüberhinaus sind ausgezeichnete Konzentrationen in Atomprozent angegeben, wobei in Klammern die Werte für Gewichtsprozent angegeben sind. Diese Konzentrationen bezeichnen die maximale Löslichkeit von Pb in (Sn) bei 1.45 at.-%Pb, die maximale Löslichkeit von Sn in (Pb) bei 71 at.-%Pb sowie die eutektische Zusammensetzung bei 26 at.-%Pb. Selbstverständlich sind die schon bekannten Phasenräume mit angegeben. Ein geeignetes Experiment zur Ermittlung des Gleichgewichtszustandes ist die thermische Analyse. Hierbei wird die Temperatur der Probe in Abhängigkeit von einer Referenztemperatur (i. A. gleicher Probenhalter ohne Probe) und von der Rate der Temperaturänderung gemessen. Bei jeder Phasenreaktion wird eine gewisse Reaktionswärme umgesetzt, die zusätzlich abgeführt / hinzugeführt werden muß. Hierdurch wird zum Beispiel eine Abkühlung mehr oder weniger verzögert. Es treten zwei Fälle auf: 118 KAPITEL 3. MEHRSTOFFSYSTEME w in % 10 20 30 40 50 60 70 80 85 90 95 T [°C] 327° 300 S 250 232° S+(Pb) 200 S+(Sn) 1.45(2.5) 150 100 0 Sn 183° 26.1(38.1) (Sn) 10 71(81) (Pb) (Sn)+(Pb) 20 30 40 50 x in % 60 70 80 90 100 Pb Abbildung 3.24: Sn–Pb-Phasendiagramm 1. Phasenumwandlung bei einer Temperatur: Verzögerung der Abkühlung, bis die gesamte Reaktionswärme abgeführt ist. In diesem Fall muß die Reaktionswärme von der Probe abtransportiert werden, wodurch in der Rate die Referenztemperatur davonläuft. In der sogenannten Differenzthermoanalyse verursacht dieses Verhalten einen exothermen Peak. 2. Phasenumwandlung in einem Temperaturintervall: (zum Beispiel bei dem Durchlaufen eines S + α-Bereiches) Während des gesamten Intervalls erfolgt die Phasenumwandlung und verzögert die Abkühlung. Die Abkühlkurve wird flacher als die der Referenz verlaufen, sie läuft verzögert ab. In Differenzthermoanalyse-Kurven wirkt sich dieses Verhalten in Kurven mit veränderter Steigung aus. 3.4.2 Eutektische Systeme Betrachten wir die Sn–Pb Legierung mit xPb = 50 (at.-)% bei 150◦ C. Bei dieser Temperatur kann Zinn maximal 1% Blei lösen und Blei kann maximal 17% Zinn lösen. Die Legierung muß also in eine zinnreiche und eine bleireiche Phase aufspalten. Der Phasenzustandspunkt der (Sn)-Phase liegt nun im (Sn)-Phasenraum bei 150◦ C und maximaler Pb-Löslichkeit, also auf der (Sn)-Phasengrenze. Analoges gilt für die (Pb)-Phase. Beim Abkühlen einer Sn − 80at.-%Pb-Legierung kommt es bei T = 310◦ C zunächst zum Übergang in das S + (Pb)-Zweiphasengebiet. Entsprechend der Gleichgewichtsbedingung scheidet entlang der Konoden ein (Pb)-Mischkristall mit der Zusammensetzung Sn − 95at.-%Pb aus. Bei weiterer Abkühlung verschiebt sich die Konzentration der Schmelze entlang der Liquiduslinie und die Konzentration der ausgeschiedenen (Pb)-Mischkristalle verändert sich entsprechend dem Verlauf der Soliduslinie mit sinkender Temperatur. Je niedriger die Temperatur ist, um so größer wird der Sn-Anteil im Mischkristall. Dies geschieht, bis bei T = 260◦ C keine Restschmelze mehr vorhanden ist. Der Mischkristall sei an dieser Stelle homogen. Bei weiterer Abkühlung erreicht der Mischkristall T = 160◦ C, wo er erneut 3.4. REALE ZUSTANDSDIAGRAMME UND IHRE INTERPRETATION 119 T [°C] 300 S 250 S+(Pb) 200 S+(Sn) 150 100 0 Sn (Pb) (Sn) 10 (Sn)+(Pb) 20 30 40 50 60 70 80 x in % 90 100 Pb Abbildung 3.25: Sn-Pb-Phasendiagramm: Abkühlverhalten einer Sn − 80at.-%Pb-Legierung in eine Sn-reiche und eine Pb-reiche feste Phase aufspaltet. Bei der Abkühlung von 150◦ C bis zu 100◦ C ändern sich die Hebelarme der Konoden. Daher kommt es zu einer Phasenreaktion von (Pb) → (Sn), d.h. aus der Pb-reichen Phase scheidet sich Sn ab. Beim Abkühlen einer Legierung mit einer nominellen Zusammensetzung von Sn − 50at.-%Pb geschieht nun Folgendes: Es sei angemerkt, daß dieser Verlauf äquivalent für jede Zusammensetzung ist, deren Zusammensetzung zwischen den Konzentrationen von maximaler Löslichkeit der beteiligten Komponenten ineinander ist. T [°C] 300 S 250 S+(Pb) 200 S+(Sn) 150 100 0 Sn (Pb) (Sn) 10 (Sn)+(Pb) 20 30 40 50 x in % 60 70 80 90 100 Pb Abbildung 3.26: Sn–Pb-Phasendiagramm: Abkühlverhalten einer Sn − 50at.-%Pb-Legierung Oberhalb der Liquiduslinie liegt die Schmelze einphasig vor. Sobald der Legierungszustandspunkt unter T = 245◦ C fällt, wird die Schmelze instabil und es scheidet sich der (Pb)Mischkristall aus der Schmelze aus. Mit weiter sinkender Temperatur verändern sich die Konzentrationen von Schmelze und Mischkristall entsprechend der Vorgaben von Liquidusund Soliduslinie, wobei sich ständig (Pb) aus der Schmelze ausscheidet. Im Gegensatz zum vorherigen Beispiel einer Sn−80at.-%Pb-Legierung erreicht die Zusammensetzung des Mischkristalls nicht die nominelle Zusammensetzung der Legierung (der Verlauf der Soliduslinie schneidet nicht die xPb = 50%-Linie) und es wird nicht die gesamte Schmelze in den (Pb)Mischkristall umgewandelt. Bei T = 183◦ C hat die Schmelze ihren tiefsten Punkt im Zustandsdiagramm erreicht (xPb = 26%), aber zu diesem Punkt besteht die Legierung noch 120 KAPITEL 3. MEHRSTOFFSYSTEME zu 47% aus Schmelzphase (Hebelgesetz!). Die noch in der Probe vorhandene Schmelze kann nicht weiter abgekühlt werden, sondern muß vollständig zerfallen und zwar in die (Sn)- und (Pb)-Phase. Diese Phasenreaktion endet erst mit dem vollständigen Zerfall der S-Phase. Dies ist die eutektische Reaktion, daher sagt man auch die Restschmelze erstarrt eutektisch. Nachdem diese Reaktion abgelaufen ist, sind nur noch (Sn) und (Pb) Mischkristalle vorhanden. Wieder ändern sich die Hebelarme der Konoden bei sinkender Temperatur und es kommt zu der Reaktion (Pb) → (Sn). Aus den Pb-reichen Mischkristallen scheidet sich Sn aus, das sich an den Sn-reichen Mischkristallen anlagert. Jede Sn–Pb-Legierung zwischen 1.47at.-%Pb und 71at.-%Pb besitzt bei T = 183◦ C drei stabile Phasen: S, (Sn) und (Pb). Dieser Dreiphasenraum ist zu einer Linie entartet. Bisher wurden die Bezeichnungen (Pb) und (Sn) verwendet ohne sie zu erklären. Hierbei handelt es sich um die Bezeichnung für einphasige (!) Mischkristalle unter Angabe ihrer Hauptkomponente. Natürlich findet man in einem (Pb)-Mischkristalle Sn-Atome (sofern das zugrundeliegende Phasendiagramm das von Sn-.Pb ist ). Mischkristalle sind feste Lösungen von Atomen. Da die feste Phase in metallischen Werkstoffen kristallin ist, bezeichnet man diese als Mischkristalle. Entsprechend ihrer atomaren Anordnung unterscheidet man systematisch zwei Arten von Mischkristallen, nämlich die interstitiellen und die substitutionellen Mischkristalle. Bei interstitiellen Mischkristallen befinden sich die Legierungsatome auf Zwischengitterplätzen des Matrixgitters, während bei Substitutionsmischkristallen die Legierungsatome auf regulären Gitterplätzen sitzen. Interstitielle Mischkristalle sind dann typisch anzutreffen, wenn die Legierungsatome sehr viel kleinere Atomradien aufweisen als die Matrixatome. Abbildung 3.27: Formen der Mischkristallbildung interstitiell (links) und substitutionell (rechts) Das Gefüge einer eutektischen Legierung Anhand mehrerer Zusammensetzungen soll nun die Bildung des Gefüges beim Abkühlen von Schmelzen eutektischer Systeme erklärt werden. Zunächst wird eine Sn − 60at.-%PbLegierung betrachtet. 3.4. REALE ZUSTANDSDIAGRAMME UND IHRE INTERPRETATION 121 T [°C] 300 1 S 250 S+(Pb) 200 S+(Sn) 150 100 0 Sn (Sn) 10 30 40 2 4 (Pb) 5 (Sn)+(Pb) 20 3 50 60 70 x in % 80 90 100 Pb Abbildung 3.28: Sn–Pb-Phasendiagramm: Abkühlverhalten einer Sn − 60at.-%Pb-Legierung Oberhalb von 260◦ C ist die Legierung flüssig. Das Gefügebild zeigt einzig und alleine die Schmelzphase. 1i Unterhalb von 260◦ C beginnt die feste (Pb)-Phase aus der Schmelze auszuscheiden. Im Gefüge erkennt man die Schmelze und einzelne (Pb)-Mischkristalle (Primärkristalle). 2i Der Anteil der Kristalle wird mit weiter absinkender Temperatur entsprechend dem Hebelgesetz größer. 3i Ist die eutektische Temperatur erreicht wird keine weitere (Pb)-Phase mehr ausgeschieden. In einer gewissen Zeit erstarrt bei dieser Temperatur die restliche Schmelze eutektisch. 4i Das eutektische Gefüge umgibt die zuerst erstarrten (Pb)-Mischkristalle. Das Gefüge selbst ist eine feinkörnige/lamellare Mischung aus (Sn)- und (Pb)Kristallen. 5i Kühlt man eine Schmelze mit eutektischer Zusammensetzung ab, so liegt oberhalb der eutektischen Temperatur alleine die Schmelze vor. Bei der eutektischen Temperatur bildet sich das eutektische Gefüge 2i, welches bis zu tiefen Temperaturen bestehen bleibt (s. Abb. 3.29). Im Verhalten einer Sn−10at.-%Pb-Legierung beobachtet man einen ähnlichen Ablauf, wie er für die Sn−80at.-%Pb-Legierung beobachtet wurde. Der Unterschied liegt in der primären Ausscheidung der (Sn)-Phase. Man unterscheidet zwischen hypo- und hyper-eutektisch, je nachdem, ob die Zusammensetzung vor, oder nach der eutektischen Zusammensetzung liegt. 122 KAPITEL 3. MEHRSTOFFSYSTEME T [°C] 300 S 1 1i 250 S+(Pb) 200 S+(Sn) 2 150 3 (Sn) 100 0 Sn 10 20 (Pb) 2i (Sn)+(Pb) 30 40 50 60 70 80 x in % 90 100 Pb 3i Abbildung 3.29: Sn–Pb-Phasendiagramm: Abkühlverhalten und Gefügeentwicklung einer Sn − 26at.-%Pb-Legierung T [°C] 300 1 1i S 250 S+(Pb) 2 200 (Pb) S+(Sn) 3 150 (Sn)+(Pb) (Sn) 100 0 Sn 10 2i 20 30 40 50 x in % 60 70 80 90 100 Pb 3i Abbildung 3.30: Sn–Pb-Phasendiagramm: Abkühlverhalten und Gefügeentwicklung einer Sn − 10at.-%Pb-Legierung 3.4.3 Kornseigerung Abbildung 3.31 zeigt den Abkühlvorgang einer Sn–Pb-Legierung mit Sn − 80at.-%Pb im Zustandsdiagramm Von 310◦ C bis 260◦ C läuft der Zustandspunkt der festen (Pb)-Phase entlang der Soliduslinie nach links (zu geringeren Pb-Gehalten hin) herunter. Die Phase wird daher also ständig zinnreicher und bleiärmer. Für ein aus der Schmelze kristallisierendes (Pb)-Korn bedeutet dies, dass es ständig seinen Komponentengehalt ändern muss. Aus der Schmelze müssen Sn-Atome in das Teilchen hinein diffundieren und Pb-Atome müssen umgekehrt aus dem Teilchen heraus. Dieser Prozess benötigt Zeit und zwar um so mehr, je länger der Weg ist (und auch je größer das Korn wird). So stellt sich der Gleichgewichtszustand in der Mitte des Kornes langsamer als am Rand ein. Wird die Legierung zu schnell abgekühlt, so kann der eben beschriebene Austausch nicht vollständig stattfinden und die (Pb)-Körner sind in der Mitte bleireicher als an ihren Oberflächen. Diese Erscheinung einer Konzentrationsänderung von Kornmitte zum Rand hin nennt man Kornseigerung. Sie tritt nur bei schneller Abkühlung auf. 3.4. REALE ZUSTANDSDIAGRAMME UND IHRE INTERPRETATION 123 T [°C] 300 S 250 S+(Pb) 200 S+(Sn) 150 100 0 Sn (Pb) (Sn) 10 (Sn)+(Pb) 20 30 40 50 x in % 60 70 80 90 100 Pb Abbildung 3.31: Sn–Pb-Phasendiagramm: Seigerung Die Konzentrationsverschiebung im Korn bewirkt, dass mehr Blei in dem (Pb)Mischkristall gelöst ist, als es durch die Soliduslinie vorgegeben ist. Es wird also mehr Blei in den Kristall eingebaut, als es das Phasendiagramm zuläßt. Demzufolge ist noch Restschmelze vorhanden, obwohl bei der Temperatur von 260◦ C die Schmelze schon aufgebraucht sein müsste. Der Phasenzustandspunkt der Restschmelze läuft einfach entlang der Liquiduslinie weiter nach unten (und kann unter Umständen sogar das Eutektikum erreichen). Der Zustand einer Legierung hängt aber nicht nur von den Zustandsvariablen ab, sondern auch in einem starken Maße von den Vorbedingungen, da thermodynamische Prozesse immer in endlicher Zeit ablaufen. In besonderen Fällen reicht die Zeit nicht aus, um einen Prozeß abzuschließen und die Probe ins Gleichgewicht zu überführen. Dies soll an folgendem Beispiel verdeutlicht werden: Bei T = 183◦ C sind in einer Sn–Pb-Legierung mit 1, 45at.-%Pb die Pb-Atome in Sn gelöst. Kühlt man die Probe auf 100◦ C ab, so können praktisch keine Pb-Atome mehr in (Sn) gelöst werden ( 0.1at.-%Pb). Die Pb-Atome ballen sich zu mikroskopisch kleinen Inseln zusammen und befinden sich nicht mehr in Lösung, das heißt im Mischkristall. Dieser weist dann entsprechend der Thermodynamik eine wesentlich geringere Pb-Konzentration auf, als die Probe in ihrer Gesamtheit. Diese Pb-Körner bilden sich allerdings nur, wenn man die Probe langsam genug abkühlt; geschieht dies hingegen schnell, können sich die Atome nicht mehr zu Inseln zusammenballen, da ihre Beweglichkeit stark eingeschränkt ist. Die Atome bleiben an ihren Plätzen und das Gefüge, welches der Mischkristall bei T = 183◦ C hat, wird eingefroren. Dies wirkt sich auch auf die Werkstoffeigenschaften aus. So weist eine langsam abgekühlte Legierung wesentlich höhere Festigkeitswerte auf. Die Verformung eines Metalls erfolgt durch Abgleiten von Atomebenen aufeinander. Durch das Auftreten der Inseln von Fremdatomen (= Ausscheidungen) wird dieses Abgleiten erschwert, das Material wird härter. Solche Härtungsmechanismen werden in metallurgischen Prozessen (= Wärmebehandlung) gezielt angewandt. Das Verhalten einer Legierung, deren Zusammensetzung im einphasigen Bereich liegt, zeigt nichts Spektakuläres. Zunächst kristallisiert ein Teil der Schmelze aus, sobald die Liquidustemperatur unterschritten ist, und sobald die Solidustemperatur unterschritten ist, liegt der einphasige feste 124 KAPITEL 3. MEHRSTOFFSYSTEME T [°C] 1 300 2 S 1i 250 S+(Pb) 200 S+(Sn) 150 (Pb) 3 (Sn) 100 0 Sn 10 2i (Sn)+(Pb) 20 30 40 50 60 70 80 x in % 90 100 Pb 3i Abbildung 3.32: Sn–Pb-Phasendiagramm: Abkühlverhalten und Gefügeentwicklung einer Sn − 90at.-%Pb-Legierung Zustand vor. 3.4.4 Vollmischbare Systeme Das in Abbildung 3.32 gezeigte wenig spektakuläre Verhalten wiederholt sich für Systeme mit vollständiger Mischbarkeit, wie es in Abbildung 3.33 am System Cu–Ni gezeigt wird. T [°C] 1455° S 1 1400 1200 1100 1i 2 1300 S+ α 2i 3 1085° α 1000 0 10 Cu 20 30 40 50 60 x in % 70 80 90 100 Ni 3i Abbildung 3.33: Cu–Ni-Phasendiagramm: Abkühlverhalten und Gefügeentwicklung einer Cu − 50at.-%Ni-Legierung 3.4.5 Systeme mit Mischungslücke Wie bereits besprochen gibt es noch andere Formen von Zustandsdiagrammen mit vollständiger Löslichkeit der Komponenten. In Abbildung 3.34 berühren sich Solidusund Liquiduslinie in einem Punkt mittlerer Konzentration. Als Beispiel ist das Au–NiPhasendiagramm gezeigt. Dieses Au–Ni-Phasendiagramm ist gleichzeitig ein Beispiel für eine Mischungslücke in der festen Phase. Unterhalb von T = 812◦ C sind die Komponenten nicht mehr in allen Konzen- 3.4. REALE ZUSTANDSDIAGRAMME UND IHRE INTERPRETATION T [°C] 125 1453° 1400 S 1i 1 1300 S+ α 1200 1100 2i 2 3 1063° S+ α 4 1000 3i ~42 900 α 812° 800 ~71 4i 5 700 α ’ +α " 600 0 10 Au 20 30 40 50 60 70 80 x in % 5i 90 100 Ni Abbildung 3.34: Au–Ni-Phasendiagramm: Abkühlverhalten und Gefügeentwicklung einer Au − 70at.-%Ni-Legierung trationsbereichen mischbar; mit sinkender Temperatur nimmt der Bereich der Mischbarkeit immer mehr ab und die Mischungslücke weitet sich aus. Beide Phasen werden α (also α0 und α00 ) genannt, weil sie im Zustandsdiagramm zum gleichen Phasenraum gehören. Die Striche sollen ausdrücken, daß es sich trotzdem um zwei verschiedene Phasen handelt, da die jeweiligen Komponentengehalte verschieden sind. Diese Phasen bilden eine sogenannte kohärente Grenzfläche, da die Phasen praktisch keine unterschiedlichen Gitterparameter haben. 3.4.6 Peritektische Systeme T [°C] S 3027° 3000 S+(Os) 2600° 19 2500 S+(Rh) 31 1965° 2000 1500 1000 (Os) 0 10 Os (Os)+(Rh) 20 30 (Rh) 40 50 60 x in % 70 80 90 100 Rh Abbildung 3.35: Os-Rh-Phasendiagramm: Ein Beispiel für ein (rein) peritektisches System 126 KAPITEL 3. MEHRSTOFFSYSTEME Im Fall von peritektischen Systemen kommt es genauso zur Bildung reiner Mischkristalle (Os) oder (Rh), wie es in Abbildung 3.35 gezeigt ist. Von besonderer Bedeutung ist nun die peritektisch gebildete Phase (Os) + (Rh). Peritektisch schmelzende Legierungen werden vor allem dann beobachtet, wenn die Schmelzpunkte der reinen Komponenten stark unterschiedlich sind. T [°C] 1063° 1000 900 S 800 700 S+Au 600 500 400 300 373° S+Bi S+Au2 Bi Au+Au 2Bi 266° Au 2Bi 241° 200 100 0 10 Au 20 30 81 Au2 Bi+Bi 40 50 60 x in % 70 80 90 100 Bi Abbildung 3.36: Au–Bi-Phasendiagramm Die nun folgende Beschreibung der peritektischen Phasenbildung läßt sich jedoch einfacher für eine peritektisch schmelzende Phase durchführen, die nicht einen so ausgedehnten Existenzbereich bei der peritektischen Temperatur aufweist. Daher ist in Abbildung 3.36 das Au-Bi-Phasendiagramm gezeigt. Dass sich an das Peritektikum bei 33at.-%Bi noch ein Eutektikum bei 81at.-%Bi anschließt, soll hier nicht weiter stören. Die Löslichkeit der Komponenten ineinander ist so niedrig, daß hier die (Au)-, (Bi)- und (Au2 Bi)-Phasen zu Strichen entartet sind. Die intermetallische Phase Au2 Bi zerfällt bei 373◦ C. Die von (Au) ausgehende Liquiduslinie überdeckt diese Phase, daher spricht man auch von peritektischer Überdeckung. Die Phase Au2 Bi kann nicht beim Aufheizen direkt in die Schmelze übergehen, sie zerfällt in eine feste Au-Phase und eine Au-ärmere Schmelze. Der Abkühlvorgang einer Legierung mit Au−33at.-%Bi verläuft entsprechend umgekehrt. Zuerst scheidet sich (Au) aus der Schmelze aus. Bei 373◦ C reagiert das bereits ausgeschiedene (Au) mit der Schmelze und bildet Au2 Bi. Erst wenn (Au) und die Schmelze vollständig verbraucht sind, ist die peritektische Reaktion abgeschlossen. Es liegt alleine Au2 Bi vor. Im Folgenden werden die Abkühlungen zweier charakteristischer Au-Bi-Legierungen mit Au − 20at.-%Bi und Au − 40at.-%Bi besprochen. Dabei soll die peritektische Dreiphasenreaktion mit ihrem Einfluß auf das Gefüge erläutert werden. Unterhalb der Liquidustemperatur wird (Au) ausgeschieden, während der Abkühlung 3.4. REALE ZUSTANDSDIAGRAMME UND IHRE INTERPRETATION 127 T [°C] 1000 900 1 S 800 1i 700 2 S+Au 600 2i 500 400 S+Bi 3 300 Au+Au 2Bi 100 0 10 Au 20 Au 2Bi 200 30 3i S+Au2 Bi 4 81 Au2 Bi+Bi 40 50 60 70 x in % 80 90 100 Bi 4i Abbildung 3.37: Au–Bi-Phasendiagramm: Abkühlverhalten und Gefügeentwicklung einer Au − 33at.-%Bi-Legierung wächst die (Au)-Phase ständig. Bei 373◦ C wird die Au2 Bi-Phase stabil. Jetzt reagieren die Restschmelze und die (Au)-Phase miteinander und bilden Au2 Bi. Diese neue Phase entsteht dort, wo die S- und die (Au)-Phase sich berühren, das heißt die (Au)-Kristalle werden durch die Reaktion mit der Schmelze mit einer Au2 Bi-Schicht überzogen (in den Gefügebildern die graue Phase). Von diesem Überzug stammt auch der Name des Peritektikums (= das Herumgebaute). Mit fortschreitender Reaktion wächst die Au2 Bi-Phase auf Kosten der (Au)Phase und der Schmelze. Erst wenn die Schmelze oder die (Au)-Phase verbraucht ist, endet die peritektische Phasenreaktion. Im Fall der Au − 20at.-%Bi-Legierung liegt dann nur noch die nicht umgewandelte/reagierte (Au)-Phase vor, während im Fall der Au − 33at.-%BiLegierung sowohl die Schmelze als auch die (Au)-Phase vollständig miteinander reagieren konnten und die peritektische Phase Au2 Bi gebildet haben. Läge die Zusammensetzung bei Au − 40at.-%Bi, so wäre die gesamte (Au)-Phase mit der Schmelze zu Au2 Bi reagiert, wobei in diesem Fall aber noch Schmelze übrig bliebe. Diese erstarrt dann eutektisch zu (Au2 Bi) und (Bi). 3.4.7 Allgemeine Systeme Prinzipiell lassen sich die bisher gezeigten Abkühlverhalten auf alle anderen – auch wesentlich komplizierteren – binären Phasendiagramme übertragen. Als Beispiel ist in Abbildung 3.40 das Ag-Sn-Phasendiagramm gezeigt. Hier sind vier reine feste Phasen und die Schmelze zu erkennen: α, β, γ, β-Sn und S. α ist der (Ag)-Mischkristall, der sich oberhalb von 724◦ C aus der Schmelze herstellen läßt, vorausgesetzt die Sn-Konzentration in der Schmelze ist hinreichend klein. Der Erstarrungsverlauf entspricht in diesem Bereich dem ei- 128 KAPITEL 3. MEHRSTOFFSYSTEME T [°C] 1000 1 900 S 800 2 700 1i S+Au 600 500 2i 400 3 S+Bi 300 200 Au+Au 2Bi 100 0 10 Au 20 S+Au2 Bi Au 2Bi 4 30 3i 81 Au2 Bi+Bi 40 50 60 x in % 70 80 90 100 Bi 4i Abbildung 3.38: Au–Bi-Phasendiagramm: Abkühlverhalten und Gefügeentwicklung einer Au − 20at.-%Bi-Legierung ner vollständig mischbaren Legierung – aber nur in diesem Bereich! Unterhalb von 724◦ C wird die Phase β peritektisch gebildet. Dieser Verlauf ist von der Diskussion über peritektische Zustandsdiagramme, wie z. B. Au–Bi bekannt. Hierbei gilt lediglich zu beachten, daß nur über einen Ausschnitt des Phasendiagramms diskutiert wird, anstelle des gesamten Systems. In diesem Fall wird die peritektisch gebildete Phase β im Konzentrationsbereich xSn ≤ 52at.-% betrachtet. Bei der Diskussion und Betrachtung von Schmelz- oder Erstarrungsvorgängen ist primär der Dreiphasenraum von Bedeutung. Dieser ist durch die horizontale Linie von 13, 3at.-% ≤ x Sn ≤ 21at.-% bei T = 724◦ C gegeben. In gleicher Weise findet man ein Peritektikum bei 24, 6at.-% ≤ xSn ≤ 53at.-% bei T = 480◦ C, welches im Bereich von T = 400◦ C bis 600◦ C und von 20at.-%Sn bis 60at.-%Sn betrachtet wird. Die peritektisch schmelzenden Zusammensetzungen β oder γ werden jeweils von zwei Phasen gebildet, nämlich α und S im Fall von β, sowie β und S im Fall von γ. Man findet einen dritten Bereich, der das Phasendiagramm charakterisiert, nämlich das Eutektikum bei 96, 5at.-%Sn und T = 221◦ C. Wieder betrachtet man nur einen Ausschnitt, nämlich 25at.-%Sn < x und T < 480◦ C, und kann den Ausschnitt auf die bekannte Struktur eines eutektischen Phasendiagramms zurückführen. Auf diese Weise kann jedes beliebige auch noch so komplizierte Phasendiagramm in Ausschnitte um die entsprechenden Dreiphasenräume zerlegt und verstanden werden. Bei der Präparation von Phasen, denen ein solches Zustandsdiagramm zu Grunde liegt, stellt sich die Angelegenheit schon komplizierter dar. Es wurde bereits erwähnt, dass die 3.4. REALE ZUSTANDSDIAGRAMME UND IHRE INTERPRETATION 129 T [°C] 1000 1 900 S 800 700 S+Au 1i Au 2Bi 600 500 400 2 2i 3 300 4 200 20 S+Au2 Bi 30 40 3i 81 4 Au+Au 2Bi 100 0 10 Au S+Bi Au2 Bi+Bi 50 60 x in % 70 80 90 100 Bi 4i Abbildung 3.39: Au–Bi-Phasendiagramm: Abkühlverhalten und Gefügeentwicklung einer Au − 40at.-%Bi-Legierung Phasenbildung ein thermodynamischer Prozeß ist, der viel Zeit in Anspruch nehmen kann. Will man zum Beispiel eine Phase β mit einer nominellen Zusammensetzung von 17at.-%Sn herstellen, verfährt man wie folgt. Man kühlt diese Zusammensetzung aus der Schmelze ab, somit erstarrt zunächst α, bis sich die Zusammensetzung der Schmelze bis zum peritektischen Punkt (xSn = 21at.-%) verschoben hat. An dieser Stelle reagieren α und S zu β, bis α komplett umgewandelt wurde. Dieser Vorgang kann sehr lange dauern. Kühlt man die Legierung weiter ab, bevor der Vorgang abgeschlossen ist, wird immer ein Anteil primär erstarrten α-Mischkristalles im Gefüge zu finden sein. Da aber in diesem Fall mehr Schmelze vorhanden ist, als nötig wäre, um die gesamte α-Phase umzuwandeln, wird der Prozeß schneller voranschreiten. In dem Fall, in dem direkt die peritektische Zusammensetzung xSn = 14, 5at.-% kristallisieren soll, kann die Verweildauer extrem lang sein, da die ganze Probe in ihrem Volumen homogenisiert werden muss, während in dem besprochenen Fall lediglich die SnKonzentration über eine gewisse Schwelle geschoben werden muss. Kühlt man die Legierung weiter ab, so scheidet sich β aus der Schmelze aus, bis die Konzentration der β-Phase einen so großen Wert angenommen hat, dass alle Schmelze umgewandelt wurde. Es liegt nun ein reiner β-Mischkristall vor, der noch Konzentrationsschwankungen aufweist, die leicht durch Glühbehandlungen ausgeglichen werden können. Die Präparation der γ-Phase verläuft äquivalent. Will man hingegen eine ausscheidungsgehärtete β + γ-Phase herstellen, benötigt man noch mehr Zeit, da man diese nicht direkt aus der Schmelze herstellen kann. Zunächst wird β auskristallisiert (wie im Fall der Au − 20at.-%Bi-Legierung), das mit der Schmelze zu γ reagiert, aber im Überschuß vorliegt, 130 KAPITEL 3. MEHRSTOFFSYSTEME 26.5 sodass noch β-Phase vorhanden bleibt, wenn die gesamte Schmelze mit β zu γ umgewandelt wurde. Jede Zusammensetzung im Bereich T [°C] 960.5° 52 < xSn < 100at.-% erstarrt eutek900 S+ α tisch zu γ und (β − Sn). ZusammenS setzungen im Bereich 26, 5 < xSn < 800 724° 52at.-% sollten dies auch tun, wobei 21 13.3 700 auch hier wieder ein hinreichend langsa14.5 mer Präparationsverlauf vorausgesetzt 600 α S+ β β wird. In diesem Bereich kristallisiert 480° 52 500 24.6 nämlich zunächst die β-Phase aus, die S+ γ 400 dann wieder mit der Schmelze zur γγ α+β Phase umgewandelt werden muss. Sie 300 β+γ 232° S+( β −Sn) 221° bleibt jedoch als Gefügebestandteil er96.5 200 halten, wenn die peritektische Phasen( β−Sn) γ+( β−Sn) reaktion nicht abgeschlossen ist, bevor 100 0 10 20 30 40 50 60 70 80 90 100 die Legierung unter die peritektische Ag x in % Sn Temperatur von T = 480◦ C abgekühlt wurde. Abbildung 3.40: Ag–Sn-Phasendiagramm Will man den Prozess, eine peritektische Phase zu erstarren, beschleunigen, so muss man erreichen, dass die Schmelze eine andere Zusammensetzung hat als die festen Phasen. Darüberhinaus müssen diese Zusammensetzungen (peritektische für die feste Phase und die Zusammensetzung des peritektischen Punktes für die Schmelze – 14, 5at.-%Sn für β und 21at.-%Sn für S) während des ganzen Kristallisationsvorganges konstant bleiben. Nach dem bisher Bekannten ist dies unmöglich, da eine Schmelze an einer Komponente angereichert wird, sobald Bestandteile kristallisieren, die eine geringere Konzentration dieser Komponente aufweisen. Der Ausweg ist z. B. das Zonenschmelzen. Nährstab und Ziehstab haben die peritektische Zusammensetzung, während die flüssige Zone dazwischen die Zusammensetzung des peritektischen Punktes aufweist. Nun braucht man nur noch dafür zu sorgen, dass immer gleich viel Material in die Schmelze nachgeführt wird, wie auskristallisiert. Weiterhin muss das Volumen der Schmelzzone konstant gehalten werden, was sich in der Praxis oft als die größte Herausforderung erweist. Hierdurch wird ein stationärer Zustand erreicht, mit dem man peritektische Phasen schnell und in größerer Menge kristallisieren kann. 3.4.8 Beispiel: Stahl Stahl spielt in der Technologie von heute eine wichtige Rolle, daher ist das zu Grunde liegende Fe–C-Phasendiagramm so wichtig, dass es an dieser Stelle vorgestellt wird. Das Zustandsdiagramm wird im Wesentlichen durch das Eutektikum bei 4.26wt.-%C und die eutektoide Reaktion bei 0.69wt.-%C bestimmt. Die einzelnen Phasenräume haben besondere Namen: • Ledeburit: Eutektikum bei 4.26wt.-%C, sowie die Phasen dieser Zusammensetzung • Perlit: eutektoide Reaktion bei 0.69wt.-%C 3.4. REALE ZUSTANDSDIAGRAMME UND IHRE INTERPRETATION T [°C] 1600 δ 1400 α − Ferrit γ − Austenit δ+ L χ − Cementit δ − delta Eisen L δ+γ 1200 131 γ+ L L+ Fe 3 C γ 1000 γ+ Fe 3 C 800 α+γ 600 α α+ Fe 3 C 400 Stahl 0 Fe 0.69 Gußeisen 2 4 w in % 6.67 C Abbildung 3.41: Das Fe–C- oder auch Stahl-Phasendiagramm • Ferrit: reines Eisen unterhalb von 911◦ C (bcc) • δ-Fe: bcc-Hochtemperaturphase des Eisens • Austenit: fcc-Phase des Eisens zwischen den beiden vorher genannten • Zementit: scheidet sich mit x > 4.26wt.-%C eutektisch aus der Schmelze aus (Fe3 C) • Martensit: entsteht aus Austenit bei schneller Abkühlung Eigenschaften Ferrit – Perlit – Zementit → Festigkeit und Sprödigkeit nimmt zu → Umform- und Zerspanbarkeit nimmt ab Der Zusatz von Kohlenstoff in Eisen erweitert das γ-Feld des Austenit und schließt den Existenzbereich von α auf der Temperaturachse. Maximal 2wt.-%C lösen sich in γ, aber nur 0, 02wt.-%C in α. Dies liegt an der Größe der Zwischengitterplätze, die in fcc-, beziehungsweise in bcc-Phasen, zur Verfügung stehen. Ternäre (und noch mehrkomponentigere) Eisenlegierungen mit interstitiellen C-Atomen und weiteren substitutionellen Legierungszusätzen spielen als Edelstähle eine technisch bedeutende Rolle. Die Zusätze verändern das γ-Feld in verschiedener Weise. • Die γ-Öffner (Ni, Co, Mn) ergeben austenitische, oft gut verformbare und rostfreie Stähle. • Die γ-Schließer (Al, Si, Ti, Mo, V, Cr, Nb) bilden Karbide und intermetallische Phasen mit α-Eisen. 132 KAPITEL 3. MEHRSTOFFSYSTEME 3.5 Diffusion 3.5.1 Einleitung Ein Festkörper ist kein statisches System von Atomen, welche an fixen Gitterplätzen angeordnet sind, wie es die für die kristallographische Beschreibung von Materialien angenommen wurde. Vielmehr gehen die Einzelatome des Festkörpers mit ihren Nachbarn Bindungen ein (deren genaue Natur hier nicht wichtig ist), indem die elektronischen Systeme der Atome miteinander in Wechselwirkung treten. Dieser Übergang von einem starren Gitter zu einem dynamischen System elektronischer Bindungen ist in Abbildung 3.42 schematisch durch das Ersetzen des starren Kristallgitters (Abbildung 3.42(a)) mit Federn (Abbildung 3.42(b)) dargestellt. Abbildung 3.42: Übergang vom starren, kristallographisch idealen, zum dynamischen Festkörper (a) Starre Atompositionen am idealen Kristallgitter (b) Nächste Nachbarbindungen, schematisch dargestellt durch Federn Aus Abbildung 3.42b wird intuitiv sofort klar, dass, sobald auch nur ein Atom durch irgendeine Störung die Ruhelage verlässt, das gesamte System in Schwingungen versetzt wird. Diese Gitterschwingungen, welche (quantisiert) als Phononen bezeichnet werden, spielen in der Festkörperphysik eine große Rolle. Wodurch kommt es zur Auslenkung der Festkörperatome aus ihren Ruhelagen? Die Antwort auf diese Frage ist einfach. Ähnlich wie beim idealen Gas, bei dem die Temperatur durch die mittlere kinetische Energie der Gasatome gegeben ist, so ist auch die Temperatur des Festkörpers durch die mittlere Schwingungsenergie seiner Atome um ihre Ruhelage gegeben. Je höher die Temperatur des Festkörpers ist, desto mehr Gitterschwingungen (oder Phononen) werden angeregt. Wie groß ist die Frequenz der Gitterschwingungen, ν0 ? Im Folgenden soll diese Kenngröße kurz abgeschätzt werden, da sie eine wichtige Rolle für alle Vorgänge von Materialtransport in Festkörpern, wie sie unter dem Überbegriff Diffusion zuammengefasst werden, spielt. Im Festkörper ist ein Atom in etwa mit 2 eV = 2 · 1.602 · 10−19 J an seinen nächsten Nachbarn gebunden. Geht man von einem einfachen kubischen Gitter aus, so hat jedes Atom sechs nächste Nachbarn, seine gesamte Bindungsenergie, EB beträgt also 12 eV = 3.5. DIFFUSION 133 12 · 1.602 · 10−19 J = 1.922 · 10−18 J. Eine gute Näherung für den Abstand der nächsten Nachbarn ist ca. 3 Å = 3 · 10−10 m. Die Masse des Atoms, m, sei mit 10−25 kg gegeben. Das entspricht ca. 60 atomaren Masseneinheiten und damit einem typischen d-Metall wie z. B. Cu. Die potentielle Energie eines Atoms, E(x) um seine Ruhelage, x0 , wird mit einem parabolischen Oszillatorpotential der Form C · (x − x0 )2 (3.53) 2 mit der Federkonstante C angenommen. Um ein Atom um einen Gitterabstand von seiner Ruhelage zu entfernen, sei es nötig, die gesamte Bindungsenergie EB aufzubringen. Mit Gleichung 3.53 ergibt sich mit Hilfe der Beziehung für die Kreisfrequenz ω0 der Schwingung, s r C 2EB ω0 = = (3.54) m m · (x − x0 )2 E(x) = schließlich ω0 1 ν0 = = · 2π 2π s 2EB m · (x − x0 )2 für die Phononenfrequenz ν0 . Einsetzen der obigen Zahlenwerte liefert s 1 2 · 1.922 · 10−18 [J] · = 3.28 · 1012 [Hz]. ν0 = 2π 10−25 [kg] · (3 · 10−10 [m])2 (3.55) (3.56) Dieses Ergebnis ist, angesichts des einfachen Modells, erstaunlich gut, da sich typische Phononenfrequenzen in der Größenordnung zwischen 1012 und 1013 Hz bewegen. Die vorhergehenden Betrachtungen haben gezeigt, dass ein Festkörper ein hochdynamisches System kondensierter Materie ist. Die permanente Bewegung der Atome kann aber nicht nur um die Ruhelage erfolgen, sondern kann auch zum Materialtransport durch Diffusion innerhalb des Kristalls beitragen. Atomistische Diffusionsmodelle sollen im Folgenden Abschnitt besprochen werden. 3.5.2 Atomistische Diffusionsmechanismen Der elementarste Schritt des Materialtransportes in einem Festkörper ist die Bewegung eines einzelnen Atoms von einem Bindungsplatz zu einem anderen. Solche Platzwechselvorgänge können durchaus in Reinmaterialien auftreten. Um eine solche Situation bildhaft darzustellen, geht man zunächst von einem idealen Material in seiner elementaren Form aus. Die einzige Voraussetztung, die gemacht wird, ist, dass es möglich ist, einzelne Atome zu verfolgen, d. h. sie in irgendeiner Art und Weise zu markieren. Für einen idealen Festkörper völlig ohne Defekte ist allerdings ein Platzwechselvorgang von zwei Atomen schwer zu realisieren. Es müsste dabei ein Atom so weit aus seiner Gleichgewichtslage ausgelenkt werden, dass es einen Zwischengitterplatz so lange innehat, bis ein benachbartes Atom auf die so entstandene Fehlstelle nachrückt und das ausgelenkte Atom schließlich den Platz des nachrückenden Atoms 134 KAPITEL 3. MEHRSTOFFSYSTEME einnimmt. Ein solcher Vorgang, wie er in Abbildung 3.43(a)–(c) dargestellt ist, beinhaltet so viele kurzzeitig eingenommene Zwischenzustände (sogenannte transiente Zustände“), dass ” er de facto nicht auftritt. Abbildung 3.43: Elementarschritte zum Austausch zweier Teilchen in einem idealen, einatomigen Festkörper (a) Anfangszustand (b) Transienter Zustand (c) Endzustand Ein wesentlich offensichtlicherer Platzwechselvorgang ist in Abbildung 3.44 dargestellt. Abbildung 3.44: Elementarer Diffusionsschritt in einem idealen einatomigen Festkörper mit einer Leerstelle (a) Anfangszustand (b) Endzustand Hier wird davon ausgegangen, dass der Kristall zwar immer noch eine Atomsorte, aber auch Punktdefekte in Form von Fehlstellen enthält. In diesem Fall kann ein einzelnes Atom sich wesentlich leichter von seiner Gleichgewichtsposition entfernen und den Platz der Fehlstelle einnehmen. Die Fehlstelle ist in die entgegengesetzte Richtung gewandert. Aus dem qualitativen Vergleich der in Abbildung 3.43 und 3.44 dargestellten Elementarschritte kann man eine sehr wichtige Tatsache ableiten: Materialtransport durch Diffusion wird in einem 3.5. DIFFUSION 135 Festkörper immer in Regionen stattfinden, die reich an Defekten sind. In defektarmen Bereichen wird hingegen kaum diffusiver Materialtransport auftreten. Defektreiche Regionen eines Festkörpers sind z.B. Korngrenzen jeder Art, Grenzflächen zwischen verschiedenen Materialien oder auch Festkörperoberflächen. Wie läuft ein einzelner Diffusionssprung im Detail ab? Betrachtet man den Anfangszustand eines Festkörpers vor dem Diffusionssprung wie er z.B. in Abbildung 3.44(a) gegeben ist, so kann diesem Anfangszustand eine Gesamtenergie des Systems zugeordnet werden. Diese errechnet sich aus den Wechselwirkungsenergien aller im System vorhandenen Teilchen. In der Festkörperphysik muss zur Berechnung der Gesamtenergie nur“ das elektronische ” System berücksichtigt werden, was allerdings mathematisch aufwendig genug ist (Lösung der Schrödingergleichung für ein Vielteilchensystem). Stabil ist ein Zustand dann, wenn leichte Auslenkungen der einzelnen Atome in eine beliebige Richtung immer eine Erhöhung der Gesamtenergie zur Folge haben. Gleichzeitig ist allerdings aus Abbildung 3.44 auch klar ersichtlich, dass die Gesamtenergien der in 3.44(a) und Abbildung 3.44(b) dargestellten Zustände gleich sein müssen (wenn man davon ausgeht, dass sich der Festkörper in alle Richtungen unendlich weit ausdehnt). Verschiebt man nun ein Atom mit Gewalt“ entlang eines bestimmten Pfades, so ergibt sich die in Abbildung ” 3.45 dargestellte Situation. Abbildung 3.45: Gesamtenergie E des Systems aus Abbildung 3.44 bei Verschiebung eines Atomes entlang entlang des mit x bezeichneten Pfeiles (a) Positionen entlang des Pfades (b) Energie entlang des Pfades Bei der Bewegung des markierten Einzelatomes entlang des Pfeiles (dieser entspricht der x-Achse in Abbildung 3.45) durchquert das System, ausgehend von Punkt A, sukzessive Zustände mit immer größer werdender Gesamtenergie E. In Punkt B nimmt E ein Maximum an. Ab dann sinkt E wieder, bis es in Punkt C den gleichen Wert annimmt wie in Punkt A. Die in 3.45(b) skizzierte energetische Situation ist eine sehr generelle: benachbarte Minima in der Gesamtenergie eines Systemes sind durch eine Potentialbarriere einer bestimmten Höhe getrennt. Die Höhe der Potentialbarriere wird Aktivierungsenergie genannt. Allgemein ist die Situation in Abbildung 3.46 dargestellt. Aus Abbildung 3.46 ist ersichtlich, dass die Absolutwerte der Gesamtenergie der benachbarten stabilen Zustände, EA und EC nicht notwendigerweise gleich sind und daher die 136 KAPITEL 3. MEHRSTOFFSYSTEME Abbildung 3.46: Allgemeine energetische Situation für ein beliebiges System zweier benachbarter stabiler Zustände A und C. Die Energien EA und EC müssen nicht gleich sein. zu überwindende Aktivierungsenergie für den Übergang A → C, EAC , nicht gleich ist der Aktivierungsenergie für C → A, ECA (Abbildung 3.46). Wodurch können die Festkörperatome so weit aus ihrem lokalen Gleichgewichtszuständen ausgelenkt werden, dass sie die Aktivierungsbarrieren überwinden können? Diese Energie stammt aus dem thermischen Reservoir des Festkörpers. Generell wird sich dabei folgende Situation ergeben: Die Festkörperatome werden lange Zeit erratisch um ihre stabilen Ruhelagen schwingen, bis eine zufällige Überlagerung von Gitterschwingungen ein Atom so weit von seiner ursprünglichen Gleichgewichtsposition auslenkt, dass es eine neue Gleichgewichtsposition einnehmen kann. Aus dieser qualitativen Betrachtung ergibt sich folgende Frage: Wie oft in der Zeiteinheit kommt ein solches Diffusionsereignis vor. Die Anzahl der Diffusionsereignisse pro Zeiteinheit wird als Diffusionsrate, νDif f , bezeichnet. Im vorher beschriebenen Modell wird sie nur von zwei Größen beeinflusst: der Temperatur des Festkörpers, T , und der Aktivierungsenergie, EA . Geht man davon aus, dass die Taktfrequenz“, mit der die Atome um ihre Ruhelagen ” schwingen der in Gleichung 3.56 abgeschätzten Phononenfrequenz ν0 entspricht, so ergibt sich E − A (3.57) νDif f = ν0 · e kB ·T mit Hilfe der Boltzmann’schen Wahrscheinlichkeitstheorie, da es sich um einen thermisch aktivierten Prozess handelt. Aus Gleichung 3.57 erkennt man sofort die exponentielle Abhängigkeit von νDif f von EA bzw. von T . Um ein Gefühl für den Einfluss von T auf νDif f zu bekommen soll folgende kurze Abschätzung durchgeführt werden; es gelte EA = 1 eV = 1.602 · 10−19 J, kB = 1.30 · 10−23 J/K und ν0 = 1013 Hz: T = 300 K (=27◦ C) ⇒ νDif f = 1.5 · 10−4 Hz T = 1000 K (=727◦ C) ⇒ νDif f = 9 · 107 Hz Das bedeutet, dass eine Temperaturänderung von nicht einmal einer Größenordnung die Diffusionsfrequenz um 11 (!) Größenordnungen verschiebt. Es ist daher nicht verwunderlich, dass Temperaturbehandlungen zu den effizientesten Methoden gehören, um gezielt Materialtransport in Festkörpern auszulösen. 3.5. DIFFUSION 137 Wie erfolgt der Materialtransport im Detail? Gleichung 3.57 trifft zwar eine Aussage über die Häufigkeit, nicht aber über die Richtung der aufeinanderfolgenden Diffusionssprünge. Geht man davon aus, dass diese nicht miteinander korreliert sind, d. h. dass die Richtung des nachfolgenden Sprunges nicht von der des vorhergehenden Sprunges abhängt, so ist es für ein kubisches Gitter einfach, den nach N Diffusionssprüngen im Mittel zurückgelegten Weg hli zu berechnen. In Abbildung 3.47 ist die Situation für ein zweidimensionales quadratisches Gitter von möglichen Gleichgewichtspositionen, welche das diffundierende Atom einnehmen kann, dargestellt. Abbildung 3.47: Unkorrelierte Abfolge von Diffusionsbewegungen in einem 2-dimensionalen Gitter. Punkte entsprechen atomaren Gleichgewichtspositionen. a . . . Gitterkonstante l . . . effektiver zurückgelegter Weg Die Erweiterung auf ein kubisches Gitter ist einfach, daher soll die folgende Rechnung auch für den dreidimensionalen Fall durchgeführt werden. Bezeichnet man die Gitterkonstante des kubischen Gitters mit a, so kann sich das diffundierende Teilchen in x-, y- und z-Richtung beim i-ten Diffusionsschritt jeweils um ∆xi = ∆yi = ∆zi = ±a bewegen. Nach N Diffusionsschritten ist der gesamte zurückgelegte Weg des Teilchens N · a, wirklich von seinem Ausgangspunkt hat es sich aber nur die Strecke l wegbewegt (Abbildung 3.47). Die Frage ist nun, wie groß der Mittelwert von l, im folgenden mit hli bezeichnet, nach N Diffusionssprüngen ist. Für ein bestimmtes l gilt: l2 = Nx X !2 ∆xi + i=1 Ny X !2 ∆yi + i=1 Nz X !2 (3.58) ∆zi i=1 und, daraus folgend l2 = Nx X i=1 ∆xi · Nx X j=1 ! ∆xj + Ny X i=1 ∆yi · Ny X j=1 ! ∆yj + Nz X i=1 ∆zi · Nz X ! ∆zj (3.59) j=1 Dabei sind Nx , Ny und Nz die jeweiligen Sprungzahlen in x-, y- und z-Richtung. Die Bildung des Mittelwertes über ein Ensemble von l2 liefert bei korrekter Berechnung der 138 KAPITEL 3. MEHRSTOFFSYSTEME Quadrate in Gleichung 3.59 mit ∆xi = ∆yi = ∆zi = ±a 2 l = *N x X i=1 + ∆x2i + * Ny X i=1 + ∆yi2 + *N z X + ∆zi2 = (3.60) i=1 = (Nx + Ny + Nz ) · a2 = N · a2 . Die gemischten Glieder verschwinden bei der Mittelwertbildung, da bei einer unkorrelierten Bewegung genauso viele Schritte in positive wie in negative Richtungen durchgeführt werden. 2 Näherungsweise gilt für ein großes Ensemble von l die Beziehung hl2 i ∼ = hli und man gelangt schließlich zu folgender Abhängigkeit des effektiv zurückgelegten Weges hli von der Anzahl der Diffusionssprünge, N : √ (3.61) hli = N · a. Die Beziehung hl2 i = N · a2 kann auch folgendermaßen interpretiert werden: In Gleichung 3.57 wurde die Sprungfrequenz eines Atoms, d. h. die Anzahl der Diffusionssprünge pro Sekunde gegeben. Es gilt E 2 − A l in1s = ν0 · a2 · e kB ·T . (3.62) Für unser aus Gleichung 3.57 abgeleitetes Rechenbeispiel (EA = 1 eV = 1.602 · 1019 J, kB = 1.38 · 10−23 J/K, ν0 = 1013 Hz, a = 3 · 10−10 m) bedeutet Gleichung 3.61, dass ein Teilchen bei Raumtemperatur de facto ortsfest bleibt, während es bei 1000 K in einer Sekunde eine Strecke von ca. 3µm zurücklegt, wie man durch Einsetzen der gegebenen Zahlenwerte in Gleichungen 3.61 und 3.62 leicht verifizieren kann. Gleichung 3.62 ist weiters die Definition des Diffusionskoeffizienten D für ein einzelnes Teilchen. E − A [m2 · s−1 ]. (3.63) D = ν0 · a2 · e kB ·T Für die Berechnung der Strecke, welche das Teilchen in einer Zeit τ zurücklegt, gilt bei Kombination der Gleichungen 3.60, 3.61, 3.62 und 3.63 die sogenannte Einstein-Beziehung, √ l = D · τ. (3.64) Der Diffusionskoeffizient ist jene zentrale Größe, welche die Beziehung zwischen makroskopischen Diffusionsmodellen und mikroskopischen Diffusionsmechanismen herstellt, wie im nächsten Abschnitt gezeigt werden soll. 3.5.3 Diffusion in kontinuierlichen Systemen Die makroskopische Diffusionstheorie, deren Grundgleichung die Diffusionsgleichung ist, beschreibt den Ausgleich von Konzentrationsgradienten in vollständig mischbaren Materialkombinationen. Sie kann auch auch auf Systeme angewendet werden, in denen die einzelnen Komponenten chemische Verbindungen bilden, allerdings sind dann die aus dem Phasendiagramm des Mischsystemes folgenden energetischen Gegebenheiten zu beachten. Im Falle des im vorhergehenden Abschnitt besprochenen Prozesses des Materialtransportes durch den 3.5. DIFFUSION 139 Austausch von Fehlstellen mit Atomen ist weiters zu sagen, dass zur vollständigen Beschreibung dieses Vorganges eigentlich zwei Diffusionsgleichungen, jene für den Strom der Atome und jene für den Strom der Fehlstellen, angegeben werden müssten. Da die beiden Ströme jedoch gleich groß (wenn auch entgegengesetzt) sind, muss nur eine Gleichung betrachtet werden. Dies gilt generell für alle Diffusionsmechanismen, welche auf Teilchenaustausch basieren. Die zentrale Annahme zur Herleitung der linearen Diffusionsgleichung ist, dass ein räumlicher Konzentrationsgradient einen Materialstrom hervorruft, welcher direkt proportional und entgegengesetzt zu diesem Gradienten ist. Dies ist das sogenannte erste Fick’sche Diffusionsgesetz, ∂c (3.65) J = −D ∂x in einer Dimension bzw. J = −D · ∇c (3.66) für das dreidimensionale Problem. D ist der Diffusionskoeffizient, das negative Vorzeichen stellt sicher, dass der Konzentrationsgradient ausgeglichen und nicht verstärkt wird. Zur Herleitung der zeitabhängigen Diffusionsgleichung, welche auch manchmal als zweites Fick’sches Gesetz bezeichnet wird, ist es nötig, die Reaktion des Diffusionsflusses auf eine zeitliche Änderung der Konzentration zu berechnen. Dies geschieht mittels der Kontinuitätsgleichung, welche die Änderung der Konzentration in einem Volumen mit den Flüssen, welche durch die Grenzflächen des Volumens treten, korreliert. Die Situation ist für das eindimensionale Problem für ein Volumen V der linearen Ausdehnung dx in Abbildung 3.48 dargestellt. Abbildung 3.48: Schematische Darstellung der Verhältnisse zur Ableitung von Gleichung 3.67 Für einen kontinuierlichen Materialtransport ohne Akkumulationen muss gelten, dass jede zeitliche Änderung der Konzentration c im Volumen gleich dem Fluss durch die das Volumen begrenzenden Einheitsflächen, P und P 0 , sein muss. Für die in Abbildung 3.48 dargestellten Flussrichtungen bewirkt ein grösserer Fluss durch P 0 eine Verringerung der Konzentration und umgekehrt, sodass gilt: ∂c ∂J =− ∂t ∂x (3.67) 140 KAPITEL 3. MEHRSTOFFSYSTEME . Die Kombination mit den Gleichungen 3.65 bzw. 3.66 ergibt schlussendlich die Diffusionsgleichung ∂c ∂2c =D· 2 (3.68) ∂t ∂x im eindimensionalen Fall bzw. ∂c = D · ∆c (3.69) ∂t 2 2 2 ∂ ∂ ∂ für den dreidimensionalen Fall (∆ ist hier der Laplace-Operator, ∆ = ∂x 2 + ∂y 2 + ∂z 2 in kartesischen Koordinaten). Wie kann die Beziehung zwischen dem in der Kontinuumstheorie eingeführten empirischen Diffusionskoeffizienten D (Gleichungen 3.65 und 3.69 bzw. deren dreidimensionale Varianten) und dem aus atomistischen Überlegungen abgeleiteten Ausdruck in Gleichung 3.63 hergestellt werden? Diese Frage reduziert sich darauf, ob der in Gleichung 3.64 hergeleitete Zusammenhang zwischen dem Diffusionskoeffizienten und der in einer Zeit τ von einem Teilchen zurückgelegten Wegstrecke aus der Diffusionsgleichung abgeleitet werden kann. Dazu geht man von folgender Modellvorstellung aus: Im eindimensionalen Fall kann ein Teilchen, welches sich zu τ = 0 an der Position x0 = 0 befindet, als δ-förmiges Konzentrationsprofil c(x, t) dargestellt werden: c(x, t = 0) = Q · δ(x − x0 ) = Q · δ(x). Eine Lösung der Diffusionsgleichung, welche diese Anfangsbedingung erfüllt, ist 2 Q −x √ c(x, t) = , · exp 4Dt 2 · πDt (3.70) (3.71) da man einerseits zeigen kann, dass 2 ∂ 2 c(x, t) −x ∂c(x, t) Qx2 Q =D· = exp · √ 3/2 5/2 − √ ∂t ∂x2 4Dt 8 πD t 2 πDt3/2 (3.72) sowie andrerseits dass für auch für t → 0 gilt Z∞ c(x, t) · dx = Q, (3.73) −∞ was bedeutet, dass die Materialmenge Q (welche in unserem Fall immer dem Volumen des einzelnen Teilchens entspricht), der Fläche unter der Konzentrationskurve entspricht und für t = 0 im Punkt x = 0 konzentriert ist. Die aus Gleichung 3.72 resultierende Kurvenschar ist ein Satz von Gauß’schen Glockenkurven, deren Halbwertsbreite von t abhängt, wie Abbildung 3.49 zeigt. Im Falle eines einzelnen Teilchens kann die Konzentrationsverteilung c(x, t) (ähnlich wie in der Quantenmechanik) als die Wahrscheinlichkeit interpretiert werden, zum Zeitpunkt t 3.5. DIFFUSION 141 Abbildung 3.49: Graphische Darstellung der in Gleichung 3.71 gegebenen Funktion c(x, t) das Teilchen in einem Ortsintervall x + dx vorzufinden. Bezeichnet man diese Wahrscheinlichkeit mit p(x, t), so gilt h 2i √Q · exp −x · dx 4Dt 2· πDt p(x, t)dx = R∞ (3.74) −x2 , √Q · exp 4Dt 2· πDt −∞ wobei das Integral im Nenner sicherstellt, dass Z∞ p(x, t) · dx = 1, (3.75) −∞ d. h., dass die Wahrscheinlichkeit, das Partikel irgendwo im ganzen Raum zu finden, gleich eins ist. Zur Berechnung des mittleren Abstandsquadrates, wie es in Gleichung 3.60 für die unkorrelierte Zufallsbewegung auf einem quadratischen Gitter durchgeführt wurde, bildet man Z∞ 2 ∆x = x2 · p(x, t) · dx (3.76) −∞ und erhält aus Gleichungen 3.74 und 3.76 mit der Substitution ξ 2 = R∞ R∞ 2 √ √ hungen exp(−ξ 2 ) · dξ = π und ξ · exp(−ξ 2 ) · dξ = π/2 −∞ x2 4Dt sowie den Bezie- −∞ ∆x2 = 2Dt (3.77) in völliger Analogie zu Gleichung 3.64, wenn man von dem Faktor 2 absieht, um welchen sich Gleichung 3.64 und Gleichung 3.77 unterscheiden. Dieser resultiert daraus, dass für die 142 KAPITEL 3. MEHRSTOFFSYSTEME Berechnung von hl2 i in Gleichung 3.60 die direkte Verbindung vom Startpunkt des Teilchens bis zu seiner Position nach N Schritten im Mittel berechnet wurde, während das in Gleichung 3.77 berechnete h∆x2 i die Halbwertsbreiten der aus Gleichung 3.71 resultierenden Gauß’schen Glockenkurven (Abbildung 3.49) repräsentiert. Der Diffusionskoeffizient D, welcher in der Diffusionsgleichung 3.68 bzw. 3.69 als empirischer Parameter auftritt, konnte also über die Einsteinbeziehung mit mikroskopischen Kenngrößen wie der Phononenfrequenz oder der Aktivierungsenergie für einen atomaren Platzwechsel verbunden werden. Kennt man diese mikroskopischen Parameter, so lässt sich aus ihnen D berechnen und in weiterer Folge die Diffusionsgleichung für ein beliebiges anfängliches Konzentrationsprofil c(x0 , t0 ) lösen. Diese Kopplung von mikroskopischen Mechanismen an Kontinuumsgleichungen ist in der Materialphysik sehr häufig. Es ist nämlich, trotz extrem gestiegener Rechnerkapazitäten, immer noch unmöglich, das dynamische Verhalten von Systemen mit Teilchenzahlen N in der Größenordnung von N = 1023 mittels atomarer Modelle (Schrödingergleichung, Molekulardynamik) zu berechnen. Manchmal ist es auch nicht möglich, direkt von einem atomistischen Modell zur Kontinuumsgleichung zu gelangen, sondern es müssen mehrere Zwischenmodelle aneinander gekoppelt werden, um den Brückenschlag von der atomaren Skala zum makroskopischen Materialverhalten zu ermöglichen. Diese Methodik wird oft als hierarchischer Ansatz, mehrstufige Simulation, oder, im Englischen, als Multilevel model“ bezeichnet. ” Im folgenden Abschnitt soll eine andere Kopplung zweier Modelle, nämlich der Diffusionsgleichung an die Phasendiagramme verschiedener Mehrstoffsysteme, besprochen werden. 3.5.4 Diffusion und Phasendiagramme Der einfachste Fall für das Ineinanderdiffundieren zweier Substanzen ist der eines Systems aus zwei vollständig miteinander mischbaren Materialien, A und B. Analog wie bei der Herleitung der Kontinuitätsgleichung 3.67 betrachtet man zwei unendlich lange Halbvolumina, deren Querschnitt der Einheitsfläche entspricht. Diese mögen bei x = 0 aneinanderstoßen. Zu t = 0 sei Material A im linken Teilbereich konzentriert und Material B im rechten Teilbereich, wie Abbildung 3.50a schematisch zeigt. Abbildung 3.50: Schematische Darstellung eines Diffusionspaares aus den Reinmaterialien A und B (a) experimentelle Anordnung (b) anfängliches Konzentrationsprofil 3.5. DIFFUSION 143 Eine solche Anordnung wird Diffusionspaar (englisch: Diffusion Couple“) genannt. Ab” bildung 3.50b zeigt die anfänglichen Konzentrationsprofile cA (x, t = 0) und cB (x, t = 0). Für cA gelten die Anfangsbedingungen x < 0 : cA (x, t = 0) = 1, x = 0 : cA (x, t = 0) = 0.5 sowie x > 0 : cA (x, t = 0) = 0 (3.78) x < 0 : cB (x, t = 0) = 0, x = 0 : cB (x, t = 0) = 0.5 sowie x > 0 : cB (x, t = 0) = 1. (3.79) und für cB analog Unter der Annahme, dass die Diffusionskoeffizienten in beiden Materialien gleich sind, sind die Diffusionsströme von A → B und B → A gleich groß und entgegengesetzt. Daher ist es möglich, sich auf ein Konzentrationsprofil zu beschränken. Im Folgenden soll daher nur cA betrachtet werden. Die Lösung der Diffusionsgleichung unter der Anfangsbedingung 3.78 und 3.79 ergibt sich zu x 1 √ (3.80) cA (x, t) = 1 − erf , 2 2 · Dt wobei erf 2·√xDt die Gauss’sche Fehlerfunktion ist. Für erf (ξ) gilt: erf (ξ) = 2 √ π Zξ exp −η 2 dη, (3.81) 0 erf (−ξ) = −erf (ξ) erf (∞) = 1 Die in Gleichung 3.80 gegebene Lösung wurde aus dem Ansatz erhalten, dass sich das Verhalten von cA (x, t) aus der Überlagerung von Funktionen des Types 3.71 ergibt. Dies entspricht einer Ansammlung von Punktquellen des Materials A, welche sich im Bereich von x < 0 befinden und zu t = 0 beginnen, gemäß Gleichung 3.71 zu zerfließen“. Mathematisch ent” spricht diese Vorgangsweise der Lösung der Diffusionsgleichung mit Hilfe der sogenannten Green’schen Funktion, welche durch 3.71 gegben ist. √ Das Verhalten von Gleichung 3.80 für verschiedene Werte von Dt ist in Abbildung 3.51 gegeben. Aus Abbildung 3.51 ist ersichtlich, dass es nach einer hinreichend langen Zeit zu einer vollständigen Durchmischung der beiden Komponenten kommt. Die Konzentrationen cA und cB haben sich im gesamten Material auf cA = cB = 0.5 eingestellt. Allerdings gilt, wie bereits erwähnt, dieser Lösungsansatz nur für vollständig mischbare Substanzen. Die Situation für Materialien, welche nur teilweise untereinander mischbar sind, wird im Folgenden behandelt. 144 KAPITEL 3. MEHRSTOFFSYSTEME Abbildung 3.51: Räumliches und zeitliches Verhalten des Konzentrationsprofiles cA (x, t) Ein typisches Phasendiagramm für ein teilweise mischbares Zweistoffsystem aus den Materialien A und B ist in Abbildung 3.52(a) gegeben. B ist in A bei konstanter Temperatur T bis zu einer Gleichgewichtskonzentration ceq αβ löslich, A in B bis zu einer Gleichgewichtskonzentration ceq βα . Die A-reiche Phase wird als α, die B-reiche Phase als β bezeichnet. Da α und β an den Grenzen des Phasendiagrammes liegen, werden sie als begrenzende Phasen“ (englisch Terminal Phases“) bezeichnet. ” ” Dazwischen liegt der sogenannte Mischkristallbereich“, welcher gleichmäßig verteilte, wohl” eq abgegrenzte Kristallite der Zusammensetzung ceq αβ bzw. cβα enthält. Die Häufigkeitsverteilung dieser Kristallite stellt sich so ein, dass sich makroskopisch die Zusammensetzung der Materialkombination ergibt. Bildet man ein Diffusionspaar aus den Reinsubstanzen A und B, wie es in Abbildung 3.52(b) schematisch dargestellt ist, und lässt man die beiden Substanzen bei einer Temperatur T , welche deutlich unterhalb der Schmelztemperaturen von A und B liegt (siehe Abbildung 3.52(a)), ineinander diffundieren, so ergibt sich das in Abbildung 3.52(b) dargestellte Konzentrationsprofil. Als Konzentrationsvariable wurde die Konzentration der Komponente B in A, cB , gewählt. In der Nähe der Grenzfläche stellen sich bei konstantem T sofort eq die Gleichgewichtskonzentrationen ceq αβ bzw. cβα ein. Nach dem Verstreichen einer endlichen Zeit, t1 , dringt B immer tiefer in A ein und umgekehrt. Die Zusammensetzung innerhalb des Eindringbereiches nähert sich immer mehr den Gleichgewichtskonzentrationen an. Nach unendlich langer Zeit bildet sich schlussendlich ein stufenförmiges Konzentrationsprofil aus. Der Bereich des ursprünglichen Reinmateriales A weist die Zusammensetzung ceq αβ auf, der eq des ursprünglichen Reinmateriales B die Zusammensetzung cβα . Das gesamte Diffusionspaar wurde vollständig in die Phasen α und β umgesetzt. Die Grenzfläche zwischen α und β befindet sich an der Position der ursprünglichen Grenzfläche zwischen A und B. Warum kommt es bei der Interdiffusion der beiden Substanzen nicht zur Ausbildung von Mischkristallbereichen? Nehmen wir an, dass sich in den ersten Phasen der Interdiffusion in der Nähe der Grenzfläche zwischen A und B ein Mischkristall aus den Phasen α und β bildet. Dann haben sowohl α als auch β ihre jeweiligen Gleichgewichtskonzentrationen bei 3.5. DIFFUSION 145 Abbildung 3.52: Phasenbildung in einem Diffusionspaar teilweise miteinander mischbarer Materialien A und B (a) Phasendiagramm (b) Phasenbildung im Diffusionspaar zu verschiedenen Zeitpunkten eq T , ceq αβ bzw. cβα . Das bedeutet, dass im Mischkristallbereich alle Konzentrationsgradienten verschwinden und ein weiterer Materialtransport durch Diffusion aus den Reinmaterialien unterbunden wird. Es kann nur mehr Material aus dem Mischkristallbereich in den A(B)-armen Bereich des Diffusionspaares abgeführt werden, da dort die einzigen Konzentrationsgradienten auftreten. Durch den unterbundenen Materialnachschub aus den Reinbereichen passiert das so lange, bis der Mischkristallbereich verschwunden ist. Kurz gesagt ist ein Mischkristallbereich unter den gegebenen Randbedingungen der Diffusionsgleichung instabil. Die Situation ändert sich, wenn im Phasendiagramm eine sogenannte intermediäre Pha” se“ (englisch: Intermediate Phase“) existiert, wie es in Abbildung 3.53(a) dargestellt ist. ” Die zwischen den begrenzenden Phasen α und β bei T stabile Phase ist in Abbildung 3.53(a) mit γ bezeichnet. Bei Bildung eines Diffusionspaares aus A und B bei einer konstanten Temperatur T zeigt das in Abbildung 3.53(b) dargestellte Konzentrationsprofil (wiederum für cB ) sofort, dass innerhalb der Phase γ ein Konzentrationsgradient zwischen ceq γα und eq cγβ existiert. Es wird daher, im Gegensatz zum vorher besprochenen Fall des Mischkristallbereiches, immer ein Materialtransport über einen endlichen Bereich der γ-Phase möglich 146 KAPITEL 3. MEHRSTOFFSYSTEME Abbildung 3.53: Phasenbildung in einem Diffusionspaar teilweise miteinander mischbarer Materialien A und B mit einer intermediären Phase γ (a) Phasendiagramm (b) Phasenbildung im Diffusionspaar sein. Weiters sagt das Phasendiagramm aus, dass die Existenz der γ-Phase thermodynamisch günstiger ist als die Existenz eines Mischkristalles. Bei konstantem T und konstantem Druck p ist dieses Faktum durch einen Unterschied in den chemischen Potentialen zwischen α und γ, ∆µαγ bzw. zwischen β und γ, ∆µβγ beschreibbar. Mikroskopisch bedeutet das, dass die Bindungsenergie der intermediären Phase größer ist als die Summe aller Bindungsenergien im Mischkristall. Unter diesen Voraussetzungen ist es möglich, dass die intermediäre γ-Phase auf Kosten der begrenzenden Phasen α und β, ausgehend von der ursprünglichen Grenzfläche zwischen A und B im Diffusionspaar, zu wachsen beginnt. Die ursprüngliche Grenzfläche wird dabei vollständig verschwinden und es werden sich zwei bewegliche Grenzflächen zwischen α und γ sowie γ und β ausbilden (Abbildung 3.53(b)). Bezeichnet man die zeitabhängige Dicke der γ-Phase mit ξ(t), so führt eine detaillierte Betrachtung der thermodynamischen Verhältnisse (welche hier nicht wiedergegeben werden soll) zu dem in Abbildung 3.54 dargestellten Verhalten. Abbildung 3.54 zeigt, dass das Wachstum der γ-Phase in zwei verschiedenen Regimen stattfindet: 3.6. ENTMISCHUNGSVORGÄNGE 147 Abbildung 3.54: Zeitliches Verhalten der Dicke der γ-Phase, ξ(t) Reaktionskontrolliertes Wachstum für kleines t: Die Wachstumsrate dξ(t) ist konstant. dt Sie ist durch die Geschwindigkeit der chemischen Reaktion an den Grenzflächen zwischen α und γ bzw. γ und β bestimmt. Die γ-Phase ist noch dünn genug, sodass die Dauer des Materialtransportes durch γ noch keine Rolle spielt. ξ(t) wächst daher linear. ist durch die Diffusionskontrolliertes Wachstum für großes t: Die Wachstumsrate dξ(t) dt Geschwindigkeit des Materialtransportes durch γ bestimmt. Da dieser durch√Diffusion erfolgt, ergibt sich für ξ(t) der für diffusive Prozesse typische Verlauf von ξ(t) √ ∝ t (siehe z.B. Abbildung 3.51: Die Halbwertsbreite der Lösungsfunktionen steigt mit t). Die hier beschriebenen Phasenbildungsmechanismen kommen in der mikroelektronischen Prozessführung z.B. bei der Herstellung von Oxid- bzw. Silizidschichten definierter Dicke durch kontrollierte Diffusionsprozesse zum Einsatz. Die Kombination von Phasendiagrammen und Diffusionsprozessen hat gezeigt, dass der Materialtransport durch Diffusion, welcher eigentlich zum Abbau von Konzentrationsgradienten führen sollte, durchaus zur Ausbildung von scharf abgegrenzten Regionen innerhalb eines Materiales führen kann. Wesentlich für diesen Vorgang ist der Unterschied in den Bindungsverhältnissen für verschiedene Phasen, wie er im vorhergegangenen Abschnitt thermodynamisch durch die Differenz der chemischen Potentiale beschrieben wurde. Im Folgenden sollen die Vorgänge, welche zur Phasentrennung in Mehrstoffsystemen führen, genauer betrachtet werden. 3.6 3.6.1 Entmischungsvorgänge Einleitung Oft führt die Wahl der Herstellungsparameter von Mehrstoffsystemen dazu, dass das Material anfangs nicht in seiner Gleichgewichtsform vorliegt. So ist es z.B. möglich, durch rapides Erstarren aus der Schmelze in einem Zweistoffsystem eine atomare Anordnung einzufrie” 148 KAPITEL 3. MEHRSTOFFSYSTEME ren“, bei der eine Komponente völlig ungeordnet in der anderen verteilt ist, obwohl der Gleichgewichtszustand ein Mischkristall aus den begrenzenden Phasen α und β wäre, wie es vorher besprochen wurde. Bei einer endlichen Temperatur wird das Material daher nicht stabil sein, sondern diffusive Transportvorgänge werden in einer endlichen Zeit zur Ausbildung des Gleichgewichtszustandes führen. Technologisch ist die Kontrolle dieser Annäherung an den Gleichgewichtszustand sehr wichtig. So kann zum Beispiel durch eine entsprechende Temperaturbehandlung die Kristallitgröße des Mischkristalles beeinflusst werden. Hohes T bewirkt eine rasche Kristallitbildung. Ist die gewünschte Kristallitgröße erreicht, wird T abgesenkt und der so erreichte Zustand eingefroren. Das Material ist dann zwar immer noch nicht stabil, aber einerseits wesentlich näher an seiner Gleichgewichtskonfiguration während andererseits die weitere Phasenumwandlung z.B. bei Raumtemperatur wesentlich langsamer vor sich geht. Die Phasentrennung kann über zwei Basismechanismen geschehen, welche im Folgenden besprochen werden sollen. 3.6.2 Nukleation Wie bereits erwähnt, ist es möglich, eine unmischbare Materialkombination in einem Zustand zu präparieren, in dem die beiden Komponenten ungeordnet ineinander verteilt sind. Eine solche Situation ist in Form des Phasendiagrammes eines völlig unmischbaren Zweistoffsystems A und B in Abbildung 3.55 dargestellt. Abbildung 3.55: Phasendiagramm einer völlig unmischbaren Materialkombination. Weit vom thermodynamischen Gleichgewicht präparierte Materialien werden sich in einen Mischkristall aus A- und B-Kristalliten entmischen Aus Abbildung 3.55 ist ersichtlich, dass keine begrenzenden Phasen existieren. Der Mischkristall in der Region A + B des Phasendiagrammes wird im Gleichgewicht aus wohl abgegrenzten, kristallinen Bereichen der Komponente A und der Komponente B bestehen. Für den Fall cB = 0.2, wie er in Abbildung 3.55 gewählt wurde, sind der Anfangszustand und der Endzustand des Materiales in Abbildung 3.56 dargestellt. Abbildung 3.56(a) zeigt die zufällige Verteilung der Minoritätskomponente B in der Majoritätskomponente A. Dies entspricht einer übersättigten Lösung von B in A. Abbildung 3.6. ENTMISCHUNGSVORGÄNGE 149 Abbildung 3.56: Ausscheidungsbildung in einer unmischbaren Materialkombination A (hell) und B (dunkel). A ist die Majoritätskomponente (Matrix); cB beträgt 0.2 (a) Ungeordnete Verteilung der beiden Komponenten (b) Bildung einer Ausscheidung der Minoritätskomponente B 3.56(b) zeigt die Bildung einer Ausscheidung von B in der Matrix A, wie sie dem oben beschriebenen Gleichgewichtszustand des Systems entspricht. Die Umverteilung der einzelnen Atome von der zufälligen Mischung zur Ausscheidung wird durch die vorher beschriebenen Diffusionsmechanismen wie z. B. leerstellenunterstützte Festkörperdiffusion ermöglicht. Sie kann, je nach gewählter Temperatur, sehr rasch oder auch sehr langsam vor sich gehen. Allerdings ist die reine Ansammlung von Teilchen durch Diffusion noch nicht der vollständige Mechanismus der Ausscheidungsbildung. Für eine kugelförmige Ausscheidung mit dem Radius r, ist bei konstantem Druck p und konstanter Temperatur T die Differenz der freien Enthalpie G zwischen einer übersättigten Lösung von n Teilchen und einer Ausscheidung, welche n Teilchen enthält, gegeben durch 4 (3.82) ∆Gn = πr3 · (GV ol − GSol ) + 4πr2 · σAB . 3 Dabei beinhaltet der erste, zum Kugelvolumen proportionale Term in Gleichung 3.82 den Energiegewinn beim Übergang von n gelösten Teilchen zu einem n-Teilchen-Aggregat. Mikroskopisch entspricht das der Absättigung chemischer Bindungen zwischen B und B im Volumen der Ausscheidung. Unter der oben getroffenen Voraussetzung einer übersättigten Lösung ist die freie Enthalpie der Lösung, GSol , immer größer als die der Ausscheidung, GV ol , und der erste Term ist immer negativ. Würde nur dieser Term in die Enthalpiedifferenz eingehen, so wäre die Bildung beliebig großer Ausscheidungen immer energetisch günstiger als die übersättigte Lösung. Allerdings ist die Bildung jeder Ausscheidung einer endlichen Größe auch mit der Ausbildung einer Grenzfläche zwischen A und B verbunden. Die Schaffung einer Grenzfläche ist immer mit dem Aufbringen einer bestimmten Grenzflächenenergie σAB [J/m2 ] verbunden. Mikroskopisch entspricht dies mit dem Vorhandensein nicht abgesättigter Bindungen zwischen der Ausscheidung und der Matrix. σAB ist immer positiv. Dies entspricht dem zweiten, zur Kugeloberfläche proportionalen Term in Gleichung 3.82. Der Gesamtverlauf von ∆Gn in Abhängigkeit von r ergibt sich daher zu der in Abbildung 3.57 gezeigten Funktion. 150 KAPITEL 3. MEHRSTOFFSYSTEME Abbildung 3.57: Verlauf der freien Enthalpie für eine kugelförmige Ausscheidung. ∆G∗n . . . Aktivierungsbarriere, r∗ . . . kritischer Keimradius. Aus Gleichung 3.82 ist ersichtlich, dass ∆Gn ein Maximum bei r∗ = − 2 · σAB (GV ol − GSol ) (3.83) hat. r∗ wird als kritischer Keimradius bezeichnet. Der Wert des Maximums, ∆Gn (r∗ ), ergibt sich zu 3 16πσAB , (3.84) ∆G∗n = 3 · (GV ol − GSol )2 was der Höhe der Aktivierungsbarriere zur Keimbildung entspricht. Hat die Ausscheidung einen Radius r < r∗ , so bewirkt eine weitere Reduktion von r durch Teilchenverlust eine Verringerung von ∆Gn . Die Ausscheidung wird daher mit hoher Wahrscheinlichkeit zerfallen. Für Radien r > r∗ bewirkt ein wachsendes r durch Hinzufügen von Teilchen allerdings ebenfalls eine Verringerung von ∆Gn . Es ist daher für die Ausscheidung energetisch günstiger zu wachsen. Diese beiden Situationen sind schematisch in Abbildung 3.58 dargestellt. Ausscheidungen mit Radien r < r∗ werden als unterkritisch oder instabil bezeichnet, Ausscheidungen mit Radien r > r∗ als überkritisch oder stabil. Beobachtbar sind in der Regel nur überkritische Ausscheidungen. Die Ausscheidungsbildung über den Weg des kritischen Keimes, auch genannt kritischer Nukleus, wird als Nukleation bezeichnet. Sie ist, wie die vorher besprochenen Diffusionssprünge, ein thermisch aktivierter Prozess. Die Anzahl Nn der n-Teilchen-Ausscheidungen, welche sich aus einer übersättigten Lösung – die N Teilchen beinhaltet – bilden, ist daher im Gleichgewicht durch −∆Gn Nn = N · exp (3.85) kB T gegeben. Für stabile Ausscheidungen (∆Gn < 0) bedeutet Gleichung 3.85, dass die steigende Temperatur zu einer Verringerung der Ausscheidungszahl führt. Die Zahl instabiler 3.6. ENTMISCHUNGSVORGÄNGE 151 Abbildung 3.58: Definition des kritischen Keimes: Ausscheidungen mit r < r∗ tendieren zum Zerfall, bei Ausscheidungen mit r > r∗ führt weiteres Wachstum zur Verringerung von ∆Gn Ausscheidungen (∆Gn > 0) steigt laut Gleichung 3.85 mit steigender Temperatur. Dies ist dadurch zu erklären, dass mit steigendem T immer mehr Diffusionsprozesse aktiviert werden und die Teilchen der Minoritätskomponente sich öfter pro Zeiteinheit treffen können und daher eine instabile Ausscheidung bilden. Diese kann jedoch, ebenfalls durch die erhöhte Teilchenbeweglichkeit, auch leichter wieder zerfallen, die Bildung stabiler Ausscheidungen wird also erschwert. Daher nimmt die Anzahl der stabilen Ausscheidungen im Volumen (die Ausscheidungsdichte) generell mit steigender Temperatur ab. Der soeben besprochene Prozess der Ausscheidungsbildung stellt den Fall der sogenannten homogenen Nukleation dar. Das System enthält keinerlei Defekte und die Ausscheidungsdichte hängt bei konstantem T nur von ∆G∗ und von r∗ ab. Unter diesen Idealbedingungen ergeben sich allerdings extrem geringe Ausscheidungsdichten, da die Übersättigung meist nicht hoch genug ist, um hohe Werte von GV ol − GSol zu ergeben. Laut Gleichungen 3.83 und 3.84 ergeben sich dadurch hohe kritische Keimradien und hohe Aktivierungsbarrieren. Diese Kombination führt dazu, dass homogene Nukleation im Volumen kaum beobachtet wird. Die Situation ändert sich drastisch, sobald das Zweistoffsystem Störstellen beinhaltet, wie dies z. B. in Abbildung 3.59 dargestellt ist. Abbildung 3.59: Heterogene Nukleation einer Ausscheidung von B an einer Korngrenze zwische zwei Kristalliten der Komponente A. Abbildung 3.59 zeigt eine Korngrenze zwischen zwei Kristalliten des Materiales A, an der sich ein kugelkalottenförmiger Keim (Radius r) der Minoritätskomponente B bildet. Je nachdem, wie gut B die von der Korngrenze gebildete Grenzfläche benetzt, wird der Wert 152 KAPITEL 3. MEHRSTOFFSYSTEME von ∆G∗n gemäß der Beziehung ∆G∗n = 3 16πσAB 2 − 3cosθ + cos3 θ · 3 · (GV ol − GSol )2 8 (3.86) modifiziert. Der Wert des in Abbildung 3.59 gegebenen Kontaktwinkels θ wird durch das Gleichgewicht der Grenzflächenenergien σAA und σAB bestimmt. Je kleiner θ ist, desto besser wird die Korngrenze benetzt und desto geringer ist laut Gleichung 3.86 die Aktivierungsener3θ → 0 für θ → 0. Der kritische Keimgie zur Bildung des kritischen Keimes, da 2−3cosθ+cos 8 ∗ radius, r , wird nicht beeinflusst. Gleichung 3.86 zeigt, dass die Anwesenheit von Störungen wie z. B. Korngrenzen, Verunreinigungen aus Spurenelementen oder auch Anhäufungen von Leerstellen ( Bläschen“ oder englisch Voids“) zu einer signifikanten Reduktion der Aktivie” ” rungsenergie zur Bildung des kritischen Keimes und damit zu einer wesentlichen Steigerung der Ausscheidungsdichte führen kann. Die Bildung von Ausscheidungen erfolgt daher bevorzugt an Störstellen. Dieser Prozess wird als heterogene Nukleation bezeichnet. Homogene und Heterogene Nukleation lassen sich anhand des Verhaltens der Ausscheidungsdichte, nAus , mit der Zeit bei konstanter Temperatur unterscheiden. Erfolgt die Nukleation an Störstellen, so haben sich bereits nach sehr kurzer Zeit alle kritischen Keime gebildet, danach bleibt nAus konstant. Bei homogener Nukleation bilden sich hingegen ständig neue Keime, nAus steigt linear mit der Zeit an, so lange bis nAus so groß ist, dass alles gelöste Material immer eine stabile Ausscheidung erreicht und nAus damit ebenfalls konstant wird. Dieses Verhalten ist in Abbildung 3.60 dargestellt. Abbildung 3.60: Abhängigkeit der Ausscheidungsdichte nAus von der Zeit für homogene und heterogene Nukleation. Beide Kurven sind auf die Sättigungsausscheidungsdichte normiert. Das Verhalten der Ausscheidungsdichte mit der Temperatur hat eine wichtige technologische Bedeutung. Geht man davon aus, dass jede Ausscheidung bei einem fixen T in etwa die gleiche Teilchenzahl n enthält, so ist nAus im Wesentlichen durch Gleichung 3.85 gegeben. Nach hinreichend langer Zeit geht, wie vorher gezeigt, nAus sowohl für homogene als auch für heterogene Nukleation in einen Sättigungswert über. Trägt man diesen Wert von nAus in Abhängigkeit von T auf, so ergibt sich lt. Gleichung 3.84 der in Abbildung 3.61(a) dargestellte funktionale Zusammenhang. 3.6. ENTMISCHUNGSVORGÄNGE 153 Abbildung 3.61: Abhängigkeit der Ausscheidungsdichte von der Temperatur lt. Gleichung 3.85. Die vollen Quadrate symbolisieren (hypothetische) Messwerte für die Ausscheidungsdichte, die durchgezogenen Kurven können im Experiment durch einen Fit an die Messwerte gewonnen werden. (a) Verhalten von nAus über T (b) Verhalten von ln(nAus ) über T1 Trägt man ln(nAus ) über T1 auf, so ergibt sich ein linearer Zusammenhang (Abbildung 3.61(b)). Aus der Steigung der Gerade in diesem sogenannten Arrhenius-Diagramm lässt sich ∆G∗n bestimmen, da ja jede beobachtbare stabile Ausscheidung aus einem kritischen Keim hervorgegangen sein muss. Für das unmischbare Zweistoffsystem A/B wird es immer (abgesehen von c = 0.5) eine Majoritäts- und eine Minoritätskomponente geben. Der Gleichgewichtszustand, welcher sich nach der Entmischung einstellt, wird also immer die Form von in einer Matrix dispergierten Ausscheidungen haben, sofern der Entmischungsprozess über Nukleation vor sich geht und keine intermediären Phasen existieren. Ein Reinmaterial kann jedoch, wenn es im amorphen Zustand hergestellt wurde, bei einer endlichen Temperatur rekristallisieren. Dabei wird die amorphe Phase des Materials vollständig in die kristalline Phase umgesetzt. Bezeichnet man mit cCrys das Verhältnis der Teilchenzahl in der kristallinen Phase, NCrys , zur Gesamtzahl N , so ergibt sich folgende empirische Beziehung für cCrys : der Teilchen, N , cCrys = Crys N cCrys = 1 − exp [− (k ∗ · t)ν ] . (3.87) Dabei ist k ∗ eine Konstante, welche von der Geschwindigkeit der Umwandlung abhängt, während ν von den Details der Entstehung der kritischen Keime, von deren Wachstumsmechanismus (diffusionskontrolliert oder reaktionskontrolliert) sowie von deren Form abhängt. Die mathematische Beziehung in Gleichung 3.87 wid als Johnson-Mehl-Avrami Verhalten bezeichnet und ist für verschiedene Werte von ν in Abbildung 3.62 dargestellt. Sie kann nicht nur auf Rekristallisationsprozesse, sondern z. B. auch auf chemische Reaktionen, bei denen eine homogene Mischung von Ausgangssubstanzen in ein stöchiometrisches Endprodukt umgesetzt wird, angewendet werden. Entmischung über Nukleation ist nicht der einzige Prozess der Phasentrennung. In be- 154 KAPITEL 3. MEHRSTOFFSYSTEME Abbildung 3.62: Johnson-Mehl-Avrami Kurven für verschiedene Werte von ν. Dass sich alle Kurven in einem Punkt schneiden, beruht auf der Tatsache, dass k ∗ = 1 gewählt wurde. stimmten Situationen ist das System so instabil, dass es zur spontanen Phasentrennung ohne Aktivierungsenergie kommt, wie im folgenden Abschnitt gezeigt wird. 3.6.3 Spinodale Entmischung Betrachtet man die freie Enthalpie eines Zweistoffsystems, so ergibt sich oft die in Abbildung 3.63(a) dargestellte Situation. Abbildung 3.63: Bereiche der verschiedenen Entmischungsmechanismen in Abhängigkeit von der freien Enthalpie. Bereich I: Mischbarkeit; Bereich II: Entmischung durch Nukleation; Bereich III: spinodale Entmischung (a) Verhalten der Freien Enthalpie in Abhängigkeit von cB bei konstantem T (b) Abhängigkeit des Entmischungsmechanismus von cB und T Abbildung 3.63(a) zeigt die Variation von G mit zunehmendem cB für eine konstante Temperatur T . Es ergeben sich 3 Bereiche: 3.6. ENTMISCHUNGSVORGÄNGE 155 • Bereich I: In diesem Bereich sinkt G monoton ab, die beiden Materialien sind ineinander löslich. • Bereich II: G steigt monoton an, die Krümmung von B (veranschaulicht durch die eingezeichnete Parabel) ist allerdings positiv. Das System neigt zwar zur Entmischung, ist aber auf Grund der positiven Krümmung stabil gegen kleine Fluktuationen. Dies ist jener Bereich, in dem die vorher besprochene klassische Nukleationstheorie ihre Gültigkeit hat. Entmischung tritt erst bei Überwinden einer bestimmten Aktivierungsenergie auf. • Bereich III: G steigt immer noch monoton an, die Kurve hat allerdings den Wende2 punkt, ddc2G = 0, überschritten, und die Krümmung von G wird negativ. In diesem B Bereich führt jede noch so geringe Konzentrationsfluktuation zur spontanen Entmischung des Systems. Es muss keine Aktivierungsenergie überwunden werden. Dieselben Bereiche ergeben sich, in Abbildung 3.63(a) von rechts nach links gelesen, für die Beimengung von A zu B. Schematisch sind die verschiedenen oben besprochenen Bereiche in Abhängigkeit von cB und T in Abbildung 3.63(b) dargestellt. 2 Jene Schar von c, T -Paarungen, für die gilt ddcG2 < 0, wird als Spinodale bezeichnet. In diesem Parameterfeld ist, wie bereits erwähnt, das Zweikomponentensystem instabil gegen infinitesimale Konzentrationsschwankungen und entmischt sich spontan. Naturgemäß ist auch dieser Vorgang mit der Bildung von Grenzflächen zwischen den einzelnen Komponenten verbunden, die Form ( Morphologie“) der Ausscheidungen ist jedoch völlig unterschiedlich ” zu jener der klassischen Nukleationstheorie, wie Abbildung 3.64 zeigt. Abbildung 3.64: Ausscheidungsmorphologien der verschiedenen Entmischungsmechanismen Während bei der Entmischung durch Nukleation die Grenzflächen der Ausscheidungen immer nach außen gekrümmt sind (Abbildung 3.64(a)), so zeigt sich bei spinodaler Entmi- 156 KAPITEL 3. MEHRSTOFFSYSTEME schung eine labyrinthartige Struktur, in der positive und negative Krümmungen der Grenzflächen miteinander abwechseln (Abbildung 3.64(b)). Da die freie Energie einer Grenzfläche auch von deren Krümmung abhängt, ergibt sich aus Abbildung 3.64(b) zumindest qualitativ, dass der Grenzflächenbeitrag bei der spinodalen Entmischung nur eine untergeordnete Rolle spielt. Der mathematische Formalismus zur detaillierten Beschreibung spinodaler Entmischung ist relativ komplex und soll daher hier nicht weiter beschrieben werden. Beobachtet wird spinodale Entmischung hauptsächlich für Polymermischungen (sogenannte Polymer Blends“), ” wo die besondere Phasenverteilung, wie sie Abbildung 3.64(b) zeigt, zu interessanten Materialeigenschaften führt. 3.7 3.7.1 Oberflächen und Grenzflächen Einleitung In den vorhergehenden Abschnitten wurde die Bedeutung von Grenzflächen und deren Einfluss auf die Phasenbildung in Mehrstoffsystemen offensichtlich. Im Sprachgebrauch existieren zwei Begriffe, nämlich Oberfläche“ und Grenzfläche“, welche im Folgenden genauer ” ” definiert werden sollen: • Oberfläche: Als Oberfläche bezeichnet man die Grenzfläche zwischen einem Festkörper oder einer Flüssigkeit mit der Umgebung. Der Begriff Umgebung“ ist hier bewusst ” nicht näher definiert. So kann die Umgebung“ z. B. Vakuum, eine saubere und trockene ” Atmosphäre oder feuchtigkeits- und salzhaltige, hochkorrosive Meerluft sein. • Grenzfläche (englisch: Interface“): Als Grenzflächen werden ” zen zwischen Festkörper/Festkörper, Festkörper/Flüssigkeit, Flüssigkeit/Flüssigkeit sowie Flüssigkeit/Gas bezeichnet. Man Definition sofort, dass der Begriff Oberfläche“ eigentlich eine ” Begriffes Grenzfläche“ darstellt. Daher soll im Weiteren möglichst ” Grenzfläche“ verwendet werden. ” alle PhasengrenFestkörper/Gas, sieht aus dieser Untermenge des häufig der Begriff In der Zeit ab etwa 1970 hat sich die Physik der Grenzflächen als wesentlicher Bestandteil der Festkörperphysik etabliert. Ein rapides Wachstum entwickelte die Grenzflächenphysik mit der Entdeckung und sukzessiven Verfeinerung von Rastersondentechniken wie dem Rasterelektronenmikroskop (SEM), Rastertunnelmikroskop (STM) und dem Rasterkraftmikroskop (AFM). Eine Verlangsamung dieses Wachstumsprozesses ist nicht abzusehen, da immer neue technologische Anwendungen von Oberflächenprozessen gefunden werden. Es ist daher nicht möglich, einen kurzen und vollständigen Überblick über alle Phänomene und Anwendungen zu geben, welche im Zusammenhang mit Grenzflächen stehen. Daher sollen im Folgenden nur die elementarsten Grundlagen sowie ausgewählte technologische Aspekte von Grenzflächenphänomenen besprochen werden. 3.7. OBERFLÄCHEN UND GRENZFLÄCHEN 3.7.2 157 Grundlagen der Grenzflächenphysik Einen einfachen, anschaulichen Fall einer Grenzfläche stellt die Phasengrenze zwischen einer Flüssigkeit und einem Gas dar. Das System kann noch weiter reduziert werden, wenn anstatt des Gases Vakuum angenommen wird. In diesem Fall sind die Moleküle im Volumen der Flüssigkeit in allen Raumrichtungen von benachbarten Molekülen isotrop umgeben. Im zeitlichen Mittel wirken aufgrund der Isotropie keine Kräfte auf ein einzelnes Molekül. An der Oberfläche der Flüssigkeit ist die Situation anders, da in Richtung der Oberflächennormale keine nächsten Nachbarn vorhanden sind. Um ein Molekül aus dem Volumen an die Oberfläche zu befördern und damit die Oberfläche um einen Betrag dA zu vergrößern, muss eine Energie von (3.88) dE = σ · dA aufgewendet werden. σ ist die sogenannte Oberflächen- oder Grenzflächenenergie, wie sie bereits im Rahmen der Nukleationstheorie eingeführt wurde. Ihre Dimension ist die einer Energie pro Fläche beziehungsweise einer Kraft pro Länge, ihre Einheit daher entweder J N oder . Befindet sich die Flüssigkeit im schwerelosen Raum, so kann das Oberm2 m flächen/Volumsverhältnis minimiert werden, wodurch die Flüssigkeitstropfen kugelförmige Gestalt annehmen. Tritt ein Flüssigkeitstropfen mit einer Festkörperoberfläche in Wechselwirkung, so ergeben sich die in Abbildung 3.65(a-c) gezeigten Idealsituationen. Abbildung 3.65: Benetzung einer Festkörperoberfläche mit einer Flüssigkeit. S: Festkörper; F: Flüssigkeit; U: Umgebung (a) Völlige Unbenetzbarkeit (b) Teilweise Benetzbarkeit (c) Vollständige Benetzung (Spreiten) Diese stellen die drei Grenzsituationen der Benetzbarkeit einer Festkörperoberfläche durch die Flüssigkeit dar: • völlige Unbenetzbarkeit (Abbildung 3.65(a)): Die Flüssigkeit bildet kugelförmige Tröpfchen und perlt von der Oberfläche ab; 158 KAPITEL 3. MEHRSTOFFSYSTEME • teilweise Benetzbarkeit (Abbildung 3.65(b)): Die Grenzflächenspannungen zwischen Festkörper und Umgebung, σSU , Festkörper und Flüssigkeit, σSF sowie Flüssigkeit und Umgebung, σF U bilden ein Kräftegleichgewicht gemäss der Young’schen Gleichung, σSU = σSF + σF U · cos θ. (3.89) Flüssigkeit und Festkörperoberfläche schließen einen definierten Kontaktwinkel θ ein, welcher kleiner oder größer als 90◦ sein kann. Dieser Zusammenhang kann einerseits zur Bestimmung von Festkörpergrenzflächenenergien verwendet werden, andererseits ist er die Grundlage für Phänomene wie z. B. Kapillarität, welche breite technologische Anwendung finden. • vollständige Benetzbarkeit (Abbildung 3.65(c)): Der Kontaktwinkel tendiert gegen Null, die Flüssigkeit breitet sich vollständig über den Festkörper aus, bis sich ein monomolekularer Flüssigkeitsfilm bildet. Dieser Vorgang wird als Spreiten bezeichnet. Zur Definition der Grenzflächenenergie von Festkörpern kann folgendes einfaches Gedankenmodell verwendet werden. Man betrachtet zunächst einen homogenen Festkörper. Sodann wird der Festkörper entlang einer Fläche A in zwei Hälften geteilt. Dabei muss eine bestimmte Anzahl von Atombindungen getrennt werden. Jene Energie, welche zur Trennung dieser Bindungen aufgewendet werden muss, ist die Grenzflächenenergie σ des Festkörpers. Im Gegensatz zur Grenzflächenenergie einer Flüssigkeit, welche räumlich isotrop ist, hängt jedoch die Grenzflächenenergie eines kristallinen Festkörpers von der Schnittrichtung ab, wie Abbildung 3.66(a) schematisch zeigt. Trägt man σ über dem Schnittwinkel θ auf, so ergibt sich der in Abbildung 3.66(b) dargestellte sogenannte Wulff-Graph“ (englisch: Wulff-Plot“). Im Falle eines einatomigen ” ” Kristalles mit einem Symmetriezentrum kann er in zwei Dimensionen dargestellt werden und besteht aus einer Schar von Kreisen, welche durch den Ursprung des Koordinatensystems führen. Die äußersten Punkte dieser Figur bilden den Wulff-Graph (Abbildung 3.66(b)). Wie Abbildung 3.66(b) zeigt, gibt es also Schnittebenen mit minimaler Grenzflächenenergie, welche besonders stabil sind sowie mit maximaler Grenzflächenenergie, welche nur eine geringe Stabilität aufweisen. So hat z. B. ein Kristall, welcher von Oberflächen mit geringem σ begrenzt ist, einen höheren Schmelzpunkt, während der Schmelzprozess bei Kristallen mit hochenergetischen Grenzflächen früher einsetzt. Dieser Prozess wird als Oberflächenschmelzen“ ” bezeichnet. Durch die kristalline Struktur des Festkörpers weisen Festkörpergrenzflächen immer eine endliche Dicke auf, welche durch die Begriffe Korrugation oder Rauhigkeit beschrieben werden kann. Selbst ideale Oberflächen mit minimalem σ weisen atomare Korrugationen auf und enthalten eine große Zahl von Defekten wie z. B. Leerstellen, Stufen oder Inseln aus Leerstellen oder adsorbierten Atomen. Auch innere Grenzflächen in Festkörpern wie z. B. Korngrenzen sind reich an Fehlstellen und weisen eine endliche Dicke auf. Grenzflächen sind daher nicht als ideale Objekte mit verschwindender Ausdehnung in einer Richtung, sondern eigentlich als eigene Phasen zu betrachten. Damit muss selbst ein Reinmaterial, welches naturgemäß immer eine Oberfläche hat, eigentlich als Zweiphasensystem aus Festkörper 3.7. OBERFLÄCHEN UND GRENZFLÄCHEN 159 Abbildung 3.66: Abhängigkeit von σ von der Schnittrichtung im Kristall (a) Gebrochene Bindungen (symbolisiert durch Kreuzchen) für ein zweidimensionales quadratisches Gitter für verschiedene Schnittrichtungen. (b) Wulff-Plot für σ für einen kubischen Kristall. Man beachte, dass der Winkel θ nicht mit dem Winkel in (a) übereinstimmt. Außerdem ist der Wulff-plot in diesem Fall eigentlich eine dreidimensionale Figur. und Oberflächenphase betrachtet werden. In völliger Analogie zu den Phasendiagrammen in Mehrstoffsystemen können auch für einen Festkörper mit inneren und äußeren Grenzflächen Phasendiagramme entwickelt werden. Diese geben z. B. Auskunft über die thermodynamische Stabilität oder über die chemische Reaktivität bestimmter Grenzflächentypen. Eine weitere Eigenschaft aller Arten von Festkörpergrenzflächen ist die Möglichkeit, dass dort wesentlich mehr Diffusionsprozesse aktiviert werden können als im Festkörpervolumen. Im Volumen treten de facto nur die leerstellenunterstützte Diffusion, wie sie bereits besprochen wurde, und die Diffusion von gelösten Atomen, welche sich auf Zwischengitterplätzen befinden (z. B. C in Fe) auf. An einer Grenzfläche können hingegen eine Vielzahl konkurrierender Diffusionsmechanismen existieren, wie einige in Abbildung 3.67 dargestellt sind. Zwar sind auch hier die diffusiven Einzelereignisse thermisch aktiviert und folgen daher den bereits besprochenen Mechanismen, allerdings liegen die Aktivierungsenergien manchmal deutlich unter denen für Volumsdiffusion. Daher fungieren innere Grenzflächen wie z. B. Korngrenzen häufig als bevorzugte Diffusionspfade in Festkörpern. Durch die hohe Anzahl von Fehlstellen und die Vielzahl aktivierbarer Diffusionsmechanismen geht der Materialtransport dort viel rascher vonstatten als es für Volumsdiffusion zu erwarten wäre. Der Einfluss von Grenzflächen auf Nukleationsprozesse durch die Herabsetzung der Aktivierungsenergien für die Ausscheidungsbildung wurde bereits erwähnt. 160 KAPITEL 3. MEHRSTOFFSYSTEME Abbildung 3.67: Verschiedene Diffusionsmechanismen an Grenzflächen (a) Migration von adsorbierten Einzelatomen (b) Eindringen eines Adsorbates in die Oberfläche unter Verdrängung eines Oberflächenatomes. Das Oberflächenatom wird zu einem Adsorbat (c) Eindringen eines Atomes in eine Inselkante. Die Insel vergrößert sich, ihr Schwerpunkt bewegt sich (d) Anlagerung eines Adsorbates an eine Insel (e) Migration eines Punktdefektes (f) Ein Atom verlässt eine Inselkante (g) Anlagerung eines Einzelatomes an eine Inselkante; das Atom befand sich vormals auf der Insel Weitere Mechanismen sind möglich, aber hier nicht gezeigt. 3.7.3 Technologische Bedeutung von Grenzflächen Hand in Hand mit den Fortschritten in der Grenzflächenphysik, welche die Grundlagen zur Charakterisierung und reproduzierbaren Manipulation von Oberflächen lieferte, stieg auch die Anzahl der technischen Anwendungen dieser Erkenntnisse in den verschiedensten Teilbereichen. Immer neue Anwendungen werden für Materialien gefunden, welche ein hohes Verhältnis von Oberfläche zu Volumen besitzen. Daher ist die folgende Liste nicht vollständig und kann jederzeit durch weitere Teilgebiete ergänzt werden. • Optische Anwendungen: Eine der ersten Anwendungen von modifizierten Oberflächen ist die Optik. Optische Anwendungen inkludieren das Auftragen dünner metallischer Schichten auf Glas zur Herstellung von Spiegeln sowie das Aufbringen von transparenten Schichten mit Dicken in der Größenordnung der Lichtwellenlänge zur Reflexionsminderung oder -steigerung durch Interferenzeffekte. Oberflächen mit gradierten Brechungsindizes kommen z. B. in der Lichtwellenleitertechnik zum Einsatz. • Elektronische Anwendungen: Eine große Anzahl elektronischer Effekte sind Grenzflächeneffekte. So hängt z. B. der elektrische Widerstand von der Anzahl innerer Grenzflächen in einem Leiter ab, da diese die mittlere freie Weglänge der Elektronen beeinflussen. Hochtemperatursupraleitung (HTSL) wird (unter anderem) erst durch den speziellen Aufbau der HTSL-Keramiken möglich, welche aus einer Stapelfolge von definierten Atomebenen bestehen. Dadurch entsteht eine quasi-zweidimensionale Struktur, durch welche die Bildung von Cooper-Paaren auch bei höheren Temperaturen möglich wird. In der Mikroelektronik sind Systeme aus dünnen Schichten und modifizierten Grenzflächen nicht wegzudenken. Feldeffekttransistoren (MOS-FETs) bestehen aus einer Abfolge Metall und Halbleiter, welche durch eine extrem dünne Oxidschicht (im Idealfall 3.7. OBERFLÄCHEN UND GRENZFLÄCHEN 161 nur eine Atomlage dick) getrennt sind. Leiterbahnen in integrierten Schaltkreisen sind dünne Metallschichten. Die Grundeinheiten eines RAM-Speichers sind Kondensatoren mit dielektrischen Trennschichten, welche unter Umständen nur einige zehn Nanometer dick sind. • Materialwissenschaften: Die mechanischen Eigenschaften von Festkörpern werden zu einem großen Teil von der Anzahl der inneren Grenzflächen wie z. B. Korngrenzen beeinflusst. Diese verhindern das Abgleiten von Versetzungen und führen daher zu einer gesteigerten Festigkeit des Materiales. Weiche Einschlüsse in einem Material, welche oft an den Korngrenzen segregiert sind, können wiederum die Rissausbreitung hemmen und dadurch die Bruchfestigkeit erhöhen. Die Benetzbarkeit der Oberfläche eines Materiales durch verschiedene Flüssigkeiten kann durch geeignete Verfahren so weit manipuliert werden, dass entweder totale Unbenetzbarkeit oder vollständige Benetzung erreicht werden kann. Vollständige Unbenetzbarkeit ist das Ziel jedes Imprägnationsverfahrens (z. B. Fasern, aber auch Lackoberflächen in der Automobilindustrie), während vollständige Benetzung etwa beim Auftragen von Klebern erwünscht ist, um einen optimal gleichmäßigen Klebstofffilm zu garantieren. • Tribologie: Werkzeugmaterialien sowie Motor- und Triebwerkskomponenten sind oftmals extremen mechanischen und thermischen Belastungen ausgesetzt. Diese können durch das Aufbringen sogenannter tribologischer Schichten (Tribologie: Wissenschaft von Reibung und Verschleiß) herabgesetzt werden. Zur Anwendung kommen hier z. B. keramische Oberflächen auf Metallwerkzeugen, welche kühlmittelfreies Bohren oder Fräsen ermöglichen. Die Keramikoberfläche reduziert die Reibung des Werkzeuges so weit, dass niemals Temperaturen erreicht werden, bei denen das Werkzeugmetall eine Phasenumwandlung durchmachen würde. • Katalyse: Metallische Oberflächen können die Aktivierungsenergien für verschiedene chemische Reaktionen herabsetzen bzw. die Bildung von Phasen extrem hoher chemischer Reaktivität erleichtern. Das Anwendungsgebiet von Katalysatoren reicht von der Automobiltechnik zur chemischen Industrie. Die Wirkungsweise von katalytischen Grenzflächen wird erst heute, z. B. durch die rapide Weiterentwicklung atomar auflösender Sondentechniken, im Detail verstanden. • Medizintechnik : Poröse Materialien mit einem hohen Verhältnis von Oberfläche zu Volumen werden als implantierbare Medikamentendepots verwendet. Die Oberfläche künstlicher Hüftgelenke wird oft dahingehend modifiziert, um einen optimalen Verbund des Implantates mit dem Oberschenkelknochen zu erreichen. Die Gelenkskugel wiederum kann mit reibungsmindernden Materialien beschichtet werden. Die breite thematische Streuung der obigen Punkte zeigt, dass sowohl im Bereich der Charakterisierung von Grenzflächen als auch in der Anwendung von Grenzflächenphänomenen immer noch ein großer Spielraum besteht. 162 3.8 3.8.1 KAPITEL 3. MEHRSTOFFSYSTEME Präparationsmethoden Einleitung Die Vielfalt von Herstellungsmethoden für verschiedene Materialklassen ist extrem groß. Für die einzelnen Arten von Werkstoffen wie z. B. Metalle, Keramiken, Polymere und Halbleiter existieren in jeder Kategorie einige Verfahren, welche das entsprechende Material in bestimmten, durchaus unterschiedlichen, Formen und Strukturen darstellen. Ähnlich wie im vorhergehenden Abschnitt über die Anwendungen von Grenzflächen kann daher die folgende Liste verschiedener Herstellungsverfahren nur willkürlich herausgegriffene Methoden enthalten und ist daher in keiner Weise vollständig. 3.8.2 Abscheidung aus der Schmelze Die Herstellung von Metallen aus ihren Schmelzen gehört zu den ältesten bekannten Verfahren. Diese Methode kann zum formgebenden Guss eines Metalles, zur Herstellung von Legierungen wie auch zur Entfernung von Verunreinigungen gebraucht werden. Seit etwa 1950 kommen schmelztechnische Verfahren auch in der Polymertechnik und in der Halbleitertechnik zum Einsatz. • Konventionelles Schmelzen: Im Erz vorhandene Metalle werden durch Zufuhr thermischer Energie in die flüssige Phase übergeführt. Die hochschmelzende Gesteinsmatrix bleibt fest und wird als Schlacke abgeführt. • Andere Schmelzverfahren: Thermische Energie kann nicht nur durch Erhitzen mittels Brennstoffen zugeführt werden, sondern auch durch elektrische Widerstandsheizung, durch elektrische Induktion, oder durch Beschuss eines Materiales mit energiereichen Elektronen. Diese Verfahren werden oft unter Vakuumbedingungen angewendet (im Falle des Elektronenstrahlschmelzens ist eine Vakuumumgebung sogar zwingende Voraussetzung) und erlauben daher die Darstellung (Herstellung) extrem reiner, oxidfreier Substanzen. • Formgebende Verfahren: Metall- und Polymerschmelzen können durch Guss zunächst in eine Grobform gebracht werden, welche durch weitere Bearbeitungsschritte in den gebrauchsfertigen Endzustand des Bauteiles gebracht wird. Spezielle Verfahren sind z. B. der Spritzguss, welcher in einem Schritt die Herstellung von maßhaltigen Polymerbauteilen erlaubt oder die Extrusion, welche zur Herstellung von Drähten oder Profilen dient. • Oberflächenspezifische Verfahren: Das Aufschmelzen von Oberflächen mittels Schweißflammen, Laser- oder Elektronenbeschuss ermöglicht die gezielte Modifikation vom Metalloberflächen. Das aufgeschmolzene Volumen ist sehr klein und erstarrt daher rasch wieder, wodurch der oberflächennahe Bereich wesentlich feinkörniger ist als das darunter liegende Material. Auch können verschiedene Legierungsbestandteile in einem metastabilen Zustand wesentlich feinverteilter vorliegen. Das führt meist zu einer höheren mechanischen Belastbarkeit der Oberfläche. 3.8. PRÄPARATIONSMETHODEN 163 • Kristallzucht: Taucht man einen kalten Draht in eine Materialschmelze, so bilden sich dort Kristallite. Werden die so entstandenen Kristallite aus der Schmelze herausgezogen, so erstarrt an der Kontaktfläche Kristallit/Schmelze immer weiteres Material. Da auch an den Seitenflächen Erstarrung eintritt, wächst der Querschnitt des entstehenden Kristalles immer weiter an. Um mit dieser Methode (Bridgeman oder CzochralskiVerfahren) einen Einkristall zu erzeugen, sollte mit der Schmelze in den Anfangsphasen nur ein einzelner, wohl orientierter Kristallit in Berührung kommen. Dieser wird Keimkristall genannt. Kristallwachstum aus der Schmelze wird z. B. zur Herstellung von Halbleiterkristallen verwendet. Im Falle von Si ist es möglich, monokristalline Säulen mit Durchmessern von bis zu 30 cm herzustellen. 3.8.3 Abscheidung aus der Gasphase Die Abscheidung von Materialien aus ihrer Gasphase dient meist zur Herstellung von dünnen Schichten auf einem Trägermaterial. Sie kann allerdings auch zur Trennung von Flüssigkeitsoder Feststoffgemengen durch Sublimation oder Destillation verwendet werden. • Physikalische Gasphasenabscheidung: Bei den sogenannten PVD (Physical Vapor Deposition) Verfahren werden Metalle oder Dielektrika entweder durch Zufuhr thermischer Energie oder durch Beschuss mit energiereichen Ionen unter Vakuumbedingungen in die Gasphase übergeführt. Der so entstandene Dampf schlägt sich auf einem Trägermaterial, dem sogenannten Substrat nieder und bildet dort eine Schicht. PVDProzesse arbeiten unter Hochvakuum- oder Ultrahochvakuumbedingungen und erlauben daher die Darstellung extrem reiner Materialien. Sie werden häufig in der Mikroelektronik und Optik eingesetzt. • Chemische Gasphasenabscheidung: Bei den sogenannten CVD (Chemical Vapor Deposition) Verfahren trifft eine in einem Trägergas dispergierte molekulare Verbindung eines Materiales auf eine heiße Festkörperoberfläche auf. Das Molekül zersetzt sich dort, die flüchtigen Komponenten dampfen ab, Feststoffe bilden eine Schicht. Es können mit Hilfe dieses Verfahrens sowohl Metalle als auch Halbleiter oder Isolatoren abgeschieden werden, sofern eine molekulare Vorläufersubstanz (ein sogenannter Precursor“) ” existiert. 3.8.4 Abscheidung aus der Flüssigphase Auch bei der Abscheidung von Materialien aus Lösungen oder Schmelzen bilden sich dünne Schichten auf einem Substrat. Durch das vollständige Eintauchen des Trägers in die Flüssigphase können komplex geformte Bauteile beschichtet werden. • Elektrochemische Abscheidung: Die elektrochemische oder galvanische Abscheidung von Metallen aus (meist wässrigen) Lösungen ist eines der ältesten Beschichtungsverfahren. Im Prinzip werden positive Metallionen am Substrat, welches auf negativem Potential liegt, neutralisiert und bilden eine Metallschicht. Die Auswahl an Metallen, 164 KAPITEL 3. MEHRSTOFFSYSTEME welche mit diesem Verfahren aufgebracht werden können, ist durch die Verfügbarkeit von wasserlöslichen Metallsalzen begrenzt. • Anodische Oxidation: Das metallische Substrat wird in reines Wasser eingetaucht und liegt auf positivem Potential. Es wird von OH − -Ionen erreicht. Es bilden sich zunächst Metallhydroxide und, in der Folge, Metalloxide. Wird als Substrat Aluminium verwendet, so ist dieses Verfahren auch als ELOXAL-Verfahren (ELektrochemisch OX idiertes ALuminium) bekannt. • Schmelztauchen: Das kalte Substrat wird in eine Metallschmelze getaucht und so mit einer Metallschicht überzogen. Um die Benetzbarkeit des Substrates mit der Schmelze zu steigern, wird das Substrat oft mit einem Flussmittel vorbehandelt. Wird als Schmelze Zn gewählt, so ist dieses Verfahren als Feuerverzinken bekannt. 3.8.5 Darstellung aus der festen Phase Formbauteile können durch Verpressen und gleichzeitige oder nachfolgende Temperaturbehandlung aus Pulvern hergestellt werden. In den Anfangsphasen dieser Technologie wurden meist Metallpulver verwendet. Daher werden diese Verfahren oft auch als pulvermetallurgische Verfahren bezeichnet. In letzter Zeit werden sie jedoch auch zusammen mit Keramiken oder Kohlefasern angewendet. Weiters eröffnet die Verfügbarkeit von Pulvern mit Korngrößen im nm-Bereich neue materialphysikalische Möglichkeiten, da Materialien, welche aus solchen Pulvern hergestellt wurden, einen sehr hohen Anteil an inneren Grenzflächen aufweisen. Ihre physikalischen Eigenschaften werden eher von der Grenzflächenphase als von den Volumseigenschaften des Pulvermateriales dominiert. • Sintern: Ein Metallpulver wird bei Raumtemperatur unter hohem Druck (im Bereich einiger MPa) zu einem Formteil, dem sogenannten “Grünling“ verpresst. Dieser wird im Nachhinein einer Temperaturbehandlung unterzogen. Die Behandlungstemperatur liegt dabei unterhalb des Schmelzpunktes des Pulvers. Allerdings werden Diffusionsprozesse an der Pulveroberfläche aktiviert, welche zu einem Zusammenfließen“ der ” einzelnen Körner führen und damit die Porösität des Bauteiles verringern. • Unidirektionales Heißpressen: Pulver werden unter hohem Druck (einige MPa) und unter hoher Temperatur (unterhalb des Pulverschmelzpunktes) zu einem Formteil verpresst. Der Druck wird in einer Vorzugsrichtung (Stempelrichtung der Presse) aufgebracht. • Isostatisches Heißpressen: Pulver werden unter hohem Druck (einige MPa) und unter hoher Temperatur (unterhalb des Pulverschmelzpunktes) zu einem Formteil verpresst. Der Druck wird allseitig aufgebracht. Das Verfahren ist hauptsächlich unter seiner englischen Abkürzung HIP (H ot I sostatic P ressing) bekannt. 3.8. PRÄPARATIONSMETHODEN 3.8.6 165 Nachbehandlungen Ein wesentlicher Schritt in der Darstellung verschiedenster Materialklassen sind verschiedene Nachbehandlungen. Eine besondere Position für metallische Werkstoffe nehmen z. B. thermische Nachbehandlungsschritte ein. Diese aktivieren Diffusionsprozesse im Material, welche, wie bereits besprochen, zur teilweisen Entmischung der Legierungskomponenten oder zur Rekristallisation des Gefüges führen. Bei geeigneter Temperaturwahl und Behandlungsdauer können so Kristallitgrößen, Ausscheidungsgrößen und Phasenverteilungen und damit die Materialeigenschaften in einem hohen Ausmaß gesteuert werden. Für Kunststoffe und Polymere können, neben thermischen Nachbehandlungen, auch chemische oder photochemische Nachbehandlungen zum Einsatz kommen, welche z. B. zum Aushärten des Kunststoffes oder zur Oberflächenaktivierung zwecks besserer Verklebbarkeit dienen. Wie bereits erwähnt, ist die obige Liste von Herstellungs- und Behandlungsmethoden keinesfalls vollständig. Industrielle Verfahren wie Schmieden, Lackieren, Verformen oder Kleben werden technologisch immer anspruchsvoller und gehen an die Grenzen verschiedenster chemischer oder mechanischer Materialeigenschaften. Weiters werden immer innovativere Verfahren zur Erzeugung exotischer Materialien wie z. B. metallischer Gläser entwickelt (Darstellung metallischer Mehrstoffsysteme aus der Schmelze unter hohen Gravitationsgradienten in einer Zentrifuge). Auch die Kombination mehrerer Verfahren zur Herstellung von Kompositwerkstoffen wird immer interessanter. In all diesen Teilbereichen sind innovative Problemlösungen unter Anwendung anspruchsvoller theoretischer und experimenteller Hilfsmittel gefragt. 166 KAPITEL 3. MEHRSTOFFSYSTEME Kapitel 4 Makroskopische Eigenschaften von Festkörpern und Grenzflächen 4.1 4.1.1 Metalle, Halbleiter und Isolatoren Metalle Die Bedeutung von Metallen im täglichen Leben ist herausragend. Ein Verständnis des physikalischen Verhaltens ist dagegen sehr oft ohne quantenmechanische Vorstellungen und Modelle nicht möglich. Im Folgenden wird nun eine kurze Darstellung über wichtige auftretende Phänomene gegeben. Gleichzeitig wird auf die Vorlesungen über Festkörperphysik I und II verwiesen, in denen viele der andiskutierten Aspekte ausführlicher besprochen werden. Eine Welt ohne Metalle ist schwer vorstellbar, da deren Gebrauch viele tausend Jahre in die Menschheitsgeschichte zurückreicht und ganze Perioden nach Metallen benannt wurden. Anwendungsbeispiele von heute reichen von Hochspannungsleitungen bis Verdrahtungen auf ICs (< 30 µm), von Eisenbahnbrücken bis zu den sprichwörtlichen Pflugscharen aus hochleistungsfähigen Metallkombinationen und vieles mehr. Für letztere Gruppe von Werkstoffen ist vor allem deren Belastbarkeit (mechanische Spannungen und Dehnungen) von Bedeutung. Als Beispiel sei hier eines der leistungsfähigsten Materialien – der hochlegierte Stahl MP35N – angeführt, dessen Zugfestigkeit, ausgedrückt durch den Parameter Y2,0 ≈ 2200 N/mm2 (yield strength) etwa 10 mal so hoch ist als für einfachen Baustahl. Dieses Material besteht aus 35 % Co, 35 % Ni, 20 % Cr und 10 % Mo, enthält aber kein Fe! Atome, die Metalle konstituieren, sind durch eine geringe Anzahl von Elektronen in der äußeren Schale charakterisiert. Die zur Abspaltung dieser Außenelektronen nötige Ionisierungsenergie ist ebenfalls klein (Eion < 10 eV). Metalle ordnen sich zu einem Metallgitter aus positiv geladenen Atomrümpfen, während die Elektronen der äußersten Schale (= Leitungselektronen) über das ganze Gitter verteilt sind. Keines dieser Elektronen gehört mehr zu einem bestimmten Kern, diese Elektronen sind frei beweglich, also nicht an bestimmte Energieniveaus (Orbitale) gebunden, sie befinden sich im “Leitungsband“ und bilden das “Elektronengas” (siehe auch den folgenden Abschnitt, bzw. Festköperphysik I). 167 168 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Aus dieser Bindungsart und diesem Gitteraufbau resultieren folgende typische Eigenschaften der Metalle: • Glanz (Spiegelglanz) Die frei beweglichen Elektronen können eingestrahlte, aufgenommene Energie in einem breiten Wellenlängenbereich wieder unverändert emittieren; so entstehen der Glanz und der Spiegeleffekt. Aus glatten Metalloberflächen werden deshalb Spiegel angefertigt. • Undurchsichtigkeit Die an der Metalloberfläche stattfindende Reflexion (vgl. Physik II) bewirkt zugleich, dass Licht das Metall nicht durchdringen kann. Metalle sehen deshalb bereits in dünnsten Schichten in der Durchsicht grau bis schwarz aus. • Gute elektrische Leitfähigkeit Die Drift der frei beweglichen Elektronen in eine Richtung begründet den makroskopischen Stromfluss. • Gute thermische Leitfähigkeit Die leicht verschiebbaren Elektronen nehmen an der Wärmebewegung teil und tragen so zum Wärmetransport bei (siehe auch: WiedemannFranz-Gesetz). • Gute Verformbarkeit (Duktilität) Im Metallgitter befinden sich Versetzungen, die sich schon bei einer Spannung unterhalb der Trennspannung bewegen können; je nach Gittertyp verformt sich also ein Metall eher, als dass es bricht. • Hoher Schmelzpunkt durch die allseitig gerichteten Bindungskräfte. Die folgende Tabelle zeigt die Schmelz- und Siedetemperaturen einiger Metalle bei Normaldruck. Element Schmelztempertur [◦ C] Aluminium 659 Wolfram 3422 Eisen 1536 Magnesium 650 Kupfer 1083 Zinn 231.9 Blei 327.4 Zink 419.5 Siedetempertur [◦ C] 2467 5555 3070 1120 2595 2687 1751 907 Als hochschmelzend bezeichnet man Metalle, deren Schmelzpunkt über 2000 K bzw. über dem Schmelzpunkt von Platin (= 2045 K) liegt. Dazu gehören die Edelmetalle Ruthenium, Rhodium, Osmium und Iridium und Metalle der Gruppen IVA (Zirkonium, Hafnium), VA (Vanadium, Niob, Tantal), VIA (Chrom, Molybdän, Wolfram) und VIIA (Technetium, Rhenium). 4.1. METALLE, HALBLEITER UND ISOLATOREN 169 Metalle, deren Verbindungen und Legierungen werden ihrer Verwendung nach entsprechend ausgewählt. • Münzen: der Einsatz von Au, Ag, Pt ist sehr teuer; Ni dagegen kann Allergie erzeugen; • bei chemischen Prozessen: Pt als Katalysator; Stabilität und Reaktivität der einzelnen Metalle ist wesentlich; Na, K, Hg und dgl. müssen damit für die meisten Anwendungen ausgeschlossen werden (Korrosion). • Mechanische Eigenschaften: reine Elemente sind oftmals zu weich; Legierungen weisen aber höhere elektrische Widerstände auf. • Thermische Eigenschaften: Temperaturkoeffizienten des elektrischen Widerstandes, der thermischen Ausdehnung, etc. müssen beachtet werden; oberhalb von 1000◦ C kaum einsetzbar. • Kompatibilität mit anderen Materialien: beim Schweißen, Löten, Thermospannungen und dgl. • Kompatibilität bei Produktionsprozessen: dünne Filme, Drähte, Gussteile, . . . Eine Schlüsseleigenschaft von Metallen ist deren elektrische Leitfähigkeit und die verschiedensten Anwendungen in diesem Bereich erfordern den Einsatz verschiedenster metallischer Elemente und deren Kombination. Um allen Erfordernissen bezüglich der elektrischen Leitfähigkeit zu genügen, werden in ICs verschiedenste Leiter eingesetzt: polykristallines hochdotiertes Si, Silizide, Al mit ≤ 1 % Si und Cu, W sowie TiN, da ein einziges Material die spezifischen Notwendigkeiten nicht erfüllen könnte. Metallische Leiter, die Transistoren und andere Komponenten in ICs verbinden, müssen viele, sich vielfach widersprechende Eigenschaften aufweisen. erforderliche Eigenschaften Erfordernisse NICHT erfüllt von sehr gute Leitfähigkeit allen außer Ag, Cu hohe eutektische Temperatur mit Si Au, Pd, Al, Mg geringe Diffusion in Si Cu, Ni, Li geringe Oxidationsrate, stabile Oxyde Mg, Fe, Cu, Ag hoher Schmelzpunkt Al, Mg, Cu minimale Wechselwirkung mit Si Substraten Pt, Pd, Rh, V, Ni, Mo, Cr minimale Wechselwirkung mit poly Si Pt, Pd, Rh, V, Ni, Mo, Cr keine Wechselwirkung mit SiO2 Hf, Zr, Ti, Ta, Nb, V. Mg, Al chemische Stabilität Fe, Co, Ni, Cu, Mg, Al leichte Strukturierbarkeit Pt, Pd, Ni, Co, Au Resistenz gegen Elektromigration Al, Cu und vieles andere ... 170 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Das am besten verwendbare Material ist Aluminum (mit < 1 % Si und Cu). Obwohl Al insgesamt ziemlich unvorteilhaft ist, wird es eingesetzt, da alle anderen Stoffe noch wesentlich mehr Probleme hervorrufen. Gegenwärtig wird aber versucht, auf Cu (und Cu-Legierungen) umzustellen, insbesondere wegen der herausragenden Leitfähigkeit. Das klassische Elektronengas Metalle sind chemisch dadurch gekennzeichnet, dass sie leicht Elektronen abgeben, d.h. durch geringe Ionisationsenergie ihrer Valenzelektronen. Elektronenabgabe an OH-Gruppen befähigt Metalle und Metalloxide zur Basenbildung. Auch die typischen physikalischen Eigenschaften der Metalle - geringer elektrischer Widerstand und hohe Wärmeleitfähigkeit, Undurchsichtigkeit, Reflexion und Glanz - beruhen auf der leichten Abtrennung der Valenzelektronen. Um handhabbare Modelle für Metalle zu entwickeln, wurden anfänglich zwei grundlegende Annahmen gemacht: • die Elektronen wechselwirken nicht mit den Atomrümpfen • die Elektronen wechselwirken nicht miteinander P. Drude und H.A. Lorentz nahmen an, die Valenzelektronen im Kristallverband des Metalls gehören nicht mehr bestimmten Atomen an, sondern bewegen sich als Gas freier Elektronen durch das Gitter der Rumpfionen. Dieses Bild erklärt vieles erstaunlich gut, versagt aber in anderen Punkten vollständig. Ein freies Elektron müßte nach dem Gleichverteilungssatz eine kinetische Energie (3/2)kB T haben, zur spezifischen Wärme des Metalls also außer den 25 J/mol · K2 des Rumpfionengitters weitere 12 J/mol · K2 (1 Valenzelektron/Atom) beitragen. Warum das nicht der Fall ist, zeigt erst die Fermi-Statistik, die auf den quantenmechnischen Charakter der Elektronen (= Spin 1/2-Teilchen) Bezug nimmt. Die Drude-Lorentz-Theorie ist in der Lage, den elektrischen Widerstand sowie das Wiedemann-Franz Gesetz zu erklären. Die Elektronen fliegen mit einer Geschwindigkeit v, bis sie nach einer mittleren freien Weglänge l, zeitlich also nach einer Flugdauer τ = l/v durch einen Stoß abgelenkt werden. Im elektrischen Feld E wird ein Elektron mit v̇ = −eE/m entgegengesetzt zum Feld beschleunigt. Innerhalb der freien Flugdauer erhält es so eine gerichtete Zusatzgeschwindigkeit v = −eEτ /m, die sich der viel größeren, aber völlig ungeordneten thermischen Geschwindigkeit überlagert. Beim Stoß wird diese Zusatzgeschwindigkeit i.A. wieder verloren, und der Prozess beginnt 4.1. METALLE, HALBLEITER UND ISOLATOREN 171 von vorne. Im Mittel driftet es also mit vd = −(1/2)eEτ /m entgegen der Feldrichtung. Seine Beweglichkeit (Geschwindigkeit des Ladungstransports pro Feld) ist µ= 1 eτ . 2m Die Leitfähigkeit σ von n Elektronen/m3 σ = enµ = 1 e2 nτ 2 m (4.1) hängt dann nicht mehr vom elektrischen Feld ab (Ohmsches Gesetz). Übernimmt man für die thermische Leitfähigkeit die klassische Formel eines einatomigen Gases, d.h. 1 (4.2) λ = nvlkB , 2 so folgt für das Verhältnis von Wärme- und elektrischer Leitfähigkeit 2 λ mkB v 2 3kB = = T σ e2 e2 (4.3) das Wiedemann-Franz-Gesetz, das empirisch gefunden wurde. Die Tatsache, dass der Quotient in Glg. 4.3 nur aus Konstanten besteht, bedeutet, dass beide Arten von Leitfähigkeit durch den gleichen Mechanismus bewirkt werden. Ein guter elektrischer Leiter ist also auch ein guter thermischer Leiter. Für die Größen von σ und λ ist entscheidend, was unter den Stößen zu verstehen ist, die den freien Flug der Elektronen beenden. Als Stoßpartner oder Streuzentren kommen zuallererst die Rumpfionen und andere freie Elektronen in Betracht. Das würde eine freie Weglänge von wenigen Å bedeuten, die viel zu klein ist. Warum die Rumpfelektronen, solange sie völlig periodisch angeordnet sind, und die anderen freien Elektronen nicht streuen, wird von der Quantenmechanik beantwortet. Elektronen können über ein periodisches Potential blochwellenartig ohne Streuung hinweggehen. Elektronen dürfen sich auf Grund des Pauliverbots nicht zu “nahe” kommen. Nur Störungen der Periodizität wirken als Streuzentren. Solche Störungen beruhen auf • auf Einlagerung von Fremdatomen, • auf Abweichungen vom idealen Gitterbau: Kristallitgrenzen, Dislokationen, mechanische Verformungen, usw., • auf thermische Gitterschwingungen, die ebenfalls momentane Abweichungen von den idealen Abständen zwischen Gitterteilchen bedingen. Alle diese Faktoren beeinflussen die freie Flugdauer (Relaxationszeit) τ und damit die Beweglichkeit µ. Dagegen ist die Elektronenkonzentration n für Metalle praktisch temperaturunabhängig. Ein Metall leitet also umso besser, je reiner, je monokristalliner und spannungsfreier und je kälter es ist. Der Restwiderstand bei Annäherung an den absoluten Nullpunkt ist daher ein hervorragendes Reinheitskriterium. 172 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Wir untersuchen die Streuung von Elektronen durch geladene Teilchen im Gitter (Anzahldichte N , Ladung Ze), genauer durch Stellen im Gitter, die einen anderen Ladungszustand haben als das normale Gitter. Diese Streuung verläuft ähnlich wie die Rutherfordsche Ablenkung von α-Teilchen durch Kerne. Eine erhebliche Ablenkung erfolgt nur bei sehr nahem Vorbeiflug am Streuzentrum, d.h. bei sehr kleinem Stoßparameter p. Man kann die Grenze zwischen Streuung und Nichtstreuung bei einem Ablenkwinkel von 90◦ ansetzen. Ihm entspricht ein Stoßparameter p, der gleich dem minimalen Abstand 2a ist, bis auf den das Elektron mit der Energie E bei zentralem Stoß an das Streuzentrum herankäme: pkr = 2a = Ze2 . 4π0 E (4.4) Die Energie des Elektrons ist die thermische Energie, also pkr = 2Ze2 . 12π0 kB T (4.5) Der Streuquerschnitt ist A = πp2kr , die mittlere freie Weglänge l = 1/(N A) und damit die freie Flugdauer 1 1 l p (4.6) τ= = v N A 3kB T /m und die Leitfähigkeit 3/2 18π 2 20 kB T 3/2 n 1 e2 nτ = √ . σ= 2m 3 m1/2 Z 2 e2 N (4.7) Die aus Glchg. 4.7 resultierende Zunahme der Leitfähigkeit mit T 3/2 ist allerdings nur selten zu beobachten. Bei Halbleitern ist sie überdeckt durch die viel stärkere exp(−E/kB T )Abhängigkeit der Ladungsträgerkonzentration n; bei Metallen findet man oft gerade die umgekehrte Abhängigkeit σ ∼ T −3/2 . Sie beruht auf der Streuung der Elektronen an den Verzerrungen des Gitters durch thermische Schwingungen, d.h. durch Elektron - Phonon Stöße. Eine genaue Berechnung unter Zuhilfenahme der halbklassischen Boltzmann-Theorie führt aber zu einer T 5 -Abhängigkeit des elektrischen Widerstandes bei tiefen - und zu einer linearen Temperaturabhängigkeit bei hohen Temperaturen. Mehr Details werden in Festkörperphysik II besprochen. Das Fermi-Gas Klassisch betrachtet können Elektronen einander zwar räumlich nicht beliebig nahe kommen, aber es besteht kein Grund, warum sie nicht exakt den gleichen Impuls haben sollten. Das quantenmechanische Elektron erfüllt dagegen den gesamten Raum als Welle und hat daher die Möglichkeit, das Verhalten anderer Elektronen mitzubeeinflussen. Die Unschärferelation zeigt, dass eine solche gegenseitige Impulsbeeinflussung tatsächlich vorliegt. Elektronen seien in einem Kristall der Kantenlänge L eingesperrt. Die größtmögliche Unschärfe in der Angabe des Ortes ist dann ungefähr ∆x = L. Dieser maximalen Ortsunschärfe ist eine minimale Impulsunschärfe ∆p = h/L zugeordnet. Dieses Impulsintervall beansprucht jedes 4.1. METALLE, HALBLEITER UND ISOLATOREN 173 Elektron für sich und “läßt kein anderes hinein” (es sei denn mit entgegengesetztem Spin). Zeichnet man die möglichen Werte des Impulsvektors p für ein derart eingesperrtes Elektron auf, dann bilden sie ein Punktgitter, dessen Punkte einen Abstand h/L voneinander haben. Jeder Elektronenzustand nimmt also ein Volumen h3 /L3 im Impulsraum ein. Jede solche Zelle h3 /L3 kann höchstens mit zwei Elektronen mit entgegengesetzten Spins besetzt werden. Dieses Punktgitter hat zunächst mit dem Kristallgitter nichts zu tun (auch nicht mit dem reziproken Gitter) und würde auch für einen völlig homogenen dreidimensionalen Potentialtopf gelten. Im Impulsraum mit den Koordinaten px , py , pz entspricht einem bestimmten 2 Wert der kinetischen Energie E = p√ /(2m) eine Kugelfläche vom Radius p = 2mE. Wenn man N Elektronen möglichst energiesparend unterbringen will, was der wirklichen Verteilung bei tiefen Temperaturen entspricht, muss man die Zustände “von innen”, d.h. von kleinen p-Werten an auffüllen. N Elektronen brauchen N/2 ZelAbbildung 4.1: Fermi- und Boltzmannverteilen, d.h, ein Impulsvolumen (1/2)N h3 /L3 . lung für verschiedene Temperaturen und verDieses Volumen bildet eine Kugel; ihr Raschiedenen Teilchenzahlen. dius, der Fermi-Impuls pF , ergibt sich aus (1/2)N h3 /L3 = 4πp3F /3 zu pF = h(3N/(8πL3 ))1/3 oder mit der Teilchenzahldichte n = N/L3 zu 1/3 3 n pF = h 8π (4.8) Dem entspricht die Fermi-Energie p2 h2 EF = F = 2m 2m 3 n 8π 2/3 (4.9) Ein Teilchengas, das sich verhält wie beschrieben, heißt entartetes oder Fermi-Gas. Die Temperatur, die gemäß kB T = EF der Fermi-Energie entspricht, heißt Entartungstemperatur TF . Bei der Temperatur T ist ein Gas entartet, wenn T TF . Für ein Metall mit n = 1022 bzw. 1023 Elektronen/cm3 ist EF = 1.7 bzw. 7.9 eV; TF = 19700 bzw. 91200 K. Die Anzahl der Zustände mit Energien zwischen E und E + dE entspricht dem Volumen einer Kugelschale im p-Raum. Am einfachsten erhält man diese Anzahl, oder vielmehr räumlich-energetische Dichte durch Auflösen von Glg. 4.9 nach n und Differenzieren nach E: 3/2 √ 2m dn = 4π E dE (4.10) h2 174 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Bei T = 0 sind alle diese Zustände unterhalb EF besetzt; darüber keiner mehr. Bei höheren Temperaturen verschwimmt die scharfe Grenze bei EF : Der “Fermi-Eisblock” schmilzt etwas ab, Elektronen wechseln von Zuständen knapp unterhalb EF in solche knapp oberhalb. Dieser Vorgang erfasst eine energetische Breite von etwa kB T beiderseits EF . Genauer ergibt sich die Wahrscheinlichkeit, dass ein Zustand mit der Energie E besetzt ist als f (E) = 1 exp[(E − EF )/(kB T )] + 1 (4.11) Diese Funktion hat den Wert 1/2 bei E = EF und geht beiderseits antisymmetrisch gegen 0 bzw. gegen 1. Der Abstand der Funktion von diesen asymptotischen Werten verringert sich bei einem Schritt kB T in E-Richtung jedesmal etwa um den Faktor e. Erst für kB T EF geht die Verteilung in die Boltzmannverteilung des nichtentarteten Gases über; vorher ist sie völlig anders. Man kann für kB T EF höchstens von einem Boltzmann-ähnlichen “FermiSchwanz” reden, der über dem “FermiEisblock” steht, wobei die Energie von EF an gezählt werden muss: Für E − EF kB T wird E − EF f (E) ≈ exp − . kB T Alle diese Aussagen gelten auch noch, wenn den Teilchen nicht wie im freien Elektronengas alle Energien mit der Zustandsdichte Glg. 4.10 zur Verfügung stehen, sondern wenn einige Bereiche nicht besetzt sind (verbotene Energiebereiche, Bändermodell). Im nichtentarteten Gas haben alle Teilchen eine mittlere Energie, die um kB T höher ist als bei T = 0. Im Fermi Gas gilt dies nur für die Teilchen, die in einem Streifen der Breite kB T unterhalb der Abbildung 4.2: Die Fermikurve regelt den Fermi-Energie saßen, d.h. für einen BruchBruchteil der besetzten Zustände, unabhängig teil k T /E aller Teilchen (nicht ganz B F davon, ob im betrachteten E-Bereich Zustände genaue Angabe). Die spezifische Wärme liegen oder nicht. ist demnach nicht (3/2)kB /m sondern nur 2 (3/2)kB T /(EF m). Der Beitrag der Elektronen zur spezifischen Wärme eines Metalls ist also einige hundertmal kleiner als die nach Dulong-Petit erwarteten 25 J/mol · K. Damit ist auch das lange ungelöst gewesene Problem geklärt, dass ein Metall bei üblichen Temperaturen im Wesentlichen nur die spezifische Wärme seiner Ionenrümpfe zeigt. Nur bei sehr tiefen Temperaturen können andere Beiträge wesentlich werden. 4.1. METALLE, HALBLEITER UND ISOLATOREN 175 Metalloptik Eine Lichtwelle kann in das dichte Elektronengas eines Metalls ebensowenig eindringen, wie eine Radiowelle in das sehr viel dünnere Elektronengas der Ionosphäre. Das Licht wird reflektiert, das Metall zeigt selbst bei rauher Oberfläche den typisch stumpfen Glanz. Es gibt aber eine Grenzfrequenz für diese Reflexion. Sie ist gleich der Langemuir-Frequenz des Elektronengases und abhängig von der Teilchenzahldichte n, s ne2 (4.12) ω0 = 0 m Für n = 1028 bzw. 1029 m−3 , erhält man ~ω0 = 3.5 bzw. 11.1 eV, entsprechend λ = 340 bzw. 110 nm. Für ist nur die Polarisation der Ionenrümpfe maßgegebend, denn die freien Elektronen fallen ja gerade bei der Frequenz ω0 aus. Tatsächlich werden Metalle je nach ihrer Elektronenkonzentration im näheren oder ferneren UV transparent, wenigstens in dünnen Schichten (z.B. Na ab 210 nm). Gleichzeitig verlieren sie aber auch ihr hohes Reflexionsvermögen. Bei manchen Metallen liegt die Langmuir-Frequenz im Sichtbaren z.B. bei Gold im Violetten. Der Ausfall der Violettreflexion läßt Gold gelblich schimmern. Das Absorptions- und Reflexionsvermögen lässt sich durch die Dielektrizitätskonstante beschreiben und wird im letzten Teil dieser Vorlesung (vgl. Dielektrische Eigenschaften) noch genauer besprochen. Elektrischer Widerstand und Wärmeleitung Die Drude-Lorentz-Theorie der elektrischen Leitfähigkeit, wie sie schon am Anfang dieses Abschnittes besprochen wurde, enthält einige “kühne” Annahmen, um die beobachteten Ergebnisse zu erklären: Die Elektronen bemerken bei ihrer Driftbewegung im elektrischen Feld die Anwesenheit der Ionenrümpfe praktisch nicht und werden nur an Störungen des regulären Gitters gestreut; ebensowenig beeinflussen sie einander in ihrer Driftbewegung. Kupfer bei Zimmertemperatur hat eine Leitfähigkeit σ = 6 × 107 Ω−1 cm−1 . Daraus folgt nach Glg. 4.1 eine Beweglichkeit von etwa 10−2 m2 /Vs und eine freie Weglänge von etwa 100 Å. Bei 10 K ist die Leitfähigkeit mehr als 100 mal größer, d.h. die Leitungselektronen driften etwa 104 Atomabstände ohne Stoß. Bei Heliumtemperaturen ergeben sich für einige Metalle freie Weglängen von bis zu einigen cm. Dass die Elektronen mit den idealen Ionenrümpfen praktisch keine Energie austauschen, folgt aus den Welleneigenschaften dieser Teilchen. Die anderen Leitungselektronen bilden aber selbst keinesfalls ein streng periodisches Gitter. Dass Elektron-Elektron Stöße so selten sind, beruht teilweise auf der Abschirmung ihrer Ladung und vor allem auf den Eigenschaften der Fermi Kugel. Ähnlich wie sich in einer Elektrolytlösung jede Ladungpmit einer Wolke von Gegenionen umgibt, deren Abmessung die Debye-Hückel Länge dDH = 0 kB T /(e2 n) ist, so versammelt jede positive Ladung in einem Metall einen Überschuß von Leitungselektronen um sich; jede negative erzeugt ein partielles Elektronenvakuum. Im Ausdruck für den Radius dieser p Wolke ist einfach kB T durch die Fermienergie zu ersetzen, außerdem kommt ein Faktor 2/3 dazu, 176 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN denn es handelt sich um eine kugelsymmetrische Anordnung (und nicht um eine ebene, wie oben impliziert). ion berücksichtigt nur die Polarisation der Ionenrümpfe: r 2ion 0 EF da = . (4.13) 3e2 n Natürlich darf da nicht viel kleiner sein als die Gitterkonstante, denn das würde bedeuten, dass die Elektronen fest an die Ionen gebunden sind. Tatsächlich liegt der Abschirmradius zwischen dem Bohr-Radius r0 und dem mittleren Elektronenabstand n−1/3 . Das Feld der Zentralladung reicht nur bis in etwa diesen Abstand da , weiter außen wird es von der Gegenelektronenwolke “verzehrt”. Der Stoßquerschnitt zwischen zwei Leitungselektronen oder einem Leitungselektron und einem Ion reduziert sich also von dem klassischen Wert A ≈ (e2 /(4π0 ))2 ≈ 2 · 105 Å2 auf etwa 10 Å2 . Man kann die Bildung der abschirmenden Wolken auch so beschreiben: Die Leitungselektronen bilden kein ungeordnetes Gas, sondern ein angenähertes Kristallgitter. Ihre Dichte ist maximal in der Nähe der Ionen. Sie halten sich gegenseitig auf Abstand und bewegen sich meist nur kollektiv durch das Gitter. Solche Kollektivbewegungen der Elektronen sind die Plasmaschwingungen, die zur Lichtabsorption führen. Ein eingeschossenes Elektron oder auch Photon regt bei der Reflexion vom Metall oder beim Durchgang durch dieses Plasmaschwingungen an, vor allem solche mit der Langmuir-Frequenz ω0 . Das ganze Fermi-Gas “schwappt” dabei relativ zum Gitter hin und her. Diese Schwingungen sind geAbbildung 4.3: Der spezifische Widerstand quantelt. Das Elektron kann nur ganzzahlige ρ ist eine der Stoffeingenschaften, die den Vielfache des Energiequants ~ω0 an die Plasgrößten Größenordnungsbereich überspannt. maschwingung abgeben, und es ergibt sich ein typisches glockenförmiges Enegieverlustspektrum. Ein Plasmaschwingungsquant heißt auch Plasmon. In einem sehr reinen Metall wird auch die Wärmeleitung überwiegend durch Leitungselektronen besorgt, bei einem weniger reinen durch Phononen, ähnlich wie im Isolator (siehe Kapitel Thermische Eigenschaften). Deshalb ist die Spanne der Wärmeleitfähigkeiten zwischen 4.1. METALLE, HALBLEITER UND ISOLATOREN 177 Metallen, Halbleitern und Isolatoren nicht so groß wie die in der elektrischen Leitfähigkeit: Das Wiedemann-Franz Gesetz gilt nicht durchgehend. Bei tiefen Temperaturen überwiegt aber in allen Metallen der Elektronenbeitrag. Hier ergibt sich klassisch aus der Thermodynamik λ = (1/3)Cel vl (4.14) Dabei ist Cel der elektronische Beitrag zu spezifischen Wärme, der in Festkörperphysik I p detailliert besprochen wird. v ist die sogenannte Fermi Geschwindigkeit mit vF = 2EF /m, l ist die freie Weglänge, also die Strecke, die Elektronen zwischen zwei Stößen zurücklegen können. Die elektrische Leitfähigkeit wurde schon definiert als σ = neµ = 1 ne2 l 2 m vF (4.15) so dass wieder das Verhältnis e2 3 e2 EF σ ≈ = 2 2 T vF T λ 2 2mvF kB kB (4.16) folgt. Das ist überraschend, wenn man bedenkt, wie verschieden die einzelnen Größen klassisch und quantenmechnisch definiert sind. Die Begrenzung der freien Weglänge durch Elektronen und Phonon-Stöße ergibt freie Weglängen, die mit fallender Temperatur wachsen. Erst wenn l bei sehr tiefen Temperaturen durch Kristallitgrößen, Abstand von Fremdionen u.ä. bestimmt wird, dominiert die Abhängigkeit von Cel ∼ T und führt zu λ ∼ T . Unter den gleichen Umständen wird die elektrische Leitfähigkeit temperaturunabhängig (entspricht dem Restwiderstand). Energiebänder Wir haben bis jetzt die freien Valenzelektronen in einem Metall als freie Elektronen aufgefasst, die sich ungestört durch das periodische Potential der Rumpfionen bewegen. Dies ist aber eine unvollkommene Näherung, denn es verbleibt eine gewisse Wechselwirkung mit dem Ionengitter, wenigstens bei gewissen Impulsen des Elektrons. Man muss ja bedenken, dass die Bewegung eines Elektrons mit der Energie E und dem Impuls p durch eine Welle ψ mit der Frequenz ω = E/~, der Wellenlänge λ = h/p oder dem Ausbreitungsvektor k = p/~ bestimmt wird. Die Aufenthaltswahrscheinlichkeit des Elektrons ist |ψ|2 (r). Wenn die ψWelle die Bragg Bedingung für die Reflexion an irgendwelchen Netzebenen erfüllt, ist keine fortschreitende ψ-Welle mehr möglich, sondern nur eine stehende, überlagert aus einfallenden und reflektierten Wellen. Speziell bei senkrechtem Einfall auf eine Netzebenenschar mit dem Abstand d tritt das bei nπ~ nπ oder p = k= d d auf. Für freie Elektronen gilt E = p2 /(2m) bzw. E = ~2 k 2 /(2m). Dieser parabolische Zusammenhang (Abb. 4.4) wird offenbar bei kritischen p- oder k-Werten durchbrochen, die Braggreflexion erlauben; dies sind die k-Vektoren, die auf einer Brillouin-Zonengrenze 178 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN enden. Hier gehen die fortschreitenden Wellen in stehende über, z.B. für k = π/d mit λ = 2d (Debye-Grenzwellenlänge). Für solche stehende Wellen gibt es zwei Hauptphasenlagen, ψ ∼ sin(πx/d) und ψ ∼ cos(πx/d). Im zweiten Fall ist |ψ|2 am Ort der Ionen (x = 0, d, . . .) maximal, dazwischen 0, im ersten ist es umgekehrt. Es ist klar, dass die cosWelle einer niedrigeren Gesamtenergie entspricht, weil sie die Nähe der Ionen ausnützt. Der im freien Zustand eindeutig bestimmte E-Wert zu p = π~/d spaltet also in zwei Zustände mit erheblich verschiedenen Energien auf. Die E(p)-Parabel muss dort aufgeschnitten werden; das eine freie Ende wandert abwärts, das andere aufwärts. So entsteht eine Folge von zumeist s-förmige Bögen, die die erlaubten Energiezustände bedeuten, mit dazwischenliegenden Lücken, den verbotenen Zonen. Die Breite der erlaubten Energiebänder ergibt sich in diesem einfachen Bild typischerweise zu p2 /(2m) = π 2 ~2 /(2md) ≈ 3 eV (bei d ≈ 3 Å). Für die Breite der verbotenen Zonen, d.h. der Differenz der potentiellen Energien einer sin- und cos-Welle, erwartet man die Größenordnung e2 /(4π0 d), was ebenfalls einige eV ergibt. Die Energiebänderstruktur ist natürlich abhängig von der Kristallstruktur und der Ausbreitungsrichtung der Elektronenwelle. Die Zonenkonstruktion von Brillouin zeigt, wo in einer gegebenen Richtung der Sprung von einem Band zum anderen erfolgt. Die E(k)-Fläche bleibt keine Rotationsfläche. Dementsprechend sind die Impulszustände in den verschiedenen Raumrichtungen verschieden weit aufgefüllt, nämlich dort am weitesten, wo die E(k)-Fläche am tiefsten liegt. Die Füllungsgrenze im p- bzw k-Raum, die für das freie Elektronengas eine Fermi-Kugel Abbildung 4.4: Die Wechselwirkung mit dem war, wird im Gitter zu einer Fermi-Fläche mit Gitter modifiziert die E(p)-Parabel des freien oft sehr komplizierter Topologie. Feinere EinElektronengases. zelheiten des elektromagnetischen und optischen Verhaltens der Metalle können auf Grund der Topologie der Fermi-Fläche und der Energiebänder verstanden werden. Es gibt eine Anzahl experimenteller Möglichkeiten, diese zu bestimmen. Die Existenz von Energiebändern folgt auch aus einer ganz anderen Betrachtung. Wir sind vom Gas freier Elektronen ausgegangen und haben die Störung durch das periodische Rumpfgitter eingebaut. Man kann auch vom anderen Grenzfall, nämlich von isolierten Metallatomen ausgehen und diese allmählich aneinander rücken. Dann beginnen die Elektronen von einem Atom zum anderen zu tunneln, d.h. ihre Aufenthaltsdauer bei einem bestimmten Atom wird begrenzt, z.B. auf τ . Nach der Unschärferelation müssen sich dann die ursprünglich scharfen Energiezustände der Elektronen verbreitern um ∆E ≈ h/τ . Im Grenzfall, wenn die Elektronen, halbklassisch gesprochen, bei jedem Bohrumlauf, also 8md2 /h ≈ 10−15 s das Durchtunneln gelingt, wird sicher ∆E = h2 /(8md2 ). Die Elektronen tieferer Schalen haben eine sehr viel kleinere Tunnelwahrscheinlichkeit und entsprechend kleinere Termverbreiterung (Abb. 4.5). Es besteht eine gewisse Entsprechung zwischen den Zuständen des freien 4.1. METALLE, HALBLEITER UND ISOLATOREN 179 Abbildung 4.5: Wenn die Einzelatome einander näher kommen, überlagern sich nicht nur ihre Potentiale (“Galerie von Rundbögen”), sondern die ursprünglich scharfen Elektronenzustände verbreitern sich. Im rechten Teilbild ist rechts die Atomkette fortgesetzt zu denken, links liegt die Kristalloberfläche. Dort kann die Austrittsarbeit der Elektronen abgelesen werden. Gitterbausteins und den Energiebändern des Kristalls. Sie wird dadurch kompliziert, dass nahe benachbarte Energiezustände oft überlappende Bänder liefern, die praktisch wie ein einheitliches Band wirken. Jedes Einzelband enthält ebensoviele Elektronenzustände wie die N Bausteine, die zum Gitter zusammengeführt sind, nämlich i.A. N Elektronenzustände. Dies folgt auch im Bild des fast freien Elektronengases: Die Zustände entsprechen den Phasenraumzellen h3 , von denen die Fermi-Statistik ausgeht. Wenn in einer Raumrichtung Nx Gitterbausteine hintereinander liegen (in den anderen Ny und Nz so dass N = Nx Ny Nz ), was einer Abmessung a = Nx d des Kristalls entspricht, ist die Impulsbreite ∆p = π~/d des ganzen Bandes in Nx Zustände mit dem Abstand π~/a unterteilt. Damit ergibt sich auch die folgende wichtige Tatsache: In einem voll besetzten Band ist, wie in der Fermi-Kugel des freien Elektronegases, zu jedem Impuls auch der entgegengesetzte vertreten. Ein solches Band erlaubt deshalb keine Bewegung des Schwerpunkts aller Elektronen, d.h. z.B. keinen Stromfluss. Elektronen und Löcher Rumpfgitter bieten den Elektronen ein bestimmtes Spektrum von Energiebändern an. Wie weit dieses Spektrum mit Elektronen aufgefüllt ist, hängt von der Wertigkeit der Gitterbausteine ab. Chemische Verbindungen oder auch Reinelemente, deren Bausteine kovalent gebunden sind, besitzen als isolierte Moleküle einen vollständig, d.h. durch das bindende Elektron besetzten Zustand. Höher gelegene Zustände sind frei. Bei der Zusammenlagerung zum Kristall entsteht aus dem Zustand des bindenden Elektronenpaars meist ein vollbesetztes Band, über dem ganz leere Bänder liegen. Wenn die verbotene Zone dazwischen sehr breit ist, entsteht ein Isolator, sonst ein Halbleiter (der Übergang ist natürlich fließend). Metalle sind dadurch gekennzeichnet, dass in ihren Atomen der Ausbau einer bestimmten Elektronenschale beginnt, oder längst nicht abgeschlossen ist. Selbst bei Erdalkali-Elementen, wo die s-Schale abgeschlossen ist, liegt die d-Schale energetisch so nahe, dass der Einbau oft 180 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN alternierend erfolgt. Beim Zusammenbau zum Gitter überlagern sich die Bänder, zu denen sich diese benachbarten Schalen verbreitern. Das entstehende Band ist dann natürlich nur teilweise mit Elektronen gefüllt. Wie bewegen sich Elektronen in Energiebändern? Interessant sind die Fälle, wo das Elektron seinen Zustand ändert, speziell energetisch und impulsmäßig im Band aufsteigt. Das ist natürlich nur möglich, wenn weiter oben freie Zustände verfügbar sind. Ferner muss eine beschleunigende Kraft - z.B. ein elektrisches Feld - wirken. Das Elektron reagiert allerdings entsprechend seiner Lage im E(k)-Diagramm oft recht eigenartig auf eine solche Kraft. Als Geschwindigkeit des Elektrons ist die Gruppengeschwindigkeit des ψWellenpaketes anzusehen, aufgebaut aus Wellen eines engen Bereichs um den gewählten k-Wert. Die Gruppengeschwindigkeit ist vg = ∂ω/∂k = ~−1 ∂E/∂k. Für das freie Elektron mit E = p2 /(2m) = ~2 k 2 /(2m) folgt sofort vg = p/m, d.h. die übliche Relation. Beim Kristallelektron ist die Lage komplizierter. Wir betrachten speziell eine Beschleunigung v̇g und die dazu nötige Kraft F . Es ist Abbildung 4.6: Mit abnehmender Gitterkonstante d verbreitern sich ∂ ∂E ∂k ∂2E ∂ ∂E Elektronenzustände. Aus einem Iso= ~−1 = ~−1 2 k̇. (4.17) v̇g = ~−1 ∂t ∂k ∂k ∂k ∂t ∂k lator wird bei hinreichend hohem Druck ein metallischer Leiter. Nun ist, wie üblich, die Kraft gleich der zeitlichen Änderung des Impulses: F = ṗ = ~k̇. Es folgt v̇g = ~−2 ∂2E 1 F = F, 2 ∂k mef f also mef f = ~ 2 ∂2E ∂k 2 (4.18) −1 (4.19) Die effektive Masse regelt die Reaktion des Kristallelektrons auf eine Kraft. Wenn die Bandbreite, wie oben nach der Näherung des freien Elektrons geschätzt, ∆E ≈ ~2 /(8md) ist, wird natürlich mef f gleich der üblichen Elektronenmasse. Das ist keineswegs allgemein der Fall. Das Elektron reagiert ja nicht als Einzelteilchen auf die Kraft, sondern es muss das ganze Gitter mitbeeinflussen. Das ist sozusagen der Preis, den es zahlen muss, um bei konstantem k so ungehindert durch das Gitter fliegen zu können. Wenn es seinen Impuls ändern soll, spielt das ganze Gitter mit. 4.2. HALBLEITER 181 Am unteren Bandrand ist die Krümmung ∂ 2 E/∂k 2 i.A. stärker als bei der freien Parabel. Dementsprechend ist mef f kleiner als die freie Masse m. Bei höheren Energien ist im schematischen Bild, Abb. 4.4, die ursprüngliche Parabel fast erhalten geblieben, es wird mef f ≈ m. Dann aber folgt vielfach ein Wendepunkt von E(k). Dort ist die Krümmung Null, also mef f = ∞. Ganz oben im Band schlägt mef f auf negative Werte um. Solche Elektronen beschleunigen sich in Gegenrichtung zur wirkenden Kraft. Wenn das Band fast bis zum oberen Rand gefüllt ist, spricht man von unbesetzten Zuständen in diesem Band, den Defektelektronen oder Löchern. Sie verhalten sich in jeder Hinsicht entgegensetzt wie das dort fehlende Elektron, das dort hingehört: die effektive Masse ändert mit ∂ 2 E/∂k 2 ebenfalls ihr Vorzeichen, d.h. die Löcher am oberen Bandrand haben wieder positive Masse. Ein Loch, gezogen von der positiven Kraft eE, beschleunigt sich im normalen Sinn, ein Elektron mit positiver effektiver Masse, gezogen von der negativen Kraft −eE, ebenfalls. Beide liefern einen positiven Beitrag zum Strom. Wie Abbildung 4.7: Bänderschema für (a) ein Megroß diese Beiträge sind, hängt natürlich tall mit einem Valenzelektron (Alkali), (b) ein von den Konzentrationen und Beweglich- Metall mit 2 Valenzelektronen (Erdalkali), (c) einen Halbleiter, (d) einen Isolator keiten der Elektronen und Löcher ab. 4.2 Halbleiter Die Informationstechnik hat heute die Energietechnik an Umfang und Bedeutung weit überholt. Sie lebt von den Halbleitern, die in der folgenden Sektion kurz besprochen werden. 4.2.1 Reine Halbleiter Die meisten Halbleiter sind binäre Verbindungen aus einem p-wertigen und einem (8 − p)wertigen Element. Man klassifiziert sie nach den Wertigkeiten bzw. nach den Spalten des Periodensystems, aus denen die Elemente stammen. ZnS ist ein II-VI-Halbleiter, GaAs ist ein III-V Halbleiter, SiC ist ein IV-IV Halbleiter; ähnlich wie SiC verhalten sich reines Si und Ge. Wichtig sind außerdem Metalloxyde wie Cu2 O, die nicht in diese Klassifikation fallen. Das Schema der Energiezustände für Elektronen in reinen Halbleitern ist sehr einfach: Ein Valenzband ist vom Leitungsband getrennt durch eine verbotene Zone der Breite E0 . Dies bestimmt die elektrischen und optischen Eigenschaften. Leitungselektronen können thermisch (durch Phonon-Elektron Stoß) oder optisch (durch Photon-Elektron Stoß, manchmal unter Mitwirkung von Phononen) angeregt, d.h. über die verbotene Zone gehoben werden. Im Leitungsband seien n Elektronen/m3 , im Valenzband ebenfalls so viele Löcher/m3 . Wir schreiben die Raten von Anregung und Rekombination auf, d.h. die Anzahl gehobener bzw. 182 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN zurückgefallener Elektronen pro m3 und s. Die Anregung, ob thermisch oder optisch, “schöpft aus dem Vollen und gießt ins Leere”. Ihre Rate hängt daher nicht von n ab! Die Rekombination hat als bimolekulare Reaktion zwischen Elektron und Loch eine Rate proportional n2 . Die zeitliche Änderung von n ist also ṅ = α − βn2 (4.20) α ist um so größer, je höher T und (bei optischer Anregung) je höher die Lichtintensität ist. Im Gleichgewicht ist ṅ = 0, also r α n= . (4.21) β E0 Energie ε Dabei spielt es zunächst noch keine Rolle, ob es sich um ein echtes thermisches Gleichgewicht handelt, oder nur um eine ausgeglichene Bilanz zwischen optischer Anregung und Rekombination. Im Falle einer reinen thermischen Anregung ergibt sich aus der Fermi Verteilung sofort ein Zusammenhang zwischen α und β. Bei T = 0 ist das Valenzband voll mit Elektronen besetzt, das Leitungsband ist leer, d.h. die Fermi-Energie EF liegt in der Leitungsband - Elektronen verbotenen Zone. Bei höheren Temperaturen werden Elektronen ins Leitungsband Fermiverbotene Zone, Energielücke energie gehoben und die gleiche Anzahl Löcher + Löcher bildet sich im Valenzband. Diese Symme+ Valenzband trie bedeutet bei gleicher Zustandsdichte in beiden Bändern, dass EF genau in der Zonenmitte liegt (obwohl es sich natürlich nicht kontrollieren lässt, dass dort f = 0.5 ist). Da E0 kB T ist, lassen sich die Abbildung 4.8: Schematisches Bandmodell eines Besetzungsverhältnisse mit Elektronen im Leitungsband und Löchern im Valenzband reinen Halbleiters. durch einen Boltzmann-Schwanz beschreiben, der seinerseits um E0 /2 über der Fermi-Grenze liegt, E0 /2 + (4.22) f () = exp − kB T Entsprechendes gilt für die Löcherbesetzung im Valenzband mit nach unten gezählter Energie. Wenn die Näherung quasifreier Elektronen anwendbar ist, ergibt sich aus Glg. 4.10 die energetische Zustandsdichte im Band 3/2 2m dN = 4π 1/2 d. (4.23) h2 Von diesen Zuständen ist der Bruchteil f () besetzt, also ist die gesamte Anzahldichte der Leitungselektronen Z ∞ n= f ()dN = N exp[−E0 /(2kB T )] (4.24) 0 4.2. HALBLEITER 183 mit N =2 mkB T 2π~2 3/2 = 3 · 1025 m−3 bei 300 K. Im Valenzband sitzen ebenso viele Löcher. Das Produkt n2 = N 2 exp[−E0 /(kB T )] hängt nicht von der Lage der Fermi-Grenze ab, behält seinen Wert also auch, wenn durch Dotierung die Löcherdichte p verschieden von der Elektronendichte n wird. Dann gilt also immer noch n · p = N 2 exp[−E0 /(kB T )]. (4.25) Bei gegebenen Produkt np ist die Summe der Trägerkonzentration n + p am kleinsten, wenn n = p ist. Dies ist im reinen Halbleiter der Fall, kann aber auch im gestörten Halbleiter erreicht werden, wenn die n- bzw. pliefernden Störstellen einander kompensieren. Ein solcher verunreinigungskompensierter Halbleiter hat keine höhere Leitfähigkeit als der reine, während einseitig verunreinigte Halbleiter oft um viele Größenordnungen besser leiten. Für n = p folgt Abbildung 4.9: Direkte und indirekte (4.26) n = N exp[−E0 /(2kB T )] Bandübergänge. Der optische Übergang läuft immer senkrecht nach oben, der thermische (Arrhenius-Kurve der Eigenhalbleikann den minimalen Energieabstand wählen, da tung), oder durch Vergleich mit Glg. 4.21 Phononen die Impulsbilanz ausgleichen können. α = βN 2 exp[−E0 /(kB T )]. (4.27) Dieser Zusammenhang zwischen α und β gilt nur für die thermische Anregung. Für die optische Anregung mit einer Intensität I ist α ∼ I, also bei n = p √ n ∼ I. (4.28) Da die Beweglichkeit i.A. viel schwächer von T abhängt (die Beweglichkeit der Ladungsträger nimmt i.A. mit steigender Temperatur ab), bestimmen die Formeln für n und p auch die Leitfähigkeit (4.29) σ = e(nµn + pµp ). Die Beweglichkeit ist meist höher als in Metallen, besonders hoch für 3-5 Verbindungen (bis etwa 10 m2 /Vs). Begrenzend wirken bei sehr reinen Halbleitern die Stöße mit Phononen, andernfalls die Stöße mit Gitterfehlern. 184 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Die Breite der verbotenen Zone kommt auch als Grenzfrequenz der Absorption oder Absorptionkante ωgr = E0 /~ zum Ausdruck. Kleinere Frequenzen werden nicht absorbiert (abgesehen von sehr viel kleineren, die Gitterschwingungen anregen), bei ωgr setzt oft sehr steil die Absorption ein. Manchmal tritt allerdings E0 nicht als Absorptionskante in Erscheinung. Man muss nämlich beachten, dass ein Photon der hier interessierenden Frequenz einem Elektron zwar eine erhebliche Energie, aber nur einen √ minimalen Impuls übergeben kann (Photon: p = h/λ = ∆E/c; Elektron: p = mv = 2m∆E; Phonon: p = h/λ = ∆E/cs ; cs c, ∆E mc2 ). Daher führen optische Übergänge im E, kDiagramm praktisch senkrecht nach oben, wenn kein Phonon beteiligt ist (vgl. Abb. 4.9). Die Ränder von Valenz- und Leitungsband liegen aber durchaus nicht immer beim gleichen k-Wert. Die optische Absorptionskante kann also einem höheren E-Wert entsprechen als das aus der Eigenleitung folgende E0 , denn thermische, durch Phononen vermittelte Übergänge nutzen immer den minimalen energetischen Abstand aus. Wenn E0 > 3.1 eV, ist der Halbleiter farblos und durchsichtig. Wenn dagegen die Absorptionskante einen Teil des sichtbaren Spektrums abschneidet, schimmert der Kristall im reflektierten Licht in der entsprechenden Farbe, im durchgehenden Licht in der Komplementärfarbe. Bei E0 < 1.5 eV wird das ganze sichtbare Spektrum absorbiert, der Kristall hat einen metallähnlichen Schimmer. Vielfach entsteht die Färbung aber nicht durch Grundgitterabsorption, sondern durch Absorption oder Streuung an Verunreinigungen. Übergangsmetalle im an sich farblosen Al2 O3 (Korund) färben die verschiedenen Edelsteine (außer Diamant); kolloides Gold in Glas streut überwiegend im Roten als Rubinglas. 4.2.2 Gestörte Halbleiter Jede Störung des Idealgitters kann zusätzliche Energiezustände für Elektronen erzeugen, die oft in der verbotenen Zone liegen. Solche Störungen sind • nichtstöchiometrische Zusammensetzung; • Einbau von Fremdatomen an Stelle der regulären Gitteratome (Dotierung); • unbesetzte Gitterplätze; die entsprechenden Teilchen können von vornherein fehlen (Nichtstöchiometrie) oder sie können aus Gitterplätzen abwandern (FrenkelFehlstellen); • Kristallitgrenzen und Grenzen des ganzen Kristalls; • Versetzungen; • unvollständige Ordnung des ganzen Gitters, das im Extremfall zum amorphen Halbleiter wird. Wir betrachten hier den Einbau eines Atoms falscher Wertigkeit auf einem regulären Gitterplatz, z.B. P oder B in ein Si-Gitter. 4.2. HALBLEITER 185 Das P-Atom stellt nicht vier Elektronen zur Bindung bereit wie das Si, sondern fünf. Es paßt sich so gut es kann in das umgebende Gitter ein, sättigt also mit vier seiner Elektronen die vier Elektronen zu Paaren ab, die von Si herrühren. Auf dem kompletten und neutralen Gitterhintergrund, der sich hauptsächlich durch seine Dielektrizitätskonstante vom Vakuum unterscheidet, sitzt das fünfte Elektron beim P-Atom wie das Elektron beim H-Atom. Allerdings sind die Bohr-Bahnradien in diesem wasserstoffähnlichem System um vergrößert, die Termenergie um den Faktor 2 verkleinert. Statt 13.6 eV ist die Ionisierungsenergie nur noch 0.1 eV oder kleiner, d.h. nicht viel größer als kB T bei Zimmertemperatur. Das Überschußelektron sitzt in einem flachen, bei P lokalisierten Term, den Donatorterm, aus dem es leicht thermisch in das Leitungsband gelangen kann, um viele Größenordnungen leichter, als eines der Bindungselektronen. Genau umgekehrt fehlt beim B ein Elektron an der vollen Bindung. Ein Loch ist wasserstoffähnlich an einen Akzeptorterm gebunden, und kann leicht ins Valenzband ionisiert werden. Bei hinreichenden Verunreinigungen mit P oder As wird also ein Si-Kristall n-leitend, durch B, Al oder Ga pleitend. Schon sehr geringe Konzentrationen genügen, da die Eigenleitung fast um den Faktor exp[−E0 /(2kB T )] benachteiligt ist. Pro m3 seien D Donatoren und A Akzeptoren eingebaut. d Donatoren haben noch ihre Elektronen, a Akzeptoren ihre Löcher. Im Übrigen gebe es n Leitungselektronen und p Valenzlöcher, alles auf 1 m3 bezogen. Die Ladungsbilanz verlangt dann Abbildung 4.10: (a,b) Bänderschema eines Halbleiters mit Donatoren bzw. Akzeptoren. n + (A − a) = p + (D − d) (4.30) (ionisierte Donatoren bzw. Akzeptoren sind positiv bzw. negativ geladen!). Damit ist nicht gesagt, dass alle D − d in den Donatoren fehlende Elektronen im Leitungsband zu finden sind. Dies ist nur der Fall, wenn keine Akzeptoren vorhanden sind. Dann gilt die zu Glg. 4.25 analoge Beziehung √ n = N D exp[−Ed /(2kB T )]. (4.31) Ed ist der Abstand (Donator - Leitungsbandrand). Wenn Akzeptoren da sind, hat man 3 Gleichgewichte zu beachten: Eine detaillierte Betrachtung zeigt, dass γ/α = N exp[−Ed /(kB T )] und δ/ = N exp[−Ea /(kB T )]. Valenzband - Leitungsband Donatoren - Leitungsband Akzeptoren - Valenzband Anregung Rekombination η = βnp γd = αn(D − d) δa = p(A − a) 186 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Abbildung 4.11: Leitungselektronenkonzentration in Si Einkristallen mit verschiedener AsDotierung. Arrheniusplot ln n(T −1 ) Es sei A D. Bei tiefen Temperaturen sind fast alle Donatoren noch besetzt: d ≈ D. Die wenigen n im Leitungsband zwingen nach Glg. 4.25 so viele Löcher ins Valenzband, dass die Akzeptoren sich fast ganz leeren müssen: a A, folglich gilt nach obiger Tabelle: p = δa/(A). Wenn dann p D, was sicher zutrifft, heißt die Ladungsbilanz n + A = D − d = γD/(αn). Jetzt kommt es darauf an, ob n kleiner ist als A oder nicht. Für n A wird n = γD/(αA) = N DA−1 exp[−Ed /(kB T )], für n A n= p γD/α was mit Glg. 4.31 identisch ist. Der Übergang zwischen beiden Fällen erfolgt bei (beide Glg. gleichsetzen) Ed T = . kB ln(N D/A2 ) Bei noch höheren Temperaturen wird schließlich d D, denn bei n A muss D −d = n einmal den Wert D erreichen, und zwar für T = Ed /kB · ln(N/D). Von dort ab lautet die Ladungsbilanz einfach n = D: Alle Donatorenelektronen sind im Leitungsband. Die Abb. 4.11 zeigt Kurven dieses Typs für verschiedene As-Konzentrationen. Bandstrukturen, wie in Abb. 4.10 kommen auf vielfache Weise zu Stande und spielen auch in anderen Halbleitertypen, z.B. in photoleitenden Kristallen eine große Rolle. Wenn 4.2. HALBLEITER 187 die Zustände unter dem Leitungsband nicht von vornherein mit Elektronen besetzt geliefert werden, nennt man sie Haftstellen oder Traps. Entsprechend können Löcher nahe am Valenzband liegen. Die Ladungsbilanz lautet dann mit den gleichen Beziehungen wie oben n + d = p + a. Das zeitliche Verhalten einer photoleitenden CdS-Zelle im Belichtungsmesser oder der Lumineszenzschicht einer Fernsehröhre hängt entscheidend von solchen Traps ab. Abbildung 4.12: Vereinfachtes Modell eines photoleitenden oder lumineszierenden Halbleiters mit Elektronentraps der Konzentration D, Ladungsträgerkonzentration n im Leitungsband, p im Valenzband, d in den Traps. Die angegebene Richtung der Übergänge entspricht dem Transport von Elektronen. Wir betrachten ein sehr einfaches Modell, Abb. 4.12. Elektronen können durch Lichteinstrahlung mit der Rate I (m3 s−1 ) ins Leitungsband gehoben werden. Bevor sie mit den gleichzeitig im Valenzband entstandenen Löchern rekombinieren (Rate βnp), werden sie i.A. wiederholt von solchen Traps eingefangen: Einfangrate αn(D − d), Ausheizrate γd. Bei nicht zu hohen Temperaturen sind die meisten Elektronen eingefangen (n d), bei nicht zu starkem Licht sind die Traps trotzdem nur schwach besetzt (d D). Die Ladungsbilanz heißt dann p = d. Zur Zeit t = 0 beginne man mit der Lichteinstrahlung; vorher war n = d = p = 0. Die Traps verzögern das Anklingen von n. Im Gleichgewicht (man beachte, dass es sich nicht um ein thermisches Glchgw. handelt), muss I = βnp und αnD = γd sein also, s s γI αDI , dgl = pgl = . (4.32) ngl = αβD βγ Diese Trägerkonzentration, hauptsächlich in d und p angelegt, wird bei der Erzeugungsrate I in der Zeit s d αD τ= = (4.33) I βγI 188 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN aufgebaut. n und damit der Photostrom steigen √ in diesem Fall nicht proportional mit der Lichtintensität, die ∼ I ist, sondern nur mit I. Je mehr Traps da sind, desto kleiner bleibt der stationäre Photostrom und desto langsamer erreicht er sein stationäres Niveau. 4.2.3 Halbleiter-Elektronik Kompaktheit, Energieverbrauch, Vielseitigkeit und Frequenzbereiche sind jene Eigenschaften, die Halbleiterelektronik gegenüber Elektronenröhren wesentlich bevorzugt. Einfache p − n-Übergänge in verschiedenen Ausführungen und Kombinationen können fast jede physikalische Größe in fast jede andere umwandeln: Elektrische Spannung, Strom, Magnetfeld, Licht, Teilchenstrahlen, mechanische Spannung beeinflussen den n−p-Übergang so, dass eine Spannung in ihm auftritt, dass er seinen Widerstand ändert, Licht emittiert, Wärme oder Kälte, sogar mechanische Bewegung hergibt. Von den zahllosen, in den letzten Jahrzehnten entwickelten Bauelementen können hier natürlich nur ganz wenige herausgegriffen und diskutiert werden. Eine Kristalldiode ist ein Halbleiterkristall, dessen beide Hälften verschieden dotiert sind, so dass die eine n−, die andere p-leitet. Das kann z.B. durch Einbau von As bzw. Al in einem Ge-Kristall erreicht werden. Die n-leitende Hälfte hat viele Elektronen, wenige Löcher, in der p-leitenden Hälfte ist es umgekehrt. An der Grenze (“junction”) zwischen beiden besteht ein starkes n-Gefälle in der einen und ein p-Gefälle in der anderen Richtung. Elektronen diffundieren deswegen in den p-leitenden Teil und Löcher in den n-leitenden, aber nur bis sich in der entstehenden Doppelschicht ein Feld aufgebaut hat, das weiteren Zustrom von Teilchen verhindert. In diesem Zustand kompensiert der Leitungsstrom (getrieben durch das aufgebaute elektrische Feld) im Doppelschichtfeld den Diffusionsstrom im Konzentrationsgefälle, d.h. das elektrochemische Potential U − kB T (1/e) ln n für Elektronen, Abbildung 4.13: Strom- bzw. U + kB T (1/e) ln p für Löcher ist überall gleich Spannungskennlinie eines p-n (leicht zu erhalten aus Besetzungswahrscheinlichkeit n2 /n1 = exp[eU/(kB T )]). In der Übergangschicht Übergangs. muss also eine steile Stufe des rein elektrischen Potentials von der Höhe kB T p 1 kB T n 2 ln = ln (4.34) U0 = e n1 e p2 liegen. 1 und 2 beziehen sich auf die beiden Hälften des Kristalls. Ein von außen angelegtes Feld verschiebt das Verhältnis zwischen Feldstromdichte jF eld und Diffusionsstromdichte jDif f , die im feldfreien Gleichgewicht beide den Wert j0 haben. Praktisch fällt die äußere Spannung U allein an der Übergangsschicht ab, denn deren Wi- 4.2. HALBLEITER 189 derstand ist sehr viel höher als für den n- oder den p-leitenden Teil. Die Potentialstufe erhöht oder erniedrigt sich also einfach um U . Für die Ladungsträger, die als Feldstrom gegen diese Stufe anlaufen, senkt bzw. steigert sich die Wahrscheinlichkeit hinaufzukommen um den Faktor exp[±eU/(kB T )], und zwar für n und p im gleichen Sinn. Somit wird jF eld = j0 exp[±eU/(kB T )]. Die Konzentrationsverteilung und damit der Diffusionsstrom ändern sich dagegen kaum: jDif f = j0 . Damit fließt ein Gesamtstrom j = jF eld − j0 = j0 (exp[eU/(kB T )] − 1), (4.35) wenn das Feld von der p- zur n-Seite zeigt (Flussrichtung) und j = j0 (exp[−eU/(kB T )] − 1) (4.36) in umgekehrter Richtung (Sperrrichtung). Diese Gleichrichterkennlinie ist höchst unsymmetrisch. In Sperrrichtung fließt praktisch immer j0 (Größenordnung 1 mA cm−2 ), unabhängig von U ; schon bei U = 1 V in Flussrichtung wäre j um den Faktor 1017 größer. Man kann die Vorgänge in der Diode auch nach Abb. 4.14 unter der Berücksichtigung der Gitterionen deuten, die als Raumladung übrig bleiben, wenn “ihre” Ladungsträger abgesaugt werden. In der p−n-Grenzschicht entsteht durch Trägerrekombination eine Randschicht, die hauptsächlich ortsfeste Ladungen enthält und und praktisch keinen Ladungstransport zuläßt, wodurch der Weiterbildung der Schicht bereits bei etwa 10−7 m eine Grenze gesetzt wird. Legt man an die p − n-Diode eine Spannung an, derart, dass die verbliebenen beweglichen Ladungen noch weiter von der Grenzfläche abgezogen werden [Abb. 4.14(c)], so verbreitert sich die schlecht leitende Mittelschicht, d.h. der Widerstand wird größer; polt man die Spannung um [Abb. 4.14(d)], so schrumpft die Schicht, d.h. der Widerstand wird geringer. Kristalldioden stellt man je nach Verwendungszweck durch verschiedene Methoden (Eindiffundierung der DoAbbildung 4.14: Schematische tierung, Aufwachsen, Ätztechniken, LegierungstechniDarstellung der Funktionsweise ken) und in verschiedenen Formen der n- und p-Bereiche her (Spitzen- und Flächendioden, p-i-n-Dioden mit eines p − n Übergangs. dickeren eigenleitenden Übergangsschichten, Schottky-, Gunn-, Zener-, Esaki-Dioden) mit besonderen Kennlinienformen, die z.T. auf einem Tunneln der Träger durch die sehr dünne Grenzschicht beruhen. Eine Flächendiode, deren Übergangsschicht so nahe an der Oberfläche liegt, dass möglichst viel eingestrahltes Licht in 190 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN ihr absorbiert wird, ist die Photodiode (Sonnenzelle). Die vom Licht erzeugten p − n-Paare werden vom kräftigen Feld in der Potentialstufe getrennt und vereinigen sich, falls die Beläge der n- und der p-leitenden Schicht durch einen Draht verbunden sind, lieber “hintenherum”, da der Widerstand der Schicht, des Drahtes und selbst eines Verbrauchers kleiner ist als in der Übergangsschicht. Das ist die einfachste z.B. für Satelliten oder aber auch für den “Hausgebrauch” auf Si- oder Ge-Basis benutzte Sonnenzelle. Gründe für die nur geringen Wirkungsgrade (10 %) sind offensichtlich: Rekombinationsverluste sind unvermeidlich; bei zu dünner Grenzschicht wird zu wenig absorbiert, bei zu dicker reicht das Feld nicht zur Trennung aus. Etwa das Umgekehrte spielt sich bei der Elektrolumineszenz-Diode, LED, ab: Ein angelegtes Feld treibt die Elektronen und Löcher, die teilweise an den Elektroden injiziert worden sind, aufeinander zu, bis sie in der junction unter Lichtemission rekombinieren. Beim Transistor (erfunden 1947, Nobelpreis 1956, Bardeen, Brattain, Shockley), schiebt man eine sehr dünne n-leitende Schicht in einem p-leitenden Kristall oder umgekehrt, schaltet also 2 p − n-junctions, entgegengesetzt gepolt, hintereinander (p − n − p, bzw. n − p − nTransistor). Auf jede der drei Schichten wird ein Kontakt aufgebracht (Emitter-, Basis-, Kollektorkontakt). Die Funktionsweise des Transistors wird anhand von p-n-p Schichten beschrieben (vgl. Abb. 4.15): Der Übergang p1 − n sei in Durchlassrichtung gepolt, d.h. an der Elektrode E liegt gegenüber B eine positive Spannung, so dass ein Strom vom Emitter E zur Basis B fließt, der im p1 -Teil überwiegend durch Löcher und im n-Teil überwiegend durch Elektronen getragen wird. Der zweite n−p2 -Übergang sei in Sperrrichtung gepolt, d.h. an K liegt eine negative Spannung gegenüber B. Die Löcher können im n-Teil mit Elektronen rekombinieren, was zum Basisstrom beiträgt. Wenn Abbildung 4.15: Zur Funktionsweise die n-Schicht genügend dünn ist, kann ein Teil der des pnp-Transistors Löcher durch die n-Schicht diffundieren und in den p2 -Teil gelangen. Hier werden sie durch die negative Spannung an K beschleunigt, rekombinieren an der Elektrode K (Kollektor) mit den von der Spannungsquelle zugeführten Elektronen, die den Kollektorstrom IK bilden. Die Stärke des Kollektorstromes hängt ab vom Emitterstrom und von der Basisspannung, weil diese den Anteil des Emitterstomes bestimmt, der auf die Basis fließt und daher dem Kollektorstrom fehlt. Ändert man bei fester KollektorBasis-Spannung UKB den Emitterstrom IE , so ändert sich der Kollektorstrom entsprechend. Diese sogenannte Basisschaltung (vgl. Abb. 4.16), bei der die Basis der gemeinsame Anschlusspunkt für von Eingangs- und Ausgangskreis ist, kann als Spannungsverstärker genutzt werden. Da der erste p-n-Übergang in Durchlassrichtung gepolt ist, wird der Eingangswiderstand Re zwischen Emitter und Basis klein, während der Ausgangswiderstand Ra zwischen Kol- 4.2. HALBLEITER 191 Abbildung 4.16: Basisschaltung des Transistors lektor und Basis wegen des in Sperrrichtung gepolten n − p2 Übergangs groß ist. Wird am Eingang eine Spannung Ue gelegt, so fließt ein Emitterstrom IE = Ue /Re , wobei Re der Eingangswiderstand zwischen Emitter und Basis ist. Die Ausgangsspannung, die am Ausgangswiderstand Ra abfällt, ist dann Ua = Ra IK = Ra βIE = β Ra Ue , Re (4.37) wobei β der Bruchteil des Emitterstromes ist, der den Kollektor erreicht. Abb. 4.17 stellt die 3 Grundschaltungen von Transistoren dar. Abbildung 4.17: Grundschaltungen von Transistoren. In der Tunneldiode sind n- und p-Bereich sehr hoch dotiert, so dass die Randschicht sehr √ dünn wird (10 nm). Ihre Dicke hängt ja als Debye-Hückel-Länge von n ab wie d ∼ 1/ n. Elektronen können bei Durchlasspolung durch diese dünne Schicht tunneln, was zu einem negativen differentiellen Widerstand führt. Der Strom fällt mit steigender Spannung. Der Halbleiterlaser erzeugt Rekombinationslicht injizierter Ladungsträger in einem p − nÜbergang ähnlich wie bei der Photodiode. Die Träger, speziell die Elektronen dicht über ihrem Bandrand, müssen durch einen Sprung der Bandkante E, die Photonen durch einen Sprung der Brechzahl n sowie an den Austrittsflächen durch halbdurchlässige Spiegel eingesperrt werden, damit die Laserbedingung (erzwungene Emission > Absorption + Photonenverlust) erfüllbar wird. Der einfachste Spiegel ist die glatte Spaltfläche des Kristalls: Der große Brechzahlsprung bedingt hohe Reflexion. Den E- und n-Sprung in die andere Richtung erreicht man, indem man z.B. eine dünne (< 1 µm) aktive Region aus GaAs in zwei 192 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Alx Ga1−x As-Schichten einschließt. Al erzeugt eine breitere verbotene Zone, ähnlich, wie die von C breiter ist als die von Si oder Ge. Dafür hat reines GaAs die höhere Brechzahl und wirkt als optischer Wellenleiter. Ein solcher Laser emittiert bei 0.9 µm. Zum Anschluß an Glasfaserkabel eignen sich 1.3 oder 1.5 µm besser; diese erzeugt man mit InP-Laser. Fasern aus Quarzglas, die durch Brechzahlgradienten (n innen größer) zu Wellenleitern werden, können Signale, die mit einigen GHz moduliert, mit Absorptionsverlusten von weniger als 1 dB/km übertragen. 4.3 4.3.1 Mechanische Eigenschaften Einleitung Die mechanischen Eigenschaften eines Festkörpers werden im Wesentlichen von der Art und Stärke der interatomaren Bindungen bestimmt. Allerdings spielt auch die kristallographische Struktur, die Art und Verteilung von Defekten, Verunreinigungen und dispergierten Phasen, sowie die Dichte der inneren Grenzflächen eine große Rolle. Eine Sonderstellung bei den mechanischen Eigenschaften nehmen die sogenannten Elastomere ein, bei denen die elastischen Eigenschaften nicht primär von den interatomaren Bindungsstärken, sondern von der Molekularstruktur abhängen. Die Kontrolle und gezielte Manipulation der mechanischen Eigenschaften von Werkstoffen stellt einen wichtigen Aspekt der modernen Materialwissenschaft dar. Durch gezielte Einflussnahme auf die Mikrostruktur von Materialien gelingt es, Eigenschaften wie Verschleißfestigkeit, Temperaturbeständigkeit, Verformbarkeit und Bearbeitbarkeit über weite Bereiche zu variieren sowie für verschiedene Anwendungsprofile zu optimieren. 4.3.2 Elastische Grundgrößen Greift an einem Körper eine Kraft an, so wird dieser durch Verformung auf diese Kraft reagieren. Ist die Verformung reversibel, kehrt der Körper also nach dem Beenden der Kraftaufbringung zu seiner ursprünglichen Gestalt zurück, so spricht man von elastischer Verformung. Eine Idealgeometrie zu einem Verformungsexperiment ist der sogenannte Zugversuch, wie er idealisiert in Abbildung 4.18 dargestellt ist. In einen würfelförmigen Prüfkörper wird normal auf die Grund- und Deckfläche eine Kraft F eingeleitet. Abbildung 4.18(a) zeigt die Situation vor der Krafteinleitung. Der Prüfkörper weist in allen Dimensionen die ursprüngliche Länge L0 auf. Nach dem Einleiten der Prüfkräfte (Abbildung 4.18(b)) hat sich die Länge parallel zur Kraftrichtung auf Lp = L0 + ∆Lp und der lineare Querschnitt auf Lq = L0 + ∆Lq geändert. ∆Lp = L0 − Lp ist dabei positiv, während ∆Lq = L0 − Lq negativ ist. Als Verformungen werden, entlang der entsprechenden Richtungen, die Größen ∆Lp (4.38) p = L0 4.3. MECHANISCHE EIGENSCHAFTEN 193 Abbildung 4.18: Zugversuch (a) Würfelförmiger Prüfkörper vor der Krafteinleitung an Grund- und Deckfläche (b) Verformung des Prüfkörpers (Seitenansicht) sowie ∆Lq (4.39) L0 bezeichnet. Die Verformungen sind dimensionslose Größen und werden oft in % angegeben. Wie können die Verformungen und eingeleiteten Kräfte in Beziehung gesetzt werden? Zunächst soll der Fall der Dehnung des Prüfkörpers behandelt werden. Im idealen Zugversuch wird die Kraft F nicht punktförmig eingeleitet, sondern über die gesamte Angriffsfläche verteilt. Es ist daher sinnvoll, vom Begriff der Kraft zur Größe einer Spannung, also einer Kraft pro Flächeneinheit, überzugehen. Für die Spannung σ gilt q = F , (4.40) A wobei A jene Fläche ist, auf die F aufgebracht wird. Der differentielle Zusammenhang zwischen Spannung und Verformung in Längsrichtung kann dann als σ= dσ =E dp (4.41) formuliert werden. Das Verhältnis E wird als Elastizitätsmodul (englisch: Young’s modu” lus“) bezeichnet. Die Dimension von E ist [Pa] bzw. [N/m2 ] In vielen Fällen gilt die linearisierte Version von Gleichung 4.41 σ =E (4.42) p 194 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN beziehungsweise σ = E · p , (4.43) welche nichts anderes ist als das auf die Fläche normierte Gesetz für die Rückstellkraft einer linearen Feder, F = C · x (Federkonstante C, Auslenkung x). Gleichung 4.43 wird als das sogenannte Hook’sche Gesetz bezeichnet und sagt aus, dass ein linearer Zusammenhang zwischen Spannung und Verformung besteht. Das Hook’sche Gesetz ist jedoch nicht das einzige Elastizitätsgesetz. Für spezielle Materialien kann der Zusammenhang zwischen Spannung und reversibler Verformung auch nichtlinear sein. Das Material ist dann immer noch elastisch, da es bei Wegfallen der eingeleiteten Kräfte seine ursprüngliche Form annimmt, folgt jedoch einem nichtlinearen Elastizitätsgesetz, wie es durch Gleichung 4.41 gegeben ist. Für Materialien, welche sich gemäß dem Hook’schen Gesetz verhalten, kann der Elastitzitätsmodul, ähnlich wie die Gitterschwingungsfrequenz in Abschnitt 3.5, aus dem Oszillatorpotential eines im Festkörper gebundenen Atomes abgeschätzt werden. Nimmt man wiederum an, dass das Atom eine Bindungsenergie von EB = 12 eV im Festkörperverband aufweist, so ergibt sich unter der Annahme, dass diese Bindungsenergie beim Auslenken des Atoms um einen Gitterabstand (3 Å = 3 · 10−10 m) aufgebracht werden muss, für die Federkonstante“ C einer einzelnen Bindung ” C= 2 · 1.992 · 10−18 2EB = = 10.67 N/m. (x − x0 )2 (3 · 10−10 )2 (4.44) Nun soll der Festkörper eine Dehnung von p = 1% erfahren. Dazu muss jeder Atomabstand um ∆Lp = 3 · 10−12 m vergrössert werden. Die dazu nötige Kraft beträgt für eine Bindung F = C · ∆Lp = 3.2 · 10−11 N. (4.45) Zur Bestimmung des Elastizitätsmoduls muss noch die Fläche ermittelt werden, auf die sich diese Kraft verteilt, um die Spannung σ zu berechnen. Beträgt der Bindungsabstand der Atome 3 Å, so beträgt die von einem Atom eingenommene Fläche A = 9 Å2 = 9 · 10−20 m2 . Die Spannung σ ergibt sich damit zu σ= F = 3.5 · 108 Pa A (4.46) und der Elastizitätsmodul E ergibt sich zu E= σ 3.5 · 108 = = 3.5 · 1010 Pa, 0.01 (4.47) was in vernünftiger Übereinstimmung mit beobachteten E-Modulen liegt. Verwendet man anstatt des obigen Oszillatorpotentiales ein realistischeres Bindungspotential vom Lennard Jones-Typ, U (r) = − A B + m n r r (4.48) 4.3. MECHANISCHE EIGENSCHAFTEN 195 wie es in Abbildung 4.19 dargestellt ist, so erhält man folgende Abschätzung für den Elastizitätsmodul, wenn man die Konstanten A und B mit dem Minimalwert, U0 und dem Bindungsabstand, r0 , parametrisiert (siehe Abbildung 4.19): E= n·m . r03 · U0 (4.49) Ersetzt man in Gleichung 4.49 r03 durch das atomare Volumen, Ω, und U0 durch die thermi- Abbildung 4.19: Atomares Wechselwirkungspotential vom Lennard-Jones Typ (Gleichung 4.48). U0 ist die Bindungsenergie und r0 entspricht dem Atomabstand sche Energie, welche aufgebracht werden muss, um das Material zum Schmelzen zu bringen, kB ·Tm (Tm ist die Schmelztemperatur des Materiales), so kann die in Gleichung 4.50 gegebene empirische Beziehung, 80 · kB · Tm (4.50) E≈ Ω gewonnen werden. Der Faktor 80 in Gleichung 4.50 ist rein empirisch und berücksichtigt, dass man zum Schmelzen eines Werkstoffes im Allgemeinen mehr thermische Energie aufwenden muss, als durch kB · Tm gegeben ist. Diese Beziehung gilt für alle Materialien, bei denen die elastische Verformung auf einer Streckung der atomaren Bindungen beruht. Eine große Ausnahme bilden hier die Elastomere, für welche Gleichung 4.50 vollkommen unbrauchbare Ergebnisse liefert. Die Gründe dafür werden später diskutiert. Als nächstes soll die Änderung der Dimension des Prüfkörpers normal auf die Prüfkräfte untersucht werden. Diese ist durch Gleichung 4.39 gegeben. Die sogenannte Querkontraktionszahl oder Poisson-Zahl ν ist durch das Verhältnis der relativen Längenänderungen, p und q , gegeben: q ν=− . (4.51) p 196 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Damit ergibt sich folgender Zusammenhang zwischen q , σ und E: q = −ν · σ . E (4.52) Geht man weiters von der Annahme aus, dass beim Zugversuch keine Volumsänderung des Prüfkörpers auftritt, so liefert die Beziehung ∆V = 0 = (L0 + ∆Lp ) · (L0 + ∆Lq )2 − L30 (4.53) unter Vernachlässigung der Quadrate und Kuben kleiner Terme den Ausdruck 1 q = − · p = −νmax · p . 2 (4.54) Die maximale Querkontraktionszahl beträgt also 21 ; ein ν > 12 würde eine Volumsverringerung bei Elongation des Prüfkörpers bedeuten, was unphysikalisch ist. Weiters rangieren alle Werte für Querkontraktionszahlen in einem engen Bereich von 0.2(Diamant) < ν ≤ 0.5, da eine Verformung des Festkörpers ansonsten eine zu große Dichteänderung bedeuten würde. Naturgemäß müssen die in den Festkörper eingeleiteten Kräfte nicht immer in der in Abbildung 4.18 gegebenen Richtung wirken. Ein weiterer wichtiger Idealfall ist in Abbildung 4.20 gegeben. Greifen zwei gleich große Kräfte τ · A in entgegengesetzter Richtung parallel Abbildung 4.20: Krafteingriff bei reiner Scherung (a) Würfelförmiger Prüfkörper vor der Krafteinleitung an Grund- und Deckfläche (Seitenansicht) (b) Verformung des Prüfkörpers (Seitenansicht) zu den Seitenflächen des Einheitswürfels an, wie in Abbildung 4.20 dargestellt, so ist der Körper einer reinen Scherung unterworfen. A ist der Flächeninhalt einer Seitenfläche des Einheitswürfels, τ ist die sogenannte Schubspannung. Die Scherlänge γ ist in Abbildung 4.20 dargestellt und es gilt die Beziehung τ G= . (4.55) γ 4.3. MECHANISCHE EIGENSCHAFTEN 197 Der Quotient G ist der sogenannte Schubmodul (englisch: Shear Modulus“). Für isotrope ” E . Stoffe gilt: G = 2(1+ν) Ein weiterer wichtiger Spezialfall ist die gleichmäßige Kraftwirkung auf den Einheitswürfel von allen Seiten, also die Wirkung eines isostatischen Druckes. Dabei kommt es zu einer Volumsverringerung von ∆V = − σ · V0 , K (4.56) wobei σ wiederum die Kraft pro Flächeneinheit, also eine Spannung, ist und K der sogenannte Kompressionsmodul. Es gilt σ · V0 . (4.57) K=− ∆V 4.3.3 Kristallstruktur und elastische Eigenschaften Die im vorigen Abschnitt betrachteten Elastizitätsmoduli stellen Spezialfälle für den allgemeinen Spannungszustand dar, unter dem ein Festkörper stehen kann. Es ist jedoch klar, dass Spannungen und Verformungen für kristalline Festkörper nicht für jede Kraftwirkung in gleicher Weise zusammenhängen, wie dies schematisch für ein einfaches zweidimensionales System in Abbildung 4.21(a) und (b) gezeigt ist. Bei gleichem Betrag der Kraft F wird sich das in Abbildung 4.21 dargestellte System unterschiedlich verformen, je nachdem in welche Richtung F wirkt. Abbildung 4.21: Verschiedene Krafteinleitungen in ein einfaches Masse-Feder-System (a) Reiner Zug (b) Beliebig gewählte Kraftrichtung bei gleichem Kraftbetrag wie in (a) Ein allgemeiner Spannungszustand ist in Abbildung 4.22 schematisch dargestellt. In jeder Ebene des Einheitswürfels wirken eine Normalspannung σ und eine Schubspannung τ , welche in je zwei Komponenten parallel zu den jeweiligen Koordinatenachsen zerlegt 198 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Abbildung 4.22: Allgemeiner Spannungszustand mit Normalspannungen σ und Schubspannungen τ . werden kann. Es ist dabei zu beachten, dass die Spannungen keine Vektoren sind, da ja definitionsgemäß gilt ~ F~ = σij · A. (4.58) Der sogenannte Spannungstensor σij ist ein Tensor zweiter Stufe und lautet in Matrixschreibweise σ11 τ12 τ13 σij (x1 , x2 , x3 ) = τ21 σ22 τ23 . τ31 τ32 σ33 (4.59) Aus der einfachen skalaren Beziehung zwischen Spannung und Verformung, σ = E · wird schließlich die tensorielle Beziehung σij = cijkl · kl , (4.60) wobei cijkl der allgemeine Tensor 4. Stufe der elastischen Konstanten ist. Im allgemeinsten Fall hat er 81 unabhängige Komponenten, deren Anzahl jedoch durch verschiedene Gittersymmetrien und andere geometrische Zusammenhänge drastisch verringert wird. Für die 14 Bravaisgitter lässt sich die Anzahl der unabhängigen elastischen Koeffizienten auf maximal 21 unabhängige Koeffizienten für trikline Kristalle und minimal 2 unabhängige Koeffizienten für kubische Kristalle (und vollständig isotrope amorphe Stoffe) reduzieren. Abschließend sei gesagt, dass die allgemeine Elastizitätstheorie zu den mathematisch anspruchsvollsten Unterkapiteln der Festkörperphysik gehört. Gleichungen mit ähnlicher Struktur wie Gleichung 4.60 finden sich auch in der allgemeinen Relativitätstheorie, welche grob gesprochen die Verformung des Raums unter dem Einfluss von Massen behandelt. 4.3. MECHANISCHE EIGENSCHAFTEN 4.3.4 199 Nichtelastische Eigenschaften Der elastische Bereich ist nur ein Teilbereich von Materialien, welche mechanischen Belastungen unterworfen sind. Auch über den elastischen Bereich hinaus liefert der einachsige Zugversuch, wie er in Abbildung 4.18(b) idealisiert dargestellt ist, wichtige Aussagen. Im Folgenden soll dabei nur der Zusammenhang zwischen der Spannung, σ, und der Verformung parallel zu den im Zugversuch angreifenden Kräften, , für verschiedene Materialklassen betrachtet werden. Da nur die Paralellverformung betrachtet wird, wurde der Index p weggelassen. Im Realfall läuft ein Zugversuch folgendermaßen ab: ein beliebiges Material wird in die Zugmaschine eingespannt und bei definierten Umgebungsbedingungen (primär konstanter Temperatur, T , aber wenn möglich auch bei konstanter Luftfeuchtigkeit und in gedehnt. Die gesamkontrollierbarer Atmosphäre) mit einer konstanten Verformungsrate, d dt d te Dehnung, , ergibt sich damit zu = dt · t. Bei bekannter Einspannfläche kann über eine Kraftmesszelle die Normalspannung σ ermittelt werden. In der idealisierten Geometrie des Zugversuches sollten alle anderen Komponenten des Spannungstensors gleich Null sein. Der Zusammenhang zwischen und σ wird als Spannungs-Dehnungskurve bezeichnet. • Spröde Materialien: Die Spannungs-Dehnungskurve für spröde Materialien ist in Abbildung 4.23 dargestellt. Sie zeigt ein weitgehend lineares Verhalten bis zum Bruch. Für den Elastizitätsmodul E gilt daher E= σ dσ = = const. d (4.61) Abbildung 4.23: Spannungs-Dehnungskurve für spröde Materialien Weiters zeigen spröde Materialien vollständig elastisches Verhalten, d.h. die SpannungsDehnungskurve zeigt keine Hysterese (die Hinkurve“ (durchgezogener Pfeil) ist iden” tisch mit der Rückkurve (strichlierter Pfeil). Die Verformungsrate hat kaum einen ” 200 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Einfluss auf die Kurve, ebenso die Temperatur. Tendenziell wird mit steigendem T der Elastizitätsmodul etwas kleiner. Die Mikrostruktur des Materiales hat ebenso keinen großen Einfluss, wohl aber die Oberflächenqualität des Prüfkörpers. Kratzer oder andere Oberflächendefekte können zum Auftreten lokaler Spannungsspitzen und damit zum vorzeitigen Bruch des Materials führen. Die Bruchdehnung, das ist jene Dehnung , bei der das Material bricht (oder reißt) ist sehr klein, meistens weit unter 1%. Die Bruchspannung kann hingegen, aufgrund des hohen E-Moduls spröder Materialien, sehr hoch sein. Typische Vertreter dieser Materialklasse sind: Gläser, einige harte“ ” Kunststoffe oder Polymere, viele Ionenkristalle, praktisch alle Keramiken, einige kovalent gebundene Kristalle bei niedrigen Temperaturen (z.B. Diamant und Si) und viele intermetallische Phasen (z.B. Ti3 Al). Ein weiterer wesentlicher Begriff ist jener der Zähigkeit“ (englisch: Toughness“). Die” ” ser ist im Wesentlichen das Gegenteil von Sprödigkeit. Um ein quantitatives Maß für diese Eigenschaft zu erhalten, definiert man als Zähigkeit GC die insgesamt erforderliche Arbeit, welche man in ein Material pro Volumeneinheit einbringen muss, bis es zum Bruch kommt: lBruch Z 1 (4.62) F · dl GC = · V l0 mit dem Volumen V , der Kraft F , der Länge l0 des Prüfkörpers vor dem Beginn des Zugversuches und der Länge lBruch beim Bruch. Mit der Querschnittsfläche A des Prüfkörpers und der Beziehung VA = A · l wird Gleichung 4.62 zu lBruch Z GC = l0 F · dl = A·l Bruch Z σ · d (4.63) 0 da σ = FA und dll = d. Die Integrationsgrenzen sind jetzt 0 und Bruch . Damit ist das Integral in 4.63 die Fläche unter der Spannungs-Dehnungskurve. Es ist mit σ = E · sofort auswertbar und man erhält GC = E · 2Bruch σ2 = Bruch 2 2·E (4.64) Da Bruch klein ist, haben spröde Materialien eine kleine Zähigkeit. Die Brucharbeit ist die Arbeit, welche gegen die Bindungskräfte verrichtet werden muss. Diese führen auch direkt zum Elastizitätsmodul E, wie bereits gezeigt wurde. • Duktile Materialien: Die Spannungs-Dehnungskurve eines duktilen Materials (z.B. eines der weichen“ Metalle Au, Ag, Cu oder Pb) ist in Abbildung 4.24 dargestellt. ” Im Gegensatz zu den spröden Materialien wird hier die Spannungs-Dehnungskurve in hohem Maße von d und von T beeinflusst. Im Wesentlichen enthält sie jedoch imdt mer die in Abbildung 4.24 gezeigten Charakteristika: Für relativ kleine Spannungen 4.3. MECHANISCHE EIGENSCHAFTEN 201 Abbildung 4.24: Spannungs-Dehnungskurve für duktile Materialien erhält man elastisches Verhalten wie bei spröden Materialien. Ein schwach temperaturabhängiger E-Modul (zusammen mit einem weiteren Modul) beschreibt das Verhalten vollständig. Beim Überschreiten einer bestimmten Spannung RP , die Fließgrenze genannt wird, bricht das Material jedoch noch nicht, sondern verformt sich plastisch. Das Kennzeichen der plastischen Verformung ist, dass sich der Rückweg vom Hinweg stark unterscheidet, das heißt das Auftreten einer Hysterese in der Spannungs-DehnungsKurve. Wird die Spannung wieder verringert, geht die Dehnung nicht auf Null zurück, sondern sinkt entlang einer elastischen Geraden auf einen endlichen Wert - das Material ist bleibend verformt. Die Fließgrenze hängt von allen möglichen Parametern ab: Wie die Graphik zeigt, von der Verformungsgeschwindigkeit, aber auch von der Temperatur und insbesondere von den Feinheiten des Gefüges. Der gezeigte Peak“, an dessen Ma” ximum sich RP befindet, kann mehr oder weniger ausgeprägt gefunden werden. Seine Größe und Form ist stark von der Präparation und der Vorgeschichte des Materials abhängig. Das absolute Maximum der Kurve liefert die höchste Spannung, der das Material unterworfen werden kann. Es heißt RM und wird als maximale Zugfestigkeit (englisch ultimate tensile strength“) bezeichnet. Sobald RM erreicht wird, kann man ” die Spannung wieder etwas zurücknehmen und trotzdem größere Dehnungen erreichen. Hält man die Spannung allerdings auf RM , wird die Probe sich bis zum Bruch immer weiter verformen. Die Fläche unter der Spannungs-Dehnungskurve ist groß, was eine große Zähigkeit bedeutet. Während das Verhalten im elastischen Bereich nach wie vor direkt durch die Bindungspotentiale gegeben ist (es werden nach wie vor nur Bindungen langgezogen“), ” gilt das nicht für das Verhalten im plastischen Bereich. Die plastische Verformung ist durch das Wandern von Versetzungen, den Einbau von Defekten und durch sonstige 202 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Änderungen der Mikrostruktur und des Materialgefüges gegeben. Typische Materialien mit mehr oder weniger ausgeprägtem plastischem Verhalten sind alle Metalle, kovalent gebundene Kristalle (insbesondere bei höheren Temperaturen, z.B Si, Ge, GaAs), einige Ionenkristalle (insbesondere bei hoher Reinheit und hohen Temperaturen) und viele Polymere (diese folgen jedoch eigenen Gesetzmäßigkeiten, was im Folgenden gezeigt werden wird). • Elastomere: Insbesondere Polymere lassen sich vom mechanischen Verhalten her weder in die Gruppe der spröden noch in die der duktilen, plastisch verformbaren Materialien einordnen. Vor allem die Elastomere - also Gummisorten - zeigen ein Verhalten, das sich stark von den bisher behandelten Materialgruppen unterscheidet. Ein typisches Spannungs-Dehnungsdiagramm von Gummi ist in Abbildung 4.25 dargestellt. Abbildung 4.25: Spannungs-Dehnungskurve für Elastomere wie z. B. Gummi Aus Abbildung 4.25 ist das gemeinsame Charakteristikum der Verformungskurven von Elastomeren ersichtlich: sie zeigen immer elastisches Verhalten; weiters treten riesige elastische Verformungen in der Größenordnung von 100 % auf. Der (sehr kleine) EModul nimmt mit wachsender Temperatur etwas zu – ganz im Gegensatz zu praktisch allen anderen Materialien. Unterhalb einer für die jeweilige Gummisorte charakteristischen Temperatur verliert das Elastomer sein gummiartiges Verhalten - es wird spröde und verhält sich weitgehend wie normale“ spröde Materialien. Die Verformungsge” schwindigkeit ist kein wesentlicher Parameter in der gesamten Verformungskurve. Wie können diese Eigenschaften erklärt werden? Eine wesentliche Erkenntnis ist, dass die elastische Verformung nicht, wie in den vorhergehenden Fällen, durch das Langzie” 4.3. MECHANISCHE EIGENSCHAFTEN 203 hen“ von Bindungen erfolgt. Es wäre unmöglich die Bindungsabstände zu verdoppeln oder zu verdreifachen ohne lange vorher das Material zu zerbrechen. Der Mechanismus für die extreme Verformbarkeit von Elastomeren ist in ihrer molekularen Struktur begründet. Die Materialien bestehen aus sehr langen, kettenförmigen Molekülen (Polymeren). Im unbelasteten Zustand sind diese Moleküle weitgehend ungeordnet ineinander gefaltet (Abbildung 4.26(a)). Wird das Elastomer einer Zugbelastung unterworfen, so richten sich die Polymerketten entlang der angelegten Zugkraft aus (Abbildung 4.26(b)). Abbildung 4.26: Ausrichtung der Kettenmoleküle eines Polymers unter Belastung (a) Vor der Krafteinleitung: die Moleküle sind unregelmäßig ineinander verknäult (b) Unter Krafteinwirkung: die Moleküle richten sich parallel zur Kraftrichtung aus Es werden also nicht die intramolekularen Bindungen gestreckt, sondern es müssen nur die vergleichsweise geringen Wechselwirkungen zwischen einzelnen, im unbelasteten Zustand nahe beieinander liegenden, Molekülbereichen überwunden werden. Das System geht durch die Ausrichtung in einen geordneteren Zustand über. Das bedeutet, dass die Gummielastizität ein rein entropischer Effekt ist. Die Ausrichtung der Moleküle vermindert die Entropie des Systems und erhöht somit die freie Enthalpie. Das System reagiert auf diese Enthalpieerhöhung durch eine Rückstellkraft. Naturgemäß sind die in den vorhergehenden Punkten angesprochenen Verformungsmechanismen im Detail unter Umständen sehr komplex. Insbesondere bei der plastischen Verformung spielt die Mikrostruktur des jeweiligen Werkstoffes eine große Rolle. So ist die Zähigkeit eines Materiales z. B. indirekt proportional zu seiner Korngröße. Geringere Korngröße bedeutet höhere Zähigkeit. Dieses Verhalten ist als Hall-Petch-Gesetz“ bekannt und ” wird besonders wichtig, wenn die Korngröße des Materiales in den nm-Bereich kommt ( na” nokristalline Materialien“). Weiters spielt bei Mehrstoffsystemen die Phasenverteilung eine wichtige Rolle. Weiche Ausscheidungen können z. B. die Ausbreitung von Rissen blockieren, indem in ihnen die an der Risspitze konzentrierte elastische Energie durch plastische Verformung abgebaut wird. Harte Partikel wiederum können die Bewegung von Versetzungen blockieren und so zur sogenannten Dispersionshärtung von Werkstoffen führen. 204 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN 4.3.5 Messung mechanischer Eigenschaften Zur Messung mechanischer Eigenschaften steht eine Vielzahl von Methoden zur Verfügung, welche in vielen Fällen Modifikationen des Zugversuches sind. Mit diesen können nicht nur elastische Eigenschaften, sondern auch plastische Verformbarkeit, Bruchfestigkeit oder die Haftung (Adhäsion) verschiedener Materialien aneinander bestimmt werden. Im Folgenden sollen einige dieser Methoden (ohne Anspruch auf Vollständigkeit) besprochen werden. • Zugversuch: Der bereits besprochene Zugversuch ist ein sehr flexibles Werkzeug zur Bestimmung mechanischer Eigenschaften sowohl im Bereich der elastischen als auch der plastischen Verformung. Mit leichten Modifikationen kann er zur Bestimmung der Haftfestigkeit von Beschichtungen (Abzugstest) oder zur Bestimmung des Verhaltens von Materialien unter Langzeitbelastung (Ermüdung, Kriechen, Fließen) angewendet werden. • Eindringen eines Prüfkörpers: Die Umkehrung des Zugversuches ist das Eindringen eines Prüfkörpers bekannter Geometrie in ein Material. Der Prüfkörper ist dabei idealerweise unverformbar. Als Prüfkörpermaterial wird daher oft Diamant oder Saphir verwendet. Sobald der Prüfkörper Kontakt mit der Materialoberfläche hat, wird die Prüfkraft sukzessive erhöht und der Eindringweg des Körpers aufgezeichnet. Eine solche Kraft-Eindringkurve (englisch: Force Distance Curve“) ist in Abbildung 4.27 ge” geben. Abbildung 4.27: Kraft-Eindringkurve eines Prüfkörpers in einen Festkörper Aus dem Anstieg der Kurve beim Eindringvorgang kann der E-Modul (analog zur Zugprüfung) bestimmt werden, aus der bleibenden Eindringtiefe nach dem Entlasten der Oberfläche die plastische Verformbarkeit des Materials, welche der Härte entspricht. Wird nur der zurückbleibende Eindruck des Prüfkörpers vermessen, so spricht man von Härtemessung. Je nach Prüfkörpergeometrie unterscheidet man die Härtemessung nach Vickers (Prüfkörper: 4-seitige Pyramide), Knoop (Prüfkörper: 3-seitige Pyramide) oder Brinell (Prüfkörper: Kugel). Die Prüfkräfte variieren von N bis hin zu nN . Geräte, welche im nN -Bereich arbeiten werden als Nanoindenter bezeichnet. 4.3. MECHANISCHE EIGENSCHAFTEN 205 • Kratz- oder Ritztest: Ein dem Eindringtest verwandtes Verfahren ist das lineare Führen einer Spitze über eine Oberfläche unter steigender Last, wie es in Abbildung 4.28 dargestellt ist. Abbildung 4.28: Prinzipieller Aufbau einer Scratch-Testers Mittels optischer Begutachtung der Kratzspur bzw. mittels akustischer Emission kann z. B. der Bruch des Materiales oberhalb einer kritischen Last, Lc und damit seine Bruchzähigkeit bestimmt werden. • Kraftspektroskopie: Das Rasterkraftmikroskop (englisch: Atomic Force Microscope, AFM ) erlaubt die ortsaufgelöste Bestimmung von mechanischen Eigenschaften mit einer lateralen Auflösung im nm-Bereich. Im Prinzip entspricht das Verfahren der Kraftspektroskopie einem wiederholten Eindringtest mit sehr geringen Prüflasten. Die an einem Biegebalken angebrachte Spitze eines AFM wird an eine Oberfläche angenähert und in definierten Kontakt mit der Oberfläche gebracht. Aus den in Abbildung 4.29 gegebenen Teilbereichen der Kraft-Abstandskurve können die elastischen Konstanten der geprüften Oberfläche, die Haftfestigkeit der Spitze an der Oberfläche und andere Daten bestimmt werden. Eine schnelle Steuerelektronik ermöglicht die Wiederholung der in Abbildung 4.29 dargestellten Vorgänge mit hoher Frequenz, wodurch, wie bereits erwähnt, ortsaufgelöste Messungen möglich sind. • Anregung von Schallwellen: Die Ausbreitungsgeschwindigkeit von Schallwellen in kristallinen Materialien ist eine Funktion der elastischen Konstanten. Damit kann eine Messung der Ausbreitungsgeschwindigkeit verschiedener Wellentypen in Festkörpern (Longitudinalwellen, Transversalwellen) zur Bestimmung der elastischen Konstanten dienen. Dieses Verfahren ist, im Gegensatz zu den vorher erwähnten, zerstörungsfrei. 206 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Abbildung 4.29: Kraft-Abstandskurve in der Rasterkraftmikroskopie (a) Spitze in weiter Entfernung von der Oberfläche (b) Attraktive Wechselwirkung Spitze/Oberfläche- Snap On“ ” (c) Eindringen der Spitze in das Material (d) Rückzug der Spitze; Spitze bleibt durch Adhäsionskräfte länger haften • Röntgenographische Spannungsmessung: Bei bekannten elastischen Konstanten lassen sich mittels Röntgenbeugung aus den Verzerrungen der Elementarzelle eines kristallinen Festkörpers die Spannungen ermitteln, unter denen sich der Kristall befindet. Auch dieses Verfahren ist zerstörungsfrei, allerdings ist die Interpretation der Messergebnisse mitunter sehr komplex. 4.4 4.4.1 Thermische Eigenschaften Spezifische Wärme Aus der Thermodynamik ist bekannt, dass die spezifische Wärme C jene Größe ist, die bestimmt, welche Wärmemenge notwendig ist, um einen Körper um eine bestimmte Temperatur ∆T zu erwärmen, bzw. welche abgeführt werden muss, um eine Temperaturabsenkung ∆T hervorzurufen. Fasst man einen Festkörper als System schwingungsfähiger Gitterteilchen auf, sollte jeder dieser Oszillatoren im Rahmen der klassischen Physik (Gleichverteilungssatz) gleichviel kinetische wie potentielle Energie haben, und zwar für jeden dieser Anteile (3/2)kB T (entsprechend den 3 Raumrichtungen). Nimmt man ein Atom als schwingungsfähige Einheit an, dann erhält man für ein Grammatom jedes Stoffes 3NA kB T = 3RT , also die spezifische Atomwärme 3R = 25 J/(mol·K) (Wert von Dulong-Petit). Wenn die Atome auch im Molekül unabhängig schwingen, folgt die Neumann-Kopp-Regel. Die Molwärme ist die Summe der Atomwärmen. Für Wasser mit der molaren Wärmekapazität von 75 J/(mol·K) 4.4. THERMISCHE EIGENSCHAFTEN 207 scheint das genau zu stimmen. Für Diamant findet man aber nur 0.5 J/(g·K) anstelle des berechneten Wertes von 2 J/(g·K). Die spezifische Wärme bleibt umso mehr hinter dem Dulong-Petit’schen Gesetz zurück, je tiefer die Temperatur, je leichter die Gitterteilchen und je fester das Gitter (Diamant!!! - Eis) ist. Ein erster Lösungsansatz gelang A. Einstein, der eine Quantelung der Energie eines schwingenden Gitterteilchens annahm. Im folgenden werden nun qualitative und quantitative Konzepte besprochen, die es erlauben, die spezifische Wärme zu berechnen. Die spezifische Wärme kann für konstante Volumina V bzw. Drücke p definiert werden: 0 ∂U ∂Q = (4.65) CV ≡ ∂T V ∂T V 5 0 ∂Q ∂(U + pV ) ∂H Cp ≡ = = . (4.66) ∂T p ∂T ∂T p p Dabei wird die thermodynamische Variable Enthalpie (4.67) H = U + pV verwendet. Üblicherweise beziehen sich diese Größen auf 1 Mol. Mit Hilfe des 2. Hauptsatzes der Thermodynamik kann die Entropie definiert werden. Z A 0 d Qrev S(A) ≡ (4.68) T 0 oder d0 Qrev (4.69) T Für reversible Prozesse mit dQ = T dS gibt es eine genau bestimmte Beziehung zwischen spezifischer Wärme und Entropie: ∂Q ∂S =T (4.70) CV ≡ ∂T V ∂T V dS ≡ sowie Cp ≡ ∂Q ∂T =T p ∂S ∂T (4.71) p In der statistischen Mechanik wird die spezifische Wärme über die Zustandssumme bestimmt. Ist diese Funktion für ein bestimmtes Problem bekannt, so kann man verschiedene Größen berechnen: Die Zustandssumme Z folgt aus X 1 Z= e−βEi , β≡ ; (4.72) kB T i daraus berechnet sich die Freie Energie F , die Entropie S, die Innere Energie U sowie die Wärmekapazität CV . F = −kB T ln Z (4.73) 208 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN S=− ∂F ∂T = kB ln Z + kB T V U = F + T S = kB T CV = ∂U ∂T =T V 2 ∂ ln Z ∂T ∂ ln Z ∂T (4.74) V (4.75) V ∂ 2 (kB T ln Z) ∂T 2 (4.76) V Die Differenz der spezifischen Wärme bei konstantem Druck und konstantem Volumen ist korreliert mit der Kompressibilität κ und dem Koeffizienten der thermischen Ausdehnung α, d.h., 1 (4.77) Cp − CV = T V α2 ; κ 1 ∂V 1 ∂V α= (4.78) , kT = . V ∂T p V ∂p T Für feste Körper ist es natürlich einfacher, die Wärmekapazität bei konstantem Druck zu bestimmen; hier ist auch die Differenz Cp and CV vernachlässigbar. Wie viele andere festkörperphysikalische Eigenschaften ist die gemessene Wärmekapazität aus verschiedenen Beiträgen zusammengesetzt. Insbesondere gilt für metallische und magnetische Festkörper: Cp = Cph + Cel + Cmag + Cnuc (4.79) wobei Cph der Gitterbeitrag, Cel der elektronische -, Cmag der magnetische - und Cnuc der Kernbeitrag ist. Im verbleibenden Teil dieses Kapitels soll nun auf den Gitterbeitrag (Gitterschwingungen) zur spezifischen Wärme näher eingegangen werden. Dieser Beitrag ist in allen Festkörpern bei hoher Temperatur essentiell und in nichtmagnetischen dielektrischen Stoffen natürlich im gesamten Bereich. Der nukleare Beitrag ist nur für Temperaturen unterhalb von etwa 1 K von Bedeutung! Spezifische Wärme des Gitters Experimentell beobachtet man für Festkörper: • Im Bereich von Zimmertemperatur beträgt die spezifische Wärme fast aller Festkörper 3N kB oder 25 J/(mol·K). • Bei tiefen Temperaturen nimmt die spezifische Wärme besonders stark ab und verhält sich in Isolatoren wie T 3 und für Metalle wie T für T → 0. Für Supraleiter gibt es einen noch wesentlich steileren Abfall. • Bei magnetischen Festkörpern findet man in der Nähe der des magnetischen Phasenüberganges einen sehr großen Beitrag zur Wärmekapazität. Eine Änderung des Ordnungszustandes bedeutet ja eine Änderung der Entropie und damit eine Änderung der spezifischen Wärme. 4.4. THERMISCHE EIGENSCHAFTEN 209 Um ein qualitatives und quantitatives Verständnis der Wärmekapazität des Gitters zu erhalten, müssen einige Begriffe, Vorstellungen und Modelle aus der Quantenmechanik bzw. Festkörperphysik adaptiert werden. Wir betrachten ein System identischer harmonischer Oszillatoren im thermischen Gleichgewicht. Der Quotient aus der Zahl der angeregten Oszillatoren im angeregten Zustand mit der Quantenzahl n + 1 und der Zahl der angeregten Oszillatoren im Zustand n lautet: Nn+1 /Nn = e−~ω/β β ≡ kB T. (4.80) Also beträgt die Zahl der Oszillatoren im Zustand n, bezogen auf die Gesamtzahl der Oszillatoren N exp(−n~ω/β) P∞ n (4.81) = P∞ s=0 Ns s=0 exp(−s~ω/β) Aus Glg. 4.81 ergibt sich für die mittlere Besetzungszahl hni eines Oszillators (d.h. die Oszillatoren sind im Mittel bis zur Quantenzahl n angeregt): P s exp(−s~ω/β) (4.82) hni = Ps s exp(−s~ω/β) Die Summe im Nenner hat die Form (Summe einer geometrischen Reihe) X xs = s 1 1−x (4.83) mit x = exp(−β~ω). Der Zähler hat die Form X sxs = x s x d X s x = . dx s (1 − x)2 (4.84) Man kann Glg. 4.82 zur Planckschen Verteilungsfunktion umformen: hni = x 1 = 1−x exp(~ω/β) − 1 (4.85) Für kleine Argumente im Exponenten, kann exp(a) in eine Taylorreihe entwickelt werden. Es gilt: exp(a) ≈ 1 + x + . . . ..... Damit erhält man unmittelbar hni ≈ kB T /~ω (4.86) Ist Glg. 4.86 erfüllt, bezeichnet man die Besetzung der Niveaus als klassisch, da dann jeder Oszillator die Energie hni~ω ≈ kB T besitzt (gültig bis etwa ~ω/kB T ≈ 1). Bei tiefen Temperaturen ist ~ω/kB T 1 und damit wird Glchg. 4.85 zu hni ≈ exp(−~ω/β). (4.87) 210 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Das Einstein Modell - N ungekoppelte Oszillatoren Die mittlere Energie eines Oszillators der Frequenz ω beträgt hni~ω. N Oszillatoren der Frequenz ω besitzen die Energie E = N hni~ω = N ~ω exp(~ω/β) − 1 Die spezifische Wärme beträgt damit 2 ∂E ~ω exp(~ω/β) CV = = N kB ∂T V β [exp(~ω/β) − 1]2 (4.88) (4.89) Ihr Verlauf ist in Abb. 4.30 dargestellt. Dies ist das Ergebnis des Beitrags von N Oszillatoren derselben Resonanzfrequenz zur spezifischen Wärme in Festkörpern. Wird N 0.8 durch 3N ersetzt, da jedes Atom drei Freiheitsgrade besitzt, ergibt sich für Glchg. 4.89 0.6 Einstein Modell, ΘE = 200 K im Grenzwert hoher Temperaturen 3N kB , alDebye Modell, ΘD = 200 K so der aus der Dulong-Petitschen Regel be0.4 kannte Wert. Bei tiefen Temperturen fällt das Ein0.2 steinmodell mit CV ∝ exp(−~ω/β) ab, experimentell jedoch findet man zumeist ein 0.0 0.0 0.5 1.0 1.5 2.0 Verhalten wie CV ∝ T 3 . Dies liegt darT/ΘE; T/ΘD in begründet, dass elastische Wellen eines Festkörpers nicht alle dieselbe Frequenz aufAbbildung 4.30: Temperaturabhängigkeit weisen. Diese Überlegung wird im sogenannder spezifischen Wärme im Einstein - und ten Debye Modell in Rechnung gestellt. Debye Modell; ΘE = 200 K, ΘD = 200 K. normierte spezifische Wärme 1.0 Das Debye Modell - N gekoppelte Oszillatoren Wir haben gesehen, dass die Energie eines harmonischen Oszillators der Frequenz ω durch die Planck’s Formel gegeben ist. U (ω, T ) = ~ω exp k~ω −1 BT (4.90) Nimmt man an, dass g(ω) die Anzahl der Moden pro Einheitsvolumen zwischen ω und ω+dω (= Zustandsdichte) ist, dann ist die Gesamtenergie des Systems Z ∞ ~ωg(ω) U= dω (4.91) exp k~ω −1 0 BT mit Z ∞ g(ω)dω = 3N. (4.92) 0 P. Debye hat angenommen, dass der Festkörper als System gekoppelter harmonischer Oszillatoren beschrieben werden werden kann. Die Gitterschwingungen sind dann Schallwellen, im Teilchenbild also akustische Phononen. 4.4. THERMISCHE EIGENSCHAFTEN 211 (a) k→ (b) (c) (d) k→ Abbildung 4.31: (a) Elastische Kette aus N + 1 Atomen und N = 10. Die Endatome werden festgehalten; der Wellenvektor muss dementsprechend gewählt werden. (b) Die Punkte bedeuten nicht Atome sondern die erlaubten Werte von k. (c) N Teilchen im Kreis. Die geometrischen Randbedingungen führen zu uN +s = us . (d) Erlaubte Werte der Wellenzahl k für periodische Randbedingungen. Die Dispersionsrelation zwischen Frequenz und Wellenvektor ist linear und wird durch die Schallgeschwindigkeit bestimmt. ω = vs · q. (4.93) Um eine Vorstellung über die Dichte g(ω) (Anzahl) der Phononen in einem Frequenzintervall ω+∆ω zu erhalten, nimmt man an, dass die Oberflächen konstanter Frequenzen sphärisch im q-Raum sind (= reziproker Raum). Die Anzahl der Moden kleiner als eine Grenzfrequenz ωD ist damit proportional zum Volumen dieser Kugel. Ein möglicher und erlaubter Wellenvektor besitzt das Volumen 8π 3 /V . Um diese Relation zu verstehen, geht man von einer 1-dimensionalen Kette mit der Länge L und N +1 Teilchen aus, die den Abstand a voneinander haben. Wir nehmen weiters an, dass die Teilchen s = 0 und s = N festgehalten werden (Abbildung 4.31). Jede Eigenschwingung dieser Anordnung ist eine stehende Welle us = u(0) exp[−iωk t] sin ska (4.94) 212 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN ωk ist mit k über die Dispersionsrelation verknüpft; weiters ist k durch die Randbedingungen für feste Enden festgelegt: π 2π 3π (N − 1)π , , , ... , L L L L Die Lösung für k = π/L lautet dann: k= us ∝ sin(sπa/L) Sie verschwindet, wie verlangt, für s = 0 und s = N . Die Lösung für k = N π/L = kmax ist dann us = sin sπ. Dabei stehen alle Atome still, da sin sπ an den Orten der Atome verschwindet. Es gibt also nur N − 1 erlaubte, unabhängige Werte von k, d.h, genau so viele Werte wie Teilchen. Jeder erlaubte Wert von k gehört zu einer Lösung von Glchg. 4.94. Bei einem eindimensionalen Gitter der Gitterkonstante a fällt jeweils eine Eigenschwingung in das Intervall ∆k = π/L. Eine weitere Methode beruht darauf, dass man das Medium als unbegrenzt ansieht, aber die Lösungen sich nach einer großen Länge L identisch wiederholen; u(sa) = u(sa + L) (periodische Randbedingungen). Die Lösungen sind dann laufende Wellen us (0) exp[i(ska − ωk t] mit den erlaubten k - Werten 4π Nπ 2π Abbildung 4.32: k Raum mit den . k = 0, ± , ± , . . . ± L L L möglichen Schwingungsmoden eiDiese Methode ergibt dieselbe Anzahl von Zuständen nes Kristallwürfels der Kante L und der Gitterkonstante d. Die wie in der vorherigen Methode (einen pro Atom), aber es Anzahl der Moden zwischen k sind nun positive als auch negative Werte von k erlaubt; und k + dk ist proportional zu das Intervall zwischen benachbarten k-Werten beträgt nun ∆k = 2π/L. k 2 dk. Beschränkt man sich nur auf positive Werte von k folgt wieder L/π. Ähnliche Überlegungen gelten für den 2 und 3-dimensionalen Fall. Für einen Würfel mit der Kantenlänge L ist k durch folgende Bedingungen bestimmt: exp i(kx x + ky y + kz z) ≡ exp i[kx (x + L) + ky (y + L) + kz (z + L)] (4.95) Daraus folgt kx , ky , kz = 0, ±2π/L, ±4π/L, . . . N π/L Im k Raum nimmt dann jeder erlaubte Wert von k ein Volumen von (2π/L)3 ein; anders ausgedrückt: pro Volumeneinheit im k-Raum gibt es für jede Polarisationsrichtung und für jeden Zweig 3 L V = 3 (4.96) 2π 8π 4.4. THERMISCHE EIGENSCHAFTEN 213 erlaubte Werte von k. Das Volumen der Probe ist V = L3 . Die diskreten Werte der erlaubten k Vektoren ist keine Konsequenz der Quantenmechanik, sondern folgt klassisch“ aus den ” Randbedingungen des Problems (z.B., Würfel mit beschränkter Seitenlänge). Mit diesen Überlegungen kann nun die Gesamtzahl der Schwingungen, sowie die Zustandsdichte berechnet werden. Alle möglichen Schwingungszustände (Moden) finden also im reziproken Raum innerhalb einer Kugel Platz. 4π 3 4π ω 3 q = =N 3 3 vs3 2π L 3 ⇒N = V ω3 6π 2 vs3 V ω2 dN = 2 3 g(ω) = dω 2π vs (4.97) (4.98) Ein alternativer Weg führt zum gleichen Ergebnis (vgl. Abb. 4.32): Das Volumen einer Kugelschicht mit Radius q und Dicke dq ist V ∗ = 4πq 2 dq (man erhält dieses Ergebnis, indem man Terme der Ordnung dq 2 und dq 3 vernachlässigt). Die Anzahl der Moden (= Zustände) innerhalb dieses Volumens folgt aus [4π(ω 2 /vs3 ) dω][V /(8π 3 )]. Da 8π 3 /V das Volumen pro q Vektor ist, ist V /(8π 3 ) deren Dichte. Es gilt somit g(ω) = V ω2 dω 2π 2 vs3 Debye nahm an, dass Gitterschwingungen eine obere Grenzfrequenz ωD besitzen und dass darüber keine weiteren Moden angeregt werden können, d.h., • g(ω) = 0 ∀ ω > ωD Damit wird nun die innere Energie ωD V ω2 U =3 dω 2 3 2π vs 0 Z ωD 3V ~ = 2 3 2π vs 0 Z ! ~ω = exp k~ω −1 BT ! ω3 exp k~ω −1 BT dω (4.99) Mit x = ~ω/kB T und xD = ~ωD /kB T = ΘD /T folgt U = 9N kB T T ΘD 3 Z xD dx 0 x3 . exp(x) − 1 (4.100) Für hohe oder tiefe Temperaturen kann das Debye Integral in eine Reihe entwickelt werden und man erhält • für T ΘD : U = 3N kB T (4.101) 214 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN • Für T ΘD : 3 T4 U = π 4 N kB 3 5 ΘD (4.102) Aus der Definition der spezifischen Wärme CV = dU/dT folgt unmittelbar der Phononenbeitrag im Debye Modell: • für T ΘD Cv = 3N kB (4.103) • für T ΘD 12 Cv = π 4 N kB 5 T ΘD 3 . (4.104) Die Temperaturabhängigkeit für gesamten Temperaturbereich folgt dann aus Cv = 9N kB T ΘD 3 J4 (T /ΘD ), (4.105) vergleiche auch Abb. 4.30. Jn (T /θ) stellt das so genannte Debye Integral dar (definiert in den div. Formelsammlungen). Abbildung 4.33 zeigt Wärmekapazitätsmessungen am ternären intermetallischen System La2 Pd2 In in einem Temperaturbereich von 4 bis ca. 100 K. Die durchgezogene Linie entspricht einer Modellkalkulation im Rahmen des Debye Modells, Glchg. 4.105. Die ausgezeichnete Übereinstimmung zwischen gemessenen und gerechneten Werten zeigt die Leistungsfähigkeit dieses Modells, obwohl hier nur ein einziger Parameter, ΘD angepasst werden kann. Eine Debyetemperatur ΘD = 172 K zeigt, dass diese intermetallische θD = 172 K Cp/T [J/mol K2] 1.5 1.2 0.9 0.6 0.3 La2Pd2In 0.0 0 10 20 30 40 50 60 70 80 90 T [K] Abbildung 4.33: Temperaturabhängigkeit des Phononenbeitrags Cph zur spezifischen Wärme von La2 Pd2 In dargestellt als Cph /T vs. T . Die durchgezogene Linie stellt einen Fit der Daten mit Hilfe des Debye Modells dar und ΘD = 172 K. 4.4. THERMISCHE EIGENSCHAFTEN 215 120 (a) LuNi2B2C 2 100 1 0 80 g(ω) x 10-3 Cph/T [mJ/gat.K2] (b) 3 60 3 YNiBC 2 1 0 40 20 LuNi2B2C 3 YNiBC La3Ni2B2N3-δ 2 La3Ni2B2N3 1 0 0 0 50 100 150 200 250 300 T [K] 0 200 400 600 800 1000 12001400 ω [Κ] Abbildung 4.34: (a): Temperaturabhängigkeit des Phononenbeitrags zur spezifischen Wärme von LuNi2 B2 C, YNiBC und La3 Ni3 B2 N3−δ dargestellt als Cph /T vs. T . (b): Energieabhängigkeit der Phononenzustandsdichte für die in (a) dargestellten intermetallischen Verbindungen. Verbindung kein besonders starres Gitter aufweist und das Schwingungsspektrum sehr einfach zu sein scheint. Eine Serie von Boriden, vgl. Abb. 4.34 (a), ist dagegen nur mit einem wesentlich komplexeren Spektrum von Phononen beschreibbar [Abb. 4.34 (b)], die neben dem Debye Spektrum noch zusätzliche Schwingungsmoden - auch oberhalb der Debyetemperatur - enthält. Eine detaillierte Diskussion der tatsächlichen Phononenzustandsdichte erfordert aber umfangreiche Studien mittels inelastischer Neutronenstreuung. Auftretende hochfrequente Moden (= Zustandsdichte bei hohen Temperaturen) ergeben sich aus dem Beitrag der leichten Elemente B und C. Im Folgenden soll anhand des so genannten magnetokalorischen Effekts die Nützlichkeit der Eigenschaft der Wärmekapazität kurz besprochen werden: Wenn ein Material mit Hilfe eines Magnetfeldes magnetisiert wird, dann verändert sich die Entropie Sm , die mit den magnetischen Freiheitsgraden assoziert wird, da sich bei verändernden Magnetfeldern der Ordnungszustand verändert. Unter adiabatischen Bedingungen muss ∆Sm durch eine gleich große, aber entgegengesetzte Veränderung der Entropie des Gitters kompensiert werden. Das hat eine Veränderung der Temperatur des Materials zur Folge. Die Temperaturänderung ∆Tad wird üblicherweise als der magnetokalorische Effekt bezeichnet. Dieser Effekt ist zu den magnetischen Eigenschaften des Materials über die thermodyna- 216 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN mischen Maxwellrelationen korreliert, d.h., ∂S ∂M = ∂B T ∂T M (4.106) Für Magnetisierun gsmessungen bei diskreten Temperaturintervallen kann ∆S aus ∆Sm (T, B) = X Mi+1 (Ti+1 , B) − Mi (Ti , B) Ti+1 − Ti ∆B (4.107) berechnet werden. Dabei sind Mi+1 (Ti+1 , B) und Mi (Ti , B) die Werte der Magnetisierung in einem Magnetfeld B und bei Temperaturen Ti+1 und Ti . Die magnetische Entropie kann natürlich auch von einer feldabhängigen Messung der spezifischen Wärme durch Integration erhalten werden. Z T C(T 0 , B) − C(T 0 , 0) (4.108) dT 0 , ∆Sm (T, B) = 0 T 0 C(T, B) und C(T, 0) sind die Werte der Wärmekapazität im Feld B und im Feld 0. Werte für ∆Sm aus Glchg. 4.107 und 4.108 sind (auch experimentell) gleichwertig. Die adiabatische Temperaturänderung kann numerisch aus den experimentell ermittelten Werten der Magnetisierung und der spezifischen Wärme ermittelt werden: Z B T ∂M ∆Tad (T, B) = − dB 0 (4.109) 0) C(T, B ∂T 0 Glchg. 4.109 zeigt, dass der magnetokalorische Effekt groß ist, wenn ∂M/∂T groß und C(T, B) bei der gleichen Tempertur klein ist. Da ∂M/∂T |B am magnetischen Phasenübergang groß ist, wird in der Nähe der Ordnungstemperatur der größte magnetokalorische Effekt erwartet. Um Kühlung im Bereich von Raumtemperatur zu bewerkstelligen, braucht man also Substanzen mit magnetischen Phasenübergängen in der Nähe der Raumtemperatur. 4.4.2 Thermische Leitfähigkeit Materialien in fester, flüssiger als auch gasförmiger Gestalt, besitzen die Eigenschaft, Wärme von ihrem warmen zum kalten Ende zu transportieren. Träger dieses Wärmeflusses sind Elektronen, Gitterschwingungen oder auch sogenannte Quasiteilchen, die sich z.B. auf langreichweitige magnetische Ordnung zurückführen lassen (=Magnonen). In einem realen Festkörper können alle diese Mechanismen gemeinsam zum gesamten Effekt beitragen. Dabei werden sich aber diese individuellen Flüsse gegenseitig stören und so den Gesamtfluss verringern. Einen Wärmefluss wird solange aufrecht erhalten, solange ein Temperaturgradient längs einer Probe anliegt (z.B. durch einen Heizer an einem Ende der Probe). In der Technik und auch im Haushalt wird die Eigenschaft der thermischen Leitfähigkeit vielfach ausgenützt. Dabei kommen sowohl Materialien mit hoher thermischer Leitfähigkeit zum Einsatz (z.B. um Wärme von einem elektronischen Bauteil abzutransportieren) als 4.4. THERMISCHE EIGENSCHAFTEN 217 auch solche, die eine sehr geringe thermische Leitfähigkeit aufweisen (z.B. damit Griffe am Kochgeschirr nicht übermäßig warm werden). Es ist einsichtig, dass in Metallen sowohl Elektronen als auch Gitterschwingungen (=Phononen) gemeinsam den Wärmetransport durch den Festkörper bewirken. In Isolatoren dagegen, sind die Phononen die wesentlichen Träger der Wärme. Trotzdem können Isolatoren, insbesondere bei sehr tiefen Temperaturen, extrem gute Wärmeleiter sein und Metalle vielfach übertreffen. Das kann darin liegen, dass Phononen nicht noch zusätzlich am Elektronensystem gestreut werden. Gute elektrische Leiter (z.B. Kupfer) sind auch gute Wärmeleiter. Diese phänomenologische Beobachtung wird durch das sogenannte Wiedemann Franz Gesetz auch theoretisch untermauert und lässt sich darauf zurückführen, dass die gleichen Ladungsträger sowohl elektrischen Strom als auch Wärme transportieren. Die thermische Leitfähigkeit wird definiert durch dT (4.110) Q=λ dx wobei λ der Koeffizient der thermischen Leitfähigkeit und Q der Wärmefluss sind (Energie, die pro Zeiteinheit durch eine Flächeneinheit hindurch tritt); dT /dx gibt den Temperaturgradienten längs der Probe an (Temperaturänderung pro Längeneinheit). Dabei diffundiert die Energie durch den Festkörper und unterliegt statistischen Streuprozessen. Eine Wärmetransport ohne Streuprozesse würde nur mehr vom Temperaturunterschied ∆T zwischen den Endflächen des Körpers abhängig sein, unabhängig von dessen Länge. Aus der kinetischen Gastheorie ist bekannt, dass 1 (4.111) λ = Cvl 3 ist. Hierbei ist C die Wärmekapazität, v die mittlere Geschwindigkeit und l die mittlere freie Weglänge zwischen Teilchenstößen. Es wird nun versucht, diese Gleichung aus der elementaren kinetischen Theorie abzuleiten. Der Teilchenfluss in x - Richtung sei 12 nh|vz |i, mit n . . . Molekülkonzentration. Im Gleichgewicht existiert ein Fluss gleicher Größe in die entgegengesetzte Richtung. h. . .i bezeichnet den Mittelwert. Bewegt sich ein Teilchen aus dem Gebiet T + ∆T in ein Gebiet mit der Ortstemperatur T , so gibt es dabei die Energie c∆T ab. c ist die Wärmekapazität eines Teilchens. Zwischen den Endpunkten einer freien Weglänge des Teilchens ist ∆T durch dT dT l= vx τ (4.112) ∆T = dx dx gegeben. Hierbei ist τ die mittlere Zeit zwischen zwei Zusammenstößen. Der resultierende Energiefluss (aus beiden Flussrichtungen) ist daher dT 1 dT (4.113) Q = nhvz2 icτ = nhv 2 icτ dx 3 dx Ist wie bei Phononen v konstant, so folgt 1 dT Q = Cvl (4.114) 3 dx l ≡ vτ und C ≡ nc. Durch Vergleich findet man λ = 13 Cvl. 218 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN (a) (b) (c) (d) Abbildung 4.35: (a) Fluss von Gasmolekülen durch eine lange offene Röhre. Elastische Stöße ändern Impuls und Energiefluss des Gases nicht. (b) Bei Wärmeleitfähigkeit eines Gases ist kein Massefluss erlaubt. Stoßpaare mit überdurchschnittlicher Geschwindigkeit wandern nach rechts, mit unterdurchschnittlicher Geschwindigkeit nach links. Das resultierende Konzentrationsgefälle sorgt für einen Gesamtenergietransport vom warmen zum kalten Ende (c) Fließen Phononen (aus der Phononenquelle) nach rechts und treten nur N -Prozesse auf, so ändert sich der Impuls der Phononen nicht und ein Fluss von Phononen wird aufrechterhalten. (d) In U -Prozessen ändert sich der Phononenimpuls bei jedem Stoß. 4.4. THERMISCHE EIGENSCHAFTEN 219 Wärmewiderstand des Gitters Die mittlere freie Weglänge l von Phononen wird hauptsächlich durch 2 Prozesse bestimmt: die Streuung an Kristallfehlern und die Streuung an anderen Phononen. Wären die Kräfte zwischen Atomen rein harmonisch, so gäbe es keinen Mechanismus, der zu Stößen zwischen verschiedenen Phononen führt, und ihre freie Weglänge wäre nur durch die Begrenzungen des Kristalls und durch Gitterfehler eingeschränkt. Bei anharmonischen Gitterwechselwirkungen besteht dagegen eine Kopplung zwischen Phononen, die ihre mittlere freie Weglänge begrenzt. Die Phononen sind dann nicht mehr genaue Normalschwingungen des Systems. Der Einfluss der anharmonischen Kopplung führt dazu, dass bei hohen Temperaturen die mittlere freie Weglänge l proportional zu 1/T ist. Dies erklärt sich aus der Anzahl der Phononen, die bei hohen Temperaturen proportional zu T ist. l eines Phonons ist umgekehrt proportional zur Zahl der Phononen, mit denen es zusammenstoßen kann, d.h., l ∝ 1/T Damit überhaupt eine Wärmeleitfähigkeit auftritt, muss ein Mechanismus vorhanden sein, der die Verteilung der Phononen lokal ins thermische Gleichgewicht bringt. Bei der Wärmeleitung muss also nicht nur die mittlere freie Weglänge begrenzt werden, es muss auch ein Mechanismus gegeben sein, durch den eine echte Gleichgewichtsverteilung der Phononen zustande kommt. Phononenzusammenstöße mit einem stationären Gitterfehler oder einer Kristallbegrenzung ergeben kein thermisches Gleichgewicht, da sich dabei die Energie der einzelnen Phononen nicht ändert: die Frequenz ω2 des gestreuten Phonons ist gleich der Frequenz ω1 des einfallenden Phonons. Bemerkenswert ist, dass auch Dreiphononenstöße K1 + K2 = K3 (4.115) zu keinem thermischen Gleichgewicht führen. Der Gesamtimpuls des Phononengases ändert sich nämlich bei solchen Stößen nicht. Eine Phononen-Gleichgewichtsverteilung mit Temperatur T kann durch einen Kristall mit einer Driftgeschwindigkeit wandern, die nicht von Dreiphononen-Stößen, Glg. 4.115 gestört wird. In solchen Stößen bleibt nämlich der Phononenimpuls X J= ~KnK~ (4.116) K erhalten. nK~ ist dabei die Anzahl der Phononen mit dem Wellenvektor K. Bei einer Verteilung J 6= 0 können Stöße (Glchg. 4.115) zu keinem vollständigen thermischen Gleichgewicht führen, da sie J unverändert lassen. Setzen wir eine Verteilung heißer Phononen in einem Stab mit J 6= 0 in Bewegung, so wird diese Verteilung mit unverändertem J durch den Stab wandern. In solchen Fällen tritt also kein Wärmewiderstand auf. Diese Überlegung gilt auch sinngemäß für Stöße zwischen Gasmolekülen in einer geraden Röhre mit reibungsfreien Wänden. Umklappprozesse Peierls zeigte, dass die für die Wärmeleitfähigkeit wichtigen Dreiphononenstöße von der 220 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN (a) (b) (c) Abbildung 4.36: (a) Normal und (b) Umklappprozesse in einem zweidimensionalen quadratischen Gitter. Das Quadrat in der Abbildung stellt die erste Brillouinzone im k Raum dar. Die Vektoren k mit Pfeilspitzen im Mittelpunkt der Zone stellen absorbierte Phononen dar; die vom Mittelpunkt wegweisende Pfeile repräsentieren Phononen, die beim Stoß erzeugt werden. Der reziproke Gittervektor hat die Länge 2π/a, mit a als Gitterkonstante. Bei allen Prozessen gilt Energieerhaltung, ω1 + ω2 = ω3 . (c) Mittelpunkt des reziproken Gitters eines linearen Kristalls der Gitterkonstante a. Ein Phonon mit K 1 stößt mit einem Phonon K 2 . K 1 + K 2 liegt außerhalb der ersten Brillouin Zone. Der resultierende Vektor ist aber gleichwertig mit K 2 . K 1 + K 2 + G. Im dargestellten Prozess ist G = 2π/a. Form K1 + K2 = K3 + G (4.117) sind; G ist dabei ein reziproker Gittervektor und kann in allen Impulserhaltungssätzen auftreten. Reziproke Gittervektoren sind in gitterperiodischen Strukturen immer möglich, im Kontinuum dagegen ist G = 0. Prozesse, bei denen G 6= 0 ist, nennt man Umklappprozesse, U - Prozesse. Dies bezeichnet den Umstand, dass bei einem Stoß zweier Phononen mit negativen K x sich durch das “Umklappen” nach dem Stoß ein Phonon mit positiven K x ergeben kann. Stöße, bei denen G = 0 ist, nennt man Normalprozesse, N - Prozesse. Bei hohen Temperaturen (T > ΘD ) sind alle Phononen angeregt, da kB T > ~ωmax ist. Ein wesentlicher Teil aller Phononenstöße sind dann Umklappprozesse und daher von einer großen Impulsänderung beim Stoß begleitet. Man erwartet, dass der Wärmewiderstand des 4.4. THERMISCHE EIGENSCHAFTEN (a) 221 (b) Abbildung 4.37: (a): Spezifischer Wärmewiderstand eines Kaliumchlorideinkristalls. Unterhalb von 5 K ist der Wärmewiderstand eine Funktion der Kristalldicke. (b): Wärmeleitfähigkeit eines hochreinen NaF-Kristalls Gitters bei hohen Temperaturen proportional zu T sein wird, d.h. die Wärmeleitfähigkeit fällt mit 1/T ab. Die Energie der Phononen K 1 und K 2 , die für einen Umklappprozess geeignet sein sollen, liegt in der Größenordnung von kB ΘD /2, da jedes der beiden Phononen 1 und 2 Wellenzahlen in der Größenordnung von G/2 haben muss, damit der Stoß, Glchg. 4.117, überhaupt möglich wird. Haben dagegen beide Phononen kleine Wellenzahlen K und damit auch geringe Energien, so kann sich bei einem Stoß dieser beiden kein Phonon mit einer Wellenzahl der Größenordnung (1/2)G ergeben. Beim Umklappprozess gilt ja der Energiesatz genau so wie beim N-Prozess. Bei tiefer Temperatur ist die Anzahl der geeigneten Phononen mit der nötigen Energie kB ΘD /2 gemäß Boltzmann Verteilung ungefähr durch exp[−ωD /2T )] bestimmt. Diese Abschätzung stimmt gut mit experimentellen Beobachtungen überein. In Glchg. 4.111 ist die mittlere freie Weglänge durch Umklappprozesse bestimmt. Kristallfehler Auch Geometrieeffekte können bei der Begrenzung der mittleren freien Weglänge eine wichtige Rolle spielen. Dazu zählt die Streuung an Kristallgrenzen, an chemischen Verunreinigungen, Gitterfehlern, etc. Wird bei tiefen Temperaturen die mittlere freie Weglänge l mit der Dicke eines Versuchskörpers vergleichbar, dann wird auch der Wert von l durch die Dicke beschränkt und die Wärmeleitfähigkeit wird eine Funktion der Abmessung des Versuchskörpers. Abb. 4.37, links, zeigt die Messergebnisse für Kaliumchloridkristalle. Der scharfe Abfall der Wärmeleitfähigkeit reiner Kristalle bei tiefen Temperaturen wird durch deren geringe Abmessungen verursacht. Bei tiefen Temperaturen kann der Umklappprozess die Wärmeleitfähigkeit nicht mehr einschränken, und der Einfluss der Kristallgröße dominiert (vgl. auch Abb. 4.37, rechts). Es ist dann zu erwarten, dass die mittlere freie Weglänge der 222 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Phononen konstant und ungefähr gleich dem Durchmesser D des Kristalls wird, d.h., λ ≈ CvD (4.118) Die einzige temperaturabhängige Größe in auf der rechten Seite von Glchg. 4.118 ist C, die bei tiefen Temperaturen mit T 3 abfällt. Man erwartet daher, dass die Wärmeleitfähigkeit bei tiefen Temperaturen wie T 3 verläuft. Der Einfluss der Kristallgröße wird immer dann spürbar, wenn die mittlere freie Weglänge der Phononen mit dem Durchmesser des Probekörpers vergleichbar wird. (b) (a) Abbildung 4.38: (a): Einfluß von Isotopen auf die Wärmeleitfähigkeit von Ge. (b): Temperaturabhängigkeit der thermischen Leitfähigkeit verschiedener Gläser und Kristalle. In sonst idealen Kristallen verursacht das Auftreten von Isotopen oft beträchtliche Phononenstreuung, da der statistische Einbau der Isotope die Periodizität des Gitters für eine elastische Welle empfindlich stört (vgl. Abb. 4.38). Diese Aussage lässt sich auch auf punktartige Gitterfehler, wie Fremdatome oder Leerstellen verallgemeinern. Dies führt natürlich auch zu Störungen der idealen Gitterperiodizität und damit zu Streuung der Phononen. In Gläsern und amorphen Substanzen ist die Wärmeleitfähigkeit signifikant reduziert (Abb. 4.38, rechts). Dies liegt daran, dass die Gitterperiodizität verloren geht und somit die Phononen beinahe an jedem Atom im Festkörper, die ja unregelmäßig angeordnet sind, gestreut werden. Praktisch führt das dazu, das die so genannte minimale thermische Leitfähigkeit erreicht wird. Dies ist eine theoretische untere Grenze für diese Größen. 4.4. THERMISCHE EIGENSCHAFTEN 223 Reale Materialien, insbesondere Metalle, sind dadurch gekennzeichnet, dass nicht nur Phononen (d.h. quantisierte Gitterschwingungen) zum Wärmetransport beitragen, sondern auch Elektronen, oder Quasiteilchen, die z.B. aus magnetischer Ordnung resultieren (so genannte Magnonen, das sind quantisierte Spinwellen). Für nichtmagnetische Materialien gilt demnach: λ = λe + λph (4.119) wobei λe der elektronische Beitrag zum gesamten gemessenen Effekt ist und λph den Gitterbeitrag repräsentiert. Dabei kann, abhängig vom untersuchten Material, entweder der eine oder der andere Beitrag dominieren, oder beide Beiträge sind von gleicher Größenordnung. Um nun λe und λph von λ zu separieren, wird das so genannte Wiedemann Franz Gesetz λe = L0 T Le T ≈ ρ ρ (4.120) angewandt, wobei ρ der elektrische Widerstand und L0 die so genannte Lorenzzahl, L0 = 2.45 × 10−8 WΩ/K2 ist. Dabei geht man von der Überlegung aus, dass Elektronen nicht nur elektrische Ladung, sondern auch Wärme transportieren. Die Quantenmechanik bestätigt die Äquivalenz beider Größen, so dass es die Kenntnis des elektrischen Widerstandes erlaubt, den elektronischen Beitrag zu λ zu berechnen und damit λph bestimmt werden kann: λph = λ − L0 T ρ (4.121) Misst man also die gesamte thermische Leitfähigkeit und den elektrischen Widerstand einer identischen Probe, so kann man den Gitterbeitrag zur thermischen Leitfähigkeit fast aller Materialien einfach bestimmen. Im folgenden Teil dieses Kapitels werden nun einige analytische Ausdrücke für die die thermische Leitfähigkeit des Gitters angegeben und gezeigt, wie die gesamte thermische Leitfähigkeit einer intermetallischen Verbindung analysiert werden kann. Das Material, das untersucht wird, zählt zur Familie der gefüllten Skutterudite und stellt ein neuartiges Material zur Verwendung in thermoelektrischen Applikationen dar. Eine Analyse des Gitterbeitrages zur thermischen Leitfähigkeit basiert auf der sogenannten Debye Näherung. Z θD /T τc x4 exp(x) 3 dx (4.122) λph = CT [exp(x) − 1]2 0 wobei x = ~ω/kB T mit der Phononenfrequenz ω. θD ist die Debye Temperatur und τc ist die gesamte Relaxationszeit, die die mittlere freie Weglänge der Phononen bestimmt. Diese gesamte Relaxationszeit setzt sich aus den Teilbeträgen gemäß τc−1 = τB−1 + τD−1 + τU−1 + τe−1 (4.123) zusammen. Dabei wird davon ausgegangen, dass die einzelnen Streuprozesse, die diese Relaxationszeit bestimmen, voneinander unabhängig sind. Die einzelnen Terme τB , τD , τU , τe 224 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN 25 Nd0.2Fe4Sb12 O[W/mK] 20 math. Anpassung 15 Otot 10 Oph 5 Omin Oe 0 0 50 100 150 200 250 300 T [K] Abbildung 4.39: Temperaturabhängigkeit der gesamten thermischen Leitfähigkeit von Nd0.2 Fe4 Sb12 , sowie der Gitter- bzw. der elektronische Anteil. Die durchgezogene Linie stellt einen Fit an die Daten dar. beziehen sich dabei auf Streuung der Phononen an Korngrenzen, an Fehlstellen, Umklappprozessen und an Leitungselektronen. Rechnungen basierend auf verschiedenen festkörperphysikalischen Modellen, die hier nicht explizit besprochen werden, führen zu folgenden Frequenz und Temperaturabhängigkeiten: τB−1 = B τD−1 = Dω 4 τU−1 = U ω 2 T exp(−θD /3T ) τe−1 = Eω (4.124) Dabei kann man sehen, dass eine Frequenzabhängigkeit durch die Eigenschaft der thermischen Leitfähigkeit in eine Temperaturabhängigkeit transferiert wird. Abbildung 4.39 zeigt die gesamte thermische Leitfähigkeit, den Gitter und den Elektronenanteil, sowie einen Fit, bei dem Glchg. 4.122 an die experimentellen Daten angepasst wird. Dabei treten als Fitparameter die Vorfaktoren aus Glchg. 4.124 auf, die damit bestimmt werden können. Wie aus Abb. 4.39 ersichtlich ist, ist die Gitterleitfähigkeit dieses Materials für höhere Temperaturen nahe am theoretischen Limit. Gefüllte Skutterudite sind also hervorragend für thermoelektrische Einsätze geeignet. 4.4.3 Thermische Ausdehnung Allgemein Die räumlichen Maße der meisten Substanzen nehmen zu, wenn sie unter konstantem Druck erwärmt werden. Es gibt aber auch Körper, die sich bei Erhöhung der Temperatur kontrahieren, wie z.B. einige tetrahedrisch gebundene Kristalle bei tiefer Temperatur, β Quarz 4.4. THERMISCHE EIGENSCHAFTEN 225 bei hoher Temperatur und auch Wasser unter 4◦ C. Andere Stoffe können bei Erwärmung verzerrt werden (anisotrope thermische Ausdehnung). Thermische Ausdehnung kann also positiv oder negativ sein. Die Eigenschaft einer temperaturabhängigen Länge kann für hochempfindliche Messanlagen, aber auch für größere Bauwerke wie Brücken oder Eisenbahnschienen von großer Wichtigkeit sein, da Temperaturschwankungen zu beachtlichen Längenänderungen führen. Als Beispiel sei hier die Dejustierung von Spiegelteleskopen und anderen Messgeräten erwähnt, die im Weltraum stationiert sind und somit großen Temperaturänderungen unterliegen. Ein Maß für die Größe der thermischen Ausdehnung ist 1 ∂V β= V ∂T p wobei V das Volumen bei einer bestimmten Temperatur T darstellt. Im Falle eines idealen Gases ist das Volumen bei konstatem Druck proportional zur mittleren Bewegungsenergie der Teilchen, V ∝ 1/2mv 2 = 3/2kB T , so dass der Wert von β proportional zu 1/T ist. Bei Raumtemperatur und atmosphärischen Druck ist β ≈ 3400 × 10−6 K−1 . Wegen der kurzreichweitigen strukturellen Ordnung in Flüssigkeiten ist das thermophysikalische Verhalten wesentlich komplexer und β wird üblicherweise in Form eines Polynoms repräsentiert, d.h., βf l = a + bT + cT 2 In Festkörpern kann die thermische Ausdehnung für verschiedene Raumrichtungen verschieden sein. Man definiert daher einen linearen thermischen Ausdehnungskoeffizieten für die Richtung i 1 ∂Li αi = Li ∂T p Die Summe der drei orthogonal linearen Koeffizienten eines Kristalls gleicht dann dem Volumenkoeffizienten β = α1 + α2 + α3 . 200 K 300 K 400 K NaCl Fe (bbc) SiO2 (hex.) In Teflon 35.3 10.1 4.9 39.5 85 39.7 11.8 7.4 52.9 > 500 43.0 13.2 8.8 77.3 150 U SiO2 (Glas) 22 -0.13 23 +0.41 24 0.55 Tabelle 4.1: Koeffizient der linearen thermischen Ausdehnung verschiedener Festkörper bei verschiedenen Temperaturen. Alle Ausdehnungswerte mal 10−6 ! Thermische Energie sorgt für eine Bewegung der Atome um ihre Gleichgewichtspositionen. Die potentielle Energie hängt in der einfachsten Näherung (harmonische Näherung) nur vom Quadrat der interatomaren Auslenkung ab. Dies würde bedingen, dass es keine thermische Ausdehnung gibt, oder dass sich Gitterschwingungen nicht gegenseitig beeinflussen. Eine einzelne Welle wäre weder gedämpft noch würde sie sich zeitlich ändern. 226 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Eine Erklärung der thermischen Ausdehnung basiert auf der Asymmetrie der Bindungspotentiale zwischen den Atomen, die bedingt, dass deren mittlere Abstand zunimmt, wenn sie längs der Verbindungslinie schwingen. Dieses Modell ist zwar nur für zweiatomige Moleküle gültig, wenn auch die Rotationsschwingungen berücksichtigt werden. Aber obwohl dieses Modell nur in groben Zügen anwendbar ist und vielfach auch zu völlig falschen Ergebnissen für feste Körper führt (es erklärt z.B. keine negative thermische Ausdehnung), so liefert es doch die wesentlichsten Grundlagen zum Verständis der thermischen Ausdehnung. Es erklärt insbesondere, dass die Schwingungen der Atome durch Anharmonizitäten Anlass zur thermischen Ausdehnung geben. Der Nachteil dieses Modells liegt darin, dass nur longitudinale Gitterschwingungen (entlang der Verbindungslinie zwischen 2 Atomen) in Betracht gezogen werden. In Festkörpern gibt es aber auch Relativbewegungen der Atome transversal zu diesen Richtungen. Dies führt zu einem weiteren anharmonischen Prozess, der Atome gegeneinander bewegt und damit den mittleren Abstand zwischen Atomen verkürzt. Diese zwei Mechanismen haben entgegengesetzte Wirkung, und die thermische Ausdehnung kann positiv oder negativ sein, je nachdem welcher dieser Effekte überwiegt. Der zweite Prozess, obwohl er immer auftritt, hat nur in bestimmten Stoffen wesentliche Auswirkungen. Insbesondere trifft das für offene Strukturen zu, wenn Relativbewegungen auftreten, die signifikante Komponenten entlang der Richtung der Bindungen besitzen. Beiträge die nicht von Gitterschwingungen herrühren, können spektakuläre Ergebnisse liefern, insbesondere bei tiefen Temperaturen (Schwingungsanteile sind hier gering). Grundsätzlich ist jeder Beitrag zur freien Energie eines Systems (z.B. elektronisch, magnetisch, etc.) abhängig von Dehnungen und Deformationen und beeinflusst daher die thermische Ausdehnung. Diese kann sehr präzise gemessen werden (mit Hilfe einer Kapazitätsmessung zweier Abbildung 4.40: Temperaturabhängigkeit des Vo- paralleler Platten) und dient daher auch lumenausdehnungskoeffizienten β verschiedener dazu, viele Eigenschaften von MateriaFestkörper lien zu untersuchen. Die thermische Ausdehnung von Festkörpern ist i.A. sehr komplex, kann aber durch die sogenannte Grüneisengleichung ΓCp (4.125) β= V Bs vereinfacht dargestellt werden. Γ ist der Grüneisenparameter, Cp ist die Wärmekapazität bei konstantem Druck und BS ist der Bulk modulus. Da Γ/(V BS ) in einfachen Systemen beinahe konstant ist über einen großen Temperaturbereich, hat β ungefähr dieselbe Temperaturabhängigkeit wie Cp . Für tiefe Temperaturen gilt β → 0 für (T → 0), während bei hohen Temperaturen β leicht ansteigt. Es ist bekannt, dass sich viele Metalle von 0 K bis zur Schmelztemperatur etwa 7% ausdehnen. Das bedeutet auch, dass Festkörper mit einem 4.4. THERMISCHE EIGENSCHAFTEN 227 geringen Schmelzpunkt einen sehr großen Ausdehnungskoeffizieten β besitzen. Im Fall von Metallen und T < 20 K kann die Wärmekapazität durch Cp = ael T + agitt T 3 ausgedrückt werden, wobei die Terme den Elektronen- und Gitterbeitrag ausdrücken. Über die Grüneisenbeziehung kann die thermische Ausdehnung in einer ähnlichen Art angegeben werden. Es gilt: 1 Γel αel T + Γgitt αgitt T 3 β= (4.126) V Bs Berechnung der thermischen Ausdehnung einfacher Festkörper Im Folgenden wird anhand eines üblichen Gitterpotentials ein Weg zur Berechnung der thermischen Ausdehnung skizziert. Ausgangspunkt ist ein asymmetrischer Potentialtopf, z.B. der eines Kr-Kristalls. Ein be- Abbildung 4.41: Schematisches Bindungspotential eines Kr-Kristalls liebig herausgegriffenes Atom schwingt zwischen den eingezeichneten Extrempositionen hin und her; bei höheren Temperaturen kann es höher den Potentialtopf hinauf laufen. In einem asymmetrischen Potentialtopf, Abb. 4.41, wird das Atom länger rechts von der Mitte als links von der Mitte sein; der mittlere Atomabstand als Funktion der Schwingungsamplitude wird auf der eingezeichneten Mittellinie liegen. Die mittlere Lage ist etwas rechts von r0 , der Kristall dehnt sich. Für den linearen thermischen Ausdehnungskoeffizienten (hier in einer etwas abgewandelten Form) gilt l(T ) − l0 therm α= = , (4.127) l0 T T mit der thermischen Dehnung therm ; die Dimension von α ist K −1 . 228 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Wenn man die Amplitude der Schwingung und die beiden Extremalpositionen berechnen will (Abb. 4.41), muss folgende Gleichung gelöst werden: U = (3/2)kB T = − A B + m. n rex rex (4.128) Dabei wird ein typisches asymmetrisches Bindungspotential UBindg = –(A/rn ) + (B/rm ) angenommen, wobei m und n Parameter für das entsprechende Potential sind. Dieses Potential sorgt für einen bestimmten Gleichgewichtsabstand r0 der einzelnen Atome und damit auch für eine bestimmte Dichte. Das negative Vorzeichen definiert die Anziehung zwischen den Teilchen und das positive für Abstoßung. Für r → ∞ wird U → 0. U (r0 ) = E0 ist dann die Gitterenergie. Für den Gleichgewichtsabstand verschwindet auch die Kraft U 0 . Die Energie an einer der markierten Extremalpositionen rex ist gleich der mittleren thermischen Energie (1/2) kB T pro Freiheitsgrad; also (3/2)kB T für die drei Freiheitsgrade der Schwingungen in den drei Koordinatenrichtungen. Für m, n > 4 gibt es keine analytische Lösung der Gleichung. In einer Näherungslösung vereinfacht man Glchg. 4.128 mit Hilfe einer Potenzreihenentwicklung (Taylor Reihe) um das Minimum, d.h. für r = r0 und erhält: 00 000 U = U0 + (1/2)U0 x2 + (1/6)U0 x3 + . . . , (4.129) 00 mit U0 = d2 U/ dr2 . . . zweite Ableitung nach r. Sie ist ein Maß für den Elastizitätsmodul. 000 U0 . . . ist die dritte Ableitung nach r. Die Reihenentwicklung verschiebt den Nullpunkt auf das Potentialminimum, oder, in anderen Worten, wir haben x = r–r0 . Die erste Ableitung ist im Potentialminimum Null. Höhere Ableitungen als die dritte vernachlässigt man. Die dritte Ableitung ist aber essentiell: Sie enthält die Asymmetrie des Potentials, die ja erst für die thermische Ausdehnung sorgt. Die erste Ableitung ergibt dU = U 0 = nAr–(n+1) –mBr–(m+1) dr Die zweite Ableitung U 00 = A(−n − 1)nr−n−2 − B(−m − 1)mr−m−2 Sucht man U 00 im Potentialminimum, d.h., r = r0 und berücksichtigt, dass U 0 (r0 ) = 0, so folgt nm U 00 (r0 ) = U0 2 r0 Die dritte Ableitung ist demgemäß U 000 = A(−n − 2)(−n − 1)nr−n−3 − B(−m − 2)(−m − 1)mr−m−3 Oder, wieder für r = r0 , U 000 (r0 ) = –U0 nm(n + m + 3) r03 4.4. THERMISCHE EIGENSCHAFTEN 229 Damit ergibt sich für die Näherungsformel des Bindungspotentials in der Nähe des Potentialminimums nmx2 nm(n + m + 3)x3 U (x) = U0 1 + (4.130) − 2r02 6r03 Für die Amplitude eines Atoms, das in diesem Potential schwingt, betrachtet man den Wert der Funktion bei der Energie U0 + (3/2)kB T . Man hat also eine implizite Gleichung für die (jeweils halbe) Amplitude x nmx2 nm(n + m + 3)x3 (3/2)kB T = – (4.131) 2r02 6r03 Glchg. 4.131 ist eine Gleichung dritten Grades für die Extremwerte von x für eine gegebene thermische Energie; diese Gleichung kann im Prinzip gelöst werden. Ausgehend von den beiden relevanten y x-Werten – als eine kleine Korrektur der y=ax2 y=ax2-bx3 Werte ±x(T ) – die sich aus einem parabelförmiges Potential ergeben würden (die x+ξ -x+ξ dann natürlich keine thermische Ausdehnung enthalten) folgt: -x x nmx2 (3/2)kB T = 2r02 y=-bx Die Lösungen der quadratischen Gleichung kann man sofort angeben; für die Amplitude nach links und rechts gilt 1/2 1/2 3kB T 3kB T r02 = ±x0 . = x1,2 = ± nm U 00 3 x Ansatz zur Lösung der kubischen Geichung: Amplitude nach links = −x0 + ξ, Amplitude nach rechts = +x0 + ξ. Was das genau bedeutet, ist aus Abb. 4.42 zu entnehmen. Einsetzen in die Gleichung dritten Grades und Ausmultiplizieren gibt eine Bestimmungsgleichung dritten Grades für ξ; und ξ ist natürlich genau die Abweichung von der Gleichgewichtsposition: ξ = r–r0 = therm r0 Abbildung 4.42: Potential Damit ist das Problem innerhalb der mathematischen Näherung mittels einer TaylorEntwicklung exakt gelöst. Um nun die Gleichung dritten Grades zu lösen, kann man jetzt berücksichtigen, dass die thermische Ausdehnung generell ein kleiner Effekt ist, und das heißt, dass sowohl ξ klein ist gegenüber x0 , als auch das |U 000 | klein ist gegenüber |U 00 |. Man vernachlässigt also die mindest quadratisch kleinen“ Terme, also alle ξ 2 , ξ 3 und ” alle Produkte zwischen ξ und U 000 . Damit folgt (3/2)kB T = (1/2)U000 (x0 + ξ)2 + (1/6)U0000 (x0 + ξ)3 = (1/2)U000 x20 + x0 ξ + (1/6)U0000 x30 230 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Setzt man den Wert für x20 ein, heben sich die beiden ersten Terme auf; ein x0 kürzt sich heraus, und es bleibt 3kB T U0000 00 0 = ξU0 + 6U 00 Damit ergibt sich für ξ: kB T U0000 ξ=– 2(U 00 )2 Einsetzen obiger Werte ergibt für α: α= therm ξ = T r0 T und als Endformel α=– –U0 [nm(n + m + 3)/r03 ]kB T kB T U0000 = − . 2(U 00 )2 r0 T 2r0 T [U0 (nm/r02 )]2 (4.132) Daraus folgt unmittelbar (n + m + 3)kB (4.133) 2nmU0 Man sieht, dass α umgekehrt proportional zur Bindungsenergie U0 ist. Es ist bekannt, dass α= Abbildung 4.43: Schmelztemperatur als Funktion der thermischen Ausdehnung für elementare Metalle der Schmelzpunkt Tm ungefähr proportional zu U0 ist - in der einfachsten Näherung setzt man U0 = kB Tm . Eingesetzt in die Formel für α ergibt sich dann ein direkter Zusammenhang zwischen dem Schmelzpunkt und dem thermischen Ausdehnungskoeffizienten: α= (n + m + 3) 1 = const. 2nmTm Tm 4.5. MAGNETISCHE EIGENSCHAFTEN 231 Diese Beziehung kann leicht überprüft werden. Für praktisch alle Metalle ergibt sich eine hervorragende Übereinstimmung - die Werte liegen fast alle sehr gut auf der erwarteten Hyperbel, bei einem Schmelzpunktintervall von mehr als 3000 K! Invar Der Begriff Invar wurde 1897 von Ch. E. Guillaume eingeführt. Er untersuchte die thermische Ausdehung von (fcc)-FeNi-Legierungen im Konzentrationsbereich Fe65Ni35 und fand, dass der Ausdehnungskoeffizient im Bereich der Raumtemperatur Null ist. Dieser Effekt rührt daher, dass neben der üblichen Volumsreduktion mit fallender Temperatur ein weiter Effekt auftritt, der die normale Ausdehnung kompensiert. Tritt ferromagnetisches Verhalten unterhalb einer charakteristischen Temperatur TC auf, so erfährt die Substanz eine Volumenaufweitung (positiver Magnetovolumen-Effekt = Volumenmagnetostriktion). Der Ausdehnungskoeffizient von Invar verschwindet dadurch bis etwa 450 K fast vollständig! Alle neueren Invar-Legierungen enthalten Eisen, Kobalt (beide ferromagnetisch) oder Mangan (antiferromagnetisch). Invar machte als Ersatz für das teure Platin-Iridium bei Ur-Metern“ Karriere, als Material für Unruhefedern in Chronometern - überall da, wo ” eine geringe thermische Ausdehnung gefragt war. Invar ist in der Technik von heute weit verbreitet, zum Beispiel auch in Schattenmasken“ von TV-Bildröhren. Guillaume erhielt ” 1920 für seine Entdeckung den Nobelpreis. 4.5 Magnetische Eigenschaften Magnetwerkstoffe sind ein wichtiger Bestandteil der heutigen Informationsgesellschaft und kommen im täglichen Leben in zahlreichen Anwendungen vor, wie zum Beispiel in Computerfestplatten, Motoren, Sensoren, etc. . . Der Vorteil der magnetischen Informationsspeicherung liegt in dem kleinen Speichervolumen pro Bit. Zum Vergleich, in einem menschlichen Gehirn sind etwa 10 Gbytes gespeichert, was in der Größenordnung moderner Computerfestplatten liegt. Die Gesamtheit der elektrischen und magnetischen Erscheinungen eines Festkörpers lässt sich auf der Grundlage einer Feldtheorie, den Maxwellschen Gleichungen beschreiben. Diese elektrischen und magnetischen Felder werden durch die elektrischen Ladungen und durch die magnetischen Momente der Elementarteilchen erzeugt. Magnetische Felder werden aber auch von Leitungs- und Konvektionsstromen, d. h. gegenüber dem Bezugssystem bewegten elektrischen Ladungsträgern, und dem Verschiebungsstrom hervorgerufen. Zur Berücksichtigung der Eigenschaften eines Mediums werden in der Maxwellschen Theorie Materialkonstanten eingeführt. Sie haben die Bedeutung von makroskopischen Mittelwerten der betreffenden Eigenschaften über die atomistische Struktur der Substanzen und werden • teilweise mit Hilfe der Quantentheorie berechnet sowie • aus dem Experiment bestimmt. Das vollständige System der Maxwellschen Gleichungen gibt die Verknüpfung elektrischer 232 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN und magnetischer Felder wieder. ∇ · D(r, t) = ρ (r, t) ∇ × E(r, t) = − ∂ B (r ,t) ∇ · B(r, t) = 0 ∂t ∇ × H(r, t) = s(r, t) + ∂ D∂t(r ,t) − − − − − − − − − − − − −− D = ε · E B = µ · H s = σE (4.134) Die magnetischen Eigenschaften eines Festkörpers lassen sich auf magnetische Momente und ihren Wechselwirkungen zurückführen. Unterschiedliche Formen der Wechselwirkung führen zu den verschiedenen Arten der magnetischen Erscheinungen. Der fundamentale Baustein der magnetischen Eigenschaften ist der magnetische Dipol und das damit verbundene magnetische Moment. 4.5.1 Magnetisches Moment Im klassischen Elektromagnetismus führt ein geschlossener Kreisstrom zu dem magnetischen Moment µ [Abb. 4.44(a)]: (4.135) µ = i . A Am2 wobei i der Kreisstrom und A der Vektor der eingeschlossenen Fläche ist. Die magnetischen Eigenschaften von Festkörpern werden bestimmt durch: • das resultierende Moment aller Elektronen, die durch die in der Substanz befindlichen Atome gegeben sind, • die Wechselwirkung dieser magnetischen Momente und • das magnetische Moment des Atomkernes und seiner Wechselwirkung mit der Elektronenhülle. Obwohl der zuletzt angeführte Anteil für eine Reihe von physikalischen Messverfahren (magnetische Kernresonanz u. a.) entscheidend ist, kann er als Beitrag zu der Polarisation bei den magnetischen Werkstoffen vernachlässigt werden. Atomares magnetisches Moment Im Schalenmodell des Bohr-Sommerfeldschen Atommodells wird jedem Elektron des Atoms ein Energiezustand zugeordnet. Er wird durch jeweils vier Quantenzahlen gekennzeichnet (n, l, lz und sz ). Nach dem Pauli-Prinzip kann jeder Zustand maximal nur mit einem Elektron besetzt werden. Steigt die Ordnungszahl und damit die Anzahl der Elektronen je Atom an, so kommt es zu der Ausbildung von abgeschlossenen Elektronenschalen. Dabei werden, beginnend mit dem Element Kalium, neue, äußere Schalen angelegt, bevor die anderen (nunmehr inneren) voll aufgefüllt sind. Jedem Elektron für sich kann man ein magnetisches Moment 4.5. MAGNETISCHE EIGENSCHAFTEN 233 Abbildung 4.44: Magnetisches Moment hervorgerufen durch a) Kreisstrom, b) Eigendrehimpuls und c) Bahndrehimpuls eines Elektrons. zuschreiben. Diese einzelnen Momente werden dann nach dem Vektormodell zu einem resultierenden Moment zusammengesetzt. Das magnetische Moment eines Elektrons mit den Quantenzahlen l und s setzt sich aus einem Bahn- und Spinmoment zusammen [Abb. 4.44(b,c)], die sich zu p µ0 e~ p l (l + 1) = µB l (l + 1) 2me (4.136) p µ0 e~ p s (s + 1) = 2µB s (s + 1) me (4.137) ml = für das Bahnmoment, bzw. ms = für das Spinmoment ergeben. Die beiden Anteile unterscheiden sich um den Faktor 2. Diese als magnetomechanische Anomalie bezeichnete Erscheinung ist für die Berechnung des magnetischen Gesamtmomentes wesentlich, da der resultierende mechanische Drehimpuls J nicht mehr mit der Richtung des magnetischen Gesamtmomentes mr übereinstimmt (Abb. 4.45). Der Quotient aus dem magnetischen Gesamtmoment und dem resultierenden mechanischen Drehimpuls wird als gyromagnetisches Verhältnis γ bezeichnet. Der Zusammenhang zwischen Bahndrehimpuls und dem magnetischen Moment eines Elektrons wurde erstmals durch den Einstein-de Haas Effekt (1915) demonstriert. µ=γ·L (4.138) e γ=− (4.139) 2me Die makroskopische Magnetisierung (magnetisches Moment pro Volumen) eines Festkörpers ergibt sich dann aus: µ M = total [A/m] (4.140) V 234 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Die magnetische Polarisation ist gegeben durch: J = µ0 M T=Vs/m2 4π V·s µ0 = 7 10 A·m Die entsprechende Materialgleichung aus den Maxwellschen Gleichungen wird zu: B = µ0 (H + M ) = µ0 H + J = µ0 µr H = µH (4.141) (4.142) (4.143) mit µ als Permeabilität und µr als relative Permeabilität. In speziellen Fällen gibt es einen linearen Zusammenhang zwischen der Magnetisierung M und dem äußeren Feld H, wobei χ die magnetische Suszeptibiltät ist. B = µ0 (1 + χ) H = µ0 µr H µr = (1 + χ) (4.144) J S L µl µs µr µj Abbildung 4.45: Lage des Gesamtdrehimpuls J = L + S und des daraus resultierenden magnetischen Gesamtdrehmomentes mr = ml + ms führt eine Präzessionsbewegung um die Richtung von j aus, so dass nur mit mj gekennzeichnete Komponente von mr gemessen wird. Nach dem Bohr-Sommerfeldschen Atommodell wird das Bahnmoment aus dem magnetischen Moment eines Kreisstromes berechnet. Für l =0 erhält man so das Bohrsche Magneton µB zu e~ µ = πr2 i = − ≡ −µB (4.145) 2me 4.5. MAGNETISCHE EIGENSCHAFTEN 235 e~ = 9.274 · 10−24 A · m2 (4.146) 2me Das resultierende magnetische Moment aller Elektronen eines Atoms hängt von der Wechselwirkung der Elektronen untereinander bzw. von der Kopplung der Bahndrehimpulse li und Eigendrehimpulse si ab. Damit ergibt sich nach dem Vektormodell der Atomhülle: µB = • Bei chemischen Elementen mit Ordnungszahlen < 50 ist die Kopplung zwischen den Bahn- und zwischen den Eigendrehimpulsen jeweils untereinander stärker, als die zwischen dem Bahn- und Eigendrehimpuls eines Elektrons (Russell-Saunders-Kopplung). Die Drehimpulse li und sP i bilden daher jeweils für sich einen Bahn- bzw. EigendrehimP puls L = li bzw. S = si für das Atom oder auch Ion als Gesamtheit der beteiligten Elektronen. Diese Impulse ergeben dann den Gesamtdrehimpuls J mit J = L + S. • Elektronen in abgeschlossenen Schalen liefern keinen Beitrag zu dem magnetischen Moment. Da bei einer chemischen Bindung die Tendenz zur Auffüllung der Schalen besteht, ergeben nur Elektronen der nicht abgeschlossenen inneren Schalen ein resultierendes Moment. Die Aufteilung der Elektronen auf die Terme der nicht voll besetzten Schalen kann mit Hilfe der Hund’schen Regeln verstanden werden. Nur Atome mit nicht aufgefüllten inneren Elektronenschalen, d.h. die Elemente • der Eisengruppe 3d • der Seltenen Erdmetalle • der Wertmetalle • derAktiniden 4d 5f Cr, Mn, Fe, Co, Ni, Cu 4f und 3d Ce... Yb Zr.. .Te U...Cm bewirken merkliche Werte der magnetischen Polarisation. Magnetische Werkstoffe mit χ 1 müssen daher obige Elemente erhalten. In einem magnetischen Festkörper kann sich jedoch das magnetische Moment je Atom ändern, weil u. a. die Bahndrehimpulse durch das Kristallfeld reduziert bzw. gelöscht werden, so dass nur der Beitrag des Spinmomentes wirksam wird, und die Terme der isolierten Atome zu den Energiebändern des Festkörpers übergehen (Anzahl der Bohrschen Magnetonen in Metallen und Legierungen, siehe Tabelle 4.2, erste Spalte; inneratomare Wechselwirkung). 4.5.2 Einteilung der magnetischen Eigenschaften In Bezug auf die magnetischen Eigenschaften können alle Substanzen zunächst grob durch drei charakteristische Wertebereiche der Suszeptibilität unterschieden werden (Abb. 4.46): • Diamagnetismus • Paramagnetismus χ<0 χ>0 236 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN • Ferro- bzw. Ferrimagnetismus • Antiferromagnetismus χ0 χ>0 Während man bei den dia- und paramagnetischen Substanzen eine Wechselwirkung zwischen den atomaren magnetischen Momenten vernachlässigen kann, werden die charakteristischen magnetischen Eigenschaften beim Ferro-, Ferri- und Antiferromagnetismus gerade durch die Kopplung zwischen den einzelnen Momenten bestimmt. Abbildung 4.46: Vergleich der magnetischen Suszeptibilität eines (a) dia- (b) para - und (c) ferromagnetischen Materials. Diamagnetische Substanzen Diese Substanzen bestehen aus Molekülen, Atomen bzw. Ionen, bei denen sich die magnetischen Momente normalerweise kompensieren. Sie besitzen also kein ständiges (permanentes) Moment. Erst mit der Einwirkung eines Magnetfeldes wird eine negative Suszeptibilität gemessen, d. h., diese Stoffe werden aus einem inhomogenen Feld verdrängt. Anschaulich kann man den Diamagnetismus mit Hilfe des Bohr-Sommerfeldschen Atommodells verstehen. Danach werden durch das Magnetfeld Kreisströme induziert, die das Bahnmoment der Elektronen beeinflussen und die gemäß der Lenzschen Regel Wirkungen hervorrufen, die der Ursache entgegenwirken (Verdrängung aus dem Feld). Typische Vertreter: Cu, Bi, H2 O Paramagnetische Substanzen Die paramagnetischen Stoffe enthalten Bestandteile, die (jeweils für sich) ein ständiges (permanentes) magnetisches Moment aufweisen und deren Wechselwirkung untereinander (im paramagnetischen Zustand) zu vernachlässigen ist und sich daher keine resultierende permanente magnetische Polarisation ergibt. Es kann sich dabei um Elektronen, Atome, Moleküle 4.5. MAGNETISCHE EIGENSCHAFTEN 237 aber auch um makroskopische Teilchen (magnetische Flüssigkeiten) handeln. Die Temperaturabhängigkeit der Magnetisierung und der Suszeptibilität werden durch den Quotienten α= µ0 JgµB H kT (4.147) d. h. durch das Verhältnis der magnetostatischen Energie und der entgegenwirkenden thermischen Energie der Teilchen bestimmt. Für die Magnetisierung erhält man M = M∞ BJ (α) (4.148) wobei J dem Gesamtdrehimpuls der Teilchen (einzelnen Momente) entspricht. Kann man die Richtungsquantelung vernachlässigen, d. h., geht man z.B. zu makroskopischen Teilchen über, so ist die Brillouin-Funktion BJ (α) durch die Langevin-Funktion L(α) zu ersetzen. Im Bereich der Raumtemperatur und bei technisch gebräuchlichen Magnetfeldern gilt das Curie-Gesetz: M C χ= = (4.149) H T mit C als die Curie-Konstante. Paramagnetismus nach dem Curie-Weißschen Gesetz tritt bei Substanzen auf, bei denen die Wechselwirkung für T < TC , d.h. unterhalb der CurieTemperatur, nicht mehr vernachlässigt werden kann (Übergang zum geordneten Ferri- und Ferromagnetismus, Abb. 4.47): M C = (4.150) χ= H T − TC Abbildung 4.47: Geordnete magnetische Momente in einem (a) Ferro- und (b) Ferrimagneten. Das Magnetvolumen ist in unterschiedliche magnetisch geordnete Bereiche (magnetische Domänen) unterteilt. 238 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Ferromagnetismus Die Curie-Temperatur ist dadurch gekennzeichnet, dass bei einer Abkühlung bzw. Erwärmung des Werkstoffes über diesen Wert eine magnetische Ordnung entsteht bzw. aufgelöst wird. Für ferromagnetische Stoffe ist diese Ordnung durch eine parallele Einstellung der magnetischen Momente gekennzeichnet. Es bildet sich damit allein durch Abkühlung unter die Curie-Temperatur ein resultierendes Moment, die spontane Magnetisierung bzw. spontane magnetische Polarisation aus (Abb. 4.48). In der Umgebung der Curie-Temperatur weisen auch weitere Eigenschaften, so z. B. der elektrische Widerstand, die spezifische Wärme und der Ausdehnungskoeffizient Anomalien auf (Phasenübergang zweiter Art). Abbildung 4.48: Magnetische Polarisation (1) und reziproker Wert der Suszeptibilität (2) aufgetragen über der Temperatur; (3) Extrapolation: Tc,f ferromagnetische Tc,p paramagnetiscne Curie-Temperatur. Die parallele Ausrichtung der magnetischen Momente, d. h. die spontane Magnetisierung, wird phänomenologisch durch ein von Weiß eingeführtes Zusatzfeld und atomistisch über die von Heisenberg definierte Austauschwechselwirkungsenergie erklärt. Die Aufteilung des Gesamtvolumens erfolgt in magnetische Domänen oder Weiß’sche Bezirke. Die parallele Ausrichtung aller magnetischen Momente ist im Bereich von technisch realisierbaren Magnetfeldern leicht möglich. Die reinen Metalle Fe, Ni, Co sind bei Raumtemperatur ferromagnetisch. In der Regel sind deren Legierungen untereinander auch ferromagnetisch. Ferrimagnetismus Tritt in Substanzen mit magnetisch nicht gleichwertigen Untergittern auf, die eine spontane antiparallele magnetische Einstellung der magnetischen Momente aufweisen. Es gibt keine Kompensation der Beiträge der Gitter und damit erfolgt eine spontane Polarisation unterhalb von TC . Die Ausbildung von Weiß’schen Bezirken und damit die Beeinflussung der magnetischen Momente durch Magnetfelder ist leicht möglich. Beispiele für ferrimagnetische Materialien sind Spinelferrite, Hexaferrite, Orthoferrite und Granate. Ferrimagnetische 4.5. MAGNETISCHE EIGENSCHAFTEN 239 Materialen unterscheiden sich von ferromagnetischen durch eine unterschiedliche Temperaturabhängigkeit der spontanen Magnetisierung (Abb. 4.49). Abbildung 4.49: Vergleich der Temperaturabhängigkeit von ferromagnetischen und ferrimagnetischen Materialien. Antiferromagnetismus Antiferromagnetismus sind Substanzen mit zwei magnetisch gleichwertigen Untergittern, wobei eine spontane antiparallele Einstellung der magnetischen Momente und somit eine Kompensation unterhalb der Neeltemperatur TN erfolgt. Typische Vertreter sind CrSb, CrAl, Metalloxide, MnO, MnO2 , FeO, NiO, . . . Superparamagnetismus Diese Erscheinung setzt bei ferro- bzw. ferrimagnetischen Teilchen ein, wenn der Durchmesser der Partikel einen kritischen Wert unterschreitet. Die thermische Energie ist dann größer als die Kristallanisotropieenergie, und die Magnetisierungsrichtung folgt der thermischen Fluktuation. Die Magnetisierungskurven zeigen keine Remanenz und keine Koerzitivfeldstärke. Die Magnetisierung als Funktion von dem äußeren Feld und der Temperatur wird genau wie bei den paramagnetischen Substanzen durch die Langevin-Funktion beschrieben. 240 4.5.3 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Klassische Theorie des Ferromagnetismus Nach dem Weißschen Ansatz ist das Molekularfeld der Magnetisierung proportional. Dieses Feld beschreibt die inneratomare Wechselwirkung. Es gilt: HW eiss = NW eiss · M (4.151) NW eiss ist die so genannte Weiß’sche Konstante. Die einzelnen Momente sind dabei einem effektiven Gesamtfeld ausgesetzt, das mit Werten von HW eiss um 109 A/m alle technisch erzeugbaren Felder um mehrere Größenordnungen übertrifft. Austauschwechselwirkung Die spontane Orientierung der einzelnen Spins ist über die Austauschwechselwirkung erklärbar. Dieser quantenmechanische Effekt kann dazu führen, dass eine parallele bzw. antiparallele Einstellung der magnetischen Momente benachbarter Spins energetisch günstiger ist, da so ein geringerer Anteil an elektrostatischer Energie erforderlich wird. Tabelle 4.2: Sättigungspolarisation bei verschiedenen Temperaturen, Curie-Temperatur, Kristallanisotropiekonstanten K1 und Austauschenergiekonstante A für ferro- und ferrimagnetische Elemente, einige charakteristische Legierungen sowie Werkstoffe. Fe Ni Co FeCo 50/50 SmCo5 (BaO6 Fe2 O3 ) (NiOFe2 O3 ) (MnOFe2 O3 ) (Y3 FeO12 ) nB (0K) JS (OK) [T] 2,2 2,19 0,608 0,656 1,74 1,78 2,43 20 2,3 5 5,1 0,72 0,34 0,69 JS (300K) [T] 2,14 0,608 1,75 2,45 1,1 0,47 0,31 0,48 0,18 TC [K] 1043 631 1400 K1 (300K) [k J/m3 ] 48 5 430 -35 A (300K) [p J/m3 ] 8,8-33 3,4 10,3 990 730 840 615 564 1550 300 -7 -4 -2,45 12 - 22 Es gibt mehrere Ansätze zur Berechnung der Austauschenergie, wobei das HeisenbergModell von lokalisierten magnetischen Momenten, d. h. an feste Gitterplätze gebundenen Spins, ausgeht und in der Bändertheorie des Ferromagnetismus ein anderer Standpunkt (keine bzw. eingeschränkte Lokalisation der Elektronen) eingenommen wird. Mit den zuletzt angeführten Vorstellungen lässt sich insbesondere das Auftreten von Ferromagnetismus in kristallinen amorphen Übergangsmetall-Legierungen verstehen. In dem Heisenberg-Modell erhält man die Wechselwirkungsenergie benachbarter Spins mit φij = −2IA · Si · Sj (4.152) 4.5. MAGNETISCHE EIGENSCHAFTEN 241 Si , Sj sind die Spinquantenzahlen für die Atome i und j und IA ist das Austauschintegral. Das Austauschintegral hängt von dem Zustand der Elektronenhülle und dem Kernabstand ab. Durch das Vorzeichen dieser Größe wird eine parallele bzw. eine antiparallele Ausrichtung als energetisch günstiger ausgewiesen. Es ergibt sich für: • IA > 0 eine parallele Spinkopplung und • IA < 0 eine antiparallele Spinkopplung. Eine exakte Berechnung des Austauschintegrals ist schwierig. Näherungsweise sind jedoch Abschätzungen möglich. So gibt die thermische Energie bei der Curie-Temperatur eine Information über die Größe der Austauschwechselwirkungsenergie. Die Austauschwechselwirkung kann aber auch z. B. in Oxiden durch zwischengelagerte Sauerstoffionen von einem Metallion zum anderen übertragen werden. Wesentlich ist dabei, dass sich die Wellenfunktionen der Sauerstoff- und Metallionen überlappen (Abb. 4.50) Abbildung 4.50: Durch Schraffur hervorgehobene Überlappung der Wellenfunktion der 2pElektronen des Sauerstoffions (1) mit denen der benachbarten Fe3+ (2) bzw. Mn2+ - Ionen (3); Richtungen der Spins bzw. der magnetischen Momente (4); für die Stärke der Superaustauschwechselwirkung sind der Winkel α und der Abstand d wesentlich. Diese als Superaustausch bezeichnete Wechselwirkung führt zu einer antiparallelen Einstellung der magnetischen Momente benachbarter Metallionen und damit zur Ausbildung von zwei Untergittern mit entgegengesetzt orientierten magnetischen Gesamtmomenten. In Abb. 4.51 werden die beiden Untergitter an dem Beispiel einer Gitterzelle des Spinellferrits dargestellt. Die Austauschenergie wird generell zunächst nur auf zwei in Wechselwirkung stehende, benachbarte magnetische Momente bezogen. Geht man zu einem Festkörper über, so ist die Gesamtheit der Wechselwirkungen zu berücksichtigen. Diese Aufgabe kann jedoch nur unter einschränkenden Bedingungen gelöst werden. Mit der Voraussetzung, dass nur nächste 242 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Abbildung 4.51: Tetraeder- (1) und Oktaederplätze (2) eines Spinellferrits als Beispiel für eine Substanz mit zwei magnetischen Untergittern; (3) Sauerstoffionen; Pfeile: Spinrichtungen; (4), (8): Kennzeichnung der O2− lonen, die zu der Umgebung von Tetraeder- bzw. Oktaederplätzen gehören. Nachbarn und kleine gegenseitige Verdrehungen der Spinrichtungen zugelassen werden, kann die Austauschenergiekonstante A für einen bcc Kristall berechnet werden als: Abcc = IA S 2 a (4.153) mit a als Gitterabstand und damit die Austauschenergiedichte in der Form angegeben werden: X ∂ αk 2 , ΦA = A · (4.154) ∂ xl k,l wobei αj den Richtungskosinus der Magnetisierung darstellt. Kristallanisotropieenergie Der Vektor der magnetischen Polarisation ist in einem Festkörper an bestimmte Richtungen (leichte Achsen) gebunden. Diese sind durch die Kristallstruktur oder andere Anisotropien, wie z.Bsp. Spannungsanisotropie, induzierte Anisotropie, Formanisotropie, etc. vorgegeben. Stimmen die Richtung der leichten Achsen und die des magnetischen Feldes nicht überein, so wird, von H= 0 ausgehend, mit ansteigendem Feld die magnetische Polarisation von der leichten Achse in die Feldrichtung eingedreht. Dabei muss jedoch der aufmagnetisierte Werkstoff mechanisch festgehalten werden, da sonst nur eine Drehung des gesamten Körpers (wie bei einer Kompassnadel) erfolgt. Analoge Überlegungen gelten für die magnetische Polarisation im Inneren eines magnetischen Körpers, wobei andere Gegenkräfte (z.B. Austauschwechselwirkung) wirksam sind. Die Kristallanisotropieenergie entspricht der Arbeit, die für die Auslenkung aus der leichten Richtung aufzubringen ist. Als eine Ursache für die Bindung der 4.5. MAGNETISCHE EIGENSCHAFTEN 243 magnetischen Polarisation an das Kristallgitter wird z. B. die Spin-Bahn-Wechselwirkung angesehen. Die Richtungsabhängigkeit der Anisotropieenergie kann durch eine Reihenentwicklung nach dem Richtungskosinus in Bezug auf eine kristallografische Hauptachse des Gitters dargestellt werden. Damit erhält man z. B. für hexagonale Kristalle: X Φ,K = Kn · sin2n Θ ∼ (4.155) = K0 + K1 · sin2 Θ + K2 · sin4 Θ + ....... n mit K1 , K2 als die Anisotropiekonstanten und Θ als den Winkel zwischen Magnetisierung und der Achse der leichten Magnetisierung. Aus den Werten für Ki ergeben sich die Vorzugsachsen bzw. Vorzugsebenen für die spontane Magnetisierung. Es ist demnach möglich, dass die leichten Richtungen eine ganze Ebene bzw. einen Kegelmantel ausfüllen können. Neben der einachsigen Anisotropie gibt es auch noch Materialien mit kubischer Kristallanisotropie, d.h. mit drei leichten Richtungen (Abb. 4.52). Die Kristallanisotropiekonstanten hängen vielfach von der der chemische Zusammensetzung der Werkstoffe als auch von der Herstellungstechnologie der Legierungen ab. Abbildung 4.52: Vergleich der Magnetisierungskurven von Einkristallen aus Eisen, Nickel und Cobalt. Magnetomechanische Effekte, Spannungsanisotropie Als magnetomechanische Effekte werden alle die Phänomene bezeichnet, bei denen eine mechanische Beanspruchung (mechanische Deformationen, aber auch z.B. Beschleunigungsvorgänge) des magnetischen Materials zu einer Magnetisierungsänderung führt bzw. eine Änderung der Magnetisierung des Werkstoffes auf die geometrischen Abmessungen zurückwirkt. Die Änderung der äußeren Form der Probenkörper kann man in eine Gestalts- (Gestaltsbzw. Längsmagnetostriktion) und eine Volumenänderung (Volumenmagnetostriktion) unterteilen. Dabei wird rechnerisch jeweils die andere Größe als konstant angesehen. Die Längsbzw. Gestaltsmagnetostriktion wird aus der relativen Längenänderung bestimmt, die bei dem Übergang von einem Ausgangswert der Magnetisierung zu einem Endwert auftritt. Handelt es sich um die Bestimmung der Sättigungsmagnetostriktion, so geht man von einer thermisch entmagnetisierten Probe aus, die in die Richtung des angelegten Feldes bis 244 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN zur Sättigung (zum Eindrehen der Magnetisierung) aufmagnetisiert wird. Die Magnetostriktion ist anisotrop, d.h., zur vollständigen Beschreibung sind die Messungen an Einkristallen längs der Hauptachsen durchzuführen. Bei isotropen Polykristallen kann man die Sättigungsmagnetostriktion aus einer Bestimmung von λ// in Magnetisierungsrichtung und bei einer Magnetisierung senkrecht dazu λ⊥ ermitteln: λ = ∆l l λs = 23 λ// − λ⊥ (4.156) Die Volumenmagnetostriktion ist in der Regel wesentlich kleiner als die Längsmagnetostriktion (∼10−6 ). Die Spannungsanisotropieenergiedichte Φm ergibt sich aus der Magnetostriktion. Dominiert diese magnetoelastische Energie, so beeinflusst sie maßgebend die Vorzugslagen für die Magnetisierung und damit die Magnetisierungsprozesse. Die Spannungsempfindlichkeit der Magnetwerkstoffe besitzt bei der halben Sättigungspolarisation den Maximalwert. In magnetischen Werkstoffen kommt zu der elastischen Dehnung noch die durch die Magnetostriktion verursachte hinzu. Der Elastizitätsmodul ist daher eine Funktion des äußeren Magnetfeldes. Magnetisches Streufeld und Formanisotropie Das entmagnetisierende Feld Hs oder das magnetische Streufeld ist proportional zu Ms und dem von der Probengeometrie abhängigen Entmagnetisierungsfaktor N , gemäß: H s = −N · M s (4.157) Der geometrische Entmagnetisierungsfaktor N wird durch die äußere Form der Probe bestimmt und beträgt zum Beispiel bei einer Kugel in alle drei Richtungen 1/3. Bei einer plättchenförmigen Probe senkrecht zur Oberfläche hat dieser den Wert 1. Eine Anisotropie der äußeren geometrischen Gestalt eines magnetisierten Körpers kann über die Winkelabhängigkeit der Streufeldenergie zu einer magnetischen Vorzugsrichtung (Formanisotropie) führen. Ist die Magnetisierung in einem Volumen homogen, so ergibt sich die Streufeldenergiedichte zu: 1 1 1 Φ,S = − · H s · J s = − · µ0 · H s · M s = · µ0 · N · Ms2 2 2 2 4.5.4 (4.158) Magnetisierungsprozesse, Hysteresis und Domänentheorie Magnetisierungsprozesse sind Vorgänge, die zu einer Änderung der magnetischen Polarisation in einem Werkstoff führen. Sie hängen unmittelbar von der auf das Material einwirkenden Feldstärke ab und verlaufen generell sprunghaft (Barkhausen-Rauschen). Die Änderung der magnetischen Polarisation erfolgt dabei durch z.B. Domänenwandverschiebungen und Drehungen der Richtung einheitlich magnetisierter Bereiche (Abb. 4.53). Eine Ummagnetisierung durch “Bloch”-Wandverschiebungen setzt in der Regel eine Keimbildung voraus, die bei einer kritischen Feldstärke einsetzt und dann bei weiterer Feldstärkeerhöhung zu Keimwachstum sowie zum Auftreten von Wänden und schließlich zu deren Verschiebung 4.5. MAGNETISCHE EIGENSCHAFTEN 245 führt. Die kritischen Feldstärken für Keimbildung, Keimwachstum und die Verschiebung von Wänden werden durch die Größe der magnetischen Anisotropie, der magnetischen Polarisation sowie die Art und Verteilung der realen Mikrostruktur in dem magnetischen Körper bestimmt. Da die magnetische Polarisation und damit auch die kritischen Felder von dem jeweils herrschenden Druck und der Temperatur abhängen, werden die aktuellen Magnetisierungsprozesse von diesen Zustandsgrößen mit beeinflusst. Bei der Neukurve leistet im Bereich kleiner Feldstärkewerte zunächst die Bloch-Wandverschiebung einen wesentlichen Beitrag zu dem Anwachsen der magnetischen Polarisation. Mit weiter ansteigendem Feld werden dann Drehprozesse wirksam. Der Wert der Sättigungspolarisation wird erreicht, wenn alle Magnetisierungsvektoren in die Feldrichtung eingedreht sind. Die äußere Hystereseschleife wird danach bei einer kontinuierlichen Abnahme der Feldstärke durchlaufen. Dabei nimmt die magnetische Polarisation immer weiter ab und stellt sich endlich in die neue Feldrichtung ein. Als Ummagnetisierungsvorgänge kommen dabei Bloch-Wandverschiebungen und Rotationsprozesse in Frage. Neben den Ummagnetisierungsprozessen sind in Abb. 4.53 auch noch die wichtigen Kenngrößen der Hysteresiskurve, wie Sättigungsinduktion Bs , Remanenz Br und Koerzitivfeldstärke HB erkennbar. Abbildung 4.53: Magnetische Hysteresiskurve schematisch a) Ummagnetisierungsprozesse. b) Kenngrößen, weich und c) hartmagnetisch. Mikromagnetismus Unter dem Begriff Mikromagnetismus werden verschiedene Theorien zur Berechnung der Magnetisierungsprozesse zusammengefasst, die auch zur Zeit noch ein aktuelles Gebiet der Forschung darstellen. In der ursprünglichen Formulierung von Brown wird von Näherungen ausgegangen, bei denen nicht die einzelnen Spins, sondern die über ein Volumenelement gemittelte Magnetisierung betrachtet wird. Ferner wird angenommen, dass der Betrag der spontanen Magnetisierung konstant ist und nur die Richtung sich von Ort zu Ort ändert. Es gilt also X J (r) = J s · α (r) , αi2 = 1 (4.159) 246 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN wobei α = α(r) in der Regel als stetige Funktion angesetzt wird. Die Magnetisierungsstruktur α = α(r) und die Feldstärke, bei der Instabilitäten auftreten, werden mit der Lösung des Variationsproblems für die freie Energie bestimmt: Φgesamt = ΦA + ΦK + ΦH + ΦS + Φm (4.160) wobei für die Zeeman-Energie gilt: Φ,H = −H · J s = −µ0 · H · M s (4.161) Aus der Gleichgewichtsbedingung δΦ = 0 erhält man, J × H ef f = 0 (4.162) d.h., die Magnetisierung dreht in die Richtung des effektiven Feldes ein. Es gilt: H eff = − δΦgesamt δJ = HA + HK + H + HS + HM (4.163) Abbildung 4.54: Während des dynamischen Umschaltprozesses präzessiert der Magnetisierungsvektor M in Richtung H ef f . Aus der Stabilitätsbedingung Φ → min. ergeben sich die kritischen Feldstärkewerte für die verschiedenen Ummagnetisierungsmoden. Der dynamische Ummagnetisierungsprozess ist ein Präzessionsprozess in Richtung effektives Feld und wird durch die Landau-Lifshitz Gleichung beschrieben (Abb. 4.54): ∂J |γ| α =− (J × H ef f ) − [J × (J × H ef f )] 2 ∂t 1+α JS (1 + α2 ) α ist die phänomenologische Dämpfungskonstante. (4.164) 4.5. MAGNETISCHE EIGENSCHAFTEN 247 Domänenstrukturen Die magnetischen Domänen stellen Volumenbereiche dar, in denen die Richtung der magnetischen Polarisation konstant ist. Sie werden voneinander durch Übergangsschichten oder Domänenwände abgegrenzt. Domänenstrukturen bilden sich aus, da die Streufeldenergie reduziert wird, wenn sich entgegengesetzt polarisierte Bereiche ausbilden (Abb. 4.55). Die Unterteilung in Weißsche Bezirke ist nach einer thermischen Entmagnetisierung bei allen magnetischen Werkstoffen zu beobachten. Sie bewirkt, dass nach einer Entmagnetisierung der gemessene Wert der Polarisation Null wird, obwohl eine spontane Polarisation in den Weißschen Bezirken vorhanden ist. Die Streufeldenergie wird durch die Ausbildung der Domänenstrukturen verringert; einer Unterteilung in immer feinere Bereiche sind aber wegen der für den Aufbau der Domänengrenzen (Bloch-Wandenergien) in Rechnung zu stellenden Energie Grenzen gesetzt. Die Wechselwirkung der Domänenwände während der Ummagnetisierung mit der realen Mikrostruktur beeinflusst die Hysteresiseigenschaften, wie Koerzitivfeldstärke, Remanenz und Anfangssuszeptibilität. Abbildung 4.55: Unterteilung eines ferri- oder ferromagnetischen Körpers in magnetische Domänen oder Weiß’sche Bezirke. Domänenwände Die magnetischen Domänen werden durch Übergangsschichten mit einer endlichen Dicke δ voneinander getrennt (Abb. 4.56). Im Falle einer Bloch-Wand geht die Magnetisierung kontinuierlich von einer leichten Richtung des 1. Bezirkes in die Richtung von M s des zweiten (benachbarten) Bezirkes über. Die Domänengrenzen haben eine endliche Dicke. Der Wert ergibt sich aus einem Energieminimum, wobei die Austauschwechselwirkung einer Verdrehung benachbarter Spins entgegenwirkt und damit einer Tendenz in Richtung große Wanddicke entspricht; im Gegensatz dazu wird der Energieaufwand für die Anisotropieenergie nur mit einer Abnahme der Breite der Übergangsschicht reduziert. Die Bloch-Wanddicke und die je Flächeneinheit benötigte Energie hängen von dem Wandtyp ab. Für 180˚-Bloch-Wände erhält man: q δBloch = π A K1 √ ΦBloch = 4 A · K1 (4.165) 248 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Néel-Wände bilden sich in dünnen Schichten (δ . . . Schichtdicke) aus. Der Magnetisierungsvektor dreht sich hier um eine Achse, die senkrecht zur Wandnormalen liegt (und nicht wie bei den Bloch-Wänden um eine Achse in Richtung der Wandnormalen). Abbildung 4.56: Magnetische Domänenwände. a) Bloch-Wand, b) Néel-Wand. Kohärente Rotation der Magnetisierung, Stoner-Wohlfahrt-Modell Bei der Berechnung der Ummagnetisierungsfeldstärke werden neben der magnetostatischen Energie nur die Form- und Kristallanisotropieenergie berücksichtigt. Es wird vorausgesetzt, dass alle magnetischen Momente im Probenvolumen parallel zueinander ausgerichtet bleiben. Nach der Sättigung eines Magnetwerkstoffes erhält man mit abnehmendem Feld zunächst reversible Drehungen, bis dann die Ummagnetisierung in einem irreversiblen Sprung erfolgt (Abb. 4.57). Der größtmögliche Wert der Koerzitivfeldstärke tritt auf, wenn Feld- und Anisotropierichtung übereinstimmen. Er wird als Anisotropiefeldstärke HA bezeichnet, und es gilt: 2K1 (4.166) HA = Js 4.5.5 Einteilung der magnetischen Werkstoffe Magnetische Werkstoffe werden nach der Größe der Koerzitivfeldstärke in weich- und hartmagnetische Materialien eingeteilt (Abb. 4.58). Weichmagnetische Werkstoffe zeichnen sich durch eine leichte Magnetisierbarkeit, kleine Koerzitivfeldstärke und niedrige Verluste aus. 4.5. MAGNETISCHE EIGENSCHAFTEN 249 Abbildung 4.57: Hystereseschleifen nach dem Stoner-Wohlfahrt-Modell. Kurvenparameter: Winkel zwischen Feld- und Vorzugsrichtung; 1 0˚, 2 10˚, 3 45˚, 4 90˚; 5 Feld- bzw. Polarisationswerte, bei denen der irreversible Sprung einsetzt. Hartmagnetische Werkstoffe weisen hohe Werte der Koerzitivität auf. Nach den Bindungsverhältnissen und der Struktur lassen sich bei den magnetischen Werkstoffen die nachfolgenden Gruppen unterscheiden: • metallische kristalline Werkstoffe • metallische amorphe Werkstoffe • oxidische Werkstoffe (Ferrite). Nach ihren Herstellungsverfahren wird neben dem auf schmelzmetallurgischem Weg und anschließender Walz- und Glühbehandlung hergestellten Bandmaterial zwischen Gussmagnetwerkstoffen und Sintermagnetwerkstoffen sowie Pulververbundwerkstoffen differenziert. Die magnetischen Eigenschaften der Werkstoffe werden durch zahlreiche Faktoren beeinflusst. Die chemische Zusammensetzung und die Mikrostruktur, d.h. die geometrische und chemische Nahordnung bestimmen die primären magnetischen Eigenschaften Js und TC . Die Art und Größe der magnetischen Anisotropie sowie die Defektstruktur bestimmen bei gegebener Form des Magnetkörpers die Domänenstruktur sowei die Magnetisierungsprozesse und damit die Größe von Hc , µ, Ummagnetisierungsverluste usw. Während die magnetische Anisotropie durch die Kristallstruktur, die chemische Nahordnung und die inneren und von außen aufgeprägten mechanischen Spannungen gegeben ist, wird die Defektstruktur sehr wesentlich durch die Reinheit der Ausgangsstoffe (Rolle von Verunreinigungen usw.) und die verschiedenen technologischen Schritte bei der Herstellung beeinflusst und kann auf diesem Wege optimal eingestellt werden. Wesentliche technologische Schritte bei der Herstellung magnetischer Werkstoffe sind: 250 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Abbildung 4.58: Übersicht der weich- und hartmagnetischen Werkstoffe. • Bandmaterialien: Schmelzprozess, Warm- und Kaltverformung, thermische Behandlung mit und ohne Magnetfeld, Glühregime (Abkühlgeschwindigkeit von der Glühtemperatur, Glühatmosphäre usw.) • Gusswerkstoffe: Schmelzprozess, Abkühlvorgang, thermische Behandlung, Magnetisieren für Dauermagnetwerkstoffe • Sinterwerkstoffe: Schmelzprozess für Ausgangslegierung bzw. Syntheseverfahren für Oxidpulver, Pulverisierung, Pressen, Sintern, thermische Nachbehandlung, Magnetisieren bei Dauermagnetwerkstoffen • Pulververbundwerkstoffe: Herstellung der magnetischen Pulverkomponenten, Auswahl der Matrixwerkstoffe (Polymere usw.), Formgebung, Bearbeitung oder Zuschnitt. Die weichmagnetischen Materialien sind nach der magnetischen Schlusswärmebehandlung sorgfältig vor mechanischen Beanspruchungen zu schützen. Wird derartiges Material bei der Weiterverarbeitung mechanischen Spannungen ausgesetzt, so sollte am Ende eine Entspannungsglühung erfolgen. Bei starken mechanischen Beanspruchungen ist die volle Schlusswärmebehandlung zu wiederholen. Die Bauform der magnetischen Werkstoffe wird den speziellen Bedingungen der jeweiligen Anwendung angepasst. Standardformen sind: 4.5. MAGNETISCHE EIGENSCHAFTEN 251 Ringbandkerne, Schnittbandkerne, Kernbleche, geklebte Blechpakete, Form- und Massivteile, Abschirmschläuche, Massekeime, dünne Schichten, Drähte. Weichmagnetische metallische Werkstoffe Die weichmagnetischen metallischen Werkstoffe basieren im Wesentlichen auf den ferromagnetischen Metallen Eisen, Cobalt sowie Nickel und ihren Legierungen (Abb. 4.59). Abbildung 4.59: Die gebräuchlichsten weichmagnetischen Werkstoffe. Hauptanwendungsrichtungen für weichmagnetische metallische Werkstoffe sind: Trafos, Generatoren, Motoren, Relais, Wandler und Übertrager, Fehlerstromschutzschalter, magnetische Bauteile in der Leistungselektronik (Schutzdrosseln, Impulsübertrager,...), Magnetköpfe für die Informationsspeicherung, mechanische Filter und Verzögerungsleitungen, Bauteile für die Ultraschallerzeugung, Temperaturkompensation. Kriterien für die Werkstoffauswahl sind neben den magnetischen Eigenschaften ”Koerzitivfeldstärke, Permeabilität, Sättigungsinduktion, Form der Hystereseschleife, Verluste, usw., auch die Be- und Verarbeitbarkeit, die mechanischen Eigenschaften, die thermische und zeitliche Stabilität der magnetischen und anderen Eigenschaften sowie die Korrosionsbeständigkeit. Für die energieorientierte Elektrotechnik werden vorrangig weichmagnetische Eisen-Silizium-Legierungen eingesetzt. Die Zugabe von Silizium zu Eisen bewirkt einerseits eine Erhöhung des spezifischen elektrischen Widerstandes und ist damit ein wesentlicher Faktor zur Verringerung der Wirbelstromverluste. Mit dem Si-Gehalt nimmt andererseits die Sättigungspolarisation ab. Mit zunehmendem Si-Gehalt tritt eine Versprödung auf, so dass eine Verformung für Legierungen mit mehr als etwa 4 % Si nicht mehr möglich ist. Je nach ihrem Verwendungszweck unterscheidet man bei den Elektroblechen: • Dynamoblech für den Einsatz in elektrischen Maschinen und 252 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN • Transformatorenblech. Bei den Dynamoblechen werden je nach Si-Gehalt sowie Art der Verformung und Wärmebehandlung beim Hersteller im Wesentlichen folgende Qualitäten unterschieden: Warmgewalztes oder kaltgewalztes, siliziertes oder unsiliziertes Blech, schlussgeglühtes oder nicht schlussgeglühtes Blech, usw. Die notwendige nachträgliche Glühbehandlung der nicht silizierten, nicht schlussgeglühten Güten zur Erzielung optimaler magnetischer Eigenschaften soll in einer entkohlenden Atmosphäre im Bereich von etwa 800˚C bei definierter Aufheiz- bzw. Abkühlgeschwindigkeit erfolgen. Die Bleche werden vorrangig im Dickenbereich von 0,2 bis 1 mm hergestellt. Die Trafobleche unterscheiden sich von den Dynamoblechen durch eine im Prozess der Herstellung ausgebildete Kristallstruktur. Es lassen sich drei Arten von Texturen (Abb. 4.60) unterscheiden, wobei allein die Bleche mit Goss-Textur industriell im großen Maßstab gefertigt werden. Die Goss-Textur Bleche weisen eine merkliche Richtungsabhängigkeit der magnetischen Eigenschaften auf. Abbildung 4.60: Texturarten bei Elektroblechen. a) Goss-Textur, b) Würfeltextur, c) Würfelflächentextur. Weichmagnetische Ferrite Ferrimagnetische Werkstoffe mit kleiner Koerzitivfeldstärke, relativ hoher Anfangspermeabilität und hoher Stabilität (Temperatur, Zeit) setzen kleine Kristallanisotropieenergie, verschwindende Werte der Magnetostriktion und der induzierten Anisotropien sowie eine möglichst hohe Curie-Temperatur voraus. Minimale Kernverluste erfordern einen hohen elektrischen Widerstand des Werkstoffes, minimale induzierte Anisotropien und bei Ferriten mit relativ hoher Kornleitfähigkeit eine Korngrenzenisolation (Glasphasen mit hohem elektrischen Widerstand). Die stoffliche Grundlage für die weichmagnetischen Ferrite bilden die Spinelle; für Bauelemente der Höchstfrequenztechnik werden aber auch Granate und hexagonale Ferrite mit Y- bzw. W-Struktur verwendet. Die Werkstoffe werden entsprechend dem spezifischen Anwendungsfall in ihrem Eigenschaftsbild optimiert. Hauptanwendungsrichtungen für oxidische weichmagnetische Werkstoffe sind: Induktivitäten, Filterspulen und Übertrager bis l MHz für die Nachrichtentechnik und elektrische Konsumgüter, Induktivitäten, Filterspulen und Übertrager von l MHz bis 200 MHz für die Nachrichten- und Messtechnik, Mikrowellenbauelemente für die drahtlose Nachrichtentechnik, Leistungsübertrager für den Frequenzbereich von 10 bis 1000 kHz, Magnetköpfe 4.5. MAGNETISCHE EIGENSCHAFTEN 253 und Speicherbaugruppen für die Informationstechnik, Wandlersysteme für die Ultraschallerzeugung und für die drahtgebundene Nachrichtentechnik. Die wichtigsten Materialien sind Mn/Zn Ferrite und Ni/Zn Ferrite. Hartmagnetische Werkstoffe: Die hartmagnetischen metallischen Werkstoffe basieren auf Legierungen der Metalle Eisen, Kobalt und Nickel, sowie den Seltenen-Erd-Metallen. Für die Anwendung oxidischer Dauermagnete sind nur die Werkstoffe auf der Basis BaFe12 O19 und SrFe12 O19 mit hexagonaler Kristallstruktur und einachsiger Kristallanisotropie von Interesse. Abb. 4.61 zeigt die historische Entwicklung der Hartmagnetwerkstoffe an Hand der Verbesserung des Energiedichteproduktes. Abbildung 4.61: Historische Entwicklung des Energiedichteproduktes der gebräuchlichsten Hartmagnete. Im Unterschied zu den weichmagnetischen Materialien sind die hartmagnetischen Materialien dadurch gekennzeichnet, dass nach Abschalten eines hinreichend großen äußeren Magnetfeldes zur Aufmagnetisierung des Magneten die wirksame magnetische Polarisation praktisch gleich der Sättigungspolarisation ist. Erst das Anlegen eines sehr großen Gegenfeldes bewirkt eine Reduzierung der magnetischen Polarisation. Die wichtigsten magnetischen Kenngrößen der hartmagnetischen Werkstoffe sind: Remanenzinduktion Br, Koerzitivfeldstärke der magnetischen Polarisation J Hc bzw. der Induktion B Hc , Rechteckförmigkeit der Hystereseschleife, maximales Energieprodukt, hohe magnetische Ordnungstemperatur 254 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN TC , reversible Temperaturkoeffizienten der Remanenz und der Koerzitivfeldstärke. Hauptanwendungsrichtungen für hartmagnetische Werkstoffe sind: Motoren, Generatoren, Lautsprecher, Mikrophone, Telefone, Hörgeräte, elektrische Zähler, Sensoren und andere Bauteile der Messtechnik, Geräte der Haushalt- und Medizintechnik, magnetische Separatoren, magnetische Kupplungen, magnetische Spannplatten und andere Bauteile im Maschinenbau, Schwebebahnen, Hebevorrichtungen. Kriterien für die Werkstoffauswahl sind neben den bereits angeführten magnetischen Eigenschaften die Möglichkeit zur Wahl der Orientierung der magnetischen Vorzugsrichtung, die mechanischen Eigenschaften und damit seine Be- und Verarbeitbarkeit, die Korrosionsbeständigkeit sowie Verfügbarkeit und Preis. Die vorgenannten Kriterien für die Applikation von Dauermagnetwerkstoffen gelten auch für hartmagnetische Ferrite. Abbildung 4.62: Entmagnetisierungskurven der gebräuchlichsten hartmagnetischen Werkstoffe. Je nach der Größe, Form, Toleranz und Stückzahl wird zwischen werkzeuggepressten und geschnittenen Teilen gewählt. Entsprechend ihrer Herstellung unterscheidet man: • schmelzmetallurgisch hergestellte Magnete (Gussmagnete) • pulvermetallurgisch hergestellte Magnete (Sintermagnete) • plastikgebundene Magnete (gespritzt oder gepresst). In jüngster Zeit werden auch neue technologische Verfahren, wie das “Injection Moulding”, das mechanische Legieren, die Schnellerstarrung aus der Schmelze, zur Herstellung von Hartmagneten untersucht. Man unterscheidet ferner entsprechend der Ausrichtung der 4.5. MAGNETISCHE EIGENSCHAFTEN 255 Vorzugsrichtung im Gefüge (ohne oder mit Textur) isotrope Magnete und anisotrope Magnete. Nach der Möglichkeit ihrer Bearbeitbarkeit spricht man von verformbaren metallischen Hartmagneten (FeCoCr, MnAlC), nicht verformbaren metallischen Hartmagneten (Hartferriten, AlNiCo-Werkstoffe, SmCo-Legierungen sowie NdFeB-Werkstoffe). Eine Übersicht zu den Entmagnetisierungskurven (2. Quadrant der Hysteresiskurve) der gebräuchlichsten hartmagnetischen Werkstoffe ist im Abb. 4.62 gegeben. Materialien für die magnetische Aufzeichnung und Datenspeicherung Bei den magnetomotorischen Speichermedien für die Ton-, Bild- und Datenspeicherung lassen sich unterscheiden: • Partikelschichten • Metallschichten. Sie finden ihre Verwendung als Beschichtungsmaterialien für Magnetbänder in der Audiound Videotechnik, Computertechnik sowie bei Floppy-Disk und auch bei Festplatten. Die Anforderungen an das Speichermaterial ergeben sich aus der Art der Informationsspeicherung sowie der Aufzeichnungsmode. Man unterscheidet zwischen: • digitaler oder analoger Informationsspeicherung sowie • Längsaufzeichnung (“longitudinal”) (Abb. 4.63) oder Senkrechtaufzeichnung (“perpendicular”) (Abb. 4.64). • Magnetooptischer Aufzeichnung Abbildung 4.63: Digitale magnetische Datenspeicherung “longitudinal recording”. Die Senkrechtaufzeichnung setzt eine magnetische Schicht mit einer magnetischen Vorzugsachse senkrecht zur Oberfläche voraus. Die Magnetisierungsmode im Fall der Senkrechtaufzeichnung ist besonders geeignet für die digitale Dichtspeicherung. Vorteilhaft sind 256 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN hohe Werte der magnetischen Polarisation. Die Verbesserung der intensitätsmäßigen Informationsfixierung bei Längsaufzeichnung (Frequenzgang, Informationsdichte) erfordert die Bereitstellung von Materialien mit immer höheren Werten der Koerzitivfeldstärke bei kleinen, jedoch ausreichenden Werten der Magnetisierung der Schicht. Neben den unterschiedlichen Anforderungen an das Eigenschaftsbild der magnetomotorischen Speichermedien ergeben sich je nach Einsatzfall auch unterschiedliche Anforderungen an solche Kenngrößen wie Abriebfestigkeit und Reißfestigkeit der Schicht. Neben den breit angewendeten klassischen Materialien, wie modifiziertem und nicht modifiziertem γ-Fe2 O3 und CrO2 (CoOAnreicherung in der Pulveroberfläche), sind in den letzten Jahren insbesondere Ba-Ferrit und das Metallschichtband in den Mittelpunkt der Weiterentwicklung von Aufzeichnungsträgem gerückt. Ba-Ferrit-Teilchen in Form von hexagonalen Plättchen weisen im Vergleich zu konventionellen Pulvern eine kleinere Teilchengröße, ein kleineres Volumen sowie eine geringere spezifische Oberfläche auf. Durch geeignete Dotierungen ist die Koerzitivfeldstärke steuerbar. Abbildung 4.64: Digitale magnetische Datenspeicherung “perpendicular recording”. Metalldünnschichtbänder (Filme) können durch Vakuumabscheidung, elektrolytische Abscheidung, chemische Abscheidung sowie ,,Sputtern“ hergestellt werden. Im Unterschied zu den Partikelschichten lassen sich auf Grund des Wegfalls des Binders höhere Werte der Sättigungsmagnetisierung erreichen. Die magnetischen Kenndaten, wie Hc , Größe der magnetischen Anisotropie, Sättigungsmagnetisierung sowie die Lage der magnetischen Vorzugsrichtung, sind abhängig von der chemischen Zusammensetzung des Filmes und den technologischen Bedingungen bei der Herstellung. Breit untersucht wurden CoNi-, CoNiCr-Filme sowie CoP-, CoPt-Filme für die magnetische Längsaufzeichnung und CoCr-, CoNiCr-, CoCrM (M=Ti, Ta, W)-Filme sowie CoPtTaBO für die Senkrechtaufzeichnung (Dichtspeicherung). Die Größe der Koerzitivfeldstärke liegt im Bereich von 30 - 90 kA/m. Ein unterschiedliches digitales Speicherverfahren erfolgt auf der Basis von magnetooptischen Speichermaterialien. Eine Reihe von magnetischen Materialien bieten auf Grund ihrer 4.5. MAGNETISCHE EIGENSCHAFTEN 257 ausgezeichneten magnetooptischen Eigenschaften Möglichkeiten für einen Einsatz in der Datenspeicherung (optische Speicher) und bei einer Reihe weiterer Baugruppen, wie Displays, Druckköpfe in optischen Druckern u.a. Das Lesen bzw. die Wiedergabe der Information erfolgt auf Basis magnetooptischer Effekte (Kerr-Effekt, Faraday-Effekt). Eine digitale Informationsspeicherung wird durch eine Folge von magnetischen Bereichen mit unterschiedlicher Richtung der Magnetisierung realisiert. Die Magnetisierungsumkehr, die dem Schreibprozess und dem Löschvorgang zu Grunde liegt, wird durch thermomagnetische Prozesse bewirkt. Hierzu wird mittels einer Lichtquelle eine lokale Aufheizung des Materials in Gegenwart eines äußeren Magnetfeldes vorgenommen. Die Datenspeicherung erfordert hierbei magnetische Schichten mit einer magnetischen Vorzugsrichtung senkrecht zur Schichtebene. Zu den magnetooptischen Materialien gehören polykristalline Filme (MnBi, MnCuBi, PtCo), dünne monokristalline Granat-Filme, dünne amorphe Filme (GdCo, TbFe, GdTbFe, TbDyFe u.a.). Ein ausreichendes Signal-Rausch-Verhältnis bei der optischen Wiedergabe erfordert einen hinreichend großen Faraday- bzw. Kerr Rotationswinkel. Der thermomagnetische Schreibvorgang setzt eine ausreichende Lichtabsorption und niedrige Curie-Temperaturen (Curie-Temperatur-Schreiben) bzw. Kompensationstemperaturen bei Ferrimagneten nahe der Raumtemperatur voraus (Kompensationstemperatur-Schreiben). Die Stabilität der geschriebenen Information wird durch die Größe von Hc (bis zu 2000 A/cm) nach Abkühlung der eingeschriebenen Information gegeben. 258 KAPITEL 4. MAKROSKOPISCHE EIGENSCHAFTEN Anhang A Modellbildung zur thermischen Ausdehnung Der folgende Abschnitt ist für den interessierten Leser gedacht und zeigt die mannigfachen Beiträge zur thermischen Ausdehnung fester Körper. Dieser Teil ist KEIN Prüfungsstoff für Materialwissenschaften. Isotrope thermische Ausdehnung (Volumsausdehnung) Die Volumsausdehnung eines Festkörpers wird durch den isotropen Ausdehnungskoeffizienten β beschrieben, für welchen folgender thermodynamischer Zusammenhang mit der freien Energie F besteht: ∂ ln V ∂ ln V =− β= ∂T P ∂P mit 2 ∂P = κT ∂P = −κT ∂ F = κT ∂S ∂T ∂T V ∂V ∂T ∂V T T V 1 ∂2F =V κT ∂V 2 (A.1) (A.2) Die Temperaturabhängigkeit der isothermen Kompressibilität κT wird im folgenden ge∂S genüber der Temperaturabhängigkeit von ∂V vernachlässigt. Zumindest für kleine Temperaturen ist dies eine sehr gute Näherung. Wie man aus Gl. (A.1) sieht, kann β in eine Summe von Einzelbeiträgen (Phononenbeitrag, Elektronenbeitrag, magnetische Beiträge, durch Index r gekennzeichnet) zerlegt werden, wenn die freie Energie F (und damit auch die Entropie S) des Festkörpers als Summe der entsprechenden Beiträge geschrieben werden kann. Dies ist nur dann möglich, wenn Kopplungen zwischen diesen Beiträgen (z.B. Elektron - Phonon Kopplung) vernachlässigbar sind. X X ∂S r r β= β = κT (A.3) ∂V T r r Oft ist es zweckmäßig, anstelle des Ausdehnungskoeffizienten β die Volumsausdehnung V anzugeben: 259 260 ANHANG A. MODELLBILDUNG ZUR THERMISCHEN AUSDEHNUNG V − V0 V = = V0 Z T β dT = X T0 rV (A.4) r Es ist sinnvoll, für das Referenzvolumen V0 das Volumen bei T=0 zu wählen (d.h. T0 =0). Dann verschwinden per definitionem alle Beiträge zur thermischen Ausdehnung bei T=0. Anisotrope thermische Ausdehnung In anisotropen Festkörpern variiert nicht nur das Volumen, sondern auch die Gestalt mit der Temperatur und die thermische Ausdehnung wird durch einen Ausdehnungstensor βij beschrieben. Alle bisherigen Betrachtungen bleiben unter der Voraussetzung eines isotropen Spannungszustandes gültig. Der Ausdehnungstensor βij ist normalerweise durch (A.5) βij = βji = (∂ij /∂T )σ definiert. Dabei ist ij eine Komponente des symmetrischen Anteils des Lagrange- Verzerrungstensors. Der asymmetrische Anteil hat für die freie Energie des Festkörpers keine Bedeutung, denn dieser bedeutet nur eine Drehung. Grüneisen-Parameter Die dimensionslose Grüneisenfunktion Γr (V, T ) ist definiert als: Γr (T, V ) = βrV κT CVr CVr oder β r = (κT /V )Γr (T, V )CVr ∂ 2 F ∂S r = −T =T ∂T V ∂T 2 V (A.6) (A.7) CVr ist die spezifische Wärme des Beitrags r bei konstantem Volumen. Aus der Definitionsgleichung (A.6) und Gl. (A.3) folgt: 1 ∂S r r Γ (T, V ) = r (A.8) CV ∂ ln V T Die Bedeutung der Definition (A.6) liegt darin, daß in vielen Fällen die Grüneisenfunktion Γr (T, V ) näherungsweise eine Konstante ist (Grüneisenparameter). Wir wollen uns nun überlegen, unter welchen Bedingungen diese Funktion unabhängig von Volumen und Temperatur ist: Wenn man die Energien der Zustände i des Subsystems r mit Eir bezeichnet, so erhält man aus den Gleichungen (A.6)- (A.9) die Beziehungen (A.10), (A.11), (A.12). F r = −kT ln Z r Zr = X e −Eir kT (A.9) i CVr = hEir (Eir − hEir i)i kT 2 (A.10) 261 ∂S r h(dEir /dV )(Eir − hEir i)i =− ∂V T kT 2 Γr (T, V ) = − V h(dEir /dV )(Eir − hEir i)i hEir (Eir − hEir i)i (A.11) (A.12) Hier sind die hEir i definiert als: hEir i = (1/Z r ) X Eir e −Eir kT (A.13) i Die im allgemeinen temperatur- und volumsabhängige Funktion Γr (T, V ) ist also eine KondE r stante, wenn EVr dVi unabhängig vom Zustand i ist: i V dEir =K Eir dV (A.14) Γr (T, V ) = −K (A.15) Denn dann ergibt sich Gl. (A.12) zu: Quasiharmonische Näherung und Debye Modell für den Phononenbeitrag zur isotropen thermischen Ausdehnung Die harmonische Näherung für die Gitterschwingungen eines Kristalls macht die Beschreibung durch nicht miteinander wechselwirkende Phononen möglich. Allerdings gibt es nur in anharmonischen Modellen Gitterschwingungsbeiträge zur thermischen Ausdehnung. In einer ersten Näherung zur Berücksichtigung der anharmonischen Effekte verwendet man die quasiharmonische Theorie, welche eine Volumsabhängigkeit der Eigenfrequenzen ωj =ωj (V ) (bzw. ωj =ωj (λ ) im anisotropen Fall) annimmt. X (i) (A.16) Eiphon = (nj + 1/2)~ωj (V ) j Die Grüneisenfunktion γ phon (T, V ) ist konstant, wenn alle Eigenfrequenzen ωj (V ) in gleicher Weise von V abhängen: dωj (V ) ωj (V ) = · const dV V (A.17) Dann gilt nämlich für Eiphon die Gl. (A.14) und Γphon (T, V ) = −const (A.18) Mit Annahme (A.17) ergibt sich also aus Gl. (A.6) β phon = χT phon phon Γ CV = K phon CVphon V (A.19) 262 ANHANG A. MODELLBILDUNG ZUR THERMISCHEN AUSDEHNUNG mit einem konstanten Koeffizienten K phon . Durch die Beschreibung der Gitterschwingungen mit dem Debye Modell ergibt sich mit Gl. (A.4) und Gl. (A.19): Z 3 z x3 dx ΘD phon phon ) D(z) = 3 V = 3Γ κT kB T D( (A.20) T z 0 ex − 1 0.006 6e-5 0.005 α 4e-5 ∆l/l 0.004 2e-5 0T 5T 0.003 100 105 110 0 115 T [K] 0.002 YbCd6 θD = 194 K θD = 250 K 0.001 Tphas 0.000 0 50 100 150 200 250 300 T [K] Abbildung A.1: Temperaturabhängigkeit der thermische Ausdehnung von YbCd6 . Die durchgezogenen Linien sind ein Fit nach Glchg. A.20; der einzige frei wählbare Parameter ist ΘD . Diese Verbindung zeigt bei etwa 110 K einen Phasenübergang, bei dem sich auch die Stei” figkeit“ des Gitters wesentlich ändert. Für hohe Temperaturen erscheint YbCd6 steifer. Klassischer Beitrag der Bandelektronen zur isotropen thermischen Ausdehnung Da die Einteilchenenergien j der Bandelektronen auch vom Volumen des Festkörpers abhängen, ergibt sich auch daraus ein Beitrag zur thermischen Ausdehnung. Wenn die j analog zu den ~ωj der Phononen wieder in gleicher Weise von V abhängen, ergibt sich: χT el el (A.21) γ CV = K el CVel V Für den dreidim. Potentialtopf ist diese Bedingung exakt erfüllt (mit γ el =2/3): β el = Ei = En1 n2 n3 = (~2 /2m)(n21 + n22 + n23 )V −2/3 (A.22) V dEi = −(2/3) (A.23) Ei dV Wenn man annimmt, daß Gl. (A.21) auch für Bandelektronen gilt, so erhält man mit CVel ∝ D(EF )T den bekannten T-Beitrag zum Ausdehnungskoeffizienten β (bzw. T 2 -Beitrag zu V ): 2 el (A.24) V ∝ D(EF )T 263 D(EF ) bezeichnet die Zustandsdichte der Bandelektronen an der Fermienergie. Die thermische Ausdehnung von Festkörpern hängt in manchen Fällen noch ab von • Bandmagnetismus • Spinfluktuationen • lokalen magnetischen Momenten. Eine detaillierte Beschreibung dieser Beiträge erfordert aber genaue Kenntnis des magnetischen Verhaltens der untersuchten Systeme.