Skript zur Vorlesung Physik 1 für Maschinenwesen Wintersemester 2010/2011 Prof. Dr. Peter Müller-Buschbaum Technische Universität München Lehrstuhl für Funktionelle Materialien Physik Department E 13 II Physik 1 für Maschinenwesen Zeit und Ort: Do 17:15 - 18:45, MW 2001 Literatur Paul A. Tipler, Gene Mosca, Dietrich Pelte, Physik für Wissenschaftler und Ingenieure, 6. Aufl. Spektrum Akademischer Verlag 2009, ISBN-10: 382741945X (79,95 Euro) Ekbert Hering, Rolf Martin, Martin Stohrer, Physik für Ingenieure, 10. Aufl. Springer Verlag 2007, ISBN-10: 3540718559 (44,95 Euro) Frank L. Pedrotti, Leno S. Pedrotti, Werner Bausch, Hartmut Schmidt, Optik für Ingenieure: Grundlagen, 4. Aufl. Springer Verlag 2007, ISBN-10: 3540734716 (74,95 Euro) Übungen Übung 1: Mo 12:30 - 14:00, Raum PH HS2 Übung 2: Mi 13:15 - 13:45, Raum MW 0350 Übung 3: Mi 14:00 - 15:30, Raum MI HS2 Übung 4: Do 08:15 - 09:45, Raum MW 0350 Übung 5: Do 10:15 - 11:45, Raum MW 1801 Übung 6: Fr 09:00 - 10:30, Raum CH 26411 - jede Woche ein Blatt mit Aufgaben Blatt zum Download im Internet Besprechung der Aufgaben in der darauffolgenden Woche Übungsaufgaben als Training für die Klausur und Verständnis Sprechstunden Koordinatorsprechstunde: Di 17:00 - 19:00, Raum PH 3734 Nachhilfesprechstunde: Mi 15:00 - 17:00 und Fr 15:00 - 17:00, Raum PH 3742 Dozentensprechstunde: nach Vereinbarung, Raum PH 3278 Internetseiten http://www.e13.physik.tu-muenchen.de/Muellerb/index.php http://av.ph.tum.de/ c Lehrstuhl E13, TUM, 2010 III Klausur im Anschluss an die Vorlesungszeit - weitere Informationen später (nicht-programmierbarer Taschenrechner) c Lehrstuhl E13, TUM, 2010 Inhaltsverzeichnis 1 Einleitung 1.1 Naturwissenschaften . . . . . . . 1.2 Was ist Physik? . . . . . . . . . . 1.2.1 Gebiete der Physik . . . . 1.2.2 Physikalische Größen . . . 1.3 Messgenauigkeiten und Messfehler 1.4 Koordinatensysteme . . . . . . . 1.5 Grundlagen der Mechanik . . . . 1.5.1 Newton ’sche Axiome . . . 1.5.2 Verschiedene Kräfte . . . . 1.5.3 Überlagerung von Kräften 1.5.4 Reibungskräfte . . . . . . 1.5.5 Bezugssysteme . . . . . . 1.5.6 Energieerhaltung . . . . . 1.5.7 Impulserhaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 2 2 3 7 11 13 16 17 21 24 26 27 30 2 Schwingungen und Wellen 2.1 Schwingungen . . . . . . . . . . . . . . . . . . 2.1.1 Harmonische Schwingung . . . . . . . . 2.1.2 Überlagerung von Schwingungen . . . . 2.1.3 Harmonische Schwingung mit Reibung 2.1.4 Erzwungene Schwingung . . . . . . . . 2.1.5 Gekoppelte Schwingung . . . . . . . . 2.2 Wellen . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Harmonische Wellen . . . . . . . . . . 2.2.2 Überlagerung von Wellen . . . . . . . . 2.2.3 Überlagerung von Wellen . . . . . . . . 2.2.4 2d Wellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 32 32 36 39 44 50 53 53 55 56 58 . . . . . . 60 60 61 61 63 65 67 3 Akustik 3.1 Schallwellen . . . . . . . . . . 3.1.1 Schalldruck . . . . . . 3.1.2 Schalldruckpegel . . . 3.2 Harmonischer Schallgeber . . 3.3 Fourier-Analyse und -Synthese 3.4 Doppler Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . INHALTSVERZEICHNIS 3.5 Modulationsverfahren . . . . . 3.5.1 Amplitudenmodulation 3.5.2 Frequenzmodulation . 3.5.3 Phasenmodulation . . V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Optik 4.1 Eigenschaften des Lichts . . . . . . . . . . . . . . . 4.1.1 Farben . . . . . . . . . . . . . . . . . . . . . 4.1.2 Lichtquellen . . . . . . . . . . . . . . . . . . 4.2 Ausbreitung von Licht . . . . . . . . . . . . . . . . 4.2.1 Beugung . . . . . . . . . . . . . . . . . . . . 4.2.2 Reflektion . . . . . . . . . . . . . . . . . . . 4.2.3 Fermatsches Prinzip . . . . . . . . . . . . . 4.2.4 Snelliussches Brechungsgesetz . . . . . . . . 4.2.5 Totalreflexion . . . . . . . . . . . . . . . . . 4.2.6 Umkehrung des Lichtweges . . . . . . . . . . 4.2.7 Planparallele Platte . . . . . . . . . . . . . . 4.2.8 Ablenkung durch ein Prisma . . . . . . . . . 4.3 Geometrische Optik . . . . . . . . . . . . . . . . . . 4.3.1 Abbildung durch Spiegel . . . . . . . . . . . 4.3.2 Abbildung durch Linsen . . . . . . . . . . . 4.3.3 Linsensysteme . . . . . . . . . . . . . . . . . 4.3.4 Optische Instrumente . . . . . . . . . . . . . 4.3.5 Abbildungsfehler . . . . . . . . . . . . . . . 4.4 Optik des Auges . . . . . . . . . . . . . . . . . . . . 4.4.1 Akkommodation des Auges . . . . . . . . . 4.4.2 Kurzsichtigkeit . . . . . . . . . . . . . . . . 4.4.3 Weitsichtigkeit . . . . . . . . . . . . . . . . 4.5 Optische Phänomene . . . . . . . . . . . . . . . . . 4.5.1 Rayleigh-Streuung . . . . . . . . . . . . . . 4.5.2 Lichtstreuung an ausgedehnten Objekten . . 4.5.3 Luftspiegelung . . . . . . . . . . . . . . . . . 4.6 Licht als Anregung des elektromagnetischen Feldes 4.6.1 Elektrisches Feld . . . . . . . . . . . . . . . 4.6.2 Magnetische Flussdichte . . . . . . . . . . . 4.6.3 Elektromagnetische Wellen . . . . . . . . . . 4.6.4 Energiedichte und Energiefluß . . . . . . . . 4.6.5 Polarisation . . . . . . . . . . . . . . . . . . 4.6.6 Polarisation durch Reflektion und Brechung 4.7 Wellenoptik . . . . . . . . . . . . . . . . . . . . . . 4.7.1 Interferenz von Wellen . . . . . . . . . . . . 4.7.2 Der ideale Doppelspalt . . . . . . . . . . . . 4.7.3 Der Einzelspalt . . . . . . . . . . . . . . . . 4.7.4 Der reale Doppelspalt . . . . . . . . . . . . 4.7.5 Mehrfachspalte . . . . . . . . . . . . . . . . 4.7.6 Das optische (Strich-)Gitter . . . . . . . . . c Lehrstuhl E13, TUM, 2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 71 71 71 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 72 73 75 80 81 81 82 83 84 85 85 86 88 89 90 98 99 101 105 106 107 107 109 109 111 114 115 115 117 118 120 121 125 132 133 136 138 141 143 146 INHALTSVERZEICHNIS 4.7.7 4.7.8 4.7.9 VI Reflektionsgitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 Interferenz an dünnen Schichten . . . . . . . . . . . . . . . . . . . . 149 Auflösungsvermögen . . . . . . . . . . . . . . . . . . . . . . . . . . 156 5 Nichtlineare Optik 5.1 Grundlagen der nichtlinearen Optik . . . . . . 5.1.1 Anharmonischer Oszillator . . . . . . . 5.1.2 Elektrische Suszeptibilität . . . . . . . 5.1.3 Elektromagnetische Welle im Medium . 5.2 Nichtlineare optische Effekte . . . . . . . . . . 5.2.1 Frequenzverdopplung . . . . . . . . . . 5.2.2 Phasenkopplung . . . . . . . . . . . . . 5.2.3 Summenfrequenzmischung . . . . . . . 5.2.4 Parametrischer Prozess . . . . . . . . . 5.2.5 Prozesse dritter Ordnung . . . . . . . . . . . . . . . . . . 158 158 158 161 162 163 163 165 166 167 167 A Ergänzung zu elektromagnetischen Wellen A.0.6 Maxwellsche Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . A.0.7 Elektromagnetische Welle im Vakuum . . . . . . . . . . . . . . . . A.0.8 Ausbreitung elektromagnetischer Wellen . . . . . . . . . . . . . . . 169 169 170 172 B Mathematische Ergänzung B.1 Differenzialgleichungen (DGLs) . . . . . . . . . . . . . . B.1.1 Definitionen . . . . . . . . . . . . . . . . . . . . . B.1.2 Integrierbare DGLs . . . . . . . . . . . . . . . . . B.1.3 Lineare, homogene DGLs, verschiedene Nullstellen B.1.4 Lineare, homogene DGLs, mehrfache Nullstellen . B.1.5 Lineare, homogene DGLs, komplexe Nullstellen . B.1.6 Lineare, inhomogene DGLs . . . . . . . . . . . . . B.1.7 Nichtlineare DGLs, Trennung der Variablen . . . B.2 Mehrfachintegrale . . . . . . . . . . . . . . . . . . . . . . B.3 Grundbegriffe der Vektoranalysis . . . . . . . . . . . . . B.3.1 Definitionen und Beispiele . . . . . . . . . . . . . B.3.2 Eigenschaften von Differenzialoperatoren . . . . . B.3.3 Helmholtzscher Hauptsatz der Vektoranalysis . . B.3.4 Integralsätze für Vektorfelder . . . . . . . . . . . 173 173 173 174 175 177 178 180 182 183 185 185 188 189 189 c Lehrstuhl E13, TUM, 2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kapitel 1 Einleitung Der Mensch ist von Natur aus neugierig und trachtete schon immer danach, die ihn umgebende Welt zu verstehen. Solange es Aufzeichnungen gibt, suchen wir nach Wegen, die verwirrende Vielfalt von Ereignissen, die wie beobachten, zu ordnen. Wissenschaft ist ein Prozess der Suche nach allgemein gültigen Grundprinzipien, die Ursache und Wirkung im Universum bestimmen. Die wissenschaftliche Methode besteht darin, nachprüfbare Modelle zu formulieren, sie zu testen und miteinander zu verknüpfen. Ziel dieser Modelle ist es, die Realität zu beschreiben, zu erklären und vorauszusagen. Diese Methode umfasst das Aufstellen von Hypothesen, das Durchführen wiederholbarer Experimente und Beobachtungen und, ausgehend davon, das Aufstellen neuer Hypothesen. Die Hauptkriterien, die den Wert eines wissenschaftlichen Modells ausmachen, sind seine Einfachheit und der Grad, in dem es genutzt werden kann, um zutreffende Voraussagen zu machen oder eine breite Vielfalt beobachteter Erscheinungen zu erklären. In diesem Kapitel wollen wir beginnen, uns auf die Beantwortung einiger dieser Fragen vorzubereiten. Zunächst betrachten wir dazu die dabei verwendeten Maßeinheiten und Größenordnungen. Außerdem gehört zu jeder Messung eine Angabe der Genauigkeit. Wenn auf einer Getränkeflasche 0.7 Liter steht, bedeutet das noch lange nicht, dass diese Flasche genau 0.7 Liter enthält. 1.1 Naturwissenschaften Die Wissenschaft stellt sich uns heute in Form verschiedener getrennter Teilbereiche dar. Allerdings geht diese Aufspaltung im Wesentlichen erst auf das 19. Jahrhundert zurück. Die Aufteilung komplizierter Systeme in Teilsysteme, welche sich einfacher untersuchen lassen, ist einer der größten Erfolge der Wissenschaft überhaupt. So untersucht die Biologie beispielsweise lebendige Organismen. Die Chemie behandelt die Wechselwirkung von Elementen und Verbindungen. Die Geowissenschaften beschäftigen sich mit der Erde, und die Astronomen untersuchen das Sonnensystem, die Sterne und die Galaxien sowie das Universum als Ganzes. Die Physik ist die Wissenschaft der Materie und der Energie, des Raums und der Zeit. Sie behandelt die Prinzipien der Bewegung von Teilchen und Wellen, der Wechselwirkungen von Teilchen und der Eigenschaften von Molekülen, Atomen und Atomkernen, aber auch von größeren Systemen wie Gasen, Flüssigkeiten und Festkörpern. 1 1.2. WAS IST PHYSIK? 2 Da die Prinzipien der Physik die Grundlage für alle anderen Gebiete der Wissenschaft bilden, betrachten manche gar die Physik als die grundlegende Wissenschaft schlechthin. Heute gibt es wieder viele Grenzbereich zwischen diesen Disziplinen (wie z.B. Polymere, Biophysik), in denen Forschungsfelder Inhalte aus verschiedenen Teilbereichen umfassen (z.B. Polymere aus Physik, Chemie, Materialwissenschaften und Ingenieurwissenschaften). 1.2 Was ist Physik? Die Physik ist die Wissenschaft von den Eigenschaften und Zustandsformen, dem inneren Aufbau (“Struktur”) und den Bewegungen der unbelebten Materie, den diese Bewegungen hervorgerufenden Kräften oder Wechselwirkungen und den dabei wirkenden Gesetzmäßigkeiten. 1.2.1 Gebiete der Physik Die Gebiete, mit denen sich die Physiker Ende des 19. Jahrhunderts vorrangig beschäftigten - Mechanik, Hydrodynamik, Thermodynamik (Wärme), Akustik (Schall), Optik (Licht), Elektrizität und Magnetismus -, werden üblicherweise als klassische Physik bezeichnet. Die klassische Physik ist unumgänglich für das Verständnis der makroskopischen Welt, in der wir leben. In dem ersten Teil der Vorlesung werden die Gebiete Akustik und Optik ausführlich behandelt. Die von Albert Einstein 1905 veröffentlichte spezielle Relativitätstheorie widersprach schließlich sogar Galileis und Newtons Vorstellungen von Raum und Zeit. Zudem schlug Einstein im gleichen Jahr vor, dass die Lichtenergie quantisiert sein sollte. Licht sollte also nicht, wie in der klassischen Physik angenommen, wellenförmig und kontinuierlich sein, sondern aus diskreten Lichtpaketen bestehen. Die Verallgemeinerung dieser Erkenntnis zur Quantisierung aller Arten von Energie ist die Grundidee der Quantenmechanik. Sie führt zu zahlreichen verblüffenden und bedeutsamen Folgerungen. Die Anwendung der speziellen Relativitätstheorie und insbesondere der Quantentheorie auf mikroskopische Systeme wie Atome, Moleküle und Kerne wird als moderne Physik bezeichnet. Sie hat zu einem tief greifenden Verständnis von Festkörpern, Flüssigkeiten und Gasen geführt. Im zweiten Teil der Vorlesung erfolgt eine Einführung in die Gebiete der Atom-, Molekül- und Kernphysik. Experimentalphysik, so der Titel dieser Vorlesung, basiert auf physikalischen Experimenten. Ein Experiment ist die Messung von physikalischen Größen. Zur Quantifizierung dieser Messgrößen werden Maßeinheiten benötigt. Erkenntnisprozess Der physikalische Erkenntnisprozess basiert auf einer Beobachtung oder einem physikalischen Experiment. Ziel ist es, zu Gesetzmäßigkeiten und Vorhersagen zu gelangen: c Lehrstuhl E13, TUM, 2010 1.2. WAS IST PHYSIK? 3 Experiment, Beobachtung ↓ Modellvorstellung Mathematische Beschreibung (Mathematik als Sprache der Physik) ↓ Physikalische Theorie ↓ Gesetzmäßigkeiten Vorhersagen 1.2.2 Physikalische Größen Die Ergebnisse einer Messung werden in Anzahl der Einheiten einer für das Problem geeigneten Größe angegeben: G = {G} · [G] mit Zahlenwert {G} und Einheit [G]. Ein gleicher Zahlenwert ergibt mit einer anderen Einheit eine vollständig andere Größe und führt somit zu einem Fehler. Nehmen wir das Beispiel der Geschwindigkeit v = 1 m/s = 3.6 km/h. Damit ist entweder {G} = 1 und [G] = m/s oder {G} = 3.6 und [G] = km/h. Wir unterscheiden sogenannte Basiseinheiten, die durch Sätze definiert sind, und abgeleitete Einheiten, die mittels Formeln auf die Basiseinheiten zurückgeführt werden können. SI-Einheiten Mit der Einführung des Sytème International d’ Unités (in allen Sprachen mit SI abgekürzt) im Jahr 1960 endete die jahrhundertelange Suche nach einem weltweit einheitlichen System der Maßeinheiten. Die sieben SI-Basiseinheiten sind: • das Meter (m) als Einheit der Länge • das Kilogramm (kg) als Einheit der Masse • die Sekunde (s) als Einheit der Zeit • das Ampere (A) als Einheit der elektrischen Stromstärke • das Kelvin (K) als Einheit der thermodynamischen Temperatur • das Mol (mol) als Einheit der Stoffmenge • die Candela (cd) als Einheit der Lichstärke In Deutschland sind die SI-Einheiten als gesetzliche Einheiten für den amtlichen und geschäftlichen Verkehr eingeführt. Historisch gibt es andere Einheitensysteme, die sich zum Teil heute noch finden. Zu diesen zählt zum Beispiel das Cgs-System (Einheiten Zentimeter, Gramm, Sekunde, ...). Vor allem in der Atomphysik ist das Cgs-System noch gebräuchlich. c Lehrstuhl E13, TUM, 2010 1.2. WAS IST PHYSIK? 4 Es sei daran erinnert, daß Winkel im Grad- oder im Bogenmaß angegeben werden. Das Bogenmaß ist das Verhältnis des Kreisbogens über dem Winkel zum Radius des Kreises. Es ist also eine dimensionslose Zahl, es trägt den Namen Radiant (rad). Die abgeleiteten SI-Einheiten werden kohärent aus den Basiseinheiten abgeleitet. Das heißt, es werden keine Umrechnungsfaktoren benötigt. Schlichtes Muliplizieren oder Dividieren von Basiseinheiten genügt. z.B. Geschwindigkeit v: [v] = m/s Kraft F : [F ] = N (Newton) = m · kg/s2 Um die Zahlenwerte in einer praktikablen Größenordnung zu halten, wurden Vorsätze zur Bezeichnung dezimaler Vielfache und Teile von Einheiten geschaffen. Da die Grundeinheiten extrem variieren können, je nachdem, ob atomare oder kosmologische Effekte beschrieben werden, ist es üblich, den Maßeinheiten folgende SI-Vorsätze voranzustellen: SI-Vorsätze Potenz Name Zeichen Potenz Name Zeichen 1024 Yotta Y 10−1 Dezi d 1021 Zetta Z 10−2 Zenti c 1018 Exa E 10−3 Milli m 1015 Peta P 10−6 Mikro µ 1012 Tera T 10−9 Nano n 109 Giga G 10−12 Piko p 106 Mega M 10−15 Femto f 103 Kilo k 10−18 Atto a 102 Hekto h 10−21 Zepto z 101 Deka 10−24 Yokto y da Basiseinheiten: Länge Länge (= Weg x, s) - Einheit ist das (der) Meter Vor 1799 war der Meter als der 10 millionste Teil der Distanz Nordpol-Äquator definiert. Auf Grund dieser Definition wurde in Sevres ein Stab aus Platin und Iridium hergestellt und aufbewahrt, der bis 1960 als Urmeter diente. Seit 1983 wird der Meter auf die Lichtgeschwindigkeit c = 299’792’458 m/s und eine Zeitmessung zurückgeführt. Versuch # 1015: Verschiedene Längenmesser Michelson Interferometer: Eine He-Ne-Laser-Lichtquelle wird mit einer kurzbrennweitigen Linse (Mikroskopobjektiv 10x) stark divergent gemacht und damit das Interferometer beleuchtet. Das Bild besteht dann aus konzentrischen Kreisen, die über eine Mattscheibe und c Lehrstuhl E13, TUM, 2010 1.2. WAS IST PHYSIK? 5 die Fernsehprojektion gezeigt werden. Man zeigt die Empfindlichkeit durch Drehen an der Mikrometerschraube des Interferometers. Neue Kreise quellen aus der Mitte heraus oder verschwinden in ihr. Längenmessung: • • • • Maßstab Schiebelehre mit Nonius Mikrometerschraube Michelson Interferrometer Auch die Messung der Länge kann auf die Abzählung von Perioden zurückgeführt werden. Ist die Wellenlänge durch einen elementaren Prozess definiert, z.B. den Übergang eines Atoms zwischen zwei Zuständen, dann liefert, bei Wahl einer möglichst kurzen Wellenlänge als Längeneinheit, deren Abzählung entlang der zu messenden Strecke die genaueste Längenangabe. Tatsächlich ist das Meter heute auf diese Weise definiert. Hierzu wird ein jodstabilisierter Helium-Neon-Laser (Wellenlängennormal, PTB Braunschweig) benutzt. Definition: 1 m ist die Strecke, die das Licht im Vakuum in 1/299’792’458 s zurücklegt. Diese Definition ist genau auf 1/100’000’000’000’000 = 10−14 ! Also erfolgt die Definition der Länge eigentlich über eine Zeitmessung: Damit sind die Zeit und die Länge metrologisch voneinander abhängig! Die Abzählung der Perioden erfolgt mit Hilfe eines Interferometers. Beispiel typischer Längen: Durchmesser der Milchstraße ≈ 7 × 1020 m Abstand Sonne-Erde ≈ 1.5 × 1011 m Durchmesser der Sonne ≈ 1.4 × 109 m Durchmesser der Erde ≈ 12700 km großer Mensch ≈ 2 m Dicke von Papier ≈ 1 × 10−4 m Wellenlänge des sichtbaren Lichts ≈ 400 − 700 nm Abmessung eines Polymermoleküls ≈ 10 nm Atomdurchmesser ≈ 0.15 nm Durchmesser eines Atomkerns ≈ 2 − 8 fm Basiseinheiten: Zeit Zeit (t) - Einheit ist die Sekunde Die Zeit wird durch Abzählung der Perioden in periodisch wiederkehrenden Vor-gängen gemessen. Man denke etwa an die Angabe von Jahren, Tagen oder der Bruchteile von Tagen, den Stunden, Minuten und Sekunden. Periodische Vorgänge sind die Umläufe von Planeten und Monden. Die Masseinheit der Zeit, die Sekunde (s), war ursprünglich über c Lehrstuhl E13, TUM, 2010 1.2. WAS IST PHYSIK? 6 die Drehung der Erde definiert und entsprach (1/60)(1/60)(1/24) eines mittleren Sonnentags. Die Proble dieser historischen Definition sind: Die Gezeitenreibung reduziert die Rotationsgeschwindigkeit der Erde. Die Rotationsachse der Erde ändert sich mit der Zeit und die Masseverteilung der Erde ist nicht homogen (Erde ist keine homogene Kugel). Versuch # 1000: Verschiedene Zeitmesser Eine kleine Sanduhr wird im Schatten oder mit der Kamera gezeigt. Die Schwingungen zweier Stimmgabeln (440 Hz und 1700 Hz) werden über ein Mikrofon aufgenommen und mit einem Digitalzähler jeweils eine Sekunde lang mehrmals gezählt. Bei einem Sekundenpendel handelt es sich um ein Fadenpendel der Länge 0.994 m mit einer Stahlkugel als Pendelkörper, welches für eine Halbschwingung genau eine Sekunde benötigt. Man zählt 10 volle Schwingungen und misst die Zeitdauer mit einer elektronischen Stoppuhr. Die Länge des Pendels ergibt sich aufgrund der Pendellänge l und der Erdbeschleunigung g. Zeitmessung • • • • (Sekunden-)Pendel Sanduhr Sonnenuhr Quarzuhr Versuch # 1010: Periodischer Vorgang im Oszilloskop Die Schwingungsdauer einer Stimmgabel (440 Hz) wird von einem Mikrofon aufgenommen und auf ein Oszilloskop gegeben. Wiedergabe über die Fernsehanlage. Die Zeitmessung wird zur Abzählung, wenn man die Perioden einer Schwingung zählt, die in das zu messende Zeitintervall fallen. Zu jedem Zeitintervall kann man die passende Uhr wählen, deren Periode nicht zu groß sein soll, weil die Standardabweichung des Ergebnisses in der Größenordnung einer Schwingungsdauer liegt. Heute liefert die primäre Atomuhr CS 2 der PTB in Braunschweig die Sekundenintervalle der gesetzlichen Zeit (MEZ). Definition: 1 s ist die Zeit für das 9’192’631’770-fache der Periodendauer der Strahlung beim Übergang zwischen bestimmten Hyperfeinstrukturniveaus des Grundzustands von Atomen des Nuklids 133 Cs. (Stabilität ca. 2 ·10−14 ) Beispiele typischer Zeiten: Alter des Universums ≈ (11±3) Gy Alter der Erde ≈ 4.5 Gy Lebenserwartung des Menschen ≈ 2.3 × 109 s 1 Jahr = 3.16 ×107 s 1 Tag = 86400 s Menschlicher Herzschlag ≈ 1 s Licht benötigt für die Strecke Erde-Mond ≈ 1.3 s Periode einer Schallschwingung ≈ 50 µs-50 ms Periode einer Lichtschwingung ≈ 10−15 s c Lehrstuhl E13, TUM, 2010 1.3. MESSGENAUIGKEITEN UND MESSFEHLER 7 Lebenszeit eines top-Quarks ≈ 4 ×10−24 s Basiseinheiten: Masse Masse (m) - Einheit ist das Kilogramm Für die Basiseinheit Masse sind die historische und die heutige Definition identisch. Es gibt einen nationalen Kilogrammprototyp der Bundesrepublik Deutschland in der PTB in Braunschweig. 1 kg ist die Masse des internationalen Kilogrammprototyps, einem Zylinder von 39 mm Höhe und ebenfalls 39 mm Durchmesser aus einer Pt-Ir-Legierung (90% Platin, 10% Iridium, beides Edelmetalle), aufbewahrt beim internationalen Büro für Masse und Gewichte (BIPM) bei Paris. Der Schwachpunkt des SI Systems ist die Einheit der Masse, die ursprünglich als Masse eines Kubikdezimeters Wasser eingeführt wurde. Es gibt 6 Ur-kg Stücke, deren Massen sich aber, vor etwa 100 Jahren aus Platin-Iridium gegossen, aus nicht ganz einsichtigen Gründen zeitlich verändern. Inzwischen unterscheiden sie sich um 20 σ, wobei σ die Standardabweichung des Messverfahrens ist. Man sucht deshalb nach einer neuen Definition, etwa über die Masse einer bestimmten Anzahl von Goldionen, weil es von Gold nur ein Isotop gibt. Die Abzählung kann über den Ionenstrom erfolgen, es wird solange gezählt, bis ein Goldstück mit wägbarer Masse entstanden ist. Beispiele typischer Massen: Sonne ≈ 1.933 ×1030 kg Erde ≈ 5.97 ×1024 kg Vollbeladener Jumbojet ≈ 3.86 ×105 kg Automobil ≈ 1000 kg Mensch ≈ 80 kg 1 Liter Wasser = 0.99997 kg Rotes Blutkörperchen des Menschen ≈ 4 × 10−10 kg Natürliches Uranatom ≈ 3.952565 ×10−25 kg Protonmasse = 1.67263 ×10−27 kg Elektronenmasse = 9.10939 ×10−31 kg 1.3 Messgenauigkeiten und Messfehler Die Aussagen der Naturwissenschaften beruhen auf Beobachtungen, den Messungen. Messwerte können Resultate der Ablesung von Instrumenten oder Skalen sein oder Ergebnisse der Abzählung irgendwelcher Ereignisse. In jedem Fall muss das Ergebnis einer einzigen Mes- c Lehrstuhl E13, TUM, 2010 1.3. MESSGENAUIGKEITEN UND MESSFEHLER 8 sung - ohne jede weitere Information - als zufällig angesehen werden. Generell ist jede Messung mit Fehlern behaftet. Daher bedarf es einer Fehlerangabe. Wir unterscheiden systematische Fehler und statistische Fehler. Systematische Fehler Als systematischer Fehler wird die Abweichung einer Messung oder Experimentreihe von ihrem Erwartungswert bezeichnet. Im Gegensatz zu den (bei Messungen nie ganz vermeidbaren) zufälligen (statistischen) Fehlern, die oft einer Normalverteilung folgen, haben systematische Fehler Schlagseite, bewirken also einen zu hohen oder zu niedrigen Messwert. Die Ursachen systematischer Fehler können vielfältig sein und werden meist folgendermaßen klassifiziert: • Instrumentelle Einflüsse (z. B. ungenaue Justierung bzw. Kalibrierung, lockere Teile am Messgerät, thermische Ausdehnung von Metallteilen, Parallaxefehler, RichtungsAbweichung von Achsen) • Persönliche Fehler (z. B. Reaktionszeit bei Stoppung von Zeiten, einseitige kleine Zielfehler, schräges Ablesen auf Thermometerskala); bei Befragungen Antwortverzerrungen • Umwelteinflüsse (z. B. Refraktion, unsymmetrische Wirkungen von Temperatur oder Wind, Vibrationen im Untergrund) • Sonstige (unerklärliche, nicht-deterministische) Effekte. Statistischer Fehler Zufallsfehler oder statistische Fehler sind Messfehler, die eine Zufallsvariation in den Messwerten bewirken. Aufgrund ihrer Zufälligkeit sind sie in Größe und Richtung unvorhersagbar, und ihr Erwartungswert ist 0. Alle realen Messungen unterliegen dem Einfluss durch Zufallsfehler. Grundlage der Fluktuationen sind unvermeidliche Wechselwirkungen der Umgebung mit dem gemessenen Prozess, Ungenauigkeiten des Messgerätes, indirekte Messung, Ungenauigkeit bei der Ablesung oder bei der Interpretation der Ablesungen. Das arithmetische Mittel x̄ (auch Durchschnitt) ist ein rechnerisch bestimmter Mittelwert. Es ist so definiert für n Messungen mit den Messwerten xAi n 1 X x̄ = xAi n i=1 . (1.1) Das arithmetische Mittel mittelt also bzgl. der arithmetischen Verknüpfung Summe. Anschaulich bestimmt man mit dem arithmetischen Mittel aus Stäben verschiedener Länge einen mit einer durchschnittlichen oder mittleren Länge. Soll ein Zahlenwert eine Situation charakterisieren, dann muß auch die Wahrscheinlichkeit angegeben werden, bei Wiederholung den gleichen oder einen ähn-lichen Wert zu c Lehrstuhl E13, TUM, 2010 1.3. MESSGENAUIGKEITEN UND MESSFEHLER 9 erhalten. Diese Information liefert die Standardabweichung. Um den Betrag des zufälligen Fehlers abzuschätzen, mit dem die Einzelmessung behaftet sind, berechnet man die Standardabweichung s der Stichprobe v u u s=t n 1 X (xAi − x̄)2 n − 1 i=1 . (1.2) Die korrekte Angabe des Messergebnises bei wenigen Einzelmessungen setzt sich also aus dem Mittelwert und der Standardabweichung zusammen s x = x̄ ± √ n . (1.3) Beispiel: Möwenzählen Wir betrachten durch ein Fernglas den Himmel und zählen die Möwen in unserem Sichtfeld zu einer festen Zeit. Die Abbildung 1.1 zeigt das Sichtfeld als schwarzen Kreis zu vier Zeitpunkten. Von links nach rechts und oben nach unten befinden sich 4, 3, 5 und 6 Möwen innerhalb des Kreises. Damit ist der Mittelwert x̄ =4+3+5+6/4= 4.5 und die Standardabweichung s = 1.3. Abbildung 1.1: Beispiel für die Bestimmung eines experimentellen Mittelwerts und der Standardabweichung: Möwenzählen. Das Ergebnis einer Messung sollte immer der Messwert und der Messfehler mit der Einheit sein. Oft stellt man allerdings fest, dass nur der Messwert mit der Einheit angegeben wird, nicht aber der Messfehler. Dann liefert die Anzahl der verwendeten Stellen einen groben Hinweis darauf, wie groß die Unsicherheit in einer Messung ist. Jede zuverlässig bekannte Stelle mit Ausnahme der Nullen, die die Position des Dezimalkommas angeben, wird signifikante Stelle genannt. Die Zahl 2.50 besitzt drei signifikante Stellen, 2.503 dagegen vier. Die Zahl 0.00103 besitzt drei signifikante Stellen; die ersten drei Nullen sind keine, da sie lediglich die Lage des Kommas zeigen. c Lehrstuhl E13, TUM, 2010 1.3. MESSGENAUIGKEITEN UND MESSFEHLER 10 Normalverteilung Die Normal- oder Gauß -Verteilung (nach Carl Friedrich Gauß) ist ein wichtiger Typ kontinuierlicher Wahrscheinlichkeitsverteilungen. Die besondere Bedeutung der Normalverteilung beruht unter anderem auf dem zentralen Grenzwertsatz, der besagt, dass eine Summe von n unabhängigen, identisch verteilten Zufallsvariablen im Grenzwert n → ∞ normalverteilt ist. Die Normalverteilung oder Gaußfunktion ist g(x) = σ 1 √ −(x − µ)2 exp 2σ 2 2π (1.4) mit der Standardabweichung σ um das Maximum µ (arithmetischer Mittelwert). Zufallsgrößen mit Normalverteilung benutzt man zur Beschreibung zufälliger Be-obachtungsund Messfehler, zufälliger Abweichungen vom Nennmaß bei der Fertigung von Werkstücken oder der Beschreibung der Brownschen Molekularbewegung. Abbildung 1.2: Gaußkurve In der Messtechnik wird häufig eine Normalverteilung angesetzt, die die Streuung der Messfehler beschreibt. Hierbei ist von Bedeutung, wie viele Messpunkte innerhalb einer gewissen Streubreite liegen. Die Standardabweichung σ beschreibt die Breite der Normalverteilung. Berücksichtigt man die tabellierten Werte der Verteilungsfunktion, so gelten näherungsweise folgenden Aussagen: • 68 % aller Messwerte haben eine Abweichung von höchstens σ vom Mittelwert • 95 % aller Messwerte haben eine Abweichung von höchstens 2σ vom Mittelwert • 99.8 % aller Messwerte haben eine Abweichung von höchstens 3σ vom Mittelwert. Somit kann neben dem Mittelwert auch der Standardabweichung eine physikalische Bedeutung zugeordnet werden. c Lehrstuhl E13, TUM, 2010 1.4. KOORDINATENSYSTEME 1.4 11 Koordinatensysteme Alle Berechnungen werden in Koordinatensystemen durchgeführt. Die Wahl des geeigneten Koordinatensystems kann die Rechnung deutlich erleichtern. Es ist immer zu empfehlen, das Koordinatensystem an die Symmetrie der Fragestellung (z.B. Kugel - Kugelkoordinaten oder Zylinder - Zylinderkoordinaten) anzupassen. In einem ungünstig gewählten Koordinatensystem ist die Rechung komplizierter aber natürlich nicht unmöglich. Ein irgendwie gestalteter Körper in einem realen Experiment wird oft zu einem Massenpunkt idealisiert. Allgemein erfolgt die Beschreibung der Bewegung eines Massenpunktes zur Zeit t mit Hilfe des Ortsvektors ~r(t). Kartesische Koordinaten Das kartesische Koordinatensystem ist uns aus dem täglichen Leben am vertrautesten. Implizit arbeiten wir normalerweise im kartesischen Koordinatensystem. Abbildung 1.3: Kartesische Koordinaten Der Ortsvektor ~r = x~e1 + y~e2 + z~e3 (1.5) für einen beliebigen Punkt P (x, y, z) im Raum ist durch die drei Basisvektorenp~e1 , ~e2 , ~e3 und deren Vorfaktoren x, y, z gegeben. Folglich ist der Betrag des Ortsvektors r = x2 + y 2 + z 2 und der Abstand zwischen zwei Punkten (x2 , y2 , z2 ) und (x1 , y1 , z1 ) d= p (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 . Das Volumenelement ist c Lehrstuhl E13, TUM, 2010 dV = dx dy dz. (1.6) 1.4. KOORDINATENSYSTEME 12 Zylinderkoordinaten Zylinderkoordinaten oder zylindrische Koordinaten sind im Wesentlichen ebene Polarkoordinaten, die um eine dritte Koordinate ergänzt sind. Diese dritte Koordinate beschreibt die Höhe eines Punktes senkrecht über (oder unter) der Ebene des Polarkoordinatensystems und wird im Allgemeinen mit z bezeichnet. Die Koordinate ρ beschreibt jetzt nicht mehr den Abstand eines Punktes vom Koordinatenursprung, sondern von der z-Achse. Abbildung 1.4: Zylinderkoordinaten Der kartesische Ortsvektor ~r = ρ cos (Φ) ~e1 + ρ sin (Φ) ~e2 + z~e3 (1.7) für einen beliebigen Punkt P (ρ, Φ, z) in Zylinderkoordinaten im Raum ist durch die drei Basisvektoren ~e1 , ~e2 , ~e3 p und deren Vorfaktoren ρ cos(Φ), ρ sin(Φ), z gegeben. Der Betrag des Ortsvektors ist r = ρ2 + z 2 und der Abstand zwischen zwei Punkten (x2 , y2 , z2 ) und (x1 , y1 , z1 ) ist q d= ρ21 + ρ22 − 2 ρ1 ρ2 cos (Φ2 − Φ1 ) + (z2 − z1 )2 . Das Volumenelement ist (1.8) dV = dρ ρdΦ dz. Kugelkoordinaten Kugelkoordinaten sind im Wesentlichen ebene Polarkoordinaten, die um eine dritte Koordinate ergänzt sind, und zwar in der gleichen Art und Weise, nämlich indem man einen Winkel υ ∈ [0, π] für die dritte Achse spezifiziert. Diese dritte Koordinate beschreibt den Winkel zwischen dem Vektor ~r zum Punkt P und der z-Achse. υ ist genau dann null, wenn P auf der z-Achse liegt. Der kartesische Ortsvektor ~r = r sin (υ) cos (ϕ) ~e1 + r sin (υ) sin (ϕ) ~e2 + r cos (υ) ~e3 (1.9) für einen beliebigen Punkt P (ϕ, υ, r) in Kugelkoordinaten im Raum ist durch die drei Basisvektoren ~e1 , ~e2 , ~e3 und deren Vorfaktoren gegeben. Der Betrag des Ortsvektors ist |~r| = r und das Volumenelement ist dV = dr rdυ r sin(υ) dϕ. c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 13 Abbildung 1.5: Kugelkoordinaten n-dimensionale Polarkoordinaten Es lässt sich auch eine Verallgemeinerung der Polarkoordinaten für einen n-dimensionalen Raum mit kartesischen Koordinaten xi ∈ R für i = 1, . . . , n angeben. Dazu führt man für jede neue Dimension einen weiteren Winkel ϑi ∈ (0, π) ein, der den Winkel zwischen dem Vektor x ∈ Rn und der Koordinate xi+2 für i = 1...n − 2 angibt. Eine Umrechnungsvorschrift von diesen Koordinaten in kartesische Koordinaten wäre dann: x1 x2 x3 x4 .. . = r cos ϕ sin ϑ1 sin ϑ2 = r sin ϕ sin ϑ1 sin ϑ2 = r cos ϑ1 sin ϑ2 = r cos ϑ2 .. . xn−1 = xn = ··· ··· ··· ··· sin ϑn−3 sin ϑn−3 sin ϑn−3 sin ϑn−3 .. . sin ϑn−2 sin ϑn−2 sin ϑn−2 sin ϑn−2 r cos ϑn−3 sin ϑn−2 r cos ϑn−2 Diese Polarkoordinaten gehen für den Fall n = 2 in die gewöhnlichen Polarkoordinaten und für n = 3 in die Kugelkoordinaten über. 1.5 Grundlagen der Mechanik Die kinematischen Größen Ortsvektor, Geschwindigkeit und Beschleunigung sind Vektoren (Betrag + Richtung) und können wie üblich addiert werden. Dies gilt unter der Annahme, dass die Bewegung in der einen Richtung keinen Einfluß hat auf die Bewegung in den dazu senkrechten Richtungen. Ortsvektor ~r(t) Geschwindigkeit ~v (t) = d~r(t) ˙ =~r(t) dt c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK Beschleunigung ~a(t) = 14 d~v (t) d2~r(t) ¨ = =~r(t) dt dt2 Abbildung 1.6: Die Bewegung des Massenpunktes ist eine zeitliche Veränderung der Lage im Raum. Der Massenpunkt beschreibt eine Bahnkurve ~r(t) (”Weg-Zeit-Funktion”) Der Koordinatenursprung (math. Kürzel KOU) bezeichnet den Punkt in einem Koordinatensystem, an welchem alle Koordinaten den Wert Null annehmen. Er wird deshalb häufig auch als Nullpunkt bezeichnet. Der durch einen Ortsvektor beschriebene Aufpunkt kann durch die Koordinaten eines Koordinatensystems beschrieben werden, wobei der Bezugspunkt des Ortsvektors normalerweise in den Koordinatenursprung gelegt wird. Freier Fall Der freie Fall ist ein Beispiel für konstante Beschleunigung bei einer eindimensionalen Bewegung. In diesem Beispiel wird die Beschleunigung durch die Erdbeschleunigung g verursacht. Versuch # 1055: Freier Fall im Vakuum Das Versuchsgerät ist eine etwa 1 m lange, 5 cm dicke Glasröhre, in der sich ein Kupferpfennig und eine Flaumfeder befinden. Die Röhre ist mit einem verschließbaren Stutzen versehen, der den Anschluss an eine Vakuumpumpe ermöglicht. Man lässt zunächst die beiden Gegenstände in der Röhre möglichst frei fallen, indem man die Röhre senkrecht hält und dann rasch umdreht. Man hört den Pfennig auf dem Röhrenboden aufschlagen und sieht die Feder nach unten schweben. Nach dem Auspumpen wiederholt man den Versuch. Ein Nacheilen der Feder ist jetzt praktisch nicht mehr festzustellen. Achtung: Mit der Definition einer y-Achse, die positiv nach oben gerichtet ist, ist die Erdbeschleunigung nach unten gerichtet ay = −g . (1.10) vy = v0y − gt (1.11) Damit folgt für die Geschwindigkeit c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 15 und für den Weg gt2 . (1.12) 2 Es gibt also keine Masseabhängigkeit! Alle Körper fallen gleich schnell (im Vakuum). Bedingt durch die Luftreibung entstehen jedoch deutliche Unterschiede beim freien Fall verschiedener Körper (siehe zum Beispiel Fallschirmspringer). y = y0 + v0y t − Kreisbewegung Die Kreisbahn kann als eindimensionale Bewegung aufgefasst werden. Im Gegensatz zur Bewegung auf geradliniger Bahn zeigen die Vektoren für Beschleunigung und Geschwindigkeit auf der Kreisbahn nicht in die gleiche Richtung. Im wichtigen Spezialfall konstanter Winkelgeschwindigkeit zeigt der Vektor der Beschleunigung vom Bahnpunkt in radialer Richtung zum Kreismittelpunkt, während die Tangente im Bahnpunkt die Richtung der Bahngeschwindigkeit zeigt. Wir betrachten die Bewegung eines Massenpunktes m auf einer Kreisbahn mit dem Radius r. Abbildung 1.7: links: Bewegung des Ortsvektors auf einem Kreis mit dem Radius r. rechts: gleichförmige Kreisbewegung. Ist bei einer Bewegung die Normalkomponente der Beschleunigung konstant, so handelt es sich um eine Kreisbewegung. Diese Kreisbewegung wird durch den Radius r und den Winkel ϕ(t) beschrieben. Die Winkelgeschwindigkeit ist dann d ϕ(t) dt (1.13) d ω(t) d2 ϕ(t) = . dt dt2 (1.14) ω(t) = und die Winkelbeschleunigung α(t) = Ist gleichzeitig die Tangentialkomponente gleich Null, spricht man von einer gleichförmigen Kreisbewegung (siehe Abbildung 1.7). Für diese ist ω(t) = dN 2π d ϕ(t) = 2π = dt dt T (1.15) mit der Anzahl der Umläufe N und der Dauer eines Umlaufs (Periode) T . Aus dieser errechnet sich die Frequenz der Kreisbewegung zu f= c Lehrstuhl E13, TUM, 2010 1 T (1.16) 1.5. GRUNDLAGEN DER MECHANIK 16 und entsprechend ist ω(t) = 2π f . 1.5.1 (1.17) Newton ’sche Axiome Kraft und Masse sind mit dem in der Kinematik behandelten Begriff der Beschleunigung, also der änderung des Bewegungszustandes in Betrag oder Richtung, ursächlich verknüpft. Dieser Zusammenhang wurde erstmals von Galilei erkannt und in den Newtonschen Axiomen der Mechanik formuliert. 1. Newton’sches Axiom (Trägheitsgesetz) Ein Körper bleibt in Ruhe oder bewegt sich mit konstanter Geschwindigkeit weiter, wenn keine resultierende äußere Kraft auf ihn wirkt. 2. Newton’sches Axiom (Grundgesetz der Dynamik) Ein Körper wird in Richtung der resultierenden äußeren Kraft beschleunigt, die auf ihn wirkt. Die Beschleunigung ist gemäß F~ges = m~a proportional zur resultierenden äußeren Kraft F~ges , wobei m die Masse des Körpers ist. Die resultierende äußere Kraft auf einen Körper ist die Vektorsumme aller Kräfte F~i , die auf ihn wirken X F~ges = F~i = m~a i 3. Newton’sches Axiom (Reaktionsgesetz, actio = reactio) (A) Kräfte treten immer paarweise auf. Wenn der Körper A eine Kraft FB auf den (B) Körper B ausübt, wirkt eine gleich große, aber entgegengesetzt gerichtete Kraft FA von dem Körper B auf den Körper A. Somit gilt: (B) FA (A) = −FB Einheit der Kraft ist das Newton (N): Das ist die Kraft, die benötigt wird, der Masse 1kg die Beschleunigung 1 m/s2 zu erteilen. 1N = 1kg × 1m/s2 = 1m × kg/s2 Versuch # 1095: Trägheit des gedeckten Tisches Ein kleiner Tisch ist mit einem Kaffeeservice gedeckt. Dann wird die Tischdecke mit einem Ruck unter dem Geschirr weggezogen. Das erste Newtonsche Gesetz lautet in seiner Originalformulierung: Corpus omne perserverare in statu suo quiescendi vel novendi uniformiter in directum, nisi quatenus a viribus impressis cogitur statum illum mutare. Also: Jeder Körper verharrt in seinem Zustand der Ruhe oder gleichförmigen Bewegung, sofern er nicht durch aufgeprägte Kräfte gezwungen wird, seinen Zustand zu verlassen. Durch den Ruck am Tischtuch werden dem Geschirr zwar Kräfte aufgeprägt, jedoch ist die Trägheitskraft des Geschirrs so groß, dass die kurzzeitige Beschleunigung, die das Geschirr durch die Gleitreibung am Tischtuch erhält, nicht ausreicht, um die Trägheitskraft c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 17 zu überwinden. Zieht man zu langsam am Tischtuch so überwiegt die Haftreibung der Gleitreibung. Da diese größer ist wird auch ein größerer Impuls auf das Geschirr übertragen und bewegt dieses in Zugrichtung mit. Versuch # 1080: Fallende Schere Der Versuch soll zeigen, dass in einem frei fallenden System keine Gravitationskräfte mehr wirken. Der Vorführende stellt sich dazu etwas erhöht in den Lichtstrahl einer Projektionslampe und hält eine Schere so, dass sie aufgrund der Schwerkraft zuklappt, wenn man sie öffnet. Lässt er sie aber im geöffneten Zustand fallen, so bleibt sie während des Falles unverändert. Versuch # 1105: Kraft erezugt Gegenkraft Das Versuchsgerät besteht aus zwei mit Rädern versehenen Brettern und einem langen Seil. Die beiden Wagen werden in etwa 10 m Entfernung voneinander aufgestellt. Zwei Versuchspersonen annähernd gleicher Masse stellen sich auf die Wagen (Massenausgleich eventuell mit Gewichten) und nehmen je ein Seilende in die Hand. Eine Person hält das Seil nur fest oder bindet es sich um den Leib, die andere zieht. Beide Wagen setzen sich in Bewegung und treffen sich in der Mitte. Man wiederholt den Versuch mit vertauschten Rollen mit demselben Effekt. 1.5.2 Verschiedene Kräfte Den Newton ’sche Axiomen folgend interessieren wir uns also für Kräftegleichgewichte. Hierzu wollen wir verschiedene Kräfte und deren Ursache kurz rekapitulieren: Gewichtskraft Die Gewichtskraft Fg ist die Kraft, mit der ein Körper an seiner Aufhängung zieht oder auf eine Unterlage drückt. Die Gewichtskraft ist Fg = m g (1.18) mit Fallbeschleunigung g = 9.81 m/s2 . Auf dem Mond ist die Schwerebeschleunigung geringer als auf der Erde (ca. ein Sechstel). Der Körper ist auf dem Mond also wesentlich leichter, obwohl er die gleiche Masse hat. Seine Gewichtskraft auf dem Mond entspricht der einer Masse von 16 kg auf der Erde. Zentripetalkraft Bei einer Kreisbewegung wirkt die Zentripetalbeschleunigung radial auf den Körper, der die Kresibahn durchläuft. Die (radiale) Zentripetalbeschleunigung az zwingt den Massenpunkt auf die Kreisbahn und ist nach Innen gerichtet (sonst würde die Masse m geradeaus fliegen). Bewegt sich der Körper mit der Bahngeschwindigkeit v so ist die Zentripetalbeschleunigung az = c Lehrstuhl E13, TUM, 2010 dv v dϕ = = vω dt dt (1.19) 1.5. GRUNDLAGEN DER MECHANIK 18 also v2 = r ω2 . r Die Zentripetalkraft zeigt zur Kreismitte und es ist az = v ω = Fz = m az = m v ω = m v2 = m r ω2 . r (1.20) (1.21) Federkraft Bisher waren Kräfte die Ursache für eine Änderung des Bewegungszustandes eines Körpers. Jetzt erlauben wir, dass Kräfte die Form eines Körpers ändern. Beim Dehnen einer Feder gilt das Hook’sche Gesetz F~k = −k ~r (1.22) oder für den eindimensionalen Fall Fk = −k x . (1.23) k ist die Federkonstante und hat die Dimension kg/s2 . Im Bereich der elastischen Verformung ist Fk proportional zur Auslenkung. Ist die Federkonstante groß so bezeichnen wir eine Feder als harte Feder und ist sie klein als weiche Feder. Abbildung 1.8: Feder im Ruhezustand (oben), im komprimierten Zustand (mitte) und im gedehnten Zusatnd (unten). Versuch # 1115: Dehnung eines Drahtes Etwa 2 m Kupferdraht (Durchmesser 0.22 mm) werden über zwei Umlenkrollen gelegt und der Endpunkt mit einem Markierungspfeil versehen, der mitsamt einer Skala über einen schräg gestellten Overheadprojektor abgebildet wird. An das freie Ende des Drahtes man nun immer größere Gewichte an. Bis etwa 0.7 kg ist die Dehnung des Drahtes reversibel, darüber nicht mehr. Die Zerreißgrenze wird mit dieser Anordnung nicht erreicht, wohl aber mit Stahlfederdraht (Durchmesser 0.2 mm), der bei etwa 8 kg reißt (Vorsicht!). c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 19 Gravitationskraft Alle Körper des Universums ziehen sich gegenseitig an. Die Gravitationskraft ist eine Anziehungskraft zwischen zwei Massen m1 und m2 , die in Richtung ihrer Verbindungslinie wirkt. Für große Abstände ist die Annahme der in Punkten konzentrierten Massen immer gerechtfertigt. Für kugelförmige Massen zeigt die Rechnung als einzige Bedingung, dass sie sich nicht durchdringen dürfen. Abbildung 1.9: Die Gravitationskraft wirkt in Richtung der Verbindungslinie der beiden Massen. Hier gezeigt ist das Beispiel Sonne und Erde. In vektorieller Schreibweise ist die Gravitationskraft m1 m2 ~r12 F~12 = −F~21 = −G 2 r12 |r12 | mit dem Richtungsvekor Auf der Erde ist ~ r12 |r12 | (1.24) und der Gravitationskonstante G = 6.673 · 10−11 m3 kg−1 s−2 . g= GME 2 RE . (1.25) Daraus folgt ein nominaler Wert von g = 9.81m/s2 . Da die Erde gar keine Kugelform hat, ist am Äquator g = 9.78m/s2 und am Nordpol g = 9.83m/s2 . Ebbe und Flut Regelmässig verändert sich der Meeresspiegel zweimal am Tag. Dabei steigt das Meereswasser (Flut) bis zu einem höchsten Punkt (Hochwasser) und fällt anschließend (Ebbe) wieder bis zu einem Tiefstand (Niedrigwasser) ab. • mondnahe Seite der Erde: Anziehungskraft des Mondes > Fliehkraft der Erde: Meerwasser wird zum Mond hingezogen = Flutberg (Zenitflut) • mondabgewandte Seite der Erde: Fliehkraft der Erde > Anziehnungskraft des Mondes: zweiter Wasserberg (Nadirflut) • Ebbe herrscht dann in jenen Zonen, die jeweils zwischen den genannten Flutbergen liegen. c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 20 Abbildung 1.10: Wasserstand als Funktion der Tageszeit. Nominell im Abstand von 6 Stunden wechseln sich Hoch- und Niedrigwasser ab. Coulombkraft Elektrische Ladungen erkennt man durch die Kraftwirkung zwischen ihnen. Wie in der Mechanik abstrahiert man zunächst die Ladungsverteilung zur Punktladung. Die Kraft F zwischen zwei Ladungen q1 , q2 im Abstand r12 ist FC = 1 q1 q2 . 2 4 π ε0 r12 (1.26) Hierbei ist die Influenzkonstante ε0 = 8.85 × 10−12 C2 /(Nm2 ). Abbildung 1.11: Gleichnamige Ladungen stoßen sich ab, ungleichnamige Ladungen ziehen einander an. Lorentzkraft Die Feldstärke eines statischen magnetischen Feldes zeigt sich als Kraftwirkung auf einen Pol eines magnetischen Körpers, analog zu den Kräften auf Ladungen im elektrischen oder auf Kräfte auf Massen im Gravitationsfeld. Mit der Lorentzkraft erscheint eine Eigenschaft, die keine Analogie im elektrischen oder im Gravitationsfeld hat: Auf eine in ~ mit Geschwindigkeit ~v bewegte Ladung q, also auf Ströme, wirkt die einem Magnetfeld B Lorentzkraft ~ . F~L = q ~v × B (1.27) c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 21 Die Lorentzkraft steht senkrecht zur Richtung des Magnetfeldes und senkrecht zur Richtung der Bewegung, also der Geschwindigkeit. Es ist FL = q v B sin (α) mit α dem Winkel ~ zwischen ~v und B. Die Richtung ergibt sich aus der 3-Finger-Regel (der rechten Hand): zeigt der Daumen in technische Stromrichtung (von + nach -) und der Zeigefinger in Richtung des Magnetfeldes, dann zeigt der Mittelfinger in Richtung der Lorentzkraft. Abbildung 1.12: Anwendung der 3-Finger-Regel der rechten Hand 1.5.3 Überlagerung von Kräften Ein Beispiel zur Kräftezerlegung ist die Bewegung auf einer schiefen Ebene. Es wirkt einerseits die Schwerkraft senkrecht nach unten, andererseits ist die beschleunigende Kraft in Richtung der Bahn von Interesse. Die Schwerkraft soll also in eine Komponente in Bahnrichtung, der Tangentialkraft, und eine Komponente senkrecht dazu, der Normalkraft, zerlegt werden. Die Letztere bewirkt den Andruck an die Bahn. Abbildung 1.13: Anwendung der 3-Finger-Regel der rechten Hand Je größer der Neigungswinkel der schiefen Ebene ist, desto kleiner wird die Normalkraft FN und desto größer wird die Hangabtriebskraft FH . Eine schiefe Ebene ist ein bewährtes Hilfsmittel, um schwere Gegenstände zu heben. c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 22 Beispiel: Fadenpendel Als Beispiel betrachten wir das mathematische Pendel bestehend aus einer punkt-förmigen Masse und einem unelastischen Faden der Länge l. Abbildung 1.14: Mathematisches Pendel bestehend aus einem Massepunkt m an einem unelastischen Faden der Länge l. Die Beträge der wirkenden Kräfte sind eingezeichnet. Der tiefste Punkt sei A und der Punkt maximaler Auslenkung B. Ein Massepunkt m ist an einem masselosen Faden aufgehängt der m auf eine Kreisbahn zwingt. Auf m wirkt die Gewichtskraft F~g , die in die Teilkräfte Fadenkraft F~f aden (Führungskraft) und die tangentiale Kraft F~tang aufgeteilt werden kann. F~f aden steht senkrecht zur Bewegungsrichtung und hat keinen Einfluß auf die Geschwindigkeit von m. F~f aden + F~tang ist die Reaktionskraft auf das Gewicht ms g. Für die Tangentialkomponente folgt aus dem 2. Newton’sches Gesetz unter Be-rücksichtigung der Richtung der Gewichtskraft (Minuszeichen) −ms g sin (ϕ) = mt d2 s dt2 (1.28) mit der Bogenlänge s = lϕ. Die Fadenlänge l ist zeitlich konstant, daher gilt d2 ϕ d2 s = l . dt2 dt2 (1.29) Da die träge Masse (widersetzt sich der Beschleunigung F = mt a) gleich der schweren Masse (verantwortlich für Gravitationskraft Fg = −ms g mit der Gravitationskonstante g = 9.81m/s2 ) ist, folgt die Bewegungsgleichung in Form einer Differentialgleichung (DGL) durch Einsetzen von Gleichung 1.29 in Gleichung 1.28: ϕ̈ + c Lehrstuhl E13, TUM, 2010 g sin(ϕ) = 0 l . (1.30) 1.5. GRUNDLAGEN DER MECHANIK 23 Die exakte Lösung dieser Differentialgleichung ist jedoch sehr kompliziert und nur in der Abbildung 1.15 dargestellt. Die Lösung der exakten DGL führt über elliptische Integrale zu einer Amplitudenabhängigkeit von T und zu sogenannten Solitonen. Abbildung 1.15: Übergang zu großen Auslenkungen beim Fadenpendel für verschiedene Maximalamplituden: oben) Periode T normiert auf die Periode der hamonischen Schwingung, unten) Abweichung der Schwingungsform von dem sinusförmigen Verlauf bei kleinen Auslekungen. Quelle: www.physik.unizh.ch Für eine analytische Lösung benötigen wir eine weitere Vereinfachung. Wir beschränken uns auf sehr kleine Auslenkungen ϕ des Fadenpendels, für die näherungs-weise sin (ϕ) ≈ ϕ gilt und erhalten die vereinfachte Differentialgleichung (DGL): ϕ̈ + g ϕ=0 l . (1.31) Diese Differentialgleichung hat als Lösung eine Sinus- oder Cosinusfunktion, z.B. ϕ(t) = ϕ0 cos(ω0 t + ∆) (1.32) ϕ(t) = ϕ0 sin(ω0 t + ∆) (1.33) oder mit der Anfangsauslenkung ϕ0 und der Phase ∆ abhängig von den Anfangsbedingungen (Randbedingungen für DGL). Die (Kreis-)Frequenz der Schwingung ist (siehe Abbildung 1.16) p ω0 = (g/l) (1.34) c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 24 Abbildung 1.16: Sinusförmige periodische Bewegung mit (Kreis-)Frequenz ω und zugehörige Kresibewegung. Damit ist die Schwingungsperiode zur Frequenz f gegeben durch s l 2π 1 = 2π . T = = f ω g (1.35) Wie man sieht, ist die Schwingungsperiode unabhängig von der Masse m. Für beispielsweise l = 1 m und g = 9.81 m/s2 erhält man T /2 = 1 s. Versuch # 1085: Äquivalenz von schwerer und träger Masse Zwei Fadenpendel gleicher Länge (etwa 1 m), aber sehr unterschiedlicher Massen werden etwa im Abstand von 60 cm voneinander aufgehängt. Die Pendelmassen sind zwei gleichgroße Kugeln aus Plastik bzw. Gusseisen. Ihre unterschiedliche Masse wird nach dem Versuch mit einer Waage gezeigt. Man versetzt die beiden Pendel in gegenphasige Schwingungen und beobachtet die Erhaltung der Gegenphasigkeit über mehr als 10 volle Schwingungen. 1.5.4 Reibungskräfte Als Reibung bezeichnet man den Widerstand, der in der Berührungsfläche zweier Körper bei ihren relativen Bewegungen zueinander auftritt. Ursache für diesen Widerstand sind einerseits Kräfte zwischen den Molekülen beider Flächen, andererseits räumliche Hindernisse. Vorsprünge des einen hängen in Vertiefungen des anderen Materials. Physikalisch wird die Reibung durch eine Mass zahl für die zur Bewegung erforderliche Kraft repräsentiert. Reibung verlangsamt die Bewegungen (oder dämpft eine Schwingungen). Folglich ist die Reibungskraft F~R zu der Geschwindigkeit ~v entgegengestzt und es gilt mit der Reibungskonstante ks F~R = −ks ~v . (1.36) c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 25 Man unterscheidet 3 verschiedene Arten von Reibung: Haftreibungskraft FRH Der Körper ruht. Erst wenn die angreifende Kraft größer als die Haftreibungskraft F > FRH = µH FN ist, wird der Körper beschleunigt. Gleitreibungskraft FRG Der Körper ist in Bewegung und gleitet auf einer Unterlage. In diesem Fall wirkt die Gleitreibungskraft FRG = µG FN entgegen der Bewegungsrichtung. Rollreibungskraft FRR Der Körper rollt auf einer Unterlage (Kontaktfläche zwischen Körper und Unterlage ist klein). In diesem Fall wirkt die Rollreibungskraft FRR = µR FN entgegen der Bewegungsrichtung. Versuch # 1145: Haftreibung am Steilhang Zwei Holzkeile (ca. 60 Grad), deren Steilflächen mit verschiedenen Materialien beklebt sind, werden mit diesen Flächen aufeinander gestellt. Holz auf Holz rutscht bereits bei 30 Grad, Filz auf Filz jedoch erst bei 60 Grad und Antirutschmatte auf Antirutschmatte kann man bei 60 Grad sogar noch mit 2 kg belasten. Abbildung 1.17: Mikroskopische Betrachtung der Reibung. Die mikroskopische Entstehung der Reibung ist ein komplizierter und bis heute nicht vollständig verstandener Prozeß. Normalerweise erfüllen die Reibungskoeffizient µH > µ G > µR . c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 1.5.5 26 Bezugssysteme Man kann zur Beschreibung von mechanischen Vorgängen verschiedene Bezugssysteme verwenden. Die Versuchsergebnisse werden in Koordinaten angegeben, deshalb definiert man jedes Inertialsystem durch sein Koordinatensystem. Möchte man die in einem Koordinatensystem beobachteten Werte in ein anderes Inertialsystem übertragen, dann gelten die Regeln der Galilei Transformation, wobei vor allem die Zeit eine absolute Größe ist und die Beschleunigungen invariant sind. Abbildung 1.18: Das ruhendes Bezugssystem mit S(x, y, z) und das bewegte Bezugssystem mit S(x′ , y ′ , z ′ ). Nichtinertialsysteme sind Koordinatensysteme, die sich gegenüber einem Inertialsystem beschleunigt bewegen. Die Physik erscheint einem Beobachter in einem beschleunigten System gegenüber der im ruhenden verändert. Dieses stimmt mit der Erfahrung überein, daß sich z.B. der Kaffee in einer Tasse im Auto oder im Zug unabhängig von der Geschwindigkeit wie gewohnt verhält, aber nicht beim Bremsen und in Kurven. Scheinkräfte Scheinkräfte entstehen bei der Transformation von einem Inertialsystem in ein beschleunigtes Bezugssystem. In einem mit a beschleunigtem System kann man Newton’s Bewegungsgleichung “retten”, indem man eine auf eine Masse wirkende Trägheitskraft F~t = −m ~a (1.37) einführt. Die Schein- oder Trägheitskraft ist für den Beobachter im beschleunigten System genauso real zu spüren wie alle anderen Kräfte auch. Weil sich die Erde dreht, ist ein Koordinatensystem im Labor kein Inertialsystem. Bei den meisten Versuchen fallen die dadurch verursachten Abweichungen von den für ein Inertialsystem erwarteten Ergebnissen nicht auf. Es gibt aber Versuche, in denen sie offen zutage treten. Der Beobachter im einem rotierenden Bezugssystem sieht eine Masse in Ruhe und erfährt eine Scheinkraft, die Zentrifugalkraft Ff . Diese Zentrifugalkraft ist auf einer Kreisbahn nach aussen gerichtet und wird vom Beobachter im beschleunigten System (auf der c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 27 Kreisbahn) wahrgenommen. Sie kompensiert als Scheinkarft die Zentripetalkraft der Kreisbewegung F~f = −F~z . (1.38) Abbildung 1.19: Die Zentrifugalkraft ist als Scheinkraft der Zentripetalkraft der Kreisbewegung entgegengerichtet. 1.5.6 Energieerhaltung Energie begegnet uns in verschiedenen Formen: mechanische, kinetische, potentielle, elektromagnetische, chemische, Kernenergie, Wärme, Masse, usw. Die Energie eines Systems erhöht sich, wenn an diesem System Arbeit A verrichtet wird. Arbeit wird verrichtet, wenn auf einen Körper entlang eines Weges eine Kraft wirkt Z (1.39) A = F~ · d~r . In den Naturwissenschaften sind Größen, die während des Ablaufs irgendeines Vorgangs erhalten bleiben besonders wichtig. Bei mechanischen Bewegungsabläufen sind diese Erhaltungsgrößen die Energie, der Impuls und der Drehimpuls des Systems. Energieerhaltung: • Energie kann nicht vernichtet werden oder aus dem NICHTS erzeugt werden • Energie kann in verschiedene Formen umgewandelt werden • bei jeder Umwandlung entsteht Wärme, die nicht mehr vollständig in andere Formen umgewandelt werden kann (2. Hauptsatz der Thermodynamik) Einheit der Arbeit ist das Joule: 1 J = 1 Nm = 1 Ws = 1 m2 kg/s2 1 cal = 1 g H2 O von 14.5o C auf 15.5o C (äquivalenz Arbeit und Wärme): 1 cal = 4.1868 J c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 28 Energie ist Arbeitsfähigkeit oder gespeicherte Arbeit. Besonders oft vorkommende Energieformen sind: 1. Kinetische Energie Wird ein Körper der Masse m konstant beschleunigt, dann wirkt an ihm entlang eines Weges s eine Kraft F , es wird also Arbeit an ihm verrichtet. Endet die Beschleunigung, dann endet auch die Kraftwirkung und damit die Zunahme der Arbeit. Der Körper bewegt sich nun aber mit höherer Geschwindigkeit vo . Die ihm während der Beschleunigung zugeführte Energie bleibt jetzt als kinetische Energie erhalten Ekin = mvo2 2 . (1.40) 2. Potentielle Energie Nahe der Erdoberfläche ist die Erdbeschleunigung g konstant. Zum Transport muss die konstante Kraft F = mg aufgebracht werden. Der Körper hat in der Höhe h die potentielle Energie Epot = mgh (1.41) oder bei einer Feder mit der Federkonstanten k durch Dehnen/ Zusammendrücken einer Feder um die Strecke s ks2 Epot = . (1.42) 2 Abbildung 1.20: Verschiedene Formen der Energieumwandlung: links: Stahlkugel auf Bleiplatte: bleibt liegen, rechts: Stahlkugel auf dicke Glasplatte: springt wieder hoch. Versuch # 1225: Energieumwandlung Eine Stahlkugel (ca. 5 mm Durchmesser) wird auf eine dicke Glasplatte fallen gelassen. Sie springt fast wieder in ihre Ausgangsposition zurück. Der Vorgang wiederholt sich 10 bis 20 mal. Als Gegenversuch nimmt man statt der Glasplatte eine Bleiplatte. Die Kugel springt c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 29 nur einmal hoch. Um einen senkrechten Fall zu garantieren, darf die Kugel nicht von Hand losgelassen werden. Man hängt sie daher an einen Haltemagnet, dessen Strom ausgerichtet werden kann, damit die Kugel auch nach vielen Sprüngen immer wieder auftrifft. In jedem abgeschlossenen System bleibt die Gesamtenergie, das ist die Summe aus kinetischer (Ekin ) und potentieller Energie (Epot ), erhalten. Das ist die Aussage des Energieerhaltungssatzes der Mechanik: Eges = Epot + Ekin = konst. . (1.43) Konservative Kraft Die von einer konservativen Kraft geleistete Arbeit hängt nicht von einem (speziellen) Weg ab. Es ist für zwei verschiedene wege die geleistete Arbeit gleich A1 = A2 . Daher ist die Arbeit längs eines geschlossenen Weges null Ages = A1 − A2 = 0 . (1.44) Wenn auf geschlossenen Wegen keine Arbeit zu leisten oder zu gewinnen ist, dann ist die Überführungsarbeit zwischen zwei Punkten unabhängig vom Weg. Je nach Wahl des Rundwegs wird auf manchen Teilstücken Arbeit zu leisten sein, diese wird aber auf anderen wieder gewonnen. Bei einer nicht-konservativer Kraft (z.B. Reibung) hängt die Arbeit vom speziellen Weg ab. Versuch # 1222: Energieerhaltung eines großen Pendels Eine schwere Eisenkugel (Masse 13.85 kg) wird an einem Seil von 5 m Länge gehängt, welches am örtlichen Teleskop befestigt wird. Im Abstand von etwa 1m sitzt eine Testperson auf einem Stuhl mit hoher Rückenlehne, wobei der Kopf an der Rückenlehne anliegt. Nun lenkt man die Kugel von ihrer Ruhelage bis zur Nasenspitze der Testperson aus. Nach dem Auslassen der Kugel schwingt diese erst von der Testperson weg um beim Zurückschwingen wieder kurz vor der Nasenspitze umzukehren. Beispiel: Fadenpendel Als Beispiel betrachten wir erneut das mathematische Pendel bestehend aus einer punktförmigen Masse und einem unelastischen Faden mit Länge l (siehe Abbildung 1.7). Wird das Pendel aus der Ruhelage (Punkt A) um einen Winkel bis zum Punkt B ausgelenkt, so gilt nach dem Energierhaltungssatz A B Ekin (ϕ) = Epot (ϕ) . (1.45) Der Koordinatenursprung wird in der Ruhelage des Pendels gewählt. Die kinetische Energie im Punkt A beträgt m(lϕ̇)2 A Ekin (ϕ) = (1.46) 2 und die potentielle Energie am Punkt B B Epot (ϕ) = m g l (1 − cos ϕ) . c Lehrstuhl E13, TUM, 2010 (1.47) 1.5. GRUNDLAGEN DER MECHANIK 30 Da gemäß der Energieerhaltung (Gleichung 1.43) die zeitliche Änderung der Gesamtenergie gleich null sein muß, gilt 0= dEges = m l2 ϕ̇ϕ̈ + m g l ϕ̇ sin ϕ . dt (1.48) Daraus ergibt sich die bereits bekannte Differentialgleichung für das mathematische Pendel (siehe Gleichung 1.30) g ϕ̈ + sin(ϕ) = 0 . (1.49) l 1.5.7 Impulserhaltung Der Impuls ist neben der Energie eine weitere Erhaltungsgröße. Im Gegensatz zur skalaren Energie ist der Impuls ein Vektor. Bewegt sich ein Massenpunkt mit konstanter Geschwindigkeit, dann ist sein Impuls definiert als das Produkt aus Masse und Geschwindigkeit p~ = m~v = F~ t . (1.50) Die Richtung des Impulses ist die der Geschwindigkeit und für eine infitesimale Änderung gilt d~p = d(m~v ) = d(F~ t) . (1.51) Impulserhaltungssatz: In einem abgeschlossenen System von n Massenpunkten mit dem Impuls p~i ist der Gesamtimpuls konstant, solange nur Kräfte zwischen den Massenpunkten wirken (keine äuß eren Kräfte) n X p~ges = (1.52) p~i = konst. . i=1 Die Unabhängigkeit des Impulses von der Zeit kann für komplexe Vorgänge ausgenutzt werden, indem nur der Impuls zu Beginn mit dem Impuls am Ende verglichen wird: p~anf ang = p~ende . (1.53) Beispiele hierfür sind Stöße. Ein Stoß heißt elastisch, wenn sowohl kinetische Energie wie auch Impuls erhalten bleiben, also keine Umwandlung von kinetischer Energie in Verformungsarbeit oder Wärme stattfindet. Ein Stoß heißt inelastisch, wenn nur der Impuls, nicht aber die kinetische Energie erhalten bleibt. z.B.: Körper bleiben nach dem Stoß aneinander kleben, es entsteht Verformungsarbeit. Versuch # 1240: Elastischer Stoß mit Kugeln Das Versuchsgerät besteht aus einer Reihe von hintereinander bifilar aufgehängten Stahlkugeln, die dadurch als lineare Fadenpendel fungieren. Man kann eine oder mehrere Randkugeln auslenken und auf die ruhenden Kugeln prallen lassen. Da man lauter Kugeln c Lehrstuhl E13, TUM, 2010 1.5. GRUNDLAGEN DER MECHANIK 31 gleicher Masse hat, schlagen am anderen Ende der Pendelreihe genauso viele Kugeln aus, wie zuerst ausgelenkt worden sind. Abbildung 1.21: Elastische Stöße zwischen einzelnen Pendeln einer Pendelkette. Versuch # 1205: Rückstoß einer Rakete Eine Spielzeugrakete wird von einer Rampe aus gestartet. Der Brennstoff ist komprimierte Luft, die man mit Hilfe einer Luftpumpe in die Rakete pumpt. Startet man sie mit einer solchen Luftfüllung, so fliegt sie nur etwa einen Meter weit. Füllt man sie aber zuerst mit einem Drittel mit Wasser und lädt sie dann erneut mit 10 Hüben aus der Luftpumpe, so wird beim Start die wesentlich größere Wassermasse ausgetrieben und die Rakete fliegt quer durch den Hörsaal. Mit einer Anfangsmasse m0 und einer Endmasse m0 − Rt folgt für die Geschwindigkeit der Rakete nach einem Ansatz über die Impulserhaltung mo v = vrakete−gas ln − gt . (1.54) mo − Rt Die Rakete mit einem Wasser/Luft Gemisch ist also deutlisch schneller als bei einem Antrieb mit reiner Luft, da die größere Masse von Wasser zu einem größeren Gesamtimpuls führt. c Lehrstuhl E13, TUM, 2010 Kapitel 2 Schwingungen und Wellen Bei Schwingungen und Wellen finden periodische Zustandsänderungen statt. Im allgemeinen Fall wird Energie zwischen Energiereservoirs periodisch hin- und herbewegt. Systeme, die zu einem solchen periodischen Energieaustausch fähig sind, werden Oszillatoren genannt. Die Periodizität des Energieaustauschs wird durch die Schwingungsdauer T beschrieben. Ein Energieaustauschzyklus hat dann die Frequenz f = 1/T . (2.1) Erfassen die periodischen Energieschwankungen nur einzelne schwingungsfähige Elemente, so sprechen wir von Schwingungen. Sind von den Energieschwankungen hingegen eine Vielzahl von elastisch (oder quasielastisch) gekoppelten Elementen erfasst, so ergeben sich Wellen, bei denen sich die Energiezustände periodisch durch den Raum fortsetzen. 2.1 Schwingungen Schwingungen werden in freie und erzwungene sowie in ungedämpfte und ge-dämpfte Schwingungen unterteilt. Die wichtigste Eigenschaft aller schwingungsfähigen Systeme ist die Periodizität. Periodizität bedeutet, dass bestimmte Muster in konstanten Zeitintervallen mit der Periode T wiederholt werden. Wird zum Beispiel als periodisch wiederkehrendes Muster eine y-Auslenkung aufgefasst, so gilt y(t) = y(t + T ) . (2.2) Die Auslenkung y ist zur Zeit t gleich groß wie die Auslenkung y zur Zeit t + T . Wird dem Schwingungssystem im weiteren zeitlichen Verlauf keine Energie zugeführt oder entzogen, so schwankt die Auslenkung des Oszillators zwischen zwei konstanten Maximalwerten. 2.1.1 Harmonische Schwingung In der Praxis gibt es viele Schwingungen, deren Auslenkungs-Zeit-Gesetz durch eine einfache mathematische Sinus- oder Cosinusfunktion beschrieben werden kann. Diese Schwingungen werden harmonische Schwingungen genannt. Die harmonische Schwingung 32 2.1. SCHWINGUNGEN 33 lässt sich durch den Vergleich mit der Parallelprojektion einer gleichförmigen Kreisbewegung anschaulich beschreiben. Die harmonische Schwingung bezeichnet also die Bewegungsform einer kartesischen Komponente eines Punktes, der sich auf einer Kreisbahn mit konstanter Winkelgeschwindigkeit ω = 2πf = 2π/T (2.3) bewegt (siehe Abb. 2.1). Für den Punkt auf der Kreisbahn mit Radius r gilt entsprechend für den Ort-, Geschwindigkeits- und Beschleunigungsvektor ~s = r cos ωt sin ωt , ~ν = r ω − sin ωt cos ωt , ~a = −r ω 2 cos ωt sin ωt . (2.4) Abbildung 2.1: Zusammenhang zwischen der Kreisbewegung und der harmonischen Schwingung: (oben) Punkt auf Kreisbahn und Projektion auf y-Achse und (unten) Projektionen zu verschiedenen Zeiten t auf y-Achse. Betrachten wir jetzt das Zeitverhalten einer Projektion, zum Beispiel der auf die yAchse, also die y-Komponente, so ist y = r sin (ωt) , ẏ = r ω cos (ωt) , ÿ = −r ω 2 sin (ωt) . (2.5) Berücksichtigen wir nun noch, dass unser Zeiger um einen Winkel ϕ0 vom Nullpunkt verschoben sein kann (siehe Abb. 2.2), so resultiert hieraus die Phase ϕ0 , die den Startwinkel zur Zeit t = 0 vorgibt und es folgt für die Schwingung mit der Amplitude y0 y(t) = y0 sin (ωt + ϕ0 ) . (2.6) Eine alternative Funktion zur Beschreibung einer Schwingung ist gegeben durch y(t) = y0 cos (ωt + ϕ0 ) c Lehrstuhl E13, TUM, 2010 . (2.7) 2.1. SCHWINGUNGEN 34 Ein System, das harmonische Schwingungen ausführt, wird als harmonischer Oszillator (die rücktreibende Kraft ist proportional zur Auslenkung) bezeichnet. Als Beispiel hierfür haben wir bereits das Pendel kennengelernt aber auch ein System aus Feder und Masse führt hamonische Schwingung aus. Für eine masselose Feder mit der Federkonstante k, an der eine Masse m hängt, folgte aus den Newtonschen Gesetzen F = −ky = ma = mÿ . (2.8) Die Bewegungsgleichung für die Feder ist also ÿ + ω02 y = 0 (2.9) mit der Kreisfrequenz ω02 = k . m (2.10) Abbildung 2.2: Vektorielle Darstellung im Zeigerdiagramm mit Phase ϕ0 = β und Zeiger bis zum Winkel α gedeht. Versuch 1575: Harmonischer Oszillator Es wird gezeigt, dass die Bewegung eines linearen harmonischen Oszillators mit der Projektion der Kreisbewegung auf einem Durchmesser übereinstimmt. Zu diesem Zweck lässt man eine Kreisscheibe mit einer aufgeschraubten Kugel synchron zu einer schwingenden Kugel drehen, wobei letztere an einer Feder aufgehängt ist. Beide Kugeln werden nebeneinander als Schatten projiziert, so dass man leicht sehen kann, ob die Kugeln sich gleichphasig bewegen oder nicht. c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 35 Gesamtenergie der freien, ungedämpften Schwingung Die Gesamtenergie für das Feder-Masse System ist gemäß der Energieerhaltung Eges (t) = Epot (t) + Ekin (t) (2.11) mit der potentiellen Energie Epot (t) = k y(t)2 . 2 (2.12) Mit y(t) = y0 cos (ωt + ϕ0 ) (2.13) ist dann die potentielle Energie Epot (t) = k y02 cos2 (ωt + ϕ0 ) . 2 (2.14) Abbildung 2.3: Schwingungszustände eines harmonischen Oszillators bestehend aus einer Masse und einer Feder. Für ausgewählte Zeitpunkte sind von links nach rechts die Auslenkung und die zugehörigen Energien dargestellt. Für die kinetische Energie gilt Ekin (t) = m v(t)2 . 2 (2.15) und mit v(t) = ẏ(t) = −y0 ω sin (ωt + ϕ0 ) (2.16) folgt m y02 ω 2 sin2 (ωt + ϕ0 ) . (2.17) Ekin (t) = 2 Nach Gleichung 2.10 ist m ω 2 = k, so dass für die kinetische Energie auch gechrieben werden kann k y02 sin2 (ωt + ϕ0 ) . (2.18) Ekin (t) = 2 c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 36 Einsetzen von Gleichung 2.14 und Gleichung 2.17 in den Energierhaltungssatz 2.11 liefert k y02 2 Eges (t) = cos (ωt + ϕ0 ) + sin2 (ωt + ϕ0 ) (2.19) 2 und unter Anwendung des Additionstheorems sin2 α + cos2 α = 1 folgt k y02 = konst. . (2.20) 2 Somit ist die gesamte Schwingungsenergie der freien, ungedämpften Schwingung zu jeder Zeit konstant. Die Gesamtenergie ist proportional zum Quadrat der Schwingungsamplitude y0 . Die Energie der harmonischen Schwingung entspricht zu jedem Zeitpunkt der anfänglich dem System zugeführten Energie. Eges (t) = Abbildung 2.4: Zeitlicher Verlauf der kinetischen, potentiellen und Gesamtenergie bei einer Schwingung. 2.1.2 Überlagerung von Schwingungen Nach dem Superpositionsprinzip können für die Überlagerung von Schwingungen die unterschiedlichen momentanen Auslenkungen der Einzelschwingungen zeitpunktgerecht zur momentanen Gesamtauslenkung addiert werden. Es kommt bei der Überlagerung von Schwingungen auf die Ausbreitungsrichtung dieser Schwingungen an. Spezialfälle sind senkrecht und parallel zueinander stehende Ausbreitungsrichtungen. parallele Ausbreitungsrichtung Betrachten wir die Überlagerung zweier harmonischer Schwingungen gleicher Raumrichtung und gleicher Frequenz ω (siehe Abb. 2.5) aber unterschiedlicher Amplitude x1 (t) = A1 sin (ωt) x2 (t) = A2 sin (ωt + ϕ0 ) c Lehrstuhl E13, TUM, 2010 (2.21) 2.1. SCHWINGUNGEN 37 die sich in der Phase ϕ0 unterscheiden, so resultiert erneut eine harmonische Schwingung xneu (t) = Aneu sin (ωt + ϕneu ) (2.22) Wichtige Spezialfälle sind die konstruktive und destruktive Überlagerung (Interferenz). Für die Phase ϕ0 = 0 und 2π erfolgt maximale Verstärkung, während die Phase ϕ0 = π bei gleichen Amplituden zur Auslöschung führt (siehe Abb. 2.5). ϕ0 = π/4 ϕ0 = π/4 ϕ0 = 3π/2 ϕ0 = π ϕ0 = 2π Abbildung 2.5: Die Überlagerung von zwei Schwingungen (x1 mit durchgezogener und x2 mit punkt-gestrichelter Linie gezeigt) führt je nach Phase ϕ0 zu einer konstruktiven oder destruktiven Interferenz. Bei gleichen Amplituden kommt es zur Auslöschung. Die resultierende Schwingung xneu ist mit der gestrichelten Linie gezeigt. Schwebung Werden zwei Schwingungen mit gleicher Ausbreitungsrichtung und geringem Frequenzunterschied ∆ überlagert, so entsteht eine Schwebung. x1 (t) = A cos (ω1 t) x2 (t) = A cos (ω2 t) (2.23) mit ∆ = ω2 − ω1 . Unter Anwendung eines Additionstheorems für cos(α) + cos(β) ergibt sich ω1 − ω2 ω1 + ω2 x(t) = 2 A cos t cos t 2 2 (2.24) (2.25) und in der Näherung für kleine (Kreis-)Frequenzunterschiede die neue Kreisfrequenz c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 38 ωneu = ω1 + ω2 ≈ ω1 ≈ ω2 2 (2.26) der resultierenden harmonischen Schwingung xneu (t) = 2 A cos (π fs t) cos (ωneu t) . (2.27) Die Schwebungsfrequenz ist gegeben durch fs = ω1 − ω2 2π (2.28) Wie Abb. 2.6 veranschaulicht ändert sich die Amplitude der Schwebung zeitlich. Abbildung 2.6: Überlagerung zweier Schwingungen mit geringem Frequenzunterschied (oben) zur Schwebung (unten). Da Schwebungserscheinungen sehr genaue Frequenzvergleiche ermöglichen, dienen sie zum Beispiel in der Akustik zum sauberen, d.h. schwebungsfreien Abgleich von Tonfrequenzen. Versuch 1650: Schwebung mit zwei Stimmgabeln Von zwei Stimmgabeln (je 440 Hz) ist eine durch eine kleine Zusatzmasse verstimmbar. Schlägt man beide an, so hört man Schwebungen, die noch über die Lautsprecheranlage des Hörsaals verstärkt werden können. c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 39 Lissajous-Figuren Werden je eine harmonische Schwingung in x- und y-Richtung überlagert, ergeben sich zweidimensionale Muster, die sogenannten Lissajous-Figuren. Ihre Form hängt wesentlich vom Verhältnis der beiden Frequenzen der Schwingungen ab. Die Form der Lissajous-Figuren erlaubt genaue Rückschlüsse auf Frequenz und Phasenlage der beiden Schwingungen. Bei gleichen Frequenzen (1:1) kann an der elliptischen Figur die Phasendifferenz abgelesen werden. Bei zwei fast gleichen Frequenzen (oder einem Frequenzverhältnis, das sehr nahe an einem der einfachen rationalen Verhältnisse liegt) zeigt der Schirm eines Oszilloskops eine zwar geschlossene, aber sich zeitlich verändernde Figur. So können mit hoher Empfindlichkeit kleine Frequenzunterschiede von Wechselströmen gemessen werden und Frequenzen präzise aufeinander abgestimmt werden. Abbildung 2.7: Das entstehende Bild hängt vom Verhältnis der Frequenzen ω1 : ω2 beider Komponenten und von der Phasenlage ϕ0 = δ beider Schwingungen ab. 2.1.3 Harmonische Schwingung mit Reibung Die harmonische Schwingung wird, wie jede Bewegung unter realen Bedingungen, durch Reibung gedämpft. Wird eine Schwingung durch Reibungskräfte gedämpft, so kommt die Schwingung im Laufe der Zeit zur Ruhe. Energetisch betrachtet wird ein Teil der Schwingungsenergie in thermische Energie umgewandelt, und zwar so lange, bis keine Schwingungsenergie mehr vorhanden ist. c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 40 Versuch 1590: Gedämpfte mechanische Schwingungen (Stab) Ein Rundstab wird eingespannt und dient als Oszillator. Die Dämpfung ist zum einen durch die Art der Einspannung und außerdem durch eine Wirbelstrom-dämpfung am Ende des Stabes variabel. In der Mitte des Stabes befindet sich als Schwingungsindikator ein Permanentmagnet, der in eine Spule eintaucht und die Schwingung am Oszillographen sichtbar macht. Die Reibungskraft wird als proportional zur Geschwindigkeit v angenommen. Für eine lineare Schwingung mit dieser zusätzlichen Reibungskraft FR = −ks v = −ks ẋ (2.29) und der Reibungskonstante ks folgt aus dem Kräftegleichgewicht für ein Masse-feder System mit der Federkonstante k (siehe Gleichung 2.8) F = −kx − ks ẋ = mẍ (2.30) ẍ + bẋ + cx = 0 (2.31) die Bewegungsgleichung mit den Konstanten ks k , c= = ω02 . (2.32) m m Die exponentielle Amplitudenabnahme der freien, gedämpften harmonischen Schwingung beschreibt der Abklingkoeffizient b= ks b = (2.33) 2m 2 und sein Verhältnis zur Kreisfrequenz ω0 der Schwingung ergibt den dimensionslosen Dämpfungsgrad δ= D= δ . ω0 (2.34) Mit diesen charakteristischen Parametern lautet die Differentialgleichung ẍ + 2Dω0 ẋ + ω02 x = 0 . (2.35) Mit dem Lösungsansatz x(t) = A exp (nt) (2.36) ẋ(t) = A n exp (nt) ⇒ ẍ(t) = A n2 exp (nt) (2.37) folgt für die Ableitungen und nach dem Einsetzen in die Differentialgleichung ergibt sich die charakteristische Gleichung c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 41 n2 + bn + c = 0 (2.38) mit √ b2 − 4c . (2.39) 2 Es gibt also zwei Lösungen mit n1 und n2 aus denen die Gesamtlösung durch eine Überlagerung berechnet wird n1,2 = −b ± xges (t) = A1 exp (n1 t) + A2 exp (n2 t) . (2.40) Die Amplituden A1 und A2 sind hierbei durch die Anfangsbedingungen bestimmt. Der Ausdruck 2.39 liefert zudem je nach Werten des Wurzelausdrucks b2 − 4c drei unterschiedliche Fälle, die im folgenden einzeln besprochen werden. Fall 1: Kleine Reibung Es gilt b2 − 4c < 0, wenn die Reibung klein ist, also ks klein ist. Entsprechend sind die beiden Lösungen n1,2 komplex, da aus einer negativen Zahl die Wurzel gezogen werden muss. Mit einer Konstanten C, die die Amplitude zum Zeitpunkt t = 0 beschreibt, lautet die Lösung x(t) = C exp (−δ t) cos (ωd t + ϕ0 ) . (2.41) Dies entspricht dem sogenannten Schwingfall. Die Amplitude der Schwingung nimmt ks jedoch mit der Exponentialfunktion exp (−δ t) = exp − 2 m t zu großen Zeiten t ab (siehe Abb. 2.8). Abbildung 2.8: Schwingfall eines gedämpften Systems: Die gestrichelte Linie zeigt die Einhüllende, die durch den exponentiellen Abfall beschrieben ist. c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 42 Die Frequenz der gedämpften Schwingung ist q ωd = ω02 − δ 2 (2.42) und damit zu kleineren Werten verschoben. Diese Verschiebung ist aber für ks /2m ≪ ω0 relativ klein. Fall 2: Aperiodischer Grenzfall Wird die Dämpfung immer stärker, dann geht schließlich eine einmalige Auslenkung exponentiell gedämpft in die Ruhelage zurück. Der aperiodische Grenzfall ist erreicht. Es gilt b2 − 4c = 0. Einsetzen in die Differentialgleichung liefert nur eine Lösung b x(t) = A exp − t . 2 (2.43) Abbildung 2.9: a) Aperiodischer Grenzfall eines gedämpften Systems beschreibt die maximale Dämpfung. b,c) Für geringfügig andere Werte b2 − 4c ∼ 0 vollführt das System noch eine Schwingung. Mit anderem Ansatz ist b x(t) = B t exp − t 2 (2.44) auch eine Lösung und damit ist die gesamte Lösung aus der Addition dieser beiden Einzellösungen c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 43 b b xges (t) = A exp − t + B t exp − t 2 2 (2.45) oder xges (t) = (A + B t) exp (−δ t) . (2.46) Die Konstanten A und B ergeben sich aus den Anfangsbedingungen. Der aperiodische Grenzfall ist für alle Systeme, die schnell in Ruhe kommen sollen von großer Bedeutung. Beispiele sind Stoßdämpfer, Türschließer oder Anwendungen aus der Regeltechnik. Systeme die noch einmal Ausschwingen (Überschwinger, siehe Abbildung 2.9b oder Unterschwinger, siehe Abbildung 2.9c) sind zum Beispiel bei Temperaturregelung äußerst unerwünscht. Fall 3: Kriechfall Es gilt b2 − 4c > 0, wenn die Reibung groß ist, also ks groß ist. Entsprechend sind die beiden Lösungen der charakteristischen Gleichung n1,2 reell. xges (t) = A exp (n1 t) + B exp (n2 t) (2.47) beschreibt keine Schwingung mehr, da n1,2 keinen Imaginäranteil enthalten, sondern eine gegen 0 kriechende Bewegung. Diese nähert sich dem Wert 0 langsamer als beim aperiodischen Grenzfall. Abbildung 2.10: Verglichen mit der maximalen Dämpfung beim aperiodischen Grenzfall (oben) kommt das überdämpfte System langsamer zur Ruhe (unten). In der Regeltechnik sind überdämpfte System wegen ihrer schlechten (langsamen) Zeitcharakteristik unerwünscht. c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 44 Zusammenfassung Oszillator Wird die Bewegungsgleichung des harmonischen Oszillators um einen Term für die Reibungskraft erweitert, der proportional zur Geschwindigkeit ist, so lassen sich realistische Systeme mit Reibung beschreiben. Abbildung 2.11: Vergleich zwischen dem ungedämpften (no damping), unterdämpften (underdamped), kritisch gedämpften (critical damped) und überdämpften (overdamped) Oszillator für ein festes Zeitfenster t. 2.1.4 Erzwungene Schwingung Wird einem schwingungsfähigen System (Resonantor) von außen durch einen Erreger eine periodische Kraft aufgezwungen, so erfolgt eine erzwungene Schwingung. Nach einer ausreichend langen Zeit, die als Einschwingphase bezeichnet wird, wird das schwingungsfähige System mit der vom Erreger erzwungenen Kreisfrequenz ωe schwingen. c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 45 Versuch 1600: erzwungene Schwingungen (Pohl’scher Resonanzapparat) Das Gerät nach Pohl besteht aus einer Kupfer-Schwungscheibe, deren Achse waagrecht gelagert ist, so dass man sie als Schatten projizieren kann. Die Scheibe ist mit einer Markierung versehen und von einer Skala umgeben. Die Ausschläge der Schwungscheibe können auf diese Weise im Schatten gezeigt werden. Damit überhaupt Schwingungen entstehen, wird die Scheibe mittels einer Spiralfeder nach Art einer Unruhe in einer Nullstellung gehalten. Ein Motorantrieb gestattet es, kleine Auslenkungen mit variabler Frequenz auf die Spiralfeder und damit auf die Scheibe zu übertragen. Außerdem ist ein Elektromagnet vorhanden, der den Rand der Scheibe umgreift und als Wirbelstrombremse eingesetzt werden kann. So sind fast beliebige Dämpfungskonstanten einstellbar. Mit diesem Gerät kann die Amplitude und die Phase der erzwungenen Schwingung in Abhängigkeit von der Anregungsfrequenz und der Dämpfung gezeigt werden. Man kann Resonanzkurven aufnehmen bis hin zum aperiodischen Grenzfall. Die Schwingung des Resonators werde durch eine periodisch wirkende Kraft f (t) = K cos (ωe t) (2.48) angeregt. Aus dem Kräftegleichgewicht F = −kx − ks ẋ + f (t) = mẍ (2.49) folgt die Bewegungsgleichung ẍ + bẋ + cx = f (t)/m (2.50) mit den Konstanten b= ks , m c= k = ω02 . m (2.51) Abbildung 2.12: Beispiel für eine erzwungene Schwingung, bei der eine Feder durch eine äußere Kraft periodisch angetrieben wird. Diese Differentialgleichung der erzwungenen Schwingung ist im Gegensatz zu der des freien Oszillators inhomogen. Die Lösung der linearen inhomogenen Differentialgleichung ist x(t) = xhomogen (t) + xpart (t) c Lehrstuhl E13, TUM, 2010 (2.52) 2.1. SCHWINGUNGEN 46 die Summe aus der allgemeinen Lösung der homogenen Differentialgleichung xhomogen (t) und irgendeiner, die inhomogene Differentialgleichung erfüllen partikulären Lösung xpart (t). Beschränken wir uns auf den Fall kleiner Reibungen, so ist die Lösung der homogenen Differentialgleichung bereits im Abschnitt zuvor unter Fall 1 (Schwingfall) gelöst worden (siehe Gleichung 2.41) und es gilt xhomogen (t) = C exp (−δ t) cos (ωd t + ϕ0 ) (2.53) mit der Frequenz der gedämpften Schwingung q ωd = ω02 − δ 2 . (2.54) Da das System nach einer Einschwingzeit der Erregerfreuqenz ωe folgt ist eine partikuläre Lösung K xpart (t) = m s (ω02 − ωe2 )2 + ks ωe m 2 cos (ωe t − ϕe ) . (2.55) Die gesamte Lösung ist schließlich K x(t) = m s (ω02 − ωe2 )2 + ks ωe m 2 cos (ωe t − ϕe ) + C exp (−δ t) cos (ωd t + ϕ0 ) . (2.56) Der erste Term beschreibt den Zustand des Systems für große Zeiten. Versuch 1615: Stimmgabelresonanz Schlägt man eine Stimmgabel ohne Resonanzkörper an, so hört man sie fast nicht. Stellt man sie jedoch auf den Resonanzkasten, ist ihr Ton laut hörbar. Zwei gleichartige Stimmgabeln werden auf ihren Resonanzkästen so einander gegenübergestellt, dass die Schallöffnungen einander zugewandt sind. Schlägt man eine der beiden Stimmgabeln an und dämpft sie wieder, indem man sie anfasst, so ist der Ton trotzdem weiterhin zu hören, weil die andere Stimmgabel in Resonanz geraten ist. Man beweist dies, indem man die zweite Gabel ebenfalls anfasst, worauf der Ton endgültig verstummt. Wirkungsweise: Die Stimmgabel ist trotz ihrer Biegung ein linearer Schwinger. Ihre Zinken schwingen gegeneinander, der Stiel bewegt sich auf und ab. Man erreicht durch diese Form eine besonders obertonfreie Schwingung. Allerdings wäre sie ohne ihren Resonanzkasten kaum zu hören, weil die Berührungsfläche des schwingenden Metalls mit der Luft klein ist und deshalb wenig Energie übertragen werden könnte. Der Holzkasten übernimmt die Schwingungen des Gabelstiels und vergrößert die Abstrahlung ganz entscheidend. Betrachten wird das System für große Zeiten, so ist die Amplitudenresonanzfunktion entscheidend: c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 47 K A= m q (ω02 − ωe2 )2 A= + ks m ωe 2 = K m q (ω02 − ωe2 )2 K p 2 m (ω0 [1 − η 2 ])2 + (2δηωo )2 . 2 (2.57) + (2δ ωe ) (2.58) Wir unterscheiden 3 Fälle in Abhängigkeit von dem Verhältnis zwischen der Frequenz der ungedämpften Systems und der Anregungsfrequenz η = ωe /ω0 für verschiedene Abklingkoeffizienten δ: Fall 1: Quasistatische Auslenkung Es ist η ≪ 1 und es folgt eine sehr langsame, quasistatische Auslenkung, die durch die Federkonstante k bestimmt ist A= K K . = 2 mω0 k (2.59) Fall 2: Resonanzfall ohne Dämpfung Die Amplitude A divergiert , falls ks und ωe − ω0 gegen 0 gehen (η = 1). Dies bezeichnet man als Resonanzkatastrophe, da sich das System immer weiter aufschaukelt. Abbildung 2.13: Amplitude A in Abhängigkeit von der Anregungsfrequenz ωe . Trifft diese die Systemfrequenz (η = 1), so kommt es zur Resonanz. Verschiedene Dämpfungen sind gezeigt. c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 48 Fall 3: Resonanzfall mit Dämpfung Ist eine Dämpfung vorhanden, so kann die Amplitude A auch für η ∼ 1 nicht mehr divergieren. Die Abbildung 2.13 zeigt die Amplitude für verschiedene Dämpfungen. Bei Anwendungen wie Automobilen hängen die Resonanzfrequenzen von den jeweilgen Bauteilen ab. Abbildung 2.14: Beispiele für schwingungsfähige Systeme an dem Modellauto sind Kotflügel und Antenne. Versuch 1625: Resonanzen an einem Modellauto Das Modellauto hat etwa eine Länge von 20 cm und ist mit auffälligen, schwingungsfähigen Teilen versehen (Kotflügel, Antenne). Es trägt einen kleinen Elektromotor mit unwuchtiger Schwungscheibe. Durch Hochfahren der Motordrehzahl lassen sich die verschiedenen Autoteile in Resonanz bringen. Resonanzkatastrophe Die Resonanzkatastrophe bezeichnet in der Mechanik und Konstruktion die Zer-störung eines Bauwerkes oder einer technischen Einrichtung durch angeregte Schwingungen. Ursache dafür ist die Resonanz: Die Energie wird bei periodischer Anregung optimal übertragen und im System gespeichert. Durch die Speicherung und weiterer Energiezufuhr schwingt das System immer stärker, bis die Belastungsgrenze überschritten ist. Zum Schutz der Konstruktion werden Schwingungsdämpfer verbaut, die im Bereich der Resonanzfrequenz stark dämpfen und somit den Energieeintrag abführen. Abbildung 2.15: Wenn der Sänger einen Ton trifft, dessen Frequenz gleich der Eigenfrequenz des sehr spröden Glases ist, kommt es zur Resonanz. Beim relativ schwach gedämpften Glas reichen kleine Schwingungsamplituden, um dieses zum Zerspringen zu bringen. Versuch 1627: Glas “zersingen” Es ist tatsächlich möglich, Gläser durch bestimmte Töne zum Platzen zu bringen. Sobald man ein Glas mit dessen Eigenfrequenz in ausreichender Lautstärke beschallt, beginnt es c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 49 zu schwingen und schließlich zu zerbrechen. Tacoma Brücke: Mit einer Mittelspannweite von 853 Metern war die erste Tacoma-Narrows-Brücke zum Zeitpunkt ihrer Fertigstellung die drittgrößte Hängebrücke der Welt. Sie wurde am 1. Juli 1940 eröffnet, stürzte jedoch vier Monate später am 7. November 1940 spektakulär ein. Ursache waren durch Wind hervorgerufene Torsionschwingungen der Brücke, die sich durch Resonanz und geringe Dämpfung immer weiter verstärkten. Abbildung 2.16: Die Tacoma Brücke vor 1940, während und nach ihrem Einsturz 1950. Die Phasenresonanzfunktion ∆ϕ bezeichnet die Phasendifferenz zwischen der periodisch wirkenden Kraft f (t) und der Auslenkung des Systems x(t). Sie verdeutlicht die Energiebilanz in dem von außen periodisch angetriebenen schwingungsfähigen System. Abbildung 2.17: Frequenzabhängigkeit der Phasendifferenz ∆ϕ einer erzwungenen Schwingung für verschiedene Dämpfungen. c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 50 Bei Resonanz ist ∆ ϕ = π/2. Die äußere Kraft wirkt also in Richtung der Geschwindigkeit der schwingenden Masse und dem System wird in jeder Schwingung die maximale Energie zugeführt. Ohne Reibung muss die Amplitude divergieren, da dem System ständig Energie zugeführt wird. 2.1.5 Gekoppelte Schwingung Zwei Oszillatoren (z.B. Pendel oder Feder-Masse Systeme), zwischen denen ein Energieaustausch stattfinden kann (beispielsweise durch eine Schraubenfeder), werden als gekoppelte Oszillatoren bezeichnet. Die ausgeführten Schwingungen werden auch als gekoppelte Schwingungen bezeichnet. Abbildung 2.18: Elastisch gekoppelte Feder-Masse System mit identischer Masse m, aber unterschiedlicher Auslenkung um y1 für den Oszillator 1 und y2 für den Oszillator 2. Die Federkonstante der Kopplungsfeder ist verschieden von den Federkonstanten der Haltefedern. Betrachten wir zwei Massen m, die mit (Halte-)Federn der gleichen Federkonstante k mit einer starren Wand und einer Kopplungsfeder mit der Federkonstante k12 untereinander verbunden sind. Wird die erste Masse um y1 und die zweite Masse um y2 ausgelenkt, so ist die Kopplungsfeder um y1 − y2 bezüglich der ersten Masse zusammengedrückt und das Newtonsche Gesetz bezüglich der ersten Masse lautet −k y1 − k12 (y1 − y2 ) = m a1 . (2.60) Entsprechend ist die Differentialgleichung für die erste Masse ÿ1 + k k12 y1 + (y1 − y2 ) = 0 . m m (2.61) Bezüglich der zweiten Masse ist die Kopplungsfeder um y2 − y1 zusammengedrückt und die Diffeerentialgleichung lautet ÿ2 + k12 k y2 + (y2 − y1 ) = 0 . m m (2.62) Werden beide Differentialgleichungen addiert, so ergibt sich die gekoppelte DGL für y1 + y2 zu d2 k (2.63) (y1 + y2 ) + (y1 + y2 ) = 0 . 2 dt m Werden beide Differentialgleichungen subtrahiert, so ergibt sich eine andere gekoppelte DGL für y1 − y2 zu k + 2k12 d2 (y1 − y2 ) + (y1 − y2 ) = 0 . (2.64) 2 dt m c Lehrstuhl E13, TUM, 2010 2.1. SCHWINGUNGEN 51 Beide DGLs beschreiben ungedämpfte harmonische Schingungen. Das gekoppelte System hat zwei Fundamentalschwingungen (gleichphasige und gegenphasige Schwingung). Diese sind die beiden einzigen Schwingungszustände des gekoppelten Systems, bei denen kein Energieübertrag stattfindet. Gleichphasige Schwingung Aus Gleichung 2.63 folgt ω1 = ω0 = r k und T1 = T0 = 2π m r 1 m = . k f1 (2.65) Für eine gleichphasige Schwingung (y1 = y2 ) verschwindet die DGL 2.64. Das Kopplungsglied ist in diesem Fall unwirksam, weil die Kopplungsfeder immer entspannt bleibt. Deshalb schwingen die Massen mit der Frequenz der ungedämpften Schwingung. Gegenphasige Schwingung Aus Gleichung 2.64 folgt ω2 = r k + 2k12 und T2 = 2π m r m 1 = . k + 2k12 f2 (2.66) Für eine gegenphasige Schwingung (y1 = −y2 ) verschwindet die DGL 2.63. Aus symmetriegründen ist die Mitte der Kopplungsfeder in Ruhe. Jedem Oszillator kann somit die Federkonstante der eigenen (Halte-)Feder und die Hälfte der Federkonstante der Kopplungsfeder zugerechnet werden. Allgemeine Schwingungen In allen anderen Fällen findet eine Überlagerung der Fundamentalschwingungen so statt, dass eine Schwebung entsteht. Diese hat die Schwebungsfrequenz fs = f2 − f1 . (2.67) Für den allgemeinen Fall betrachten wir jetzt spezielle Anfangsbedingungen, um für dieses Beispiel das Entstehen einer Schwebung nachzurechnen: Bei Beginn der Schwingung (t = 0) ist der erste Oszillator maximal ausgelenkt (y1 (0) = y0 ) und der zweite Oszillator in Ruhe (y2 (0) = 0). Damit wird y1 + y2 = y0 und die beiden Fundamentalschwingungen gehorchen den Ansätzen: y1 + y2 = y0 cos(ω1 t) y1 − y2 = y0 cos(ω2 t) (2.68) (2.69) Aus der Addition beider Gleichugen folgt y1 = c Lehrstuhl E13, TUM, 2010 y0 [cos(ω1 t) + cos(ω2 t)] 2 (2.70) 2.1. SCHWINGUNGEN 52 und unter Anwendung des Additionstheorems α+β α−β cos α + cos β = 2 cos cos 2 2 folgt für den ersten Oszillator die Schwebungsgleichung ω1 − ω2 ω1 + ω2 t cos t . y1 = y0 cos 2 2 (2.71) (2.72) Aus der Subtraktion beider Gleichugen folgt y2 = y0 [cos(ω1 t) − cos(ω2 t)] 2 und unter Anwendung des Additionstheorems α+β α−β cos α − cos β = −2 sin sin 2 2 folgt für den zweiten Oszillator die Schwebungsgleichung ω1 − ω2 ω1 + ω2 t sin t . y2 = −y0 sin 2 2 (2.73) (2.74) (2.75) Es führen also der erste und zweite Oszillator Schwebungen aus, die um π/2 phasenverschoben sind. Der Kopplungsgrad für Oszillatoren gleicher Masse und bei gleicher Amplitude ist definiert als k12 K= . (2.76) k + k12 mit 0 < K < 1. Bei loser Kopplung ist K ≪ 1 und f1 6= f2 und bei fester Kopplung ist K ∼ 1 und f1 ≈ f2 . Im allgemeinen Fall sind n Oszillatoren miteinander gekoppelt. Dieses System besitz dann n Fundamentalschingungen (Eigenschwingungen). Abbildung 2.19: n Pendel sind untereinander mit Federn gekoppelt. c Lehrstuhl E13, TUM, 2010 2.2. WELLEN 2.2 53 Wellen Durch die Kopplung von schwingungsfähigen Systemen kann sich die Schwingung auf Nachbarn übertragen, was zu einer räumlichen Ausbreitung des Schwingungszustandes führt. Wellen sind also Schwingungen, die sich in Raum und Zeit ausbreiten. Bei Schwingungen von Teilchen ist nur die Richtung ihrer Auslenkung im Raum definiert, bei der Welle kommt die Richtung ihrer Ausbreitung hinzu. Man spricht von Transversalwellen, wenn die Richtung der Auslenkung senkrecht zur Ausbreitungsrichtung steht, bei Longitudinalwellen sind Auslenkung und Ausbreitung gleichgerichtet (siehe Abb. 2.20). Abbildung 2.20: links: Unterschied zwischen longitudinalen und transversalen Wellen. rechts: Getreidefeld im Wind. Beispiele für Wellen sind das Getreidefeld im Wind, Erdbeben, elektromagnetische Wellen, Schallwellen oder Lichtwellen. Die uns aus dem täglichen Leben ebenfalls vertrauten Wasserwellen sind komplexerer Natur und können mit der folgenden einfachen Beschreibung erklärt werden. Wellen transportieren Energie und Impuls durch den Raum ohne eine wesentliche Verlagerung von Massen in der Ausbreitungsrichtung. Eine Welle ist charakterisiert durch ihre Amplitude A, durch ihre Phase φ und durch ihre Wellenlänge λ. Darüber hinaus hat sie eine Ausbreitungsrichtung, die durch den Wellenvektor ~k bestimmt ist. 2.2.1 Harmonische Wellen Eine harmonische Welle entsteht durch die Kopplung harmonischer Oszillatoren. Die Ausbreitungsgeschwindigkeit v der Welle beschreibt, wie schnell sich ein Wellenberg im Ortsraum bewegt. Wird der Ort eines Maximums zu zwei Zeiten ermittelt, dann zeigt der Quotient aus Orts- und Zeitdifferenz die Ausbreitungsgeschwindigkeit v. Das Maximum der Welle verschiebt sich in Raum und Zeit von x, t zu x + ∆x, t + ∆t (vgl. Fortschreiten des Maximums). Eine entsprechende Beschreibung ist natürlich mit jedem anderen Phasenzustand eder Welle, also zum Beispiel dem Minumum, ebenfalls möglich. c Lehrstuhl E13, TUM, 2010 2.2. WELLEN 54 Eine sinusförmige, transversale Welle, mit Wellenlänge λ , Amplitude ym , Ausbreitungsgeschwindigkeit v und Schwingungsdauer T = λ/v wird beschrieben durch y(x, t) = ym 2π 2π v 2π sin (x − vt) = ym sin x− t λ λ λ . (2.77) Periodizität im Raum: Wenn sich bei festem t die Variable x um λ ändert, nimmt das Argument des Sinus um 2π zu und y nimmt wieder den gleichen Wert an. y (x + λ, t) = y (x, t) Periodizität in der Zeit: Wenn sich bei festem x die Variable t um T = λ/v ändert, dann nimmt das Argument des Sinus um 2π zu und y nimmt wieder den gleichen Wert an. y (x, t + λ/v) = y (x, t + T ) = y (x, t) Abbildung 2.21: Wellenflächen einer ebenen Welle, wobei Wellenberge in weiß und Wellentäler in schwarz dargestellt sind (wie bei einer Lichtwelle). Mit der Wellenzahl 2π λ (2.78) 2π 2πv = T λ (2.79) k= und der Kreisfrequenz ω= folgt y (x, t) = ym sin (k x − ω t) . (2.80) Phasengeschwindigkeit Die Ausbreitungsgeschwindigkeit einer Welle wird im engeren Sinne als Phasengeschwindigkeit c bezeichnet, da die Phasengeschwindigkeit angibt, wie schnell ein Zustand konstanter Phase (zum Beispiel ein Wellenberg, Wellental oder Nulldurchgang), also eine Wellenfläche, sich fortbewegt. Wellenflächen einer ebenen Welle sind in der Abbildung 2.21 gezeigt. Die allgemeine Wellengleichung ist dann 2 ∂2 y 2 ∂ y = c ∂t2 ∂x2 . (2.81) Eine (cosinusförmige) ebene Welle is beschrieben durch y(x, t) = ym cos (ωt − kx + ϕ0 ) . c Lehrstuhl E13, TUM, 2010 (2.82) 2.2. WELLEN 55 Aus dem Zustand konstanter Phase ωt − kx + ϕ0 = konst. oder x= (2.83) ωt + ϕ0 − konst. k (2.84) dx ω = . dt k (2.85) folgt für die Phasengeschwindigkeit c= Diese ist identisch mit der Ausbreitungsgeschwindigkeit v= λ = λf . T (2.86) Für Wellen in unterschiedlichen Medien zeigt die Wellengleichung die gleiche Gestalt, die Ausbreitungsgeschwindigkeit hängt aber von unterschiedlichen Materialeigenschaften ab. 2.2.2 Überlagerung von Wellen Laufen mehrere Wellen durch ein gemeinsames Medium, so kann es an bestimmten Stellen des Raums zu einer Überlagerung einzelner Wellen kommen. Interferenz beschreibt diese Überlagerung von zwei oder mehr Wellen nach dem Superpositionsprinzip (d.h. durch Addition der Amplituden, nicht der Intensitäten). Sie tritt bei allen Arten von Wellen auf, also Schall, Licht, Materiewellen, usw. Betrachten wir zwei eben Wellen gleicher Amplitude, die in der selben Richtung laufen y1 (x, t) = y0 cos(ω t − k x) (2.87) y2 (x, t) = y0 cos(ω t − k x + ϕ) (2.88) und mit der Phasenverschiebung ϕ beziehungsweise dem Gangunterschied ∆= ϕ λ . 2π Die resultierende Welle, die durch die Addition der beiden Teilwellen entsteht ist ϕ ϕ y2 (x, t) = 2y0 cos cos ω t − k x + 2 2 ∆ ∆ = 2y0 cos π cos ω t − k x + π . λ λ (2.89) (2.90) (2.91) Es gibt die beiden Spezialfälle: a) konstruktive Interferenz: Gangunterschied ∆ = m λ, Phasenverschiebung ϕ = m 2π mit m = 0, 1, 2, 3, ...: Die Amplitude der resultierenden Welle ist doppelt so groß wie die der Ausgangswellen. Die Nulldurchgänge liegen am selben Ort wie bei den Ausgangswellen. c Lehrstuhl E13, TUM, 2010 2.2. WELLEN 56 b) destruktive Interferenz: Gangunterschied ∆ = (2m + 1)λ/2, Phasenverschiebung ϕ = (2m + 1)π mit m = 0, 1, 2, 3, ...: Die beiden Ausgangswellen schwingen an jedem Ort gegenphasig und löschen sich überall aus. Während sich die Überlagerung zweier Wellen gleicher Frequenz und Amplitude anhand der trigonometrischen Additionstheoreme berechnen läßt, wird für eine gleiche Frequenz der Wellen, aber unterschiedliche Amplituden und Phasen die resultierende Welle mittels Zeigerarithmetik berechnet. 2.2.3 Überlagerung von Wellen Die Reflexion einer Welle lässt sich als Überlagerung von zwei sich gegenläufig ausbreitenden Wellen f (ω t − k x) und g(k x + ω t) y(x, t) = f (ω t − k x) + g(ω t + k x) (2.92) beschreiben. Sie ist abhängig von den Randbedingungen bei der Reflexion. Es wird das feste Ende und das offene Ende unterschieden (siehe Abb. 2.22). Am festen Ende erfolgt ein Phasensprung um π und die Welle hat in der Reflexionsebene einen Knoten. Am offenen Ende tritt kein Phasensprung auf und die Welle hat in der Reflexionsebene einen Bauch. Abbildung 2.22: Die einlaufende Wellen (gestrichelte Linie) und die reflektierte Welle (punktierte Linie) interferrieren zur resultierenden Welle (durchgezogene Linie). Je nach Wandtyp tritt ein Phasensprung auf. Stehende Welle Die Interferenz zweier Wellen gleicher Frequenz, aber mit entgegengesetzter Ausbreitungsrichtung führt zu einer stehenden Welle. Versuch 1685: Stehende Welle auf einem Gummischlauch Ein etwa 10 Meter langer Gummischlauch wird in Hüfthöhe an einem Ende fest eingespannt. Bewegt man das freie Ende periodisch quer zur Schlauchrichtung, so entstehen c Lehrstuhl E13, TUM, 2010 2.2. WELLEN 57 nach der Reflexion am festen Ende stehende Wellen. Bei entsprechend rascher Anregung lassen sich bis zu fünf Bäuche erzeugen. Dabei ist es einfacher, statt einer linearen Welle eine zirkulare anzuregen (Hand macht kreisförmige Bewegungen). Betrachten wir die Überlagerung zweier gegenläufiger fortschreitender Wellen gleicher Frequenz und gleicher Amplitude y1 (x, t) = A cos (ωt − kx) y2 (x, t) = A cos (ωt + kx + ϕ0 ) (2.93) mit dem Phasensprung ϕ0 = 0 (loses Ende) oder ϕ0 = π (festes Ende) so folgt beziehungsweise ϕ0 ϕ0 cos ωt + y(x, t) = 2 A cos kx + 2 2 (2.94) ϕ0 y(x, t) = A(x) cos ωt + 2 (2.95) mit der Amplitude ϕ0 . (2.96) A(x) = 2A cos kx + 2 y(x, t) ist zwar in Raum und Zeit periodisch, stellt aber keine sich ausbreitende Welle mehr dar, da das Argument nicht von der Form (x − vt) ist. Jeder Punkt der Welle stellt eine harmonische Bewegung in y-Richtung dar. Die entsprechende Amplitude am Ort x ist dann A(x). Abbildung 2.23: Schwingungszustände einer stehenden Welle mit zwei festen Enden. Der Grundzustand ist n = 1, exemplarisch sind vier weitere Zustände gezeigt. Es gibt n solche Schwingungszustände. Für zwei feste Enden ist • bei x = nπ = n λ2 ist die Amplitude immer Null. Die Welle hat an diesen Stellen k Knoten. c Lehrstuhl E13, TUM, 2010 2.2. WELLEN 58 • bei x = (2n + 1) λ4 ist die Amplitude immer maximal. An diesen Stellen hat die Welle Bäuche. Die Abbildung 2.23 zeigt die Zustände einer stehenden Welle für verschiedene Anzahl von Bäuchen (1 = unten bis 5 = oben). 2.2.4 2d Wellen Bisher wurden Wellen in einer Dimension (1d) betrachtet, da für viele Wellentypen (ebene Wellen, Kugelwellen) eine geschickte Wahl des Koordinatensystems ausreicht, um die zweidimensionale Ausbreitung vereinfacht in 1d darzustellen (siehe Abb. 2.24). Abbildung 2.24: 6 Beispiele für 2d Wellen, von denen sich die ersten 5 durch geschickte Wahl des Koordinatensystems als 1d Wellen beschreiben lassen. Es gibt jedoch kompliziertere Wellen, bei denen diese Vereinfachung nicht mehr funktioniert, da die entsprechende Symmetrie fehlt. Ein Beispiel hierfür sind die Chladnischen Klangfiguren. Versuch 1715: Chladnische Klangfiguren Die Eigenschwingungen (Resonanzen) zweier Metallplatten werden sichtbar gemacht, indem man die in der Mitte eingespannten Platten (eine rund, eine quadratisch) mit feinem Quarzsand bestreut und am Rand mit einem Bassbogen anstreicht. Der Sand bleibt auf den Schwingungsknoten liegen, so dass die Knotenlinien gut zu sehen sind (Vorführung mit der Fernsehanlage). Man kann durch Anfassen auch einige Schwingungsknoten am Rand der Platte vorgeben, während man die Schwingung anregt. Es kommen recht komplizierte c Lehrstuhl E13, TUM, 2010 2.2. WELLEN 59 Figuren zustande. In Folge von Eigenresonanzen beginnt eine zweidimensionale Platte zu schwingen. Der Sand wird beim Tönen der Platte von den vibrierenden Partien regelrecht weggeschleudert und wandert zu den Stellen, an denen keine Schwingung auftritt. Auf diese Weise werden die Knotenlinien von zweidimensionalen stehenden Wellen sichtbar gemacht, die sich auf der Platte ausbilden. Abbildung 2.25: Beispiele für Chladnische Klangfiguren für quadratische Platten. c Lehrstuhl E13, TUM, 2010 Kapitel 3 Akustik Die Akustik beschäftigt sich mit der Ausbreitung von longitudinalen Wellen. Diese Ausbreitung erfolgt in unterschiedlichen Medien (Gase, Flüssigkeiten oder Festkörper). Von besonderem Interesse ist die Ausbreitung von Schall in Luft und das beim Menschen ausgelöste Schallempfinden. 3.1 Schallwellen Schall bezeichnet die Ausbreitung von lokalen Druckschwankungen in einem Medium. Schallwellen sind die Druckschwankungen im Medium. Die ausgelenkten Moleküle schwingen periodisch um ihre ihre Ausgangsposition. Diese Bewegung wird auf benachbarte Teilchen durch Stoß übertragen. Es kommt zu einer Verdichtung und Verdünnung des Mediums und damit zur Fortpflanzung des Schalls. Abbildung 3.1: Die schwingenden Luftmoleküle führen zu Verdichtungen und Verdünnungen, die sich als Welle durch das Medium ausbreiten. Schallwellen breiten sich mit einer charakteristischen Geschwindigkeit, der Schallge- 60 3.1. SCHALLWELLEN 61 schwindigkeit c aus. Dabei transportieren sie Schallenergie. Im Vakuum ist Schall nicht ausbreitungsfähig. Die Schallgeschwindigkeit hängt vom Ausbreitungsmedium ab. Die Schallgeschwindigkeit in idealen Gasen ist abhängig vom Adiabatenexponenten κ, der Dichte ρ sowie dem Druck p0 des Gases. Alternativ kann sie aus der thermischen Zustandsgleichung berechnet werden und hängt von der molaren Masse M , molare Gaskonstante R= 8.3145 J/(mol K) und der absoluten Temperatur T ab. cgas r r RT p0 = κ = κ ρ M (3.1) In Luft beträgt sie 343 m/s bei einer Temperatur von 20o C. Die Schallgeschwindigkeit in Flüssigkeiten ist eine Funktion der Dichte ρ und des Kompressionsmoduls K der Flüssigkeit s K . (3.2) cf l = ρ In Wasser beträgt sie 1484 m/s bei einer Temperatur von 20o C. 3.1.1 Schalldruck Als Schalldruck werden die Druckschwankungen eines kompressiblen Mediums (üblicherweise Luft), die bei der Ausbreitung von Schall auftreten, bezeichnet. Diese Druckschwankungen werden vom Trommelfell als Sensor in Bewegungen zur Hörempfindung umgesetzt. Der Schalldruck p ist der Wechseldruck, der dem statischen Druck p0 (Luftdruck) des umgebenden Mediums überlagert ist. Für den gesamten Druck pges gilt somit: pges = p + p0 . (3.3) Der Schalldruck ist in der Regel um viele Größenordnungen kleiner als der statische Luftdruck. Der Ruhedruck der Atmosphäre beträgt 101325 Pascal (= 1013,25 Hektopascal), während ein Schalldruckpegel von 130 dB einem Effektivwert des Schalldrucks p von gerade einmal 63 Pascal entspricht. Die SI-Einheit des Schalldrucks, ebenso wie des Drucks, ist das Pascal mit dem Einheitenzeichen Pa. Der Schalldruck wird oft als Pegelgröße (siehe Schalldruckpegel) in dB angegeben. 3.1.2 Schalldruckpegel Der Schalldruckbereich für das menschliche Gehör beginnt bei 2x10−5 N/m2 und reicht bis 20 N/m2 (bei einer Frequenz von 1000 Hz). Zwischen oberer und unterer Grenze liegt also ein Faktor von 1000000 ! Daher wird der Schalldruckpegel Lp als logarithmische Verhältnisgröße gemessen. Das Ergebnis wird mit der Hilfsmaßeinheit Dezibel (Abkürzung dB) gekennzeichnet. Es ist 2 p p Lp = 10 log dB . (3.4) dB = 20 log 2 pN pN c Lehrstuhl E13, TUM, 2010 3.1. SCHALLWELLEN 62 Als Bezugswert für den Schalldruckpegel wurde willkürlich pN =2x10−5 N/m2 einem Pegelwert von 0 dB zugeordnet. Damit resultiert bei einem Schalldruckpegel von 20 N/m2 ein Pegelwert von 120 dB. Die Abbildung 3.2 zeigt Beispiele für Pegelwerte und die entsprechenden Folgen, die für das menschliche Gehör auftreten können. Bei einem Schalldruckpegel von 130 dB beträgt die Geschwindigkeit der schwingenden Luftmoleküle (der Hin- und Herbewegung von Luftteilchen) nur 0.153 m/s. Bei der Hörschwelle des Menschen von 0 dB hat diese Geschwindigkeit einen Wert von 5x10−8 m/s. Hierbei werden die Luftpartikel nur ganz gering ausgelenkt. Diese Geschwindigkeit darf nicht mit der Schallgeschwindigkeit verwechselt werden. Abbildung 3.2: Schalldruckpegel in dB für verschiedene Beispiele aus dem täglichen Leben. Die Werte sind mit dem menschlichen Gehör in Bezug gesetzt. Der Schalldruckpegel ist eine technische und keine psychoakustische Größe. Ein Rückschluss von Schalldruckpegel auf die wahrgenommene Empfindung ist nur eingeschränkt möglich. Ganz allgemein lässt sich sagen, dass eine Erhöhung bzw. Senkung des Schalldruckpegels tendenziell auch lauter bzw. leiser wahrgenommenes Schallereignis hervorruft. Ein Unterschied im Schalldruckpegel von 10 dB wird als doppelte Lautstärke wahrgenommen. c Lehrstuhl E13, TUM, 2010 3.2. HARMONISCHER SCHALLGEBER 3.2 63 Harmonischer Schallgeber Betrachten wir einen eindimensionalen harmonischen Schallgeber mit einer Erregerfrequenz f so folgt für die Schallwelle bei einem mittleren Druck p0 am Ort x zur Zeit t x pges (x, t) = p0 + p cos 2πf t − . (3.5) c Der Hörschall umfasst den Frequenzbereich von 16 bis 20 000 Hz. Schwingungen unterhalb des Hörbereichs (< 16 Hz) heißen Infraschall, oberhalb zirka 20 kHz Ultraschall; bei Frequenzen über etwa 1 GHz spricht man von Hyperschall. Versuch 1700: Ruben’sches Flammenrohr Ein Messingrohr (Länge 1 m, Durchmesser ca. 4 cm) ist der Länge nach mit einer Reihe feiner Löcher versehen und trägt in der Mitte einen Anschlussstutzen für Propangas. Ein Ende ist verschlossen, am anderen Ende ist eine Telefonmembran befestigt, mit der man im Rohr Tonfrequenzen erzeugen kann. Als Tongenerator dient ein Sinusgenerator, der über einen Verstärker an die Membran angeschlossen ist. Das Rohr wird an die Gasflasche angeschlossen und das Gas nach einiger Zeit entzündet (Flammenhöhe auf ca. 4 cm einstellen). Die stehenden Schallwellen im Rohr bilden sich auf die Flammenreihe ab. Abbildung 3.3: Ruben’sches Flammenrohr Musikalische Akustik • Die Schallwelle eines Tons ist rein sinusförmig und monofrequent. • Klänge sind eine Überlagerung mehrerer Schallwellen unterschiedlicher Amplitude und Frequenz, wobei die Frequenzen in ganzzahligen Verhältnissen zueinander stehen. Das Signal ist also zwar periodisch aber nicht mehr sinusförmig. • Unregelmäßig überlagerte Schallwellen werden als Geräusch empfunden. Der Begriff Grundfrequenz, auch Grundschwingung oder Grundton, bezeichnet die tiefste Frequenz in einem harmonischen Frequenzgemisch. Die Grundfrequenz hat eine weitere Bedeutung: Sieht man ein periodisches Signal als ein Signal an, bei dem sich ein bestimmtes Muster ständig wiederholt, so beschreibt die Grundfrequenz, wie häufig eine solche Musterwiederholung stattfindet. Im Bereich der Musik beschreibt die Grundfrequenz die c Lehrstuhl E13, TUM, 2010 3.2. HARMONISCHER SCHALLGEBER 64 Tonhöhe, mit der ein Instrument wahrgenommen wird. Die anderen beteiligten Schwingungen, deren Frequenzen jeweils ein Vielfaches der Grundfrequenz betragen, werden Harmonische oder Obertöne genannt (siehe Abb. 3.4). Abbildung 3.4: Beispiel für ein Frequenzgemisch aus einer Grundfrequenz (Kammerton a mit f = 440 Hz) mit der zweiten und vierten Harmonischen. Zum Beispiel kommen bei einer Gitarrensaite mehrere Arten von Schwingungen gleichzeitig vor. Zum einen schwingt die gesamte Gitarrensaite gleichartig über die gesamte Saitenlänge. Daneben gibt es Schwingungen, bei denen beide Hälften der Saite mit doppelter Frequenz gegeneinander schwingen, Schwingungen mit dreifacher Frequenz auf jeweils 1/3 der Saite usw. Die Schwingung mit der niedrigsten Frequenz (gleichartige Schwingung der gesamten Saite) ist hier die Grundfrequenz, die anderen Schwingungen Oberschwingungen (siehe Abb. 3.5). Abbildung 3.5: links: Grundschwingung und Harmonische auf einer Saite. rechts: Grundschwingung und Harmonische für ein Luftsäule in einer offenen oder halboffenen Röhre. c Lehrstuhl E13, TUM, 2010 3.3. FOURIER-ANALYSE UND -SYNTHESE 65 Aus der Gesamtheit aller Obertöne ergibt sich das Frequenzspektrum eines Instruments. Versuch 1640: Bilder von akustischen Schwingungen (Oszilloskop) Man nimmt die Schwingungen verschiedener Schallquellen (Stimmgabel, Galtonpfeife, menschliche Stimme, Pfeifen) über ein Mikrophon auf, verstärkt sie und zeigt sie auf dem Oszilloskop. Abbildung 3.6: Kammerton a mit der Grundfrequenz f = 440 Hz und entsprechende Signalverläufe für verschiedene Instrumente. Klangerzeugende Instrumente unterscheiden sich durch das Verhältnis der Amplituden der höherfrequenten Schwingungen, der Obertöne, zur Grundschwingung. Dies führt zu sehr verschiedenen Obertonreihen (siehe Abb. 3.6). 3.3 Fourier-Analyse und -Synthese Die Fourier-Analyse beschreibt das Zerlegen eines beliebigen periodischen Signals in eine Summe von Sinus- und Kosinusfunktionen (eine sogenannte Fourier-Reihe). Sie zerlegt ein Signal damit in seine Frequenzanteile. ∝ a0 X x(t) = + [ak cos (k ω0 t) + bk sin (k ω0 t)] 2 k=1 (3.6) Zum Beispiel ist die Fourierreihe für ein Rechtecksignal xR (t) = sin (ω0 t) + 1 1 1 sin (3ω0 t) + sin (5ω0 t) + sin (7ω0 t) + .... . 3 5 7 (3.7) Anhand dieser Funktion erkennt man, dass man eine Rechteckschwingung durch unendlich viele Oberschwingungen darstellen kann. Sie enthält jeweils die ungeraden harmonischen Oberschwingungen, wobei die Amplitude mit steigender Frequenz abnimmt. c Lehrstuhl E13, TUM, 2010 3.3. FOURIER-ANALYSE UND -SYNTHESE 66 Aufgrund dessen wird ein Rechtecksignal auch häufig zum Testen elektronischer Schaltungen genommen, da so das Frequenzverhalten dieser Schaltung erkannt wird. Abbildung 3.7: Zerlegung eines Rechtecksignals in eine Fourier-Reihe (hier ω0 = 1). Versuch 1642: Fourier-Analyse von akustischen Schwingungen Ein akustisches Signal (z.B. Stimmgabel, Pfeifton oder Geige) wird über ein Mikrophon und einem Messwerterfassungssystem (PASCO) auf den PC gegeben und vom Programm Science Workshop in Echtzeit analysiert. Diskrete oder analoge Signale werden mit Hilfe der sogenannten Fourier-Transformation in ihr Frequenzspektrum transformiert und im Spektralraum analysiert. Im Vergleich zur Discrete Fourier Transformation (DFT) ist die Fast Fourier Transformation (FFT) das schnellere Verfahren. Abbildung 3.8: Zerlegung eines Klangspektrums in eine Fourier-Reihe. c Lehrstuhl E13, TUM, 2010 3.4. DOPPLER EFFEKT 67 Die Fourier-Synthese hingegen beschreibt das umgekehrte Verfahren, die Erzeugung beliebiger Signale aus Sinus- und Kosinusfunktionen. Abbildung 3.9: Fourier-Synthese eines Rechtecksignals Im Abbildung 3.9 ist die Fourier-Synthese eines Rechtecksignals dargestellt. Die Diagramme der ersten Spalte zeigen diejenige Schwingung, die in der jeweiligen Zeile hinzugefügt wird. Die Diagramme in der zweiten Spalte zeigen alle bisher berücksichtigten Schwingungen, die dann in den Diagrammen der dritten Spalte aufaddiert werden, um dem zu erzeugenden Signal möglichst nahe zu kommen. Die Schwingung aus der ersten Zeile ist die Grundschwingung, alle weiteren, die hinzugefügt werden, sind die Oberschwingungen. Je mehr solcher Vielfache der Grundfrequenz berücksichtigt werden, um so näher kommt man einem idealen Rechtecksignal. An den unstetigen Stellen der Rechteckfunktion bildet sich durch die Fourier-Synthese bedingt ein so genannter Überschwinger, der auch bei genauerer Approximation nicht verschwindet. Die vierte Spalte zeigt das Amplitudenspektrum. 3.4 Doppler Effekt Als Doppler Effekt bezeichnet man die Veränderung der (wahrgenommenen oder gemessenen) Frequenz von Wellen, während sich die Quelle und der Beobachter mit der Gechwindigkeit v0 einander nähern oder voneinander entfernen, sich also relativ zueinander bewegen (siehe Abb. 3.10). Für die Berechung der Frequenzverschiebung sind die folgenden Fälle zu unterscheiden: c Lehrstuhl E13, TUM, 2010 3.4. DOPPLER EFFEKT 68 a) Beobachter bewegt sich, Quelle ruht: Die Schwingungen einer Schallquelle breiten sich in Form von Kugelwellen in der Luft aus. Bewegt sich der Beobachter mit der Geschhwindigkeit vB radial auf die Quelle zu, so kommen die Verdichtungen und Verdünnungen der Luft in rascherer Folge auf ihn zu als beim Stillstand. Der zeitliche Abstand zwei aufeinanderfolgender Verdichtungen, die beim Boebachter ankommen, ist λ TB = . (3.8) c + vB Mit c = λ fQ folgt vB fB = fQ 1 + > fQ . (3.9) c Entfernt sich der Beobachter gilt entsprehend vB < fQ . (3.10) fB = fQ 1 − c Bewegt sich der Beobachter auf einem konzentrischen Kreis um die Quelle herum, so ist keine Dopplerverschiebung zu beobachten. Abbildung 3.10: oben: Quelle und Beobachter nähern sich und die Frequenz erhöht sich. unten: Quelle und Beobachter entfernen sich und die Frequenz erniedrigt sich. a) Beobachter ruht, Quelle bewegt sich: Bewegt sich die Quelle mit der Geschwindigkeit vQ auf den Beobachter zu, so sind die Abstände zwischen den Wellenflächen auf der Vorderseite gestaucht und auf der Rückseite gedehnt (siehe Abbildung 3.11). Entsprechend ist für den Beobachter die wirksame Wellenlänge λB = λ − vQ TQ verkürzt und die Frequenz, die der Beobachter wahrnimmt fB = c λB (3.11) erhöht. Mit c = λ fQ folgt fB = c Lehrstuhl E13, TUM, 2010 fQ v 1 − cQ . (3.12) 3.4. DOPPLER EFFEKT 69 Entfernt sich die Quelle vom Beobachter so gilt fB = fQ v 1 + cQ . (3.13) Bei kleinen Geschwindigkeiten sind die Frequenzverschiebungen sehr ähnlich zu denen mit invertierter Bewegung. Für Geschwindigkeiten nahe an der Schallgeschwindigkeit c sind die Unterschiede jedoch erheblich. Versuch 1760: Akustischer Dopplereffekt Ein kleiner Lautsprecher ist an einem langen Arm befestigt, der seinerseits auf der Achse eines Elektromotors sitzt und in der Waagerechten rotieren kann. Der Rotationsdurchmesser beträgt etwa 2m, die Drehzahl maximal etwa 2 Umdrehungen pro Sekunde. Der Lautsprecher gibt einen konstanten Ton von sich, der mit einer eingebauten Minischaltung samt Batterie erzeugt wird. Lässt man ihn rotieren, so hört man eine deutliche Frequenzschwankung im Rhythmus der Drehfrequenz. Machscher Kegel Ein sich mit der Geschwindigkeit vq bewegendes Objekt schiebt durch die Verdrängung des Mediums kurzzeitig eine Verdichtungsfront vor sich her, die sich nach dem Ablösen entsprechend der Schallwellen kugelförmig ausbreitet (siehe Abblidung 3.11 links). Abbildung 3.11: links: Die Quelle bewegt sich mit vq = c. mitte: Die Quelle bewegt sich mit vq > c. rechts: Flug mit Überschallgeschwindigkeit - auf die Stoßfront folgende Unterdruckphase kühlt die Luft ab und bringt dadurch den Wasserdampf der Luft zur Kondensation, was den Machschen Kegel sichtbar macht. Mit zunehmender Geschwindigkeit der Quelle nähern sich die Wellenflächen auf der Vorderseite immer mehr, bis sie schließlich für vq = c durch einen Punkt gehen und die Einhüllende wie eine ebene Wand aussieht. Durchstößt die Quelle (Flugzeug) diese Schallmauer und fliegt mit Überschallgechwindigkeit (vq > c), dann stellt sich ein Wellenfeld nach Abbildung 3.11 mitte ein. An der Spitze des Kegels befindet sich das auslösende Objekt. Dieses muß selbst gar keine Schallwellen aussenden! Bei seiner Bewegung drängt es die Luftmoleküle zur Seite, erzeugt also vor sich eine Druckerhöhung und hinter sich eine Druckerniedrigung. Diese Druckwellen breiten sich vom jeweilgen Entstehungspunkt c Lehrstuhl E13, TUM, 2010 3.5. MODULATIONSVERFAHREN 70 kugelförmig im Raum aus. Die Überlagerung aller Kugelwellen ergibt als Einhüllende einen Kegel, den Machschen Kegel. Der halbe Spitzenwinkel Θ dieses Kegels heißt Machscher Winkel sin Θ = c . vq (3.14) Weil sich auf dem Kegelmantel die Druckerhöhungen aufaddieren, hört ein Beobachter, über den diese Stoßfront hinwegrast, einen Knall (den Überschallknall). In Luft beträgt die Schallgeschwindigkeit unter Normalbedingungen (Luft bei 15o C) 343 m/s, was etwa 1235 km/h entspricht. Die relative Geschwindigkeit eines Objektes zur Schallgeschwindigkeit in Luft wird auch mit der dimensionslosen Mach-Zahl bezeichnet, so bedeutet Mach 1 die Bewegung mit Schallgeschwindigkeit, Mach 2 diejenige mit der doppelten Schallgeschwindigkeit usw. 3.5 Modulationsverfahren Die Modulation beschreibt in der Nachrichtentechnik einen Vorgang, bei dem ein zu übertragendes Nutzsignal (Musik oder Sprache) ein sogenanntes Trägersignal verändert (moduliert) und damit die Übertragung des Nutzsignals über das Trägersignal möglich wird. Dabei vergrößert das Nutzsignal immer auch die Frequenzbandbreite des Trägersignals. Die Nachricht wird später empfangsseitig durch einen Demodulator wieder zurückgewonnen. Abbildung 3.12: links: Die zu modulierende Schwingung wird Grundschwingung (Trägerschwingung) genannt. Die Grundschwingung bestimmt die Tonhöhe und die Lautstärke des Tones. Die Schwingung, welche die Schwankung der Lautstärke um den Mittelwert verursacht, wird modulierende Schwingung, ihre Frequenz Modulationsfrequenz genannt. rechts: Die zu modulierende Schwingung wird Grundschwingung genannt, diese bestimmt die Grundtonhöhe und die Lautstärke des Tones. Die Frequenz der modulierenden Schwingung, welche die Tonhöhenschwankung verursacht, wird Modulationsfrequenz genannt. c Lehrstuhl E13, TUM, 2010 3.5. MODULATIONSVERFAHREN 71 Das Trägersignal selbst ist bezüglich der übertragenen Nachricht ohne Bedeutung, es ist nur zur Anpassung an die physikalischen Eigenschaften des Übertragungskanals notwendig. 3.5.1 Amplitudenmodulation In der Amplitudenmodulation wird die Amplitude einer hochfrequenten Trägerwelle abhängig vom zu übertragenden, niederfrequenten (modulierenden) Nutzsignal verändert. Ändert man die Amplitude eines reinen Tones periodisch über der Zeit, so weist das Resultat zwar eine konstante Tonhöhe aber eine sich periodisch verändernde um einen Mittelwert schwankende Lautstärke auf (siehe Abbildung 3.12). Niederfrequente Nutzsignale wie Sprache oder Musik können häufig nicht direkt über gewünschte Übertragungsmedien wie beispielsweise einen Funkkanal übertragen werden. Zur Übertragung muss das Nutzsignal im Frequenzbereich verschoben werden, was durch die Amplitudenmodulation erreicht werden kann. Durch das Verschieben in unterschiedliche Frequenzbereiche können mehrere Nutzsignale gleichzeitig und ohne gegenseitige Störung übertragen werden. 3.5.2 Frequenzmodulation Bei der Frequenzmodulation wird die Trägerfrequenz durch das zu übertragende Signal verändert. Eine frequenzmodulierte Schwingung weist eine konstante Amplitude bei sich periodisch ändernder Frequenz auf. Ändert man die Frequenz eines reinen Tones periodisch über der Zeit, so erhält man einen Ton konstanter Lautstärke aber mit sich periodisch ändernder Tonhöhe (siehe Abbildung 3.12). Die Frequenzmodulation ermöglicht gegenüber der Amplitudenmodulation einen höheren Dynamikumfang des Informationssignals. Weiterhin ist sie weniger anfällig gegenüber Störungen. 3.5.3 Phasenmodulation Das modulierte Sendesignal kann bei der Phasenmodulation allgemein durch eine Sendefrequenz dargestellt werden, deren Frequenz sich nur dann in gewissem Umfang ändert wenn sich die zu übertragende Nutzsignalfrequenz zeitlich verändert. Durch diese Frequenzänderung wird eine Phasenverschiebung vom Sendesignal zur ursprünglichen Sendefrequenz erreicht. Ist die zu übertragende Nutzsignalfrequenz zeitlich konstant, wird die Sendefrequenz ausgegeben. c Lehrstuhl E13, TUM, 2010 Kapitel 4 Optik Die Optik beschreibt die Ausbreitung von Licht und dessen Wechselwirkung mit Materie insbesondere im Zusammenhang mit optischen Abbildungen. Optik wird daher oft auch als die Lehre vom Licht bezeichnet. Es werden zwei klassische Zugänge zur Lichtausbreitung unterschieden: Die Wellenoptik und die geometrische Optik. Grundlage der Wellenoptik ist die Wellennatur des Lichts. Die Gesetzmäßigkeiten der geometrischen Optik gelten für den Fall, dass die Abmessungen des optischen Systems sehr groß sind gegenüber der Wellenlänge des Lichts. 4.1 Eigenschaften des Lichts Mit Welle-Teilchen-Dualismus wird ein klassischer Erklärungsansatz der Quantenmechanik bezeichnet, der besagt, dass Objekte aus der Quantenwelt sich in manchen Fällen nur als Wellen, in anderen nur als Teilchen beschreiben lassen. Jede Strahlung hat sowohl Wellenals auch Teilchencharakter, aber je nach dem durchgeführten Experiment tritt nur der eine oder der andere in Erscheinung. Im Teilchenbild besteht das Licht aus Lichtteilchen, sogenannten Photonen. Das Photon hat hierbei die Energie E, die von der Wellenlänge λ bzw. der Frequenz f der Lichtwelle abhängen hc E = hf = . (4.1) λ Hierbei bezeichnen c = 2.998 · 108 m/s die (Vakuum-)Lichtgeschwindigkeit und h = 6.626 · 10−34 Js eine Konstante, das sogenannte Planck’sche Wirkungsquantum. Die Ausbreitung von Licht wird am einfachsten durch die Welleneigenschaften erklärt, während der Austausch von Energie zwischen Licht und Materie (z.B. Beim Photoeffekt) durch Teilcheneigenschaften erklärbar ist. Ein Teilchen mit dem Impuls p weist auch Welleneigenschaften mit der de-Broglie Wellenlänge h λ= (4.2) p 72 4.1. EIGENSCHAFTEN DES LICHTS 73 auf. Entsprechend verknüpft die sogenannte de-Broglie Wellenlänge das Teilchen- und Wellenbild. Abbildung 4.1: Die Gesamtheit aller strahlender Energiearten oder Wellenfrequenzen, von den kürzesten bis zu den längsten Wellenlängen, bildet das elektromagnetische Spektrum. Unter Licht wird in der Regel der sichtbare Teil des elektromagnetischen Spektrums (siehe Abb. 4.1) zwischen ca. 380 nm bis 780 nm verstanden. In der Physik wird als optisches Spektrum häufig auch der Frequenzbereich ab einer Frequenz von 100 THz bis 800 THz definiert. Hierunter fällt also auch unsichtbares Licht, wie z. B. das Infrarotlicht oder das ultraviolette Licht. Viele Gesetzmäßigkeiten und Methoden der klassischen Optik gelten allerdings auch außerhalb des Bereichs des sichtbaren Lichts. Dies erlaubt eine Übertragung der Erkenntnisse der Optik auf andere Bereiche des elektromagnetischen Spektrums. 4.1.1 Farben Eine Spektralfarbe (reine Farbe) ist jener Farbeindruck, der durch Licht einer festen Wellenlänge (monochromatisches Licht) im sichtbaren Teil des Lichtspektrums entsteht. Wir ordenen also einzelnen Lichtwellenlängen λ= Farben zu. Versuch 3140: Additive Farbmischung c Lehrstuhl E13, TUM, 2010 c f (4.3) 4.1. EIGENSCHAFTEN DES LICHTS 74 Drei Diaprojektoren enthalten je eine Lochblende, die mit einer Farbfolie abgedeckt ist (rot, grün und blau). Die Farbkreise werden so abgebildet, daß sie sich teilweise überlappen. Man sieht dann außer den drei reinen Farben die aus je zwei Farben entstehenden additiven Mischungen und schließlich die in der Mitte entstehende Summenfarbe Weiß. In der additiven Farbmischung werden aktiv leuchtende bzw. beleuchtete Lichtquellen verschiedener Farben überlagert. Rot (R), Grün (G) und Blau (B) sind die Primär- oder Grundfarben des additiven Modells. Die drei Grundfarben ergeben bei geeignetem Mischverhältnis nach der additiven Farbmischung Weiß. Ein typisches Beispiel sind die Pixel bei Bildschirmen (Fernseher, Computer, usw.). Das zugehörige Modell wird bezugnehmend auf die drei Grundfarben als RGB-Modell bezeichnet. Abbildung 4.2: Additive Farbmischung aus den drei Grundfraben Rot, Grün und Blau. In der Mitte überschneiden sich alle drei Lichtkegel, hier sieht man die Tertiärfarbe Weiß. Die ersten reinen Mischfarben der Primärfarben im Verhältnis 1 zu 1 sind Cyan (Cyanblau), Magenta (Magentarot) und Yellow (Optimalgelb). Sie heißen Sekundärfarben des (additiven) Modells. Sie sind gleichzeitig auch die Komplementärfarben zu den Primärfarben. In der Mitte überschneiden sich alle drei Lichtkegel und es ergibt sich die Tertiärfarbe Weiß. Die unbunte Grundfarbe Schwarz wird durch die Dunkelheit im Raum repräsentiert. Versuch 3145: Komplementärfarben Wir erzeugen mit einem Geradsichtprisma das kontinuierliche Spektrum der Bogenlampe oder 24 V Halogenlampe als Zwischenbild. In diesem Zwischenbild kann man mit einem Spiegel einen Teil des Spektrums auslenken und sowohl den ausgelenkten Teil als auch das Restspektrum mit einer Zylinderlinse wieder zum Bild des Spaltes vereinigen. Je nach Stellung des Spiegels sieht man zwei Spaltbilder in verschiedenen Komplementärfarben. Die subtraktive Farbmischung beruht auf der Absorption von Teilen des Lichtspektrums durch die Körperoberfläche, so dass nur die verbleibenden Anteile durchgelassen oder reflektiert werden. c Lehrstuhl E13, TUM, 2010 4.1. EIGENSCHAFTEN DES LICHTS 75 Der Farbauftrag absorbiert den komplementären Farbanteil im Licht und reflektiert deshalb nur seinen Farbton. Dies ist gleichbedeutend mit dem Einfügen von Filtern in einen weißen Lichtstrahl. Die drei Primärfarben sind Yellow (Y, Gelb), Magenta (M) und Cyan (C). Diese drei Grundfarben ergeben bei geeignetem Mischverhältnis nach subtraktiver Farbmischung Schwarz. Die Sekundärfarben sind die Farben Rot (R), Grün (G) und Blau (B). Abbildung 4.3: Subtraktive Farbmischung aus den drei Grundfarben Yellow (Gelb), Magenta und Cyan. In der Mitte überschneiden sich alle drei Farben, hier sieht man die Tertiärfarbe Schwarz. Das zugehörige Modell wird bezugnehmend auf die drei Grundfarben als CMY-Modell bezeichnet und findet in der Malerei und Druckgrafik Anwendung. In der Praxis sind Farbstoffe allerdings nicht in der theoretisch erforderlichen Reinheit verfügbar. Aus technischem Grund wird meist zu Cyan, Magenta, und Yellow als Ergänzung noch Schwarz eingesetzt (CMYK-Modell). Dadurch erhält man z.B. beim Drucken mit Tintenstrahldruckern eine Qualitätsverbesserung. 4.1.2 Lichtquellen Eine Lichtquelle ist der Ursprungsort von Licht. Lichtquellen 1. Ordnung sind selbstleuchtende Lichtquellen. Dazu gehören u. a. die Sonne, Sterne, Lampen, Glühwürmchen, Feuer usw. Als Lichtquellen 2. Ordnung bezeichnet man Körper, die Licht nur reflektieren und nicht selbst leuchten. Hierzu zählen z. B. der Mond, Rückstrahler an Fahrzeugen. Die Strahlstärke (Lichtstärke) einer Punktquelle, die den Strahlungsfluss dΦ pro Raumwinkel dΩ emittiert, ist dΦ I= . (4.4) dΩ Die Einheit der Lichtstärke ist das Candela (cd). Versuch 4067: Strahlung verschiedener Oberflächen bei gleicher Temperatur Ein Metallwürfel (Leslie-Würfel) von etwa 10 cm Kantenlänge ist innen hohl und hat verschieden behandelte Oberflächen: glänzend, weiß und schwarz lackiert. Er wird mit c Lehrstuhl E13, TUM, 2010 4.1. EIGENSCHAFTEN DES LICHTS 76 heißem Wasser über einen Thermostaten gefüllt und auf eine drehbare Unterlage gestellt. Schaut man jetzt seine verschiedenen Oberflächen mit einem Bolometer an, dessen Strom man mit einem Galvanometer sichtbar macht, so stellt man fest, dass die schwarze Fläche am meisten und die glänzende Fläche am wenigsten Wärme abstrahlt. Thermische Strahler Thermische Strahler liefern eine kontinuierliche Strahlung. Ein schwarzer Strahler (auch: schwarzer Körper, planckscher Strahler) ist ein idealisierter Körper, der die auf ihn treffende elektromagnetische Strahlung egal welcher Wellenlänge vollständig absorbiert. Er ist zugleich eine ideale thermische Strahlungsquelle, die elektromagnetische Strahlung mit einem charakteristischen, nur von der Temperatur abhängigen Spektrum aussendet. Intensität und Frequenzverteilung der von einem schwarzen Körper ausgesandten elektromagnetischen Strahlung werden durch das von Max Planck aufgestellte plancksche Strahlungsgesetz beschrieben. Die spezifische spektrale Ausstrahlung bei Temperatur T ist 2 2π h c 1 . i h (4.5) Meλ = 5 hc λ −1 exp λ kB T Hierbei bezeichnet kB = 1.381 · 10−23 J/K die Boltzmann-Konstante. Abbildung 4.4: Verteilung der Intensität der abgegebenen Strahlung in Abhängigkeit von der Wellenlänge. Je höher die Temperatur, desto weiter verlagert sich das Maximum zu kleineren Wellenlängen. c Lehrstuhl E13, TUM, 2010 4.1. EIGENSCHAFTEN DES LICHTS 77 Die spezifische spektrale Ausstrahlung nimmt bei jeder Wellenlänge mit der absoluten Temperatur zu. Das Maximum λmax der Kurven verschiebt sich, gemäß dem Wienschen Verschiebungsgesetz, mit zunehmender Temperatur zu kürzeren Wellenlängen λmax T = hc 4.966 kB . (4.6) Für den Temperaturbereich zwischen 5000 und 6000 K fällt das Maximum in den sichtbaren Bereich des elektromagnetischen Spektrums. Die gesamte spezifische spektrale Ausstrahlung Me bei einer Temperatur T ist die Fläche unter der Kurve der Schwarzkörperstrahlung und folgt durch Integration über alle Wellenlängen Z ∞ Meλ dλ = σT 4 , Me = (4.7) 0 wobei σ = 5.67 · 10−8 W/(m2 K4 ) die Stefan-Boltzmann Konstante ist. Dieser Zusammenhang wird als Stefan-Boltzmann Gesetz bezeichnet. Sonnenspektrum Das Spekturm der Sonne kommt einer idealen Schwarzkörperstrahlung für eine Temperatur von 5762 K recht nahe. Oberhalb der Erdatmosphäre liegt entsprechend eine extraterrestrische Strahlung von 1350 W/m2 vor. Auf dem Weg durch die Atmosphäre wird die spektrale Verteilung der Sonnenstrahlung durch Absorption und Streuung verändert. Vor allem durch Wasserdampf, Sauerstoff und Kohlendioxid wird die meist selektive Absorption verursacht, woraus sich Bandlücken ergeben. Lediglich Ozon absorbiert in einem breiten Spektrum von 200 bis 700 nm und filtert somit (siehe Abbildung 4.5) einen großen Teil der UV-Strahlung (links des sichtbaren Bereichs) aus. Abbildung 4.5: Das Spektrum eines (a) schwarzen Körpers ist mit dem (b) Sonnenspektrum über der Atmosphäre und (c) auf der Erde verglichen. c Lehrstuhl E13, TUM, 2010 4.1. EIGENSCHAFTEN DES LICHTS 78 Der Strahlungsfluss Φ, der von der Sonne auf der Erde zu beobachten ist, hängt vom Einfallswinkel β (gemessen zum Lot) ab. Diese Abhängigkeit läßt sich über das Lambertsche Gesetz beschreiben: Φ = Φ0 cos(β) , (4.8) wobei Φ0 den Strahlungsfluss bei senkrechtem Einfall bezeichnet. Auf dem Weg durch die Atmosphäre kann die Strahlung absorbiert oder gestreut werden. Bei Absorption nimmt der Strahlungsfluss exponentiell ab: Φ = Φ0 exp(−tl) . (4.9) Der Strahlungsfluss vor dem Eintreffen in die Atmosphäre Φ0 wird also abhängig vom Absorptionskoeffizienten t und der Länge des Weges durch die Atmosphäre l reduziert. Um die Änderung des Sonnenspektrums auf dem Weg durch die Erdatmosphäre zu charakterisieren, führte man den Begriff der Air Mass (AM) ein. AM0 steht dabei für die Strahlung vor dem Eintreten in die Atmosphäre, AM1 kennzeichnet den senkrechten Einfall des Sonnenlichts auf die Erdoberfläche. Umgerechnet in den Strahlungsstrom ergeben sich für die Air Mass in etwa folgende Werte: AM0: 1350 W/m2 , AM1: 925 W/m2 , AM1.5: 844 W/m2 und AM2: 691 W/m2 . Abbildung 4.6: AM-Werte für verschiedene Tage im Jahr in Berlin. Versuch 3357: Modellauto mit Solarzellenantrieb Der Motor eines Modellautos wird über sechs am Heck angebrachte Solarzellen angetrieben, indem man sie mit einer starken Lichtquelle (Fotolampe oder Spot) beleuchtet. Die Geschwindigkeit bleibt jedoch trotz hoher Energiezufuhr relativ klein. Es bewältigt auch nur kleine Steigungen. Eine Solarzelle oder photovoltaische Zelle ist ein elektrisches Bauelement, das die im Licht (in der Regel Sonnenlicht) enthaltene Strahlungsenergie direkt in elektrische Energie wandelt. Die physikalische Grundlage der Umwandlung ist der photovoltaische Effekt. Der photovoltaische Effekt ist ein Sonderfall des inneren photoelektrischen Effekts (siehe nächstes Semester). c Lehrstuhl E13, TUM, 2010 4.1. EIGENSCHAFTEN DES LICHTS 79 Gasentladungslampen Gasentladungslampen sind Lichtquellen, die zur Lichterzeugung eine Gasentladung verwenden. Dabei werden die spontane Emission durch atomare oder molekulare elektronische Übergänge und die Rekombinationsstrahlung eines durch elektrische Entladung erzeugten Plasmas ausgenutzt. Ein Unterscheidungskriterium der Gasentladungslampen ist der Druck im Entladungsgefäß: • Niederdruck-Entladungslampen (Niederdruck-Plasma, Glimmentladung, z. B. Leuchtröhren, Leuchtstofflampen, Neonröhren) • Hochdruck-Entladungslampen (Drücke bis etwa 1 MPa, z. B. Quecksilberdampflampen, Krypton-Bogenlampen zur Laser-Anregung) • Höchstdruck-Lampen (Drücke bis etwa 10 MPa, z. B. Quecksilberdampf-Höchstdrucklampen in der Fotolithografie, Xenonlampe im Auto) Abbildung 4.7: Die Kathode ist von einer scharf begrenzten, dünnen, violetten Schicht, dem negative geladenen Glimmsaum, bedeckt, dem sich ein erster schmaler und ebenfalls scharf begrenzter Dunkelraum, der Hittorfsche Dunkelraum, anschließt. Es folgt das negative Glimmlicht, das diffus in den zweiten, den Faradayschen Dunkelraum, übergeht. Die anschließende, jetzt fahlrot leuchtende positive Säule nimmt nur noch die halbe Länge des Entladungsrohrs ein. Versuch 3340: Gasentladung In einem Gasentladungsrohr von etwa 5 cm Durchmesser und ca. 50 cm Elektrodenabstand wird die Glimmentladungsausbildung in Luft untersucht. Als Spannungsquelle dient ein Funkeninduktor oder ein Hochspannungsgerät, mit dem man Gleichspannungen über 10 KV bei Stromstärken im mA-Bereich erzeugen kann. Die Druckvariation wird mittels Drehschieberpumpe erreicht. Bei einem Druck von einigen zehn Millibar tritt eine bläuliche, fadenstrahlartige Entladung auf. Diese Entladung verbreitert sich, wenn der Druck mit der Drehschieberpumpe weiter reduziert wird. Sobald die Glimmentladung das gesamte Entladungsrohr ausfüllt, kann man drei ausgeprägte Leuchterscheinungen unterscheiden: unmittelbar an der Kathode befindet sich eine schmale, violett leuchtende Schicht, das negative Glimmlicht; es folgt ein Dunkelraum, der nach seinem Entdecker der Faradaysche Dunkelraum genannt wird; an diesen Dunkelraum schließt sich ein langes, intensiv rot leuchtendes Band, die positive Säule, an. Die positive Säule reicht bis zur Anode. Bei weiterer Verminderung des Drucks dehnen sich das negative Glimmlicht und der Dunkelraum immer weiter aus, während die positive Säule langsam schrumpft. Bei ca. 1 mbar entspricht die Leuchterscheinung etwa der in Abbildung 4.7 dargestellten Form. Bei etwa c Lehrstuhl E13, TUM, 2010 4.2. AUSBREITUNG VON LICHT 80 10−1 mbar verschwindet die positive Säule vollkommen und das negative Glimmlicht erfüllt den Großteil des Rohrs. Bei weiterem Evakuieren schwindet das Leuchten der Entladung immer mehr, bis man schließlich nur mehr bläuliches Fluoreszieren der Glaswand beobachtet. Über zwei Elektroden fließt ein Strom durch das ionisierte Gas, das in einer Quarzröhre eingeschlossen ist. Das elektrische Feld zwischen den Elektroden beschleunigt die Elektronen so, dass sie die Gasatome ionisieren können. Beim Übergang der Gasatome in energetisch tieferliegende Zustände wird Energie in Form von Strahlung (Photonen) frei. Die Photonenenergie Emn entspricht der Differenz der diskreten Energien Wm und Wn der zugehörigen Schalen m und n des Gasatoms Emn = hfnm = Wm − Wn . (4.10) Es entsteht ein Linienspektrum. Bei niedrigem Druck und niedrigen Stromstärken treten diese scharfe Spektrallinien auf. Bei Betriebsbedingungen wie hoher Druck oder hohe Temperatur ergibt sich zusätz zu verbreiterten Spektrallinien eine kontinuierliche spektrale Verteilung. Versuch 3335: Gitterspektrum von Quecksilber Das Linienspektrum von Hg wird mit einem Gitterspektrograph in verkürzter Bauweise gezeigt. Wir benutzen Gitter verschiedener Strichzahl, um das Auftreten der zweiten Beugungsordnung zu zeigen. Die nullte Ordnung (weiß) muss wegen der hohen Intensität mit einem schwarzen Papierstreifen ausgeblendet werden. 4.2 Ausbreitung von Licht Es gibt zwei grundlegende Arten für die Beschreibung der Lichtausbreitung, abhängig von der Wellenlänge λ im Vergleich zur Größe des Objekts (Objektgröße), welches beleuchtet wird: • λ << Objektgröße: Die Beschreibung erfolgt durch die geometrische Optik. Das Licht wird als Strahl betrachtet und breitet sich geradlinig von seiner Quelle aus. • λ ∼ Objektgröße: Die Beschreibung erfolgt durch die Wellenloptik. Licht besteht aus elektrischen und magnetischen Feldern, die sich wellenförmig ausbreiten (elektromagnetische Welle). Versuch 3000: Schatten in geometrischer Optik und Interferenzoptik Ein paralleler veränderlicher Spalt wird von einer Lichtquelle (Laser mit Mikroskopoptik 10-fach) beleuchtet und sein Schatten auf die Leinwand projiziert. Bei weit geöffnetem Spalt sieht man den geometrischen Schatten auf der Leinwand. Verengt man den Spalt allmählich, so wird zunächst auch das Schattenbild enger, dann aber wieder weiter. Zusätzlich tauchen Interferenzstreifen neben dem geometrischen Schatten auf. c Lehrstuhl E13, TUM, 2010 4.2. AUSBREITUNG VON LICHT 4.2.1 81 Beugung Beugung bezeichnet die Ablenkung von (Licht-)Wellen an einem Hindernis. Bei Beugungserscheinungen kann sich die Welle im geometrischen Schattenraum des Hindernisses (Kante, Spalt, Gitter, usw.) ausbreiten. Zur Beugung kommt es durch Entstehung neuer Wellen entlang einer Wellenfront gemäß dem Huygensschen Prinzip. Abbildung 4.8: links: Bei der Beugung an einem spaltförmigen Hindernis breiten sich die Wellen hinter dem Hindernis auch im geometrischen Schattenraum aus. rechts: Beispiele für das Huygenssche Prinzip mit alten und neuen Wellenfronten für ebene Wellen (links) und Kugelwellen (rechts). Huygenssches Prinzip: Jeder Punkt einer Wellenfront kann als Ausgangspunkt von Elementarwellen angesehen werden, die sich mit gleicher Geschwindigkeit und Wellenlänge wie die ursprüngliche Welle ausbreiten. Die Einhüllende dieser Elementarwellen stellt die neue Wellenfront dar. 4.2.2 Reflektion Beim Übergang einer Lichtwelle in ein anderes Medium wird ein Teil reflektiert, der andere Teil dringt in das Medium ein. Versuch 3005: Reflektionsgesetz Der Versuch wird entweder an der optischen Wand oder (besser) mit einem eigens dafür gebauten drehbaren Spiegel vor einer Styroporplatte gezeigt. Im zweiten Fall nimmt man einen Diaprojektor mit Lochblende als Lichtquelle und arbeitet mit einem streifendem Lichtstrahl. Fällt ein Lichtstrahl unter einem Winkel α auf einen ebenen Spiegel ein so wird er unter demselben Winkel β wieder reflektiert: α = β. Beide Winkel werden zum Einfallslot (auf die Spiegeloberfläche) gemessen. c Lehrstuhl E13, TUM, 2010 4.2. AUSBREITUNG VON LICHT 82 Abbildung 4.9: links: Reflektion an der Grenzfläche zwischen zwei Medien mit unterschiedlichem Brechungsindex n1 und n2 . rechts: Glatte Oberflächen reflektieren das Licht und wirken so wie Spiegel. Bei Reflektion gilt das Reflektionsgesetz wonach der Einfallswinkel α gleich dem Ausfallswinkel β ist α=β . (4.11) Die einfallende und die reflektierte Welle laufen jeweils mit der Geschwindigkeit c1 im gleichen Medium n1 (siehe Abb. 4.9). 4.2.3 Fermatsches Prinzip Nach dem Fermatschen Prinzip muss der optische Weg (Produkt aus Brechungsindex und geometrischem Weg) einen Extremwert annehmen (also ein Minimum). Abbildung 4.10: Beispiele für verschiedene Lichtwege zwischen den Punkten A und B. Licht nimmt nach dem Fermatschen Prinzip den kürzesten Weg ACB. Mathematisch lautet das Fermatsche Prinzip: Die Zeit Z s2 n(s) t= ds s1 c(n(s)) ist minimal. Die Lichtwelle folgt also dem Weg, bei dem die Laufzeit minimal ist. c Lehrstuhl E13, TUM, 2010 (4.12) 4.2. AUSBREITUNG VON LICHT 83 Abbildung 4.11: links: bikonkave Linse, rechts: bikonvexe Linse Das Fermatsche Prinzip ist die Grundlage der geometrischen Lichtoptik, in der Licht als Strahl verstanden wird. Es findet beispielsweise bei allen Konstruktionen an Linsen Anwendung. 4.2.4 Snelliussches Brechungsgesetz Eine (Licht-)Welle wird gebrochen, ändert also ihre Richtung, wenn sie von einem transparenten Medium in ein anderes transparentes Medium mit einem anderen Brechungsindex übergeht. Abbildung 4.12: links: Brechung an der Grenzfläche zwischen zwei Medien mit unterschiedlichen Brechungsindices n1 und n2 . c0 bezeichnet die Lichtgeschwindigkeit im Vakuum. rechts: Durch Brechung erscheint der Buntstift nicht gerade sondern unterhalb der Wasseroberfläche unter einem Winkel abgeknickt. Geht der Lichtstrahl vom Medium mit Brechungsindex n1 in das Medium mit dem Brechungsindex n2 über, so ist sin α c1 n2 = = (4.13) sin γ c2 n1 und wegen Energieerhaltung (also auch Frequenz f = konst.) λ1 c1 = , c2 λ2 c Lehrstuhl E13, TUM, 2010 (4.14) 4.2. AUSBREITUNG VON LICHT 84 wobei α den Einfallswinkel und γ den Brechungswinkel gemessen zum Lot bezeichnen. Das Snelliussche Brechungsgesetz ist eine Folgerung des Fermatschen Prinzips. 4.2.5 Totalreflexion Totalreflexion kann nur bei dem Übergang eines Lichtstrahls von einem optisch dichteren Medium (Wasser) in ein optisch dünneres Medium (Luft) erfolgen. Dabei geht keinerlei Energie verloren. Versuch 3046: Totalreflexion im Wasserstrahl In unserem Versuch schießen wir mit einem He-Ne-Laserstrahl im rechten Winkel zur Grenzfläche (keine Totalreflexion!) durch die verengte Öffnung (Glasrohr im Korken) eines 5 Liter Wassertrogs und führen ihn in einen ausfließenden Wasserstrahl. Dort wird er solange im Strahl totalreflektiert, bis sich der Strahl in einzelne Tropfen auflöst. Die Sichtbarkeit des Lichts im Strahl erreichen wir durch Streuung an kleinen aufgeschwemmten Teilchen. Abbildung 4.13: Beispiele für verschiedene Einfallswinkel des Lichts auf die Grenzfläche zwischen einem optisch dichteren und dünneren Medium (Übergang Glasfaser in Luft): 1) Einfallswinkel 0o , 2) 30o , 3) 41,8o und 4) 45o . Ein Lichtstrahl, der aus einem optisch dichteren Medium kommt und auf die Grenzfläche zu einem optisch dünneren Medium fällt, wird gemäß dem Snelliusschen Brechungsgesetz vom Einfallslot weg gebrochen. Der Brechungswinkel ist also größer als der Einfallswinkel des Lichts. Vergrößert man den Einfallswinkel, so verläuft der gebrochene Strahl ab einem bestimmten Wert parallel zur Grenzfläche (siehe Abb. 4.13.3). Dieser Winkel wird Grenzwinkel der Totalreflexion αtot oder auch kritischer Winkel αc genannt. Beispiel Glasfaser: Es ist nLuf t < nGlas , so daß Totalreflexion beim Austritt von Licht aus der Glasfaser möglich ist. Am Grenzwinkel der Totalreflexion ist der Ausfallswinkel erneut β = 90o . Entsprechend ist sin β = 1 und es folgt 1 nGlas = sin αc nLuf t c Lehrstuhl E13, TUM, 2010 (4.15) 4.2. AUSBREITUNG VON LICHT 85 und so mit für den Grenzwinkel der Totalreflexion nLuf t αc = arcsin . nGlas (4.16) Bei einer Glasfaser mit einem Brechungsindex von 1.5 (BK 7-Glas) ergibt dies αc = 41.8o . Abbildung 4.14: links: Übergang von Glas zu Luft. rechts: Aufbau einer Glasfaser mit Faserkern, Fasermantel und Isolation. Versuch 3045: Lichtleiter Der Strahl eines He-Ne-Lasers wird durch einen Lichtleiter geschickt, in den man einen Knoten gemacht hat. Das Licht ist in der Lage diesem Knoten zu folgen und kann so in komplizierten Geometrien geführt werden. 4.2.6 Umkehrung des Lichtweges Vertauschen wir in den betrachteten Fällen den Ausgangspunkt des Lichts (Lichtquelle) und den Beobachtungspunkt (Detektor), so folgt nach dem Fermatschen Prinzip der gleiche geometrische Weg. Lediglich die Richtung ist vertauscht. In einem optischen System nimmt der Lichtstrahl also den selben Weg zurück. Für optische Konstruktionen ist diese Prinzip sehr nützlich. 4.2.7 Planparallele Platte Licht trifft unter einem Einfallswinkel α auf eine planparallele Platte der Dicke d (siehe Abbildung 4.15. Durchläuft ein Lichtstrahl diese planparallele Platte vollständig, so ändert sich seine Richtung insgesamt nicht, der austretende Strahl ist aber zum eintretenden verschoben. Die Verschiebung δ ist dann δ= d sin(α − β) , cos(β) wobei sich der Winkel β aus dem Brechunsggesetz berechnet. c Lehrstuhl E13, TUM, 2010 (4.17) 4.2. AUSBREITUNG VON LICHT 86 Abbildung 4.15: Licht durchläuft eine Platte mit planparallelen Grenzflächen und erfährt eine Querverschiebung. Versuch 3007: Lichtstrahlenverschiebung an einer planparallelen Platte Tritt ein Lichtstrahl an einem Punkt A in eine planparallele rechteckige Platte ein, so wird er aufgrund des Snelliusschen Brechungsgesetzes zur Normalen auf die Oberfläche hin gebrochen. Er tritt anschließend am Punkt B wieder aus dem dichteren Medium aus und wird dabei wiederum von der Normalen weg gebrochen. Da es sich bei beiden Übertritten jeweils um einen Übergang zwischen denselben Medien handelt wird der Strahl beide Male um denselben Winkel gebrochen - allerdings in unterschiedliche Richtungen, was dazu führt, dass die Richtung des Strahls nach dem Austritt aus der Platte dieselbe ist wie vor dem Eintritt, sich der Strahl aber aufgrund seines Verlaufs innerhalb der Platte um einen Abstand d parallel verschoben hat. 4.2.8 Ablenkung durch ein Prisma Unter einem Prisma wird in der Optik vorwiegend eine spezielle Form des geometrischen Körpers Prisma verstanden, nämlich ein gerades Prisma mit einem Dreieck als Grundfläche. Seine optischen Eigenschaften hängen im Wesentlichen von den Dreieckswinkeln und von der Brechzahl des Werkstoffes (Glas oder glasklarer Kunststoff) ab. Die Hauptanwendungen des Prismas beruhen auf seiner Eigenschaft, Licht wellenlängenabhängig zu brechen oder total zu reflektieren, je nach Bauart des Prismas. Versuch 3023: Reflexion von Licht an der Kante eines Glasprismas Fallen Lichtstrahlen senkrecht auf die Kante (Kathete) eines gleichschenklig rechtwinkligen Glasprismas (siehe Abbildung 4.16) so werden sie zunächst aufgrund des Snelliusschen Brechungsgesetzes nicht abgelenkt. Im weiteren Verlauf treffen sie jedoch auf eine weitere Kante, geometrisch gesehen die Hypothenuse, wo sie total reflektiert werden. Nach dem Reflexionsgesetz ist Einfalls- gleich Ausfallswinkel, was dazu führt, dass die Lichtstrahlen um 90o abgelenkt werden. Wird das Prisma leicht verschoben so können sowohl Reflexion als auch Brechung beobachtet werden. Versuch 3024: Reflexion von Licht an zwei Kanten eines Glasprismas Fallen Lichtstrahlen senkrecht auf die untere Kante (geometrisch gesehen die Hypo- c Lehrstuhl E13, TUM, 2010 4.2. AUSBREITUNG VON LICHT 87 thenuse) eines gleichschenklig rechtwinkligen Glasprismas (siehe Abbildung 4.16) so werden sie zunächst aufgrund des Snelliusschen Brechungsgesetzes nicht abgelenkt. Im weiteren Verlauf treffen sie jedoch zunächst auf eine der Katheten, wo sie total reflektiert und aufgrund des Reflexionsgesetzes um 90o abgelenkt werden, danach auf die andere Kathete, wo sie ebenfalls total reflektiert und um 90o abgelenkt werden. Insgesamt werden die Lichtstrahlen also um 180o abgelenkt, der Verlauf des Lichtes dreht sich gerade um. Außerdem ist ebenfalls das gesamte Bild um 180o gedreht: wird der oberste einfallende Strahl abgedeckt so verschwindet der unterste Strahl des austretenden Lichtes, und umgekehrt. Abbildung 4.16: links: Reflexion von Licht an einer Kante (Hypothenuse) eines Glasprismas. rechts: Reflexion von Licht an zwei Kanten (Katheten) eines Glasprismas. Beim Eintritt in ein Glasprisma wird der einfallende Strahl zur Oberflächennormalen hin gebrochen, beim Austritt wieder davon weg gebrochen. Daraus ergibt sich ein totaler Ablenkwinkel δ wie Abbildung 4.17 ersichtlich ist. Abbildung 4.17: Die Ablenkung des gebrochenen Lichtes ist bei symmetrischem Durchgang minimal. Im Falle des minimalen Ablenkwinkels δmin ist der Einfallswinkel α gleich dem Ausfallswinkel β. Der Verlauf des abgelenkten Strahls innerhalb des Prismas ist parallel zu der Kante die der Strahl nicht durchtritt (die Kante KL in Abbildung 4.17). Der Brechungsindex des Prismas ergibt sich dann aus sin δmin2 +φ n= . (4.18) sin φ2 c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK Allgemein ist der Ablenkwinkel am Prisma p δ = φ − α + arcsin cos φ sin α − sin φ n2 − sin2 α 88 . (4.19) Benutzen wir jedoch anstelle des monochromatischen Lichts, weisses Licht, so stellen wir fest, dass der Ablenkwinkel zudem von der Wellenlänge abhängt. Ursache ist die Abhängigkeit der Brechzahl n(λ) von der Wellenlänge. Versuch 3024: Dispersion verschiedener Prismen Drei 60o Prismen verschiedener Gläser (Kronglas n=1.52, Flintglas n= 1.60 und Schwerflint n=1.73) werden übereinander gestellt und je ein Spektrum durch sie erzeugt. Mit einer Bogenlampe entstehen kontinuierliche Spektren, deren Aufbau aber unterschiedlich ist. Das kann man gut sehen, wenn man beispielsweise die gelbe Spektralfarbe aller drei Spektren übereinander stellt. Der Aufbau entspricht dem vereinfachten Prismenspektrographen (nur eine Linse), die Spektren werden auf die Leinwand abgebildet. Abbildung 4.18: Die Farbzerlegung von weissem Licht bei der Brechung durch ein Prisma beruht auf der Dispersionkurve von typischen Materialien, bei der die Brechzahl mit steigender Wellenlänge abnimmt. Für der Bereich des sichtbaren Lichts haben typische Materialien einen wellenlängenabhängigen Verlauf der Brechzahl n, bei dem n mit steigendem Wert von λ abnimmt. Folglich werden kleiner Wellenlängen stärker abgelenkt und ein weisser Strahl immer so aufgespalten, dass der Farbverlauf von oben nach unten von rot zu violett geht. 4.3 Geometrische Optik Die geometrische Optik oder Strahlenoptik ist eine Näherung der Optik, in der die Welleneigenschaften des Lichtes vernachlässigt werden, weil die mit dem Licht wechselwirkenden Strukturen (Spiegel, Linsen, Blenden, usw.) und die abgebildeten Objektdetails groß im Verhältnis zur Wellenlänge des Lichtes sind. In der geometrischen Optik wird das Licht als aus Lichtstrahlen zusammengesetzt betrachtet. Eine Lichtquelle oder ein diffus reflektierendes Objekt sendet Lichtstrahlen aus, welche dann reflektiert, gebrochen oder aufgespaltet werden. Die Lichtstrahlen folgen dem Superpositionsgesetz, d. h. sie können sich gegenseitig durchdringen, ohne sich zu stören. In einem homogenen Medium breiten sich die Lichtstrahlen geradlinig aus. An verspiegelten Flächen werden sie reflektiert. An Grenzflächen zwischen Medien mit verschiedener c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 89 Brechzahl werden sie nach dem Snelliusschen Brechungsgesetz gebrochen und partiell reflektiert (und somit in zwei Strahlen aufgespaltet), oder sie werden total reflektiert. Ein Lichtstrahl kann auch durch Doppelbrechung aufgespaltet werden. Allgemein gilt für die Bahnen von Lichtstrahlen das Fermatsche Prinzip. 4.3.1 Abbildung durch Spiegel Ein Spiegel ist eine reflektierende Fläche, glatt genug, dass reflektiertes Licht nach dem Reflexionsgesetz seine Parallelität behält und somit ein Abbild entstehen kann. Abbildung 4.19: Konstruktion des Bildes an einem ebenen Spiegel aus den rückwärtigen Verlängerungen der reflektierten Strahlen. Zur bestimmung des Ortes des Spieglbildes L’ sind mindestens zwei Strahlen notwendig. Zur Konstruktion des Spiegelbildes werden die rückwärtigen Verlängerungen aller beliebigen reflektierten Strahlen (zum Beispiel auch diejenige des Strahls b) verlängert. Sie treffen sich alle im Ort des Spiegelbildes (in Abbildung 4.19 L’). Das Auge sieht also die Lichtquelle am diesem Ort hinter dem Spiegel. Es entsteht ein virtuelles Bild (optisches Abbild, das im Gegensatz zu einem reellen Bild nicht auf einem Schirm abgebildet werden kann). Wenn sich der Beobachter in die Lage seines Spiegelbildes versetzen möchte, so erscheint es ihm, als ob rechts und links vertauscht wären - alles erscheint im Wortsinne spiegelbildlich. gekrümmte Spiegeloberflächen Die spiegelnde Oberfläche muß nicht plan sein, es können auch gekrümmte Oberflächen Licht reflektieren. Die Konstruktion erfolgt für jeden Lichtstrahl einzeln. Versuch 3050: Brennpunkt eines Hohlspiegels Das Licht einer Bogenlampe wird mit einer großen Linse (Durchmesser 20 cm) parallel gemacht und quer durch den Hörsaal auf einen Hohlspiegel geworfen (Durchmesser etwa 15 cm). In den Brennpunkt bringt man ein Streichholz, das durch Einschalten der Bogenlampe entzündet wird. c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 90 Abbildung 4.20: Zwei Strahlen im Abstand h zur optischen Achse werden unter Einhaltung des Reflexionsgesetzes an der Oberfläche des Hohlspiegels reflektiert und treffen sich im Brennpunkt F . Der Kugelmittelpunkt ist mit M und der Kugelradius mit R bezeichnet. Bogenlampen strahlen punktgenau ein sehr helles und intensives Licht mit einem hohen Infrarot-Anteil aus. Alle Lichtstrahlen, die die Bogenlampe senkrecht zum Spiegel wirft, werden so reflektiert, dass sie genau in seinem Brennpunkt gebündelt werden. Weil natürlich die infrarote Wärmestrahlung denselben Weg geht, ist am Brennpunkt die Energiedichte sehr hoch. Diese hohe Energie, die hauptsächlich vom infraroten Licht ausgeht, ist in der Lage, ein Streichholz zu entzünden. 4.3.2 Abbildung durch Linsen Als Linse bezeichnet man ein optisch wirksames Bauelement mit zwei lichtbrechenden Flächen, von denen mindestens eine Fläche konvex oder konkav gewölbt ist. Die wesentlichste Größe einer Linse ist die Brennweite f , d.h. der Abstand von Brennpunkt bzw. Brennebene zur Linse. Abbildung 4.21: Strahlenbündel gehen durch die Brennebene bzw. den Brennpunkt F im Abstand der Brennweite f . c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 91 Unter den Hauptebenen eines optischen Systems wie einer Linse versteht man den äquivalenten Ort der Brechung von Lichtstrahlen, die achsparallel in das System einfallen. Dabei gilt: 1. Strahlen, die parallel zur optischen Achse verlaufen, werden so gebrochen, dass sie den Brennpunkt F passieren. 2. Strahlen, die untereinander parallel verlaufen, werden so gebrochen, dass sie die Brennebene in einem gemeinsamen Punkt passieren. Abbildung durch Sammellinsen Eine Sammellinse oder Konvexlinse ist eine Linse mit positiver, vergrößernder Brechkraft. Die Sammellinse sammelt parallel eingestrahltes Licht und fokussiert es in ihrem Brennpunkt. Wir betrachten eine Bildkonstruktion, bei der das Objekt im Abstand zwischen f und 2f zur Sammellinse steht. Das entstehende Bild ist reell und seitenverkehrt. Abbildung 4.22: Bildkonstruktion für eine Sammellinse: Das Objekt steht im Abstand zwischen f und 2f zur Sammellinse. Die Strahlen sind gestrichelt eingezeichnet. Häufig benutzte Abkürzungen sind: PS: Parallelstrahl F: Brennpunkt im Objektraum ZS: F’: Brennpunkt im Bildraum Zentralstrahl BS: Brennstrahl f: Brennweite im Objektraum f’: Brennweite im Bildraum Zur Bildkonstruktion verwenden wir 3 Stahlen (Parallelstrahl, Zentralstrahl und Brennstrahl). Der Parallelstrahl läuft im Objektraum vom Objekt G parallel zur optischen Achse und wird ab der Hauptachse der Linse im Bildraum durch den Brennpunkt geführt. Der Zentralstrahl läuft vom Objekt durch den Schnittpunkt zwischen optischer Achse und c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 92 Hauptachse der Linse. Der Brennstrahl geht schließlich vom Objekt durch den Brennpunkt im Objektraum bis zur Hauptachse und danach im Bildraum parallel zur optischen Achse. Alle drei Strahlen schneiden sich in einem Punkt. In diesem Punkt entsteht das Bild B. Versuch 3057: Strahlengang durch eine konvexe Linse Treffen zur optischen Achse parallele Strahlen auf eine Bikonvexlinse, so werden sie an der ersten konvexen Oberfläche gebündelt. Dies geschieht, da laut dem Snelliusschen Brechungsgesetz beim Übergang von einem optisch dünneren in ein optisch dichteres Material die Lichtstrahlen zum Einfallslot hin gebrochen werden. Beim Austritt aus der Linse an der zweiten konvexen Oberfläche werden die Lichtstrahlen von der Normalen weg gebrochen, was aufgrund der Geometrie der Linse impliziert, dass die Strahlen nochmals gebündelt werden. Eine Bikonvexlinse verhält sich also wie ein konvergierendes optisches System; die Lichtstrahlen schneiden sich nach dem Durchlaufen der Linse im Brennpunkt F. Die Vergrößerung einer Linse ist durch den Vergrößerungsfaktor B b V = =− (4.20) G g gegeben. Ein negatives V bedeutet hier ein reelles und auf dem Kopf stehendes Bild; ein positives V bedeutet ein virtuelles Bild, das aufrecht steht. Zur Bestimmung der Vorzeichen der Größen G, B, g, b ist zu beachten, dass sich der Gegenstand im Ursprung befindet und entsprechend alle Größen auf der x-Achse (g, b, f ) positiv gezählt werden. Der Nullpunkt entlang der y-Achse ist durch die optische Achse gegeben. Der Abbildungsmaßstab β ist definiert als das Verhältnis zwischen der Größe der optischen Abbildung (B, Bild) eines Gegenstandes und dessen realer Größe (G, Gegenstand) β= |B| |G| (4.21) und wird in der Technik gemäß der Vorzeichenkonventionen der DIN 1335 berechnet. Ein Abbildungsmaßstab von 1:1 sagt aus, dass der Gegenstand und seine Abbildung gleich groß sind. Ein Abbildungsmaßstab von 1:2 sagt aus, dass der Gegenstand doppelt so groß ist wie seine Abbildung. Ein Abbildungsmaßstab von 2:1 sagt aus, dass die Abbildung doppelt so groß ist wie der Gegenstand. In der Fotografie bezeichnet man als Abbildungsmaßstab das Verhältnis der Abbildungsgröße eines Objektes auf der Filmebene zur Größe des Originalobjektes selbst. Der Abbildungsmaßstab nimmt mit kleiner werdendem Abstand zum Objekt und mit Verlängerung der Objektivbrennweite zu. Der Kehrwert der Brennweite (bezogen auf Luft) heißt Brechwert oder Brechkraft D= 1 . f (4.22) In der Optik verwendet man für den Brechwert auch die Einheit Dioptrie (Einheitenzeichen: dpt). Es gilt: 1 dpt = 1 m−1 . Beispiel: Eine freistehende Linse der Brennweite 50 cm = 0.5 m hat den Brechwert von 1/(0.5 m) = 2 dpt. c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 93 Lupe Die Lupe ist ein einfaches optisches Instrument. Sie ist eine Konvexlinse kleiner Brennweite, bei der sich der abzubildende Gegenstand innerhalb der Brennweite f befindet. Sie erzeugt ein aufrechtes virtuelles Bild. Versuch 3064: Strahlengang der Lupe An der optischen Wand wird der Strahlengang der Lupe sichtbar gemacht. Da zum Versuchsaufbau nur dicke Linsen zur Verfügung stehen, sind Linsenfehler vorhanden. Abbildung 4.23: Bildkonstruktion Lupe: Das Objekt steht im Abstand zwischen 0 und f zur Sammellinse. Die Bildkonstruktion bei der Lupe erfolgt erneut mit den drei Stahlen Parallelstrahl, Zentralstrahl und Brennstrahl. Es müssen jedoch nun noch zusätzlich die rückwärtigen Verlängerungen der Strahlen (gestrichelte Linien in der Abbildung 4.23) betrachtet werden, um den Schnittpunkt für die Lage des Bildes zu finden. Das resultierende Bild ist virtuell und nicht seitenverkehrt. Das Bild der Lupe wird im Auge und nicht auf dem Schirm sichtbar. Um die Vergrößerung einer Lupe zu bestimmen, wählt man die deutliche Sehweite des Auges (s0 =250 mm) als Bezugsgröße. Ein Gegenstand erscheine in dieser Entfernung unter dem Winkel α0 G tan α0 = . (4.23) s0 Bei Einsatz der Lupe erscheint das Bild in einem größeren Abstand s und unter einem vergrößerten Winkel α mit B . (4.24) tan α = s Für die Vergrößerung folgt tan α s0 V = = . (4.25) tan α0 f c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 94 Abbildung 4.24: Strahlengang bei der Lupe in Bezug auf das Auge: α0 = Sehwinkel bei konventioneller Sehweite und α = Sehwinkel bei Verwendung einer Lupe. Abbildungsgleichung Wenn man den mathematischen Strahlensatz zuerst auf den Mittelpunktsstrahl und die sich mit ihm im Mittelpunkt der Linse kreuzende optische Achse anwendet erhält man den Abbildungsmaßstab b |B| =|− | . (4.26) β= |G| g Wendet man den mathematischen Strahlensatz nun auf den Brennpunktstrahl und die sich mit ihm im Brennpunkt kreuzende optische Achse an, so erhält man B b−f = G f . (4.27) Somit ist b−f b = g f und nach Division durch b folgt die Abbildungsgleichung 1 1 1 = + f g b . (4.28) (4.29) Die Abbildungsgleichung oder Linsengleichung setzt die Bildweite b, die Gegenstandsweite g und die Brennweite f in Beziehung. Die Linsengleichung stellt eine Vereinfachung dar, weil hier angenommen wird, dass die Linse keine Ausdehnung besitzt und dass die Brennweite an jeder Stelle der Linse gleich groß und unabhängig von der Wellenlänge des Lichtes ist. In der Praxis sind alle drei Bedingungen nicht exakt erfüllt. Linsenschleifergleichung Es seien R1 und R2 die Kugelradien einer Linse. Hierbei ist zu beachten, dass die beiden Radien dann gleiche Vorzeichen haben, wenn die Mittelpunkte auf derselben Seite der c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 95 Linse liegen (konvex-konkave Linse), jedoch unterschiedliche Vorzeichen, wenn die Linse bikonvex oder bikonkav ist (siehe Abbildung 4.25). Für eine Linse der Dicke d (gemessen in Höhe der optischen Achse) und mit der Brechzahl des Linsenmaterials n ist in Luft die Brechkraft 1 (n − 1)d 1 1 . (4.30) − + D = = (n − 1) f R1 R2 nR1 R2 Abbildung 4.25: Darstellung der Radien R1 und R2 zur Berechnung der Brechkraft einer Linse der Dicke d nach der Linsenschleifergleichung. Für dünne Linsen mit d ≪ R1 , R2 gilt genähert 1 D = = (n − 1) f 1 1 − R1 R2 . (4.31) Für eine Sammellinse erhalten wir insgesamt je nach Abhängigkeit von Ort der Gegenstandes: Gegenstandsweite g Bildweite b Vergrößerung V Bildlage g > 2f f < b < 2f 0 > V > −1 umgekehrt, reell g = 2f b = 2f V = −1 umgekehrt, reell f < g < 2f b > 2f V < −1 umgekehrt, reell g≤f |b| > |f | und b < 0 V >0 aufrecht, virtuell c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 96 Abbildung durch Zerstreuungslinsen Ein Bündel von einfallenden Parallelstrahlen läuft nach dem Passieren einer Zerstreuungslinse oder Konkavlinse scheinbar von einem Punkt auf der Einfallseite des Lichts auseinander. Es ist hierbei zu beachten, dass die Brennweite von Zerstreuungslinsen negativ ist. Die Bildkonstruktion bei der Zerstreuungslinse erfolgt wieder mit den drei Stahlen Parallelstrahl, Zentralstrahl und Brennstrahl. Wie bei der Lupe müssen die rückwärtigen Verlängerungen der Strahlen betrachtet werden, um den Schnittpunkt für die Lage des Bildes zu finden. Abbildung 4.26: Bildkonstruktion Zerstreuungslinse: Das Objekt steht in weitem Abstand hinter der Zerstreuungslinse. Die Vergrößerung ist V =− f S2 =− , S1 f − S1 (4.32) also V > 0. Das Bild ist aufrecht und virtuell. Versuch 3058: Strahlengang durch eine konkave Linse Treffen zur optischen Achse parallele Strahlen auf eine Bikonkavlinse, so werden sie an der ersten konkaven Oberfläche gestreut. Dies geschieht, da laut dem Snelliusschen Brechungsgesetz beim Übergang von einem optisch dünneren in ein optisch dichteres Material die Lichtstrahlen zum Einfallslot hin gebrochen werden. Beim Austritt aus der Linse an der zweiten konkaven Oberfläche werden die Lichtstrahlen von der Normalen weg gebrochen, was aufgrund der Geometrie der Linse impliziert, dass die Strahlen nochmals gestreut werden. Eine Bikonkavlinse verhält sich also wie ein aufweitendes optisches System; nach dem Durchlaufen einer Bikonkavlinse sind die Lichtstrahlen divergent, sie erzeugen kein reelles Bild. Verlängert man die austretenden Strahlen nach hinten, so erkennt man, dass sie einen gemeinsamen Schnittpunkt haben, den virtuellen Brennpunkt F. c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 97 Linsentypen Bei den einfachsten Linsen sind die beiden optisch aktiven Flächen sphärisch. Das heißt, sie sind Oberflächenausschnitte einer Kugel. Daher kann man diesen Flächen Krümmungsradien zuordnen. Jede dieser Flächen kann konvex, eben oder konkav sein: Abbildung 4.27: links: Sammellinsen: a) Bikonvexlinse b) Plankonvexlinse c) Konkavkonvexlinse. rechts: Zerstreuungslinsen: a) Bikonkavlinse b) Plankonkavlinse c) Konvexkonkavlinse. Asphärische Linsen sind meist auch rotationssymmetrisch, jedoch sind die Flächen nicht Ausschnitte von Kugeloberflächen. Die Form rotationssymmetrischer asphärischer Linsen wird in der Regel als Kegelschnitt (Kreis, Ellipse, Parabel, Hyperbel) plus eine Potenzreihe für Deformationen höherer Ordnung angegeben z = f (h) = h2 + A4 h4 + A6 h6 + ... . p R 1 + 1 − (1 + k)(h/R)2 (4.33) Nach DIN ISO 10110-12 entspricht z der Pfeilhöhe in Abbildung 4.28 und sind h der Abstand senkrecht zur optischen Achse, R der Scheitelradius, k eine konische Konstante und A4 , A6 asphärische Parameter. Abbildung 4.28: Pfeilhöhe bei einer asphärischen Linse nach DIN ISO 10110-12 Die so entstandenen Freiheitsgrade im Vergleich zur sphärischen Linse können genutzt werden, um beispielsweise Abbildungsfehler zu reduzieren. Konventionell werden in optischen Systemen Abbildungsfehler durch den Einsatz mehrerer sphärischer Linsen aus unterschiedlichen Materialien (Brechzahl, Dispersion) korrigiert. Durch den Einsatz einer asphärischen Fläche kann der Optikdesigner im Allgemeinen 2-3 sphärische Linsen ersetzen. Nachteil asphärischer Linsen ist insbesondere ihre auch heute noch vergleichsweise teure Herstellung. c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 4.3.3 98 Linsensysteme Bei Linsensystemen betrachten wir an Stelle von einer einzelnen Linse eine Abfolge von hintereinander auf der optischen Achse angeordneten Linsen. Der einfachste Fall ist durch zwei dünne Sammellinsen beschrieben, die im Abstand d hintereinander gestellt sind. Die Konstruktion des Bildes erfolgt jetzt über das Konzept des Zwischenbilds B = G′ . Abbildung 4.29: Zwei Linsen im Abstand d, es entstehen Zwischenbild B = G′ und Bild B in der Konstruktion für das gesamte Linsensystem. Für das Linsensystem errechnet sich eine effektive Brennweite fsystem des Gesamtsystems 1 1 d 1 = + − . (4.34) fsystem f1 f2 f1 f2 Versuch 3065: Linsenkombinationen Um die Strahlengänge von Linsenkombinationen darzustellen verwenden wir Plexiglasscheiben in Linsenform auf der optischen Wand. Es stehen Sammellinsen und Zerstreuungslinsen verschiedener Brennweiten zur Verfügung. Auf diese Weise können verschiedenste Strahlengänge mittels eines Mehrfachstrahlers dargestellt werden. Speziell für nur zwei Linsen mit f1 = f2 = f ergibt sich für den Fall, dass der Abstand d zwischen beiden Linsen vernachlässigbar gegenüber den Brennweiten ist die Vereinfachung 1 fsystem = 1 f 1 + → fsystem = . f f 2 (4.35) In einem System mit N Linsen, die so hintereinander gestellt sind, dass die Abstände zwischen den einzelnen Linsen vernachlässigt werden können, gilt 1 fsystem N X 1 = . fi i=1 (4.36) Optische Systeme oder Instrumente (Mikroskope, Fernrohre, Objektive) enthalten immer mehrere Linsen. c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 4.3.4 99 Optische Instrumente Einfache optische Instrumente lassen sich bereits aus zwei Linsen aufbauen. Diese beiden Linsen werden als Objektiv (dem Gegenstand, dem Objekt zugewandte Linse) mit der Brennweite fob und Okular (dem Auge, dem Oculus, zugewandte Linse) mit der Brennweite fok bezeichnet. Versuch 3064: Mikroskop und Fernrohr An der optischen Wand wird der Strahlengang des Mikroskops und des Fernrohrs (Kepler, Galilei) sichtbar gemacht. Da zum Versuchsaufbau nur dicke Linsen zur Verfügung stehen, sind Linsenfehler vorhanden. Fernrohr Ein Fernrohr ist ein optisches Instrument, mit dem man entfernte Gegenstände unter einem größeren Sehwinkel als mit dem bloßen Auge sieht und diese dadurch näher bzw. größer erscheinen. Im einfachsten Aufbau besteht das Fernrohr aus zwei Linsen, die sich im Abstand der Summe ihrer Brennweiten gegenüberstehen. Nach dem Konstruktionsprinzip unterscheidet man das Galilei-Fernrohr vom Kepler-Fernrohr: • Das Galilei-Fernrohr hat als Objektiv eine Sammellinse und als Okular eine Zerstreuungslinse kleinerer Brennweite. Es besitzt ein kleines Gesichtsfeld, stellt die Objekte aber aufrecht und seitenrichtig dar. Es ist heute nur noch als Opernglas und als fest installiertes Aussichtsfernrohr in Gebrauch. • Beim Kepler-Fernrohr werden sowohl für das Objektiv als auch für das Okular Sammellinsen verwendet. Es entsteht ein reelles, aber auf dem Kopf stehendes (um 180 Grad gedrehtes) Bild. Es wird heute in der Astronomie verwendet. Abbildung 4.30: links: Galileisches Fernrohr oder terrestrisches Fernrohr und rechts: Keplersches Fernrohr oder astronomisches Fernrohr Wie jedes Gerät, mit dem das Auge direkt beobachten soll, erzeugt das Fernrohr parallele Lichtstrahlen, die vom entspannten Auge auf der Netzhaut gesammelt werden. Ein Fernrohr wandelt also einfallende Parallelstrahlen in austretende Parallelstrahlen und verändert dabei nur den Winkel und die Dichte dieser Strahlen. Die Veränderung des Winkels bewirkt die Vergrößerung. Die größere Dichte der Strahlen vergrößert die Helligkeit des Bildes. c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 100 Abbildung 4.31: Vergrößerung des Sehwinkels beim Keplerschen Fernrohr (oben) und beim Galileischen Fernrohr (unten). Wird die Vergrößerung des Sehwinkels betrachtet, so ist der Vergrößerungsfaktor V = tan σ ′ . tan σ (4.37) Gebräuchlicher ist die Angabe in Abhängigkeit von den Brennweiten von Objektiv bzw. Okular fob V = . (4.38) fok Kleine Fernrohre und Ferngläser charakterisiert man durch zwei Zahlenangaben, zum Beispiel 5 × 20 mm (Taschengerät). Die erste Angabe bezieht sich auf die Vergrößerung (5-fach), die zweite auf die Öffnung (Apertur) des Objektivs in mm. Bei Linsenfernrohren für astronomische Beobachtungen wird das Verhältnis von Apertur zur Brennweite (das Öffnungsverhältnis) als Kenngröße für das Leistungsvermögen des Instruments verwendet. Die Vergrößerung ergibt sich je nach verwendetem Okular, das meist gewechselt werden kann. Ein Refraktor 100/1000 hat also eine Öffnung von 100 mm und eine Brennweite von 1000 mm. Ein Gerät mit 1000 mm Objektiv-Brennweite und 5 mm Okular-Brennweite besitzt zum Beispiel eine 200-fache Vergrößerung. Mikroskop Ein Mikroskop ist ein optisches Instrument, das es erlaubt, Objekte vergrößert anzusehen. Im einfachsten Aufbau besteht das Mikroskop aus zwei Sammellinsen, deren beider c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 101 Brennpunkte im Abstand der Tubuslänge t angeordnet sind. Die Bezeichnung dieser Linsen mit Objektiv und Okular erfolgt analog zum Fernrohr. Das Objektiv entwirft ein Zwischenbild, welches mit dem Okular betrachtet wird. Das Okular wirkt hierbei wie eine Lupe. Abbildung 4.32: Bildkonstruktion für ein Mikroskop mit dem Zwischenbild und dem resultierenden virtuellen Bild. Die eingezeichneten Lichtstrahlen entsprechen nicht dem wirklichen Verlauf, da diese im Mikroskop nicht ihre Richtung ändern können. Zur Konstruktion des Bildes ist diese Vorgehensweise jedoch erlaubt. Unter der Vergrößerung des Objektivs wird üblicherweise dessen Abbildungsmaßstab verstanden. Mit der Vergrößerung eines Objektivs ist also keine Winkelvergrößerung gemeint. Vorausgesetzt wird für die Berechnung, dass der Abstand zum Gegenstand so gewählt wird, dass das Zwischenbild dort entsteht, wo sich im Mikroskop die Brennebene des Okulars befindet. Der Abbildungsmaßstab ist β= t s0 fob fok (4.39) mit der Bezugssehweite s0 ≈ 250 mm. 4.3.5 Abbildungsfehler Ein Abbildungsfehler, oder auch Aberration genannt, ist eine Abweichung von der idealen optischen Abbildung. Abbildungsfehler lassen sich im Rahmen der geometrischen Optik erfassen. Es ist möglich, die Abbildungsfehler gegenüber einem einfachen System aus einer einzelnen Linse sehr stark zu reduzieren, indem mehrere Linsen aus verschiedenen Glassorten miteinander kombiniert werden. Sie werden durch eine Optimierungsrechnung so aufeinander abgestimmt, dass die gemeinsame Auswirkung aller Abbildungsfehler minimal wird. Sphärische Aberration Achsparallel einfallende oder vom gleichen Objektpunkt auf der optischen Achse ausgehende Lichtstrahlen haben nach dem Durchgang durch die Linse nicht den gleichen Schnittpunkt, sondern werden auf eine Kreisfläche abgebildet. Im allgemeinen ist die Abweichung c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 102 umso stärker, je weiter außen der Strahl verläuft. Es entsteht ein weiches und etwas verschwommenes, aber scharfes Bild. Feine Objektdetails sind noch erkennbar, aber der Kontrast ist vermindert (Weichzeichnungseffekt). Versuch 3090: Sphärische Aberration einer Zylinderlinse Die sphärische Aberration einer Linse kann insbesondere vermindert werden durch Verkleinern des Durchmessers des in die Linse eintretenden Strahls, da dadurch die achsenfernen Strahlen nicht mit einbezogen werden. Eine Verminderung der sphärischen Aberration ist bei plankonvexen Linsen durch das Drehen der Linse möglich. Treffen die parallelen Strahlen unter 90o auf die plane Fläche der Linse werden die Lichtstrahlen nur beim Austritt aus der Linse gebrochen. Im umgekehrten Fall brechen die Lichtstrahlen sowohl beim Eintritt als auch beim Austritt. Dieser Versuch lässt sich am Besten an der optischen Wand zeigen. Der Mehrfachstrahler erzeugt je zwei achsennahe bzw. achsenferne Parallelstrahlen, die durch eine plankonvexe Plexiglaslinse gehen. Die Linse wird zunächst mit der planen Seite zur Lichtquelle hin in den Strahlengang gebracht und die Schnittpunkte der beiden Strahlenpaare markiert. Dann dreht man die Linse um 180o und bringt sie so an, dass der Schnittpunkt der achsenahen Strahlen wieder an derselben Stelle wie vorher ist. Man sieht, dass jetzt der Schnittpunkt der randnahen Strahlen woanders erscheint. Abbildung 4.33: Späherische Aberration: Lichtstrahlen, die durch die Randzonen der Linse gehen, werden stärker gebrochen und in einem der Linse näher liegendem Brennpunkt fokussiert als mittig einfallende Lichtstrahlen. Chromatische Aberration Die Brechzahl n(λ) des verwendeten Linsenglases hängt (wie für jedes Material) nichtlinear von der Wellenlänge des einfallenden Lichts ab (Dispersion). Kurzwelliges Licht wird stärker gebrochen und damit zu einem kleineren Abstand hinter der Linse fokussiert. Entsprechend verschiebt sich von blauem zu rotem Licht der Schnittpunkt von Strahlen hinter der Linse zu größeren Abständen von dieser. Dieser Effekt führt zu Farbsäumen am Bildrand. Versuch 3095: Farbfehler einer Linse c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 103 Dieser Versuch kann sowohl an der optischen Wand mit der halbierten Glaslinse oder mit der Bogenlampe und dem großen Kondensor demonstriert werden. In beiden Fällen wird der gesamte Lichtkegel der Lichtquelle divergent durch die Linse geschickt und dahinter streifend auf der Leinwand gezeigt. Man sieht sehr gut, dass das blaue Bild der Lichtquelle näher an der Linse liegt als das rote. Abbildung 4.34: Chromatische Aberration: Lichtstrahlen kurzer Wellenlänge (blau) werden stärker gebrochen und in einem der Linse näher liegendem Brennpunkt fokussiert als Lichtstrahlen großer Wellenlänge (rot). Astigmatismus In Abhängigkeit von der Rotationssymmetrie der Linse unterscheiden wir zwei verschiedene Arten des Astigmatismus: a) Für rotationssymmetrische Linsen entsteht dieser Abbildungsfehler durch einen schrägen Lichteinfall auf die Linse. Aufgrund der sphärischen Form der Linsenoberfläche entstehen so unterschiedliche Einfallswinkel der Strahlen zum jeweiligen lokalen Grenzflächenlot. Da der Brechungswinkel von der Brechzahl und dem Einfallswinkel abhängt, wird jeder Strahl mit anderem Einfallswinkel auch anders gebrochen. Hierdurch resultiert für die beiden Hauptachsen der Linse unterschiedliche Brennweiten. b) Durch eine Rotationsasymmetrie der Linse (z.B. Auge) bei Einfall völlig paraxialen Strahlen entsteht ebenfalls diese Abbildungsfehler. Die asphärische Form der Linsenoberfläche führt zu unterschiedlichen Krümmungsradien für die beiden Hauptachsen. Da der Brechungswinkel von Krümmungsradius abhängig ist, resultieren für die beiden Hauptachsen der Linse unterschiedliche Brennweiten. Abbildung 4.35: Astigmatismus durch Linsenasymmetrie: Ist die Linse nicht kugelförmig, sondern hat in einer Schnittebene einen anderen Krümmungsradius als in der dazu senkrechten Schnittebene, so führt dies zu unterschiedlichen Brennpunkten in Abhängigkeit vom Krümmungradius. c Lehrstuhl E13, TUM, 2010 4.3. GEOMETRISCHE OPTIK 104 Versuch 3100: Astigmatismus einer Linse Astigmatismus kann auch bei völlig paraxialen Strahlen durch eine Rotationsasymmetrie der Linse um die optische Achse entstehen (z.B. beim menschlichen Auge). Je größer der Krümmungsradius der Linse ist, desto stärker werden die Strahlen in dieser Ebene der Linse gebrochen und der Brennpunkt liegt dichter hinter der Linse als für die dazu senkrechte Ebene der Linse mit kleinerem Krümmungsradius. Bildfeldwölbung Das Bild wird nicht auf einer Ebene, sondern auf einer gewölbten Fläche erzeugt. Die Position des Strahlenschnittpunkts längs der optischen Achse ist dann von der Bildhöhe abhängig, d. h. je weiter Objekt- und damit Bildpunkt von der Achse entfernt sind, um so mehr ist der Bildpunkt in Achsrichtung verschoben (typischerweise nach vorn, zum Objektiv hin). Das entstehende Bild ist nicht überall scharf. Wenn man auf die Bildmitte scharfstellt, ist der Rand unscharf und umgekehrt. Versuch 3105: Bildfeldwölbung einer Linse Ein Dia mit konzentrischen Ringen wird über eine einfache Linse (f = 160 mm) abgebildet. Stellt man die inneren Ringe scharf ein, so werden die äußeren Ringe unscharf und umgekehrt. Man kann mit einem Papierschirm zeigen, dass die Bildweite der Außenringe kleiner ist als die der Innenringe. Abbildung 4.36: Bildfeldwölbung: Dieser Fehler entsteht weil Punkte am Rand der Linse näher zur optischen Achse abgebildet werden als mittige. Verzeichnungen Die Verzeichnung (optische Verzerrung) ist ein geometrischer Abbildungsfehler optischer Systeme, der zu einer lokalen Veränderung des Abbildungsmaßstabes führt. Die Maßstabsänderung beruht auf einer Änderung der Vergrößerung mit zunehmendem Abstand des Bildpunktes von der optischen Achse. Die Verzeichnung ist daher rotationssymmetrisch. c Lehrstuhl E13, TUM, 2010 4.4. OPTIK DES AUGES 105 Nimmt die Vergrößerung zu den Rändern des Bildfelds zu, dann wird ein Quadrat kissenförmig verzeichnet. Im umgekehrten Fall spricht man von tonnenförmiger Verzeichnung. Es können auch Verzeichnungen höherer Ordnung auftreten, und die Überlagerung verschiedener Ordnungen kann zu einer wellenförmigen Abbildung gerader Linien führen. Versuch 3110: Verzeichnungen einer Linse Ein Dia mit einem groben Gitter wird über eine einfache Linse (f = 150 mm) abgebildet. Setzt man eine Lochblende (Irisblende, Durchmesser ausprobieren) an der Stelle des Linsenbrennpunkts in den Strahlengang, so erhält man am objektseitigen Brennpunkt eine tonnenförmige Verzeichnung des Gitters, am bildseitigen Brennpunkt eine kissenförmige. Abbildung 4.37: Je nachdem ob der Abbildungsmaßstab zum Bildrand hin zu- oder abnimmt erhält man eine kissen- oder tonnenförmige Verzeichnung. Von links nach rechts: kissenförmig verzeichnungsfrei - tonnenförmig. 4.4 Optik des Auges Beim Menschen liegt der durch das Auge wahrnehmbare Bereich des elektromagnetischen Spektrums im Wellenlängenbereich von etwa 380 nm bis 780 nm, das sogenannte Lichtspektrum. Dagegen sehen beispielsweise Bienen auch kurzwelligeres Licht, das sogenannte ultraviolette UV-Licht, während sie andererseits kein rotes Licht wahrnehmen können. Das Auge besteht aus 5 Hauptbestandteilen (siehe Abbildung 4.38): • Hornhaut: Die glasklare Augenhülle. Sie schützt das Auge nach außen. Wenn die Hornhaut missgebildet ist, kann dies zu Sehstörungen führen. • Iris: Die farbige Öffnung des Auges. Die Aufgabe der Iris besteht darin, sich je nach der Lichtmenge, die in das Auge eindringt, zu öffnen oder zu schließen. Diese Regelung geschieht unbewusst. Die Iris(blende) entspricht in ihrer Funktion der Blende einer Kamera. Durch das Loch, das die Irisblende noch freilässt, die Pupille, dringt Licht in das Auge ein. Der Durchmesser der Pupillenöffnung kann, je nach Umgebungslicht, zwischen 1 mm und etwa 8 mm betragen. Die Pupille erscheint schwarz, weil das Licht nicht wieder aus dem Auge kommt. • Augenlinse: Die Linse ist in der Mitte weich (etwa vergleichbar einer durchsichtigen, mit Wasser gefüllten Plastiktüte). Der Muskel an ihren Enden, der Zilliarmuskel, kann die Form der Augenlinse und damit ihre Brennweite so verändern, so dass das gesunde Auge nahe und ferne Gegenstände scharf sehen kann. c Lehrstuhl E13, TUM, 2010 4.4. OPTIK DES AUGES 106 • Netzhaut: Sie ist eine Art Projektionsleinwand auf der das Bild des Gegenstandes, den wir sehen, abgebildet wird. Wenn das Bild scharf darauf abgebildet wird, sehen wir gut. Auf der Netzhaut befinden sich Nervenzellen (Zäpfchen und Stäbchen), die das einfallende Licht in Nervenreize wandeln. • Nervenleitungen: Nervenleitungen tragen die Signale, die in den Zäpfchen und Stäbchen auf der Netzhaut entstehen, zum Gehirn. Hier wird das Bild erfasst. Das Bild, das eine Sammellinse (also auch die Augenlinse) erzeugt, steht auf dem Kopf und ist seitenverkehrt. Erst im Gehirn wird das Bild sozusagen umgedreht. Abbildung 4.38: Querschnitt durch das Auge mit den 5 Hauptbestandteilen. Das Licht tritt durch die durchsichtige Hornhaut in das Auge ein. 4.4.1 Akkommodation des Auges Unser Auge beruht in seiner optischen Funktion auf einer Sammellinse. Beim Auge ist die Bildweite b (Abstand Augenlinse zu Netzhaut) unveränderlich. Wollen wir Gegenstände in verschiedenen Entfernungen (Gegenstandsweite g) scharf sehen, muss unsere Augenlinse ihre Brennweite f verändern. Die Brennweite von Sammellinsen (Konvexlinsen) hängt von ihrer Wölbung ab. Das bedeutet, dass die Wölbung der Augenlinse, je nach Entfernung des Gegenstandes, den wir scharf sehen wollen, angepasst werden muss. Diese Aufgabe übernimmt der Ziliarmuskel. Basierend auf der Abbildungsgleichung 4.29 bedeutet dies unterschiedliche Anforderungen an das Auge für entfernt und nahe positionierte Gegenstände: Sehen eines entfernten Gegenstandes Wenn ein entfernter Gegenstand gesehen werden soll ist g groß und damit 1/g klein. Da b und damit auch 1/b konstant ist, muss die linke Seite der Gleichung 4.29 (1/f ) ebenfalls klein werden. Das bedeutet, dass die Brennweite f groß werden muß. c Lehrstuhl E13, TUM, 2010 4.4. OPTIK DES AUGES 107 Abbildung 4.39: oben: Sehen weit entfernter Gegenstände erfordert eine große Brennweite f und unten: Sehen naher gegenstände erfordert eine kleine Brennweite f . Der Abstand Linse-Netzhaut (die Bildweite b) ist gleich geblieben, die Linsen liegen also untereinander. Sehen eines nahen Gegenstandes Soll ein Gegenstand in der Nähe gesehen werden (g klein, also 1/g groß), so muss die linke Seite der Gleichung ebenfalls groß sein (1/b ist ja immer noch gleich). Es muss also 1/f groß, bzw. die Brennweite f klein werden. 4.4.2 Kurzsichtigkeit Ist die Augenlinse ist zu stark, die Hornhaut zu dick oder der Augapfel zu lang, so entsteht ein scharfes Bild schon vor der Netzhaut im Inneren des Augapfels. Auf der Netzhaut selbst ist das dort entstehende Bild nicht mehr scharf. Diesen Augenfehler nennt man Kurzsichtigkeit. Leute, die kurzsichtig sind, können in die Nähe (auf kurze Distanz) zwar gut sehen, sehen aber in große Entfernungen unscharf. Ohne Korrektur durch eine Brille oder Kontaktlinsen wird ein kurzsichtiger Mensch in die Ferne nie scharf sehen können. 4.4.3 Weitsichtigkeit Ist die Augenlinse ist zu schwach, die Hornhaut zu dünn oder der Augapfel zu kurz, so entsteht ein scharfes Bild erst hinter der Netzhaut außerhalb des Augapfels. Auf der Netzhaut selbst ist das dort entstehende Bild nicht mehr scharf. Diesen Augenfehler nennt man Weitsichtigkeit. Leute, die weitsichtig sind, können in die Ferne (auf große Distanz) zwar gut sehen, sehen aber in die Nähe unscharf. Weitsichtigkeit kann in gewissen Grenzen durch einen größeren Abstand zwischen Objekt und Auge kompensiert werden. Dabei wird sein Bild allerdings kleiner. Versuch 3315: Optische Farbtäuschungen Lässt man Scheiben rotieren, die in bestimmter Weise, aber nur Schwarz und Weiß, c Lehrstuhl E13, TUM, 2010 4.4. OPTIK DES AUGES 108 Abbildung 4.40: Strahlengang beim kurzsichtigen Auge (jeweils beim Blick in die Ferne). oben: das unkorrigierte Auge und unten: Korrektur durch eine Zerstreuungslinse. Abbildung 4.41: Strahlengang beim weitsichtigen Auge (jeweils beim Blick in die Ferne). oben: das unkorrigierte Auge und unten: Korrektur durch eine Sammellinse. bemalt sind, so sieht man nicht nur Grau als Mischung, sondern auch andere Farben. Eine weitere Farbtäuschung kann mit einer Scheibe demonstriert werden, die zur einen Hälfte schwarz, zur anderen weiß ist und an der Trennlinie einen Schlitz hat, durch den eine rote Lampe zu sehen ist (Rotlichtbirne aus Fotolabor, möglichst hellrot). Man muss dabei die Helligkeit dieser Lampe variieren können (Regeltrafo) und außerdem die Scheibe selbst von vorne geeignet beleuchten (regelbare Schreibtischleuchte). Lässt man nun die Scheibe vor der leuchtenden roten Birne rotieren, dann erscheint letztere nur dann rot, wenn die Scheibe so rotiert, dass auf den Schlitz die schwarze Scheibenhälfte folgt. Wenn die Scheibe dagegen so rotiert, dass die weiße Scheibenhälfte auf den Schlitz folgt, dann erscheint die Birne grün! Wirkungsweise: In der Netzhaut gibt es zwei verschiedene Arten von Sehzellen: Die sogenannten Stäbchen sind für das Helligkeitsempfinden zuständig (davon gibt es pro Auge 125 Millionen). Die etwa 7 Millionen Zäpfchen hingegen nehmen Reize von Farben auf, c Lehrstuhl E13, TUM, 2010 4.5. OPTISCHE PHÄNOMENE 109 ermöglichen also das Farbensehen. Es gibt 3 Arten von Zäpfchen. Eine Sorte von Zäpfchne ist am stärksten für rot empfindlich, eine am meisten für grün und die letzte für blau. Jede dieser Sehzellen benötigt eine unterschiedliche Zeit, um auf einen Farbreiz zu reagieren. Außerdem unterscheiden sich die Zellen darin, wie lange sie einen Reiz noch weiterleiten, wenn er gar nicht mehr existiert. So reagieren die blauempfindlichen Zäpfchen am langsamsten, leiten den Reiz dafür aber am längsten weiter. Wenn man nun auf die drehende Feymannsche oder Machsche Scheibe schaut, sieht man die schnell wechselnden schwarzen und weißen Segmente. Wenn sich ein weißes Feld vor dem Auge vorbeidreht, reagieren alle Farbrezeptoren. Man sieht aber erst dann die Farbe weiß, wenn alle drei Arten von Farbrezeptoren gleichzeitig einen Reiz weiterleiten. Die Tatsache, dass bestimmte Zäpfchen schneller reagieren als beispielsweise die blauempfindlichen, kann nun teilweise erklären, wie es zu den Farberscheinungen kommt. Wenn beispielsweise der Blauanteil aus dem weißen Licht noch nicht ans Gehirn weitergeleitet wurde, sieht man rot. Die unterschiedlichen Farben, die sich auf der Scheibe innen und außen ergeben, resultieren aus den verschieden langen und positionierten schwarzen Bögen. 4.5 Optische Phänomene Vielen optischen Phänomenen wie dem blauen Himmel liegen drei wesentliche Faktoren zu Grunde: das Licht (Sonnenstrahlung), unsere Farbwahrnehmung als Mensch und ein physikalischer Prozess (z.B. die Rayleigh-Streuung). Wir wollen einige ausgewählte optische Phänomene betrachten. Diese sollen nicht mit optischen Täuschungen (visuellen Phänomenen), mit Erklärungsansätzen in der aktuellen Sehforschung verwechselt werden. Es geht um die zugrunde liegenden physikalischen Prozesse. 4.5.1 Rayleigh-Streuung Bei der Streuung von Licht an kugelförmigen Teilchen, die einen im Vergleich zur Wellenlänge λ der gestreuten Wellen kleinen Durchmesser d besitzen, folgt für die Intensität 1 + cos2 Θ I = I0 2R2 2π λ 4 n2 − 1 n2 + 2 2 6 d 2 . (4.40) I0 ist die Intensität der einfallenden Welle, Θ der Streuwinkel, R der Abstand des Beobachters zum Teilchen und n die Brechzahl des Teilchens. Die Energie E = hf = hc λ des eingestrahlten Photons ist zu klein, um Atome anzuregen. Die Energie des gestreuten Photons ändert sich nicht. Das Oszillatormodell ist ein Modell zur Beschreibung der Streuung von Licht an Atomen. Dazu wird von einem externen elektrischen harmonischen Feld zur Beschreibung der Lichtwelle ~ ~ 0 e−iωt E(t) =E (4.41) ~ ~ ausgegangen. Auf ein Elektron im Atom wirkt dann die Kraft F~ = q E(t) = −eE(t). Als Bewegungsgleichung folgt die eines gedämpften harmonischen Oszillators mit ¨ + me Γ~r ˙ + me ω 2 ~r = −eE(t) ~ me~r . 0 c Lehrstuhl E13, TUM, 2010 (4.42) 4.5. OPTISCHE PHÄNOMENE 110 Abbildung 4.42: Im klassischen Grenzfall, d. h. einer großen Wellenlänge des Photons gegenüber dem Bohrradius des Atoms, spricht man von Rayleigh-Streuung. Dabei bezeichnen me die Masse des Elektrons, Γ die Dämpfung (Atomstöße, Strahlungsverluste, etc.) und ω0 die Eigenfrequenz. Nach einiger Zeit sind die Einschwingprozesse abgeklungen und die Elektronen schwingen mit der Frequenz ω des erregenden externen Feldes. Für diese inhomogene Lösung machen wir den Ansatz ~rinhom (t) = ~a e−iωt . (4.43) ~a stellt eine (konstante) komplexe Amplitude dar. Setzt man dies in die Bewegungsgleichung ein, so erhält man für das sogenannte atomare Dipolmoment ~ p~(t) = αe (ω)E(t) = e2 /me . ω02 − ω 2 − i Γ ω (4.44) Dabei bezeichnet αe (ω) die elektrische Polarisierbarkeit in Abhängigkeit von der Frequenz. Aus diesen Überlegungen erhält man den differentiellen Wirkungsquerschnitt für die Streuung von Licht 2 2 ω4 dσ e = sin2 θ . (4.45) dΩ me c2 (ω02 − ω 2 )2 + Γ2 ω 2 θ = π − Θ ist hierbei der Winkel zwischen Dipolmoment und Beobachtungspunkt. Dies hat die Form einer Resonanzkurve. Der totale Wirkungsquerschnitt ergibt sich daraus nach Integration zu 2 2 ω4 e 8π . (4.46) σ(ω) = 3 me c2 (ω02 − ω 2 )2 + Γ2 ω 2 Blauer Himmel Der Wirkungsquerschnitt σ der Rayleigh-Streuung ergibt sich als Grenzfall niedriger Frequenzen (im Vergleich zur Eigenfrequenz, ω ≪ ω0 ) aus dem Oszillatormodell (Gleichung 4.46) zu ω4 σ(ω) = σT h 4 , (4.47) ω0 wobei σT h = 0.665·10−24 cm2 der Thomson-Wirkungsquerschnitt ist. Die Rayleigh-Streuung erklärt, warum der Himmel blau erscheint. Die Frequenz von blauem Licht ωblau ist rund c Lehrstuhl E13, TUM, 2010 4.5. OPTISCHE PHÄNOMENE 111 1.4 mal so groß wie die von rotem Licht ωrot . Somit folgt das Verhältnis der Wirkungsquerschnitte σblau ω4 = blau ∼4 . (4.48) 4 σrot ωrot Blaues Licht wird also rund viermal stärker in der Atmosphäre gestreut als rotes Licht. Am Tag, wenn die Sonne hoch am Himmel steht, muss das Licht nur eine kurze Strecke durch die Atmosphäre zurücklegen. Dabei werden nennenswerte Lichtanteile nur im kurzwelligen, blauen Spektralbereich gestreut. Dieses Streulicht lässt den Himmel blau erscheinen. Ein Blick auf die Spektralfarben lässt vermuten, dass der Himmel violett sein sollte, da dies das kurzwelligste, sichtbare Licht ist. Das Licht des Himmels enthält auch diesen Lichtanteil, gelangt aber im Verhältnis zu den anderen Farben des Lichts in kleineren Mengen zur Erde und wird vom menschlichen Auge mit relativ geringer Empfindlichkeit und eingeschränkter Selektivität aufgenommen (siehe Farbwahrnehmung). Morgen- und Abendrot Bei niedrigem Sonnenstand ist die Strecke des Sonnenlichts durch die Erdatmosphäre groß. Da ein Großteil der hochfrequenten Lichtanteile (blau) schon gestreut wurde, treten die verbliebenen, langen Wellenlängen in Relation stärker zu Tage und der Farbeindruck der Sonne verschiebt sich in Richtung rot. Dieser Effekt wird durch zusätzliche Partikel in der Luft (z.B. Staub, Sand) weiter verstärkt. Versuch 3315: Streuung des Sonnenlichts Mit dem parallelem Lichtbündel eines Diaprojektors wird in das mit Mastix trübe gemachte Wasser eines Aquariums eingestrahlt. Außerdem wird auf das Becken eine Vorrichtung aufgesetzt, die es gestattet, den Strahl an einer beliebigen Stelle aus dem Wasser herauszureflektieren und über einen weiteren Umlenkspiegel an die Wand zu werfen. Die Farbe des Lichtflecks hängt dann von der Dicke der durchstrahlten trüben Flüssigkeitsschicht ab. Je dicker diese gemacht wird, desto mehr spielt die Farbe ins orange-rote. Um die Illusion eines Sonnenuntergangs zu erzeugen, wird der Auslenkspiegel mit zunehmender Schichtdicke geneigt, so daß der Lichtfleck immer tiefer sinkt, während er seine Farbe ins Rote verändert, bis er schließlich am ”Horizont”(Blendenkarton) verschwindet. 4.5.2 Lichtstreuung an ausgedehnten Objekten Sind die Objekte, an denen Licht gestreut wird, ausgedehnt, so sind Brechungs- und Reflektionsphänomene zu berücksichtigen. Prominentes Beispiel sind kugelförmige Wassertropfen, an denen Sonnenlicht bei Ein- und Austritt aus dem Tropfen wellenlängenabhängig gebrochen und an der rückwärtigen inneren Oberfläche richtungsabhängig reflektiert wird. Bei Ein- und Austritt aus dem kugelförmigen Tropfen wird der Lichtstrahl gemäß dem Brechungsgesetz abgelenkt und an der rückwärtigen inneren Oberfläche reflektiert. Beim Lichteintritt in den Tropfen gilt nLuf t sin Θ1 = nW asser sin Θ2 . c Lehrstuhl E13, TUM, 2010 (4.49) 4.5. OPTISCHE PHÄNOMENE 112 Abbildung 4.43: Strahlengang im Regentropfen bei einem Lichtstrahl Es folgt für den Ablenkwinkel des rückgestreuten Lichts gegenüber dem ursprünglich einfallen Lichtstrahl nLuf t sin Θ1 φA = π + 2Θ1 − 4 arcsin . (4.50) nW asser Eine geometrische Berechnung (siehe Abbildung 4.43) ergibt, dass die reflektierten Strahlen für monochromatisches rotes Licht von einem kugelförmigen Wassertropfen unabhängig vom Tropfendurchmesser maximal unter einem bestimmten Grenzwinkel von annähernd 42 Grad zurückgeworfen werden. Da größere Ablenkwinkel bei einfacher Reflektion nicht auftreten, häufen sich dort die Beiträge verschiedener Auftreffpunkte. Entsprechend ist die Intensität des reflektierten Lichtes unter dem Maximalwinkel besonders groß. Abbildung 4.44: Totalreflexion in einem Wassertropfen für 12 verschiedenen einfallende Lichtsrahlen Bei weißem Licht folgt aus dem Brechungsgesetz eine wellenlängenabhängige Ablenkung. Primär, also bei nur einer Reflektion des Lichtstrahls innerhalb des Tropfens, ergibt sich der Ablenkungswinkelbereich von 40o bis 42o (innen blau, außen rot) (siehe Abbildung 4.45). Es sind jedoch auch zwei Reflektionen innerhalb des Tropfens möglich. Für diesen sekundären Prozess ergibt sich der Ablenkungswinkelbereich von 50o bis 53o (innen rot, c Lehrstuhl E13, TUM, 2010 4.5. OPTISCHE PHÄNOMENE 113 außen blau) (siehe Abbildung 4.45). Primär und sekundär abgelenktes Licht unterscheiden sich also in der Anordnung der Farben. Abbildung 4.45: Ablenkung des Lichts bei Streuung an kugelförmigen Regentropfen. links: primärer Prozess mit einer Reflektion und rechts: sekundärer Prozess mit zwei Reflektionen. Regenbogen Der Regenbogen ist eine optische Naturerscheinung, die auftritt, wenn Sonnenlicht von der hinter dem Beobachter stehenden Sonne auf vor dem Beobachter befindliche Regentropfen oder andere Wassernebel trifft und reflektiert wird. Es entsteht ein kreisbogenförmiges Lichtband mit vielen Spektralfarben, die in einem charakteristischen Farbverlauf wahrgenommen werden. Für den primären Regenbogen (innen blau, außen rot) ergibt sich der Ablenkungswinkelbereich von 40o bis 42o . Abbildung 4.46: Der Regenbogen wird also nur sichtbar, wenn der Betrachter mit dem Rücken zur Sonne auf die Regenwand blickt, denn nur dann kann man in Richtung des Winkels schauen. Die Breite des Regenbogens entsteht dabei durch die Auffächerung der Farben in die unterschiedlichen Winkel, die eigentliche Form des Regenbogens aber durch den festen Beobachtungswinkel. Steht die Sonne höher als 42o über dem Horizont, sind keine Regenbögen mehr möglich, weil ihr Scheitelpunkt dann unterhalb des Horizonts läge. c Lehrstuhl E13, TUM, 2010 4.5. OPTISCHE PHÄNOMENE 4.5.3 114 Luftspiegelung Die Luftspiegelung ist ein durch Ablenkung des Lichtes an unterschiedlich warmen Luftschichten verursachter optischer Effekt basierend auf dem Fermatschen Prinzip. So erwärmt sich zum Beispiel gerade über schwarzem Asphalt einer Straße oder Wüstensand die Luft besonders stark und dehnt sich aus. Ihre Dichte (auch die optische Dichte) nimmt also direkt über der Straße ab und es entsteht ein kontinuierlicher Übergang von kalten, dichten Luftschichten zu heißen, weniger dichten über der Straße. Die Lichtstrahlen werden, ausgehend vom Auto, auf dem gesamten Weg durch die Luft zum Beobachter hin gebrochen und so quasi noch oben gebogen. Somit entsteht zusätzlich zu der direkten Beobachtung ein, an den heißen Luftschichten gespiegeltes, Bild eines Objekts oberhalb der Straße. Abbildung 4.47: Die Luft direkt über dem heißen Asphalt ist wärmer als die darüberliegenden Luftschichten und deshalb auch weniger dicht. Die Lichtstrahlen von einem fernen Objekt sind deshalb nach oben gebogen und es sieht so aus, als ob sich das Objekt am Boden spiegelt. Die Voraussetzung für eine zweite Art der Luftspiegelung ist, dass sich warme Luftschichten über den kalten befinden (Inversionswetterlage). Am besten ist dies über Wasseroder Eisflächen zu beobachten. Die Lichtstrahlen werden dann nämlich nach unten gebogen, wodurch für den Beobachter der Eindruck entsteht, als kämen sie von oben. Ein Objekt kann so auch nach oben gespiegelt werden, so dass sich das Trugbild über dem eigentlichen Objekt befindet. Auf diese Weise kann auf dem Meer ein Schiff am Himmel sichtbar werden, das sich vielleicht noch hinter dem Horizont befindet. Da der Sehwinkel, unter dem diese zweite Art der Luftspiegelung erscheint, im allgemeinen sehr klein ist, benötigt man zur Beobachtung ein Fernglas. Abbildung 4.48: Eine Spiegelung nach oben tritt auf, wenn sich kalte, dichte Luftschichten unter wärmeren Luftschichten befinden. c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 4.6 115 Licht als Anregung des elektromagnetischen Feldes Als elektromagnetische Welle bezeichnet man eine Welle aus gekoppelten elektrischen und magnetischen Feldern. Anders als z. B. Schallwellen, benötigen elektromagnetische Wellen kein Medium, um sich auszubreiten. Sie pflanzen sich im Vakuum unabhängig von ihrer Frequenz mit Lichtgeschwindigkeit fort. Im freien Raum treten sie als Transversalwellen auf, d. h. die elektromagnetischen Feldvektoren sind senkrecht zur Ausbreitungsrichtung der Welle orientiert. 4.6.1 Elektrisches Feld ~ ist eine vektorielle Größe, die den Betrag und die Richtung Die elektrische Feldstärke E der an einem Ort wirkenden Kraft F~ auf eine Einheitsladung q hat. Es ist ~ ~ =F E q (4.51) mit der Einheit 1N/C. Zum Beispiel ergibt sich im Abstand r zu einer Punktladung für die elektrische Feldstärke ~ = 1 Q ~r , (4.52) E 4 π ε0 r 2 r ~r der Richtungsvektor der Länge 1 ist. Hierbei ist ε0 = 8.85 · 10−12 C2 /(Nm2 ) die wobei r Influenzkonstante. Abbildung 4.49: Feldlinien einer positiv geladenen Punktladung: a) Kräfte an ausgewählten Punkten 1 bis 8 und b) zugehöriges Feldlinienbild. c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 116 Elektrische Feldlinien Feldlinien zeigen an jedem Ort in die Richtung der von der Feldstärke auf eine positive Ladung ausgeübten Kraft. Versuch 2040: Elektrische Feldlinien (Griesbilder) In eine flache Glasschale wird eine dünne Schicht Rizinusöl gegossen (einige mm). Als Elektroden dienen runde bzw. stangenförmige Messingstücke. Das ganze wird auf einer Schreibprojektion aufgebaut und die Elektroden mit den Polen der Influenzmaschine verbunden. Man streut Hartweizengrieß auf die Rizinusoberfläche und lädt die Elektroden auf. Die Grießkörner bilden dann entlang der Feldlinien Ketten. Folgende Anordnungen lassen sich demonstrieren: Monopol, Dipol, Punktladung gegen Platte, Plattenkondensator, Quadrupol. Man erkennt: • Feldlinien enden senkrecht auf Oberflächen elektrischer Leiter. Die beweglichen Ladungsträger verschieben sich, bis die tangentialen Komponenten des elektrischen Feldes verschwinden. • Je nach Geometrie der Objekte liegen die Feldlinien unterschiedlich dicht. • An den Spitzen von Leitern ist ihre Dichte besonders hoch. (Blitzableiter). • Das Innere eines von einem Leiter umgebenen Hohlraums ist frei von Ladung (FaradayKäfig). Gleichnamige Ladungen suchen größten Abstand voneinander, deshalb wandern sie auf die Außenseite des Leiters. Abbildung 4.50: links: Feldlinienbild einer negativen Ladung, rechts: Feldlinienbild einer Anordnung aus einer negativen und einer positiven Ladung. Quellen der Feldlinien sind positive Ladungen Senken der Feldlinien sind negative Ladungen c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 4.6.2 117 Magnetische Flussdichte ~ wird auch als magnetische Induktion oder umgangssprachDie magnetische Flussdichte B lich und unpräzise als Magnetfeld bezeichnet. Sie hat die Einheit 1 T (Tesla) = 1 Vs/m2 . Sie steht für die Flächendichte des magnetischen Flusses welcher durch ein bestimmtes Flächenelement hindurch tritt. ~ (auch magnetische Erregung genannt) kennzeichnet die Die magnetische Feldstärke H Stärke eines Magnetfeldes. Sie ist die Ursache für den magnetischen Fluss. Sie hat die Einheit 1 A/m. Im Vakuum gilt der Zusammenhang ~ ~ = B H µ0 (4.53) mit der magnetischen Feldkonstante µ0 = 4 π · 10−7 VS/(Am). Magnetische Feldlinien Magnetische Feldlinien geben in jedem Punkt die Richtung des Magnetfeldes bzw. des magnetischen Flusses an. Der Abstand zwischen benachbarten Feldlinien ist ein Anhaltspunkt für die Stärke des Magnetfeldes: je dichter die Feldlinien, desto stärker das Feld. Abbildung 4.51: links: Magnetische Feldlinien in der Umgebung eines Stabmagneten (von Nordzu Südpol), rechts: Das Erdmagnetfeld ist gegenüber der Erdachse verschoben und geneigt. Das Erdmagnetfeld ist das Magnetfeld, das die Erde umgibt. Nahe der Erdoberfläche ähnelt das Feld dem eines magnetischen Dipols (Stabmagnet). Die geomagnetischen Pole der Erde fallen nicht genau mit den geographischen Polen der Erde zusammen. Die Achse des geomagnetischen Dipolfeldes um etwa 12◦ gegenüber der Rotationsachse der Erde geneigt. c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 118 In guten Magnet-Kompassen ist die Nadel so austariert, dass sie vor allem auf die Horizontalkomponente anspricht und daher in den meisten Gebieten etwa nach Norden weist. Am Geomagnetischen Nordpol befindet sich aus physikalischer Sicht ein magnetischer Südpol. Daher wird dieser Pol besser als der nordanziehende Pol des Erdmagnetfeldes bezeichnet oder als der im Norden liegende Pol des Erdmagnetfeldes. Versuch 2135: Feldlinien um Stab und Hufeisenmagnet Auf der Unterseite einer Glasplatte ist ein Stabmagnet (Modell 1) bzw. ein Hufeisenmagnet (Modell 2) befestigt. Die Modelle werden auf die Schreibprojektion gelegt und Eisenfeilspäne aus einem Streuer darübergestreut. Der Feldverlauf ist sehr gut zu sehen. 4.6.3 Elektromagnetische Wellen In einer Dimension war eine harmonische Welle durch y (x, t) = ym sin (k x − ω t) (4.54) y (x, t) = ym cos (k x − ω t) (4.55) oder durch beschrieben (siehe Kapitel 2). In drei Dimensionen ist dann entsprechend die harmonische Welle y (~r, t) = ym sin (~k · ~r − ω t) . (4.56) Eine komplexe Beschreibung ist oft einfacher, da in Rechnungen keine Additionstheoreme benutzt werden müssen. In komplexer Darstellung ist eine harmonische Welle mit Ausbreitungsrichtung ∓~k ~ = î E0 exp i(~k · ~r ± ωt + ϕ0 ) = î Ê0 exp i(~k · ~r ± ωt) E (4.57) mit der komplexen Amplitude Sowohl der Realteil als auch der Imaginärteil beschreiben ebene Wellen. Ê0 = E0 exp (iϕ0 )) . (4.58) ~ = E0 cos ~k · ~r ± ωt + ϕ0 Re(E) (4.59) ~ ~ Im(E) = E0 sin k · ~r ± ωt + ϕ0 (4.60) Wellengleichung Die zugehörige eindimensionale Wellengleichung war (Kapitel 2) 2 ∂2 y 2 ∂ y = c . ∂t2 ∂x2 c Lehrstuhl E13, TUM, 2010 (4.61) 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 119 Die Phasengeschwindigkeit c ist die Ausbreitungsgeschwindigkeit der Welle. Entsprechend ist in drei Dimensionen die Wellengleichung für die elektrische Feldstärke ~ ∂2E ~ = c 2 ∆E ∂t2 (4.62) mit dem Laplace-Operator ∂2 ∂2 ∂2 + + . ∂x2 ∂y 2 ∂z 2 ~ die Wellengleichung Analog wird für die magnetische Flussdichte B ∆= ~ ∂2B ~ = c 2 ∆B 2 ∂t (4.63) (4.64) hergeleitet. Die Lösungen dieser Gleichungen beschreiben Wellen, die sich mit Lichtgeschwindigkeit c ausbreiten. Im Vakuum ist c2 = 1 µ0 ε0 (4.65) abhängig von der magnetischen Feldkonstante µ0 und der Influenzkonstante ε0 . Breitet sich die elektromagnetische Welle in isotropem Material (mit der relativen Permeabilität µr und der relativen Permittivität εr des Mediums) mit der Dielektrizitätskonstante ε = εr ε0 und der Permeabilität µ = µr µ0 aus, beträgt die Ausbreitungsgeschwindigkeit 1 c= √ µε . (4.66) Im Allgemeinen sind jedoch die Materialkonstanten µr und εr nicht linear, sondern können selbst z. B. von der Feldstärke oder der Frequenz abhängen. Während Licht sich in der Luft immer noch fast mit Vakuumlichtgeschwindigkeit c ausbreitet (die Materialkonstanten sind in guter Näherung 1), gilt das für die Ausbreitung in Wasser nicht, was u. a. den Tscherenkow-Effekt ermöglicht. Das Verhältnis der Vakuumlichtgeschwindigkeit zur Geschwindigkeit im Medium wird als Brechzahl r µε √ = µr εr n= (4.67) µ0 ε0 bezeichnet. Ausbreitung elektromagnetischer Wellen ~ 0 für das elektrische Feld Wir betrachten eine allgemeine Welle mit konstanter Amplitude E und einem Einheitsvektor k̂, der in Propagationsrichtung zeigt. Dann steht das elektrische Feld stets senkrecht zur Propagationsrichtung und es gilt ~ · k̂ = 0 . E c Lehrstuhl E13, TUM, 2010 (4.68) 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 120 Es handelt sich also um eine Transversalwelle. Zudem gilt ~ . ~ = 1 k̂ × E B c (4.69) Die magnetische Flussdichte in der elektromagnetischen Welle steht also ebenfalls senkrecht zur Propagationsrichtung und auch senkrecht zum elektrischen Feld. Abbildung 4.52: Die Komponenten einer elektromagnetischen Welle umfassen eine si~ und im rechten Winkel dazu eine ebenfalls sinusförmige manusförmige elektrische Welle (E) ~ gnetische Welle (B). Beide liegen senkrecht zur Ausbreitungsrichtung. Durch Betragsbildung auf beiden Seiten folgt weiterhin aus Gleichung 4.69, dass die Amplituden von elektrische Feld und magnetischer Flussdichte proportional zueinander sind: E0 = c B0 . (4.70) 4.6.4 Energiedichte und Energiefluß Mit dieser Beziehung lässt sich auch eine Aussage über die Energiedichte (Energie pro Volumeneinheit) des elektromagnetischen Felds 1 wem = ε0 (E 2 + c2 B 2 ) 2 (4.71) für den Fall der der elektromagnetischen Welle herleiten: wem = ε0 E 2 = 1 2 B µ0 . (4.72) ~ kennzeichnet die Dichte und die Richtung des EnerDer sogenannte Poynting-Vektor S gietransportes (Energieflussdichte) einer elektromagnetischen Welle. Für transversalelek~ definiert als tromagnetischen Wellen ist S ~=E ~ ×H ~ S c Lehrstuhl E13, TUM, 2010 . (4.73) 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES und im Vakuum gilt ~ = 1 (E ~ × B) ~ . S µ0 121 (4.74) Der Betrag des Poynting-Vektors entspricht der Leistungsdichte (oder Intensität I) der Welle (die Energie, die pro Zeiteinheit durch eine Einheitsfläche senkrecht zum PoyntingVektor hindurchtritt) rε ~ 0 I = S (4.75) E2 . = µ0 Der Betrag des Poynting-Vektors hat die Dimension N/(ms). 4.6.5 Polarisation Die Polarisation ist eine Eigenschaft transversaler Wellen (also elektromagnetischer oder ~ in Bezug optischer Wellen), die die Richtung des Feldvektors des elektrischen Feldes E ~ auf den Wellenvektor k beschreibt. Longitudinale Wellen (also Schallwellen) zeigen keine Polarisation, da die Schwingung in Ausbreitungsrichtung (das ist die Richtung des Wellenvektors ~k) erfolgt. Abbildung 4.53: Von links nach rechts: Lineare, zirkulare und elliptische Polarisation. Eine Transversalwelle ist durch zwei Richtungen charakterisiert: Den Wellenvektor ~k, ~ der unter der in Ausbreitungsrichtung zeigt, und den Feldvektor des elektrischen Feldes E, den angegebenen Voraussetzungen immer senkrecht auf dem Wellenvektor steht. Das lässt jedoch im dreidimensionalen Raum noch einen Rotationsfreiheitsgrad offen, nämlich die Rotation um den Wellenvektor. Man unterscheidet drei Arten von Polarisation, die man durch Richtung und Betrag des Feldvektors in einem festen Raumpunkt beschreiben kann: • lineare Polarisation: Der Feldvektor zeigt immer in eine feste Richtung und die Auslenkung ändert bei Voranschreiten der Welle ihren Betrag und ihr Vorzeichen periodisch (mit fester Amplitude). • zirkulare Polarisation: Der Feldvektor dreht sich bei Voranschreiten der Welle mit konstanter Winkelgeschwindigkeit um den Wellenvektor und ändert seinen Betrag dabei nicht. • elliptische Polarisation: Der Feldvektor rotiert um den Wellenvektor und ändert dabei periodisch den Betrag. Die Spitze des Feldvektors beschreibt dabei eine Ellipse. c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 122 Mit Hilfe der Fourier-Zerlegung lässt sich jedes beliebige Feld als Linearkombination von ebenen Wellen darstellen. Für diese ebenen Wellen schwingen also beide Felder in einer Ebene senkrecht zum Wellenvektor, d.h. sie sind in dieser Ebene polarisiert. Dabei ist es ausreichend das elektrischen Feld zu spezifizieren. Um die Polarisationsebene aufzuspannen, bedarf es zweier orthogonaler Basisvektoren î und ĵ (also î · ĵ = 0). Die Entwicklungskoeffizienten E1 und E2 müssen dabei auf Grund möglicher Phasenverschiebungen komplex sein. Mathematisch kann dies wie folgt zum Ausdruck gebracht werden: ~ = î E1 exp i(~k · ~r − ωt) + ĵ E2 exp i(~k · ~r − ωt) E . (4.76) Lineare Polarisation Bei linearer Polarisation gibt es eine Richtung, zum Beispiel die Richtung î, so dass in Gleichung 4.76 nur ein Koeffizient von Null verschieden ist, d.h. es gilt ~ = î E0 exp i(~k · ~r − ωt) ~ = ĵ B0 exp i(~k · ~r − ωt) E und B . (4.77) Durch geeignete Wahl des Zeitnullpunkts können E0 und B0 reell gemacht werden. Abbildung 4.54: Vektor der elektrischen Feldstärke bei linear polarisierter Welle Versuch 3245: Polarisationsfolien Zwei Polarisationsfilter (aus Polarisationsfolie) werden auf die Schreibprojektion gelegt und gegeneinander verdreht. Man beobachtet qualitativ die Lichtdurchlässigkeit in Abhängigkeit vom Drehwinkel. Polarisationsfilter: Unpolarisiertes Licht wird durch einen Polarisationsfilter z.B. linear polarisiert, das heißt das aus einem Gemisch aus zwei senkrecht zueinander polarisierten Lichtstrahlen nur einer durchgelassen wird. Anschaulich kann man sich einen linearen Polarsiationsfilter als Drahtgitter mit parallelen Stäben (siehe Abbildung 4.55 vorstellen. Diese Drähte schließen das elektrische Feld kurz, falls der entsprechende Feldvektor nicht parallel zu diesen orientiert ist. Bei einem optischen Polarisationsfilter wirken anstelle von Drähten atomare Effekte. Ebenso kann man sich vorstellen, dass die Welle das magnetische Feld darstellt. In diesem Fall stellen die Drähte magnetische Drähte dar, bei denen das magnetische Feld kurzgeschlossen wird. c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 123 Abbildung 4.55: Polarisationsfilter, links: Prinzip eines linearen Polarisationsfilters, das aus einem Gemisch aus zwei senkrecht zueinander polarisierten Lichtstrahlen nur den einen durchlässt (Darstellung für das B-Feld) und rechts: Gekreuzte Polarisatoren führen zur Auslöschung des Lichts (Darstellung für das E-Feld). Gesetz von Malus: Fällt linear polarisiertes Licht der Intensität I0 auf einen Polarisator, dessen Transmissionsachse mit der Schwingungsrichtung des elektrischen Feldes den Winkel α bildet, so gilt für die nach dem Polarisator austretende Intensität I = I0 cos2 (α) . (4.78) Zirkulare Polarisation Beim zirkular polarisierten Licht rotieren an einem gegebenen Ort ~r beide Felder mit der Kreisfrequenz ω um die Ausbreitungsrichtung. Dabei bleibt ihr Betrag konstant. Zirkular polarisiertes Licht entsteht durch Überlagerung von zwei zueinander senkrechter und um π/2 phasenverschobener, linear polarisierter Wellen, die die selbe Ausbreitungsrichtung und die selbe Frequenz haben. Entsprechend haben die beiden elektrischen Felder den selben Betrag, aber eilen einander voraus und es gilt ~ = î E0 exp i(~k · ~r − ωt) + ĵ E0 exp i(~k · ~r − ωt ± π/2) E (4.79) und ~ = î B0 exp i(~k · ~r − ωt ± π/2) − ĵ B0 exp i(~k · ~r − ωt) B . (4.80) ~ ~ B = (±i î − ĵ) B0 exp i(k · ~r − ωt) . (4.82) In komplexer Schreibweise ist dies zusammengefasst unter Verwendung von exp (± i π/2)) = ±i ~ ~ E = (î ± i ĵ) E0 exp i(k · ~r − ωt) (4.81) und Das ±-Zeichen in obiger Gleichung bringt zum Ausdruck, daß wir links- und rechtszirkularpolarisiertes Licht erzeugen können. Wir führen also den Begriff der Händigkeit oder Chiralität ein. Das Pluszeichen steht für rechts polarisiertes Licht, d.h. wenn wir uns das elektrische Feld für einen fixen Zeitpunkt t = t0 betrachten, so beschreibt es eine rechtshändige Spirale entlang des Wellenvektors ~k. c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 124 Abbildung 4.56: Vektor der elektrischen Feldstärke bei zirkular polarisierten Wellen: linkszirkulare Welle (oben) und rechtszrikulare Welle (unten). Elliptische Polarisation Wird entlang zweier orthogonaler Richtungen linear polarisiertes Licht mit einer Phasenverschiebung von π/2 aber mit unterschiedlicher Amplitude überlagert, so resultiert elliptisch polarisiertes Licht mit ~ = (E1 î ± i E2 ĵ) exp i(~k · ~r − ωt) E (4.83) Dies ist der allgemeinste Fall und sowohl linear als auch zirkular polarisiertes Licht können als Spezialfälle der elliptischen Polarisation aufgefasst werden. Polarisationsgrad Partiell polarisiertes Licht ist Licht, das nicht gänzlich polarisiert ist. Wir definieren den Polarisationsgrad als Ipol P = (4.84) Iges wobei Ipol für die Intensität des polarisierten Anteils steht. Optische Spannungsanalyse Um die mechanische Beanspruchung (Spannungen und Spannungsspitzen) in technischen Bauteilen sichtbar zu machen, werden die Bauteile in Plexiglas nachgebildet, mit Licht durchstrahlt und zwischen Polarisationsfilter gesetzt. Die Spannungen (Definition: Spannung ist Kraft pro Fläche) führen zu farblich veränderten Linien, die durch ihre Dichte die Höhe der Spannung anzeigten. Es erfolgt die Aufnahme von Isochromaten (Kurven gleicher c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 125 Farbe) und Isoklinen (Kurven gleicher Ableitung) für unterschiedlich beanspruchte Körper (siehe Abbildung 4.57). Abbildung 4.57: Untersuchung der Beanspruchung einer Verzahnung. Gezeigt ist das Isochromatenbild. Die mechanische Beanspruchung dreht die Polarisationsebene des Lichts und es kommt zur Doppelbrechung. Versuch 3265: Spannungsoptik Verschiedene Objekte aus Glas werden zwischen zwei gekreuzte Polarisationsfilter gestellt und mit einer Linse abgebildet. Wenn keine Deformationskräfte auf die Gegenstände wirken ist nur ein lichtschwaches Bild auf der Leinwand zu sehen. Deformiert man sie aber von Hand oder mit einem Werkzeug, so zeigen sich helle Bereiche gleicher Spannung im Bild. 4.6.6 Polarisation durch Reflektion und Brechung Die Reflektion und die Brechung von elektromagnetischen Wellen (Licht) wird durch die Fresnelschen Formeln bestimmt. Der einfallende und der reflektierte Strahl definieren die Einfallsebene. Diese ist senkrecht zur Grenzfläche der beiden Medien. Licht, dessen Polarisationsebene senkrecht zur Einfallsebene liegt, heisst s-polarisiertes Licht (auch häufig als transverselektrische (TE) Komponente bezeichnet). Licht, dessen Polarisationsebene parallel zur Einfallsebene liegt, heisst p-polarisiertes Licht (auch häufig als transversmagnetische (TM) Komponente bezeichnet). Abhängig von der Polarisation der einfallenden Welle ergeben sich unterschiedliche Randbedingungen für das Auftreffen einer elektromagnetischen Welle auf eine optische Grenzfläche. Eine einfallende, beliebig polarisierte Welle mit dem Wellenvektor k~e lässt sich also als Superposition einer parallel (p) und senkrecht (s) zur Einfallsebene polarisierten Welle schreiben ~ ~ E = [(E0e )s ~es exp (iδs ) + (E0e )p ~ep exp (iδp )] exp i(ke · ~r − ωt) (4.85) ~ ~ ~ E = (E0e )s ~es exp i(ke · ~r − ωt + δs ) + (E0e )p ~ep exp i(ke · ~r − ωt + δp ) . c Lehrstuhl E13, TUM, 2010 (4.86) 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 126 Abbildung 4.58: Einfalles Licht mit den zwei Polarisationszuständen s und p wird an einer Grenzfläche reflektiert und gebrochen. ~ der Feldvektor des elektrischen Feldes, ~es,p sind die Einheitsvektoren für sDabei ist E und p-Polarisation, (E0e )s,p sind Amplituden der einfallenden Wellen und die Parameter δs,p entsprechen beliebigen Phasenverschiebungen. sin β und Additionstheoremen ergibt Nach dem Snelliussche Brechungsgesetz war nn21 = sin α sich für die senkrechte Polarisation (TE) E0t E0e E0r E0e = ts = 2 sin β cos α 2n1 cos α = n1 cos α + n2 cos β sin (α + β) (4.87) = rs = sin (α − β) n1 cos α − n2 cos β =− n1 cos α + n2 cos β sin (α + β) (4.88) s s und für die parallele Polarisation (TM) E0t E0e = tp = p E0r E0e 2 sin β cos α 2n1 cos α = n2 cos α + n1 cos β sin (α + β) cos (α − β) (4.89) tan (α − β) n2 cos α − n1 cos β = . n2 cos α + n1 cos β tan (α + β) (4.90) = rp = p Dabei sind ts,p die Amplitudenkoeffizienten der transmittierten und rs,p die Amplitudenkoeffizienten der reflektierten elektromagnetischen Welle in s- und p-Polarisation. Die zugehörigen Transmissionskoeffizienten Ts,p und Reflektionskoeffizienten Rs,p sind Ts,p = tan α 2 2 t und Rs,p = rs,p . tan β s,p (4.91) In Abhängigkeit vom Einfallswinkel α zeigen die Amplitudenkoeffizienten der reflektierten elektromagnetischen Welle einen Kurvenverlauf, der vom Verhältnis der Brechungsindices an der Grenzfläche, an der die Welle reflektiert wird, abhängt. Es gibt einen ausgezeichneten Winkel, an dem der Amplitudenkoeffizient der p-polarisierten Welle bis auf null abfällt. Dieser Winkel heisst Brewster Winkel. c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 127 Abbildung 4.59: Amplitudenkoeffizienten der reflektierten elektromagnetischen Welle in Abhängigkeit des Einfallswinkels α beim Einfall von Licht auf die Grenzfläche zweier idealer Dielektrika (Luft-Glas). Brewster Winkel Unpolarisiertes (natürliches) Licht, das auf eine Glasoberfläche fällt, ist nach der Reflexion teilweise polarisiert, und zwar so, dass die elektrischen Feldvektoren, die senkrecht zur Einfallsebene schwingen, dominieren. Das reflektierte Licht ist vollständig polarisiert, wenn der Einfallswinkel so gewählt wird, dass der reflektierte und gebrochene Strahl senkrecht aufeinander stehen. Die Schwingungsrichtung ist dabei senkrecht zur Einfallsebene. Dieser Polarisationswinkel heißt Brewster Winkel. Der gebrochene Strahl enthält vorwiegend Feldvektoren, die in der Einfallsebene schwingen. Dort wo die Amplitudenkoeffizienten reell und negativ sind tritt ein Phasensprung von 180o = π auf (bei reell und positiv keine Phasenänderung) r = −|r| = |r| · eiπ (4.92) Das Amplitudenverhältnis rp besitzt einen Nulldurchgang am Brewster Winkel αB wegen rp = tan(α − β) = 0 für α + β = 90o . tan(α + β) (4.93) Die unter dem Brewster Winkel reflektierte Lichtwelle enthält also keinen Anteil an ppolarisiertem Licht und ist ausschließlich s-polarisiert. Mit n2 sin α sin α sin α = = = tan α = ◦ n1 sin β sin(90 − α) cos α (4.94) berechnet sich der Brewster Winkel zu αB = arctan Beispiel: Brewster-Winkel für Luft-Glas ist αB = 33.7o . n2 n1 = Versuch 3255: Polarisation nach Brewster c Lehrstuhl E13, TUM, 2010 1.5 1 n2 . n1 ist αB = 56.3o und für Glas-Luft (4.95) n2 n1 = 1 1.5 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 128 Eine Lochblende wird mit polarisiertem Licht auf die Leinwand abgebildet, wobei der Strahlengang in Reflexion über eine Glasplatte geführt wird. Je nach Polarisationsrichtung sieht man beim Brewster Winkel den Lichtfleck an der Leinwand verschwinden oder nicht. Man kann auf diese Weise feststellen, welche Polarisationsrichtung reflektiert wird und welche nicht. Versuch 3250: Polarisation durch Reflexion Die Nörrembergsche Anordnung besteht aus zwei spiegelnden Flächen, die auf einer gemeinsamen Drehachse so befestigt sind, dass die Drehachse durch den Mittelpunkt geht. Außerdem können die Spiegel unabhängig voneinander gegen die Drehachse geneigt werden. Das Gerät wird so aufgestellt, dass die Drehachse senkrecht steht. Dann lässt man ein Lichtbündel auf den unteren Spiegel fallen, reflektiert es zum oberen Spiegel und von dort an die Hörsaalwand. Stellt man als Reflexionswinkel den Brewster Winkel ein und richtet die beiden Spiegel parallel zueinander aus, so ist das ausfallende Bündel vollständig polarisiert. Ein Verdrehen des oberen Spiegels um 90o löscht den ausfallenden Strahl völlig aus. Weiter Spezialfälle sind: • Wenn ein einfallender Strahl senkrecht zur Einfallsebene (durch Lot und Strahl aufgespannt) polarisiert ist, erzeugen die angeregten Dipolschwingungen einen reflektierten und einen gebrochenen Strahl gleicher Polarisation. • Wenn ein einfallender Strahl parallel zur Einfallsebene polarisiert ist, ist die Intensität des reflektierten Strahls abhängig vom Einfallswinkel. Beim Brewster Winkel (das heißt der gebrochene Strahl ist senkrecht zum reflektierten Strahl) ist die reflektierte Intensität annähernd gleich null. Abbildung 4.60: Sonnenbrille mit Polarisationsfilterfunktion zur Helligkeitsverringerung indem der Horizontalanteil des Lichts, also von Oberflächen reflektiertes Licht, blokiert wird. Anwendung: Sonnenbrille: Im Skiurlaub schützt man seine Augen vor der grellen Höhensonne. Gute Sonnenbrillen besitzen dafür Gläser aus polarisierendem Material, die nur vertikal polarisiertes Licht passieren lassen. Wie funktioniert die Helligkeitsverringerung? Die von der weitgehend horizontalen Schneefläche reflektierte Intensität ist hauptsächlich senkrecht zur Einfallsebene des Sonnenlichtes polarisiert (Diese darf hier als vertikal angesehen werden!) - schwingt also horizontal zum Betrachter. Die Sonnenbrille blockt genau diesen Horizontalanteil. c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 129 Doppelbrechung Als Doppelbrechung wird die Eigenschaft von optisch anisotropen Materialien bezeichnet, ein Lichtbündel in zwei senkrecht zueinander polarisierte Teilbündel aufzuspalten (vgl. Brechung). Die Ursache dieses Effekts liegt in unterschiedlichen Brechzahlen (no und nao ) in Abhängigkeit von der Ausbreitungsrichtung und Polarisation des Lichtes. Ein prominentes Beispiel für ein solches Material ist Calcit (Kalkspat). Doppelbrechende Materialien werden z. B. in Wellenplatten und Polarisatoren verwendet. Man kann aus unpolarisiertem Licht so linear polarisisertes Licht erzeugen. Abbildung 4.61: Doppelbrechung im Kalkspat: Ein Strahl der beiden folgt den normalen Brechungsgesetzen; man nennt ihn den ordentlichen Strahl. Der andere tut das nicht, er heisst deshalb der außerordentliche Strahl (abgekürzt mit a.ordn. Strahl). Versuch 3250: Doppelbrechung und Polarisation am Kalkspat Eine Lochblende wird durch einen Kalkspat-Kristall (CaCO3 ) hindurch mit einer Linse auf die Leinwand abgebildet, wobei zwischen Linse und Leinwand noch ein Polarisationsfilter in den Strahlengang gebracht werden kann. Der Kalkspat ist so in einer Halterung befestigt, dass seine optische Achse zum Strahlengang parallel gestellt werden kann. Außerdem lässt sich der ganze Kristall um die optische Achse drehen. Ohne Polarisationsfilter sieht man zwei Bilder der Lochblende an der Wand, die beim Drehen des Kristalls umeinander rotieren. Bringt man nun einen Polfilter in den Strahlengang, so werden beim Drehen des Kristalls die beiden Bilder abwechselnd hell und dunkel. Dichroismus Wenn in einem Kristall der außerordentliche Strahl, der durch Doppelbrechung entsteht, absorbiert wird, spricht man vom Dichroismus. Ein Beispiel hierfür ist der Turmalin. Entsprechend sind bei der Betrachtung aus verschiedenen Blickwinkeln verschiedene Farben zu sehen. Polarimetrie Die Konzentrationsbestimmung von Lösungen optisch aktiver Stoffe mit Hilfe polarisierten Lichtes heisst Polarimetrie. Beim Durchgang von linear polarisiertem Licht durch eine c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 130 optisch aktive Probe wird die Polarisationsebene des linear polarisierten Lichtes gedreht. Abbildung 4.62: In der Polarimetrie wird Licht einer Natriumdampflampe durch einen Polarisationsfilter linear polarisiert und die Verdrehung der Polarisation durch eine optisch aktive Lösung mittels eines Analysators gemessen. Der Betrag des Drehwinkels ist dabei direkt proportional zur Konzentration c der gelösten Verbindung. Je mehr optisch aktive Moleküle gelöst sind, desto größer wird natürlich ihr resultierender Effekt sein. Deswegen ist der Drehwinkel α auch proportional zur Strecke d, die das Licht in der optisch aktiven Lösung zurücklegt. Mit der Proportionalitätskonstante α0 , die spezifisches Drehvermögen genannt wird, ist α = α0 d c . (4.96) Dieser Drehwinkel ist charakteristisch für die Probe. Er kann als Maß für die Reinheit der Substanz gelten. Weitere Anwendungen sind die Unterscheidung zwischen optisch aktiven Isomeren, die Erfassung von Konzentrationsänderungen einer optisch aktiven Substanz in einer Reaktionsmischung oder die Untersuchung kinetischer Reaktionen durch Messung der optischen Drehung als Funktion der Zeit. Eine Substanz heißt rechtsdrehend, wenn sie die Polarisationsebene des Lichtes im Uhrzeigersinn dreht. Dreht sie diese dagegen im Gegenuhrzeigersinn, so nennt man sie linksdrehend. Versuch 3275: Optische Aktivität einer Zuckerlösung Eine Lochblende wird durch eine Küvette (3 cm × 10 cm) hindurch auf die Leinwand abgebildet (Objektiv f = 250 mm, Lichtquelle 24 V / 250 W). Die Küvette wird mit Rohrzuckerlösung gefüllt und zwischen zwei Polarisationsfilter gestellt, welche so eingestellt werden, dass die Abbildung ausgelöscht wird. Nimmt man jetzt die Küvette mit der Zuckerlösung aus dem Strahlengang heraus, so wird das Bild wieder hell. Im Umkehrversuch kreuzt man ohne Zuckerlösung die Polarisatoren bis zur Auslöschung und stellt dann die gefüllte Küvette in den Strahlengang. Wieder erfolgt eine Aufhellung. c Lehrstuhl E13, TUM, 2010 4.6. LICHT ALS ANREGUNG DES ELEKTROMAGNETISCHEN FELDES 131 Flüssigkristallbildschirm In Flüssigkristalldisplays verwendete Flüssigkristalle sind organische Verbindungen, die richtungsabhängige (anisotrope) physikalische Eigenschaften aufweisen und die sowohl Eigenschaften von Flüssigkeiten als auch Eigenschaften von Festkörpern zeigen. Sie sind einerseits mehr oder weniger fluide wie eine Flüssigkeit, andererseits zeigen sie Eigenschaften wie Doppelbrechung. Ein Flüssigkristallbildschirm oder eine Flüssigkristallanzeige (englisch liquid crystal display, LCD), ist ein Bildschirm oder eine Anzeige, dessen Funktion darauf beruht, dass Flüssigkristalle die Polarisationsrichtung von Licht beeinflussen, wenn ein bestimmtes Maß an elektrischer Spannung angelegt wird. LCDs bestehen aus Segmenten, die unabhängig voneinander ihre Helligkeit ändern können. Dazu wird mit elektrischer Spannung in jedem Segment die Ausrichtung der Flüssigkristalle gesteuert. Damit ändert sich die Durchlässigkeit für polarisiertes Licht, das mit einer Hintergrundbeleuchtung und Polarisationsfiltern erzeugt wird. Abbildung 4.63: Durch die Verdrillung der Moleküle folgt eine Drehung der Polarisationsrichtung des Lichtes, wodurch das Licht den zweiten Polarisator passieren kann. Das Display ist im Ruhezustand durchsichtig. Legt man eine elektrische Spannung an die Elektroden an, so tritt unter dem Einfluss des elektrischen Feldes eine Drehung der Flüssigkristallmoleküle ein, die sich parallel zum elektrischen Feld ausrichten. Die Verdrillung wird damit zunehmend aufgehoben, die Polarisationsrichtung des Lichts wird nicht mehr gedreht und damit kann es den zweiten Polarisationsfilter nicht mehr passieren. Die einfachste Anordnung ist die nematische Drehzelle (engl. twisted nematic, TNZelle) bei der die Verdrillung der Moleküle 90o beträgt. Aufgrund der niedrigen Ansteuerspannung (im Bereich weniger Volt) und der nahezu leistungslosen Ansteuerung (es ist kein Stromfluss zum Betrieb notwendig), bildet die TN-Zelle die Grundlage zur Anwendung von LCDs in tragbaren batteriebetriebenen Geräten, wie z.B. Taschenrechnern und Armbanduhren. Bei einem farbfähigen Bildschirm werden pro Bildelement (Pixel) drei Teilbildelemente (Subpixel) für die Grundfarben Rot, Grün und Blau verwendet. c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 132 Eine Verbesserung in Bezug auf einen erhöhten Farbkontrast erreichen STN-Displays (Super-Twisted-Nematic), bei denen der Verdrillwinkel der Moleküle auf 180 bis 270 Grad erhöht ist. Ein TFT-Display besteht grundsätzlich aus einer TN-Zelle, einem Farbfilter und einem Transistor pro Subpixel. Die Abkürzung TFT steht für Dünnfilm-Transistor (engl. T hin F ilm T ransistor). Der Transistor steuert die Helligkeit des jeweiligen Subpixels direkt vor Ort. Mit dieser Technologie werden schnellere Schaltzeiten und eine genauere Steuerung des Pixels gegenüber Passiv-Displays ermöglicht. Mit dieser Technologie ist es auch möglich, sehr hohe Auflösungen (grösser als 640 x 480 Pixel) zu realisieren. Die Farbfilter für die Farben Rot, Grün und Blau sind nebeneinander auf das Glassubstrat aufgebracht. Jeder einzelne Bildpunkt (engl Dot) setzt sich aus drei dieser Farbzellen oder Bildelemente zusammen. Man hat somit bei einer Auflösung von 1280 × 1024 genau 3840 × 1024 Transistoren und Bildelemente. Der Punktabstand (engl Dot Pitch bzw. Pixel Pitch) beträgt bei einem 15.1-Zoll-TFT (1024 × 768 Pixel) circa 0.30 mm und bei einem 18.1-Zoll-TFT (1280 × 1024 Pixel) ungefähr 0.28 mm. Ein 15-Zoll Bildschirm enthält also bereits etwa 800000 Bildpunkte oder ungefähr 2.4 Millionen LCD-Zellen. 4.7 Wellenoptik Bisher haben wir in drei Dimensionen immer ebene Wellen ~ = î E0 exp i(~k · ~r ± ωt + ϕ0 ) = Ê0 exp i(~k · ~r ± ωt) E (4.97) mit Ausbreitungsrichtung ∓~k betrachtet. Es gibt aber auch andere Arten von Wellen, wie zum Beispiel Kugelwellen Ê0 ~ ~ E= exp i(k · ~r ± ωt) (4.98) r für die die Amplitude mit wachsendem Abstand vom Ort des Erregers proportional mit 1/r abnimmt, da die Energie der Welle auf eine immer größere Kugelfläche verteilt wird. Abbildung 4.64: links: Eine Welle, bei der die Wellenfronten (Orte gleicher Phase) auf Ebenen liegen heißt ebene Welle. rechts: Eine 1/r-amplitudengedämpfte harmonische Kreiswelle. c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 4.7.1 133 Interferenz von Wellen Interferenz beschreibt die Überlagerung von zwei oder mehr Wellen nach dem Superpositionsprinzip (d.h. durch Addition der Amplituden, nicht der Intensitäten). Wir betrachten zunächst die Überlagerung von zwei gleichfrequenten ebenen Wellen mit gleicher Ausbreitungsrichtung ~ =E ~1 + E ~ 2 = îE1 exp i(~k · ~r ± ωt + ϕ01 ) + îE2 exp i(~k · ~r ± ωt + ϕ02 ) E . (4.99) Werden die Wellen von unterschiedlichen Orten ausgesendet, so wird die durch verschieden lange Laufwege verursachte Phasenverschiebung der beteiligten Wellen durch die verschiedenen Nullphasenwinkel ϕ01 und ϕ02 berücksichtigt. Es folgt wieder eine ebene Welle, jedoch mit geänderter Amplitude und anderem Phasenwinkel ~ = îE0 exp i(~k · ~r ± ωt + ϕ0 ) E . (4.100) Die Intensität I der Welle war nach Gleichung 4.75 r ε0 2 I= E µ0 (4.101) und mit ~E ~ ∗ = (E1 exp(iϕ01 ) + E2 exp(iϕ02 )) (E1 exp(−iϕ01 ) + E2 exp(−iϕ02 )) E2 = E E 2 = E12 + E22 + 2E1 E2 cos (ϕ02 − ϕ01 ) (4.102) (4.103) folgt eine Gesamtintensität I = I1 + I2 + 2 Die Phasendifferenz der Teilwellen ist p I1 I2 cos (∆ϕ) . ∆ϕ = ϕ02 − ϕ01 . (4.104) (4.105) Der zusätzliche Interferenzterm wird durch die Phasenbeziehung zwischen den beiden Teilwellen bestimmt. In einem wichtigen Spezialfall sind die Amplituden der beiden Wellen und damit auch beide Intensitäten gleich (I1 = I2 ) und es folgt für die Gesamtintensität I = 2I1 [1 + cos (∆ϕ)] (4.106) oder nach Anwendung eines Additiontheorems 2 I = 4I1 cos c Lehrstuhl E13, TUM, 2010 ∆ϕ 2 . (4.107) 4.7. WELLENOPTIK 134 Löschen sich die Wellen durch Überlagerung gegenseitig aus, so spricht man von destruktiver Interferenz. Verstärken sich die Amplituden, so spricht man von konstruktiver Interferenz. Es erfolgt konstruktive Interferenz (Intensität maximal) für ∆ϕ = N 2π ; N = 0, ±1, ±2, ... (4.108) und destruktive Interferenz (Intensität minimal) für ∆ϕ = (N + 1/2) 2π ; N = 0, ±1, ±2, ... . (4.109) Versuch 3150: Interferenzmodell Das Modell besteht aus zwei Glasplatten, die übereinander liegen und gegeneinander verschoben werden können. Jede Glasplatte hat ein System konzentrischer schwarzer Ringe aufkopiert. Die ganze Anordnung wird auf die Schreibprojektion gelegt. In Transmission sieht man nur diejenigen Stellen hell, die von keinem der beiden Ringsysteme abgedeckt werden. Das stellt eine gewisse Analogie zur Interferenzauslöschung dar. Für die Überlagerung von zwei gleichfrequenten ebenen Wellen mit verschiedener Ausbreitungsrichtung gilt ~ =E ~ 1 +E ~ 2 = îE1 exp i(~k1 · ~r ± ωt + ϕ01 ) + îE2 exp i(~k2 · ~r ± ωt + ϕ02 ) E . (4.110) Die Wegdifferenz ist entscheidend für das Auftreten von Interferenzerscheinungen zwischen diesen Wellen. Der optische Weg dopt ist durch den geometrischen Weg r und die Brechzahl n entlang dieses Weges bestimmt dopt = r n . (4.111) Der Gangunterschied ∆r ist die Wegdifferenz (Wegunterschied) zweier oder mehrerer kohärenter Wellen gleicher Wellenlänge. Für eine Laufzeitdifferenz ∆t folgt ∆r = c ∆t = c (t2 − t1 ) = c r2 r1 − c = r2 n 2 − r1 n 1 . c2 c1 (4.112) Zusätzlich sind noch Phasensprünge bei Reflektion möglich, die einen weiteren Beitrag zum Gangunterschied liefern können. Der aus den unterschiedlich langen zurückgelegten Wegen folgende Gangunterschied ∆r führt ebenfalls zu einer Phasendifferenz ∆ mit ∆= ∆r 2π . λ (4.113) Die gesamte Phasendifferenz δ setzt sich also aus zwei Anteilen zusammen: Ein Beitrag kommt durch die Phasendifferenz zwischen den beiden Wellen ∆ϕ und ein zweiter Beitrag folgt aus der Phasendifferenz ∆, die aus der Wegdifferenz, die beide Wellen durchlaufen, stammt. Es ist δ = ∆ϕ + ∆ . (4.114) Entsprechend ergeben sich als Interferenzbedingungen für zwei zwei gleichfrequenten ebenen Wellen mit verschiedener Ausbreitungsrichtung (Zweistrahlinterferenz): c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 135 a) konstruktive Interferenz (Intensität maximal) für δ = N 2π ; N = 0, ±1, ±2, ... (4.115) ∆r = N λ ; N = 0, ±1, ±2, ... (4.116) b) destruktive Interferenz (Intensität minimal) für δ = (N + 1/2) 2π ∆r = (N + 1/2) λ ; N = 0, ±1, ±2, ... (4.117) ; N = 0, ±1, ±2, ... . (4.118) Für den Spezialfall gleicher Amplituden I1 = I2 = I0 folgt für die Gesamtintensität δ I = 4I0 cos 2 2 . Abbildung 4.65: Interferenz zweier Kugelwellen c Lehrstuhl E13, TUM, 2010 (4.119) 4.7. WELLENOPTIK 4.7.2 136 Der ideale Doppelspalt Beim Doppelspaltexperiment lässt man kohärentes, monochromatisches Licht durch eine Blende mit zwei schmalen, parallelen Schlitzen treten. Auf einem Beobachtungsschirm hinter der Blende zeigt sich dann ein Interferenzmuster aus hellen und dunklen Streifen. Dieses Muster entsteht durch die Interferenz der die beiden Blendenöffnungen passierenden Lichtstrahlen. Versuch 3200: Beugung am Doppelspalt Wir beleuchten mit einem grünen Laser einen verstellbaren Spalt, so dass das Beugungsbild in etwa 10 m Abstand auf der Leinwand erscheint. Außerdem erzeugen wir mit dem roten Laser das Beugungsbild eines Doppelspaltes und ordnen es so genau über dem des Einfachspaltes an. Nun kann man den verstellbaren Spalt so einstellen, dass die Struktur des Beugungsbildes mit der Grobstruktur des Doppelspaltes übereinstimmt. Der Spaltabstand d liegt in der Größenordnung der verwendeten Wellenlänge λ und wir beobachten auf einem weit entfernten Schirm im Abstand l >> d das Interferenzmuster. Abbildung 4.66: links: Konstruktion von Punkten maximaler oder minimaler Intensität hinter dem Doppelspalt. rechts: Interferenzmuster des Doppelspalts. Dann ist der Gangunterschied ∆r = d sin Θ und konstruktive Interferenz führt zu Maxima mit mλ = d sin(Θ) (4.120) und destruktive Interferenz zu Minima mit (m + 1/2)λ = d sin(Θ) (4.121) für m = 0, ±1, ±2, ±3, .... Wenn der Beobachtungsschirm relativ weit vom Doppelspalt entfernt ist, ist der Winkel Θ zum Beobachtungspunkt von beiden Spalten aus derselbe und es gilt d sin Θ ≈ d tan Θ = d c Lehrstuhl E13, TUM, 2010 ym ≈ mλ . l (4.122) 4.7. WELLENOPTIK 137 Abbildung 4.67: Geometrie am Doppelspalt: y misst den Abstand auf dem Schirm von der Mitte des Doppelspalts zum Beobachtungspunkt P . Der m-te helle Streifen hat von der Achse den Abstand λl d (4.123) λl . d (4.124) ym ≈ m und der Abstand zweier Streifen ist ∆y = Für einen idealen Doppelspalt mit der Spaltbreite 0 folgt für die Intensität nach Gleichung 4.119 δ 2 I = 4 I0 cos (4.125) 2 mit einer Phasendifferenz δ= 2π d sin(Θ) . λ Abbildung 4.68: Intensitätsverteilung für einen idealen Doppelspalt. c Lehrstuhl E13, TUM, 2010 (4.126) 4.7. WELLENOPTIK 4.7.3 138 Der Einzelspalt Teilt man in Gedanken ein Lichtbündel, das an einem Einzelspalt in eine bestimmte Richtung abgelenkt wird, in zwei Hälften, können sich diese beiden Anteile des Lichtbündels konstruktiv oder destruktiv überlagern. Auch an einem Spalt ergibt sich so wieder eine Reihe von Beugungsmaxima. Versuch 3200: Beugung am Spalt Wir beleuchten mit dem grünen Laser einen verstellbaren Spalt, so dass das Beugungsbild in etwa 10 m Abstand auf der Leinwand erscheint. Abbildung 4.69: links: M + 1 punktförmige Lichtquellen in einem Spalt der Breite a. rechts: Zeigerdiagramm zur Berechnung der Amplitude für einen Einzelspalt. Beim Doppelspalt sind wir von der Idealisierung punktförmiger Spalte ausgegangen. In Wirklichkeit haben die Spalte aber eine endliche Breite a. In einem Gedankenexperiment unterteilen wir den Einzelspalt der Breite a in M + 1 punktförmige Lichtquellen mit Abstand d = a/M . Der Phasenunterschied zwischen zwei benachbarten Lichtquellen in die Richtung Θ ist 2π δi = d sin Θ . (4.127) λ Der gesamte Phasenunterschied ist dann Φ= M X δi = (M + 1) i=0 und für M → ∞ M + 1 2π 2π d sin Θ = a sin Θ λ M λ (4.128) 2π a sin Θ . (4.129) λ Die Amplitude A0 resultiert aus der Addition von M + 1 Einzelamplituden A gemäß dem Zeigerdiagramm wie in Abbildung 4.69 veranschaulicht Φ . (4.130) A0 = 2 r sin 2 c Lehrstuhl E13, TUM, 2010 Φ= 4.7. WELLENOPTIK 139 Für den Winkel Θ = 0 ist Amax = A0 (Θ = 0) = M A. Die Amplituden der einzelnen Quellen sind unabhängig von der Beobachtungsrichtung. Deshalb ist auch die Bogenlänge Amax = M A = r Φ. Wir lösen nach r auf und setzen in Gleichung 4.130 ein: Amax Amax Φ Φ A0 = 2 = . (4.131) sin sin Φ 2 Φ/2 2 Nach Gleichung 4.75 war die Intensität I ∼ A20 und I0 ∼ A2max und somit ist Intensitätsverteilung am Einzelspalt 2 Φ sin 2 I = I0 Φ 2 . (4.132) Abbildung 4.70: Intensitätsverteilung bei der Beugung am Einzelspalt als Funktion des Winkels. Setzt man für den Phasenunterschied Gleichung 4.129 ein, ergibt sich 2 π a sin Θ sin λ . I = I0 π a sin Θ (4.133) λ Durch Einführen der Spaltinterferenzfunktion sinc(β) = sin β β (4.134) vereinfacht sich der Ausdruck zu I = I0 sinc 2 π a sin Θ λ . (4.135) Je höher die Ordnung der (Neben-)Maxima ist, desto dunkler werden sie, weil ein kleineres Teilbündel für die Resthelligkeit verantwortlich ist. c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 140 Abbildung 4.71: Die Aufteilung in verschieden viele Teilbündel führt zu einer abnehmenden Intensität bei den nicht destruktiv interferierten Restbündel für höhere Ordnungen. Für Θ = 0 , also in der Mitte, herrscht konstruktive Interferenz und wir erhalten das Hauptmaximum. Haben die Randstrahlen beispielsweise den Gangunterschied ∆r = λ, so können wir den Spalt in zwei Hälften aufspalten. Zu jeder Elementarwelle aus der oberen Hälfte findet sich eine zweite in der unteren Hälfte, die zur ersten einen Gangunterschied von ∆r = λ/2 hat und destruktive Interferenz ergibt. Entsprechend ist der Trick zur Bestimmung der Minima die Aufteilung des Spalts in M Intervalle, wobei sich das Licht aus jeweils benachbarten Intervallen auslöscht. Es ist ∆r = a sin Θ . M (4.136) Abbildung 4.72: Trick zur Bestimmung der Minima ist die Aufteilung in Intervalle mit den zugehörigen Elementarwellen. Für Minima gilt M λ = a sin Θ (4.137) mit M = ±1, ±2, ±3.... Das Hauptmaximum liegt zentral bei Θm =0. Die Nebenmaxima sind nicht exakt in der Mitte zwischen benachbarten Minima. Ihre Lage folgt der Bedingung β cos β − sin β d sin β = (4.138) dβ β β2 c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 141 mit β = Φ/2 und Φ als gesamter Phasenunterschied zwischen den Wellen vom oberen und unteren Ende des Spalts. 4.7.4 Der reale Doppelspalt Ohne die Idealisierung punktförmiger Spalte verändert sich auch die Intensitätsverteilung am Doppelspalt gegenüber dem vorangegangenen Abschnitt. Wir betrachten zwei Spalte der Breite a mit Abstand d. Es folgt die Interferenz und das Beugungsmuster von Doppelspalt und Spaltgröße als Produkt 2 Φ sin 2 δ 2 cos I = 4 I0 Φ 2 2 . (4.139) Darin ist Φ die Phasendifferenz zwischen den Wellen vom oberen und unteren Ende eines Spalts. Sie hängt von der Breite a des einzelnen Spalts ab und es gilt Φ= 2π a sin Θ . λ (4.140) δ ist die Phasendifferenz zwischen Wellen aus der Mitte zweier benachbarter Spalte. Sie hängt vom Abstand der Spalte d ab und es ist δ= 2π d sin Θ . λ (4.141) Für die Bedingung a < d liefert der Einzelspalt die Einhüllende für die Interferenz des Doppelspalts. Abbildung 4.73: links: realer Doppelspalt mit a < d. rechts: Intensitätsverteilung bei der Beugung am realen Doppelspalt als Funktion des Winkels. Das Interferenzmuster hängt nicht von der Anzahl oder Gleichzeitigkeit der beteiligten Photonen ab. Bei einer langsamen Folge von einzelnen Teilchen baut sich das Interferenzmuster langsam auf. Nach dem Detektieren von immer mehr Teilchen sieht man die c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 142 bekannte Verteilung immer genauer. Bezüglich des Interferenzmusters muss beachtet werden, dass die Energie des Lichts nicht reduziert wird. Vielmehr handelt es sich lediglich um eine Umverteilung der Energie (Licht). Die Energie bleibt also erhalten. Eine Änderung der Spaltbreite a führt zu einer Änderung der Lage der Extrema des Einfachspaltes, dessen Intensitätsverteilung die Hüllkurve der Intensitätsverteilung des Doppelspalts bildet (siehe Abbildung 4.74). Je breiter der Spalt ist, desto enger wird die Hüllkurve. Abbildung 4.74: Einfluss der Spaltbreite auf das Interferenzmuster des realen Doppelspalts für eine Wellenlänge λ= 553 nm, Spaltabstand d= 124 µm und Spaltbreiten a= 10 µm (links), 25 µm (mitte) und 45 µm (rechts). Eine Änderung des Spaltabstandes d führt zu einer Änderung der Lage der Extrema des Doppelspalts innerhalb der konstant bleibenden Hüllkurve (siehe Abbildung 4.75). Je größer der Spaltabstand ist, desto enger liegen die Extrema des Doppelspalts beieinander. Abbildung 4.75: Einfluss des Spaltabstandes auf das Interferenzmuster des realen Doppelspalts für eine Wellenlänge λ= 553 nm, Spaltbreite a= 25 µm und Spaltabstände d= 50 µm (links), 124 µm (mitte) und 195 µm (rechts). Eine Änderung der Wellenlänge λ wirkt sich sowohl auf die Hüllkurve als auch auf c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 143 die Intensitätsverteilung des Doppelspalts aus (siehe Abbildung 4.76). Je größer die Wellenlänge ist, desto breiter werden die Hüllkurve und die Interferenzabstände des Doppelspalts. Abbildung 4.76: Einfluss der Wellenlänge auf das Interferenzmuster des realen Doppelspalts für einen Spaltabstand d= 124 µm, Spaltbreite a= 25 µm und Wellenlängen λ= 409 nm (links), 553 nm (mitte) und 695 nm (rechts). 4.7.5 Mehrfachspalte Bei einer Spaltanzahl N , die größer als 2 (Doppelspalt) ist, spricht man von einem Mehrfachspalt, oder bei einem sehr großen Wert von N auch von einem Gitter. Das einfachste Beispiel für einen Mehrfachspalt ist der Dreifachspalt. Der Dreifachspalt kann als Doppelspalt mit einem zusätzlichen dritten Spalt, ebenfalls im Abstand d, verstanden werden. Abbildung 4.77: links: realer Dreifachspalt mit a < d. rechts: Intensitätsverteilung bei der Beugung am realen Dreifachspalt als Funktion des Winkels. An Orten, an denen zuvor Intensitätsmaxima des Dopppelspalts lagen, hat der erste zum zweiten Wellenzug einen Gangunterschied einer ganzzahligen Wellenlänge (Phasendifferenz 0 oder 2π) , ebenso wie der zweite zum dritten. Alle drei Wellenzüge sind also in c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 144 Phase und interferieren konstruktiv. Entsprechend sind an diesem betrachteten Orten bei einem Dreifachspalt nach wie vor Maxima der Intensität mit mλ = d sin(Θ) (4.142) für m = 0, ±1, ±2, ±3, .... Ist A0 die Amplitude eines einzelnen Wellenzuges mit zugehöriger Intensität I0 , so ergibt sich die Intensität der neuen Maxima zu (3A0 )2 = 9 I0 . (4.143) Zum Vergleich: Die Maxima des Doppelspalts hatten eine Intensität von (2A0 )2 = 4 I0 . Da die Maxima sozusagen ihren Ort auf dem Schirm beibehalten und gleichzeitig maximal mögliche Intensität besitzen, nennt man sie in diesem Zusammenhang auch Hauptmaxima n-ter Ordnung. Desweiteren treten zwischen den Hauptmaxima Resthelligkeiten, so genannte Nebenmaxima auf. Abbildung 4.78: Vergleich von Doppelspalt (N=2) und Mehrfachspalten (N=4, 8), links: Der Einzelspalt ist so eng, dass von ihm Elementarwellen ausgehen. rechts: Die Breite a der Spalte ist nicht zu vernachlässigen. Die Gesamtintensität ist ein Produkt aus der Spaltfunktion und der Gitterfunktion 2 2 π d sin Θ π a sin Θ sin N sin λ λ . (4.144) I = I0 π a sin Θ π d sin Θ sin λ λ c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 145 Ist die Spaltbreite a zu vernachlässigen, so ist die Gesamtintensität nur durch die Gitterfunktion beschrieben und es ist 2 π d sin Θ sin N λ . I = I0 (4.145) π d sin Θ sin λ Bei steigender Spaltzahl N wächst die Intensität der Hauptmaxima quadratisch mit N , ihre Positionen auf dem Sichtschirm bleiben unabhängig von N . Die Hauptmaxima befinden sich also an den Positionen der maxima des Deoppelspalts. Dagegen rückt das jeweils erste Minimum neben einem Hauptmaximum mit steigender Spaltanzahl N zum Zentrum hin näher an dieses Hauptmaximum heran. War beim Doppelspalt das erste Minimum bei einer Phasendifferenz von π zwischen den Wellenzügen zu beobachten, so tritt es beim Dreifachspalt schon bei einer relativen Phasendifferenz von 2π/3 auf. Diese entspricht einem kleineren Gangunterschied und damit auch einem geringeren (Winkel)Abstand zum jeweiligen Hauptmaximum. Die Hauptmaxima werden also mit steigender Spaltanzahl N zunehmend schärfer durch die ersten Minima neben diesen eingegrenzt. Abbildung 4.79: Intensität am Mehrfachspalt aus Zeigeraddition für verschiedene Phasenunterschiede von einem Spalt zum nächsten ∆ϕ : a) Hauptmaximum ∆ϕ = 2π b) Nebenmaximum ∆ϕ = π c) Nullstelle ∆ϕ = 2/3 π d) beliebig ∆ϕ = 5/6 π. e) Von oben nach unten Übergang vom Einzelspalt zu Mehrfachspalten, die als Vorstufe des Gitters verstanden werden können. Die Lage der Maxima und der Nullstellen lässt sich mit der Zeigeraddition verstehen (siehe Abbildung 4.79): • Hauptmaxima ergeben sich immer dann, wenn alle Zeiger parallel liegen. Das ist der Fall, wenn ∆ϕ = m 2π ist, also für ∆r = m λ. • Nullstellen ergeben sich genau dann, wenn die N Zeiger ein geschlossenes Polygon bilden, d.h. wenn N ∆ϕ = m 2π ist. Dann ist ∆r = m/N λ für m = 1, 2, ..., N − 1. Zwischen zwei Hauptmaxima liegen N − 2 Nebenmaxima und N − 1 Minima. c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 4.7.6 146 Das optische (Strich-)Gitter Optische Gitter, auch Beugungsgitter genannt, bestehen aus einer großen Zahl von Längsstrukturen in gleichmäßigem Abstand: • Spalte in intransparentem Material oder Striche auf einer transparenten Platte (Draht, Spalt- oder Strichgitter) • Gräben oder Rillen auf einer reflektierenden Fläche (Reflexionsgitter) Versuch 3210: Strichgitter und Kreuzgitter In den Strahl eines He-Ne-Lasers werden Strichgitter mit drei verschiedenen Strichdichten und ein Kreuzgitter gebracht. Die Beugungsbilder erscheinen groß an der Hörsaalleinwand. Durch Verdrehen der Gitter kann man auch noch die scheinbare Gitterkonstante ändern. Die Gitterkonstante g bezeichnet den Abstand der Spalte (z.B.: 10000 Linien pro cm → g = 1 cm/10000 = 1µm). Abbildung 4.80: Intensitätsverteilung bei der Beugung am Gitter als Funktion der Hauptmaxima. Ein optisches Gitter bewirkt das gleiche wie ein Mehrfachspalt mit einer sehr großen Spaltanzahl N . Bei einem Gitter mit M Linien setzt sich das Beugungsmuster aus dem Muster des Einzelspalts multipliziert mit dem Beugungsmuster des Gitters zusammen: 2 2 π d sin Θ π a sin Θ sin M sin λ λ I = I0 π a sin Θ π d sin Θ sin λ λ . (4.146) Es entstehen Haupt- und Nebenmaxima. Hauptmaxima treten unter den Winkeln Θm auf und es gilt mλ = g sin(Θm ) (4.147) c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 147 mit m = 0, ±1, ±2, ±3.... Zwischen 2 Hauptmaxima liegen M −2 Nebenmaxima und M −1 Minima. Die Lage eines Interferenzmaximums hängt nicht von der Anzahl der Spalte (also Quellen) ab. Es werden die beim Gitter auftretenden Hauptmaxima bei steigender Spaltanzahl zunehmend intensiver und schärfer, während die Intensität der Nebenmaxima schnell abnimmt. Natürlich lassen sich nicht Maxima beliebig hoher Ordnung auf dem Sichtschirm beobachten, da in der obigen Bedingung an die Interferenzmaxima stets die Bedingung sin(Θm ) ≤ 1 gilt, woraus m ≤ g/λ folgt. Es existiert also eine maximale Ordnung mmax , bis zu welcher die Interferenzmaxima sichtbar sind. 4.7.7 Reflektionsgitter Neben den bisher betrachteten Transmissionsgittern gibt es auch Reflektionsgitter (siehe Abbildung 4.81). Abbildung 4.81: links: Transmissionsgitter und rechts: Reflektionsgitter Für einfallendes Licht gilt das Reflektionsgesetz Θ = Θm = 0. Dies reflektierte Licht entspricht der 0−ten Ordnung. Zusätzlich entstehen wie beim (Transmissions-)Gitter Beugungsmaxima unter den Winkeln Θm mit mλ = g (sin(Θm ) − sin(Θ)) (4.148) und m = 0, ±1, ±2, ±3.... Erneut liegen zwischen zwei Hauptmaxima M −2 Nebenmaxima und M − 1 Minima. Spezialfall: Bei einem senkrechten Lichteinfall auf das Gitter ist Θ = 0 und sin(Θ) = 0. Folglich gilt mλ = g sin(Θm ) (4.149) mit m = 0, ±1, ±2, ±3..., aber wegen sin(Θm ) = − sin(−Θm ) ist die Numerierung der Beugungsordnungen ist gegenüber dem Transmissionsgitter vertauscht (siehe Abbildung 4.81). c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 148 Beispiele für eine wichtige Anwendungen von Reflektionsgittern sind die CD-ROM oder die DVD. Bei der Betrachtung einer CD-ROM oder DVD fällt auf, dass sie einfallendes Licht spektral zerlegt. Ihre Oberfläche enthält winzige Rillen, die ein Reflexionsgitter bilden. Abbildung 4.82: links: Reflektionsgitter bei senkrechtem Lichteinfall und rechts: CD oder DVD als Reflektionsgitter Wird das Licht eines Lasers (Wellenlänge λ= 633 nm) senkrecht auf eine CD gerichtet, so sind in Reflektion Interferenzmaxima zu beobachten. Das Interferenzmaximum zweiter Ordnung tritt dann gerade unter einem Winkel von ±37.7o bezüglich der Rillenebene der CD auf. CD-ROM Eine CD-ROM besteht aus einem Kunststoffträgermaterial (aus Polycarbonat) mit Aluminiumbeschichtung. Die digitale Information wird auf einer spiralförmigen Spur aufgebracht. Die Spiralspur hat etwa eine Länge von 6 km. Es werden stellenweise Vertiefungen in die Beschichtung gepresst, so genannte Pits. Diese reflektieren etwas früher als die unbeschädigten reflektierenden Stellen, die Lands genannt werden, da die CD-ROM von der Oberseite gepresst wird und von der Unterseite gelesen wird. Somit sind die Pits von der Lese-Seite nicht als Vertiefungen sichtbar, sondern als Hügel. Die Übergänge von Land zu Pit, und umgekehrt, reflektieren das Licht nicht. Beim Lesen tastet ein schwacher Laserstrahl die gespeicherte Information ab. Abbildung 4.83: links: Mikroskopaufnahme einer CD-ROM rechts: Rasterkraftmikroskopieaufnahme einer CD-ROM. c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 149 Bei einer CD-ROM beträgt ein nominaler Track-Abstand 1.6 µm und es wird typischerweise mit einer Laserwellenlänge von 780 nm gearbeitet. DVD Im Vergleich zu den CDs wird bei DVDs mit Lasern kürzerer Wellenlänge gearbeitet (650 nm), und wegen der gleichzeitig kürzeren Strahlengänge der Fokussierungsoptiken resultieren daraus kleinere Laserspots, mit denen in den Datenträgerschichten entsprechend kleinere Strukturen gelesen und geschrieben werden können. Der Trackabstand für die DVD wurde um mehr als die Hälfte auf 0.74 µm verringert, die minimale Pit-Länge schrumpfte von 0.9 µm auf 0.4 µm. Es gibt verschiedene Speichervarianten. Abbildung 4.84: Unterschiedliche DVD-Speichervarianten im Querschnitt: Jeweils zwei Halbdisks von 0.6 mm Dicke sind zu einer DVD zusammengeklebt. Diese Halbdisks können einschichtig oder zweischichtig sein. Blu-ray Disc Der Name bezieht sich auf den violetten Lichtstrahl des verwendeten Lasers (405 nm). Durch die Verringerung des Laserspots von 1.3 µm bei einer DVD auf 0.6 µm bei einer Blu-ray Disc wird eine größere Speicherkapazität erreicht. Bei einem Durchmesser von 12 cm fasst eine Scheibe mit einer Lage bis zu 25 GB und mit zwei Lagen bis zu 50 GB an Daten. 4.7.8 Interferenz an dünnen Schichten Licht fällt auf eine dünne Platte der Dicke d mit dem Brechungsindex n. Der Einfallswinkel zum Lot gemessen ist ε. Der Lichtstrahl wird teilweise reflektiert, teilweise gebrochen und reflektiert und es kommt zur Interferenz zwischen beiden Strahlen. Zur Bestimmung des c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 150 Gangunterschieds zwischen dem reflektierten und dem zuerst gebrochenen und danach reflektierten Strahl benutzen wir die parallele Wellenfront bei den Punkten C und P (siehe Abbildung 4.85). Abbildung 4.85: Interferenz an dünnen Schichten mit den Brechungsidices n und n′ umgeben von Luft. Der Gangunterschied ist ∆ = n AB + BC − AP . (4.150) Geometrisch gilt für die rechtwinkligen Dreiecke AB = und d cos ε′ (4.151) AP = AC sin ε (4.152) AC = DB = d tan ε′ . 2 (4.153) AC = 2d tan ε′ (4.154) Also und entsprechend folgt mit AB = BC n 2d ′ − sin ε tan ε = (n − sin ε sin ε′ ) . ∆ = 2d ′ cos ε cos ε′ Das Brechungsgesetz liefert (4.155) n sinε = ′ sinε 1 (4.156) r (4.157) und außerdem gilt p cos ε′ = 1 − sin2 ε′ = 1− 1p 2 sin2 ε = n − sin2 ε . n2 n Eingesetzt in den Gangunterschied erhalten wir damit sin2 ε 2dn n− ∆= p n n2 − sin2 ε c Lehrstuhl E13, TUM, 2010 (4.158) 4.7. WELLENOPTIK 151 und schließlich ∆ = 2d p n2 − sin2 ε . (4.159) Bei Reflektion am dichteren Medium tritt ein zusätzlicher Phasensprung von π auf (siehe Abschnitt über Reflektion von Wellen). Dieser Phasensprung entspricht einem zusätzlichen Gangunterschied von λ/2. Für den Strahl 1 aus Abbildung 4.85 (einfalleder Strahl) bedeutet Reflektion am dichteren Medium, dass die Bedingung n > 1 erfüllt sein muss und für den Strahl 2 entsprechend n′ > n. Für den Einfall der Lichtwelle aus Luft auf eine Schicht ist immer die Bedingung n > 1 erfüllt und die Phase von Strahl 1 (an oberen Grenzfläche reflektiert) wird um π gedreht. Ist zusätzlich n′ > n für den gebrochenen Strahl erfüllt, so wird auch die Phase von Strahl 2 um π gedreht und es folgt für den Gangunterschied p ∆ = 2d n2 − sin2 ε . (4.160) Ist hingegen n′ < n oder gar n′ = 1, was einer dünnen Schicht entspricht, so ist p λ ∆ = 2d n2 − sin2 ε − . (4.161) 2 Die Interferenzbedingung für eine dünne Schicht (oder allgemeiner n′ < n) ist also: • Verstärkung (Helligkeit) für m = 0, ±1, ±2,... und p (m + 1/2) λ = 2d n2 − sin2 ε . • Auslöschung (Dunkelheit) für m = 0, ±1, ±2,... und p (m + 1) λ = 2d n2 − sin2 ε . (4.162) (4.163) Die Interferenz an dünnen Schichten erklärt die Farben dünner Blättchen: Dünne Schichten wie Seifenfilme, Ölfilme auf Wasser oder Aufdampfschichten zeigen bei Beleuchtung mit weißem Licht Farben aufgrund von Interferenz. Beispiel: Ein Seifenfilm (Brechungsindex n = 1.33) mit der Dicke von d = 350 nm wird mit weißem Licht senkrecht beleuchtet. Es wird also Licht, das der Bedingung 2dn 931 nm λ= = (4.164) m + 1/2 m + 1/2 für die Wellenlänge genügt, reflektiert. Von den Wellenlängen, die diese Voraussetzung erfüllen (m = 0: λ= 1862 nm, m = 1: λ= 621 nm, m = 2: λ= 372 nm, m = 3: λ= 266 nm, usw.), liegt nur λ= 621 nm im sichtbaren Bereich und der Film erscheint folglich rot. Versuch 3148: Glänzende Reflexion Eine Glasplatte mit den Buchstaben B (blau), G (grün) und R (rot) wird über eine 12 V Halogenlampe und einer Mattscheibe beleuchtet. Die Glasplatte wird im spitzen Winkel mit der Kamera betrachtet. In der glänzenden Reflexion erscheint nun das B rot, das G blau und das R gelb; sprich in der Interferenzfarbe. Die Interferenzfarbe ist abhängig von der Schichtdicke der Farbpigmente, des Hintergrundes und der Grundfarbe Dreht man die Glasplatte etwas und stellt ein weißes Blatt Papier dahinter, so erscheinen die Buchstaben wieder in ihren tatsächlichen Farben. c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 152 Entspiegeln von Linsen Ein Beispiel für die Anwendung der destruktiven Interferenz zur Verringerung von Reflexionen ist das Entspiegeln von Linsen. Wir betrachten hierzu eine Anordnung mit n1 < n2 < n3 was zu einem Phasensprung für die Strahlen r1 und r2 führt. Der Gangunterschied bei senkrechtem Einfall des Lichts ist ∆ = 2d n2 . n1 (4.165) Abbildung 4.86: Interferenz an dünnen Schichten zur Entspiegelung von Linsen Da zur Auslöschung ∆ = (2m + 1)λ/2 erfüllt sein muss, ist die dünnste Schicht, die keine Reflektion aufweist (bei m = 0) d= λ . 4n2 /n1 (4.166) Der Effekt der Entspiegelung (λ/4-Entspiegelung) ist also abhängig von der Wellenlänge. Entspiegelte Linsen erscheinen leicht farbig (rötlich oder violett). Eine Verbesserung der Entspiegelung ist durch mehrere Schichten zu erreichen. Versuch 3175: Vergütete Glasscheibe Eine Glasscheibe (5 cm x 5 cm) ist zur Hälfte mit einem Antireflexionsbelag bedeckt. Wir beleuchten sie mit einer Halogenlampe etwas schräg, so dass auf der Leinwand sowohl der durchgehende als auch der reflektierte Strahl zu sehen sind. Besonders in Reflexion wird der Helligkeitsunterschied zwischen der vergüteten und der nicht vergüteten Hälfte der Scheibe deutlich. Interferenz an keilförmigen, dünnen Schichten Wieder wollen wir zunächst monochromatisches Licht (Wellenlänge λ fest) betrachten, das auf eine dünne, keilförmige Schicht (Keilwinkel ν, Brechzahl n) fällt, die von Luft (Brechzahl n = 1) umgeben sein soll. Der unter dem festen Winkel ε auf die keilförmige Schicht treffende Strahl a wird im Punkt A mit Phasensprung reflektiert. Wir betrachten nun einen Strahl b, der unter gleichem Einfallswinkel wie Strahl a im Punkt B auf den Keil trifft, aber so, dass er nach zweimaliger Brechung und Reflexion im Punkt C an der Schichtunterseite ebenfalls im Punkt A austritt. Somit interferieren die Strahlen a und b im Punkt A. Für sehr c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 153 kleine Keilwinkel ν können wir die optische Weglängendifferenz aus der zuvor für den planparallelen Fall hergeleiteten Formel berechnen: ∆ = 2d p n2 − sin2 ε − λ . 2 (4.167) Durch den sehr kleinen Keilwinkels ν kann der Abstand zwischen den Punkten A und B als konstant betrachtet werden. Somit ist es nur die Dicke d an einer betrachteten Stelle, die eine Weglängendifferenz hervorruft. Es werden also bei einem gleichmäßig dicker werdenden Keil Interferenzstreifen sichtbar, die parallel zur Keilkante verlaufen und als Kurven gleicher Dicke bezeichnet werden (siehe Abbildung 4.87). Abbildung 4.87: links: Geometrie am einem Keil mit dem Brechungsindex n, rechts: Streifenförmige Anordnung der Interferenzmaxima und Minima Betrachten wir zwei nebeneinander liegende, dunkle Linien destruktiver Interferenz der Ordnungen k und k + 1. Deren optische Weglängendifferenzen betragen ∆k = (2k + 1)λ/2 und ∆k+1 = (2k + 3)λ/2. Der Unterschied der optischen Wegdifferenzen zwischen diesen beiden Stellen mit den Dicken dk und dk+1 beträgt also eine Wellenlänge λ, weswegen für die Dickenzunahme des Keils ∆k+1 − ∆k λ dk+1 − dk = p = p 2 n2 − sin2 ε 2 n2 − sin2 ε (4.168) folgt. Sei nun D der Abstand zweier solcher Interferenzminima. Dann nimmt die Dicke des Keils von einem zum nächsten Streifen um dk+1 − dk = D sin ν (4.169) zu. Somit finden wir für den Streifenabstand zweier Interferenzminima D= λ 2 sin ν p n2 − sin2 ε (4.170) Versuch 3160: Interferenz am Doppelspiegel nach Fresnel Der von einer Bogenlampe beleuchtete Spalt erzeugt ein schmales Lichtbündel, das von zwei wenig gegeneinander geneigten Spiegeln so auf die Leinwand geworfen wird, dass sich die beiden Teilbündel noch überlappen. Hat man den Spalt gut parallel zu den Spiegelebenen eingestellt, sieht man bunte Interferenzstreifen auf der Leinwand, die man problemlos über die Fernsehanlage projizieren kann. c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 154 Sichtbar werden solche Interferenzen an dünnen, durchsichtigen (und natürlich keilförmigen) Schichten, z.B. an schräg eingespannten Seifenlamellen. Aufgrund der Schwerkraft ist die Lamelle an ihrem tiefstgelegensten Punkt am dicksten und wird nach oben hin zunehmend dünner. Dabei sinkt solange Wasser ab, bis sie schließlich zerreißt. Unter weißem Licht betrachtet ergeben sich verschiedenfarbige Streifensysteme der einzelnen Wellenlängen, die sich überlappen. Abbildung 4.88: Bei senkrechter Anordnung hat die Seifenlamelle einen keilförmigen Querschnitt. Aufgrund der Schwerkraft wird die Flüssigkeitsschicht nach unten hin dicker. Newtonsche Ringe Eine Plankonvexlinse mit großem Krümmungsradius R liegt mit der gekrümmten Fläche auf einer ebenen Glasplatte. Wird monochromatisches Licht von oben senkrecht auf die Versuchsanordnung gestrahlt, erscheinen in Reflektion durch konstruktive und destruktive Interferenz abwechselnd helle und dunkle konzentrische Kreise, deren Zentren im Berührungspunkt der Linse mit der Glasplatte liegen. Abbildung 4.89: Seitenansicht zum Aufbau für die Beobachtung von Newtonschen Ringen. Versuch 3170: Newton’sche Ringe c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 155 Das Demonstrationsgerät besteht aus einem Rahmen, in dem eine plankonvexe Glasplatte mit der gewölbten Seite gegen eine planparallele Platte montiert ist, wobei man den Auflagedruck mittels dreier Schrauben verändern kann. Die entstehenden Interferenzringe werden in Reflexion beobachtet. Ein Blau/Rot Wechselfilter wird in den Strahlengang gebracht, dieser zeigt die Abhängigkeit der Ringdurchmesser von der Wellenlänge. Wir projizieren das reflektierte Bild. Es interferieren Lichtwellen, die an der Grenzfläche beim Übergang von der Linse in die Luft reflektiert werden, mit denjenigen, die an der Grenzfläche beim Übergang von der Luft in die Glasplatte reflektiert werden. Der Gangunterschied ist an einer Stelle, an der der Abstand zwischen Linse und Glasplatte (Luftspalt) d ist, ∆r = 2d − λ/2 , (4.171) weil ein Strahl am optisch dichteren Medium (Platte) reflektiert wird und einen Phasensprung erleidet. Die Radien der hellen und dunklen Interferenzringe rm (vom Zentrum aus der m-te helle und dunkle Kreis) sind mit der Dicke des Luftspaltes dm an diesem Radius geometrisch verknüpft. Nach dem Höhensatz ist 2 rm = dm (2R − dm ) (4.172) und es ist dm ≪ R. Damit folgt 2 rm = dm 2R und dm = 2 rm 2R (4.173) und eingesetzt in die Interferenzbedingungen für Maxima (konstruktive Interferenz ergibt helle Ringe) und Minima (destruktive Interferenz ergibt dunkle Ringe) ergibt sich für die Radien dunkler Ringe √ (4.174) rm = m λ R und heller Ringe rm = p (m + 1/2) λ R (4.175) mit m = 0, 1, 2, 3.... Die Symmetrie ergibt sich aus der Form der Linse als Kugelsegment (um die Achse AM rotationssymmetrisch, siehe Abbildung 4.89) und bedingt die Symmetrie der Interferenzminima bzw. Interferenzmaxima (Kreisringe). Wird weißes Licht verwendet, entstehen bunte Ringe, weil die einzelnen Farben wegen ihrer unterschiedlichen Wellenlängen bei verschiedenen Radien ausgelöscht werden. Die Komplementärfarbe ist an der Stelle sichtbar. Anwendung: Mit Newtonschen Ringen können Unebenheiten im Nanometerbereich entdeckt werden, da schon kleinste Unebenheiten einer Oberfläche (Abweichungen der Glasplatte) die Newtonschen Ringe stören. Es können so kleinste Materialschäden nachgewiesen werden. So wird die Oberflächenprüfung von Linsen mit Genauigkeit von Bruchteilen der Wellenlänge mittels Newtonscher Ringe ausgeführt. c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 156 Abbildung 4.90: Kleinste Unebenheiten führen zu einer gut sichtbaren Störung der Ringform bei Newtonschen Ringen. 4.7.9 Auflösungsvermögen Eine Lochblende kann als kreisförmiger Spalt verstanden werden, der nicht mehr unendlich lang ist, sondern einen Durchmesser d aufweist. Die Berechnung des Interferenzmusters ist für Lochblenden komplizierter und führt auf sogenannte Besselfunktionen. Das erste Minimum, also der erste dunkle Ring erscheint ungefähr unter dem Winkel α1 mit sin α1 ≈ 1.22 λ /d (4.176) Der Begriff Auflösungsvermögen bezeichnet die Unterscheidbarkeit feiner Strukturen, also den kleinsten noch wahrnehmbaren Abstand zweier Punkte. Durch die Angabe eines Winkelabstandes oder durch die Angabe des Abstandes gerade noch trennbarer Strukturen lässt es sich quantifizieren. Bei der Abbildung zweier dicht benachbarter Objekte durch eine Blende überlagern sich die Beugungsbilder. Es sein der Winkel δ die Differenz der Sichtwinkel von der Blende aus gesehen. Abbildung 4.91: von links nach rechts: d = 1.25 δmin , d = 1.00 δmin , d = 0.75 δmin und d = 0.50 δmin Das resultierende Gesamtbild kann als verbeultes Scheibchen mit kleinem Buckel beschrieben werden. Das praktische Kriterium geht auf Lord Rayleigh zurück: Zwei dicht benachbarte Objekte sind nur dann als zwei Punkte erkennbar, also auflösbar, wenn das erste Beugungsminimum der einen Quelle nicht das zentrale Maximum der anderen Quelle c Lehrstuhl E13, TUM, 2010 4.7. WELLENOPTIK 157 erreicht. Diese Bedingung ist erfüllt für δ > 1.22 λ /d ≡ δmin (4.177) In Abbildung 4.91 erfüllt also nur das erste Beispiel (linke Grafik) das Rayleigh Kriterium. Versuch 3160: Auflösungsvermögen eines Gitters Die Versuchsanordnung besteht aus einem aus einzelnen Teilen zusammengestellten Prismenspektrographen, der einen zusätzlichen Spalt enthält, mit dem sich die Ausleuchtung des Gitters (1016 Striche pro mm) verändern lässt. Wir beleuchten ihn mit der Natriumdampflampe und sehen ihn uns mit der Fernsehkamera und Nahlinse das Na-D-Linien Dublett an. Man sieht je nach Ausleuchtung des Gitters die Doppellinie sauber getrennt oder verwaschen ineinander übergehen. c Lehrstuhl E13, TUM, 2010 Kapitel 5 Nichtlineare Optik In Kapitel 4 sind wir davon ausgegangen, dass die optischen Eigenschaften eines Materials unabhängig von der Intensität des eingestrahlten Lichtes sind. In diesem, sogenannten linearen Bereich zeigen unterschiedliche Lichtstrahlen in Materie keine Wechselwirkung miteinander und die elektrische Suszeptibilität χ ist eine Materialkonstante eines optischen Mediums. Im nichtlinearen Bereich können sich Lichtstrahlen in Materie gegenseitig beeinflussen. Zwei wichtige Prinzipien der linearen Optik sind in der nichtlinearen Optik verletzt: das Superpositionsprinzip und die Frequenzerhaltung. Jedes Medium ist nichtlinear, kann aber in guter Näherung als linear betrachtet werden, solange die auftretenden Feldstärken klein sind. Um nichtlineare Effekte zu beobachten, bedarf es sehr großer Feldstärken (entsprechende Lichtintensitäten liegen im Bereich von 102 bis 106 W/cm2 ). Große Feldstärken werden z. B. von fokussierter Laserstrahlung erzeugt, insbesondere bei gepulsten Lasern, bei denen die Energie in sehr kurzer Zeit abgestrahlt wird. Entsprechend wurde die Entwicklung der nichtlinearen Optik zwischen 1960 und 1980 durch den Fortschritt im Laserbau stark gefördert. Dafür gab es 1981 den Nobelpreis für N. Blombergen. 5.1 Grundlagen der nichtlinearen Optik In dem bisherigen Ansatz ist Licht eine elektromagnetische Welle, dessen elektrischer Feldstärkevektor auf die Elektronen eines Mediums eine Kraft ausübt und diese zum Schwingen bringt. Die schwingenden Elektronen bilden kleine Hertzsche Dipole und wirken wie Antennen die Licht in alle Richtungen wieder abstrahlen. Die abgestrahlten Felder überlagern sich und bilden neue Lichtwellen mit bestimmten Frequenzen und Richtungen. Die Auslenkung eines Elektrons erzeugt lokal ein elektrisches Dipolmoment. Die zeitlichen Änderungn aller Dipole ergeben eine Polarisationswelle. Die nichtlinearen Aspekte kommen bei der Erzeugung der Polarisationswelle in die Beschreibung. 5.1.1 Anharmonischer Oszillator Einen einziger Oszillator kann durch ein Elektron an einer Feder mit Federkonstante k beschrieben werden. Er wind durch das elektisches Feld des Lichts angetrieben. Bei kleinen 158 5.1. GRUNDLAGEN DER NICHTLINEAREN OPTIK 159 Lichtintensitäten gilt das Hooksche Gesetz F (x) = −k x = mẍ , (5.1) da auch die Auslenkung x des Elektrons klein ist. Das Kraftfeld des harmonischen Oszillators ist konservativ und somit existiert für jedes Oszillator-Kraftfeld ein Potential U (~r), also ein skalares Feld, mit ~ (~r) . F~ (~r) = −m ∇U (5.2) Das Potential eines Oszillatorkraftfeldes hat demnach die Form einer quadratischen Parabel U (x) = k x2 . 2m (5.3) Der Zusammenhang zwischen Potential U (~r) und potentieller Energie ist für eine Masse m 1 (5.4) U (~r) = Epot (~r) m und damit folgt für die potentielle Energie der Feder Z x 1 (5.5) F (x)dx = kx2 . Epot (x) = 2 0 Unter Vernachlässigung von Dämpfung (keine Absorption) folgt die übliche Differentialgleichung für den erzwungenen harmonischen Oszillator mẍ + k x = fe (t) , (5.6) wobei fe (t) die Kraft des elektrischen Feldes auf das Elektron ist. Die Differentialgleichung ist linear. Man kann die erregende Kraft in Fourierkomponenten zerlegen und jede Komponente einzeln behandeln ẍ + ω02 x = fω cos(ω t) , mit ω02 = k . m (5.7) (5.8) Die Lösung lautet x(t) = xω cos(ω t + ϕ) . (5.9) Entscheidend ist, dass die Amplitude linear mit der erregenden Kraft ansteigt xω ∼ fω . (5.10) Besteht die antreibende Kraft aus mehreren Frequenzkomponenten, so überlagern sich die jeweiligen Lösungen linear. Es gibt keine gegenseitige Beeinflussung, keinen Energieaustausch oder sonst eine Kopplung. Es gibt keinen Energieaustausch zwischen Lichtfeld und Oszillator. Ohne Dämpfung ist die Resonanzkurve unendlich schmal und man ist immer nichtresonant. Der Fall ω = ω0 ist c Lehrstuhl E13, TUM, 2010 5.1. GRUNDLAGEN DER NICHTLINEAREN OPTIK 160 als ein einziger Punkt in einem Kontinuum von moglichen Frequenzen ω nicht realisierbar. Betrachten wir große Auslenkungen (hohe Intensitäten) so entstehen Abweichungen vom Hookschen Gesetz und die Kraft muss entsprechend entwickelt werden F (x) = −k x + a x2 + b x3 + ... (5.11) und das Potential enthält ebenfalls höhere Ordnungen U (x) = −k ′ x2 + a′ x3 + b′ x4 + .... . (5.12) Nähert man das Potential durch die ersten beiden Termen in Gleichung 5.12, so hat es einen unsymmetrischen Verlauf (siehe Abbildung 5.1.) Bei einer harmonischen antreibenden Kraft ist die Schwingung jetzt verzerrt und kann nicht mehr durch eine einfache cosinusförmige Schwingung beschrieben werden. Die Fourier-Zerlegung enthält höhere Harmonische. Dasselbe gilt für ein Potential, das einer kubischen Kraftkorrektur entspricht und entsprechend die ersten drei Terme in Gleichung 5.12 berücksichtigt (siehe Abbildung 5.1). Abbildung 5.1: links: Anharmonisches Potential U mit kubischem Korrekturterm. rechts: Anharmonisches Potential U mit Korrekturterm vierter Potenz und im Vergleich das harmonische Potential (gestrichelt). Wichtig ist vor allem, dass die Amplitude der Elektronenschwingung nicht mehr linear von der Amplitude der antreibenden Kraft abhängt xω ≁ fω . (5.13) Zerlegt man die Schwingung in ihre Frequenzkomponenten x(t) = ∞ X xωn exp(iωn t) , (5.14) n=−∞ so hängen die Amplituden xωn zunachst beliebig von der Stärke der antreibenden Kraft ab. Man entwickelt diese Abhängigkeit zweckmäßigerweise in eine Taylor-Reihe xωn = χ(1) (ωn , ω)Fω + χ(2) (ωn , ω)Fω2 + χ(3) (ωn , ω)Fω3 + ... c Lehrstuhl E13, TUM, 2010 (5.15) 5.1. GRUNDLAGEN DER NICHTLINEAREN OPTIK 161 mit den Entwicklungskoeffizienten χ(n) . Wenn das Licht mehrere Frequenzen enthält, können im Prinzip jetzt auch gemischte Terme auftreten xωn = χ(1) (ωn , ω1 )Fω1 + χ(2) (ωn , ω1 , ω1 )Fω21 + χ(2) (ωn , ω1 , ω2 )Fω1 Fω2 + ... + χ(3) (ωn , ω1 , ω2 , ω3 )Fω1 Fω2 Fω3 + ... . (5.16) Die Auslenkungsamplitude xn einer Frequenz ωn hängt auch von der Stärke des Lichtfeldes bei anderen Frequenzen ab. Man kann z.B. eine Schwingung der doppelten Lichtfrequenz anregen. Dies entspricht dem zweiten Term in der Gleichung 5.15. Die Beschreibung wird also in die Funktionen χ(n) (ωn , ω1 , ...) verlagert. Sie heißen nichtlineare elektrischen Suzeptibilitäten oder dielektrische Verschiebungen. Energieaustausch ist jetzt auch ohne Dämpfung möglich. 5.1.2 Elektrische Suszeptibilität Die elektrische Suszeptibilität χe ist als Proportionalitätsfaktor der dielektrischen Verschie~ in einem äußeren elektrischen Feld E ~ definiert über bung D ~ = εr ε0 E ~ = (1 + χe )ε0 E ~ . D (5.17) Dabei sind εr die relative und ε0 die absolute Permittivität. Teil der dielektrischen Verschiebung ist die Polarisation P~ , für die im linearen Fall ~ P~ = χe ε0 E (5.18) gilt. Je nach Material ist die Suszeptibilität so wie die Polarisation richtungsabhängig. Ein Beispiel dafür ist die Doppelbrechung. Abbildung 5.2: links: Linearer Zusammenhang zwischen Polarisation und elektrischem Feld. rechts: Nicht-linearer Zusammenhang führt zu höheren Harmonischen. Während die Polarisation in der linearen Optik nur von dem Term erster Ordnung abhängt, wird sie bei großen Strahlungsintensitäten nun auch von den weiteren Ordnungen c Lehrstuhl E13, TUM, 2010 5.1. GRUNDLAGEN DER NICHTLINEAREN OPTIK 162 abhängig und besteht in diesem Fall aus mehreren Beiträgen: X ~n P~ = ε0 χ(n) E (5.19) n wobei χ(n) der nichtlinearen elektrischen Suszeptibilität entspricht und ein Tensor ist. In ~ ist (mit der sogenannten Einsteinschen SummenIndexschreibweise der Vektoren P~ und E konvention, also der Summation über gleiche Indices) (1) (2) (3) Pi = ε0 χij Ej + χijk Ej Ek + χijkl Ej Ek El + ... . (5.20) (1) (2) Bei χij handelt es sich um einen Tensor zweiter Stufe, bei χijk um einen Tensor dritter (3) Stufe und bei χijkl um einen Tensor vierter Stufe. Rechnerisch ist ein Tensor zweiter Stufe nichts anderes als eine (quadratische) Matrix. Ein Tensor dritter Stufe lässt sich durch eine würfelförmige Anordnung seiner n3 Koeffizienten darstellen, die durch je drei Indizes adressiert werden und ein Tensor m-ter Stufe hat dementsprechend nm Koeffizienten, die mit Hilfe von m Indizes auseinandergehalten werden. Die Suszeptibilitäten χ(2) und χ(3) sind dabei um Größenordnungen kleiner sind als χ(1) . So ist zum Beispiel für Quarz χ(1) = 4.0 aber χ(2) = 4.2 · 10−12 m/V und χ(3) = 6.8 · 10−23 m2 /V2 . 5.1.3 Elektromagnetische Welle im Medium Die Wellengleichung für das elektrische Feld im Vakuum A.13 wird in einem Medium ~ r = 0 zu mit räumlich konstanter relativer Permittivität, also ∇ε ~ − µ0 ε0 ∆E ~ ∂2E ∂ 2 P~ = µ 0 ∂t2 ∂t2 . (5.21) Im dielektrischen Medium mit zeitlich konstanter Suszeptibilität ∂χe =0 ∂t (5.22) folgt die Grundgleichung der linearen Optik ~− ∆E ~ 1 ∂2E (1 + χ ) =0 . e c2 ∂t2 (5.23) Unter Berücksichtigung von linearen bzw. nichtlinearen Anteilen, die die hochgestellten Indizes (L) und (N L) bezeichnen, wird aus Gleichung 5.21 ~ ∂2E ∂ 2 ~ (L) ~ (N L) ~ ∆E − µ0 ε0 2 = µ0 2 Pω + P2ω ∂t ∂t . (5.24) Entsprechend folgt die Grundgleichung der nichtlinearen Optik ~− ∆E c Lehrstuhl E13, TUM, 2010 ~ ∂ 2E ∂ 2 P~ (N L) 1 (1 + χ ) = µ e 0 c2 ∂t2 ∂t2 . (5.25) 5.2. NICHTLINEARE OPTISCHE EFFEKTE 163 ~ Diese Gleichung beschreibt ein von der nichtlinearen Polarisation getriebenes E-Feld, ~ 0 erzeugt die nichtlineare Polarisatialso die Abstrahlung der bewegten Elektronen. E (N L) ~ ~ ~ 0 getriebenes, on P , welche E abstrahlt. Alternativ kann man es auch als von E zeitabhängiges χ(t) ansehen, welches neue Frequenzen erzeugt. Da in den nichtlinearen Bewegungsgleichungen das Superpositionsprinzip nicht mehr gilt, müssen stets reelle Felder gewählt werden. 5.2 Nichtlineare optische Effekte Die Effekte der nichtlinearen Optik, die bei großen Intensitäten auftreten, lassen sich in drei Klassen einteilen: • Die Absorption wird intensitätsabhängig. Das Medium bleicht aus und wird transparenter. Die Absorption sättigt: Sättigungsspektroskopie, Mehrphotonenspektroskopie und optische Bistabilität in Resonatoren (optische Schalter). • Die Dispersion wird intensitätsabhängig. Der Brechungsindex wird durch die lokale Lichtintensität moduliert: Solitone, Zweistrahlkopplung, phasenkonjugierte Spiegel und optische Bistabilität in Resonatoren. • Es tritt eine nichtlineare Frequenzkonversion auf. Es gibt einen Energieübertrag zwischen Wellen verschiedener Frequenzen: Frequenzverdopplung, Summenfrequenzmischung und parametrischer Oszillator. Im folgenden soll nur eine kleine Auswahl dieser Effekte kurz betrachtet werden. 5.2.1 Frequenzverdopplung Zur Frequenzverdopplung wird ein optisch nichtlineares Material mit Licht einer sehr hohen Intensität bestrahlt. Es entsteht unter bestimmten Bedingungen Strahlung mit der doppelten Frequenz f . Aufgrund des Zusammenhanges c=λf =λ ω 2π (5.26) mit der Lichtgeschwindigkeit c entspricht dies einer Halbierung der Wellenlänge λ, was bei sichtbarem Licht als Änderung der Farbe des Lichts bemerkt wird. Zum Beispiel kann durch Frequenzverdopplung aus der infraroten Strahlung eines Nd:YAG-Lasers (λ = 1064 nm) grünes Licht der Wellenlänge 532 nm erzeugt werden. Es ist auch Frequenzverdreifachung möglich, so dass ultraviolette Strahlung mit λ = 354.7 nm entsteht. Die Effizienz der Frequenzverdopplung hängt stark von der Stärke des Strahlungsfeldes bzw. der Feldstärke ab. Anwendungen sind grüne Laser wie sie in Laserpointern oder bei Lasershows eingesetzt werden. Im Fall der Frequenzverdopplung ist nun der Term zweiter Ordnung (d.h. n = 2) in Gleichung 5.19 zu betrachten. Wenn sich eine starke Lichtwelle der (Kreis-)Frequenz ω in c Lehrstuhl E13, TUM, 2010 5.2. NICHTLINEARE OPTISCHE EFFEKTE 164 einer Raumrichtung in der Materie ausbreitet, erzeugt sie an einer gegebenen Stelle ein zeitabhängiges Strahlungsfeld E(t) = E0 sin(ωt) , (5.27) das eine Polarisation zweiter Ordnung hervorruft, und sich nach Gleichung 5.19 schreiben lässt zu |P~ (2) | = ε0 χ(2) E 2 = ε0 E02 χ(2) sin2 (ωt) . (5.28) Unter Zuhilfenahme der trigonometrischen Identität sin2 (x) = 1 − cos(2x) 2 (5.29) wird damit ε0 E02 χ(2) ε0 E02 χ(2) − cos(2ωt) . (5.30) 2 2 Die Polarisation zweiter Ordnung besteht also aus zwei Beiträgen: einem konstanten Term, entsprechend einem statischen elektrischen Feld (optische Gleichrichtung), sowie einem zweiten Term, der mit der zweifachen Frequenz 2ω schwingt. Diese oszillierende Polarisation erzeugt im nichtlinearen Medium eine Sekundärstrahlung mit der Frequenz 2ω, wobei man hierbei nun von Frequenzverdopplung oder auch Erzeugung der zweiten Harmonischen (englisch SHG (second harmonic generation)) spricht. im Photonenbild bedeutet dies, dass zwei Photonen der Frequenz ω zu einem Photon der Frequenz 2ω kombinieren, weswegen dieser Prozess auch in die Kategorie der Dreiwellenmischung fällt. |P~ (2) | = Abbildung 5.3: Frequenzverdopplung Damit die Sekundärstrahlung beim Durchgang durch das Medium auch abgestrahlt wird, muss die Brechzahl in Ausbreitungsrichtung für die Grundwelle gleich der ersten Harmonischen sein: n(ω) = n(2ω) . (5.31) Ist diese Bedingung nicht erfüllt, findet die Konversion im Medium zwar immer noch statt, aber die an den verschiedenen Stellen des Mediums emittierte Strahlung wird durch destruktive Interferenz eliminiert bzw. es findet auch wieder eine Rückkonversion zur Grundwelle statt. Bei gleicher Brechzahl sind die Ausbreitungsgeschwindigkeiten der Grundwelle und der ersten Harmonischen gleich, so dass eine konstruktive Überlagerung stattfindet. c Lehrstuhl E13, TUM, 2010 5.2. NICHTLINEARE OPTISCHE EFFEKTE 165 Diese Anpassung der Brechzahlen nennt man auch Phasenanpassung. Daher sind die anisotropen Materialien, die zur Frequenzverdopplung verwendet werden, doppelbrechend. Die Primärwelle wird linearpolarisiert eingestrahlt und die Sekundärwelle bildet den außerordentlichen Strahl. Durch Wahl des Winkels, zwischen der Feldrichtung der Primärwelle und der optischen Achse des Materials, kann die Differenz ∆n der Brechungsindizes der beiden Strahlen zu Null gebracht werden, so daß Phasenanpassung erreicht wird. 5.2.2 Phasenkopplung Wir betrachten die Frequenzverdopplung in einer dünnen Schicht eines anisotropen Materials der Dicke ∆z. Abbildung 5.4: Frequenzverdopplung in einer dünnen Schicht eines anisotropen Materials der Dicke ∆z als Beispiel für die Phasenkopplung . Es fallen Primärstrahlen mit ES (t, z) = ESo exp [−i (ωt − k1 z)] (5.32) auf eine dünnen Schicht eines anisotropen Materials der Dicke ∆z. Diese Lichtstrahlen erzeugen eine Polarisation 2. Ordnung in der Materie, die ihrerseits die Sekundärwellen mit der doppelten Frequenz 2ω abstrahlt. Hinter der Schicht besitzen diese Sekundärwellen einen Beitrag zum elektrischen Feld gleich (2) 2 2 ES (t, z) ∼ ES2 = ESo exp [−2i (ωt − k1 z)] = ESo exp [−i (2ωt − 2k1 z)] . (5.33) Ohne Phasenanpassung ist die Wellenzahl k2 der frequenzverdoppelten Welle aber im Allgemeinen nicht gleich 2k1 . Dies wäre nur der Fall, wenn in dem Material der Brechungsindex für die frequenzverdoppelte Welle N2 gleich dem Brechungsindex N1 für die Primärwelle wäre. Aufgrund der Dispersion in dem Material ist aber normalerweise N1 6= N2 und damit k2 6= 2k1 . Primär- und Sekundärwellen können miteinander innerhalb der Schicht interferieren. Dies führt je nach Phasendifferenz zu einer Abschwächung der Sekundärwelle. Es gilt 2k1 − k2 = 2k(N1 − N2 ) = 2k ∆N c Lehrstuhl E13, TUM, 2010 (5.34) 5.2. NICHTLINEARE OPTISCHE EFFEKTE 166 mit der Vakuumwellenzahl der Primärwelle k. An einem Aufpunkt z0 außerhalb der Materieschicht betrachten wir die Interferenz zwischen Primär- und Sekundärwelle. Dabei erhalten wir das gesamte Feld der Sekundärwelle durch Integration über die Schichtdicke dz von z = 0 bis ∆z und Anwenden der Eulerschen Beziehung ergibt sich (2) ES (t, z0 ) ∼ E0 (t, z0 ) exp [ik ∆N ∆z] sin (k ∆N ∆z) . k ∆N ∆z (5.35) Diese Funktion hat die Form der Spaltbeugungsfunktion eines Rechteckspalts. Sie resultiert aus der Interferenz und erreicht ihr Maximum (falls ∆N und ∆z endlich sind) bei (2) k ∆N ∆z = π/2, entsprechend ES (t, z0 ) = 2y0 (t, z0 )∆z/π und ∆z = l/4∆N . Dies wird Kohärenzlänge der Sekundärwellen genannt und begrenzt die erreichbare Intensität dieser frequenzverdoppelten Welle. 5.2.3 Summenfrequenzmischung Zwei Laserstrahlen mit der Frequenz ω1 und ω2 werden überlagert und in einen Kristall geschickt. Im Kristall entsteht eine dritte Frequenzkomponente mit der Frequenz ω3 = ω1 + ω2 . Abbildung 5.5: Summenfrequenzmischung Zwei Felder mit Frequenzen ω1 und ω2 erzeugen eine Polarisation bei der Frequenz ω3 : X (2) X (2) Pi (ω3 ) = ε0 χijk (ω3 , ω1 , ω2 )Ej (ω1 )Ek (ω2 ) + ε0 χijk (ω3 , ω2 , ω1 )Ej (ω2 )Ek (ω1 ) jk jk (5.36) Da die Indizierung physikalisch willkürlich ist und die Felder als komplexe Zahlen vertauschen, gilt X (2) Pi (ω3 ) = 2ε0 χijk (ω3 , ω1 , ω2 )Ej (ω1 )Ek (ω2 ) . (5.37) jk Falls die Lichtpolarisation für beide Felder gleich ist (und in linear z.B. in x-Richtung), vereinfacht sich das Ganze zu (2) Pi (ω3 ) = 2ε0 χixx (ω3 , ω1 , ω2 )Ex (ω1 )Ex (ω2 ) . c Lehrstuhl E13, TUM, 2010 (5.38) 5.2. NICHTLINEARE OPTISCHE EFFEKTE 167 Für ω1 = ω2 = ω3 /2 folgt die Frequenzverdopplung (2) Pi (ω3 ) = ε0 χixx (ω3 , ω1 , ω1 )Ex (ω1 )Ex (ω1 ) . (5.39) Die Summenfrequenzbildung führt im Vergleich zur Frequenzverdopplung zu einer doppelt so großen Polarisation. Abbildung 5.6: Diagrammendarstellung der nichtlinearen Suszeptibilität für (links und mitte) Summenfrequenzbildung und (rechts) Frequenzverdopplung. 5.2.4 Parametrischer Prozess Während bei der Frequenzmischung aus zwei Photonen durch eine Summen- und Differenzbildung ein drittes Photon erzeugt wird, so kann auch der umgekehrte Prozess beobachtet werden. In diesem optisch parametrischen Prozess zerfällt ein Photon mit der Frequenz ω1 in zwei Photonen mit den Frequenzen ω2 und ω3 wobei nach der Energierhaltung für die Frequenzen ω1 = ω2 + ω3 (5.40) gilt. Abbildung 5.7: Parametrischer Prozess 5.2.5 Prozesse dritter Ordnung Im Gegensatz zu Prozessen zweiter Ordnung lassen die Prozesse dritter Ordnung eine Beeinflussung der Welle durch sich selbst zu. Während der Term zweiter Ordnung in c Lehrstuhl E13, TUM, 2010 5.2. NICHTLINEARE OPTISCHE EFFEKTE 168 ~ für die Erzeugung der zweiten Harmonischen verantwortlich ist, jedoch nur in nichtE zentrosymmetrischen Kristallen auftritt, ist der χ(3) -Term prinzipiell immer vorhanden. Diese Tatsache folgt daraus, daß in zentrosymmetrischen Kristallen eine Änderung der Vorzeichen der einfallenden elektrischen Felder eine Änderung des Vorzeichens der Polarisation nach sich zieht. Mit der Formel für die Polarisation folgt aus der Bedingung (2) (2) ε0 χijk Ej Ek = −ε0 χijk (−Ej )(−Ek ) (5.41) dass χ(2) = 0 sein muss. Die analoge Formulierung für χ(3) (3) (3) ε0 χijkl Ej Ek El = −ε0 χijkl (−Ej )(−Ek )(−El ) (5.42) ergibt eine Gleichheit, also keine einschränkende Bedingung. χ(3) koppelt drei einfallende und eine ausfallende elektromagnetische Welle miteinander. Über χ(3) ist eine schnelle, reversible Änderung des Brechungsindex und/oder des Absorptionskoeffizienten möglich. Dieser Effekt könnte Grundlage eines rein optischen Computers werden, da so ein optischer Schalter aufgebaut werden kann. Dieser Rechner wäre dann deutlich schneller als elektronische Systeme aufgrund der möglichen parallelen Datenbearbeitung. c Lehrstuhl E13, TUM, 2010 Anhang A Ergänzung zu elektromagnetischen Wellen A.0.6 Maxwellsche Gleichungen Die vier Maxwellschen Gleichungen beschreiben die Erzeugung von elektrischen und magnetischen Feldern durch Ladungen und Ströme, sowie die Wechselwirkung zwischen diesen beiden Feldern, die bei zeitabhängigen Feldern in Erscheinung tritt. Sie sind die Grundlage der Elektrodynamik. Sie lassen sich in differentieller und in integraler Form darstellen. Die Äquivalenz beider Formulierungen beruht auf dem Satz von Stokes und dem Satz von Gauß. Die 4 Maxwellschen Gleichungen in SI-Einheiten in differentieller Form (und nach Umformung in die integrale Form) lauten: ~ = εE ~ ist ein Quellen• Gaußsches Gesetz: Das Feld der elektrischen Flussdichte D feld. Die Ladung (Ladungsdichte ρ) ist Quelle des elektrischen Feldes: I Z ~ =∇ ~ ·D ~ =ρ⇔ ~ · dA ~= div D D ρ dV (A.1) ∂V V ~ ist quellenfrei. Es gibt keine magnetischen • Das Feld der magnetische Flussdichte B Monopole: I ~ ~ ~ ~ · dA ~=0 div B = ∇ · B = 0 ⇔ B (A.2) ∂V ~ • Induktionsgesetz: Jede Änderung des B-Feldes führt zu einem elektrischen Gegenfeld. Die Wirbel des elektrischen Feldes sind von der zeitlichen Änderung der magnetischen Induktion abhängig. ~ ~ ~ + ∂B = ∇ ~ ×E ~ + ∂B = 0 ⇔ rot E ∂t ∂t ~ · d~s + d E dt ∂A I Z A ~ ~ B · dA = 0 (A.3) • Verallgemeinertes Durchflutungsgesetz: Die Wirbel des Magnetfeldes hängen von der elektrischen Leitungsstromdichte ~jl und von der elektrischen Flussdichte ~ ab. Die zeitliche Änderung von D ~ wird auch als Verschiebungsstromdichte ~jv D 169 A. ERGÄNZUNG ZU ELEKTROMAGNETISCHEN WELLEN 170 bezeichnet und ergibt als Summe mit der Leitungsstromdichte die totale Stromdichte ~j = ~jl + ~jv : ~ ~ =∇ ~ ×H ~ = ~jl + ∂ D ⇔ rot H ∂t I ∂A ~ · d~s = H ~+ d ~jl · dA dt A Z Z A ~ ~ D · dA (A.4) ~ im 3-dimensionalen kartesischen Koordinatensystem Dabei ist der Nabla-Operator ∇ mit den Einheitsvektoren ~e1 , ~e2 und ~e3 definiert als ∂ ∂ ∂ ∂ ∂ ∂ ~ , , + ~e2 + ~e3 . (A.5) = ~e1 ∇= ∂x ∂y ∂z ∂x ∂y ∂z A.0.7 Elektromagnetische Welle im Vakuum Eine elektromagnetische Welle breite sich im Vakuum aus, und zwar im ladungsfreien ~ = ε0 E ~ Raum unter Ausschluss von dielektrischen, dia- und paramagnetischen Effekten (D ~ = µ0 H). ~ Die Stromdichte ~j und Ladungsdichte ̺ betragen null. Ausgehend von der und B dritten Maxwellschen Gleichung ~ ~ ×E ~ = − ∂B ∇ (A.6) ∂t wird auf beiden Seiten der Rotationsoperator angewendet und es folgt ! ~ ∂ ~ ∂B ~ ~ ~ ~ ~ = −µ0 ∇×H . (A.7) ∇ × (∇ × E) = −∇ × ∂t ∂t Durch Einsetzen der vierten Maxwellschen Gleichung (mit j~l = 0) ~ ~ ×H ~ = ∂D ∇ ∂t (A.8) ergibt sich ~ × (∇ ~ × E) ~ = −µ0 ∂ ∇ ∂t ~ ∂D ∂t ! = −µ0 ε0 ~ ∂ 2E . ∂t2 (A.9) Es gilt allgemein die vektoranalytische Beziehung ~ × (∇ ~ × A) ~ = ∇( ~ ∇ ~ · A) ~ − ∆A ~ ∇ (A.10) ∆ = ∂ 2 /∂x2 + ∂ 2 /∂y 2 + ∂ 2 /∂z 2 . (A.11) mit dem Laplace-Operator ~ angewendet und berücksichtigt, dass der Wird diese vektoranalytische Beziehung auf E ladungsfreie Raum betrachtet wird, in dem nach der ersten Maxwellschen Gleichung die ~ und damit auch von E ~ null beträgt, so folgt Divergenz von D ~ × (∇ ~ × E) ~ = ∇( ~ ∇ ~ · E) ~ − ∆E ~ = −∆E ~ . ∇ c Lehrstuhl E13, TUM, 2010 (A.12) A. ERGÄNZUNG ZU ELEKTROMAGNETISCHEN WELLEN 171 Aus A.9 und A.12 ergibt sich die Wellengleichung für das elektrische Feld ~ = µ0 ε0 ∆E ~ ∂ 2E ∂t2 . (A.13) Alle Wellen lassen sich durch Gleichungen der allgemeinen Form ∂ 2f = v 2 ∆f ∂t2 (A.14) beschreiben, wobei v die Ausbreitungsgeschwindigkeit der Welle ist. Für die Ausbreitungsgeschwindigkeit elektromagnetischer Wellen, die Lichtgeschwindigkeit c, gilt daher c2 = 1 µ0 ε0 (A.15) und die Gleichung A.13 kann auch als ~ ∂2E ~ = c 2 ∆E ∂t2 (A.16) geschrieben werden. ~ die Wellengleichung Analog wird für die magnetische Flussdichte B ~ ∂2B ~ = c 2 ∆B ∂t2 (A.17) hergeleitet. Die Lösungen dieser Gleichungen beschreiben Wellen, die sich mit Lichtgeschwindigkeit c ausbreiten. Breitet sich die elektromagnetische Welle in isotropem Material (mit der relativen Permeabilität µr und der relativen Permittivität εr des Mediums) mit der Dielektrizitätskonstante ε = εr ε0 und der Permeabilität µ = µr µ0 aus, beträgt die Ausbreitungsgeschwindigkeit 1 c= √ . (A.18) µε Im Allgemeinen sind jedoch die Materialkonstanten µr und εr nicht linear, sondern können selbst z. B. von der Feldstärke oder der Frequenz abhängen. Während Licht sich in der Luft immer noch fast mit Vakuumlichtgeschwindigkeit c ausbreitet (die Materialkonstanten sind in guter Näherung 1), gilt das für die Ausbreitung in Wasser nicht, was u. a. den Tscherenkow-Effekt ermöglicht. Das Verhältnis der Vakuumlichtgeschwindigkeit zur Geschwindigkeit im Medium wird als Brechzahl r µε √ = µr εr n= (A.19) µ0 ε0 bezeichnet. c Lehrstuhl E13, TUM, 2010 A. ERGÄNZUNG ZU ELEKTROMAGNETISCHEN WELLEN A.0.8 172 Ausbreitung elektromagnetischer Wellen ~ 0 für das elektrische Feld Betrachten wir eine allgemeine Welle mit konstanter Amplitude E ~ =E ~ 0 f (k̂ · ~x − ct), E (A.20) mit dem Ortsvektor ~x und einem Einheitsvektor k̂, der in Propagationsrichtung zeigt, so erfüllt diese die Wellengleichung A.13. Einsetzen in Gleichung A.13 liefert ∆f (k̂ · ~x − ct) = 1 ∂2 f (k̂ · ~x − ct) . c2 ∂t2 (A.21) ~ nun eine elektromagnetische Welle beschreibt, muss es aber nicht nur die Damit E Wellengleichung erfüllen, sondern auch die Maxwellgleichungen (im ladungsfreien Raum). Das bedeutet zunächst ~ ·E ~ = k̂ · E ~ 0 ∇f ~ (k̂ · ~x − ct) = 0 ∇ (A.22) und damit ~ · k̂ = 0 . E (A.23) Das elektrische Feld steht also stets senkrecht zur Propagationsrichtung, es handelt sich also um eine Transversalwelle. ~ in eine weitere Maxwellgleichung ergibt Einsetzen von E ~ ~ ×E ~ = k̂ × E ~ 0 ∇f ~ (k̂ · ~x − ct) = − ∂ B ∇ ∂t (A.24) und durch Integration über die Zeit ~ = 1 k̂ × E ~ . B c (A.25) Die magnetische Flussdichte in der elektromagnetischen Welle steht also ebenfalls senkrecht zur Propagationsrichtung und auch senkrecht zum elektrischen Feld. c Lehrstuhl E13, TUM, 2010 Anhang B Mathematische Ergänzung Die meisten physikalischen Aussagen sind in der Sprache der Mathematik formuliert. Um die Vorlesung verstehen und Übungsaufgaben lösen zu können, ist es unerlässlich einige einfache mathematische Sachverhalte zu kennen. Ziel dieses Kapitels ist es, Techniken kennenzulernen, die das Lösen von Differenzialgleichungen (DGLs) und Mehrfachintegralen erleichtern. Es geht vor allem um die Methoden, mathematische Details werden an vielen Stellen weggelassen. Dieses Kapitel ersetzt in keinem Fall Abschnitte einer Mathematikvorlesung. B.1 Differenzialgleichungen (DGLs) Physikalische Gesetze setzen oft Größen und deren Ableitungen (beispielsweise nach dem Ort oder der Zeit) miteinander in Beziehung. Die Bewegungsgleichung des mathematischen Pendels in differenzieller Form g (B.1) ϕ̈ + ϕ = 0 l ist ein solches Beispiel. Ein weiteres anschauliches Gesetz ist das in der Biologie verwendete sogenannte Wachstumsgesetz Ṅ (t) = rN (t) , (B.2) das die Anzahl der Lebewesen N (t) einer Population mit der zeitlichen Änderung der Zahl der Lebewesen Ṅ (t) miteinander in Beziehung setzt. Hierbei ist r > 0 ein Parameter, der etwas über die Vermehrungsrate aussagt. Je mehr Lebewesen also in einer Population sind, desto mehr können sich auch vermehren und umso schneller wächst Population. Folglich wird auch Ṅ (t) größer. Die Aussage ist umgekehrt genauso gültig. In beiden vorgestellten DGLs kann man keine explizite Form der jeweils gesuchten Funktion ablesen. Genausowenig gibt es eine allgemeine, einheitliche Lösungsmethode, die auf jede DGL anwendbar wäre. Im Folgenden werden aber Lösungsstrategien für bestimmte, für die Vorlesung wichtige, DGLs vorgestellt. B.1.1 Definitionen Eine DGL ist eine Gleichung, die die unbekannte Funktion y(x) und Ableitungen davon enthält. Die Ordnung einer DGL ist die höchste vorkommende Ableitung von y(x). Eine 173 B.1. DIFFERENZIALGLEICHUNGEN (DGLS) 174 lineare DGL der Ordnung n hat die Form n X ai y (i) (x) = b(x) . (B.3) i=0 Dabei bedeutet y (i) (x) die i-te Ableitung der Funktion y(x). Aus Gründen der Übersichtlichkeit schreibt man oft auch nur y statt y(x). Die DGL lautet in ausgeschriebener Form a0 y(x) + a1 y ′ (x) + . . . + an−1 y (n−1) (x) + an y (n) (x) = b(x) . (B.4) Die Koeffizienten ai können auch von x abhängen. Sind sie hingegen unabhängig von x, so spricht man von einer linearen DGL mit konstanten Koeffizienten. Die Funktion b(x) ist die sogenannte Inhomogenität oder auch Steuerungsfunktion. Gilt b(x) = 0, ist also b(x) die konstante Nullfunktion, so bezeichnet man die DGL als homogen. Ist dies nicht erfüllt, ist also b(x) 6= 0, so liegt eine inhomogene DGL vor. Es gibt natürlich auch nichtlineare DGLs. Das sind solche DGLs, die nicht in obige Form gebracht werden können. Beispielsweise hat dann y(x) oder eine Ableitung davon einen Exponenten 6= 1 oder steht als Argument in einer Exponentialfunktion, etc.. Die vorgestellten Begriffe eignen sich, um DGLs zu klassifizieren. Beispielsweise ist die Schwingungsgleichung eine lineare, homogene DGL zweiter Ordnung mit konstanten Koeffizienten. Das Wachstumsgesetz ist eine lineare, homogene DGL erster Ordnung mit konstanten Koeffizienten. Die DGL für eine erzwungene Schwingung mit Reibung ẍ(t) + ks k ẋ(t) + x(t) = K cos(ωe t) m m (B.5) ist dementsprechend eine lineare, inhomogene DGL zweiter Ordnung mit konstanten Koeffizienten. Hier noch einige Beispiele für nichtlineare DGLs erster Ordnung: x2 y 2 (x) y ′ = 4y − y 2 y ′ (x) = B.1.2 y ′ (x)ey(x) − 1 = 0 (B.6) y ′ sin(x) = y ln(y) (B.7) Integrierbare DGLs Es gibt DGLs, die sich durch einfaches Integrieren lösen lassen. Ein Beispiel hierfür ist die DGL y ′ (x) = 2x . (B.8) Die durch Integrieren gefundene Stammfunktion y(x) = x2 + c ist nicht eindeutig, sie enthält eine zunächst nicht bestimmte Integrationskontante c. Diese fällt beim Ableiten wieder weg, so dass y(x) = x2 + c für jedes beliebige c die DGL löst. Wir haben also eine Schar an Lösungsfunktionen mit Scharparameter c gefunden, diese nennt man auch die allgemeine Lösung der DGL. Die Vorgabe einer weiteren Bedingung, einer sogenannten Anfangsbedingung, zum Beispiel y(2) = 9, ermöglicht eine Berechnung von c. Für dieses Beispiel gilt y(2) = 9 ⇒ 22 + c = 9 ⇒ c = 5 . (B.9) c Lehrstuhl E13, TUM, 2010 B.1. DIFFERENZIALGLEICHUNGEN (DGLS) 175 Wir betrachten ein weiteres Beispiel, in dem wir die Anfangsbedingungen gleich mit vorgeben: y ′′ (x) = sin(x); y(0) = 2; y ′ (0) = 0 . (B.10) Da diese DGL zweiter Ordnung ist, müssen wir auch zweimal integrieren und es folgt y ′ (x) = − cos(x) + c1 ; y(x) = − sin(x) + c1 x + c2 . (B.11) Die allgemeine Lösung hängt hier, entsprechend der Ordnung der DGL, von zwei Konstanten c1 und c2 ab. Diese werden über die Anfangsbedingungen bestimmt: y ′ (0) = 0 ⇒ y(0) = 2 −1 + c1 = 0 ⇒ ⇒ c2 = 2 c1 = 1 (B.12) (B.13) Nun lässt sich die spezielle Lösung angeben: y(x) = − sin(x) + x + 2 . (B.14) Allerdings lassen sich nur die wenigsten DGLs durch einfache Integration lösen. B.1.3 Lineare, homogene DGLs, verschiedene Nullstellen Das Ziel ist es ein Lösungsschema für lineare, homogene DGLs mit konstanten Koeffizienten zu entwickeln. Das Prinzip wollen wir uns an einem Beispiel veranschaulichen. Wir betrachten die DGL y ′′ (x) + y ′ (x) − 6y(x) = 0 . (B.15) Als geschickter Lösungsansatz erweist sich eine Exponentialfunktion. Wir wählen y(x) = ekx . (B.16) Diese Funktion setzen wir in die DGL ein. Daher müssen wir die erste und zweite Ableitung bilden: y ′ (x) = kekx und y ′′ (x) = k 2 ekx . (B.17) Einsetzen ergibt k 2 ekx + kekx − 6ekx = 0 . (B.18) Da diese Gleichung für alle x ∈ R gilt, kann ekx gekürzt werden und es bleibt k2 + k − 6 = 0 . (B.19) Dies ist das sogenannte charakteristische Polynom der obigen DGL. Über die Lösungsformel für quadratische Polynome berechnet man die zugehörigen Nullstellen p −1 ± 1 − 4 · 1 · (−6) (B.20) k1,2 = 2 ⇒ c Lehrstuhl E13, TUM, 2010 k1 = 2 und k2 = −3 . (B.21) B.1. DIFFERENZIALGLEICHUNGEN (DGLS) 176 Für diese Werte von k löst die Ansatzfunktion die DGL. Wir erhalten zwei verschiedene (linear unabhängige) Lösungen, das sogenannte Fundamentalsystem, bestehend aus e2x , e−3x . (B.22) Für lineare Differentialgleichungen gilt generell: Die Anzahl der Funktionen im Fundamentalsystem ist genauso groß wie die Ordnung der DGL. Wie bei den integrierbaren DGLs hat die allgemeine Lösung zwei noch nicht bestimmte Konstanten, die hier als Vorfaktoren der Fundamentallösungen auftauchen. Die allgemeine Lösung der gegebenen DGL ist eine Linearkombination der Fundamentallösungen y(x) = c1 e2x + c2 e−3x . (B.23) Die Koeffizienten c1 und c2 werden über sogenannte Anfangsbedingungen bestimmt. In der Physik sind dies oft der Ort und die Geschwindigkeit zum Zeitpunkt 0. Die Anzahl der notwendigen Anfangsbedingungen ist genauso groß wie die Ordnung der DGL. Eine DGL mit gegebenen Anfangsbedingungen bezeichnet man auch als Anfangswertproblem. Für obige DGL geben wir uns nun spezielle Anfangsbedingungen y(0) = 10, y ′ (0) = 0 (B.24) vor. Aus der ersten Bedingung folgt y(0) = c1 + c2 = 10 ⇒ c2 = 10 − c1 . (B.25) Ableiten der allgemeinen Lösung und einsetzen der zweiten Bedingung impliziert y ′ (x) = 2c1 e2x − 3c2 e−3x y ′ (0) = 2c1 − 3c2 = 0 . ⇒ (B.26) Den Ausdruck c2 = 10 − c1 setzt man in die letzte Gleichung ein und erhält 2c1 − 3(10 − c1 ) = 5c1 − 30 = 0 ⇒ c1 = 6 und c2 = 4 . (B.27) Schließlich können wir als Endergebnis die zu diesen Anfangswerten spezielle Lösung angeben: y(x) = 6e2x + 4e−3x . (B.28) Zusammenfassend sind hier die wesentlichen Schritte nocheinamal im Überblick. Schritt 1, charakteristisches Polynom aufstellen: Die Ableitungsordnungen werden dabei zum Exponenten der Polynomvariablen y ′′ (x) + y ′ (x) − 6y(x) = 0 −→ k2 + k − 6 = 0 Schritt 2, Nullstellen ausrechnen und allgemeine Lösung angeben: k1 = 2 und k2 = −3 c Lehrstuhl E13, TUM, 2010 −→ y(x) = c1 e2x + c2 e−3x B.1. DIFFERENZIALGLEICHUNGEN (DGLS) 177 Schritt 3, aus Anfangsbedingungen Koeffizienten berechnen: y(0) = 10, y ′ (0) = 0 −→ y(x) = 6e2x + 4e−3x In diesem Beispiel hatte das charakteristische Polynom zwei verschiedene reelle Nullstellen. Es können natürlich auch andere Fälle auftreten, beispielsweise könnte das charakteristische Polynom Nullstellen höherer Vielfachheit oder komplexe Nullstellen haben. Diese Fälle wollen wir im folgenden betrachten. B.1.4 Lineare, homogene DGLs, mehrfache Nullstellen Um den Fall von Nullstellen höherer Vielfachheit aufzugreifen, betrachten wir die DGL y (3) (x) − 4y ′′ (x) + 8y ′ (x) − 8y(x) = 0 . (B.29) Als Lösungsansatz verwenden wir wieder den ekx -Ansatz, aus dem wir das charakteristische Polynom erhalten. Da aber in jedem Fall die Ableitungsordnungen in der DGL zu den Exponenten im Polynom werden, können wir uns den Zwischenschritt auch sparen und das charakteristische Polynom direkt angeben: k 3 − 4k 2 + 8k − 8 = 0 . (B.30) Nun müssen wir die Nullstellen bestimmen. In der faktorisierten Form des Polynoms lassen sich diese einfach ablesen, außerdem sieht man auch gleich die jeweiligen Vielfachheiten der Nullstellen. k 3 − 4k 2 + 8k − 8 = (k − 2)3 = 0 . (B.31) In diesem Fall ist k = 2 eine Nullstelle der Vielfachheit 3. Eine Fundamentallösung lautet damit e2x . Da wir eine DGL dritter Ordnung vorliegen haben, muss das Fundamentalsystem aber aus 3 Lösungen bestehen. Weitere Lösungen lauten xe2x und x2 e2x . Dies lässt sich durch Einsetzen in die DGL verifizieren. Nun haben wir drei Fundamentallösungen und wir können die allgemeine Lösung als Linearkombination dieser drei Lösungen angeben. Sie lautet y(x) = c1 e2x + c2 xe2x + c3 x2 e2x . (B.32) Da die DGL die Ordnung 3 hat, haben wir natürlich auch 3 Koeffizienten c1 , c2 und c3 . Hätten wir Anfangsbedingungen gegeben, könnten wir diese auch bestimmen. Nach dem Lösungsschema dieses Beispiels kann man nun allgemein für jede lineare DGL mit konstanten Koeffizienten der Ordnung n ein Fundamentalsystem aufstellen und so direkt die allgemeine Lösung angeben. Zusammenfassend wird im folgenden nocheinmal das Rezept dafür angegeben. Angenommen wir haben das charakteristische Polynom einer gegebenen DGL aufgestellt und faktorisiert. Dann hat es die Form A(k − k1 )λ1 · (k − k2 )λ2 · . . . · (k − kr )λr = 0 . (B.33) Hierbei sind k1 , k2 , . . . , kr die verschiedenen Nullstellen und λ1 , λ2 , . . . , λr die zugehörigen Vielfachheiten. Da wir eine DGL der Ordnung n haben, müssen sich die Vielfachheiten auch c Lehrstuhl E13, TUM, 2010 B.1. DIFFERENZIALGLEICHUNGEN (DGLS) 178 zu n addieren, also λ1 + λ2 + . . . + λr = n. Das Fundamentalsystem besteht dann aus den folgenden n Lösungen: zu k1 die λ1 Lösungen: zu k2 die λ2 Lösungen: .. . ek1 x , xek1 x , . . . , xλ1 −1 ek1 x ek2 x , xek2 x , . . . , xλ2 −1 ek2 x .. . zu kr die λr Lösungen: ekr x , xekr x , . . . , xλr −1 ekr x Dies gilt im Prinzip für reelle und komplexe Nullstellen ki , allerdings ist in letzterem Fall dann auch die Funktion eki x komplexwertig. Solche Lösungen sind in der Physik oft unbrauchbar, da gängige Größen wie Ort, Geschwindigkeit, Zeit, . . ., reell sind. Wir benötigen also eine Methode, aus eventuell komplexwertigen Nullstellen des charakteristischen Polynoms reelle Lösungen zu berechnen. B.1.5 Lineare, homogene DGLs, komplexe Nullstellen Das folgende Beispiel ist so gewählt, dass das zugehörige charakteristische Polynom komplexe Nullstellen bestitzt. Es soll illustrieren, wie man trotzdem auf reelle Lösungen kommt. Wir betrachten die DGL y ′′ (x) − 4y ′ (x) + 13y(x) = 0 . (B.34) Das zugehörige charakteristische Polynom lautet k 2 − 4k + 13 = 0 . (B.35) Die Nullstellen können hier wieder über die Lösungsformel für Polynome zweiten Grades berechnet werden: √ √ 4 ± 16 − 4 · 1 · 13 4 ± −36 4 ± 6i k1,2 = = = . (B.36) 2 2 2 Die Nullstellen lauten k1 = 2 + 3i und k2 = 2 − 3i, sie unterscheiden sich nur um das Vorzeichen des Imaginärteils, man sagt, die beiden Nullstellen sind komplex konjugiert. Dies ist nicht verblüffend, denn bei Polynomen mit reellen Koeffizienten treten die komplexen Nullstellen immer in komplex konjugierten Paaren auf. Die Anzahl der nicht-reellen Nullstellen ist also immer gerade. Nach dem bisherigen Schema lautet das (komplexe) Fundamentalsystem e(2+3i)x , e(2−3i)x . (B.37) Um dieses nun in ein reelles Fundamentalsystem umzuwandeln bentzen wir die sogenannte Eulerformel: für jedes ϕ ∈ R gilt: eiϕ = cos(ϕ) + i · sin(ϕ) Diese wenden wir nun auf beide Funktionen im Fundamentalsystem an. (1) e(2+3i)x = e2x e3ix = e2x (cos(3x) + i · sin(3x)) (2) e(2−3i)x = e2x e−3ix = e2x (cos(−3x) + i · sin(−3x)) = e2x (cos(3x) − i · sin(3x)) . c Lehrstuhl E13, TUM, 2010 B.1. DIFFERENZIALGLEICHUNGEN (DGLS) 179 Im letzten Schritt wurde die Symmetrie des Cosinus bzw. die Antisymmetrie des Sinus benutzt. In anderen Worten heißt dies, dass für alle ϕ ∈ R gilt cos(−ϕ) = cos(ϕ) bzw. sin(−ϕ) = − sin(ϕ). Wir wissen bereits, dass wir aus den Funktionen im Fundamentalsystem beliebige Linearkombinationen bilden dürfen, und dass das Ergebnis einer solchen Operation wieder eine Lösung ist. Wir bilden (1) + (2) = e2x cos(3x) und 2 (1) − (2) = e2x sin(3x) . 2i (B.38) Diese zwei Funktionen sind nun die reellen Fundamentallösungen der DGL. Die allgemeine Lösung lautet also y(x) = c1 e2x cos(3x) + c2 e2x sin(3x) . (B.39) Ein weiteres Beispiel liefert uns die Schwingungsgleichung. Diese ist mit der vorgestellten Methode sehr schnell zu lösen. Wir geben uns dazu die Schwingungsgleichung ohne Einheiten mit gl = 25 vor: y ′′ (x) + 25y(x) = 0 . (B.40) Das charakteristische Polynom lautet k 2 + 25 = 0 . (B.41) hat also die Nullstellen k1 = 5i und k2 = −5i. Unter Beachtung von e0x = 1 kann man sofort das reelle Fundamentalsystem angeben, es lautet: cos(5x), sin(5x) . (B.42) Die allgemeine Lösung ist somit y(x) = c1 cos(5x) + c2 sin(5x) . (B.43) Diese kann in die bereits bekannte Form y(x) = cneu sin(5x + ϕneu ) (B.44) umgeschrieben werden. Zusammenfassend wird jetzt nocheinmal das Rezept vorgestellt, wie man mit komplexen Nullstellen umzugehen hat, wenn die Lösung reell sein soll. Dies gilt wieder für lineare DGLs mit konstanten Koeffizienten der Ordnung n. Wir gehen wieder davon aus, dass wir das charakteristische Polynom faktorisiert vorliegen haben und so alle Nullstellen inklusive deren Vielfachheiten ablesen können. A(k − k1 )λ1 · (k − k2 )λ2 · . . . · (k − kr )λr = 0 . (B.45) Für die reellen Nullstellen stellen wir das Fundamentalsystem auf wie gehabt. Dieses muss noch um die Lösungen erweitert werden, die zu den nicht-reellen Nullstellen gehören. c Lehrstuhl E13, TUM, 2010 B.1. DIFFERENZIALGLEICHUNGEN (DGLS) 180 Deren Anzahl ist aufgrund der Tatsache, dass sie in komplex konjugierten Paaren auftreten, bekanntlich gerade. Wir picken uns ein solch komplex konjugiertes Paar heraus und bezeichnen dieses mit k = α + iβ, k̄ = α − iβ . (B.46) α ist dabei der Realteil und β bzw. −β der jeweilige Imaginärteil. Wenn nun λ die Vielfachheit der Nullstelle k ist, dann ist λ auch die Vielfachheit der Nullstelle k̄. Insgesamt haben wir uns also, mit Vielfachheiten gezählt, 2λ viele Nullstellen herausgepickt. Zu diesen Nullstellen können wir wie bereits besprochen die 2λ Fundamentallösungen angeben: eαx cos(βx), xeαx cos(βx), . . . , xλ−1 eαx cos(βx), eαx sin(βx), xeαx sin(βx), . . . , xλ−1 eαx sin(βx), Mit allen komplexen Nullstellen, zu denen nach diesem Rezept die Fundamentallösungen bestimmt wurden, und allen reellen Nullstellen besteht das Fundamentalsystem wieder aus n Funktionen. Insgesamt können wir nun homogene, lineare DGls beliebiger Ordnung mit konstanten Koeffizienten lösen. Es bleibt nun die Frage, wie mit inhomogenen DGls umzugehen ist. Dies soll das nächste Kapitel zeigen. B.1.6 Lineare, inhomogene DGLs Wir betrachten wieder eine allgemeine lineare DGL der Ordnung n: a0 y(x) + a1 y ′ (x) + . . . + an−1 y (n−1) (x) + an y (n) (x) = b(x) . (B.47) Allerdings soll jetzt b(x) 6= 0 gelten. Folgender Lösungweg ist immer anwendbar: Zunächst lösen wir die zugehörige homogene Gleichung a0 y(x) + a1 y ′ (x) + . . . + an−1 y (n−1) (x) + an y (n) (x) = 0 . (B.48) Nach bekanntem Schema können wir die allgemeine Lösung zur homogenen Gleichung yH (x) angeben (wieder als Linearkombination der Fundamentallösungen). Danach bestimmen wir irgendeine Lösung der inhomogenen Gleichung. Das Ergebnis ist die sogenannte partikuläre Lösung yP (x). Insgesamt ist die allgemeine Lösung y(x) der inhomogenen Gleichung die Summe aus der allgemeinen Lösung der homogenen Gleichung und der partikulären Lösung. y(x) = yH (x) + yP (x) . (B.49) Hierbei tauchen in yH (x) noch die n Koeffiezienten c1 , . . ., cn auf. Unter Benutzung eventuell gegebener Anfangsbedingungen können diese Koeffizienten bestimmt und so eine spezielle Lösung angegeben werden. Die Schwierigkeit bei inhomgenen DGLs ist, auf die partikuläre Lösung zu kommen. Diese muss durch geschicktes Raten bestimmt werden. Allerdings gibt es auch hier geschickte Ansätze, die oft zum Ziel führen. Hierzu folgt nun ein Beispiel. Wir betrachten das inhomogene Anfangswertproblem y ′ (x) − 2y(x) = −1 − x2 , y(0) = c Lehrstuhl E13, TUM, 2010 11 . 4 (B.50) B.1. DIFFERENZIALGLEICHUNGEN (DGLS) 181 Nach unserem Rezept müssen wir erst die zugehörige homogene Gleichung y ′ (x) − 2y(x) = 0 (B.51) lösen. Hierzu lautet das charakteristische Polynom k−2=0 ⇔ k=2 . (B.52) Als lineare DGL erster Ordung gibt es nur die eine Fundamentallösung e2x , die allgemeine Lösung der homogenen Gleichung lautet somit yH (x) = ce2x . (B.53) Nun müssen wir irgendeine Lösung der inhomogenen Gleichung finden. Wir raten, und dieser Tipp funktioniert in sehr vielen Fällen, dass die partikuläre Lösung die Form einer Polynomfunktion hat. Und weil in der Inhomogenität höchstens ein Term mit x2 vorkommt, setzten wir ein Polynom zweiten Grades an. Allerdings kennen wir die Koeffizienten unseres Polynoms nicht, daher lautet unser Ansatz mit zunächst unbekannten Koeffzienten A0 , A1 und A2 : yP (x) = A0 + A1 x + A2 x2 . (B.54) Da wir diesen Ansatz in die inhomogene Gleichung einsetzen müssen, benötigen wir auch die Ableitung: yP′ (x) = A1 + 2A2 x . (B.55) Wir setzen unseren Ansatz nun in die inhomogene DGL ein und es ergibt sich A1 + 2A2 x − 2(A0 + A1 x + A2 x2 ) = −1 − x2 . (B.56) Um die Koeffizienten bestimmen zu können, ist es erforderlich, die linke Seite nach Potenzen von x zu ordnen. (A1 − 2A0 ) + (2A2 − 2A1 )x − 2A2 x2 = −1 − x2 . (B.57) In der Gleichung stehen nun auf beiden Seiten Polynome zweiten Grades. Damit wirklich Gleichheit gilt, müssen die jeweiligen Vorfaktoren gleich sein. Dieser sogenannte Koeffizientenvergleich ergibt A1 − 2A0 = −1, 2A2 − 2A1 = 0 und − 2A2 = −1 . (B.58) Wir können nun nach den einzelnen Koeffizienten auflösen und erhalten 1 1 A2 = , A1 = 2 2 und A0 = 3 . 4 (B.59) Damit lautet die partikuläre Lösung yP (x) = 1 3 1 + x + x2 , 4 2 2 (B.60) was natürlich durch einsetzen in die inhomogene Gleichung verifiziert werden kann. Wir haben also die allgemeine Lösung der inhomogenen Gleichung bestimmt, nämlich y(x) = yH (x) + yP (x) = ce2x + c Lehrstuhl E13, TUM, 2010 1 3 1 + x + x2 . 4 2 2 (B.61) B.1. DIFFERENZIALGLEICHUNGEN (DGLS) 182 Um das gegebene Anfangswertproblem zu lösen, müssen wir noch über den Anfangswert den Koeffizienten c bestimmen: 3 11 = y(0) = c + 4 4 ⇒ c=2 . (B.62) Schließlich lautet die spezielle Lösung y(x) = 2e2x + 3 1 1 + x + x2 . 4 2 2 (B.63) Wir verlassen nun das Feld der linearen DGLs und wenden uns den nichtlinearen DGLs zu. B.1.7 Nichtlineare DGLs, Trennung der Variablen Nichtlineare DGLs sind im Allgemeinen sehr schwer zu lösen, da es keine einheitliche Theorie dazu gibt. Es sind bei weitem nicht alle nichtlinearen DGLs gelöst, sie sind ein wichtiger Gegenstand der aktuellen mathematischen Forschung. Nichtsdestotrotz gibt es auch hier bestimmte Klassen, die sich nach einem bestimmten Schema lösen lassen. Für unsere Zwecke betrachten wir nichtlineare DGLs von der Form y ′ (x) = g(x)h (y(x)) . (B.64) Dies sind DGLs erster Ordnung, die nicht notwendigerweise linear sein müssen. Sie sind lösbar durch folgendes Schema: Zunächst formen wir die DGL um in die sogenannte Differenzialschreibweise. dy = g(x)h(y) . (B.65) dx Der wichtigste Schritt ist die Trennung der Variablen. Wir formen die Gleichung so um, dass auf einer Seite nur Terme mit y vorkommen und auf der anderen Seite nur Terme mit x. dy = g(x)dx . (B.66) h(y) Die Ausdrücke dx und dy werden wir durch Integration beider Seiten los. Wir erhalten auf beiden Seiten eine Integrationskonstante, die wir in einer Konstanten K zusammenfassen können. Da unsere DGL Ordnung 1 hat, ist auch genau eine Integrationskonstante zu erwarten: Z Z dy = g(x)dx + K . (B.67) h(y) Diese integrierte Gleichung muss man nur noch nach y auflösen und man hat die allgemeine Lösung der DGL gefunden. Gibt man sich zusätzlich eine Anfangsbedingung, also einen Funktionswert y(x0 ) zu einem Punkt x0 , vor, so kann man die Konstante K berechnen und man hat zu diesem Anfangswertproblem eine spezielle Lösung. c Lehrstuhl E13, TUM, 2010 B.2. MEHRFACHINTEGRALE 183 Dieses abstrakte Lösungsschema wollen wir uns anhand eines Beispiels veranschaulichen. Wir betrachten das nichtlineare Anfangswertproblem y ′ ey − 1 = 0, y(1) = ln(2) . (B.68) Man addiert auf beiden Seiten 1 und multipliziert beide Seiten mit e−y . Mit y ′ = ergibt sich die DGL in der Differenzialschreibweise dy = e−y . dx dy dx (B.69) Durch Multiplikation mit ey und dx trennt man die Variablen ey dy = dx . (B.70) Nun integrieren wir beide Seiten, dadurch ergibt sich Z Z y e dy = dx + K ⇒ ey = x + K . (B.71) Um nach y aufzulösen, logarithmiert man beide Seiten und man erhält die allgemeine Lösung y = y(x) = ln(x + K) . (B.72) Durch Einsetzen der Anfangsbedingung bestimmen wir K gemäss ln(2) = y(1) = ln(x + K) ⇒ K=1 . (B.73) Und somit lautet die spezielle Lösung y(x) = ln(x + 1) . B.2 (B.74) Mehrfachintegrale Wir verlassen nun das Themenfeld der Differentialgleichungen und beschäftigen uns mit Mehrfachintegralen. Dabei integriert man nicht wie bei Einfachintegralen entlang einer Koordinatenachse sondern über ein komplettes Raumgebiet. Wir gehen nicht auf die Theorie ein, sondern veranschaulichen uns den Zweck dieser Technik anhand zweier Beispiele. Der Quader in der Abbildung habe keine homogene Dichte, sondern die Dichte D an jeder Position ~r sei beschrieben durch die Funktion x (B.75) D(~r) = D y = xyz . z Zur Vereinfachung lassen wir in den Beispielen die Einheiten weg. Dieser fiktive Quader hat beispielsweise entlang der Koordinatenachsen die Dichte 0. Desweiteren habe der Quader die Seitenlängen 0A = 2, 0C = 5 und 0H = 3. Zu berechnen ist nun die Masse der Quaders. c Lehrstuhl E13, TUM, 2010 B.2. MEHRFACHINTEGRALE 184 Abbildung B.1: Quader mit inhomogener Dichte Wir lösen die Aufgabe, indem wir über alle infinitesimalen Massen dm im Quader integrieren. Für das Problem eignet sich am besten das kartesische Koordinatensystem, in dem dV = dx dy dz gilt. Unter Benutzung von dm = D dV ergibt sich Z Z Z 3Z 5Z 2 xyz dxdydz . (B.76) m= dm = DdV = V V 0 0 0 R2 Dieses Dreifachintegral löst man nun von innen nach außen, d.h. zum Integral 0 gehört die Integration über dx. Das Ergebnis dieses Integrals ist der Integrand des Integrals über dy, und so weiter. Man beachte, dass bei der Integration über dx die Variablen y und z konstant bezüglich x sind. 2 Z 3Z 5 Z 3Z 5 1 2 m= yz dydz . (B.77) x yz dydz = 2 2 0 0 0 0 0 Analog erfolgt auch der nächste Schritt und es ist 5 3 Z 3 Z 3 1 2 1 2 y z dz = 25 z dz = 25 z = 112.5 . m=2 2 2 0 0 0 0 (B.78) Abschließend betrachten wir ein weiteres Beispiel, in dem wir nun einen Zylinder inhomogener Dichte untersuchen. Die Dichte hänge nur vom Abstand ̺ von der Zylinderachse ab, in diesem Beispiel sei D(~r) = ̺2 . (B.79) Die Dichte des Zylinders steigt also von innen nach außen. Der Zylinder habe einen Radius von 5 und eine Höhe von 20. Der Einfachheit halber lassen wir auch hier die Einheiten weg. Wie in dem vorherigen Beispiel integrieren wir über alle infinitesimalen Massen dm im Zylinder. Als das dem Problem angepasste Koordinatensystem wählen wir Zylinderkoordinaten, in denen dV = ̺ d̺ dφ dz gilt. Es folgt Z Z Z 20 Z 2π Z 5 ̺2 ̺ d̺dφdz . (B.80) m= dm = DdV = V c Lehrstuhl E13, TUM, 2010 V 0 0 0 B.3. GRUNDBEGRIFFE DER VEKTORANALYSIS 185 Die Berechnung des innersten Integrals ergibt m= Z 20 0 Z 2π 0 1 4 ̺ 4 5 625 dφdz = 4 0 Z 0 20 Z 2π dφdz . (B.81) 0 Analog lösen wir die restlichen beiden Integrale und es folgt 625 m= 4 B.3 Z 0 20 [φ]2π 0 625π dz = 2 Z 20 0 dz = 625π 20 [z]0 = 6250π . 2 (B.82) Grundbegriffe der Vektoranalysis In der Physik ist es oft notwendig, jedem Punkt im Raum eine gewisse Größe zuzuordnen. Beispielsweise kann man jedem Raumpunkt eine Temperatur, einen Druck, eine Dichte, usw. zuordnen. Diese Parameter lassen sich durch eine Zahl beschreiben, man spricht in diesem Fall von einem Skalarfeld. Ordnet man jedem Raumpunkt eine vektorielle Größe zu, so spricht man von Vektorfeldern. Gängige Vekorfelder sind zum Beispiel elektrische Felder, in denen jedem Raumpunkt der Vektor der zugehörigen elektrischen Feldstärke zugeordnet wird, Magnetfelder, Gravitationsfelder, Strömungsfelder, . . . . Viele mathematische Operationen für eindimensionale Funktionen, wie etwa die Ableitung, machen im Falle der Felder in ihrer ursprünglichen Form keinen Sinn mehr. In diesem Abschnitt werden einige wichtige Operationen vorgestellt, die bei der Analyse von Feldern sehr nützlich sind. Dabei wird nur auf ihre Darstellung im kartesische Koordinatensystem eingegangen. Für Zylinder- und Kugelkoordinaten ist die Form der hier eingeführten Operatoren etwas komplizierter. Vorausgesetzt ist immer die stetige Differenzierbarkeit der jeweiligen Felder. B.3.1 Definitionen und Beispiele Ein Skalarfeld J liegt vor, wenn jedem Punkt mit Ortsvektor ~r des n-dimensionalen Raumes ein Skalar J(~r) zugeordnet ist. J : Rn −→ R ~r 7→ J(~r) (B.83) Ein Beispiel für ein Skalarfeld haben wir bereits im vorherigen Kapitel kennengelernt. Die Gleichung x (B.84) D(~r) = D y = xyz. z ordnet jedem Punkt im dreidimensionalen Raum einen Wert zu, welcher in Gleichung B.75 eine Dichte war. Ein dreidimensionales Vektorfeld V~ ist eine Abbildung, die jedem Punkt im Raum einen Vektor mit drei Komponenten zuordnet. Vx (~r) V~ : R3 −→ R3 ~r 7→ V~ (~r) = Vy (~r) , (B.85) Vz (~r) c Lehrstuhl E13, TUM, 2010 B.3. GRUNDBEGRIFFE DER VEKTORANALYSIS wobei Vx , Vy und Vz jeweils Skalarfelder sind. Ein Beispiel für ein Vektorfeld lautet: xy x ~ W y = z2 5x z 186 (B.86) Für die Analyse von Skalar- und Vektorfeldern benötigen wir sogenannte Vektordifferentialoperatoren, ähnlich wie die Ableitung für eindimensionale Funktionen. Für die Notation dieser Operatoren benutzt man oft den Nabla-Operator ∂ ∂x ∂x ∂ ∂ ∂ ∂ ~ ∇ = ∂y = ∂y = ~ex + ~ey + ~ez . (B.87) ∂x ∂y ∂z ∂ ∂ z ∂z Der Gradient ist ein Operator, der aus einem Skalarfeld ein Vektorfeld ableitet. Dieses nennt man das zugehörige Gradientenfeld. ∂x J(~r) ∂x ~ r) = ∂y J(~r) = ∂y J(~r) (B.88) grad J(~r) = ∇J(~ ∂z J(~r) ∂z Man multipliziert das Skalarfeld direkt auf den Nabla-Operator. Das sich ergebende Vektorfeld gibt die Änderungsrate und die Richtung der größten Änderung des Skalarfeldes an. Der Gradient des obigen Skalarfeldes lautet beispielsweise yz ~ (B.89) grad D(~r) = ∇(xyz) = xz xy Abbildung B.2: Skalarfeld als Grauschattierung, blaue Pfeile: zugehöriges Gradientenfeld Ein weiteres Beispiel zeigt Abbildung B.2. Hier ist ein Skalarfeld in Grauschattierungen dargestellt, je höher der Wert des Skalarfeldes an einem bestimmten Punkt, desto dunkler ist der jeweilige Punkt gezeichnet. Die blauen Pfeile symbolisieren das zugehörige Gradientenfeld. Sie zeigen in Richtung des steilsten Anstieges, in diesem Falle radialsymmetrisch nach innen. c Lehrstuhl E13, TUM, 2010 B.3. GRUNDBEGRIFFE DER VEKTORANALYSIS 187 Ein weiterer wichtiger Differenzialoperator ist die Divergenz. Sie führt ein Vektorfeld ~ · V~ über. V~ in ein skalares Feld ∇ Vx (~r) ∂x ~ · V~ (~r) = ∂y · Vy (~r) = ∂x Vx (~r) + ∂y Vy (~r) + ∂z Vz (~r) (B.90) div V~ (~r) = ∇ Vz (~r) ∂z Die Divergenz kann man als Skalarprodukt des Vektorfeldes mit dem Nablaoperator darstellen. Sie ist ein Maß für die Stärke der Quellen (positives Vorzeichen) oder Senken (negatives Vorzeichen) in einem Vektorfeld. Ist die Divergenz eines Vektorfeldes die konstante Nullfunktion, so nennt man das Vektorfeld quellenfrei. Die Divergenz des Vektorfeldes aus obigem Beispiel lautet xy ∂x ~ ~ (B.91) ∇ · W (~r) = ∂y · z 2 = y + 0 + 0 = y, 5x ∂z es ist nicht quellenfrei. Die Rotation erzeugt aus einem Vektorfeld V~ ein weiteres Vektorfeld, das sogenannte ~ × V~ . Wirbelfeld ∇ ∂y Vz (~r) − ∂z Vy (~r) Vx (~r) ∂x ~ × V~ (~r) = ∂y × Vy (~r) = ∂z Vx (~r) − ∂x Vz (~r) (B.92) rot V~ (~r) = ∇ ∂x Vy (~r) − ∂y Vx (~r) Vz (~r) ∂z Die Rotation kann man als Kreuzprodukt des Vektorfeldes mit dem Nablaoperator darstellen. Die Rotation beschreibt die Wirbel eines Vektorfeldes und ist ein Maß für seine Queränderungen (z.B. entlang der geschlossenen kreisförmigen magnetischen Feldlinien um einen elektrischen Leiter) oder anders ausgedrückt für die Stärke seiner Wirbel. Namensgebend für die Rotation ist ihre Bedeutung in einem Strömungsfeld: für jeden Ort gibt die Rotation die doppelte Winkelgeschwindigkeit an, mit der ein mitschwimmender Körper rotiert, also wie schnell und um welche Achse er sich dreht. Ist die Rotation eines Vektorfeldes die konstante Nullfunktion, so nennt man das Vektorfeld wirbelfrei oder, insbesondere bei Kraftfeldern, konservativ. Die Rotation des Vektorfeldes aus obigem Beispiel lautet −2z ∂y (5x) − ∂z (z 2 ) xy ∂x ~ ×W ~ (~r) = ∂y × z 2 = ∂z (xy) − ∂x (5x) = −5 , (B.93) ∇ 2 −x ∂x (z ) − ∂y (xy) 5x ∂z es ist nicht wirbelfrei. Als weiteres Beispiel betrachten wir das Geschwindigkeitsfeld einer rotierenden Scheibe, wie es in Abbildung B.3 gezeigt ist. Es ist parametrisiert durch −y x (B.94) ~v (~r) = ~v y = ω x 0 z Es ergibt sich 0 rot ~v (~r) = 0 . 2ω c Lehrstuhl E13, TUM, 2010 (B.95) B.3. GRUNDBEGRIFFE DER VEKTORANALYSIS 188 y x Abbildung B.3: Geschwindigkeitsfeld einer rotierenden Scheibe, es gilt ω < 0 Die Winkelgeschwindigkeit ist also ω und die Rotationsachse zeigt in z-Richtung. Desweiteren ist div ~v (~r) = 0, (B.96) wir haben es also mit einem quellenfreien Vektorfeld zu tun. Schließlich wollen wir noch das vektoranalytische Analogon zur zweiten Ableitung, den sogenannten Laplace-Operator einführen. Er lässt sich auf Skalarfelder J anwenden. Das Ergebnis ∆J ist wieder ein Skalarfeld. ∆J(~r) = div grad J(~r) = ∂x2 J(~r) + ∂y2 J(~r) + ∂z2 J(~r) (B.97) Der Laplace-Operator lässt sich als Hintereinanderausführung des Gradienten- und des Divergenzoperators darstellen. Angewendet auf obiges Beispiel ergibt er yz (B.98) ∆D(~r) = div grad (xyz) = div xz = 0. xy B.3.2 Eigenschaften von Differenzialoperatoren Gewisse Hintereinanderausführungen der eingeführten Differenzialoperatoren ergeben sehr nützliche Eigenschaften. Diese werden hier nur aufgelistet, sie lassen sich aber leicht durch explizites Ausrechnen beweisen. • Das Gradientenfeld eines gegebenen Skalarfeldes J ist stets wirbelfrei: 0 ~ ~ rot grad J = ∇ × ∇J = 0 = 0. 0 c Lehrstuhl E13, TUM, 2010 (B.99) B.3. GRUNDBEGRIFFE DER VEKTORANALYSIS • Das Wirbelfeld eines gegebenen Vektorfeldes V~ ist stets quellenfrei: ~ · ∇ ~ × V~ = 0. div rot V~ = ∇ 189 (B.100) • Folgende Identität ergibt sich für Wibelfelder von Wirbelfeldern eines Vektorfeldes V~ : ~ × ∇ ~ × V~ = ∇ ~ ·∇ ~ V~ − ∆V~ . rot rot V~ = ∇ (B.101) Hierbei ist zu beachten, dass auf der rechten Seite sowohl der Gradient als auch der Laplace-Operator auf ein Vektorfeld und nicht (wie definiert) auf ein Skalarfeld angewendet werden. Dies bedeutet, dass der Gradient bzw. der Laplace-Operator auf jede Komponente des Vektorfeldes seperat anzuwenden ist - die einzelnen Komponenten des Vektorfeldes sind Skalarfelder. B.3.3 Helmholtzscher Hauptsatz der Vektoranalysis ~ r) und B(~ ~ r) zerlegen, Jedes beliebige Vektorfeld V~ (~r) lässt sich stets in zwei Vektorfelder E(~ so dass gilt: ~ r) + B(~ ~ r) mit rot E(~ ~ r) = 0 und div B(~ ~ r) = 0. V~ (~r) = E(~ (B.102) Dieser Sachverhalt ist von grundlegender Bedeutung in der Elektrodynamik. Es folgt, dass sich jedes statische elektromagnetische Feld V~ (~r) in ein wirbelfreies elektrisches Feld ~ r) (Induktionsgesetz) und ein quellenfreies magnetisches Feld B(~ ~ r) (keine magnetischen E(~ Monopole) zerlegen lässt. B.3.4 Integralsätze für Vektorfelder Ein Zweck der Integralsätze ist, Integrale über Volumengebiete bzw. Flächen in eventuell einfachere Integrale über die jeweilige Umrandung umzuwandeln. Der Rand ist im Falle eines Volumengebietes eine (Ober-) Fläche und im Falle einer Fläche eine geschlossene Kurve. Für ein Vektorfeld V~ gilt bei Integration über eine Fläche S, welche das Volumen U umschließt: I Z ~ · V~ dU V~ · d~n = ∇ (Gaußscher Satz) (B.103) S U Hierbei ist d~n der Flächennormalenvektor auf das infinitesimale Flächenstück dS. Er steht senkrecht auf dS und seine Länge ist der Betrag der Fläche von dS. Dies bedeutet, dass zum linken Integral nur Anteile senkrecht zur Umrandung S beitragen. Das Integral der Quellenverteilung (Summe der Divergenz eines Vektorfeldes, rechtes Integral) über das Volumen im Innern einer Hülle ergibt den gesamten Durchfluss (das Hüllenintegral, linkes Integral) der gesamten Strömung durch die Hülle dieses Volumens. Ein weiterer Integralsatz betrachtet Flächen und ihre Umrandungen. Für ein Vekorfeld V~ gilt bei Integration über eine glatte Kurve l, in welche die Fläche S eingespannt ist: I Z ~ ~ × V~ d~n V · d~r = ∇ (Stokesscher Satz) (B.104) l c Lehrstuhl E13, TUM, 2010 S B.3. GRUNDBEGRIFFE DER VEKTORANALYSIS 190 Hierbei ist d~r der Tangentialvektor auf das zugehörige infinitesimale Kurvenstück dl. Zum linken Integral tragen also nur die tangential zur Kurve l zeigenden Komponenten des Vektorfeldes V~ bei. Abbildung B.4: Veranschaulichung der Bedeutung des Stokesschen Satzes Hinter dem Satz steckt ein allgemeines topologisches Prinzip, das in seiner einfachsten Form besagt, dass sich bei orientierter Pflasterung“ eines Flächenstücks im Innern die ” Wege wegen Gegenverkehrs“ paarweise aufheben, so dass nur die Randkurve übrig bleibt. ” Dies ist in Abbildung B.4 veranschaulicht. c Lehrstuhl E13, TUM, 2010