Der Einfluß einer Kombination von Mikro- und Makrolinsen auf die Statistik kosmologischer Objekte Diplomarbeit vorgelegt von Matthias Bartelmann an der Ludwig-Maximilians-Universität München angefertigt am Institut für Astrophysik des Max-Planck-Instituts für Physik und Astrophysik, Garching Betreuer: Professor Jürgen Ehlers München, im Mai 1990 Geheimnisvoll am lichten Tag Läßt sich Natur des Schleiers nicht berauben; Und was sie dir nicht offenbaren mag, Das zwingst du ihr nicht ab mit Hebeln und mit Schrauben. Goethe, Faust I i ii ...aber Kleinvieh macht auch Mist. Volksmund iii Inhaltsverzeichnis Einleitung 1 1 Das kosmologische Modell 1.1 Homogene, isotrope Universen: Das Friedmann-Lemaı̂tre-Modell 1.1.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.2 Einige wichtige Zusammenhänge . . . . . . . . . . . . . 1.2 Der Ansatz von Dyer und Roeder . . . . . . . . . . . . . . . . . . 1.2.1 Vorbemerkung . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Die Dyer-Roeder-Differentialgleichung . . . . . . . . . . 1.2.3 Folgerungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 2 3 4 5 5 6 Grundlagen der Gravitationslinsentheorie 2.1 Linsengeometrie, die Linsengleichung . . . . . . . . . 2.1.1 Begriffe . . . . . . . . . . . . . . . . . . . . . 2.1.2 Der Ablenkwinkel . . . . . . . . . . . . . . . 2.1.3 Die Linsengleichung, vektorielle Schreibweise 2.1.4 Skalare Schreibweise der Linsengleichung . . 2.2 Verstärkung, die Jacobimatrix . . . . . . . . . . . . . 2.2.1 Der Verstärkungsfaktor . . . . . . . . . . . . . 2.2.2 Eigenschaften der Jacobimatrix . . . . . . . . 2.3 Zwei allgemeine Sätze . . . . . . . . . . . . . . . . . 2.4 Radialsymmetrische Linsen, die isotherme Sphäre . . . 2.4.1 Radialsymmetrische Linsen . . . . . . . . . . 2.4.2 Die isotherme Sphäre . . . . . . . . . . . . . . 2.4.3 Eine Skalierungseigenschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 7 7 8 9 9 9 10 11 11 11 12 15 3 Galaxien aus der Sicht des Beobachters 3.1 Die Leuchtkraftfunktion von Schechter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Zusammenhang zwischen Geschwindigkeitsdispersion und Leuchtkraft . . . . . . . . . . . . . . . 3.3 Eine Relation zwischen Radius und Leuchtkraft . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 16 17 17 4 Mikrolinsen 4.1 Das Feld zufällig verteilter Sterne . . . . . . . . . . . . . . . . . 4.1.1 Das Modell . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.2 Markovs Methode; Anwendung auf den vorliegenden Fall 4.1.3 Skalierung des Sternfeldes . . . . . . . . . . . . . . . . . 4.2 Sternfeld als Teil einer isothermen Sphäre . . . . . . . . . . . . . 4.2.1 Verstärkungswahrscheinlichkeit für helle Bilder . . . . . . 4.2.2 Weitere Eigenschaften . . . . . . . . . . . . . . . . . . . 4.2.3 Ein konkretes Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 18 18 19 21 21 22 24 24 Wirkungsquerschnitte 5.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Wirkungsquerschnitte für klumpige isotherme Sphären 5.2.1 Bildeigenschaften . . . . . . . . . . . . . . . . 5.2.2 Berechnung der Wirkungsquerschnitte . . . . . 5.2.3 Der Grenzfall glatter Galaxien . . . . . . . . . 5.2.4 Berücksichtigung des Bildabstands . . . . . . 5.2.5 Numerische Ergebnisse . . . . . . . . . . . . . 5.2.6 Wirkungsquerschnitte für Einzelbilder . . . . . 5.3 Einfluß einer konstanten Flächenmassendichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 27 27 27 27 29 30 30 31 33 2 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv 6 Globale Abbildungswahrscheinlichkeiten 6.1 Selbstkonsistente Wahrscheinlichkeiten . . . . . . . 6.2 Spezialisierung des allgemeinen Ergebnisses . . . . . 6.2.1 Wahrscheinlichkeit für doppelte Abbildung . 6.2.2 Wahrscheinlichkeiten für einfache Abbildung 6.3 Berücksichtigung konstanter Flächenmassendichten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 35 36 37 38 38 Der Amplification Bias“ ” 7.1 Quellenstatistik . . . . . . . . . . . . . 7.1.1 Quellenzahlen . . . . . . . . . 7.1.2 Wahrscheinlichkeitsverteilungen 7.1.3 Eine Leuchtkraftfunktion . . . . 7.2 Anteil doppelt abgebildeter Quasare . . 7.3 Einige analytische Abschätzungen . . . 7.4 Interpretation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 39 39 40 41 41 43 45 Interpretation der Ergebnisse 8.1 Anteil doppelt abgebildeter Quasare . . . . . . . . . . . 8.1.1 Vorbemerkung, Wahl der Parameter . . . . . . . 8.1.2 Interpretation des Kurvenverlaufs . . . . . . . . 8.1.3 Veränderungen im mittleren Helligkeitsverhältnis 8.2 Auswirkungen einer konstanten Flächenmassendichte . . 8.3 Zusätzliche Forderungen . . . . . . . . . . . . . . . . . 8.3.1 Bedeutung der Helligkeit der Linse . . . . . . . 8.3.2 Berücksichtigung möglicher Überstrahlung . . . 8.4 Schlußbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 46 46 46 47 48 48 49 50 52 A Vier Nachträge A.1 Berechnung der Wahrscheinlichkeitsverteilungen nach Markovs Methode A.1.1 Wahrscheinlichkeitsverteilung für die Scherung . . . . . . . . . . A.2 Anmerkung zum Jaynesschen Prinzip . . . . . . . . . . . . . . . . . . . A.3 Bilder einer Quelle nahe einer Kaustik . . . . . . . . . . . . . . . . . . . A.4 Zur Skalierungseigenschaft der Wahrscheinlichkeitsverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 54 54 55 56 56 7 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B Diagramme B.1 Anteil aufgelöster Quasarpaare an allen beobachteten Quasaren . . . . . . . . . . . . . . . . . . . . B.2 Anteil aufgelöster Quasarpaare mit Helligkeitsverhältnis zwischen q = 10 und q = 100 . . . . . . . B.3 Steigerung des Anteils aufgelöster Quasarpaare durch zusätzliche Flächenmasse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literaturverzeichnis63 57 58 61 62 Einleitung 1 Einleitung Die Idee, Licht könnte gravitativ von Massen abgelenkt werden, ist älter als die Allgemeine Relativitätstheorie. Licht, als ein Strom von Teilchen aufgefaßt, wird auch nach der Newtonschen Gravitationstheorie abgelenkt1. In der Newtonschen Näherung ergibt die Allgemeine Relativitätstheorie ein Resultat für den Ablenkwinkel eines Lichtstrahls im Schwerefeld eines Körpers, das um einen Faktor zwei von dem abweicht, das die Newtonsche Gravitationstheorie fordert. Die erste Beobachtung einer Lichtablenkung durch Eddington 1919 galt als ein kräftiger Hinweis auf die Richtigkeit der Einsteinschen Theorie. Ebenfalls bereits 1919 schlug O. Lodge vor, daß aufgrund der Lichtablenkung durch Gravitation Gebilde erzeugt werden könnten, deren Effekt als die Wirkung von Sammellinsen zu interpretieren sei. 1924 nahm O. Chwolson das vorweg, was heute als Einstein-Ring“ bezeichnet wird: Daß nämlich ein Stern, der vom Beobachter aus gesehen ” direkt hinter einem anderen steht, durch dessen Gravitationswirkung ringförmig erscheint. Einstein selbst fand 1936, daß ein solcher Ring viel zu klein sein würde, um beobachtbar zu sein. Obwohl F. Zwicky schon 1937 zeigte, daß nicht Sterne, sondern Galaxien gut als Gravitationslinsen geeignet wären, dauerte es bis 1979, bis der erste Gravitationslinsenkandidat durch Walsh, Carswell und Weymann gefunden wurde. Dabei handelt es sich um ein enges Quasarpaar bei einer Rotverschiebung von 1.41, in dessen Vordergrund sich eine Galaxie der Rotverschiebung 0.36 befindet. Seither wurden einige weitere solcher Mehrfachobjekte entdeckt, die relativ zweifelsfrei als Bilder einer Gravitationslinse gelten können. Das Überraschende an diesen Objekten ist, daß sich bereits vier unter ihnen befinden, bei denen der Helligkeitsunterschied zwischen den beiden hellsten Bildern größer als zwei Größenklassen ist2 . Bei QSO 1120+019 beträgt er sogar ∆V = 4:6 Größenklassen, das entspricht einem Helligkeitsverhältnis von fast 70. Warum ist der Anteil von Quasaren mit Bildern stark unterschiedlicher Helligkeit so groß? Die vorliegende Arbeit geht der Frage nach, ob die Eigenschaft großer Linsen (z.B. Galaxien), aus einer Unzahl erheblich kleinerer Linsen (z.B. Sternen) zusammengesetzt zu sein, dafür verantwortlich gemacht werden kann. Wir verfahren folgendermaßen: Das erste Kapitel stellt den kosmologischen Rahmen der Gravitationslinsentheorie vor. Dabei kommt vor allem der Ansatz von Dyer und Roeder zur Sprache. Im zweiten Kapitel werden Grundlagen der Linsentheorie zusammengestellt, insoweit sie im folgenden gebraucht werden. Hier spielen radialsymmetrische Linsen, insbesondere die isotherme Sphäre, eine besondere Rolle. Beobachtungsdaten, die von Interesse sind, werden im dritten Kapitel knapp dargestellt. Das vierte Kapitel führt Mikrolinsen ein und behandelt die Eigenschaften des zufälligen Sternfeldes näher. Sie sind besonders im Hinblick auf die Wahrscheinlichkeitsverteilung wichtig, die am Ende des vierten Kapitels konstruiert wird, um die Auswirkungen von Mikrolinsen auf die Abbildungseigenschaften der isothermen Sphäre zu untersuchen. Im fünften Kapitel führen wir den zentralen Begriff des Wirkungsquerschnitts ein und berechnen ihn unter Verwendung der Ergebnisse aus dem vorangegangenen Kapitel. Er wird in den Kapiteln 7 und 8 fortwährend verwendet, wo Abbildungswahrscheinlichkeiten und der Amplification Bias“ behandelt werden. Ka” pitel 8 schließlich stellt die Ergebnisse zusammen. Diskutiert werden: Der Anteil solcher Quasare, deren Bilder vorgegebene Eigenschaften haben, an allen beobachteten Quasaren, der Anteil von Quasaren mit großem Helligkeitsverhältnis ihrer Bilder und einige weitere Bedingungen, die gestellt werden, um die Sichtbarkeit der abbildenden Galaxien in Betracht zu ziehen. Schließlich zieht sich die Diskussion einer Skalierungseigenschaft durch die Arbeit, die am Ende auf die Frage angewandt wird, welche Wirkung eine räumlich konstante Massenverteilung in der Umgebung der Linsen auf die Abbildung hat. Anhang A faßt einige Nebenrechnungen zusammen; zahlreiche Diagramme finden sich in Anhang B. Noch ein Wort zur Sprachregelung“: Wir sprechen von Mikrolinsen“, wenn solche Linsen gemeint sind, de” ” ren typische Bildaufspaltung derer von Einzelsternen entspricht; sie ist von der Größenordnung 10,6 Bogensekunden. Dagegen sind Makrolinsen“ solche, die eine um einige Größenordnungen stärkere Bildaufspaltung erzeugen ” können, wie das z.B. bei Galaxien der Fall ist. 1 Newton 2 Das selbst erwähnte bereits diese Möglichkeit. sind: QSO 0142-100, QSO 1120+019, QSO 1429-008 und QSO 2345+007. Homogene, isotrope Universen 2 1 Das kosmologische Modell 1.1 Homogene, isotrope Universen: Das Friedmann-Lemaı̂tre-Modell 1.1.1 Grundlagen Die statistische Gravitationslinsentheorie benötigt ein Modell der kosmischen Umgebung, in die der Beobachter, aber auch Quellen und Linsen eingebettet sind. Deswegen wird in diesem Kapitel zunächst der kosmologische Rahmen besprochen werden, soweit er für das folgende notwendig ist. Wo nicht anders angegeben, werden Geschwindigkeiten in Einheiten der Lichtgeschwindigkeit gemessen: c = 1. Das kosmologische Standardmodell beruht auf zwei grundsätzlichen Annahmen: Der einen, daß die Verteilung der Materie um unsere Position herum räumlich isotrop sei und der anderen, daß die Position der Erde im Universum durch nichts ausgezeichnet sei; das ist das kopernikanische oder kosmologische Prinzip. Die Hypothese der Isotropie scheint von vorneherein fragwürdig zu sein, denn offenbar gibt es Stellen am Himmel mit starken Zusammenballungen leuchtender Materie und andere, wo solche Lichtkonzentrationen fast völlig fehlen. Dennoch scheint die Verteilung der Materie auf Skalen, die vergleichbar mit den Abmessungen eines Galaxienhaufens (' 10 Mpc) oder größer sind, keine Richtung zu bevorzugen. Hinzu kommt, daß die leuchtende Materie im Universum nur einen kleinen Bruchteil der gesamten Materie darstellt, daß aber Aussagen über die Verteilung dunkler Materie naturgemäß nur sehr schwer getroffen werden können. Möglicherweise glättet“ diese nichtleuch” tende Substanz die beobachteten Anisotropien. Das entscheidende Argument, an der Hypothese der Isotropie festzuhalten, ist aber die phantastische Richtungsunabhängigkeit der kosmischen Hintergrundstrahlung. Das Spektrum des Mikrowellenhintergrundes entspricht dem eines schwarzen Körpers mit der Temperatur T = 2:7K. Auf der Suche nach Anisotropien dieser Strahlung vergleicht man die Strahlungsströme, die von derselben Antenne von verschiedenen Stellen des Himmels empfangen werden. Bei gegebenem Raumwinkel ist der empfangene Strahlungsstrom proportional zur Energiedichte der Strahlung, die ihrerseits wieder proportional zur vierten Potenz der Schwarzkörpertemperatur ist. Daher kann man Anisotropien des Strahlungsstroms in Form von Anisotropien einer Temperatur ausdrücken. In diesem Sinne werden Anisotropien als relative Fluktuationen der Strahlungstemperatur angegeben. Der Wert von ∆T =T liegt nun laut [41] bei weniger als 4:5 10,5. Akzeptiert man die Isotropie für den irdischen Beobachter, dann verlangt das kopernikanische Prinzip die Isotropie um jeden Punkt der Raumzeit, da ja die Position der Erde auch nicht durch besonders hohe Isotropie in ihrer Umgebung ausgezeichnet sein darf. Jeder Raum, der isotrop um jeden Punkt ist, ist auch homogen [42, S.379]. Damit sind die empirisch maximal vertretbaren Symmetrieforderungen festgelegt. Die Materie im Weltall, allgemein als kosmisches Substrat“ bezeichnet, beschreibt man als ideale, also reibungs” freie Flüssigkeit, die sich den Gesetzen der relativistischen Hydrodynamik entsprechend durch die Raumzeit bewegt. Die Isotropieforderung, präzisiert in Gestalt von Forderungen nach Isotropie der Rotverschiebung, der Materiedichte und des Drucks, schränken die möglichen Bewegungen des Substrats allerdings stark ein: Sie schließen Scherung und Rotation, nicht aber Expansion des kosmischen Substrats aus und legen fest, daß sich die Teilchen des Substrats auf geodätischen Linien bewegen müssen. Aus der Rotationsfreiheit der Vierergeschwindigkeit mitschwimmender Teilchen folgt darüber hinaus, daß es ein Potential gibt, dessen Gradient die Vierergeschwindigkeit ist. Dieses Potential hat die Eigenschaften einer Eigenzeit und wird deswegen als kosmische Zeit t bezeichnet. Sie definiert eine Blätterung der Raumzeit in dreidimensionale Hyperflächen. Abbildungen zwischen zeitlich benachbarten Blättern der Raumzeit sind konform; der Konformfaktor R(t ) hängt nur von der Zeit ab und beschreibt die kosmische Expansion. Die Metrik wird durch folgenden Satz bestimmt: Satz 1 Eine Raumzeit, die den Einsteinschen Feldgleichungen genügt und die ein Beobachterfeld enthält, für das Rotverschiebung, Massenverteilung und Druckverteilung isotrop sind, hat eine Metrik der Robertson-Walker-Form 2 ds = dt 2 , R (t )dσ 2 2 = dt 2 , R (t ) 2 dr2 2 2 + r dΩ 1 , kr2 : Homogene, isotrope Universen 3 Hierin ist dσ2 die Metrik einer dreidimensionalen Hyperfläche mit der radialen Koordinate r und dem Raumwinkel Ω. k ist die konstante Gaußkrümmung der Hyperfläche; sie kann – bei geeigneter Skalierung von r bzw. R – die Werte 1 oder 0 annehmen. Die Skalenfunktion R(t ), oben als Konformfaktor eingeführt, genügt der Friedmann-Gleichung, die sie und ihre Ableitung nach der Zeit mit der Energiedichte ρ des kosmischen Substrats und der kosmologischen Konstante Λ verknüpft: 2 Ṙ 8πG Λ k = ρ+ , 2: R 3 3 R Die Expansion der Materie schließlich wird durch die Adiabatengleichung d d 3 3 (ρR ) + p (R ) = 0 dt dt beschrieben, worin p den Druck bedeutet. Die Adiabatengleichung entspricht dem ersten Hauptsatz der Thermodynamik für ein abgeschlossenes System: Der erste Summand ist die zeitliche Änderung der inneren Energie, während der zweite die Energie beschreibt, die für die zeitliche Änderung des Volumens erforderlich ist. Eine Robertson-Walker-Metrik, die der Friedmann-Gleichung genügt, heißt Friedmann-Lemaı̂tre-Metrik. (Siehe dazu: [42, 39]) 1.1.2 Einige wichtige Zusammenhänge Ein Friedmann-Lemaı̂tre-Modell, das eine wechselwirkungsfreie Mischung aus kalter Materie und heißer Strahlung enthält, wird ebenso wie die kosmische Zeitskala eindeutig durch vier Parameter bestimmt, die bis auf den ersten dimensionslos sind: (i) (ii) Hubble-Konstante: Dichte der kalten Materie: H0 := RṘ0 , 0 ρ ; Ω := 8πG 3H2 0 (iii) Dichte der heißen Strahlung: ω := (iv) kosmologische Konstante: 0 8πG u ; 3H02 0 Λ λ := 3H2 : 0 Die Begriffe kalt“ und heiß“ weisen in diesem Zusammenhang auf Teilchen hin, deren kinetische Energie klein ” ” bzw. groß gegenüber ihrer Ruheenergie ist. Sie werden ausgedrückt durch p = 0 bzw. p = ρ=3. Der Index 0 kennzeichnet das Heute“ des Beobachters; u ist die Energiedichte der Strahlung [13]. ” Ein zur Zeit t < t0 emittiertes Lichtsignal erscheint dem Beobachter um den Betrag z= R0 ,1 R(t ) rotverschoben. Beschränkt man sich auf die Behandlung druckfreier Universen, also solcher, die durch kalte Materie dominiert werden, und nimmt ferner Λ = 0 an, verschwinden wegen u = 3p = 0 die beiden Parameter ω und λ. Aus der Friedmann-Gleichung für den Zeitpunkt t0 wird dann k = R20 H02 (Ω , 1): k nimmt also die Werte +1 oder ,1 für Ω > 1 oder Ω < 1 an und verschwindet für Ω = 1. Für Ω > 1 spricht man deswegen von einem geschlossenen, für Ω < 1 von einem offenen und für Ω = 1 von einem flachen Universum3. Der Wert der Dichte, für den Ω = 1 wird, nämlich ρc = 3H02 ; 8πG heißt kritische Dichte. 3 Das ist die übliche Redeweise. Tatsächlich legt das Vorzeichen von Ω die Topologie noch nicht fest. Der Ansatz von Dyer und Roeder 4 Die druckfreie Gleichung für die Massenerhaltung lautet ρ = ρ0 R0 R 3 = ρ0 (1 + z) 3 ; (1) p während die Friedmann-Gleichung auf Ṙ = R0 H0 1 + Ωz zusammenschrumpft. Das radiale physikalische Wegelement dr prop, das einem Rotverschiebungsintervall dz bei einer Rotverschiebung von z entspricht, lautet dr prop = dt = dR Ṙ = dz p : H0 (1 + z)2 1 + Ωz (2) Diesem Wegelement entspricht das Element des affinen Parameters λ längs Lichtstrahlen dλ = R(t ) dr prop; R0 (3) weil die Bewegungsgleichung für die Koordinate t innerhalb der Robertson-Walker-Metrik fordert, daß dλ proportional zu R(t )dr prop sei; der Proportionalitätsfaktor wird geeignet gewählt. Im folgenden sind Entfernungsmaße und ihre Zusammenhänge mit der Rotverschiebung besonders wichtig. Entfernungsskalen werden in der Kosmologie gewissermaßen entsprechend ihrem Verwendungszweck definiert, weil - anders als im flachen, statischen Raum - kein eindeutiges, bevorzugtes Entfernungsmaß existiert. Für die Geometrie der Gravitationslinsen ist die Winkeldurchmesserdistanz4 D besonders vorteilhaft, deren Quadrat analog zu den euklidischen Verhältnissen als Quotient aus der Fläche A des Objekts und dem Raumwinkel ω, unter dem es erscheint, definiert wird. Wenn r die radiale Koordinate der Quelle und te < t0 der Emissionszeitpunkt des beobachteten Lichtes sind, gilt ω 4π = A 4π[R(te )r]2 Also ist die Winkeldurchmesserdistanz durch r D= A ω = = A(1 + z)2 : 4π(R0 r)2 R0 r 1+z gegeben. Wo nichts anderes angegeben wird, ist von nun an mit Distanz“ immer die Winkeldurchmesserdistanz ” gemeint. 1.2 Der Ansatz von Dyer und Roeder In einem Friedmann-Lemaı̂tre-Universum gibt es streng genommen keine Gravitationslinsen, da homogen verteilte Materie keine Linsenwirkung haben kann. Insofern ist das eben skizzierte Modell ungeeignet für die Gravitationslinsentheorie. Dennoch stellt es einen vorteilhaften Hintergrund für die Linsentheorie dar, da keine geeigneten exakten Lösungen der Einsteinschen Feldgleichungen für inhomogene Universen bekannt sind. Das Schweizer-Käse-Modell“ 5 von Kantowski [23] zum Beispiel ist zwar eine Lösung der Einsteinschen Feld” gleichungen, die Inhomogenitäten der Dichte berücksichtigt. Es erscheint aber aus mehreren Gründen als nicht geeignet für die Gravitationslinsentheorie: 1. Die Löcher im Käse“, die die Inhomogenitäten darstellen, sind sphärisch symmetrisch. Nicht-sphärische Gra” vitationslinsenmodelle können also nicht behandelt werden. 2. Die Materie, die ein Loch vorher ausfüllte, wird sphärisch symmetrisch um dessen Mittelpunkt konzentriert, so daß in dem Bereich zwischen den Rändern von Materiekonzentration und Loch unterdichte Materie vorliegt. 3. Die Wirkung der Inhomogenitäten beschränkt sich auf die Löcher. Lichtstrahlen, die nahe an einem Loch vorbeigehen, spüren nichts von dessen Anwesenheit. Einen gewissermaßen näherungsweisen Ausweg aus dieser Situation bietet der Ansatz von Dyer und Roeder [10, 11]. 4 Der Begriff Winkeldurchmesserdistanz“ ist eine etwas unglückliche Übersetzung des englischen angular diameter distance“. ” ” swiss-cheese model 5 engl. Der Ansatz von Dyer und Roeder 5 1.2.1 Vorbemerkung Man betrachte ein Lichtbündel, das sich durch eine beliebige Raumzeit bewegt. Wie verändert sich seine Querschnittsfläche A bzw. sein Durchmesser mitpfortschreitendem affinem Parameter λ? µ µ Zweifache Differentiation von A nach dem affinen Parameter führt unter Berücksichtigung von dx dλ = k auf die Fokus- Gleichung“ 6, (siehe dazu auch [27, Kapitel 22]): ” p p d2 A 1 1 µ 2 1 µ;ν µ ν = , k k , ( k ) + R k k A µ;ν µν ;µ 2 dλ 2 4 2 =: p p ,(jσj2 + 12 Rµνkµ kν) A: (4) A ist ein Maß für den Durchmesser des Lichtbündels, d.h. diese Gleichung gibt an, wie sich dieser Maßstab längs seiner Ausbreitung verändert. jσj heißt Scherung, der Term 12 Rµν kµ kν Ricci-Fokussierung. Letztere beschreibt die Konvergenz des Lichtbündels durch Materie innerhalb des Bündels, während die Scherung die Deformation durch äußere Materie darstellt. 1.2.2 Die Dyer-Roeder-Differentialgleichung Dyer und Roeder nehmen die Fokus-Gleichung (4) zum Ausgangspunkt folgender Überlegung: Wegen der Eigenschaft des Lichts kµ kµ = 0 reduziert sich der Ricci-Term 12 Rµν kµ kν unter Verwendung der Feldgleichungen auf 4πGTµν kµ kν : (5) Gegeben sei nun ein Friedmann-Lemaı̂tre-Universum, in dem ein Bruchteil δ 2 [0; 1] der Materie in Klumpen“ kon” zentriert wird. Setzt man dementsprechend für Tµν den druckfreien, isotropen Energie-Impuls-Tensor der homogen verteilten Restmaterie ein und geht in ein mit dem kosmischen Substrat bewegtes Koordinatensystem über, bleibt von (5) lediglich7 4πGρ(k0 )2 = 4πGρ(1 + z)2: Mit ρ = (1 , δ)ρ0(1 + z)3 folgt: 1 3 Rµν kµ kν = H02 Ω(1 , δ)(1 + z)5: 2 2 Wenn man nun annimmt, daß das betrachtete Lichtbündel weit entfernt von allen Materieklumpen verläuft, kann man die Scherung in (4) gegenüber dem Ricci-Term vernachlässigen, solange δ nicht zu nahe bei eins liegt. Auf diese Weise erhält man: p p d2 A 3 2 5 = , H0 Ω(1 , δ)(1 + z) A: (6) dλ2 2 Nun führt man statt des affinen Parameters λ die Rotverschiebung z als unabhängige Variable ein. Dieser Schritt beruht auf der Annahme, daß für den Zusammenhang zwischen λ und z derjenige eingesetzt werden darf, den die Friedmann-Lemaı̂tre- Kosmologie erfordert, nämlich Gleichung (3). Das Ergebnis ist dann die Dyer-Roeder-Differentialgleichung [11]: p p p 7 Ω d A d2 A (1 + z)(1 + Ωz) + Ωz + + 3 dz2 2 2 dz = , 32 (1 , δ)Ω p A: (7) Der Ausdruck A ist gemäß p der Definition der Winkeldurchmesserdistanz zu dieser proportional, d.h. man kann in obiger Differentialgleichung A durch D ersetzen. Es ist allerdings sehr bequem, D mit Hilfe der Hubble-Länge H0,1 in ein dimensionsloses Entfernungsmaß ψ umzuwandeln: ψ := H0 D: 6 engl. focussing equation die tatsächlich beobachtete Rotverschiebung. Das Dyer-Roeder-Modell nimmt an, sie sei gleich der mittleren kosmischen Rotverschiebung. 7 z ist hier eigentlich Der Ansatz von Dyer und Roeder 6 Faßt man (7) als Differentialgleichung für ψ auf, liefert sie mit den notwendigen Randbedingungen 1. ψ(z1 ; z2 ) = 0 für z1 = z2 , 2. dψ dz2 z1 =z2 = p1 + Ωz 1 (1 + z1 )2 1 (lokales Hubble-Gesetz) einen Zusammenhang zwischen (dimensionsloser) Winkeldurchmesserdistanz und Rotverschiebung. ψ wurde hier als Funktion zweier Rotverschiebungen aufgefaßt, weil später auch Entfernungen zwischen Linsen und Quellen benötigt werden. Ihre Lösungen sind im allgemeinen hypergeometrische Funktionen. Sie gehen für δ = 0 in die Entfernungen über, die sich aus der Friedmann-Lemaı̂tre-Metrik ergeben 1.2.3 Folgerungen Die Dyer-Roeder-Differentialgleichung liefert also ein durch die Rotverschiebung parametrisiertes Entfernungsmaß aufgrund der näherungsweisen Annahmen, daß (i) das beobachtete Lichtbündel weit entfernt von allen Inhomogenitäten verläuft und (ii) die Friedmann-Lemaı̂tre-Metrik auf großen Skalen weiterhin gilt. Punkt (ii) versteckt sich hinter der Annahme über den Zusammenhang zwischen dem affinen Parameter und der Rotverschiebung, der beim Übergang von (6) nach (7) angewandt wurde, siehe oben. Da die fokussierende Materie im Lichtbündel gegenüber dem reinen Friedmann-Lemaı̂tre-Modell um den Faktor 1 , δ verringert wird, konvergiert es schwächer. Die Dyer-Roeder-Distanz wird also umso größer, je mehr Materie geklumpt auftritt. Definiert man analog zu den Verhältnissen im euklidischen Raum eine Leuchtkraftdistanz DL , deren Quadrat das Verhältnis aus Leuchtkraft zum Strahlungsstrom am Ort des Beobachters ist, ergibt sich DL = (1 + z)2D; vergleiche [42, S.418ff]. Bei gegebener Rotverschiebung sind also Leuchtkraft- und Winkeldurchmesserdistanz zueinander proportional. Das hat zur Folge, daß eine Quelle bei fester Rotverschiebung und mit gegebener Leuchtkraft in einem teilweise geklumpten Universum schwächer erscheint als in einem, dessen Materie homogen verteilt ist, wenn die Sichtlinie hinreichend weit von allen Klumpen entfernt verläuft. In der Nähe von Materieklumpen jedoch erfährt das Lichtbündel eine Verstärkung (siehe [31]). Beide Effekte kompensieren sich gerade so, daß der mittlere Strahlungsfluß erhalten bleibt (vgl. [43]). Das bedeutet, daß durch eine Kugelschale konstanter Rotverschiebung um die Quelle pro Zeit- und Flächeneinheit im Mittel über alle Punkte der Schale dieselbe Energie wie im Friedmann-Lemaı̂treFall fließt, was wegen der Erhaltung der Photonenzahl erforderlich ist. Im folgenden sollen alle Distanzen, die innerhalb eines Friedmann-Lemaı̂tre-Modells gelten, mit dem Index ‘0’ gekennzeichnet werden, während Dyer-Roeder-Distanzen ohne Index bleiben. Ein Lichtbündel, das sich weit entfernt von allen Materieklumpen durch ein Dyer-Roeder-Universum ausgebreitet hat, wird um D20 D2 abgeschwächt. Infolge der Flußerhaltung muß aber dann der mittlere Verstärkungsfaktor hµDR i für Lichtbündel, die durch Gravitationslinsen beeinflußt werden, gleich dem Kehrwert davon sein: 2 hµDR i = DD2 : (8) 0 Auf diese Gleichung wird später noch Bezug zu nehmen sein. Der Ansatz von Dyer und Roeder ist insofern unbefriedigend, als ein klumpiges Universum natürlich nirgendwo streng der Friedmann-Lemaı̂tre-Metrik genügt, trotzdem aber weiterhin von der globalen Gültigkeit dieser Metrik Linsengeometrie und -gleichung 7 ausgegangen wird. Dennoch wird er in der statistischen Gravitationslinsentheorie allgemein angewandt, weil er einfach zu handhaben ist und kein befriedigenderer Ersatz existiert. Die Arbeiten von Futamase [17] und [18] legen außerdem nahe, daß die Beschreibung von Dyer und Roeder durchaus akzeptabel ist. 2 Grundlagen der Gravitationslinsentheorie 2.1 Linsengeometrie, die Linsengleichung 2.1.1 Begriffe Eine Gravitationslinse ist eine Massenverteilung, etwa eine Galaxie, die sich zwischen einer Quelle und einem Beobachter befindet. Da die Dimensionen typischer Galaxien (einige 10 kpc) sehr viel kleiner sind als die charakteristischen Abstände zwischen den beteiligten Objekten (einige 10 Mpc für Galaxien innerhalb eines Haufens), findet die tatsächliche Ablenkung des Lichstrahls nur auf einem sehr kleinen Stück seiner Gesamtlänge statt. Typische Ablenkwinkel liegen außerdem im Bereich von Bogensekunden, sind also sehr klein. Aus beiden Gründen kann der Lichtstrahl durch zwei Geraden angenähert werden, die miteinander das Komplement des Ablenkwinkels einschließen. Die jeweilige Linse wird in dieser Näherung auf eine Ebene, genannt Linsenebene, projiziert, die orthogonal zur Blickrichtung vom Beobachter zum Schwerpunkt der Linse gedacht wird. Diese Blickrichtung, festgelegt durch konstante Winkelkoordinaten in der Friedmann-Lemaı̂tre-Metrik, heißt auch optische Achse. Analog zur Linsenebene konstruiert man die Quellenebene, die ebenfalls orthogonal zur optischen Achse ist und die Quelle enthält. Bei den genannten Ebenen handelt es sich um Tangentialebenen an Blätter der Friedmann-Lemaı̂tre-Raumzeit, die diese Blätter in ihren Schnittpunkten mit der optischen Achse berühren. Da die kosmische Zeit t die Blätter der Raumzeit eindeutig anordnet, kann sie im Prinzip dazu verwendet werden, die Positionen der beiden Ebenen entlang der optischen Achse anzugeben. Statt der kosmischen Zeit verwendet man aber die Rotverschiebung, die in eindeutigem Zusammenhang mit der kosmischen Zeit steht und aus den Spektren von Quelle und Linse bestimmt werden kann. Verkürzt spricht man daher etwa von Quellen bei z = 2“. ” Durch die Ablenkung des Lichts der Quelle in der Linsenebene entsteht für den Beobachter der Eindruck, die Quelle stünde in einem Winkelabstand von der Linse, der der Richtung des Lichtstrahls von der Linsenebene zum Beobachter entspricht. Man nennt deswegen die Linsen- auch Bildebene; siehe dazu auch Abbildung 1. Den Abstand desjenigen Punktes der Linsenebene von der optischen Achse, an dem der Lichtstrahl abgelenkt wird, nennen wir im folgenden Stoßparameter. Schließlich geht man in der Gravitationslinsentheorie davon aus, daß die Näherung geometrischer Optik anwendbar ist, d.h. daß die Welleneigenschaften des Lichtes keine Rolle spielen. Das ist dann der Fall, wenn die auftretenden Wellenlängen klein gegenüber dem Krümmungsradius des Raumes sind. Das ist in allen typischen Situationen ausgezeichnet erfüllt. 2.1.2 Der Ablenkwinkel Der Winkel, um den ein Lichtstrahl beim Passieren einer Masse abgelenkt wird, ist definiert als der Winkel zwischen den Tangentenvektoren an die ein- bzw. auslaufende Nullgeodätische in großer Entfernung von der Masse M. Aus der Schwarzschildmetrik erhält man in genügender Näherung“ ([15]) für den Betrag des Ablenkwinkels ” 4GM α̃ = ; r0 wenn r0 der geringste Abstand zwischen dem Lichtstrahl und dem Massenzentrum ist. Er ist unabhängig von der Frequenz des Lichtes; Gravitationslinsen sind daher achromatisch. Genauer gesagt gilt diese Gleichung in erster Ordnung von 4GM r0 , innerhalb derer r0 auch durch den Stoßparameter b ersetzt werden kann. Solange also b groß gegenüber dem Schwarzschildradius der ablenkenden Masse ist, kann α̃ auf obige Weise ausgedrückt werden. In dieser (linearen) Näherung können auch die durch mehrere Massen hervorgerufenen Ablenkwinkel linear superponiert werden. Dazu ist es jedoch notwendig, den Ablenkwinkel als vektorielle Größe zu betrachten: α̃ = ~ 4GM j~ηl ,~ηmj2 (~ηl ,~ηm); (9) Linsengeometrie und -gleichung 8 wobei ~ηm und ~ηl die Orte der ablenkenden Masse und des Abknickpunktes des Lichtstrahls bezeichnen. Kontinuierliche Masseverteilungen, charakterisiert durch eine Flächenmassendichte Σ(~η), denkt man sich also in einzelne Massenelemente Σ(~η)d 2 η zerlegt, deren Ablenkwinkel gemäß (9) aufintegriert werden: Z Σ(~η)(~ηl ,~η) ~ α̃ = 4G d 2η j~ηl ,~ηj2 : Linse 2.1.3 Die Linsengleichung, vektorielle Schreibweise Zur Ableitung der Linsengleichung führt man sowohl in der Quellen- als auch in der Linsenebene Koordinaten~ζ;~η ein, deren Ursprung der Schnittpunkt der jeweiligen Ebene mit der optischen Achse sei. Weiterhin werden die (Winkeldurchmesser-) Distanzen zwischen Beobachter und Quelle, Beobachter und Linse sowie Linse und Quelle mit Dq ; Dl bzw. Dlq abgekürzt. Aus Abbildung 1 liest man mit Hilfe des Strahlensatzes ab: 6 D(z) opt. Achse Dq E ζ E E EE Eα EE E * η - Quellenebene ~ ~ Dl 0 ~ Linsenebene Beobachterebene Abbildung 1: Zur Herleitung der Linsengleichung: Beobachter, Linsen- und Quellenebene ~ 1 ~ ~ η (ζ + α̃Dlq ) = ; Dq Dl also ζ= ~ Dq ~ η , Dlq~α̃: Dl Das ist bereits die Linsengleichung, die den Bildpunkt ~η mit dem Punkt~ζ in der Quellenebene verknüpft. Sie definiert also eine Abbildung von der Linsen- in die Quellenebene. Bequem ist der Übergang zu dimensionslosen Größen. Legt man eine (zunächst willkürliche, später geeignet zu D wählende) Längenskala η0 in der Linsenebene fest, entsprechend die Längenskala Dq η0 =: ζ0 in der Quellenebene, l Verstärkung, Jacobimatrix 9 und führt dann die Koordinaten η ; η0 ~ x := ~ ζ ζ0 ~ y := ~ ein, wird die Linsengleichung zu y = ~x , ~ Dl Dlq ~ α̃(η0~x): Dq Mit der Definition einer dimensionslosen Flächenmassendichte, 4πGDl Dlq Σ(η0~x) Dq κ(~x) := und α x := ~ (~ ) 1 π Z d 2 x0 κ(~x0 ) x , ~x0 ~ jx , x0j2 ~ Linse ~ (10) (11) folgt daraus schließlich die einfachstmögliche Schreibweise der Linsengleichung: y = ~x , ~α(~x): ~ 2.1.4 Skalare Schreibweise der Linsengleichung Wegen der Identität ∇ ln j~xj = ~ x j~xj2 ~ läßt sich der Ablenkwinkel ~α als Gradient eines Potentials ψ darstellen: α ~ = := ∇ψ(~x) Z 1~ ∇ d 2 x0 κ(~x0 ) ln j~x , ~x0 j: π ~ Linse Ergänzt man ψ(~x) zu einem weiteren, durch ~y parametrisierten Potential φ(~x;~y) in der Art φ(~x;~y) := 1 (~ x ,~y)2 , ψ(~x); 2 (12) kann die Linsengleichung in der Form ∇~x φ(~x;~y) = 0 ~ geschrieben werden; siehe dazu [44] und [32]. Diese Gleichung ist der Ausdruck des Fermatschen Prinzips in der Gravitationslinsentheorie, da die Laufzeit eines virtuellen Lichtstrahls, der den Beobachter sowie die Punkte ~x und ~y miteinander verbindet, eine lineare Funktion von φ(~x;~y) ist. Die Gleichung ~∇φ(~x;~y) = 0 drückt also aus, daß die Laufzeit tatsächlich verwirklichter Lichtstrahlen stationär ist (siehe dazu [32] und [4]). 2.2 Verstärkung, die Jacobimatrix 2.2.1 Der Verstärkungsfaktor Die Abbildung durch eine Gravitationslinse verändert im allgemeinen den Raumwinkel ω, unter dem der Beobachter die Quelle sieht. Sie hat aber auf die Intensität der Strahlung I keinen Einfluß, weil sie Photonen weder vernichtet noch erzeugt. Insgesamt ändert sich damit in der Regel der von der Quelle bzw. von einem ihrer Bilder beobachtete Strahlungsstrom Φ = Iω. Man betrachte eine infinitesimale Quelle, die den Raumwinkel dω ausfüllt. Wenn die Verstärkung, Jacobimatrix 10 Gravitationslinse ein Bild8 erzeugt, das unter dem Raumwinkel dω0 erscheint, wird die Quelle um den frequenzunabhängigen Faktor Φ0 dω0 µ= = Φ dω verstärkt. dω aber ist proportional zu d 2 y, während dω0 mit demselben Proportionalitätsfaktor proportional zu d 2 x ist. Man kann also symbolisch schreiben: d 2~y µ,1 = 2 : d ~x Mit der Jacobimatrix der Linsengleichung, , A = Ai j := erhält man: ∂yi ∂x j µ = (det A),1 : Das Vorzeichen der Jacobideterminante gibt die Parität des entsprechenden Bildes an. Sie ist positiv, wenn die Abbildung den Umlaufsinn der Quelle erhält und negativ, wenn sie ihn umkehrt. Die Menge aller Punkte, auf denen die Jacobideterminante verschwindet, heißt kritische Menge; ist sie einfach zusammenhängend, heißt sie kritische Linie. Das Bild einer kritischen Linie unter der Linsengleichung in die Quellenebene wird Kaustik genannt. Eine Punktquelle, die genau auf einer Kaustik steht, wird um einen formal unendlichen Faktor verstärkt. Dennoch bleiben tatsächlich auftretende Verstärkungsfaktoren endlich, weil sie sich entweder aus der Mittelung über endlich ausgedehnte Quellen ergeben oder weil für ideal punktförmige Quellen die Näherung geometrischer Optik zusammenbricht. Es müssen dann Welleneigenschaften des Lichts berücksichtigt werden, weil das Licht der Quellen fast völlig kohärent beim Beobachter ankommt. 2.2.2 Eigenschaften der Jacobimatrix Wegen der Äquivalenz der Linsengleichung mit ~∇φ = 0 kann die Jacobimatrix A auch in der Form A = (Ai j ) = ∂2 φ ∂xi ∂x j geschrieben werden. Das heißt aber, daß A symmetrisch und damit diagonalisierbar ist. Denkt man sich also das Koordinatensystem in der Linsenebene so gewählt, daß die Jacobimatrix diagonal ist, dann nimmt sie die Form A= λ1 0 0 λ2 an, wobei die beiden Eigenwerte λ1;2 durch λ1;2 = q o 1n 2 ∇ φ (∇2 φ)2 , 4(φ;11 φ;22 , φ2;12 ) 2 gegeben sind. A läßt sich also aufspalten wie folgt A= 1 2 ∇2 φ 0 0 ∇2 φ + ,γ 0 0 γ ; wenn mit γ die Hälfte der Wurzel bezeichnet wird, die in λ auftaucht. Wendet man den Operator ∇2 auf (12) an, erhält man wegen ∇2 ln j~x , ~x0 j = 2πδ(~x , ~x0 ) den Ausdruck ∇2 φ = 2 , 2κ(~x) 8 Bild“ ist hier nicht im üblichen, optischen Sinn gemeint, denn die Bilder einer Gravitationslinse bilden nicht die Konvergenzpunkte der ” Lichtstrahlen. Zwei allgemeine Sätze 11 mit κ aus (10). Damit lautet die Jacobimatrix dann A= 1,κ 0 0 1,κ + ,γ 0 0 γ : Der erste Summand bildet die Basis des Koordinatensystems in der Linsenebene auf eine um den Faktor 1 , κ zentrisch gestreckte Basis in der Quellenebene ab. Deswegen wird κ auch als Konvergenz bezeichnet. Der spurfreie zweite Summand verkürzt die eine Koordinatenrichtung und verlängert die andere um denselben Betrag. Er stellt also die Verzerrung des Bildes dar. γ wird daher als Scherung bezeichnet. Abschließend seien noch zwei Sätze erwähnt, die von großer Bedeutung in der Gravitationslinsentheorie sind: 2.3 Zwei allgemeine Sätze Die direkte Invertierung der Linsengleichung ist in der Regel nicht analytisch möglich. Deswegen sind allgemeingültige Aussagen über die von Gravitationslinsen erzeugten Bilder sehr wichtig. Die beiden bisher bewiesenen Sätze werden hier ohne Beweis erwähnt. Satz 2 (Burke) Eine transparente Massenverteilung erzeugt immer eine ungerade Anzahl (2n + 1) von Bildern, von denen n + 1 von positiver und n von negativer Parität sind. (Siehe Burke 1981, zum Beweis vgl. [4].) Satz 3 (Schneider) Eine transparente, geometrisch dünne Linse erzeugt mindestens ein verstärktes Bild. ([31],[4]) 2.4 Radialsymmetrische Linsen, die isotherme Sphäre 2.4.1 Radialsymmetrische Linsen Ablenkwinkel und Linsengleichung Von besonderem Interesse sind für uns radialsymmetrische Linsen, also solche, die durch eine Flächenmassendichte der Form κ(~x) = κ(j~xj) beschrieben werden können. Diese Schreibweise ist möglich, weil als Ursprung des Koordinatensystems in der Linsenebene das Zentrum der Linse gewählt wurde. Führt man entsprechend der vorgegebenen Symmetrie Polarkoordinaten (x; ϕ) in der Linsenebene ein und dreht, was wegen der Symmetrie ohne Einschränkung der Allgemeinheit geschehen kann, das Koordinatensystem so, daß ~x = (x; 0) geschrieben werden kann, bekommt man durch Einsetzen in Gleichung (11) folgenden Ausdruck für den Ablenkwinkel: αx ~ (~ ) = 1 π Z 0 2π Z ∞ 0 x0 dx0 dϕ0 κ(x0 ) 1 x2 + x02 , 2xx0 cos ϕ0 x , x0 cos ϕ0 ,x0 sin ϕ0 : Die zweite Komponente von ~α verschwindet dann, und für die erste erhält man: Z 2 x 0 0 α1 (x) = x dx κ(x0 ) =: α(x): x 0 In den Ablenkwinkel zum Stoßparameter x geht also nur die dimensionslose Masse ein, die sich innerhalb eines Kreises mit Radius x um das Zentrum der Linse befindet. Demgemäß schreibt man abkürzend: 2 α(x) = m(x): x Weil ~α parallel zu ~x ist, ist auch ~y parallel oder antiparallel zu ~x. Die Linsengleichung läßt sich deswegen als Betragsgleichung in der eindimensionalen Form y = 1 , 2m(x) x x2 (13) Radialsymmetrische Linsen 12 schreiben. Diese Schreibweise ist so gewählt, daß die Bedeutung von x und y als Vektorbeträge erhalten bleibt. Deswegen geht die Information über die Lage der Bilder relativ zur Linsenposition zunächst verloren. Offenbar liegt aber ein Bild relativ zum Zentrum der Linse der Quelle gegenüber, wenn die Relation 2m(x) x2 1 > erfüllt ist. Die Jacobimatrix Allgemein nimmt die Matrix (d~y=d~x) eine besonders einfache Form an, wenn die Vektoren ~y und ~x kollinear sind. Wenn man – was aufgrund der Symmetrie allgemein möglich ist – die Koordinatenachse x2 = 0 parallel zu ~x wählt, läßt sich aus ~ x ~ y = y(x1 ; x2 ) x sofort ableiten: dy y dy 0 dx ; A= det A = 0 yx x dx Im vorliegenden Fall gewinnt man daher aus (13): 1 + mx(2x) , m x(x) 0 ! 0 A= 0 1 , mx(2x) ; (14) wobei der Strich Ableitung nach x bedeutet. Die Abspaltung eines spurfreien Anteils von A führt dann in eindeutiger Weise auf: ! ! 0 m(x) m0 (x) , 0 1 , m2x(x) 0 2 2x x A= + : 0 0 1 , m2x(x) 0 , mx(2x) + m2x0 (x) Daraus liest man für Konvergenz und Scherung die Ausdrücke κ= m0 ; 2x γ= m x2 0 , m2x (15) ab. 2.4.2 Die isotherme Sphäre Das Modell Ein besonders einfaches Galaxienmodell beruht auf folgenden beiden Annahmen: 1. Die Massenverteilung ist sphärisch symmetrisch und 2. sie befindet sich im hydrostatischen Gleichgewicht. Die zweite Annahme findet Ausdruck in den beiden Gleichungen: 1 0 P = g; ρ 1 2 0 (r g) = ,4πGρ; r2 wobei P; ρ und g Druck, Dichte und Schwerebeschleunigung in Abhängigkeit vom Radius r angeben und der Strich Ableitung nach r bezeichnet. Die erste dieser Gleichungen sagt aus, daß der Druckgradient überall der Schwerebeschleunigung die Waage halten muß, während die zweite die kugelsymmetrische Poissongleichung des Gravitationsfeldes ist. Entsprechend einem idealen Gas räumlich konstanter Temperatur setzt man nun den Druck proportional zur Dichte an, P = ρv2 ; wobei die Proportionalitätskonstante das Quadrat der eindimensionalen Geschwindigkeitsdispersion der Sterne der Galaxie ist. Das Modell entspricht insgesamt einer Polytrope mit unendlichem Index. Radialsymmetrische Linsen 13 Setzt man diese Vorgabe für den Druck zusammen mit der Gleichung für dessen Gradienten in die Poissongleichung ein, erhält man eine Differentialgleichung für die Dichte, deren physikalisch sinnvolle Lösung das radiale Dichteprofil v2 ρ= 2πGr2 ist. Es ergibt sich also eine im Zentrum singuläre Massenverteilung. Integration über eine Sichtlinie, die im Abstand η vom Zentrum der Galaxie verläuft, ergibt die projizierte, zweidimensionale Flächenmassendichte Σ(η) = v2 : 2Gη Setzt man einen maximalen (dreidimensionalen) Radius als Radius der Galaxie RG fest, erhält man als Gesamtmasse mG = πv2 RG : G Obwohl diese Massenverteilung, die wegen des Ansatzes für den Druck und der Annahmen über die Symmetrie isotherme Sphäre“ genannt wird, singulär ist, scheint der radiale Dichteverlauf proportional zu r,2 doch ein ” brauchbares Modell für elliptische Galaxien zu sein. (Näheres dazu im nächsten Kapitel) Die Linsengleichung Der Übergang zu dimensionslosen Größen erfolgt wie unter 2.1.3 beschrieben. Die Flächenmassendichte wird nach Gleichung (10) zu κ(x) = 2πDl Dlq v2 : Dq xη0 Legt man die Längenskala η0 auf η0 = 4π Dl Dlq 2 v Dq (16) 1 2x (17) fest, ergibt sich unmittelbar κ(x) = und damit aus Gleichung (11) der Ablenkwinkel αx ~ (~ ) = x ; x ~ α(x) = 1: Die Linsengleichung wird zu y = ~x , ~ oder, in eindimensionaler Schreibweise y = 1 x j~xj ~ (18) , 1x x: (19) Lage der Bilder, Verstärkung Aus Gleichung (19) folgt zunächst (vgl. Abb. 2), daß für y < 1 die beiden Bildpositionen x1;2 = 1 y auftreten, von denen für y > 1 nur das äußere Bild x1 = 1 + y übrigbleibt. Das dem Zentrum der Linse näher stehende Bild x2 liegt relativ zu diesem der Quelle gegenüber. Der Bildabstand ist konstant gleich 2. Das Ergebnis scheint dem Satz von Burke zu widersprechen, der ja aussagt, daß eine ungerade Anzahl von Bildern auftreten muß. Die gerade Anzahl von Bildern im Fall der isothermen Sphäre kommt von deren singulärer Massenverteilung. Sie bewirkt, daß das dritte Bild, das im Zentrum der Linse auftauchen sollte, um einen Faktor Null verstärkt“ wird, weil es infolge der Singularität extrem divergiert. ” Radialsymmetrische Linsen 6y 1 14 y = j1 , 1x jx ,, ,, ,, , @ @ @@ @@,, x - 1 Abbildung 2: Lösungen der Linsengleichung für die isotherme Sphäre; Abszisse: Bildposition x, Ordinate: Quellenposition y Die Scherung ergibt sich aus Gleichung (15), ebenso wie die Konvergenz, zu γ= 1 ; 2x (20) wobei x wie üblich der Stoßparameter ist. Aus der Jacobimatrix, die entsprechend Gleichung (14) für ~x = (x; 0) A= 1 0 0 1 , 1x lautet, folgt für den Betrag des Verstärkungsfaktors in Abhängigkeit vom Stoßparameter µ= x jx , 1 j (21) : Die kritische Linie, bestimmt durch die Gleichung detA = 0, ist ein Kreis mit Radius 1 um das Zentrum der Galaxie. Die Kaustik, also das Bild der kritischen Linie in der Quellenebene, ist der Punkt y = 0. Darin zeigt sich der durch die hohe Symmetrie erzeugte nicht-generische Charakter des Problems. Jede marginale Störung der Symmetrie weitet den Punkt zu einer diamantförmigen Kaustik mit vier Kuspen auf; vgl. dazu [9]. Die Parität eines Bildes ist dann negativ, wenn es innerhalb der kritischen Linie liegt. Für die beiden Bilder einer Quelle am Ort y < 1 gilt µ1;2 = 1 1; y (22) das heißt, die Gesamtverstärkung der Bilder beträgt µ = µ1 + µ2 = 2 : y (23) Für das Verhältnis der beiden Verstärkungsfaktoren und damit der Bildhelligkeiten gilt schließlich: r := µ1 µ2 = 1+y : 1,y Der Verstärkungsfaktor des für y > 1 verbleibenden Bildes ist maximal gleich 2. (24) Leuchtkraftfunktion 15 2.4.3 Eine Skalierungseigenschaft Interessant ist die Frage, wie sich die Bildeigenschaften der isothermen Sphäre ändern, wenn sie in einen Hintergrund eingebettet wird, der durch eine konstante Flächenmassendichte beschrieben wird. Der Gedanke dabei ist, daß Galaxien in aller Regel von Gas bzw. Staub umgeben sind, die etwa einen Galaxienhaufen lokal gleichmäßig anfüllen. Die konstante zusätzliche Flächenmassendichte bewirkt eine zusätzliche Konvergenz κ0 , die eine Änderung der Längenskala der isothermen Sphäre erwarten läßt. Die Linsengleichung kann in der Form y= ~ 1 , κ0 0 0 1 , κ0 x, x ~ jxj ~ ~ geschrieben werden. Daran sieht man, daß sie in die ursprüngliche Form (18) zurückkehrt, wenn man die Koordinaten x0 := (1 , κ0)~x; ~y0 := ~y ~ einführt. Physikalische Längen werden durch diese Skalierung natürlich nicht verändert, deswegen bedeutet dies eine Vergrößerung der Längenskala η0 in der Linsenebene auf η00 = (1 , κ0),1 η0 6 (κ0 = 1); während die Skala in der Quellenebene erhalten bleibt. Der Bildabstand in den gestrichenen Koordinaten ist zwei, in den ungestrichenen Koordinaten erhöht er sich also auf ∆x = 2 1 , κ0 : Die stärkere Konvergenz bewirkt also zunächst eine Aufweitung der Bildgeometrie. Ferner erhält man 0 y dy0 ,1 x0 dx0 = (1 , κ 0 )2 µ ; das heißt, der Verstärkungsfaktor vergrößert sich auf µ= 1 (1 , κ0 )2 0 jx0 x, 1j : Damit lauten also die Verstärkungsfaktoren der beiden Bilder einer isothermen Sphäre µ1 = µ2 = (1 , κ 0 )2 (1 , κ 0 )2 1 1 1+y y 1,y : y Das Helligkeitsverhältnis der Bilder dagegen bleibt erhalten. Eine zusätzliche Flächenmassendichte läßt sich also einfach durch eine Änderung der Längenskala in der Linsenebene, also durch eine Umskalierung der Koordinaten, berücksichtigen. Darauf kommen wir in 5.3 und 6.3 noch zurück. 3 Galaxien aus der Sicht des Beobachters In diesem Kapitel sollen einige Beobachtungsergebnisse zusammengetragen werden, die eine wichtige Grundlage für die Annahmen bilden, die in unser Galaxienmodell eingehen. Wir beschränken uns auf die unmittelbar notwendigen Daten, die in der Regel aus Beobachtungen elliptischer Galaxien gewonnen wurden. Wir werden in den folgenden Kapiteln unser Galaxienmodell diesen Ergebnissen weitgehend anpassen, wobei aber klar ist, daß es nach wie vor der Vielfalt von Galaxientypen nicht Rechnung trägt. Das liegt vor allem daran, daß wir Galaxien im wesentlichen nur durch einen Parameter, nämlich die Geschwindigkeitsdispersion, beschreiben. Damit entfällt die Möglichkeit, beispielsweise Elliptizität oder endliche Kernradien darzustellen. Dieses Kapitel hat daher nur den Zweck, realistische Abschätzungen für bestimmte Parameter und statistische Eigenschaften der Galaxien anzugeben. Geschwindigkeiten werden ausnahmsweise in der Einheit km/s angegeben. Faber-Jackson-Relation 16 3.1 Die Leuchtkraftfunktion von Schechter Die Leuchtkraftfunktion astrophysikalischer Objekte gibt an, wie viele solcher Objekte es pro Volumeneinheit in einem infinitesimalen Leuchtkraftintervall [L; L + dL] gibt. Sie zu bestimmen, erfordert Quellenzählungen ebenso wie Messungen der absoluten Helligkeit. Dazu benötigt man Methoden, extragalaktische Entfernungen zu messen. Allen diesen Methoden liegt die Verwendung geeichter Indikatoren zugrunde. Für vergleichsweise nahe Galaxien (Entfernung einige Mpc) können pulsationsveränderliche Sterne wie etwa Cepheiden oder RR Lyrae-Sterne verwendet werden, deren absolute Helligkeit in bekanntem Zusammenhang mit ihrer Pulsationsperiode steht. Für größere Entfernungen (bis einige 10 Mpc) beobachtet man Objekte wie hellste B-Sterne, Kugelhaufen, HII-Regionen oder Novae, von deren absoluten Helligkeiten angenommen wird, daß sie typisch für die jeweiligen Objekte seien und daß ihre Schwankungsbreite hinreichend klein ist. Aus der Differenz von scheinbarer und absoluter Helligkeit folgt dann sofort die Entfernung. Bei noch weiter entfernten Galaxien müssen dann Eigenschaften der Galaxien selbst herangezogen werden, weil keine einzelnen Entfernungsindikatoren mehr aufgelöst werden können. Wir nehmen im folgenden für die Hubblekonstante den Wert H0 = 50kms,1 Mpc,1 an. Es zeigt sich, daß die Leuchtkraftfunktion für elliptische Galaxien einen deutlichen Knick bei einer Leuchtkraft aufweist, die allgemein mit L bezeichnet wird. Im B-Bereich des Johnsonschen Farbsystems, also bei einer Wellenlänge von 440 nm, beträgt die zugehörige absolute Magnitude MB = ,21:00 0:11 (siehe [24]). Mit der absoluten B-Helligkeit der Sonne von B = 5:4 folgt: LB ' 4 1010L : Schechter [30] nähert die beobachtete Leuchtkraftfunktion für Feld- und Haufengalaxien durch folgenden analytischen Ausdruck an: ν L L Φ(L)dL = Φ exp , dL: (25) L L Der Exponent ν wird von ihm mit ,1:25 angegeben; Kirshner et al. finden ν = ,1:10 0:15. Hier und im folgenden nehmen wir ν = ,1:25 an. Ebenfalls Kirshner et al. geben für die mittlere Leuchtkraftdichte der Galaxien den Wert L ' 108 L Mpc,3 an, der von ihnen selbst als sehr unsicher bezeichnet wird. Integration der Leuchtkraftfunktion über alle Leuchtkräfte ergibt andererseits: Z L = Φ ∞ 0 LΦ(L)dL = Φ L2 Γ(ν + 2): Darin ist Γ die gewöhnliche Gammafunktion. Insgesamt erhält man 1 Φ ' 7 10,14Mpc,3 L, : Damit ist die Leuchtkraftfunktion normiert. Definiert man eine Anzahl N so, als wäre die Leuchtkraft aller Galaxien gleich L , nämlich 3 c N := Φ L ; H0 kommt man mit den genannten Zahlen auf N = 5 108: Das gibt eine Abschätzung der Gesamtzahl der Galaxien in einem Würfel mit der Kantenlänge des Hubble-Radius c=H0 . Radius-Leuchtkraft-Relation 17 3.2 Zusammenhang zwischen Geschwindigkeitsdispersion und Leuchtkraft Geschwindigkeitsdispersionen sind prinzipiell aus der Dopplerverbreiterung galaktischer Spektrallinien bestimmbar. Faber und Jackson [16] führen solche Messungen an 25 elliptischen Galaxien im Spektralbereich von 470 bis 600 nm durch, der zahlreiche kräftige Absorptionslinien enthält, zum Beispiel Hβ, Natrium D, das Magnesium b-Triplett und ein starkes MgH-Band. Sie können auf diese Weise Geschwindigkeitsdispersionen größer als 100 150kms,1 messen, wobei sie eine geschätzte Genauigkeit von 10 15% erreichen. Sie erhalten einen Zusammenhang zwischen der B-Leuchtkraft und der Geschwindigkeitsdispersion der Form LB ∝ v4 : Für Galaxien der Leuchtkraft LB geben Binney und Tremaine [2, S.22] v = 220kms,1 an. Damit erhält man die sogenannte Faber-Jackson-Relation: LB LB = v v 4 : (26) 3.3 Eine Relation zwischen Radius und Leuchtkraft Die Radien von Galaxien sind schwer anzugeben, weil die galaktische Helligkeitsverteilung keinen scharfen Rand besitzt. Man benützt daher z.B. den sogenannten Holmberg-Radius, das ist der Radius der Isophote zur Flächenhelligkeit 26:5mag(arcsec),2 . Etwa so groß ist die geringste verläßlich meßbare Flächenhelligkeit. Ein anderes Maß ist der effektive Radius, das ist der Radius der Isophote zur Hälfte der maximalen Flächenhelligkeit. (Im Gegensatz zum effektiven Radius erfordert der Holmberg-Radius eigentlich eine Korrektur hinsichtlich der Rotverschiebung, was ihn weniger geeignet erscheinen läßt.) Wir werden später einen Zusammenhang der Form R = R L L γ (27) zwischen Radien und Leuchtkräften annehmen. Grossman und Narayan [20] nehmen γ = 1=2 an. R dient später als freier Parameter. 4 Mikrolinsen Die unter 2.4.2 abgeleiteten Eigenschaften der Bilder, die von isothermen Sphären erzeugt werden, treten nur dann auf, wenn die Massenverteilung der Linse als glatt angenommen wird. Das ist eine Idealisierung, die außer acht läßt, daß die Sterne innerhalb realer Galaxien selbst als Linsen wirken. Man spricht von ihnen als von Mikrolinsen, die in die galaktische Makrolinse eingebettet sind. Diese Bezeichnung leitet sich daraus ab, daß der Einsteinradius der Einzelsterne von der Größenordnung 10,6 Bogensekunden ist und damit um sechs Zehnerpotenzen unter demjenigen der gesamten Galaxie liegt. Es handelt sich also um ein typisches Zweiskalen-Problem: Man betrachte einen Ausschnitt der Galaxie, in dem sich die mittlere Materiedichte, die durch das Dichteprofil der Galaxie vorgegeben ist, nur unwesentlich ändert. Dann befindet sich darin bereits eine sehr große Zahl von Mikrolinsen. Der Radius dieses Sternfeldes ist andererseits immer noch sehr klein gegenüber der Skala, auf der sich die Dichte der Galaxie wesentlich ändert, wenn man eine geeignete Zahl und Anzahldichte der Mikrolinsen vorgibt. Das bedeutet, daß im Bereich des Sternfeldes die Eigenschaften der Galaxie auch dann als konstant angenommen werden können, wenn sein Radius groß gegenüber dem Einsteinradius einer typischen Mikrolinse ist. Ein Lichtstrahl, der die Galaxie bei einem Stoßparameter x passiert, wird nicht mehr wie bei der glatten isothermen Sphäre um einen eindeutig von x abhängenden Faktor µ(x) verstärkt. Vielmehr hängt seine Verstärkung empfindlich davon ab, wie stark er von den Mikrolinsen beeinflußt wird, deren räumliche Verteilung als zufällig angenommen wird. Das Feld zufällig verteilter Sterne 18 Es gibt dann einen weiten Bereich möglicher Verstärkungsfaktoren, die mit bestimmten Wahrscheinlichkeiten eintreten. Um also die Auswirkung von Mikrolinsen auf die Eigenschaften der Bilder zu ermitteln, benötigt man eine Wahrscheinlichkeitsverteilung für Verstärkungsfaktoren. Sie soll in mehreren Schritten in diesem Kapitel entwickelt werden. Mit µ ist hier ausnahmsweise nicht der Betrag des Verstärkungsfaktors gemeint, sondern das Produkt aus ihm und der Parität. 4.1 Das Feld zufällig verteilter Sterne 4.1.1 Das Modell Der Prototyp eines aus Mikrolinsen zusammengesetzten Teils einer Makrolinse ist das Feld zufällig verteilterp Sterne. Seien also N Sterne gegeben, deren Anzahldichte n sei. Das entspricht einem Radius des Sternfeldes von R = N=nπ . Führt man entsprechend der Vorgehensweise unter 2.1.3 dimensionslose Grösen ein, kann der Ausdruck nπ völlig analog zu (10) als κ geschrieben werden. Für den dimensionslosen Radius des Sternfeldes behalten wir die Bezeichnung R bei, weil der dimensionsbehaftete Radius im folgenden nicht mehr auftritt. Geht man nun zunächst davon aus, daß alle diese N Sterne gleiche Masse M haben, lautet die Linsengleichung ζ= ~ N ~ Dq η ,~ηi ~ η , Dlq 4GM ∑ ; ~ ~ i 2 Dl i=1 jη , η j wenn i die Nummer jedes Sterns ist. Führt man als Längenskala η0 den Ausdruck s η0 = ein, wird diese Gleichung zu: Dlq Dl Dq (28) x ,~xi : x ,~xi j2 i=1 j~ (29) 4GM N y = ~x , ∑ ~ ~ Im Zentrum des Sternfeldes, also bei ~x = 0, erhält man als Jacobimatrix A= d~y d~x = I+ S1 S2 S2 ,S1 ; wobei nach der Einführung von Polarkoordinaten (xi ; ϕi ) die Matrixelemente S j lauten: N cos 2ϕi ; i 2 i=1 (x ) S1 = ∑ N sin 2ϕi : i 2 i=1 (x ) S2 = ∑ (30) Der von der Einheitsmatrix abweichende Summand von A ist spurfrei und symmetrisch, entspricht also einer Scherung. Er beschreibt die Verzerrung, die ein Lichtstrahl durch das Sternfeld erfährt. Ein Konvergenzterm taucht in A deswegen nicht auf, weil sämtliche Sterne des Sternfeldes eine Menge vom Maß Null überdecken und deswegen praktisch kein Lichtstrahl direkt auf Materie trifft.9 Aus der Jacobimatrix erhält man den Verstärkungsfaktor µ = (det A),1 = 1 ; 1 , S2 wenn S2 := S21 + S22 definiert wird. Die Frage ist nun, wie groß die Wahrscheinlichkeit dafür ist, daß ein Lichtstrahl, der das Sternfeld passiert, eine Verstärkung aus dem Intervall [µ; µ + dµ] erfährt. Zur Ableitung der zugrundeliegenden Wahrscheinlichkeitsverteilung eignet sich Markovs Methode der charakteristischen Funktion. 9 Der Lichtstrahl sieht“ die Materie nicht, und wenn er sie sähe, sähen wir ihn nicht mehr, weil er extrem divergierte. ” Das Feld zufällig verteilter Sterne 19 4.1.2 Markovs Methode; Anwendung auf den vorliegenden Fall Markovs Methode beruht auf der Einführung der charakteristischen Funktion, aus der die gesuchte Wahrscheinlichkeitsverteilung durch Fourierinversion folgt. Das entscheidende ist, daß die charakteristische Funktion auf einem unabhängigen Weg bestimmt werden kann. (Vergleiche zum folgenden die Arbeit [35] und den Anhang zu [37].) Sei die Wahrscheinlichkeitsverteilung für eine skalare oder vektorielle, allgemein n-dimensionale Größe g gesucht, die sich linear aus den Beiträgen der einzelnen Sterne zusammensetzt: N g = ∑ gi : i=1 Ferner seien alle gi gleiche Funktionen der Koordinaten ~xi des i, ten Sterns. Dann führt man die charakteristische Funktion Z C(h) := d n g p(g)eigh ein, deren Argument h 2 IRn sei. Wegen der statistischen Unabhängigkeit der Sternpositionen untereinander und der linearen Superposition der Einzelbeiträge gi zu g kann man die charakteristische Funktion auch mit Hilfe der Wahrscheinlichkeitsverteilung für die Sternkoordinaten p(~xi ) berechnen: Z C(h) = d 2 xi p(~xi ) exp(igi (~xi ) h) N : Da es sich um ein Feld zufällig verteilter Sterne handeln soll, sind die Positionen ~xi gleichverteilt. Also ist p(~xi ) = 1 : πR2 Die charakteristische Funktion lautet dann C(h) = 1 πR2 Z d 2 xi exp(igi (~xi ) h) N ; und man erhält die Wahrscheinlichkeitsverteilung p(g) gemäß Z 1 p(g) = d n h C(h)e,igh : (2π)n Der erste Schritt bei der Anwendung dieser Methode auf unser Problem ist die Feststellung, daß die Verstärkung eine Funktion der Scherung ~S ist. Kennte man die Wahrscheinlichkeitsverteilung für die Komponenten der Scherung, ließe sich aus ihr die Wahrscheinlichkeitsverteilung für die Verstärkung berechnen, denn: Sei ν 2 IR und Z Z heiνµi = C1 := dS1dS2 p(S1; S2 ) exp(iνµ(S1 ; S2 )) (31) Dann gilt auch, weil es sich um denselben Mittelwert handelt, Z heiνµ i = dµ p(µ)eiνµ: Fourierinversion dieser Gleichung und Einsetzen der rechten Seite von (31) anstelle von hexp(iνµ)i führt mit Hilfe der Identität Z 1 dν exp[iν(µ , µ(S1 ; S2 ))] = δ(µ , µ(S1; S2 )) 2π direkt auf Z Z p(µ) = dS1 dS2 p(S1 ; S2 )δ(µ , µ(S1; S2 )) (32) Es muß also p(S1 ; S2 ) bestimmt werden. Für ~S gilt aber das Superpositionsprinzip N S = ∑ ~Si ; ~ i=1 Das Feld zufällig verteilter Sterne 20 wobei die ~Si Funktionen der Sternkoordinaten ~xi sind. Wir führen also mit der Hilfsvariablen ~T eine weitere charakteristische Funktion C2 ein: Z Z ~~ dS1 dS2 p(S1 ; S2 )eiT S : C2 (~T ) = Sie kann geschrieben werden als: C2 (~T ) = 1 πR2 Z Z N xi dϕi dxi exp(i~T ~S(~xi )) ; und man gewinnt daraus die Wahrscheinlichkeitsverteilung für die Scherung Z Z 1 ~~ dT1 dT2 C2 (~T )e,iT S : p(S1 ; S2 ) = (2π)2 Diese Rechnungen werden im Anhang A ausgeführt. Sie ergeben zunächst p(S1 ; S2 ) = 1 κ : 2 2π [(κ ) + S2]3=2 (33) Damit und mit den Gleichungen (31) und (32) folgt endlich p(µ) = 8 < : κ h 2µ2 (κ )2 +1, µ1 i3=2 0 für µ 2 IRn[0; 1) µ 2 [0; 1) für Verstärkungsfaktoren zwischen 0 und 1 können also nicht auftreten. Das Ergebnis ist unabhängig von der Masse der Sterne.10 Erweiterung der Ergebnisse Das eben betrachtete Sternfeld existiert nicht isoliert, sondern ist Teil eines größeren Systems, im Allgemeinen einer Galaxie. Diese erzeugt am Ort des Sternfeldes eine äußere Scherung und unterlegt ihm eine zusätzliche Konvergenz. Beide sollen jetzt verallgemeinernd berücksichtigt werden. Konvergenz κ und Scherung γ erweitern die Jacobimatrix des Sternfeldes zu A= 1,κ+γ 0 0 1,κ,γ S1 S2 + S2 ,S1 : Sie ergibt einen Verstärkungsfaktor von µ = (detA),1 = h (1 , κ)2 , γ2 , S2 , 2γS1 i,1 : Führt man die Hilfskoordinaten x := S1 + γ; y := S2 ein und nennt x2 + y2 =: r2 bzw. arctan (y=x) =: ϕ, dann vereinfacht sich die obige Gleichung zu µ= h (1 , κ)2 , r2 i,1 : Drückt man in der Wahrscheinlichkeitsverteilung (33) auch S2 durch r und ϕ aus und integriert analog zu (32), aber nicht über S1 ; S2 , sondern über r und ϕ, erhält man sehr rasch das Ergebnis p(µ) = Dabei wurden die Abkürzungen 10 Das 8 < κ : πµ2 (u 1p ,v) q E u+v 0 2v u+v für µ 2 IRn[0; (1 , κ),2) für µ 2 [0; (1 , κ),2) 1 u := (1 , κ)2 + κ2 + γ2 , ; µ Ergebnis gilt auch dann, wenn man ein Massenspektrum der Sterne zuläßt. (34) Sternfeld innerhalb isothermer Sphäre 21 s v := 2γ (1 , κ)2 , µ1 benutzt. E ist das vollständige elliptische Integral zweiter Gattung. Insgesamt wurde also in 4.1.2 die Wahrscheinlichkeitsverteilung dafür berechnet, daß ein Lichtstrahl, besser gesagt ein infinitesimal dünnes Lichtbündel, um einen Faktor aus dem Intervall [µ; µ + dµ] verstärkt wird, wenn es ein Feld zufällig verteilter Sterne passiert, das äußerer Scherung und zusätzlicher Konvergenz unterliegt. Die Situation ist grundlegend, denn sie beruht auf der Vorstellung, daß ein Lichtstrahl eine Galaxie durchquert. Die Umgebung seines Durchstoßpunktes“ kann als zufälliges Sternfeld konstanter Dichte angesehen werden, wo” gegen die gesamte Galaxie Scherung und Konvergenz erzeugt. Während der Herleitung von p(µ) wurde zwar an einer Stelle der Grenzwert für unendlichen Radius gebildet; vgl. Anhang A.1. Also ist das erhaltene Ergebnis nur für große Radien des Sternfeldes gültig. Nach den einleitenden Bemerkungen über die zwei Skalen, die in diesem Zusammenhang eine Rolle spielen, nämlich den Einsteinradius einer typischen Mikrolinse und den Radius der Galaxie, bedeutet das aber keine Einschränkung. 4.1.3 Skalierung des Sternfeldes Ähnlich wie die Linsengleichung der isothermen Sphäre erlaubt auch diejenige des Feldes zufällig verteilter Sterne, eine zusätzliche, konstante Flächenmassendichte κ0 durch eine Umskalierung der Koordinaten zu berücksichtigen. In Anwesenheit von κ0 , einer Konvergenz κ und einer Scherung γ wird aus Gleichung (29): 1 , κ0 , κ + γ 0 0 1 , κ0 , κ , γ y= ~ x ,~xi : x ,~xi j2 i=1 j~ N x, ∑ ~ ~ Sie geht in die Form (29) zurück, wenn man die neuen Koordinaten x0 := ~ p 1 , κ0~x ; ~y0 := p1 1, κ y ~ 0 6 (κ0 = 1) einführt. Damit verändert sich die Längenskala in der Linsenebene zu η00 = p1 1, κ η0 ; 0 während der Verstärkungsfaktor auf das (1 , κ0 ),2 -fache anwächst. Konvergenz und Scherung werden umskaliert zu κ γ κ̃ = ; γ̃ = : (35) 1 , κ0 1 , κ0 Mit der genannten Skalierung der Koordinaten wird die Linsengleichung der isothermen Sphäre (19) zu p1 , κ x0 0 0 y = 1 , : x0 1 , κ0 Der Bildabstand wird daher zu ∆x0 = p1 2, κ ; 0 in ungestrichenen Koordinaten also zu ∆x = 2 1 , κ0 : 4.2 Sternfeld als Teil einer isothermen Sphäre Wir legen jetzt das im folgenden verwendete Galaxienmodell endgültig fest. Das Dichteprofil entspreche dem einer isothermen Sphäre. Weiterhin soll ein Bruchteil ε 2 [0; 1] der galaktischen Masse in Sternen konzentriert sein, während der Rest aus glatter, kontinuierlich verteilter Materie wie z.B. Gas oder Staub bestehe. Der Parameter ε ist also ein Maß für die Klumpigkeit“ der Materie innerhalb der Galaxie. ” Sternfeld innerhalb isothermer Sphäre 22 Die Konvergenz geht nach (20) aus 2.4.2 auf den Wert 1,ε 2x κk = zurück, wobei der Index ‘k’ für ‘kontinuierlich’ steht. Die Scherung, ebenfalls in 2.4.2 durch (20) gegeben, bleibt von der Aufteilung der Materie unbeeinflußt, weil zu ihr die gesamte Masse beiträgt. Die dimensionslose Massendichte eines Sternfeldes innerhalb der Galaxie beträgt κ = ε ; 2x weil der nicht kontinuierlich verteilte Anteil von κ = 1=2x in Sternen konzentriert sein muß. 4.2.1 Verstärkungswahrscheinlichkeit für helle Bilder Das Ergebnis (34) aus 4.1.2 gilt für infinitesimal dünne Lichtbündel, nicht aber für die Makrobilder einer Quelle, weil solche wegen möglicher Mehrfachabbildung auf unkontrollierbare Art aus Lichtstrahlen zusammengesetzt sind. Aber man kann dann folgende Abschätzung durchführen: Zunächst muß wegen der Flußerhaltung der mittlere Verstärkungsfaktor eines Makrobildes, das in einem Abstand x vom Zentrum der Galaxie entsteht, gleich hµi = jx ,x 1j sein, vgl. (21) aus 2.4.2. Die Mittelbildung ist hier so zu verstehen: Man schickt ein Ensemble von Lichtbündeln durch die Galaxie, die alle in derselben Entfernung vom Galaxienzentrum verlaufen, und mittelt die einzelnen Verstärkungsfaktoren über das Ensemble. Hohe Verstärkungsfaktoren treten dann auf, wenn die Quelle sehr dicht bei einer Mikrokaustik des Sternfeldes steht. Es entstehen dann zwei Bilder beiderseits der zugehörigen kritischen Linie, die etwa um den gleichen Faktor verstärkt sind11. Die Gesamtverstärkung aller Mikrobilder wird dann von der Verstärkung dieser beiden dominiert. Also kann in diesem Zusammenhang der Gesamtfluß des hier betrachteten Makrobildes der Quelle näherungsweise durch den der beiden stark verstärkten Mikrobilder ersetzt werden. Wenn man nun einen im Vergleich zur gesamten Linse kleinen Ausschnitt der dimensionslosen Fläche Ax in der Linsenebene betrachtet, dann wird ein Lichtstrahl um einen Faktor aus [µ; µ + dµ] verstärkt, wenn er ein Flächenelement dax = Ax p(µ)dµ aus Ax durchläuft. Die Fläche Ax wird gemäß der Definition der Verstärkungsfaktoren auf die Fläche Ay = 1 hµi Ax in der Quellenebene abgebildet, während dax auf die Fläche day = 1 dax µ abgebildet wird. Die Wahrscheinlichkeit, daß ein Mikrobild einer Quelle um [µ; µ + dµ] verstärkt wird, ist also day Ay = hµi dax = hµi p(µ)dµ µ Ax µ : Da aber eine stark verstärkte Quelle zwei dominierende Mikrobilder hat, ist ihre Gesamtverstärkung µg Wahrscheinlichkeit für eine Gesamtverstärkung aus [µg ; µg + dµg] ist also pg (µg )dµg = 11 Siehe dazu Anhang A.3. 2hµi µg µg p d : µg 2 2 = 2µ. Die Sternfeld innerhalb isothermer Sphäre 23 Von der Quelle wurde angenommen, daß sie sich nahe einer Mikrokaustik befinde. Auf der Mikrokaustik selbst wird µ unendlich. Nähert man dementsprechend p(µ) aus (34) in 4.1.2, gilt bis zur führenden Ordnung in 1=µ: p(µ) = mit der Konstanten K K= K ; µ2 r κ 1 p E π (u0 , v0 ) u0 + v0 2v0 u0 + v0 1 µ =0 die Striche an u und v geben an, daß in den vorigen Definitionen ! ; gesetzt wird. Demnach: u0 = (1 , κk )2 + κ2 + γ2 ; v0 = 2γj1 , κk j: Für pg ergibt sich damit: pg (µg )dµg = 4hµiK dµg : µ3g Das Ergebnis ist also, daß sich die Wahrscheinlichkeitsverteilung für die Verstärkungsfaktoren heller Bilder der Quelle dem Ausdruck C ; µ3g C := 4hµiK, für große µg asymptotisch annähern muß. Dieses Ergebnis kann auch auf allgemeinere Weise abgeleitet werden. Sei eine kritische Linie parametrisiert durch ~x(λ). Eine Quelle, die nahe an der zugehörigen Kaustik steht, hat zwei Bilder im Abstand dx beiderseits der kritischen Linie. Auf dieser selbst verschwindet die Determinante der Jacobimatrix, d.h. der Betrag des Verstärkungsfaktors der Bilder ist 1 µ= j∇ det Ajdx : Innerhalb eines Streifens der Breite dx beiderseits der kritischen Linie ist der Verstärkungsfaktor größer als µ. Er hat die Fläche I 1 K0 ax (µ) = dλ =: j∇ det A(~x(λ))jµ µ : Ein Gesamtverstärkungsfaktor zwischen µg und µg + dµg tritt also innerhalb der Fläche 0 dax (µ) dµ = 2K dµg dµ µ2 g auf. Sie wird auf day (µ) = 2 2K0 C dµg =: 3 2 µg µg µg in der Quellenebene abgebildet. Normiert man day , entspricht es der Wahrscheinlichkeit, daß ein Makrobild einer Quelle um einen Faktor aus [µg ; µg + dµg ] verstärkt wird, d.h. die Wahrscheinlichkeitsverteilung ist proportional zu 3 µ, g für große µg . Im folgenden wird nur noch von Gesamtverstärkungen die Rede sein, weswegen der Index ‘g’ wieder wegfallen kann. Sternfeld innerhalb isothermer Sphäre 24 4.2.2 Weitere Eigenschaften Das obige Resultat, daß die Wahrscheinlichkeitsverteilung für die Verstärkungsfaktoren der Bilder einer Punktquelle für ε 6= 0 asymptotisch wie µ,3 abfallen muß, ist unabhängig von der Aufteilung der galaktischen Materie in Sterne und Gas. Da aber eine Galaxie, die nur aus glatt verteilter Materie besteht, eindeutig vom Ort x abhängende Verstärkungsfaktoren liefert, muß die Wahrscheinlichkeitsverteilung für ε ! 0 gegen eine δ, Distribution konvergieren, deren Singularität bei hµi = jx ,x 1j liegt. Weiterhin muß die Wahrscheinlichkeitsverteilung normiert sein und den von der Flußerhaltung geforderten Mittelwert hµi korrekt liefern. Wenn µ gegen das Minimum seines Definitionsbereiches geht, erwartet man, daß p(µ) verschwindet. Das ergibt sich aus numerischen Rechnungen; siehe die Arbeit von Schneider und Weiß [38]. Der untere Rand des Definitionsbereiches selbst ist keineswegs von vorneherein klar. So verlangt der Satz von Schneider nur, daß eines der Mikrobilder positiver Parität einen Verstärkungsfaktor größer oder gleich eins haben muß. Das gilt dann natürlich auch für das Makrobild, von dem das Mikrobild ein Teil ist. Über den Verstärkungsfaktor des anderen Makrobildes, das für y < 1 auftritt, ist damit aber noch nichts gesagt. Wir nehmen deshalb als kleinstmöglichen Wert von µ an: min(µ) =: µ ; dieser Parameter wird später genauer festgelegt. Insgesamt muß die Wahrscheinlichkeitsverteilung also folgende Eigenschaften erfüllen: R∞ p(µ)dµ = 1; (i) Normierung: Rµ∞ (ii) Flußerhaltung: µp (µ)dµ = hµi; µ (iii) Asymptote: p(µ) ! µC3 (µ ! ∞); (iv) Verhalten für kleine µ: p(µ) ! 0 (µ ! µ ); (v) Konvergenz: p(µ) ! δ(µ ,hµi) (ε ! 0). 4.2.3 Ein konkretes Modell Eine Wahrscheinlichkeitsverteilung, die diesen Bedingungen genügt, soll nun konstruiert werden. Der Forderung nach dem asymptotischem Verhalten (iii) trägt man am besten dadurch Rechnung, daß man zu einem Term, der in seinem Verhalten durch einen zu µ,3 proportionalen Abfall bestimmt ist, einen schneller abfallenden Term addiert. Schneller als jede Potenz fällt aber die Exponentialfunktion ab, weshalb wir uns für diese entscheiden. Prinzipiell käme natürlich auch jede höhere als die dritte Potenz von µ in Frage; die abfallende Exponentialfunktion erscheint aber demgegenüber als die am wenigsten willkürliche Wahl. Der Forderung (iv) tragen wir dadurch Rechnung, daß jeder der beiden Summanden mit einer noch zu bestimmenden Potenz von (µ , µ ) multipliziert wird. Bedingungen (i) und (ii) verlangen, daß die zu wählende Funktion zwei freie Parameter enthält, die aus (i) und (ii) zu bestimmen sind. Nach alldem erscheint folgende Wahl zweckmäßig: p(µ)dµ = 4Khµi(µ , µ )α µα+3 + A(µ , µ ) β exp(,Bµ) dµ H(µ , µ ); (36) wobei H für die Heavisidefunktion steht. Sie erfüllt die bisher besprochenen Voraussetzungen; die Konvergenz gegen eine δ, Distribution für ε ! 0 wird noch zu prüfen sein. Aus (i) und (ii) erhält man folgende Ausdrücke für A und B: B = β+1 f 2 hµi(1 + α)(2 + α) , 4K ; f hµi(α + 1) f (1 , f )hµi(2 + α) , 4K A = K ist bereits bekannt; f ist der Quotient 1, 4K 2 f hµi(1 + α)(2 + α) µ hµi : Bβ+1 Bµ e : Γ(β + 1) Sternfeld innerhalb isothermer Sphäre 25 A; B und C hängen noch vom Ort x innerhalb der Galaxie ab; diese Abhängigkeit wurde in den vorstehenden Gleichungen unterdrückt, muß aber später wieder berücksichtigt werden. Allerdings ist noch zu prüfen, ob B, in dessen Nenner eine Summe steht, im gesamten Definitionsbereich von x und auch für alle α und β wohldefiniert bleibt. Es stellt sich in der Tat heraus, daß der Nenner des zweiten Faktors in B für manche Werte von ε und α Nullstellen hat. Wir vermeiden sie durch geeignete Wahl von α, wie, wird weiter unten beschrieben. Auch A enthält eine Summe, die nicht negativ werden darf. Wenn jedoch B wohldefiniert ist, bleibt auch A positiv.12 Natürlich haftet dieser Wahl eine gewisse Willkür an, obwohl die Bedingungen (i) bis (v) die Form der Wahrscheinlichkeitsverteilung bereits sehr weitgehend festlegen. Es zeigt sich aber, daß die Wirkungsquerschnitte, zu deren Berechnung p(µ) dient, bemerkenswert unempfindlich gegen Veränderungen an der Wahrscheinlichkeitsverteilung sind. Ein Beispiel dafür wird in 5.2.5 gezeigt werden. Wahl der Parameter für y < 1 Wir nehmen Zunächst muß der untere Rand des Definitionsbereiches von µ festgelegt werden. 2,ε hµi 2 an, da für ε ! 0 wegen der Forderung (v) aus 4.2.2 µ gegen hµi gehen muß. Damit ist ε f = 1, : 2 Um die Nullstellen im Nenner von B aufzuheben, legen wir α so fest, daß für alle x die Bedingung µ = hµi f (1 , f )(2 + α) , 4K > 0 erfüllt ist. Numerisch stellt sich heraus, daß die Funktion 4K hµi Maxima hat, deren größtes für ε ! 0 im Bereich x 2 [0; 2] auf etwa 1:5 anwächst. Als sichere Bedingung wählen wir daher in diesem Intervall: f (1 , f )(2 + α) = 2; also mit f =1 ,ε = 2: , 2 > 1: 2ε , ε2 A und B sind gegen Veränderungen von β völlig unempfindlich. Wir setzen deswegen β = 1 fest. α= 8 Wahl der Parameter für y > 1 Der äußere Bereich der Galaxie erzeugt nur das Bild an der Position x = 1 + y. Dessen Verstärkungswahrscheinlichkeit wird ebenso durch eine Verteilungsfunktion der genannten Form beschrieben, jedoch gelten für die Parameter α; β und µ andere Bedingungen. Zunächst ist die Forderung, daß der Parameter B im gesamten Definitionsbereich von x wohldefiniert sein muß, für x > 2 bereits mit α = 1 erfüllt. Es genügt also, α = 1 = β zu setzen. Ferner muß die minimale Verstärkung des verbliebenen Bildes nach dem Satz von Schneider größer oder gleich eins sein. Wegen hµi 2 [1; 2] für x 2 [2; ∞)wird diese Bedingung zusammen mit der Forderung µ ! hµi (ε ! 0) durch die Wahl µ = 1 , ε 1 , 1 hµi hµi erfüllt. Damit ist eine Wahrscheinlichkeitsverteilung für Verstärkungsfaktoren vollständig festgelegt. Zur Verdeutlichung ihrer Eigenschaften dient die Abbildung 3: Sie zeigt p(µ) für x = 1:5 und ε 2 f0:2; 0:4; 0:6; 0:8; 1:0g und veranschaulicht die Konvergenz gegen eine δ, Distribution mit der Singularität an der Stelle hµ(x = 1:5)i = 3 . Die unterschiedlichen Parameter für y < 1 und y > 1 bewirken eine Unstetigkeit in der Wahrscheinlichkeitsverteilung in dem Sinne, daß sich verschiedene Funktionen ergeben, wenn sich x entweder von rechts oder von links der Stelle x = 2 nähert. Da die Wirkungsquerschnitte aber, wie erwähnt, nur schwach auf Veränderungen der Wahrscheinlichkeitsverteilung reagieren, ist diese Unstetigkeit nicht von Bedeutung. 12 Vgl. auch Anhang A.2. Sternfeld innerhalb isothermer Sphäre 26 Abbildung 3: Wahrscheinlichkeitsverteilung für x = 1:5 und ε 2 f0:2; 0:4; 0:6; 0:8; 1:0g Konvergenz gegen eine δ, Distribution Zu untersuchen bleibt die Frage, ob p(µ) gegen δ(µ ,hµi) konvergiert, wenn ε verschwindet. Für kleine ε ist K proportional zu ε. Linearisiert man auch B und A in ε, kann man mit Konstanten K1 ; K2 2 IR+ schreiben: K K A = 21 ; B = 2 : ε ε Ferner kann µ , µ zerlegt werden in µ , hµi + εz =: ∆ + εz, worin z eine positive Größe ist. Der rein gebrochen rationale Anteil von p(µ) wird gegenüber dem exponentiell abfallenden vernachlässigbar. Damit gewinnt die Wahrscheinlichkeitsverteilung die Form: p(µ) ! lim ε!0 , Kε2 (∆ + εz) K1 (∆ + εz) exp ε2 H(µ , µ): Der Grenzwert der Exponentialfunktion kann in der Form lim lim 1 , ε!0 n!∞ K2 (∆ + εz) εn n geschrieben werden. Wir wählen nun ε so, daß n = 1=ε wird. Dann wird der obige Grenzwert zu lim [1 , K2(∆ + εz)]1=ε ; ε!0 die Wahrscheinlichkeitsverteilung also zu lim ε!0 K1 1=ε (∆ + εz)[1 , K2 (∆ + εz)] H(∆ + εz): ε2 Definition 27 Für ∆ 6= 0 verschwindet dieser Grenzwert, weil der Ausdruck in eckigen Klammern stets kleiner als 1 bleibt. Für ∆ = 0 dagegen gilt: lim [1 , K2(∆ + εz)]1=ε = exp(,K2 z) > 0; ε!0 also divergiert die Wahrscheinlichkeitsverteilung im Grenzwert ε ! 0. Zusammengefaßt gilt also lim p(µ) = ε!0 0 µ 6= hµi ∞ µ = hµi: Zusammen mit der Normierung von p(µ) folgt daraus, daß die Wahrscheinlichkeitsverteilung im Grenzfall glatter Galaxien gegen die δ, Distribution δ(µ ,hµi) konvergiert. 5 Wirkungsquerschnitte 5.1 Definition Ziel der Aufgabenstellung ist es, die Wahrscheinlichkeit zu ermitteln, mit der weit entfernte Punktquellen doppelt abgebildet werden, wobei die beiden Bilder bestimmte Eigenschaften zeigen sollen. Zur Beantwortung dieser Frage ist das Konzept der Wirkungsquerschnitte äußerst nützlich. Wir beginnen mit einer Definition. Unter dem Wirkungsquerschnitt einer Linse für eine bestimmte Bildeigenschaft versteht man den Inhalt derjenigen Fläche in der Quellenebene, innerhalb derer eine Quelle in der gewünschten Weise abgebildet wird. Wir werden in der Regel dimensionslose Wirkungsquerschnitte betrachten. Zunächst ein Beispiel dazu. Betrachtet man isotherme Sphären als Linsen, dann ist die Bedingung dafür, daß eine Quelle doppelt abgebildet wird: Ihr Abstand von der optischen Achse darf nicht größer als eins werden; y 1. Die zugehörige Fläche und damit der Wikungsquerschnitt der Galaxie für doppelte Abbildung ist also gleich π. 5.2 Wirkungsquerschnitte für klumpige isotherme Sphären 5.2.1 Bildeigenschaften Die Bedingungen, die wir an die Abbildung stellen, sind von der Beobachtung abhängig. Einerseits sollen die Objekte doppelt abgebildet werden, damit die Linsenwirkung zumindest prinzipiell erkennbar ist. Wegen des endlichen Auflösungsvermögens des Teleskops dürfen die Bilder nicht enger als ein bestimmter Winkel ϑ beieinander stehen. Schließlich darf der Helligkeitsunterschied der Bilder nicht zu groß sein, weil anderenfalls das schwächere Bild unter die Grenze der dynamischen Auflösung des Teleskops fiele und damit der Beobachtung entzogen wäre. Zum vierten soll auch die Gesamtverstärkung beider Bilder nicht unter einen bestimmten Wert sinken, damit einerseits genügend schwache Quellen, die ohne Linsen unbeobachtet blieben, in den Empfindlichkeitsbereich des Teleskops gehoben werden und andererseits der Einfluß der Linsen auf die Quellenstatistik genügend deutlich wird (vgl. Kapitel 7). Die Bildeigenschaften, die wir fordern, sind damit klar: (i) Gesamtverstärkung größer als µt ; (ii) Helligkeitsverhältnis der Bilder kleiner als q; (iii) Winkelabstand der Bilder größer als ϑ. Der zugehörige Wirkungsquerschnitt soll nun berechnet werden. 5.2.2 Berechnung der Wirkungsquerschnitte Sei y 1, so daß Doppelbilder entstehen. Die beiden Bilder werden numeriert, wobei der Index ‘1’ das äußere Bild kennzeichne. Die Wahrscheinlichkeit, daß das Bild i um einen Faktor aus dem Intervall [µi ; µi + dµi] verstärkt wird, ist p(µi )dµi : Klumpige isotherme Sphären 28 Demnach ist wegen der Unabhängigkeit der Verstärkungsfaktoren voneinander p(µ1 ) p(µ2 )dµ1 dµ2 die Wahrscheinlichkeit, Bild 1 mit einer Verstärkung aus [µ1 ; µ1 + dµ1 ] und zugleich Bild 2 um einen Faktor aus [µ2 ; µ2 + dµ2 ] verstärkt zu finden. Sei zunächst jedes beliebige Helligkeitsverhältnis erlaubt. Dann sind µ1 und µ2 nur durch µ1 + µ2 µt eingeschränkt. Definiert man r := µ1 =µ2 , bedeutet die Einschränkung des Helligkeitsverhältnisses 1 q rq : Betrachtet man die µ1 ; µ2 , Ebene, dann schränken die beiden Bedingungen den Definitionsbereich von ~µ := (µ1 ; µ2 ) auf einen halbunendlichen, trapezförmigen Ausschnitt aus dem ersten Quadranten dieser Ebene ein. Er ist in Abbildung 4 als Fläche A dargestellt. Die Wahrscheinlichkeit, daß eine Quelle am Ort y < 1 in der gewünschten Weise 6µ 2 µ2 = µ1 q A µ @@ @ @@ µ µ µ @ 2 = µ1 =q = -µ 1+ 2 1 Abbildung 4: Integrationsgebiet in der µ1 , µ2, Ebene abgebildet wird, ist also P(µt ; q; y) = Z Z dµ1 dµ2 p(µ1 ; 1 + y) p(µ2; 1 , y): (37) A Daraus erhält man den differentiellen Wirkungsquerschnitt dσ(µt ; q; y) = 2πydy P(µt ; q; y) (38) und den gesamten, integrierten Wirkungsquerschnitt σ(µt ; q) = 2π Z 0 1 ydy P(µt ; q; y); wobei sich die Integration in der Quellenebene auf den Bereich von y beschränkt, innerhalb dessen Doppelbilder entstehen. Dabei handelt es sich um einen dimensionslosen Wirkungsquerschnitt, weil in den skalierten Koordinaten gerechnet wurde. Entsprechend lautet der dimensionierte Wirkungsquerschnitt in der Quellenebene: σ̂(µt ; q) = σ(µt ; q)ζ20 : Klumpige isotherme Sphären 29 5.2.3 Der Grenzfall glatter Galaxien Im Falle ε = 0, also bei einer Galaxie ohne alle punktweise konzentrierte Materie, läßt sich σ(µt ; q) analytisch berechnen. Es ist dann x p(µ) = δ(µ ,hµi) = δ µ , jx , 1 j : Mit x1 = 1 + y; x2 = 1 , y folgt: P(µt ; q; y) = Z Z 1+y 1,y dµ1 dµ2 δ µ1 , δ µ2 , y y A : Die Variablentransformation µ := µ1 + µ2 µ1 µ2 r := ergibt dann: Z Z dµ1 dµ2 ! A Damit lautet die Wahrscheinlichkeit Z∞ Z P(µt ; q; y) = µdµ µt Z ∞ µt µdµ Z q dr 2 1=q (1 + r) : dr rµ 1+y µ 1,y δ , δ , 2 1+r y 1+r y 1=q (1 + r) q : Das führt nach kurzer Rechnung auf: ( h P(µt ; q; y) = i h 1 y 2 0; qq, \ 0; µ2t +1 sonst. 1 0 i Der Wirkungsquerschnitt ergibt sich daraus dann zu σ(µt ; q) Z = 2π 0 = 1 ydy P(µt ; q; y) 8 2 < π q,1 q+1 : 4π µt2 für µt 2 qq,11 für µt > + 1 2 qq+ ,1 (39) Für festes q ist der Wirkungsquerschnitt also über einen gewissen Bereich von µt konstant und fällt dann wie µt,2 ab. Das läßt sich folgendermaßen verstehen: Zwischen y und r besteht der Zusammenhang y= r,1 ; r+1 r= 1+y ; 1,y d.h. mit zunehmendem y wird r größer. Legt man also ein maximales r = q fest, darf y nicht über (q , 1)=(q + 1) wachsen. Die Gesamtverstärkung nimmt entsprechend µt = 2=y mit abnehmendem y zu. Für maximales y = (q , 1)=(q + 1) ist also das minimale µt = 2(q + 1)=(q , 1). Für kleinere µt ist also die Bedingung µ1 + µ2 µt immer erfüllt, weshalb σ bis µt = 2(q , 1)=(q + 1) konstant bleibt. Das Verhalten für größere µt ist die Konsequenz davon, daß y proportional zu µt,1 und damit das Integral über ydy proportional zu µt,2 ist. Klumpige isotherme Sphären 30 5.2.4 Berücksichtigung des Bildabstands Bisher wurde der Winkelabstand der beiden Bilder noch nicht berücksichtigt. Das war möglich, weil in skalierten Koordinaten der Bildabstand bei ∆x = const. = 2 liegt. Um den Winkelabstand der Bilder tatsächlich in die Berechnung einzuführen, muß dieser Wert erst umgerechnet werden. Offenbar ist (wegen der Definition der Entfernung) ϑ= η0 ∆x Dl = 4π Dlq 2 v ∆x: Dq Nennt man 4πv2 =: θ , erhält man zusammen mit der Faber-Jackson-Beziehung aus Kapitel 3: ϑ= p Dlq ∆xθ l ; Dq worin l := L=L sei. Schreibt man nun für den Wirkungsquerschnitt für eine Gesamtverstärkung größer als µt , ein Helligkeitsverhältnis kleiner als q und einen Bildabstand größer als ∆x σ(µt ; q)H(2 , ∆x) (40) mit der Heaviside-Funktion H, erhält man: Dq ϑ p σ̃(µt ; q; ϑ) = σ(µt ; q)H 2 , Dlq θ l : (41) Damit sind alle gewünschten Bildeigenschaften im Wirkungsquerschnitt ausgedrückt. 5.2.5 Numerische Ergebnisse Die Berechnung der Wirkungsquerschnitte für ε 6= 0 erfolgt gemäß den Gleichungen (37) und (38). Allerdings ist eine analytische Behandlung des auftretenden Dreifachintegrals nur ansatzweise möglich, weshalb numerisch integriert wird. Der entscheidende Unterschied zu dem Fall ε = 0 ist, daß die strenge Korrelation zwischen Verstärkungsfaktoren und Bildorten aufgehoben wird, da an jedem Ort x prinzipiell jeder Verstärkungsfaktor aus [µ ; ∞) eintreten kann. Dementsprechend erwartet man, daß der scharfe Knick, der für ε = 0 im Wirkungsquerschnitt auftritt, mit zunehmender Klumpigkeit aufgeweicht wird. Trotzdem bleibt aber der untere Rand µ von Null verschieden, so daß keine beliebig kleinen Gesamtverstärkungen auftreten können. Auch für ε 6= 0 sollte daher der Wirkungsquerschnitt einen Sättigungswert erreichen, wenn die Gesamtverstärkung gegen ihren - nach dem Satz von Schneider - kleinstmöglichen Wert 1 geht. Für q ! ∞ und µt ! 1 muß σ = π werden, weil die Gesamtverstärkung immer über eins liegen und das Helligkeitsverhältnis natürlich irgendeinen Wert zwischen 1 und ∞ annehmen muß. Der Wirkungsquerschnitt ist dann die gesamte Fläche, innerhalb derer überhaupt doppelte Abbildung stattfindet. Unklar ist das Verhalten für große µt . Es stellt sich heraus, daß hier die Überlagerung von Wahrscheinlichkeitsverteilungen zu verschiedenen Orten eine entscheidende Rolle spielt. p(µ) fällt für große µ wie µ,3 ab, also fällt das Integral über das Produkt der beiden Wahrscheinlichkeitsverteilungen über die µ1 ; µ2 , Ebene wie µ,4 ab. Die Integration über y führt dann dazu, daß sich die logarithmische Steigung des Wirkungsquerschnittes asymptotisch dem Wert ,2 annähert. Zur Verdeutlichung dessen wurde in Abbildung 5 eine Schar von Funktionen yP(µt ; q; y) für q = 100 und y 2 f0:1; 0:2; : : : ; 0:9g gezeichnet. Man erkennt, wie die Überlagerung steiler Einzelkurven zu einer flacheren Gesamtkurve führt. In Abbildung 6 sind für q = 10 die Wirkungsquerschnitte σ(µt ; q) für ε = 0 und ε = 1 dargestellt. Man sieht, daß für kleine µt (etwa µt 5) der Wirkungsquerschnitt für ε = 1 kleiner als der für ε = 0 ist, während sich die Verhältnisse für größere Gesamtverstärkung umkehren. Doppelbilder mit hoher Gesamtverstärkung werden also bei Anwesenheit von Mikrolinsen wahrscheinlicher, obwohl dieser Effekt klein ist. Wie besprochen, weicht der Knick in der Kurve bei 2(q + 1)=(q , 1) auf. Beide Querschnitte erreichen einen Sättigungswert, der jedoch für ε = 1 unter dem für ε = 0 liegt. Das kommt daher, daß die Anwesenheit von Mikrolinsen die Entstehung von Bildern mit Klumpige isotherme Sphären 31 Abbildung 5: Funktionenschar yP(µt ; q; y) für y 2 f0:1; 0:2; : : : ; 0:9g und q = 100 großen Helligkeitsunterschieden gegenüber der glatten Makrolinse begünstigt, so daß die Begrenzung auf q = 10 einen größeren Anteil der Fälle ausschließt. In Abbildung 7 sind Wirkungsquerschnitte für ε = 1 und q 2 f10; 20; 50; 100g dargestellt. Auch im Bereich hoher Gesamtverstärkung nehmen diese mit q noch zu, im Gegensatz zu den Wirkungsquerschnitten für ε = 0, deren Amplitude für µt 2(q + 1)=(q , 1) nicht mehr von q abhängt. Das bedeutet, daß auch Doppelbilder mit großem Helligkeitsverhältnis durch Mikrolinsen wahrscheinlicher werden. Abschließend sei noch gezeigt, wie der Wirkungsquerschnitt σ(µt ; q) auf eine Veränderung der zugrundeliegenden Wahrscheinlichkeitsverteilung reagiert. Wir wählen p(µ) = 4Khµi + A exp(B(µ , µ )) µ3 H(µ , µ) mit µ = hµi=3. Abbildung 8 zeigt diese Funktion für x = 1:5 und ε = 1. Daraus wurde in der gewohnten Weise der Wirkungsquerschnitt σ(µt ; q) für q = 10 berechnet. Das Ergebnis zeigt Abbildung 9. Ein Vergleich mit der entsprechenden Kurve aus 7 zeigt, daß sich trotz der drastischen Veränderung in p(µ) der Wirkungsquerschnitt nur schwach verändert. 5.2.6 Wirkungsquerschnitte für Einzelbilder Wir werden später auch den Wirkungsquerschnitt dafür benötigen, daß von einem Objekt nur ein Bild mit einem bestimmten Verstärkungsfaktor entsteht. Solche Ereignisse können nur dann auftreten, wenn die Quelle bei y > 1 sitzt, wenn also das Bild bei x > 2 entsteht. Außerhalb der Galaxie darf es aber nicht liegen, d.h. die Bildposition muß sich innerhalb eines Kreisringes mit den Radien 2 und ρ um das Zentrum der Galaxie befinden. Wir werden daher zunächst den Radius ρ der Galaxie als weiteren Parameter einführen. Klumpige isotherme Sphären 32 Abbildung 6: Wirkungsquerschnitte für vollkommen glatte und vollständig klumpige Galaxien als Funktion der minimalen Gesamtverstärkung; die Darstellung ist doppelt-logarithmisch. Wie unter 3.3 angekündigt, nehmen wir als Zusammenhang zwischen Radius und Leuchtkraft R R =l γ an. R wird mit η0 nach (16) aus 2.4.2 in einen dimensionslosen Radius umgewandelt: ρ= Also folgt: ρ= R : η0 R Dq ,2 γ v l : 4π Dl Dlq Die Faber-Jackson-Relation macht daraus: ρ= R Dq ,2 γ,1=2 v l : 4π Dl Dlq (42) Für γ = 1=2 entfällt also die Abhängigkeit des dimensionslosen Radius’ von der Leuchtkraft, was sich später als sehr bequem erweisen wird. Die Wahrscheinlichkeit, ein Bild mit einer Verstärkung größer als µt zu erzeugen, ist Z∞ p(µ)dµ; µt wenn für p(µ) die Wahrscheinlichkeitsverteilung für x > 2 (vgl. die Beschreibung unter 4.2.3) eingesetzt wird. Der zugehörige Wirkungsquerschnitt ist dann Z ρ,1 Z∞ τ(µt ; ρ) = 2π ydy p(µ; 1 + y)dµ: (43) 1 µt Konstante Flächenmassendichte 33 Abbildung 7: Wirkungsquerschnitte für vollständig klumpige Galaxien und q 2 f10; 20; 50; 100g als Funktion der minimalen Gesamtverstärkung; auch diese Abbildung ist doppelt logarithmisch Die obere Grenze der y, Integration ergibt sich daraus, daß Quellen bei y = ρ , 1 bereits auf den Rand der Galaxie abgebildet werden. 5.3 Einfluß einer konstanten Flächenmassendichte Wie ändern sich die hier eingeführten Wirkungsquerschnitte, wenn zu der isothermen Sphäre eine konstante Flächenmassendichte addiert wird? Das entspricht einer Berücksichtigung intergalaktischen Gases oder Staubs. Wie unter 2.4.3 und 4.1.3 besprochen, bedeutet die Einführung einer zusätzlichen Konvergenz eine Umskalierung der Koordinaten in der Linsenebene, die eine Änderung des Bildabstands und der Verstärkung, nicht aber des Helligkeitsverhältnisses zur Folge hat. Der Skalierungsfaktor hängt davon ab, ob die Galaxie glatt oder klumpig ist. Für glatte Galaxien muß die Skalierung aus 2.4.3, für klumpige die aus 4.1.3 verwendet werden. In beiden Fällen skaliert aber der Verstärkungsfaktor in derselben Weise. Es bleibt aber hier zu zeigen, daß der gemäß Gleichung (37) berechnete Wirkungsquerschnitt für klumpige Galaxien gerade die Eigenschaften hat, die er nach 4.1.3 haben muß. Das ist nicht selbstverständlich, da die zugrundeliegende Wahrscheinlichkeitsverteilung ohne Rücksicht auf ihre Skalierungseigenschaften konstruiert wurde. Betrachten wir also die Wahrscheinlichkeitsverteilung (36). Führt man eine zusätzliche Konvergenz κ0 ein, läßt sich unter Verwendung der Skalierungseigenschaften der Koordinaten und des Verstärkungsfaktors (siehe 4.1.3) leicht zeigen, daß gilt: K = B = A = , κ0),2 K̃ 2 (1 , κ0 ) B̃ 2β 2 (1 , κ 0 ) Ã (1 ; ; + ; Konstante Flächenmassendichte 34 Abbildung 8: Probeweise angenommene Wahrscheinlichkeitsverteilung; x = 1:5; ε = 1 wobei die mit einer Tilde versehenen Größen diejenigen sein sollen, die für κ0 = 0 gelten. Die Rechnungen sind in Anhang A.4 ausgeführt. Damit folgt dann bereits: p(µ)dµ = p̃(µ̃)d µ̃ : Also erhält man zusammen mit der Skalierungseigenschaft für die Quellenkoordinaten ~y: σ(µt ; q) = (1 , κ0)σ̃((1 , κ0)2 µt ; q): Dasselbe gilt für den Wirkungsquerschnitt τ. Die Heaviside-Funktion in (40) verändert sich außerdem zu H 2 1 , κ0 , ∆x =H , Dq ϑp 1 , κ0 Dlq θ l 2 ! ; weil der Abstand der beiden Bilder sowohl für glatte als auch für klumpige Galaxien auf 2=(1 , κ0) vergrößert wird. Für die dimensionierten, auf die Quellenebene projizierten Wirkungsquerschnitte gilt also zusammenfassend: σ̂(µt ; q; ϑ) = τ̂(µt ; ρ) = , κ0)2 σ̃ˆ ((1 , κ0)2 µt q (1 , κ0)ϑ) p 2ˆ 2 (1 , κ0 ) τ̃ ((1 , κ0 ) µt 1 , κ0 ρ) (1 ; ; ; ; : Das bedeutet insgesamt folgendes: Die Wirkungsquerschnitte werden bei den um den Faktor (1 , κ0 )2 verkleinerten Argumenten betrachtet. Da sie monoton in µt fallen, zieht das eine Erhöhung von σ und τ über einen weiten Bereich von Verstärkungsfaktoren nach sich. Für kleine µt aber verläuft σ nahezu konstant, d.h. dort hat die zusätzliche Flächenmasse praktisch keinen Einfluß. Der Übergang zum dimensionierten Wirkungsquerschnitt bringt eine Selbstkonsistenz 35 Abbildung 9: Wirkungsquerschnitt aus der Testverteilung“; ε = 1; q = 10 ” Verringerung um den Faktor (1 , κ0)2 mit sich. Da σ asymptotisch wie µt,2 abfällt, bleibt für große µt eine Vergrößerung des Wirkungsquerschnitts um (1 , κ0 )2 übrig. Im Bereich kleiner µt allerdings wird σ dadurch verkleinert. Die Einführung einer konstanten Flächenmasse bewirkt also letztlich, daß hohe Verstärkungsfaktoren bei Quasarpaaren nicht nur häufiger auftreten, sondern auch gegenüber niedrigen begünstigt sind. Der Wirkungsquerschnitt für Einzelbilder τ fällt in seinem gesamten Definitionsbereich ebenfalls etwa wie µt,2 ab. Auch er wird also in seiner dimensionsbehafteten Form um den Faktor (1 , κ0),2 vergrößert. 6 Globale Abbildungswahrscheinlichkeiten 6.1 Selbstkonsistente Wahrscheinlichkeiten Die Berechnung der Wirkungsquerschnitte bildete den ersten Schritt auf dem Weg zur Bestimmung der Wahrscheinlichkeit, mit der eine Quelle bei vorgegebener Rotverschiebung auf vorgegebene Weise durch Gravitationslinsen abgebildet wird. Der Grundgedanke für den nächsten Schritt ist der folgende: Die Wirkungsquerschnitte aller Galaxien, die sich zwischen dem Beobachter und der Sphäre befinden, deren Radius durch die Rotverschiebung der Quelle parametrisiert wird, werden an diese Sphäre projiziert. Der solcherart überdeckte Bruchteil der Gesamtfläche der Sphäre gibt die gesuchte Wahrscheinlichkeit unter den Voraussetzungen, daß die projizierten Wirkungsquerschnitte nicht oder nur in vernachlässigbarem Maß überlappen und daß die Positionen der Quellen unabhängig von den Positionen der Linsen sind. Dieser Gedanke soll nun zunächst ausgeführt werden. Auch die Entfernungen der Linsen-Galaxien werden durch ihre Rotverschiebung parametrisiert. Eine Schicht der Dicke dz bei einer Rotverschiebung von z hat das Volumen dV = 4πD20 (z) dr prop dz; dz (44) worin dr prop das radiale, physikalische Wegelement ist. Die Fläche der Sphäre ist wie im euklidischen Raum durch Spezialisierung 36 4πD20 gegeben, weil die Winkeldurchmesserdistanz entsprechend definiert wurde. Da es sich hier um eine globale Eigenschaft der Linsen- oder der Quellensphäre handelt, muß die im Friedmann-Lemaı̂tre-Modell gerechnete Distanz verwendet werden; daher der Index ‘0’ an D. Wenn sich die mitbewegte Anzahldichte der Galaxien nicht mehr entwickelt, wenn also die Galaxien erhalten bleiben, gilt für ihre Anzahldichte: n(z) = n0 (1 + z)3; worin n0 ihre mitbewegte heutige“ Anzahldichte ist. ” Seien die Galaxien nun durch eine Menge von Parametern χ klassifiziert. Der Wirkungsquerschnitt jeder Galaxie für eine bestimmte Bildeigenschaft E kann auch von χ abhängen; dann z.B., wenn der Radius der Galaxie in ihn eingeht. Darüber hinaus enthält auch die Längenskala ζ0 in der Quellenebene Angaben über die Galaxie. Demnach überdecken die Wirkungsquerschnitte der Galaxien zwischen z und z + dz eine Fläche von Z dA = (1 + z)3 dV dχ n0 (χ)ζ20 (χ)σ(E ; χ) in der Quellenebene. Integriert man nun dA über alle Rotverschiebungen zwischen Beobachter und Quelle und dividiert das Ergebnis durch die Gesamtfläche der Quellensphäre, erhält man die gesuchte Wahrscheinlichkeit als: P(E ; zq ) = 1 H0 D20 (zq ) 2 Z zq 0 1+z 6 dz 4D20 (z) p 1 + Ωz Z 3 7 dχ n0 (χ)ζ20 (χ)σ(E ; χ)5 : (45) D(χ) Dabei wurde für dV der Wert aus (44) eingetragen; ferner ging (2) aus 1.1.2 ein. D(χ) sei der Definitionsbereich von χ. 6.2 Spezialisierung des allgemeinen Ergebnisses Die Längenskala der Quellenebene für isotherme Sphären ist nach (16) aus 2.4.2: ζ0 = Dq η0 = 4πDlq v2 : Dl Die Geschwindigkeitsdispersion ist vorerst der einzige Parameter der isothermen Sphäre. Er hängt über die FaberJackson-Relation mit der Leuchtkraft zusammen: p v2 = v2 l : Den Wert 4πv2 hatten wir bereits unter 5.2.4 mit θ abgekürzt. Damit folgt: p ζ0 = Dlq θ l ; womit ζ0 durch die Leuchtkraft parametrisiert ist. Die Frage ist nun, innerhalb welchen kosmologischen Modells die Entfernung Dlq zwischen Linsen- und Quellenebene berechnet werden soll. Offenbar liegt unserer Beschreibung die Vorstellung zugrunde, daß sich ein Lichtbündel weit entfernt von allen Materieklumpen im Kosmos ausbreitet, dann auf eine Gravitationslinse trifft, dort entsprechend verändert wird, um sich anschließend wieder durch homogene Materie fortzupflanzen. Das ist der Rahmen des Dyer-Roeder-Modells. Wir müssen also für globale Eigenschaften der auftretenden Sphären die Friedmann-Lemaı̂tre-Entfernungen verwenden, für die mit den Gravitationslinsen verknüpften Distanzen aber Dyer-Roeder-Entfernungen. Ohne auf die Plausibilität dieser Unterscheidung zweier Entfernungsskalen einzugehen ist klar, daß eine selbstkonsistente Beschreibung globaler Abbildungswahrscheinlichkeiten innerhalb des Dyer-Roeder-Modells diese Unterscheidung notwendig macht. Siehe dazu die Arbeit von Ehlers und Schneider [14]. Um die Abhängigkeit von Dlq von z und zq zu verdeutlichen, schreiben wir im folgenden stattdessen D(z; zq ). Die mitbewegte Anzahldichte wird durch die Leuchtkraftfunktion gegeben, wenn sie durch die Leuchtkraft parametrisiert wird. Dann ist n0 (χ)dχ = Φ(l )dl ; Spezialisierung 37 wobei wir für Φ die Schechter-Funktion annehmen. Da auch der Radius durch die Leuchtkraft parametrisiert werden kann, ist die Beschreibung der Galaxien durch l vollständig möglich. Man erhält also schließlich mit χ = l ; D(χ) = [0; ∞) aus (45) P(E ; zq ) = = 1 H0 D20 (zq ) Nθ2 ψ20 (zq ) Z Z dz 0 D20 (z)D2 (z; zq ) zq dz 0 zq ψ20 (z)ψ2 (z; zq ) p1 + z 1 + Ωz p1 + z 1 + Ωz Z Z ∞ 0 ∞ 0 h dl θ lσ(E; l )L Φ l e,l h ν 2 dl σ(E; l )l ν+1 e,l i i ; (46) dabei haben wir im letzten Schritt D durch die dimensionslose Größe ψ = H0 D ersetzt, die in 1.2.2 eingeführt wurde. N wurde unter 3.1 definiert. Den z, abhängigen Ausdruck kürzen wir künftig ab: 1+z ψ20 (z)ψ2 (z; zq ) p 1 + Ωz =: h(z; zq ): Wir gehen nun auf zwei verschiedenen Wegen weiter, indem wir für den Wirkungsquerschnitt einmal den für doppelte, einmal den für einfache Abbildung einsetzen. 6.2.1 Wahrscheinlichkeit für doppelte Abbildung Nach (41) aus 5.2.4 ist der Wirkungsquerschnitt für doppelte Abbildung, Gesamtverstärkung größer als µt , Helligkeitsverhältnis kleiner als q und Winkelabstand größer als ϑ: Dq ϑ p σ̃(µt ; q; ϑ) = σ(µt ; q)H 2 , Dlq θ l ! : Die Heaviside-Funktion kann umskaliert werden in: H(l , lmin ) mit lmin := Dq ϑ 2Dlq θ 2 (47) : Auch hier sind für die Entfernungen Dq und Dlq Dyer-Roeder-Distanzen zu verwenden. Aus (46) wird dann P(µt ; q; ϑ) = = Nθ2 σ(µt ; q) ψ20 (zq ) Z zq 0 dz h(z; zq ) Z ∞ 0 h dl H(l , lmin )l Nθ2 f (δ; Ω; ϑ; zq )σ(µt ; q): ν+1 e,l i (48) Dabei haben wir die Funktion f (δ; Ω; ϑ; zq ) := 1 2 ψ0 (zq ) Z 0 zq dz [h(z; zq )Γ(ν + 2; lmin )] eingeführt. Bei festen kosmologischen Parametern ist sie eine Funktion des Winkelanstands ϑ der Bilder und der Quellrotverschiebung zq . Γ(a; b) ist die unvollständige Gammafunktion, die sich bei der Integration über l in (48) ergibt; siehe [1, Kap. 6.5]. Abbildung 10 zeigt f (δ; Ω; ϑ; zq ) für δ = 0:5; Ω = 1:0 und zq 2 f0:5; 1:0; 1:5; 2:0g als Funktion von ϑ=θ . Für θ = 4πv2 erhält man mit dem Wert v = 220kms,1 θ = 1:400 : Damit beträgt das Produkt Nθ etwa Nθ2 = 0:02: Dieser Wert erbt natürlich die beträchtliche Unsicherheit, mit der auch N behaftet war. Konstante Flächenmassendichte 38 Abbildung 10: Die Funktion f für vier verschiedene Quellenrotverschiebungen (zq 2 f0:5; 1; 1:5; 2g) in Abhängigkeit vom Bildabstand; Abszisse: ϑ=θ ; kosmologische Parameter: δ = 0:5; Ω = 1 6.2.2 Wahrscheinlichkeiten für einfache Abbildung Der Wirkungsquerschnitt dafür, daß eine Galaxie ein einzelnes Bild einer Quelle mit einer Verstärkung von mehr als µt erzeugt, ist nach (43) aus 5.2.6: τ(µt ; ρ) = 2π Z ρ,1 Z ydy 1 ∞ µt dµ p(µ; 1 + y): Der Parameter ρ enthält die Rotverschiebungen von Linse und Quelle. Durch Einsetzen in (46) erhält man: P(µt ; zq ) = Nθ2 g(δ; Ω; µt ; zq ; ρ); wenn man die Funktion g definiert als g(δ; Ω; µt ; zq ; ρ) := 2πΓ(ν + 2) ψ20 (zq ) Z 0 zq dz [h(z; zq )τ(µt ; ρ)] : (49) Die vollständige Gammafunktion ergibt sich durch Integration über die Leuchtkraft, weil τ wegen der Wahl γ = 1=2 in (42) aus 5.2.6 nicht mehr von l abhängt. 6.3 Berücksichtigung konstanter Flächenmassendichten Mit Hilfe der Skalierungseigenschaften, die unter 2.4.3 beschrieben und unter 5.3 auf die benötigten Wirkungsquerschnitte angewandt wurden, lassen sich die Ergebnisse (48) und (49) leicht auf den Fall verallgemeinern, in dem die Linsengalaxien in eine konstante Flächenmassendichte eingebettet sind. Dabei muß allerdings berücksichtigt werden, daß eine bestimmte vorgegebene Flächenmassendichte Σ0 wegen der Skalierung (10) auf eine Konvergenz κ0 Quellenstatistik 39 führt, die von der Rotverschiebung z abhängt: κ0 = 4πGDl Dlq Σ0 : Dq Der wesentliche Effekt davon ist, daß die Wahrscheinlichkeit (48) nicht mehr in zwei Faktoren zerfällt, von denen der eine nur den Winkelabstand der Bilder, der andere die Gesamtverstärkung und das Helligkeitsverhältnis enthält. Außerdem wird auch der Parameter lmin , eingeführt in (47), verändert zu 0 = (1 , κ )2 l : lmin 0 min Damit wird aus (48): P(µt ; q; ϑ) = Nθ2 ψ20 (zq ) Z zq 0 n o 0 ) dz h(z; zq )(1 , κ0)2 σ((1 , κ0)2 µt ; q)Γ(ν + 2; lmin Die Gleichung (49) verändert sich entsprechend zu: Z i 2πΓ(ν + 2) zq h g(δ; Ω; µt ; zq ; ρ) := dz h(z; zq )(1 , κ0)2 τ((1 , κ0)2 µt ; ρ) : 2 ψ0 (zq ) 0 7 Der Amplification Bias“ ” Der Umstand, daß Gravitationslinsen immer mindestens ein Bild erzeugen, das heller als die ungelinste“ Quelle ist, ” hat zur Folge, daß eine Population von Linsen im Universum die beobachteten Helligkeiten von Quellen statistisch verfälscht. Betrachtet man weit entfernte Quellen im Universum, also solche, die mit beträchtlicher Wahrscheinlichkeit durch Gravitationslinsen abgebildet werden, dann werden mehr Quellen heller als eine bestimmte Grenze erscheinen, als man ohne Gravitationslinsen erwarten sollte. Dieser Effekt heißt amplification bias“. Er soll nun ” behandelt werden. 7.1 Quellenstatistik Unsere Behandlung von Wirkungsquerschnitten setzt punktförmige Quellen voraus. Von derart kompakten, zudem weit entfernten und leuchtkräftigen Quellen werden wir im folgenden als von Quasaren“ sprechen, ohne näher dar” auf einzugehen, daß es eine Vielzahl von Arten heller extragalaktischer Quellen gibt wie etwa Seyfert-Galaxien oder BL-Lacertae-Objekte. Wir werden auch nicht auf die Schwierigkeiten eingehen, die mit verläßlichen Quellenzählungen verbunden sind, sondern davon ausgehen, daß eine intrinsische Leuchtkraftfunktion dieser Quellen existiert, die beobachtbar wäre, wenn es die Linsen nicht gäbe. Sie wird durch Gravitationslinsen verfälscht; wie und in welchem Ausmaß, ist vorerst unbekannt. Um eine gewisse Freiheit bei der Wahl dieser Funktion zu behalten, werden wir mindestens einen weiteren Parameter einzuführen haben. 7.1.1 Quellenzahlen Zur Unterscheidung von der Leuchtkraftfunktion Φ der Linsen-Galaxien werden wir die Leuchtkraftfunktion der Quellen mit Ψ bezeichnen. Sei also H03 Ψ(zq ; L=L0 ) die mitbewegte Anzahl von Quasaren pro Volumeneinheit mit einer Leuchtkraft größer als L, wobei L0 eine geeignete Referenzleuchtkraft sei. Diese Dichte entwickelt sich kosmologisch; deswegen taucht die Rotverschiebung als Argument von Ψ auf. Wir werden sie allerdings im folgenden wieder unterdrücken, weil wir uns auf Quellen einer Rotverschiebung beschränken. In einer Schicht der Dicke dzq bei einer Rotverschiebung von zq befinden sich dann, wenn man (44), (2) und die Adiabatengleichung (1) aus 1.1.2 zusammenträgt 1 + zq dn(zq ; L) = 4πψ20 (zq ) p Ψ(L=L0 )dzq 1 + Ωzq Quellenstatistik 40 Quellen. Ohne Verstärkung würde man von einer solchen Quelle eine Energieflußdichte von größer als S0 = L 4πD2L (zq ) beobachten, worin DL die Leuchtkraftdistanz ist. Sie hängt mit der Winkeldurchmesserdistanz gemäß DL = (1 + z)2 D zusammen; siehe 1.2.3. Wird die Quelle um einen Faktor µ verstärkt, beobachtet man demgemäß eine Flußdichte von mehr als Lµ Lµ S= =: : 4π(1 + zq)4 D2 (zq ) ζ(zq ) In einem sogennanten flux-limited sample“, d.h. in einer Menge von Quellen, von denen eine Mindestflußdichte ” von S beobachtet wurde, befinden sich also pro Raumwinkel 1 + zq ζ(zq )S dn(zq ; S) = ψ20 (zq ) p Ψ dzq dµ µ 1 + Ωzq Quellen mit einer Rotverschiebung aus dem Intervall [zq ; zq + dzq ], die um einen Faktor aus [µ; µ + dµ] verstärkt wurden. Sei p(µ)dµ die Wahrscheinlichkeit, mit der ein solcher Verstärkungsfaktor eintritt. Dann ist die Gesamtzahl von Quellen pro Raumwinkel bei einer Rotverschiebung zq in dem durch S begrenzten sample gleich Z∞ dn(zq ; S) ζ(zq )S = k(zq ) dµ p(µ)Ψ ; (50) dzq µ 1 wobei die Abkürzung 1 + zq k(zq ) := ψ20 (zq ) p : 1 + Ωzq eingeführt wurde. Diese Gleichung bildet die intrinsische Leuchtkraftfunktion Ψ auf die beobachtbare kumulative Quellenh”aufigkeit ab. 7.1.2 Wahrscheinlichkeitsverteilungen Was ist nun p(µ) ? Wir hatten in Kapitel 6 Wahrscheinlichkeiten dafür ausgerechnet, daß eine Quelle bei der Rotverschiebung zq um mehr als µt verstärkt wird, wobei die Bilder der Quelle zusätzliche Eigenschaften E erfüllen sollten. Der Index ‘t’ am Verstärkungsfaktor kann wegfallen, weil µ in keiner anderen Bedeutung als der einer Gesamtverstärkung mehr auftreten wird. Aus den Wahrscheinlichkeiten erhält man die in (50) erforderlichen Wahrscheinlichkeitsdichten nach ∂ p(µ) = , P(µ; : : : ; zq ): ∂µ Die drei Punkte kennzeichnen die Parameter, die die Eigenschaft E festlegen. Zum Beispiel ist die Anzahl der Quellen - bei einer Rotverschiebung von zq , - die doppelt abgebildet werden, - für die das Helligkeitsverhältnis der Bilder kleiner als q, - der Bildabstand größer als ϑ und - der Gesamtfluß größer als S ist, gleich dn(q; ϑ; S; zq ) dzq Z = = Siehe dazu (48) aus 6.2.1. ∞ q; ϑ; zq ) ζ(zq )S ,k(zq ) dµ ∂P(µ;∂µ Ψ µ 1 Z∞ ,k(zq )Nθ2 f (δ; Ω; ϑ; zq ) 1 dµ ∂σ(∂µµ; q) Ψ ζ(zµq )S : Doppelt abgebildete Quasare 41 7.1.3 Eine Leuchtkraftfunktion Die Leuchtkraftfunktion wurde bisher nicht festgelegt. Beobachtungen zeigen, daß sie flach für kleine, steil für große Leuchtkräfte ist, wobei die Trennung zwischen klein“ und groß“ bei etwa der 19.8ten scheinbaren Größenklasse ” ” im Johnson-B-Bereich liegt; siehe dazu [21]. Wir nennen die zugehörige Leuchtkraft L0 und skalieren ` := L=L0 . Dann ist bei fester Quellenrotverschiebung die Form eines Potenzgesetzes Ψ(`) := 1 λ ν ` +` (51) mit λ < ν eine Wahl, die die Beobachtungen gut beschreibt.13 Die Parameter λ und ν nennen wir im folgenden Leuchtkraftindices“, um sie bequem ansprechen zu können. Für kleine ` wird Ψ also durch `,λ , für große ` durch `,ν ” bestimmt. Beobachtungen, die ohne Berücksichtigung von Linseneffekten interpretiert werden, zeigen etwa ν ' 2:6. 7.2 Anteil doppelt abgebildeter Quasare Unser Ziel ist, den Anteil von Quasaren mit den Bildeigenschaften E an der Gesamtzahl beobachteter Quasare zu berechnen. Dazu nehmen wir an, daß es außer den Linsen-Galaxien nur glatt verteilte Materie im Universum gibt, die also nicht als Linse wirken kann. Das bedeutet, daß ein beliebiger Quasar entweder durch eine Galaxie abgebildet oder überhaupt nicht durch Linsen beeinflußt wird. Wenn er aber abgebildet wird, dann kann das entweder doppelt oder einfach sein, je nachdem, ob der innere Bereich der Galaxie abbildet oder der äußere Ring. Und schließlich werden möglicherweise nicht alle Doppelbilder als solche erkannt, weil sie unterhalb der Auflösungsgrenzen des verwendeten Teleskops liegen. Entsprechend dieser Aufteilung haben wir zunächst die Wahrscheinlichkeiten für vier Fälle zu berechnen: 1. dafür, daß der Quasar doppelt abgebildet wird, wobei das Doppelbild die Eigenschaften E erfüllen soll, die vom Auflösungsvermögen des Teleskops bestimmt sind; 2. dafür, daß der Quasar doppelt abgebildet wird ohne Rücksicht auf die Bildeigenschaften; 3. dafür, daß der Quasar einfach abgebildet wird und schließlich 4. dafür, daß der Quasar nicht gelinst“ wird. ” Die ersten drei Wahrscheinlichkeiten wurden bereits in 6.2.1 und 6.2.2 bestimmt. Sie lauten: P1 (µ; q; ϑ; zq ) = Nθ2 f (δ; Ω; ϑ; zq )σ(µ; q) P2 (µ; zq ) = Nθ2 f (δ; Ω; 0; zq )σ(µ; ∞) P3 (µ; zq ) = Nθ2 g(δ; Ω; µ; zq ): P2 ergibt sich, wenn man bedenkt, daß für alle Doppelbilder der Winkelabstand größer als 0 und das Helligkeitsverhältnis kleiner als ∞ ist. Es bleibt die Wahrscheinlichkeit für den vierten Fall zu bestimmen. Ein Lichtstrahl, der weit entfernt von allen Galaxien verläuft, wird im Dyer-Roeder-Universum relativ zum Friedmann-Lemaı̂tre-Universum um 1 hµDR i = D20 D2 (siehe (8) in 1.2.3) abgeschwächt. Verläuft er nahe bei den Materieklumpen“, wird er im Mittel entsprechend verstärkt. ” Die mittlere Gesamtverstärkung im Universum relativ zum Friedmann-Lemaı̂tre-Fall muß wegen der Flußerhaltung gleich eins sein. Auf der anderen Seite haben wir aber alle bisherigen Verstärkungsfaktoren bezüglich des Dyer-Roeder-Universums berechnet, weil die Wirkung des Mediums zwischen der Quelle und der Linse bzw. zwischen der Linse und dem Beobachter nicht in Betracht gezogen wurde. Wir normieren deswegen die Verstärkungsfaktoren so, daß ein 13 Es ist hier nicht nötig, Ψ zu normieren, weil im folgenden nur relative, keine absoluten Zahlen betrachtet werden. Doppelt abgebildete Quasare 42 Lichtbündel, das sich durch klumpenfreien Raum ausbreitet, die Verstärkung eins erfährt. Das hat zur Folge, daß die mittlere Gesamtverstärkung gleich hµDR i wird. Da wir über diese Aussage hinaus nur wissen, daß die Gesamtwahrscheinlichkeit auf eins normiert sein muß, nehmen wir zur Beschreibung des vierten Falles die singuläre Wahrscheinlichkeitsverteilung p4 (µ) = p0 δ(µ , µ0) an. Die darin eingeführten Konstanten p0 und µ0 werden dann durch die Bedingungen R (i) 1∞ dµ ∑4j=2 p j (µ) = 1 R (ii) 1∞ µdµ ∑4j=2 p j (µ) = hµDR i bestimmt. Dabei ist p j (µ) = , ∂Pj (µ) ∂µ für j 2 f2; 3g. Die anderen Argumente von Pj sind hier nicht von Bedeutung und werden weggelassen. Wegen Z∞ ∂Pj dµ , = P j (1 ) ∂µ 1 erhält man für den Koeffizienten der δ, Distribution14: 3 p0 = 1 , ∑ Pj (1): j =2 Nun ist aber der Wirkungsquerschnitt σ(µ = 1; q = ∞) = π; demnach wird P2 (1) = πNθ2 f (δ; Ω; 0; zq ); außerdem ist P3 (1) = Nθ2 g(δ; Ω; 1; zq ): Damit folgt: p0 = 1 , Nθ2[π f (δ; Ω; 0; zq ) + g(δ; Ω; 1; zq )]: Für den Ort der Singularität erhält man mit Z ∞ 1 j , ∂P ∂µ µdµ Z = P j (1 ) + 1 ∞ dµ Pj (µ) den Ausdruck p0 µ0 = hµDR i, Nθ2 f (δ; Ω; 0; zq ) π + Z 1 ∞ dµ σ(µ; ∞) + g(δ; Ω; 1; zq ) + Z 1 ∞ dµ g(δ; Ω; µ; zq ) ; (52) der durch numerische Integration ausgewertet werden muß. Mit den Wahrscheinlichkeiten Pj läßt sich der jeweilige Anteil an Quellen mit gegebener Rotverschiebung zq nach (50) berechnen. Die Möglichkeit, die Wahrscheinlichkeiten P2 und P3 durch die Funktionen f ; g und σ ausdrücken zu können, fällt weg, wenn zusätzlich eine konstante Flächenmassendichte angenommen wird (vgl. dazu 6.3). Die beiden Gleichungen (i) und (ii) bleiben aber natürlich auch dann gültig und damit das Prinzip der eben ausgeführten Rechnung. 14 Dieser Koeffizient zeigt an, wie verläßlich die Annahme war, daß die Wirkungsquerschnitte sich nicht überlappen: Er liegt für alle verwendeten Galaxienradien R zwischen 0.5 und 1. Abschätzungen 43 Der Anteil an doppelt abgebildeten Quasaren mit den gewünschten Bildeigenschaften E an allen beobachteten Quasaren mit einer Rotverschiebung von zq ist schliesslich F (s; E ; zq ) dn1 (s;zq ) dzq dn j (s;zq ) 4 ∑ j=2 dzq = R∞ dµ p1 (µ)Ψ µs : R∞ ∑4j=2 1 dµ p j (µ)Ψ µs 1 = (53) Der Einfachheit halber haben wir hier den Fluß S durch die dimensionslose Größe s := ζS L0 ersetzt. 7.3 Einige analytische Abschätzungen Einige analytische Abschätzungen können nun durchgeführt werden. Wir nehmen, um die Rechnungen zu vereinfachen, eine Leuchtkraftfunktion der Form ( ,λ für ,ν für ` ` Ψ(`) = ` 1 `> (54) 1 an, die qualitativ dieselben Eigenschaften wie die oben gegebene hat, und betrachten zunächst den Einfluß glatter Galaxien auf die Zählungen der mit den Eigenschaften E abgebildeten Quasare. Das Integral Z∞ s dµ p(µ)Ψ =: I µ 1 kann leicht berechnet werden, wenn man für p(µ) den Ausdruck p(µ) = = ,Nθ2 f (δ Ω; ϑ zq ) ∂σ(∂µµ q) ; C ( ; ; 1 für µ 2 qq+ ,1 sonst. 0 1 µ3 =: a ; (55) wobei C abkürzend für 8πNθ2 f (δ; Ω; ϑ; zq ) geschrieben wurde. Das Integral I wird dann zu Z ∞ I= a Ist s < a, folgt I< = während sich für s > a ergibt: I> = C s2 C s dµ 3 Ψ µ µ : Caλ,2 1 ; λ , 2 sλ ν,2 , 1 , sCν νa , 2 ν,2 λ,2 1 : Bei der Auswertung des Integrals mußte λ < 2 und ν 6= 2 vorausgesetzt werden. Für die hier durchgeführte Abschätzung bedeutet dies aber keine nennenswerte Einschränkung. 1 Das Ergebnis sagt aus, daß für hinreichend kleine s, genauer für s < a = 2 qq+ ,1 , die Steigung der Leuchtkraftfunktion unverändert bleibt. Für ν < 2 geht die beobachtete Leuchtkraftfunktion im Grenzfall s ! ∞ asymptotisch Abschätzungen 44 gegen s,ν , während sie für ν > 2 asymptotisch unabhängig von ν wird und den Leuchtkraftindex ,2 annimmt. Das bedeutet, daß der amplification bias“ von umso größerer Bedeutung wird, je steiler das steile Ende der intrinsischen ” Leuchtkraftfunktion ist. Auch im Anschluß an (53) lassen sich einige analytische Abschätzungen durchführen. zu `,1 ist, ist F konstant in s, weil dann sowohl Zähler als auch Zunächst gilt offenbar: Wenn Ψ(`) proportional R Nenner von F lediglich Integrale der Form µdµ p(µ) darstellen: F (s; E ; zq ) = Z wobei der Zähler Z durch ∞ Z := 1 Z hµDR i µdµ p1 (µ) = 4πNθ2 f (δ; Ω; ϑ; zq ) q,1 : q+1 gegeben ist. Um den Verlauf von F mit s abschätzen zu können, wählen wir wieder die einfache Leuchtkraftfunktion (54) und nehmen ε = 0 an. Für den Zähler von F hatten wir bereits einen Ausdruck der Form ( A1 sλ A2 A3 + sν s2 für sa sonst. erhalten, wobei die Ai , ebenso wie die noch einzuführenden Bi ; Ci ; Di , Konstanten in s sind. Nun zum Nenner. Der erste Summand (j=2) gibt (wegen q = ∞ ist a = 2) einen Verlauf der Form ( B1 sλ B3 B2 sν + s2 für s2 sonst. Der dritte Summand verschiebt die Leuchtkraftfunktion lediglich zu höheren Leuchtkräften hin; er verhält sich also wie ( C1 für s µ0 sλ C2 sonst, sν wobei µ0 von der Größenordnung 1 ist. Beim zweiten Summanden schließlich muß man bedenken, daß Verstärkungsfaktoren größer als 2 vom äußeren Ring einer glatten Galaxie nicht hervorgerufen werden können. p3 (µ) verschwindet also nur im Intervall [1; 2] nicht. Innerhalb dieses Intervalls ist numerischen Ergebnissen zufolge p3 (µ) annähernd proportional zu µ,1 . Die Abhängigkeit des dritten Summanden von s kann demnach in der Form 8 > < > : D1 sλ D D2 + sν3 + D4 λ s D5 sν für s1 für s 2 [1; 2] sonst dargestellt werden. Insgesamt ergibt sich dann für F: F (s; zq ) ' 8 const. > > > > > > sν,λ > > > < b sν,λ + c sν + d 1 1 1 sν,λ > > > > b2 sν,2 + c2 > > > > sν,2 + b3 > : c3 sν,2 + d3 für s<1 für s 2 [1; 2) für s 2 [2; a) für s 2 [a; ∞) Dabei sind auch die bi ; ci und di Konstanten in s. Abbildung 11 stellt diesen abgeschätzten Verlauf für ν = 3; λ = 1 dar. Interpretation 45 Es lassen sich auch Zahlenwerte angeben. Wählt man q = 10, also a = die Leuchtkraftindices λ = 1 und ν = 4, erhält man: Z hµDR i ' A3 ' B3 ' 22 9 , ferner zq = 2; δ = 0:5 und Ω = 1 sowie 0:0008 0:0039 0:0169 (56) Damit ist sowohl der konstante Wert bekannt, den F für kleine s annimmt, nämlich etwa 0.0008, als auch der Wert, gegen den F für große s gehen wird. Für große s dominieren nämlich die proportional zu s,2 abfallenden Terme im Zähler und im Nenner von F, so daß F dann den Wert A3 =B3 ' 0:23 annimmt. Zahlenwerte für den Verlauf von F zwischen sehr kleinen und sehr großen Mindestflüssen sind nicht mehr auf der Basis dieser einfachen Rechnungen angebbar. Abbildung 11: abgeschätzter schematischer Verlauf des Anteils doppelt abgebildeter und aufgelöster Quasare an allen beobachteten Quasaren als Funktion des Mindestflusses s; die Abszisse ist in relativen Größenklassen skaliert 7.4 Interpretation Für kleine Flüsse ist F konstant. Das liegt daran, daß die Wirkung der Linsen nur darin besteht, solche Quellen über die untere Grenze des Flusses zu heben, die sonst zu schwach wären, um beobachtet zu werden. Im Bereich kleiner Flüsse stammen alle diese Quellen vom flachen Ende der intrinsischen Leuchtkraftfunktion, so daß der Funktionsverlauf dadurch nicht geändert wird. Die Abhängigkeit der Anzahl der doppelt abgebildeten Quellen vom Fluß ist also dieselbe wie für nicht abgebildete Quellen. Die Situation ändert sich, wenn die Flußgrenze auf über eins erhöht wird. Dann transportieren die Linsen schwache Quellen vom flachen Ende der Leuchtkraftfunktion über den Knick der Funktion in den Bereich der steil abnehmenden intrinsischen Quellenzahlen hinein. Die Anzahl der nicht abgebildeten Quellen fällt also rascher ab als Anteil doppelt abgebildeter Quasare 46 die der abgebildeten, weshalb die durch Linsen beeinflußten Quasare zunehmend dominieren. Auch für noch größere Flüsse bleiben die abgebildeten Quellen dominant, weil für ν > 2 die Anzahl der doppelt abgebildeten Quasare weniger stark abfällt als die für nicht oder einfach abgebildete. Für besonders hohe Flüsse dominiert schließlich die Anzahl der doppelt abgebildeten Quellen völlig, weil die Zahl der nicht oder einfach abgebildeten Quellen ihr gegenüber vernachlässigbar klein wird. F strebt dann einem Sättigungswert zu, der nur noch bestimmt ist durch das Verhältnis der Anzahl der Doppelbilder mit der Eigenschaft E relativ zu derjenigen aller Doppelbilder. 8 Interpretation der Ergebnisse 8.1 Anteil doppelt abgebildeter Quasare 8.1.1 Vorbemerkung, Wahl der Parameter Die am Ende des vorigen Kapitels durchgeführten analytischen Abschätzungen geben einen ersten Eindruck von dem qualitativen Verlauf des Anteils geeignet abgebildeter Quasare an allen beobachteten Quasaren in Abhängigkeit vom empfangenen Mindestfluß. Hier soll nun untersucht werden, wie die durch Gleichung (53) bestimmte Größe F (s; E ; zq ) von den gewünschten Bildeigenschaften E, von den Eigenschaften der abbildenden Galaxien und von der intrinsischen Leuchtkraftfunktion der Quellen abhängt. Das kosmologische Modell wird mit den Parametern δ = 0:5; Ω = 1:0 fixiert; für die Hubblekonstante nehmen wir, wie bisher immer, H0 = 50kms,1 Mpc,1 an. Die Rotverschiebung der Quellen wurde auf zq = 2 festgelegt. Zur Beschreibung der Quellenzählungen wählen wir die abgerundete Leuchtkraftfunktion (51) mit dem Leuchtkraftindex λ = 1 und variierendem ν 2 f2; 3; 4g um darzustellen, welche Bedeutung die Steilheit der intrinsischen Leuchtkraftfunktion auf das Beobachtungsergebnis hat. Als Parameter für die abbildenden Galaxien bleiben Radius und Klumpigkeit. Wir stellen hier die Ergebnisse für die Radien R 2 f20; 30; 40gkpc sowie für die Klumpigkeitsparameter ε 2 f0; 0:5; 1g dar. Der Mindestwinkelabstand wurde auf ϑ = θ ' 1:400 festgesetzt. Verändert man ihn, tritt keine qualitative Änderung der Ergebnisse auf, weil sich dadurch nur der in (48) eingeführte Vorfaktor f (δ; Ω; ϑ; zq ) ändert. Wir haben ϑ daher nicht variiert. Das maximale Helligkeitsverhältnis der Bilder erhält den Wert 10, entsprechend einer Helligkeitsdifferenz von 2.5 Größenklassen. Es ergeben sich also neun Diagramme, wenn man die drei Kurven für die verschiedenen Leuchtkraftindices ν in je einem Diagramm zusammenfaßt und von Diagramm zu Diagramm einen der Parameter ε und R verändert. Die je drei Diagramme für konstantes ε, aber variierendes R sind auf je einer Seite zusammengestellt. Die Achsenskalen der Diagramme sind einfach-logarithmisch in folgendem Sinn: Die Ordinate ist linear, die Abszisse stellt den Mindestfluß logarithmisch dar. Das entspricht einer Skalierung in Größenklassen. Nachdem wir den Fluß so skaliert hatten, daß von einer nicht durch Gravitationslinsen beeinflußten Quelle der Leuchtkraft L0 gerade der Fluß 1 beobachtet wird, geben wir relative Größenklassen an, deren Nullpunkt der Leuchtkraft L0 und damit der scheinbaren B-Helligkeit +19:8 entspricht. Da die Größenklassen mit zunehmender Helligkeit abnehmen, nimmt in den Diagrammen der Mindestfluß von rechts nach links zu. Die Diagramme wurden in den Anhang B aufgenommen. 8.1.2 Interpretation des Kurvenverlaufs Für vollkommen glatte Galaxien nehmen die Kurven eine Form an, die qualitativ dem abgeschätzten Verlauf in Abbildung 11 nahekommt. Der entscheidende Unterschied, daß nämlich die Knicke aus Abbildung 11 geglättet werden, rührt daher, daß die kantige“ Leuchtkraftfunktion (54) durch die abgerundete“ (51) ersetzt wurde. Darüber hinaus ” ” zeigen sich dieselben Merkmale wie die, die unter 7.4 diskutiert wurden: konstanter Verlauf für kleine, rascher Anstieg auf einen Sättigungswert für große Mindestflüsse. Jetzt zeigt sich deutlich der Einfluß der Steilheit der intrinsischen Leuchtkraftfunktion: Je steiler die Leuchtkraftfunktion ist, desto schneller wird der Sättigungswert erreicht. Das liegt daran, daß bei zunehmendem Leuchtkraftindex ν > 2 und steigendem Mindestfluß die nicht doppelt abgebildeten Quasare zunehmend schnell von den doppelt abgebildeten dominiert werden, die ja aufgrund ihrer größeren Verstärkung vom flachen Ende der Leuchtkraftfunktion weiter über den Steilabfall“ hinaus transportiert werden. ” Offenbar ist im Fall ε = 0 das Ergebnis völlig unempfindlich gegen Veränderungen des Galaxienradius’ R . Der Grund dafür ist, daß die äußeren Bereiche einer vollständig glatten Galaxie maximal um den Faktor 2 verstärken können. Wenn die Galaxie einen Mindestradius überschritten hat, der dem skalierten Radius r = 2 entspricht, trägt Anteil doppelt abgebildeter Quasare 47 jede weitere Vergrößerung des Radius’ nur Verstärkungsfaktoren von der Größenordnung eins bei, die keinen Einfluß mehr auf das Beobachtungsergebnis haben. Was geschieht nun, wenn die Galaxien klumpiger“ werden? Zunächst fällt auf, daß F bei festem q und festem ” ε 6= 0 mit wachsendem Galaxienradius abnimmt. Das hat folgenden Grund: Während der äußere Ring glatter Galaxien wie bereits erwähnt nur unwesentlich verstärken kann, ist es bei Anwesenheit von Mikrolinsen möglich, auch ein stark verstärktes Einzelbild zu erzeugen. Damit wächst mit dem Galaxienradius die Anzahl überhaupt beobachteter Quasare erheblich, während die Zahl aufgelöster Quasarpaare unbeeinflußt bleibt. Völlig analog läßt sich verstehen, daß auch bei festem q und R mit zunehmender Klumpigkeit der Anteil aufgelöster Quasarpaare kleiner wird. Die Wahrscheinlichkeitsverteilung für Verstärkungsfaktoren wird mit steigendem ε breiter; damit nimmt die Wahrscheinlichkeit zu, daß die äußeren Bereiche der Galaxie ein stark verstärktes Bild erzeugen. Folgender Effekt sei noch erwähnt: Im Falle ε = 0 gehört zu jedem Gesamtverstärkungsfaktor ein exakt definiertes Helligkeitsverhältnis der Bilder. Insbesondere treten hohe Verstärkungen nur auf, wenn die Quelle dicht am Kaustikpunkt steht. Dann entstehen aber zwei Bilder mit sehr geringem Helligkeitsverhältnis nahe der kritischen Linie. Wird ε größer, verbreitern sich die Wahrscheinlichkeitsverteilungen für die Verstärkungsfaktoren und flachen ab. Nach wie vor treten große mittlere Gesamtverstärkungen nur für Quellen nahe ~y = 0 auf; die möglichen Helligkeitsverhältnisse werden aber über ein Intervall verteilt, dessen Breite mit der Klumpigkeit wächst. Das bedeutet, daß Doppelbilder mit großem Helligkeitsverhältnissen relativ zu solchen mit kleinen Helligkeitsverhältnissen wahrscheinlicher werden, wenn die Klumpigkeit der Galaxien wächst. Quellen, die etwas weiter vom Kaustikpunkt entfernt stehen, erzeugen Doppelbilder mit geringerer mittlerer Gesamtverstärkung. Hohe Gesamtverstärkungen treten dann bevorzugt bei Doppelbildern mit großem Helligkeitsverhältnis auf. Beschränkt man also das Helligkeitsverhältnis nach oben, wie es der endlichen dynamischen Auflösung eines Teleskops entspricht, und verlangt eine bestimmte minimale Gesamtverstärkung, wird der Anteil entsprechend abgebildeter Quasare mit wachsender Klumpigkeit abnehmen, auch wenn die Galaxien zu klein sind, um eine nennenswerte Anzahl heller Einzelbilder zu erzeugen. Unsere Kurven deuten diesen Effekt an, da auch für den kleinsten Galaxienradius R = 20kpc der Anteil F für große Mindestflüsse s mit der Klumpigkeit ε abnimmt. 8.1.3 Veränderungen im mittleren Helligkeitsverhältnis Um die Frage zu untersuchen, welchen Einfluß die Anwesenheit von Mikrolinsen auf das mittlere beobachtete Helligkeitsverhältnis der Bilder hat, berechnen wir den Anteil solcher Quasare an allen beobachteten Quasaren, deren Bilder ein Helligkeitsverhältnis zwischen q = 10 und q = 100 haben. Wie verändert sich dieser Anteil, abgekürzt ∆F, mit der Klumpigkeit ε ? Aufschluß geben die Bilder in Anhang B.2, bei denen in je einem Diagramm die drei Kurven für zunehmend steile Leuchtkraftfunktionen, aber konstantes ε zusammengefaßt wurden. Für den Radius R wurde 30 kpc gewählt. In allen drei Bildern verlaufen die Kurven im Bereich kleiner Mindestflüsse auf demselben konstanten Wert. Das wird unmittelbar aus dem oben diskutierten Verlauf des Anteils F klar. Während jedoch die Kurven für ν 6= 2 und ε = 0 im Bereich hoher Mindestflüsse auf Null absinken, bleiben sie für ε 6= 0 bei endlichen Werten, die wesentlich höher liegen als die Maxima der Kurven für ε = 0. Das läßt bereits den Schluß zu, daß Mikrolinsen die Häufigkeit von Quasarbildern mit großem Helligkeitsverhältnis deutlich erhöhen, daß also das mittlere Helligkeitsverhältnis heller Quasarbilder in Anwesenheit von Mikrolinsen zunimmt. Qualitativ läßt sich dieser Effekt so verstehen: Glatte Galaxien können nur von solchen Quellen Bilder stark unterschiedlicher Helligkeit erzeugen, die sehr dicht an der Linie y = 1 stehen. Der Wirkungsquerschnitt dafür ist also sehr klein. Zudem ist die Gesamtverstärkung solcher Bilder nur unwesentlich größer als zwei. Da die meisten hellen Quasare aber wegen des steilen Abfalls der Leuchtkraftfunktion auch stark verstärkt sein müssen, können glatte Galaxien keine Bilder mit großer Gesamt- und stark verschiedener Helligkeit erzeugen. Außerdem ist auch die Anzahl von unterschiedlich hellen, um etwa einen Faktor zwei verstärkten Bildern sehr klein. Klumpige Galaxien dagegen können – wegen der endlichen Breite der Verteilungsfunktion für Verstärkungsfaktoren – prinzipiell von allen Quellen mit y < 1 helle Doppelbilder mit großem Helligkeitsverhältnis erzeugen. Deswegen ist deren Anzahl für ε 6= 0 ungleich Null. Auch, daß ihr Anteil für steile Leuchtkraftfunktionen ein Maximum ausbildet, läßt sich verstehen: Bereits unter 8.1.2 wurde besprochen, daß sehr stark verstärkte Quasarbilder im Mittel auch ein hohes Helligkeitsverhältnis haben müssen, wenn ε 6= 0 ist. Das heißt, daß mit zunehmendem Mindestfluß der Quasare, also mit zunehmender Gesamtverstärkung, der Anteil der Quasarbilder mit q 2 [10; 100] wieder abnehmen muß, weil eine wachsende Zahl von Bildern wegen zu großen Helligkeitsverhältnisses aus dem Beobachtungsbereich fällt. Konstante Flächenmassendichte 48 Mit wachsender Klumpigkeit der Galaxien wird der Anteil stark verstärkter Einzelbilder größer. Der Anteil von Doppelbildern mit q 2 [10; 100] nimmt dann ab, wodurch verständlich wird, warum die Kurven für ε = 0:5 höher als die für ε = 1 liegen. 8.2 Auswirkungen einer konstanten Flächenmassendichte Werden die Linsen in eine konstante Flächenmassendichte eingebettet, wie sie der Anwesenheit von intergalaktischer Materie entspricht, ändert sich der Anteil aufgelöster Quasarpaare. Wie unter 2.4.3 erläutert, vergrößert sich dadurch der maximale Bildabstand ebenso wie die Gesamtverstärkung. In 5.3 war ergänzt worden, daß der zugehörige Wirkungsquerschnitt entsprechend wächst. Es ist also zu erwarten, daß eine konstante Flächenmassendichte den Anteil beobachteter Quasarpaare anhebt. In welchem Ausmaß das geschieht, wird im folgenden untersucht. Wir legen dazu den Galaxienradius R auf 40 kpc fest, variieren die Klumpigkeit zwischen 0,0.5 und 1, setzen als maximales Helligkeitsverhältnis q = 10 ein und beschränken den Bildabstand auf Werte ϑ größer als θ . Für den Leuchtkraftindex ν wählen wir 4, für λ = 1, um die maximale Auswirkung zu demonstrieren. Die Konvergenz κ0 , die zu der zusätzlichen Flächenmassendichte Σ0 gehört, wird folgendermaßen bestimmt: Wie erwähnt (siehe 6.3), hängt κ0 von der Rotverschiebung in der Weise κ0 = ab. Wir schreiben das um in κ0 = 4πGDl Dlq Σ0 Dq 4πG H0 Dl Dlq Σ0 H0 Dq =: κ 0 H0 Dl Dlq : Dq Diese Schreibweise hat den Vorteil, daß der entfernungsabhängige Faktor ebenso wie die Flächenmassendichte dimensionslos werden. Wir wählen κ0 2 f0:0; 0:1; ; 0:5g, was mit H0 = 50kms,1 Mpc,1 Flächenmassendichten von Σ0 2 f0:0; 2:8; ; 13:8g 107M kpc,2 bedeutet. Wir berechnen dann für jeden Wert von ε die fünf Quotienten aus den Anteilen aufgelöster Quasarpaare mit und ohne Flächenmassendichte, fassen die sich ergebenden fünf Kurven in je einem Diagramm zusammen und stellen die drei Diagramme auf einer Seite in Anhang B zusammen. Die Abszisse ist der Mindestfluß in der gewohnten Skalierung in Größenklassen; die Ordinate ist linear und gibt an, um wieviel Prozent der beobachtete Anteil von Quasarpaaren mit höher als derjenige ohne Flächenmassendichte ist. Unabhängig von ε liegt das Niveau der Kurven umso höher, je größer die Flächenmassendichte ist. Das entspricht den Erwartungen, denn umso mehr Quasare werden wegen des zunehmenden Wirkungsquerschnitts doppelt abgebildet. Für kleine Flüsse ist der Einfluß konstant und von der Klumpigkeit der Galaxien unabhängig. Die Maxima in den Kurven zeigen an, daß der Anstieg im Anteil aufgelöster Quasarpaare mit steigender Flächenmassendichte steiler wird, was der Diskussion aus 5.3 zufolge zu erwarten war. Der anschließende Anstieg der Kurven für zunehmende Mindestflüsse der Quasare deutet zudem darauf hin, daß der Einfluß der zusätzlichen Flächenmassendichte umso größer wird, je stärker die betrachteten Quasare verstärkt sein müssen. Auch das entspricht den Erwartungen aus 5.3, denn dort war erläutert worden, daß hohe Verstärkungsfaktoren gegenüber geringen wahrscheinlicher werden. Die Ergebnisse zeigen, daß der Anteil geeignet abgebildeter Quasare durch eine zusätzliche Flächenmassendichte innerhalb sehr weiter Grenzen beeinflußt werden kann. Mit den gewählten Werten für κ0 bleiben wir aber im linearen Bereich, in dem die betrachteten Quotienten annähernd proportional zu κ0 sind – erkennbar an dem parallelen Verlauf der Kurven. Nichtlineare Effekte, wie sie bei höheren Flächenmassendichten zu erwarten sind, berücksichtigen wir hier also nicht. Die Existenz der luminous arcs“ (vgl. [26]) deutet aber darauf hin, daß Nichtlinearität in manchen ” Situationen durchaus wichtig werden kann. 8.3 Zusätzliche Forderungen Bei der Beantwortung der Frage, ob es sich bei einem beobachteten Quasarpaar tatsächlich um ein Objekt handelt, das durch Gravitationslinsen abgebildet wurde, dient als wichtiges Argument, ob man die Linse sehen kann oder nicht. Wir gehen deswegen hier der Frage nach, unter welchen Bedingungen die Vordergrundgalaxie beobachtet werden kann. Zusätzliche Forderungen 49 8.3.1 Bedeutung der Helligkeit der Linse Läßt man zunächst außer acht, daß die Linse u.U. von den abgebildeten Quasaren überstrahlt und deswegen der Beobachtung entzogen wird, bleibt als einzige Beschränkung, daß sie hell genug sein muß, um die untere Empfindlichkeitsschwelle des Teleskops zu übersteigen. Es gibt eine scheinbare Grenzgröße m0 , die der Beobachtung gerade noch zugänglich ist. Ist DL die Leuchtkraftdistanz zur Linse, ∆ die Einheitsentfernung 10 pc und M die absolute Helligkeit der Sonne, erhält man als minimale Leuchtkraft L0 = DL ∆ 2 100 4 M : ( ,m0 ) L : Es ist also L0 (1 + z)4 D2 (z)L = 100:4(M,m0 ) : L ∆2 L Diesen Wert muß die skalierte Leuchtkraft der Galaxien übersteigen, wenn sie beobachtet werden sollen. Das bedeutet lediglich eine Änderung der Funktion f , die in (48) eingeführt wurde. Sie geht über in Z zq H02 dz [h(z; zq )Γ(ν + 2; l )] ; f 0 (δ; Ω; ϑ; zq ) = D20 (zq ) 0 l0 = l := max(lmin ; l0 ): Darin ist ausgedrückt, daß die Leuchtkraft der Linsen groß genug sein muß, um sowohl die gewünschte Bildaufspal- Abbildung 12: die Funktion f 0 für zq Grenzgrößen = 2; δ = 0:5; Ω = 1 in Abhängigkeit von ϑ=θ für 6 verschiedene scheinbare tung als auch die nötige scheinbare Helligkeit zu erreichen. In Abbildung (12) ist f 0 für zq = 2; δ = 0:5 und Ω = 1 als Funktion von ϑ=θ dargestellt. Die sechs Kurven sind für die scheinbaren Grenzgrößen m0 2 f20; 21; :::; 25g gerechnet. Ihre Form läßt sich so verstehen: Ist ϑ klein, reicht bereits eine kleine Leuchtkraft der Linsen aus, um eine Zusätzliche Forderungen 50 derartige Bildaufspaltung zu erreichen. Die dann entscheidende, von ϑ unabhängige Bedingung ist, daß die Galaxie hell genug sein soll, um gesehen zu werden. Deshalb geht f 0 für kleine ϑ gegen einen konstanten Wert, der umso kleiner ist, je kleiner die Grenzgröße ist. Für große ϑ spielt die Sichtbarkeitsbedingung keine Rolle mehr, weil Galaxien, die entsprechend stark aufspalten, in jedem Fall beobachtet werden können. f 0 nähert sich dann asymptotisch an f aus Abbildung (10) an. Der Anteil aufgelöster Quasare F verringert sich, wenn im Vordergrund die verantwortliche Linse zu sehen sein soll, um den Faktor f 0 = f . In Abbildung (13) wurde dieser Faktor für die sechs oben erwähnten Grenzgrößenklassen dargestellt. Man sieht daran besonders deutlich, daß für große Mindestabstände der Bilder die zusätzliche Forderung an die Leuchtkraft bedeutungslos ist. Für geringe Bildaufspaltung hingegen wird der Anteil der beobachteten Quasarpaare deutlich verringert. Abbildung 13: der Quotient f 0 = f für dieselben Parameter wie im vorigen Bild 8.3.2 Berücksichtigung möglicher Überstrahlung Nun soll zusätzlich in Betracht gezogen werden, daß eine Vordergrundgalaxie auch dann nicht mehr beobachtet werden kann, wenn sie zwar hell genug ist, aber von dem abgebildeten Quasar überstrahlt wird. Dann werden die Linsen überall dort nicht erkannt, wo die Gesamthelligkeit der Quasarbilder um mehr als einen Faktor ρ größer ist als die der Linse. Wird der Quasar um einen Faktor µ verstärkt und sind µSQ und S die Energieflußdichten von Quasar und Galaxie, muß die Bedingung ρ SQ S =: SQ;max µ erfüllt sein. Eine Galaxie mit der Rotverschiebung z liefert die Flußdichte S, wenn ihre skalierte Leuchtkraft l= L L = ζ(z)S L beträgt. Wir betrachten nun zunächst die Wahrscheinlichkeit, mit der ein Quasar mit der Rotverschiebung zq von einer Galaxie, von der der Fluß S beobachtet wird und die bei einer Rotverschiebung von z steht, mit bestimmten Eigenschaften E doppelt abgebildet und insbesondere um einen Faktor µ verstärkt wird. Zusätzliche Forderungen 51 Zunächst ist die Fläche in der Quellenebene, die von Linsen mit einer Rotverschiebung zwischen z und z + dz sowie einer Leuchtkraft zwischen l und l + dl so überdeckt wird, daß innerhalb ihrer eine Quelle um einen Faktor aus [µ; µ + dµ] verstärkt wird, gleich = dA 4πψ20 (z) dz p H03 (1 + z)2 1 + Ωz (1 + z) 3 Φ(l )H(l , l ) dl dµ ,ζ20 ∂σ ∂µ : In der ersten Zeile steht das Volumen einer Kugelschale bei der Rotverschiebung z mit der Dicke dz, in der zweiten steht die durch die Leuchtkraft parametrisierte Anzahl der Galaxien und in der dritten Zeile schließlich steht der dimensionierte Wirkungsquerschnitt. Die Heaviside-Funktion in der zweiten Zeile gibt an, daß nur ausreichend helle Galaxien berücksichtigt werden. Mit bereits eingeführten Abkürzungen erhält man, wenn man durch 4πD20(zq ) dividiert, die Wahrscheinlichkeit θ2 h(z; zq ) ∂σ p dzdldµ = , 3 2 lΦ(l )H(l , l ) dzdldµ ∂µ H0 ψ0 (zq ) Die Anzahl der Quasare mit der Rotverschiebung zq und einer skalierten Leuchtkraft größer als `=µ, deren Flußdichte den Wert SQ;max nicht übersteigt, ist δn = k(zq ) Ψ ` µ ,Ψ ζ(zq )ρS L0 µ ; sie verschwindet, wenn die Differenz auf der rechten Seite negativ wird. Integriert man nun das Produkt pδn über µ; l und z, erhält man die Anzahl von Quasarpaaren mit den festgelegten Eigenschaften, die zudem die Vordergrundgalaxie nicht überstrahlen. Ersetzt man in δn den Fluß S durch die skalierte Leuchtkraft l und schreibt anstelle der RRR Quasarleuchtkraft ` die dimensionslose Größe s, bekommt man für dµdldz ( pδn): dn0 dzq := dn(E ; s; zq ) dzq θ2 +k(zq ) H03 ψ20 (zq ) Z 1 ∞ ∂σ(E ; µ) dµ ∂µ Z zq 0 Z dz h(z; zq ) ∞ l L ρζ(zq )l dl Φ(l )dlΨ L0 µζ(z) : Der erste Summand ist das bisherige Resultat (51). Der zweite ist negativ, weil ∂σ=∂µ negativ ist. Er verringert also das ursprüngliche Ergebnis. In Abbildung (14) zeigen wir den zweiten Summanden in Abhängigkeit von ϑ=θ für ein maximales Helligkeitsverhältnis der Quasarbilder von 10, eine Quellenrotverschiebung von zwei, und die Leuchtkraftindices λ = 1 und ν = 4. Der Faktor ρ wurde ebenfalls auf 10 festgelegt. Das bedeutet, daß die Vordergrundgalaxien um nicht mehr als 2.5 Größenklassen schwächer als die Gesamthelligkeit der Quasarbilder sein dürfen. Für die Grenzgrößenklasse der Galaxien wurden die sechs Werte m0 2 f20; 21; ; 25g eingesetzt; daher auch die sechs Kurven im Diagramm. Die Kurven zeigen genau dasselbe Verhalten wie die aus Abbildung (12). Die Interpretation ist völlig analog, weil die Abhängigkeit vom Mindestfluß der Quasare noch nicht mit einbezogen wurde. Auf sie allein wirkt die hier zusätzlich eingeführte Bedingung, daß die Linsen nicht überstrahlt werden sollen. Um den Einfluß dieser Forderung zu verdeutlichen, berechnen wir die Größe 1+ dn0 dn als Funktion des Mindestflusses s für drei verschiedene Werte von ϑ (ϑ=θ 2 f0:5; 1; 1:5g). Leuchtkraftindices und Quellenrotverschiebung bleiben ebenso dieselben wie ρ und q; für m0 nehmen wir nur den Wert m0 = 25 an. Die drei Kurven für die verschiedenen Mindestwinkelabstände wurden in ein Diagramm (Abbildung (15)) gezeichnet. Schlußbemerkungen 52 Abbildung 14: Korrektur des Anteil aufgelöster Quasarpaare zur Berücksichtigung möglicher Überstrahlung; Abszisse: ϑ=θ Es zeigt sich, daß für kleine Mindestflüsse der betrachtete Quotient gegen eins geht. Die Beschränkung auf solche Quasare, deren Bilder die abbildende Galaxie nicht überstrahlen, bedeutet dann keine merkliche Verringerung der beobachteten Paare. Mit zunehmendem s fällt der Quotient steil auf Null ab. Dieser Abfall geschieht bei umso kleineren Mindestflüssen, je größer der minimale Bildabstand wird. Je größer der Mindestfluß der Quasare wird, umso größer muß auch der Fluß werden, der von den Galaxien beobachtet wird, weil sie sonst überstrahlt würden. Die Linsen müssen deswegen entweder besonders leuchtkräftig sein oder in geringer Entfernung stehen; beides schränkt ihre Anzahl drastisch ein; das erklärt den steilen Abfall der Kurven. Ferner sollen sie leuchtkräftig genug sein, um eine bestimmte minimale Bildaufspaltung zu erzeugen. Das bedeutet, daß mit zunehmender Bildaufspaltung der Mindestfluß der Quasare größer werden muß, damit die ohnehin schon hellen Galaxien überstrahlt werden. Deshalb setzt der Abfall dann erst bei größeren Mindestflüssen ein. 8.4 Schlußbemerkungen Was hat sich nun ergeben? Mikrolinsen haben einen Einfluß auf die Quasarstatistik, und zwar in zweierlei Weise: Erstens gewinnt der Radius der Linsen an Bedeutung, zweitens nimmt das mittlere Helligkeitsverhältnis der beobachteten Quasarbilder zu. Je größer die Radien der Linsen-Galaxien werden, desto kleiner wird der Anteil aufgelöster Quasarpaare an allen beobachteten Quasaren, weil umso mehr helle Einzelbilder entstehen. Ohne die Anwesenheit von Mikrolinsen dagegen sind die Quasarzählungen völlig unempfindlich gegen Änderungen des Linsenradius. Da man aber die Größe15 typischer Galaxien nur sehr unvollkommen kennt und schon gar keinen Einfluß auf sie nehmen kann, lassen sich aus diesem Ergebnis kaum Vorhersagen über die Quasarstatistik ableiten. Vielmehr wäre es prinzipiell möglich, aus 15 Größe“ ist hier ein Begriff, der sowohl den Radius der Galaxien meint, bis zu dem sie als isotherme Sphäre behandelt werden können, als ” auch denjenigen, bis zu dem Mikrolinsen auftreten können. Schlußbemerkungen 53 Abbildung 15: Korrekturfaktor zur Berücksichtigung der Überstrahlung als Funktion des Mindestflusses s Quasarzählungen dann Rückschlüsse auf die Radien beteiligter Linsen-Galaxien zu ziehen, wenn man sich über den Anteil von Mikrolinsen an Galaxien anderweitig Anhaltspunkte verschafft hätte. Solche Anhaltspunkte würden aus dem zweiten Ergebnis folgen, da eine verhältnismäßig große Häufigkeit von Quasarbildern mit großen Helligkeitsunterschieden nicht das Werk glatter Galaxien sein kann. Mikrolinsen müssen dann eine Rolle spielen, wenn insbesondere in einem sample heller Quasare eine signifikante Anzahl solcher Doppelbilder gefunden würde. Leider existieren bislang keine in irgendeinem Sinn vollständigen Quasarsamples; große Anstrengungen werden jedoch unternommen, solche zu gewinnen. Dennoch scheint die Tatsache, daß unter den elf bislang akzeptierten, durch Gravitationslinsen erzeugten Mehrfachquasaren sich drei befinden, bei denen das Helligkeitsverhältnis der Bilder größer als etwa zehn ist, bereits deutlich darauf hinzuweisen, daß Mikrolinsen in Betracht gezogen werden müssen. Darüber hinaus wurde klar, daß nicht reine Ansammlungen von Mikrolinsen am effektivsten für die Entstehung deutlich verschieden heller Mehrfachbilder sind, sondern Kombinationen von Mikrolinsen und glatt“ verteilter Materie wie etwa Gas oder Staub. Gerade diese Situation, die tatsächlich in Galaxien vorliegt, ” ist also besonders gut geeignet, große Helligkeitsunterschiede in Mehrfachquasaren zu erzeugen. Unglücklicherweise wissen wir wenig bis nichts über die typische Dichte des intergalaktischen Gases, das sich in Galaxienhaufen befindet und in das die Linsen-Galaxien eingebettet sind. Wie gezeigt, beeinflußt aber eine solche zusätzliche Materieverteilung die beobachteten Quasarzählungen erheblich. Auch hier gilt wieder, daß dieser Mangel an Kenntnis keine Schlüsse auf die Quasarstatistik erlaubt, sondern eher die Quasarstatistik Rückschlüsse auf die Materiedichte in Galaxienhaufen, falls alle anderen unbekannten Größen bekannt wären. Damit verbunden wären auch Hinweise auf die Dichte dunkler Materie möglich. In der Arbeit von Turner, Ostriker und Gott [40] nehmen die Autoren eine Flächenmassendichte von κ0 = 4:3 an; dieser Wert entspricht 1:2 109 Sonnenmassen pro kpc2 . Es ist die maximal mögliche Flächenmassendichte, die gewährleistet, daß überall zwischen den Quellen und dem Beobachter κ0 unter dem kritischen Wert eins bleibt. Es scheint, als hätte dieses Argument die Wahl der Dichte stärker beeinflußt als tatsächlich bekannte Daten. Schließlich wird klar, wie groß der Einfluß der Leuchtkraftindices auf die Quasarzählungen ist – dieser ist allerdings unabhängig davon, ob Mikrolinsen von Bedeutung sind oder nicht. Die Kurven, die den Anteil aufgelöster Qua- Markovs Methode 54 sarpaare an allen beobachteten Quasaren in Abhängigkeit von deren Mindestfluß zeigen, deuten an, daß ihr Anstieg mit zunehmendem Mindestfluß umso steiler ist, je steiler die Leuchtkraftfunktion der Quasare für große Leuchtkräfte abfällt. Auch hier gäben also möglichst vollständige Quasarzählungen zumindest im Prinzip ein Mittel an die Hand, den größeren Leuchtkraftindex einzugrenzen. Nachdem der kleinere Index durch Gravitationslinsen nicht verändert wird, kann er direkt aus Quellenzählungen bestimmt werden. Abschließend sei darauf hingewiesen, daß dieser Arbeit zwei wesentliche Einschränkungen zugrunde liegen: Einerseits werden Quellen als punktförmig angenommen, andererseits sind Linsen sphärisch symmetrisch und ihre radiale Dichteverteilung ist singulär. Ginge man von nicht-singulären Linsen aus, würde die Anzahl der Bilder ungerade. Ein Teil der Bilder wäre dann nicht mehr auflösbar, weil sie zu dicht beieinander stünden. Eine Störung der sphärischen Symmetrie würde außerdem die Struktur der Kaustiken der Linse verkomplizieren. Zöge man ausgedehnte Quellen in Betracht, würden die betrachteten Effekte durch Mittelung über deren Fläche kleiner werden. Dennoch scheint unser Modell nahe genug an der Wirklichkeit zu sein, um zumindest prinzipielle Aussagen über die Bedeutung von Mikrolinsen zu erlauben. Entscheidend dafür ist nicht das spezielle, hier sehr einfach gewählte Modell, sondern letztendlich die endliche Breite der Wahrscheinlichkeitsverteilung für Verstärkungsfaktoren mit den geschilderten Konsequenzen. A Vier Nachträge A.1 Berechnung der Wahrscheinlichkeitsverteilungen nach Markovs Methode A.1.1 Wahrscheinlichkeitsverteilung für die Scherung Zunächst muß die charakteristische Funktion C2 berechnet werden: (~ C2 T ) = Führt man Polarkoordinaten ein, N Z Z 1 πR2 i i i ~ ~ (~ i )) dϕ x dx exp(iT S x (57) : T := T (cos β; sin β)t ; ~ erhält man für den Ausdruck in eckigen Klammern: ] = Z RZ 2π [ 0 0 1 T dϕrdr 2 exp i 2 (cos 2ϕ cos β + sin2ϕ sin β) πR r : Die Winkelintegration kann geschrieben werden als: Z 0 Z 2π = dϕ cos 0 2π T dϕ exp i 2 cos(2ϕ , β) r iT cos(2ϕ , β) r2 Z 2π +i dϕ sin 0 iT cos(2ϕ , β) r2 : Nach den Gleichungen 3.715.13 und 3.715.18 aus [19] verschwindet der zweite Summand, und für den ersten ergibt sich T 2πJ0 2 ; r worin J0 die Besselfunktion 0. Ordnung ist. Es bleibt das Integral Z 0 R 2 rdr 2 J0 R T r2 auszuführen. Mit der Substitution Tr,2 =: z bringt man es auf die Form Z∞ Z∞ 1 dz z0 dz 2 [J0 (z) , 1] + z0 ; 2 z z0 z0 z Zum Jaynesschen Prinzip 55 wenn z0 := TR,2 gesetzt wird. Der zweite Summand ist konstant gleich 1, während der erste nach Gleichung 11.4.18 aus [1] in erster Ordnung von z0 gleich ,z0 ist. Damit erhält man schließlich aus (57) im Grenzübergang R ! ∞, also z0 ! 0: T N TN i~T~S he i = 1 , R2 = exp , R2 : Wegen R2 = N=κ folgt: heiT S i = exp(,Tκ ) ~~ : Dementsprechend gewinnt man durch Fourierinversion von C2 : p(S1 ; S2 ) = Schreibt man auch ~S in Polarkoordinaten, 1 (2π)2 Z Z ∞ 2π dβTdT 0 e,Tκ e,iT S : ~~ (58) 0 S := S(cosϑ; sin ϑ)t ; ~ wird das Winkelintegral in (58) zu Z 2π 0 dβ exp[,iTS(cosϑ cos β + sinϑ sin β)] analog zu oben. Nun bleibt noch 1 2π Z 0 ∞ = 2πJ0 (TS); dT Te,Tκ J0 (T S) auszurechnen. Es ist darstellbar als 1 d , 2π d (κ ) Z 0 ∞ i 1 d h 2 2 ,1=2 dT e,Tκ J0 (TS) = , (κ + S ) ; 2π d (κ ) vgl. Gleichung 6.611.1 in [19]. Die Wahrscheinlichkeitsverteilung für die Komponenten der Scherung ist damit bestimmt: 1 κ p(S1 ; S2 ) = : (59) 2π (κ2 + S2 )3=2 A.2 Anmerkung zum Jaynesschen Prinzip In 4.2.3 wurden die Parameter α und β in die Wahrscheinlichkeitsverteilung eingeführt, die zunächst noch unbekannt sind. Eine überzeugende Möglichkeit, sie zu wählen, wäre die folgende: Ein Maß für den Informationsgehalt einer Wahrscheinlichkeitsverteilung ist das Shannonsche Funktional Z S ∝ , p ln p: Wählt man eine Wahrscheinlichkeitsverteilung so, daß sie unter gegebenen Bedingungen dieses Funktional minimiert, enthält sie die geringstmögliche über diese Bedingungen hinausgehende Information, also gewissermaßen das geringstmögliche Vorurteil (siehe dazu die Arbeit von Jaynes [22]). Unglücklicherweise steigt das Shannonsche Funktional für die Wahrscheinlichkeitsverteilung (36) streng monoton in α und β an, so daß daraus keine Informationen über die günstigste Wahl dieser Parameter gewonnen werden kann. Es zeigt sich aber, daß die unter Kapitel 5 berechneten Wirkungsquerschnitte, zu deren Bestimmung die Wahrscheinlichkeitsverteilung ausschließlich dient, äußerst unempfindlich gegen Veränderungen derselben sind, solange sie die Eigenschaft haben, für große Verstärkungsfaktoren µ wie µ,3 abzufallen. Skalierung 56 A.3 Bilder einer Quelle nahe einer Kaustik Sei ~x0 ein Punkt auf einer kritischen Linie und ~y0 sein Bild in der Quellenebene. Für ~x0 gilt also (det A)(~x0 ) = 0 und y liegt auf einer Kaustik. Das Koordinatensystem sei so gewählt, daß A in ~x0 diagonal ist und dort die Form ~0 A= a 0 0 b mit b = 0 annimmt. In der Umgebung von ~x0 kann A dann geschrieben werden als A= a0 + ∇a d~x 0 0 ∇b d~x wobei ∇b senkrecht auf der kritischen Linie steht. Ein Punkt mit den Koordinaten ~x0 + d~x wird dann auf die Position y + d~y abgebildet, wobei d~y = A(~x0 + d~x) d~x ~0 ist. Eine Quelle am Ort ~y0 + (0; dy)t wird also abgebildet auf x ~0 + 0; s dy b;2 !t ; d.h. auf zwei Punkte beiderseits der und im gleichen Abstand zur kritischen Linie. (b;2 steht für ∂b=∂x2.) Die Verstärkungsfaktoren der beiden Bilder sind p µ1;2 = (a0 b;2 dy),1 ; sie sind also gleich hell und von unterschiedlicher Parität. A.4 Zur Skalierungseigenschaft der Wahrscheinlichkeitsverteilung In 4.2.1 wurde K definiert als K= r κ 1 p E π (u0 , v0) u0 + v0 2v0 u0 + v0 ! : Unter Berücksichtigung von κ0 lauten u0 und v0 : u0 = v0 = , κ0)2 ũ0 2 0 (1 , κ0 ) ṽ (1 ; : Hier wie im Hauptteil steht die Tilde für solche Größen, bei denen κ0 bereits durch die Skalierung berücksichtigt wurde. Setzt man nun u0 , v0 und κ0 in K ein , erhält man: K= 1 (1 , κ0)2 K̃ : Die Konstanten A und B waren bestimmt worden zu B = β+1 f 2 hµi(1 + α)(2 + α) , 4K ; f hµi(α + 1) f (1 , f )hµi(2 + α) , 4K A = 1, 4K 2 f hµi(1 + α)(2 + α) Bβ+1 Bµ e : Γ(β + 1) Geht man hierin davon aus, daß der Faktor f nicht skaliert und setzt die Skalierung für hµi und K ein, folgt unmittelbar: B = A = , κ0)2 B̃ 2β 2 (1 , κ0) Ã (1 ; + : Skalierung 57 Für den inneren Bereich der Galaxie hatten wir f = 1 , ε=2 gewählt. Er skaliert in der Tat nicht, weil ε von κ0 unabhängig ist. Im äußeren Bereich dagegen hatten wir f = (1 , ε(1 , 1=hµi) gesetzt, um den Satz von Schneider zu erfüllen. Diese Definition wird dann unabhängig von der Skalierung, wenn man sie abwandelt in f = 1,ε Damit skaliert dann in jedem Fall µ ebenso wie hµi. B Diagramme (1 , κ0)2 hµi : Anteil aufgelöster Quasarpaare B.1 Anteil aufgelöster Quasarpaare an allen beobachteten Quasaren F als Funktion von s; ε = 0; q = 10; R = 20kpc F als Funktion von s; ε = 0; q = 10; R = 30kpc F als Funktion von s; ε = 0; q = 10; R = 40kpc 58 Anteil aufgelöster Quasarpaare F als Funktion von s; ε = 0:5; q = 10; R = 20kpc F als Funktion von s; ε = 0:5; q = 10; R = 30kpc F als Funktion von s; ε = 0:5; q = 10; R = 40kpc 59 Anteil aufgelöster Quasarpaare F als Funktion von s; ε = 1; q = 10; R = 20kpc F als Funktion von s; ε = 1; q = 10; R = 30kpc F als Funktion von s; ε = 1; q = 10; R = 40kpc 60 Großes Helligkeitsverhältnis B.2 61 Anteil aufgelöster Quasarpaare mit Helligkeitsverhältnis zwischen q = 10 und q = 100 ∆F als Funktion von s; ε = 0; R = 30kpc ∆F als Funktion von s; ε = 0:5; R = 30kpc ∆F als Funktion von s; ε = 1; R = 30kpc Konstante Flächenmassendichte B.3 Steigerung des Anteils aufgelöster Quasarpaare durch zusätzliche Flächenmasse prozentuale Erhöhung von F durch κ0 als Fkt. von s; ε = 0 prozentuale Erhöhung von F durch κ0 als Fkt. von s; ε = 0:5 prozentuale Erhöhung von F durch κ0 als Fkt. von s; ε = 1 62 Literaturverzeichnis 63 Literatur [1] Abramowitz, M., Stegun, I. 1965, Handbook of Mathematical Functions (New York: Dover) [2] Binney, J., Tremaine, S., 1987, Galactic Dynamics (Princeton: Princeton University Press) [3] Blandford, R., Kochanek, C. 1987, in: Dark Matter in the Universe, ed. Bahcall, J., Piran, T., Weinberg, S. (Singapore: World Scientific) [4] Blandford, R., Narayan, R. 1986, Astrophys. Journal 310, 56 [5] Borgeest, U., Refsdal, S. 1982a, Sterne u. Weltraum 21, 199 [6] Borgeest, U., Refsdal, S. 1982b, Sterne u. Weltraum 21, 244 [7] Canizares, C. 1981, Nature 291, 620 [8] Canizares, C. 1982, Astrophys. Journal 263, 508 [9] Chang, K., Refsdal, S. 1984, Astron. Astrophys. 132, 168 [10] Dyer, C., Roeder, R. 1972, Astrophys. Journal 174, L115 [11] Dyer, C., Roeder, R. 1973, Astrophys. Journal 180, L31 [12] Ehlers, J., Survey of General Relativity Theory, in: Relativity, Astrophysics, and Cosmology, ed. Israel,W. (Dordrecht: D. Reidel) [13] Ehlers, J. 1989, Vorlesung über Allgemeine Relativitätstheorie, Teil 2 (unveröffentlicht) [14] Ehlers, J., Schneider, P. 1986, Astron. Astrophys. 168, 57 [15] Einstein, A. 1916, Annalen d. Physik 49, 50 [16] Faber, S., Jackson, R. 1976, Astrophys. Journal 204, 668 [17] Futamase, T. 1989, Monthly Not. of the Royal Astron. Soc. 237, 187 [18] Futamase, T., Sasaki, M. 1989, RITP Hiroshima University Communications [19] Gradshteyn, I., Ryzhik, I. 1980, Table of Integrals, Series, and Products (New York: Academic Press) [20] Grossman, S., Narayan, R. 1988, Astrophys. Journal 324, L37 [21] Heisler, J., Ostriker, J. 1988, Astrophys. Journal 325, 103 [22] Jaynes, E. 1957, Physical Review 106, 620 [23] Kantowski, R. 1968, Astrophys. Journal 155, 89 [24] Kirshner, R., Oemler, A., Schecter, P. 1979, Astron. Journal 84, 951 [25] Linder, E., Schneider, P. 1988, Astron. Astrophys. 204, L8 [26] Lynds, R., Petrosian, V. 1989, Astrophys. Journal 336, 1 [27] Misner, C., Thorne, K., Wheeler, J. 1973, Gravitation (San Francisco: Freeman) [28] Press, W., Gunn, J. 1973, Astrophys. Journal 185, 397 [29] Refsdal, S. 1964, Monthly Not. of the Royal Astron. Soc. 128, 295 [30] Schechter, P. 1976, Astrophys. Journal 203, 297 Literaturverzeichnis [31] Schneider, P. 1984, Astron. Astrophys. 140, 119 [32] Schneider, P. 1985, Astron. Astrophys. 143, 413 [33] Schneider, P. 1986, Astrophys. Journal 300, L31 [34] Schneider, P. 1987a, Astrophys. Journal 316, L7 [35] Schneider, P. 1987b, Astrophys. Journal 319, 9 [36] Schneider, P. 1987c, Astron. Astrophys. 179, 71 [37] Schneider, P. 1987d, Astron. Astrophys. 179, 80 [38] Schneider, P., Weiss, A. 1988, Astrophys. Journal 327, 526 [39] Sexl, R., Urbantke, H. 1975, Gravitation und Kosmologie (Mannheim: BI) [40] Turner, E., Ostriker, J., Gott III, R. 1984, Astrophys. Journal 284, 1 [41] Uson, J., Wilkinson, D. 1984, Astrophys. Journal 277, L1 [42] Weinberg, S. 1972, Gravitation and Cosmology (New York: J. Wiley) [43] Weinberg, S. 1976, Astrophys. Journal 208, L1 [44] Young, P. 1981, Astrophys. Journal 244, 756 64 Dank 65 Danken möchte ich Herrn Professor Ehlers, der die Betreuung dieser Arbeit übernommen hat. Herr Dr. Peter Schneider hatte die Idee zu dieser Arbeit. Er stand meinen Fragen immer zur Verfügung und half mir, wo immer ich Hilfe brauchte. Sein geduldiges Erklären lichtete den Urwald meiner oft falschen und wirren Vorstellungen. Sein Beistand beschränkte sich nicht auf das Fachliche; stellvertretend für manches andere seien die aufmunternden Getränke erwähnt. Helmut Erdl, Michael Freyberg und Paul Haines sorgten für ein sehr angenehmes Klima in unserem Arbeitszimmer. Auch die Diskussionen mit ihnen waren mir eine große Unterstützung. Schließlich war das Max-Planck-Institut ein sehr angenehmer Ort dank der Hilfsbereitschaft und Freundlichkeit seiner Mitarbeiter. Herr S. Cray darf nicht unerwähnt bleiben: Seine Erfindung beschleunigte viele meiner Rechnungen.