Mathematische Modellierung mit Differentialgleichungen Prof. Dr. Ansgar Jüngel Fachbereich Mathematik und Informatik Johannes Gutenberg-Universität Mainz Sommer 2003 unkorrigiertes Vorlesungsskript Inhaltsverzeichnis 1 Modellbildung und Asymptotik 1.1 Grundzüge der Modellbildung . . . . . . . . . . . . . . 1.2 Skalierungen . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Schwingungen . . . . . . . . . . . . . . . . . . . . . . . 1.4 Ein wenig Theorie gewöhnlicher Differentialgleichungen 1.5 Regulär und singulär gestörte Probleme . . . . . . . . . 2 Dynamik 2.1 Populationsmodelle . . . . . 2.2 Ein Modell für Aids . . . . . 2.3 Chemische Reaktionskinetik 2.4 Ein Wirtschaftsmodell . . . 2.5 Elektrische Schaltkreise . . . 2.6 Himmelsmechanik . . . . . . 2.7 Deterministisches Chaos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 5 11 19 25 . . . . . . . 34 34 39 44 49 55 60 68 3 Wellenphänomene 73 3.1 Wellengleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.2 Schrödingergleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 3.3 Computertomographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 1 4 Strömungen 4.1 Verschmutzung eines Flusses . 4.2 Verkehrsflüsse . . . . . . . . . 4.3 Strömungsmechanik . . . . . . 4.4 Bluttransport durch Adern . . 4.5 Strömung um einen Tragflügel 4.6 Hele-Shaw-Strömung . . . . . . . . . . . . . . . . . . . . . . . 5 Diffusion 5.1 Diffusionsgleichung . . . . . . . . . 5.2 Ein globales Klimamodell . . . . . 5.3 Selbstentzündung von Kohlehaufen 5.4 Elektronenverteilung in Halbleitern 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 93 97 105 113 115 123 . . . . . . . . . . . . . . . . 130 . 130 . 135 . 141 . 145 1 Modellbildung und Asymptotik 1.1 Grundzüge der Modellbildung Das Grundziel der mathematischen Modellierung ist die Formulierung, Lösung und ggf. Verfeinerung eines mathematischen Modells für ein reales Problem aus der Industrie, Wirtschaft oder Wissenschaft. Obwohl der Weg der mathematischen Modellierung sehr stark von dem konkreten Problem abhängt, wird er immer die folgenden sechs Schritte beinhalten (siehe Abbildung 1.1): 1. Spezifikation des realen Problems, 2. Formulierung eines mathematischen Modells, 3. Analyse des Modells (Vereinfachungen, qualitatives Lösungsverhalten), 4. Lösung des Modells (analytisch oder numerisch), 5. Interpretation der Ergebnisse und Vergleich mit dem Ausgangsproblem, 6. eventuell Verfeinerung des Modells. Diese Schritte können auch mehrmals durchlaufen werden, wenn das mathematische Modell keine zufriedenstellenden Ergebnisse liefert und es geändert oder verfeinert werden muß. Im folgenden erläutern wir die obigen Schritte: 1. Spezifikation des Problems: Zuerst muß das reale Problem präzise spezifiziert werden, um die Fragestellung einzugrenzen. Der Sachverhalt sollte verdeutlicht und die relevanten Daten, Parameter und Variablen müssen identifiziert werden. Es ist zu erwarten, daß der Sachverhalt vereinfacht werden muß. Welches sind die wichtigsten Prozesse oder Variablen? 2. Mathematische Formulierung: Das spezifizierte Problem muß nun mit Hilfe mathematischer Methoden formuliert werden. Welche Techniken sind angemessen? Wie lauten die Größenordnungen der Parameter und Variablen? Sind weitere Vereinfachungen möglich, bzw. gibt es einfache Spezialfälle? 3. Mathematische Analyse: Häufig stellt sich heraus, daß eine anfangs kompliziert erscheinende Gleichung so umformuliert werden kann, daß sie eine einfachere Struktur aufweist oder in eine bekannte Klasse von Gleichungen eingeordnet werden kann, für die bereits mathematische Lösungstechniken existieren. Ist dies hier der Fall? Kann das mathematische Problem oder können Spezialfälle explizit gelöst werden? Meistens sind 3 Mathematisches Modell Reales Problem Spezifikation des Problems Mathematische Formulierung Mathematische Analyse Mathematisches Ergebnis Lösung des Modells Interpretation der Lösung ggf. Verfeinerung des Modells Abbildung 1.1: Der Modellierungskreislauf. numerische Verfahren zur Lösung der Gleichung notwendig. Welche Verfahren sind in diesem Fall angebracht? 4. Lösung des Modells: Nachdem die mathematische Struktur des Problems identifiziert ist, kann das Modell mit Hilfe analytischer und numerischer Methoden gelöst werden. Dafür sind für die Anwendungen geeignete Werte der Parameter zu wählen. Werden numerische Techniken verwendet, ist sicherzustellen, daß die numerische Lösung tatsächlich die Lösung des mathematischen Problems mit hinreichender Genauigkeit approximiert. 5. Interpretation der Lösung: In diesem Schritt wird untersucht, inwiefern die mathematische Lösung das reale Problem approximiert. Stimmt die Größenordnung der Lösung mit der erwarteten Lösung überein? Wie groß ist der Gültigkeitsbereich der Approximation? Können die Resultate durch Experimente validiert werden? 6. Verfeinerung des Modells: Die mathematischen Resultate können Hinweise geben, ob eine in der Modellierung vorgenommene Vereinfachung zu einem unrealistischen Ergebnis führt. In diesem Fall müssen das Modell oder die mathematischen Techniken verbessert werden. Welche Modellierungsannahmen sollen abgeschwächt werden? Müssen verfeinerte numerische Methoden zur Lösung verwendet werden? Dies führt zu einer neuen Spezifikation des realen Problems bzw. zu einer neuen mathematischen Formulierung, und der Modellierungskreislauf beginnt von neuem, bis ein zufriedenstellendes Ergebnis erzielt wird. In den folgenden Kapiteln stellen wir einige konkrete Fragestellungen vor, die wir exemplarisch mittels der obigen Modellierungsschritte lösen. Die Probleme repräsentieren einerseits typische Phänomene wie Dynamik, Wellen, Strömungen und Diffusion und andererseits Beispiele aus verschiedenen Anwendungsgebieten wie Biologie, Chemie, Geowissenschaften, Physik und Wirtschaftswissenschaften. Insbesondere modellieren wir den Krankheitsverlauf HIV-positiver Personen (Biologie), 4 die Ausbreitung von Verschmutzungen im Trinkwasser (Chemie), den Einfluß der Sonneneinstrahlung auf das Weltklima (Geowissenschaften), den Autoverkehr bei Anwesenheit von Ampeln (Physik), die Handelsdynamik zwischen zwei Nationen (Wirtschaftswissenschaften). 1.2 Skalierungen In diesem Abschnitt präsentieren wir ein einfaches Beispiel für die im vorigen Abschnitt erläuterten Modellierungsschritte. Dieses Beispiel erlaubt es uns, gleichzeitig auf einige wichtige Konzepte der Entdimensionalisierung und Skalierung einzugehen. Frage: Werfe einen Gegenstand nach oben. Nach welcher Zeit prallt er wieder auf der Erde auf ? Um diese Aufgabe zu lösen, benötigen wir einige physikalische Gesetzmäßigkeiten, nämlich das Newtonsche Gesetz F = m · a, wobei m die Masse eines Gegenstands, a deren Beschleunigung (Geschwindigkeitsänderung pro Zeiteinheit) und F die auf dem Gegenstand einwirkende Kraft seien; das Gravitationsgesetz F = Gm1 m2 x , |x|3 wobei m1 und m2 die Massen zweier Gegenstände, x deren Abstandsvektor und G die universelle Gravitationskonstante seien; F ist die auf die beiden Gegenstände wirkende Gravitationskraft. Nun können wir beginnen, eine Gleichung für die Bewegung des geworfenen Gegenstands herzuleiten (Schritt 1). Die Frage bedeutet, genauer formuliert, daß ein Gegenstand der Masse m von der Erdoberfläche mit der Anfangsgeschwindigkeit v senkrecht nach oben geworfen wird. Sei R der Erdradius und x(t) die Entfernung des Gegenstandes von der Erdoberfläche zur Zeit t (siehe Abbildung 1.2). Die mathematische Formulierung der obigen Aufgabe lautet dann: Bestimme den Aufprallzeitpunkt T > 0, für den x(T ) = 0 gilt. Um T > 0 zu berechnen, benötigen wir eine Gleichung für x(t). Die Beschleunigung x00 (t) = d2 x/dt2 ist durch das Newtonsche Gesetz mx00 = F 5 m x(t) M R Abbildung 1.2: Geometrie für den nach oben geworfenen Gegenstand. gegeben. Die Kraft F ist die auf den Gegenstand wirkende Gravitationskraft F =− GmM , (x(t) + R)2 wobei M die Erdmasse bezeichne, so daß mx00 = − GmM . (x + R)2 Nach Division durch m und Definition der Gravitationskonstanten der Erde g := GM/R 2 folgt gR2 x00 = − , t > 0. (1.1) (x + R)2 Diese Gleichung ist mit den Anfangsbedingungen x0 (0) = v x(0) = 0, (1.2) zu vervollständigen (Schritt 2). Hierbei haben wir benutzt, daß die Geschwindigkeit x 0 (0) = dx(0)/dt zur Zeit t = 0 gleich v sein soll. Die Gleichung (1.1) ist eine gewöhnliche Differentialgleichung, und das Problem (1.1)–(1.2) ist ein Anfangswertproblem. Wir werden im Abschnitt 1.4 die Theorie gewöhnlicher Differentialgleichungen auffrischen. Das Problem (1.1)–(1.2) enthält drei physikalische Parameter: g, R und v. Um das Problem zu vereinfachen, wollen wir die Gleichung in eine dimensionslose Form mit möglichst wenigen dimensionslosen Parametern umformulieren (Schritt 3). Dazu gehen wir in zwei Schritten vor. Zuerst stellen wir eine Tabelle aller Variablen und Parameter samt Einheiten auf (Tabelle 1.1). Wir verwenden hierbei das cgs-Einheitensystem, d.h. Zentimeter (cm), Gramm (g) und Sekunde (s). Der zweite Schritt besteht darin, für alle Variablen intrinsische Referenzgrößen zu definieren und damit die Variablen zu skalieren. Eine Möglichkeit ist es, den Erdradius R 6 Variable: Dimension cm s cm/s2 cm cm/s x t g R v Parameter: Tabelle 1.1: Auflistung aller Variablen und Parameter. als charakteristische Länge und R/v als charakteristische Zeit zu wählen. Damit erhalten wir dimensionslose Variablen y := x R und τ := t . R/v (1.3) Wie sieht die entsprechende dimensionslose Gleichung aus? Es folgt y 00 = R gR gR2 1 d2 y ³ R ´2 1 d2 x = = − =− 2 2 2 2 2 dτ v R dt v (Ry + R) v (y + 1)2 und R x(0) dy (0) = = 1. dτ v R Setzen wir ε = v 2 /gR, lautet das dimensionslose Problem y 0 (0) = εy 0 = − 1 , (y + 1)2 τ > 0, y(0) = 0, y 0 (0) = 1. (1.4) Bevor wir das Problem (1.4) weiter analysieren, erklären wir genauer die allgemeine Vorgehensweise des Entdimensionalisierens von Gleichungen. Seien dazu die Parameter α1 , . . . , αn gegeben, wobei αk die Einheit cm`k gmk stk (k = 1, . . . , n) besitzen. Wir schreiben dies kürzer als [αk ] = (`k , mk , tk ). Beispielsweise gilt [g] = (1, 0, −2) und [ε] = (0, 0, 0). Sei weiter α ein dimensionsloser Parameter. Wir setzen voraus, daß mathematische Modelle von realen Problemen immer in eine dimensionslose Form gebracht werden können, indem die dimensionslosen Parameter α als Produkte von Potenzen der ursprünglichen Parameter gewählt werden. Daraus folgt, daß Zahlen b1 , . . . , bn existieren, so daß α= n Y k=1 7 αkbk . Um die Exponenten b1 , . . . , bn zu bestimmen, verwenden wir (0, 0, 0) = [α] = = n Y cmbk `k gbk mk sbk tk k=1 à n X b k `k , n X bk m k , bk t k k=1 k=1 k=1 n X ! . Dies ergibt das lineare Gleichungssystem für b1 , . . . , bn mit Koeffizienten `k , mk und tk : n X n X `k bk = 0, k=1 mk bk = 0, k=1 n X tk bk = 0. (1.5) k=1 Nach Voraussetzung besitzt das Gleichungssystem mindestens eine nicht-triviale Lösung. Wieviele (linear unabhängige) Lösungen gibt es? Sei n∗ die Anzahl der linear unabhängigen Lösungen, d.h., n∗ ist die Dimension des Kerns der Koeffizientenmatrix `1 · · · ` n m1 · · · m n . t1 · · · t n Dann ist n∗ die Anzahl der relevanten dimensionslosen Parameter. Sind nämlich b = (b1 , . . . bn ) und eb = (eb1 , . . . ebn ) zwei linear abhängige Lösungen des Gleichungssystems, d.h., b = λeb, so folgt für die entsprechenden Parameter α= n Y αkbk und k=1 α e= n Y k=1 e αkbk , daß α = α eλ , und wir können etwa α e durch α ersetzen. Es gilt (für n ≥ 3) 0 ≤ n∗ < n, denn n∗ = n bedeutet, daß die Koeffizientenmatrix eine Nullmatrix sein muß, und dies würde einem bereits dimensionslosen Problem entsprechen. Im Beispiel des geworfenen Gegenstandes haben wir die Parameter [g] = (1, 0, −2), [R] = (1, 0, 0), [v] = (1, 0, −1) und damit die Koeffizientenmatrix 1 1 1 0 . 0 0 −2 0 −1 Wegen n∗ = 1 existiert genau ein dimensionsloser Parameter, nämlich die Lösung (−1, −1, 2) von (1.5). Dies entspricht unserem Parameter v2 ε=g R v = . gR −1 −1 2 8 Schritt 4 des Modellierungsprozesses ist die Lösung des Problems (1.4). Das Problem kann nicht explizit gelöst werden, so daß wir nach einer geeigneten Vereinfachung suchen. Typische Werte für die Parameter sind v = 102 . . . 104 cm/s, g ≈ 980 cm/s2 , R ≈ 6500 km = 6.5 · 108 cm, so daß (104 )2 = 0.0002 ¿ 1. 1000 · 5 · 108 Weil ε “sehr klein” ist, sind wir versucht, das Problem (1.4) dadurch zu vereinfachen, daß wir ε = 0 in (1.4) setzen: ε≈ 0=− 1 , (y + 1)2 y(0) = 0, y 0 (0) = 1. Dieses Problem besitzt keine Lösung! Was ist schiefgegangen? Die Skalierung (1.3) ist nicht sinnvoll. Das skalierte (dimensionslose) Problem sollte so gewählt werden, daß die dimensionslosen Variablen die Größenordnung eins haben. Ist dies bei der Skalierung (1.3) der Fall? Wir erwarten x = 10 . . . 103 m und t = 1 . . . 100 s. Dann sind y= x 105 = 0.0002, ≈ R 5 · 108 τ= t 102 = 0.002 ≈ R/v 5 · 108 /104 nicht von der Größenordnung eins. Um eine sinnvolle Skalierung zu erhalten, machen wir die Annahme x ¿ R. Daraus folgt, daß die Beschleunigung x00 die Größenordnung |x00 | = gR2 gR2 ≈ =g (x + R)2 R2 hat. Die typische Beschleunigung g ist gleich der Geschwindigkeit v dividiert durch die typische Zeit θ: g = v/θ oder θ = v/g. Andererseits ist die typische Beschleunigung gleich der typischen Länge L dividiert durch das Quadrat der Zeit: g = L/θ 2 oder L = gθ 2 = v 2 /g. Die Referenzzeit und -länge lauten also θ= v 104 ≈ 3 s = 10 s, g 10 L= v2 (104 )2 ≈ cm = 105 cm = 1 km, g 103 und die skalierten Variablen x t , τ := L θ sind von der Größenordnung eins. Mit dieser Skalierung lauten die dimensionslosen Gleichungen y := y 00 = gR2 d2 y θ 2 d2 x 1 1 = = − = − , dτ 2 L dt2 g (v 2 y/g + R)2 (εy + 1)2 9 τ > 0, (1.6) wobei ε = v 2 /gR, und θ 0 x (0) = 1. L Wegen ε ¿ 1 lösen wir das vereinfachte Problem y 0 (0) = y(0) = 0, y 00 = −1, τ > 0, (1.7) y 0 (0) = 1. y(0) = 0, Die Lösung lautet τ2 , τ ≥ 0. 2 Der Aufprallzeitpunkt ist definiert durch y(τ ∗ ) = 0, τ ∗ > 0, also y(τ ) = τ − τ ∗ = 2. Dies beendet Schritt 4. In Schritt 5 interpretieren wir die gefundene Lösung: Dazu transformieren wir die Variablen zurück in die dimensionsbehafteten Variablen: T = θ · τ∗ = 2v . g (1.8) Der Aufprallzeitpunkt ist also proportional zur Anfangsgeschwindigkeit. Typische Werte für T sind 2 · 102 2 · 104 T ≈ . . . s = 0.2 . . . 20 s. 103 103 Wie genau ist dieses Ergebnis bzw. kann es verbessert werden (Schritt 6)? Wir können das Problem (1.6)–(1.7) zwar nicht explizit lösen, sind aber in der Lage, eine implizite Formel für die Lösung anzugeben. Dazu multiplizieren wir (1.6) mit y 0 und integrieren in (0, τ ): Z τ Z τ 1 0 2 0 y 0 (s) ds 1 1 1 0 2 1 y (τ ) − = (y (s) ) ds = − = − . (1.9) 2 2 2 ε(εy(τ ) + 1) ε 0 2 0 (εy(s) + 1) Schreiben wir dy = dτ so folgt Z y(τ ) 0 µ s 2 2 − + 1, ε(εy + 1) ε 2 2 − +1 ε(εy + 1) ε ¶−1/2 dy = Z τ dt = τ, 0 τ ≥ 0. (1.10) Der Aufprallzeitpunkt τ ∗ ist das Doppelte des Umkehrzeitpunktes τ0 , definiert durch y 0 (τ0 ) = 0, denn zur Zeit τ0 hat der Gegenstand seine maximale Höhe erreicht. Aus (1.9) folgt 1 1 1 − , − = 2 ε(εy(τ0 ) + 1) ε 10 also 1 . 2−ε Setzen wir dieses Resultat in (1.10) ein, erhalten wir eine exakte Formel für den Aufprallzeitpunkt: ¶−1/2 Z 1/(2−ε) µ 2 2−ε ∗ τ = 2τ0 = 2 − dy. (1.11) ε(εy + 1) ε 0 y(τ0 ) = Diese Formel macht nur Sinn, wenn ε < 2. Was passiert, wenn ε ≥ 2? Wir haben implizit angenommen, daß der Gegenstand wieder auf der Erdoberfläche aufprallen wird. √ √ Nun bedeutet ε < 2 gerade v < 2gR. Ist die Anfangsgeschwindigkeit größer als 2gR, √ so wird der Gegenstand die Erde für immer verlassen. Der Grenzwert vg := 2gR wird daher Fluchtgeschwindigkeit genannt. Tatsächlich folgt im Fall ε = 2 aus (1.10): Z y(τ ) 0 p 2y + 1 dy = τ, und für τ → ∞ muß das Integral divergieren, was y(τ ) → ∞ impliziert, d.h., der Gegenstand überwindet das Gravitationsfeld der Erde. Diese Bemerkung zeigt, daß die ursprüngliche Fragestellung ungenau formuliert ist. Es ist implizit angenommen, daß die Anfangsgeschwindigkeit v kleiner als die Fluchtgeschwindigkeit ist. Gilt v ¿ vg , d.h. ε ¿ 1, so ist die Formel (1.8) eine akzeptable Approximation. Sie ist gegen 2v T = g Z 1/(2−ε) 0 µ 2−ε 2 − ε(εy + 1) ε ¶−1/2 dy auszutauschen, wenn v nicht sehr viel kleiner als vg ist. Übungsaufgabe: Berechnen Sie das Integral (1.11) numerisch für ε = 1, 1.5, 1.8, 1.9, 1.95, 1.99, und vergleichen Sie die Ergebnisse mit dem approximativen Aufprallzeitpunkt τ ∗ = 2. Übungsaufgabe: Sie werfen einen Stein in einen Brunnen und hören nach t Sekunden den Aufprall. Wie tief ist der Brunnen? 1.3 Schwingungen Ist die Wäsche in einer Waschmaschinentrommel nicht gleichmäßig verteilt, beginnt die Waschmaschine zu vibrieren. Ein Waschmaschinenhersteller muß sicherstellen, daß die Schwingungen nicht zu groß sind, da die Waschmaschine ansonsten die Tendenz hat, sich 11 infolge der Vibrationen von ihrem Standort zu entfernen. Eine Möglichkeit, die Schwingungen zu bremsen, besteht darin, eine Dämpfung in der Schwingungsrichtung einzubauen. Der Hersteller plant, eine größere Trommel in seine Maschinen einzubauen. Er hat Befürchtungen, daß wegen des nun möglichen höheren Befüllungsgewichtes die Vibrationen im Betrieb zu groß werden könnten. Frage: Wie groß muß die Dämpfungskraft in der neuen Waschmaschine sein, damit die Schwingungen nicht stärker als in der ursprünglichen Maschine sind? Bevor wir diese Frage präzisieren und beantworten können, müssen wir uns mit dem Phänomen der Schwingung beschäftigen. Zuerst betrachten wir ein Pendel (siehe Abbildung 1.3). Sei θ = θ(t) die Auslenkung des Pendels in Bogenmaß von der Ruhelage. Die Pendelmasse betrage m. θ L L F θL θ −mg −mg sin θ Abbildung 1.3: Darstellung der auf ein Pendel wirkenden Kräfte. Ist das Pendel um den Betrag θL ausgelenkt, wirkt die Gravitationskraft −mg auf das Pendel, genauer gesagt nur die tangentiale Komponente −mg sin θ. Man nennt −mg sin θ auch die Rückstellkraft. Aus dem Newtonschen Gesetz folgt m d2 θL = −mg sin θ dt2 oder θ00 + ω 2 sin θ = 0, t > 0, (1.12) wobei ω 2 := g/L. Diese gewöhnliche Differentialgleichung beschreibt die Dynamik des Pendels. Es sind noch die Anfangsbedingungen θ(0) = θ0 , θ0 (0) = v (1.13) vorzugeben. In diesem Abschnitt arbeiten wir mit unskalierten Gleichungen, da wir keine “kleinen” Parameter haben. 12 Unser Ziel ist es, die Schwingungsdauer des Pendels zu finden. Wir nehmen dazu an, daß das Pendel nur wenig ausgelenkt werde, d.h. θ ¿ 1. In diesem Fall können wir sin θ ≈ θ approximieren und erhalten die Schwingungsgleichung θ00 + ω 2 θ = 0, t > 0. Diese Gleichung kann explizit gelöst werden, und die allgemeine Lösung lautet θ(t) = c1 sin ωt + c2 cos ωt, t ≥ 0. Die Konstanten c1 , c2 ∈ R können aus den Anfangsbedingungen (1.13) bestimmt werden: θ0 = θ(0) = c2 , v = θ0 (0) = ωc1 , also c1 = ω/v, c2 = θ0 . Aus der Lösungsformel folgt die Schwingungsdauer s L 2π = 2π . T = ω g Wie groß ist die Schwingungsdauer bei “großen” Auslenkungen? Dazu gehen wir ähnlich wie im vorigen Abschnitt vor. Wir multiplizieren (1.12) mit θ 0 und integrieren über (0, t): 1 0 2 1 2 θ (t) − v = ω 2 cos θ(t) − ω 2 cos θ0 , (1.14) 2 2 und aus dθ p 2 = 2ω (cos θ − cos θ0 ) + v 2 (1.15) dt folgt Z t Z θ(t) dθ p = ds = t. (1.16) 2ω 2 (cos θ − cos θ0 ) + v 2 0 θ0 Damit das Integral Sinn macht, muß 2ω 2 (cos θ − cos θ0 ) + v 2 > 0 gelten. Beginnt das Pendel zur Zeit t = 0 aus der Ruhelage heraus zu pendeln (d.h. θ0 = 0), so erreicht das Pendel nach t = T /4 die erste maximale Auslenkung θmax , für die θ0 (T /4) = 0 gilt. Für Zeiten t > T /4 wird die Auslenkungsgeschwindigkeit negativ, und wir müssen in (1.15) ein Minuszeichen vor die Wurzel setzen. Es folgt wegen θ0 = 0 p 0 = θ0 (T /4) = 2ω 2 (cos θmax − 1) + v 2 und damit θmax µ v2 = arccos 1 − 2 2ω ¶ . Dies macht genau dann Sinn, wenn −1 ≤ 1 − v 2 /2ω 2 ≤ 1 oder √ |v| ≤ 2ω. 13 √ Für Anfangsgeschwindigkeiten größer als 2ω überschlägt sich das Pendel. Diese Situation wollen wir hier ausschließen. Setzen wir den Ausdruck für θmax in (1.16) ein, so erhalten wir eine Formel für die Schwingungsdauer: ¶ µ Z θmax v2 dθ p mit θmax = arccos 1 − 2 . T =4 2ω 2ω 2 (cos θ − 1) + v 2 0 Übungsaufgabe: Berechnen Sie das Integral Z θmax 4 dθ p T =√ cos θ − 1 + v 2 /2ω 2 2ω 2 0 numerisch für verschiedene Werte von v 2 /2ω 2 . Wie lautet die Schwingungsdauer, wenn v 2 /2ω 2 → 0 bzw. v 2 /2ω 2 → 1? Es gibt übrigens eine einfache physikalische Interpretation der Formel (1.14), geschrieben als m 0 2 m Lθ (t) + mg(1 − cos θ(t)) = Lv 2 + mg(1 − cos θ0 ). (1.17) 2 2 Der Term (m/2)Lθ 0 (t)2 kann als eine kinetische Energie und mg(1 − cos θ0 ) als eine potentielle Energie interpretiert werden. Dann bedeutet (1.17) gerade, daß die Gesamtenergie des Systems m E(t) = Ekin (t) + Epot (t) = Lθ0 (t)2 + mg(1 − cos θ(t)) 2 für alle Zeiten t ≥ 0 konstant ist. Wir kehren wieder zu dem Problem der vibrierenden Waschmaschine zurück. Der Einfachheit halber nehmen wir an, daß sich die Waschmaschinentrommel um ihre horizontale Achse dreht und nur in vertikaler Richtung vibrieren kann. Wir modellieren die Waschmaschine als ein System, das aus einer gefüllten Waschmaschinentrommel, einer Feder und einer Dämpfung besteht (siehe Abbildung 1.4). Der Schwerpunkt der Wäsche befinde sich um die Länge R vom Trommelmittelpunkt entfernt. Wir bezeichnen mit M das Gewicht der Trommel, mit m das effektive Gewicht der Wäsche und mit ω0 die Umdrehungsfrequenz der Trommel. Sei x(t) die Auslenkung der Trommel von ihrer Ruhelage. Nach dem Newtonschen Gesetz gilt: M x00 = Rückstellkraft + Reibungskraft + Anregungskraft. Die Rückstellkraft lautet für kleine Auslenkungen x ¿ 1 gerade −kx, wobei k eine Proportionalitätskonstante sei. Wir nehmen an, daß die Reibungskraft proportional zur Geschwindigkeit der vertikalen Auslenkung ist, −rx0 , mit einer Proportionalitätskonstanten r > 0. Die Wäsche in der Trommel werde angeregt durch die der Auslenkung R sin ω0 t entsprechenden Kraft, d2 m 2 (R sin ω0 t) = −mRω02 sin ω0 t. dt 14 Trommel R Feder Wäsche Dämpfung Abbildung 1.4: Vereinfachte Darstellung der schwingenden Waschmaschine. Damit lautet die Bewegungsgleichung M x00 = −kx − rx0 − mRω02 sin ω0 t oder x00 + 2%x0 + ω 2 x = −γω02 sin ω0 t, wobei 2% := r , M k , M ω 2 := γ := t > 0, (1.18) mR , M mit den Anfangsbedingungen x(0) = 0, x0 (0) = 0. (1.19) Der Waschmaschinenhersteller stellt uns die Daten M = 10 kg, m = 2 kg, R = 10 cm, k = 400 N/m, r = 200 Ns/m, ω0 = 50 Hz zur Verfügung. Hierbei bezeichnet N = kg m/s2 die Einheit Newton und Hz = 1/s die Einheit Hertz. Daraus folgt % = 10 s−1 , ω 2 = 40 s−2 , γ = 2 cm. (1.20) Insbesondere hat ω die Einheit 1/s und ist daher eine Frequenz (was die Bezeichnung rechtfertigt). Der Hersteller plant, eine andere Trommel einzubauen, so daß das effektive Wäschegewicht auf m e = 3 kg steigen kann. Der Abstand des Wäscheschwerpunktes zum Trommelmittelpunkt sei unverändert R = 10 cm. Wir können nun die zu Beginn dieses Abschnittes 15 gestellte Frage präziser formulieren: Wie groß muß der Reibungswiderstand r sein, damit die maximale vertikale Auslenkung der neuen Trommel nicht größer ist als die der alten Trommel (mit m = 2 kg)? Um diese Frage zu beantworten, müssen wir zuerst die maximalen Auslenkungen xmax = sup |x(t)| 0<t<∞ der alten Trommel berechnen. Dafür benötigen wir die Lösung x(t) des Anfangswertproblems (1.18)–(1.19). Glücklicherweise kann dieses Problem explizit gelöst werden. Dazu betrachten wir zuerst die Schwingungsgleichung ohne Anregung: x00 + 2%x0 + ω 2 x = 0, t > 0. (1.21) Man nennt dies auch eine homogene Gleichung. Für die Lösung machen wir den Ansatz x(t) = eλt , λ ∈ C. Setzen wir diesen Ansatz in (1.21) ein, erhalten wir eλt (λ2 + 2%λ + ω 2 ) = 0 für alle t > 0. Da eλt 6= 0, folgt λ2 + 2%λ + ω 2 = 0 mit Lösungen λ1/2 = −% ± p %2 − ω 2 . Sowohl eλ1 t als auch eλ2 t sind Lösungen von (1.21), also auch Linearkombinationen davon: x(t) = c1 eλ1 t + c2 eλ2 t , t ≥ 0, mit beliebigen Konstanten c1 , c2 ∈ C. Man kann zeigen, daß alle Lösungen von (1.21) von dieser Form sind (siehe Abschnitt 1.4). In unserem Fall gilt %2 > ω 2 , also ist p x(t) = e−%t (c1 eδt + c2 e−δt ) mit δ = %2 − ω 2 ∈ R. (1.22) Ist die Reibung so klein, daß %2 < ω 2 , so folgt x(t) = e−%t (c1 eiDt + c2 e−iDt ) mit D = p ω 2 − %2 ∈ R. Da wir nur an reellwertigen Lösungen interessiert sind, können wir den Real- und Imaginärteil dieses Ausdruckes linear kombinieren und erhalten x(t) = e−%t (c3 sin Dt + c4 cos Dt), c3 , c4 ∈ R. Eine einfache Rechnung zeigt, daß dies wirklich eine Lösung von (1.21) ist. Die Theorie gewöhnlicher Differentialgleichungen zeigt, daß alle (reellwertigen) Lösungen diese Gestalt haben. 16 Übungsaufgabe: Bestimmen Sie alle Lösungen von (a) x00 + 4x0 + 3x = 0, t > 0; (b) x00 + 4x0 + 4x = 0, t > 0; Hinweis für (b): Versuchen Sie auch die Funktion x(t) = te−2t . Wir lösen nun die inhomogene Gleichung (1.18). Wir rechnen damit, daß nach dem Einschwingvorgang die Trommel gezwungen wird, mit der Frequenz ω0 zu schwingen. Daher scheint der Ansatz x(t) = a sin ω0 t + b cos ω0 t, a, b ∈ R, (1.23) sinnvoll. Setzen wir ihn in (1.18) ein, erhalten wir 0 = (−aω02 − 2b%ω0 + aω 2 + γω02 ) sin ω0 t + (−bω02 + 2a%ω0 + bω 2 ) cos ω0 t, t > 0. Wählen wir zuerst t = π/2ω0 und dann t = 0, folgt (ω 2 − ω02 ) · a − 2%ω0 · b = −γω02 , 2%ω0 · a + (ω 2 − ω02 ) · b = 0. (1.24) (1.25) Dies ist ein lineares Gleichungssystem für a und b, das genau dann eine eindeutige Lösung besitzt, wenn ! à ω 2 − ω02 −2%ω0 = (ω 2 − ω02 )2 + 4%2 ω02 6= 0. det 2%ω0 ω 2 − ω02 Das ist der Fall, wenn % > 0 und ω0 > 0. Wir schließen, daß der Ansatz (1.23) tatsächlich eine Lösung von (1.18) ist. Die Summe aus der allgemeinen Lösung (1.22) der homogenen Gleichung und der (speziellen) Lösung (1.23) der inhomogenen Gleichung ist wieder eine Lösung von (1.18): x(t) = e−%t (c1 eδt + c2 e−δt ) + a sin ω0 t + b cos ω0 t, (1.26) wobei (a, b) die Lösung von (1.24)–(1.25) ist und (c1 , c2 ) aus den Anfangsbedingungen (1.19) bestimmt werden kann. Übungsaufgabe: Berechnen Sie c1 , c2 , a und b. Welchen Wert hat nun xmax = supt |x(t)|? Obwohl wir die Lösung x(t) explizit berechnet haben, ist die Frage anhand der Lösungformel nicht einfach zu beantworten. Wir geben eine numerische Antwort. In Abbildung 1.5 ist die Lösung (1.26) mit den Daten (1.20) 17 6 5 Auslenkung in cm 4 3 2 1 0 −1 −2 0 0.5 1 Zeit in sec. 1.5 2 Abbildung 1.5: Lösung von (1.18)–(1.19) mit % = 10 s−1 , ω 2 = 40 s−2 , γ = 2 cm. illustriert. Die maximale Auslenkung beträgt xmax ≈ 5.9 cm. Mit der neuen Trommel folgt m e = 3 kg und γ = 3 cm mit maximaler Auslenkung xmax ≈ 8.4 cm (Abbildung 1.6). Die Dämpfung muß auf r = 380 Ns/m bzw. % = 19 s−1 erhöht werden, damit die Auslenkung den ursprünglichen Wert von xmax = 5.9 cm nicht überschreitet (Abbildung 1.7). Die Lösung (1.26) besteht aus zwei Anteilen: dem Einschwinganteil e−%t (c1 eδt + c2 e−δt ) und der dauerhaften Schwingung a sin ω0 t + b cos ω0 t. Zuweilen ist nicht nur die maximale Auslenkung für alle t ≥ 0 von Bedeutung, sondern auch die größte Auslenkung x im dauerhaften Betrieb der Trommel. Da der Einschwinganteil für t → ∞ abklingt, folgt x = sup |a sin ω0 t + b cos ω0 t| t ¯µ ¶ µ ¶¯ ¯ ¯ a sin ω t 0 ¯ · = sup ¯¯ cos ω0 t ¯ b t √ ≤ a2 + b 2 . Eine einfache Rechnung zeigt, daß µ µ ¶ ¶ −(ω 2 − ω02 ) a γω02 = 2 (ω − ω02 )2 + (2%ω0 )2 2ω0 b und damit x ≤ γω02 ((ω 2 − ω02 )2 + (2%ω0 )2 )1/2 (ω 2 − ω02 )2 + (2%ω0 )2 18 10 Auslenkung in cm 8 6 4 2 0 −2 −4 0 0.5 1 Zeit in sec. 1.5 2 Abbildung 1.6: Lösung von (1.18)–(1.19) mit % = 10 s−1 , ω 2 = 40 s−2 , γ = 3 cm. γω02 ((ω 2 − ω02 )2 + (2%ω0 )2 )1/2 γω0 ≤ . 2% = Für die alte Waschmaschinentrommel gilt x = 5 cm. Um den gleichen Wert für die neue Trommel zu erhalten, genügt es, eine Dämpfung mit % = 15 s−1 bzw. r = 300 Ns/m zu wählen. Beachte, daß der maximale Wert für x nur für ω = ω0 erreicht wird. Dies bedeutet, daß die Eigenschwingungsfrequenz ω, die aus der Rückstellkraft resultiert und die eine intrinsische Konstante der Waschmaschine ist, gleich der von außen aufgeprägten Anregungsfrequenz ist. Dieser Fall wird Resonanz genannt. Im Falle verschwindender Reibung % = 0 folgt im Resonanzfall ω → ω0 , daß a → ∞ und b → ∞ und somit x → ∞. Die maximale Auslenkung wächst also über alle Maßen. Dieses Verhalten wird Resonanzkatastrophe genannt. 1.4 Ein wenig Theorie gewöhnlicher Differentialgleichungen Die Modellierung dynamischer Prozesse geschieht häufig – wie in den beiden vorigen Abschnitten – mit Hilfe von gewöhnlichen Differentialgleichungen. In diesem Abschnitt geben wir einige Resultate aus der Theorie der Differentialgleichungen an. Definition 1.1 Sei f : Rn × R → R eine Funktion und seien t0 , x1 , . . . , xn ∈ R. Dann heißt x(n) = f (x(n−1) , . . . , x0 , x, t), t ∈ R, (1.27) 19 6 5 Auslenkung in cm 4 3 2 1 0 −1 −2 0 0.5 1 Zeit in sec. 1.5 2 Abbildung 1.7: Lösung von (1.18)–(1.19) mit % = 19 s−1 , ω 2 = 40 s−2 , γ = 3 cm. (explizite) gewöhnliche Differentialgleichunge n-ter Ordnung, und x(t0 ) = x1 , x0 (t0 ) = x2 , . . . , x(n−1) (t0 ) = xn (1.28) heißen Anfangswerte für (1.27), wobei x(i) die i-te Ableitung von x bezeichne. Wir nennen x : I → R eine Lösung von (1.27)–(1.28), wenn I ein offenes Intervall ist, das t0 enthält, u ∈ C n (I), und u löst (1.27)–(1.28). Das Problem (1.27)–(1.28) bezeichnen wir auch als ein Anfangswertproblem. Jede Differentialgleichung n-ter Ordnung kann in ein System von Differentialgleichungen 1. Ordnung umformuliert werden. Definiere dazu die Funktionen u1 := x, u2 := x0 , . . . , un := x(n−1) . Dann sind (1.27)–(1.28) äquivalent zu u0 = F (u, t), wobei u1 .. u = . , un t ∈ R, F (u, t) = u(t0 ) = u0 , u1 .. . un f (un , . . . , u1 , t) , (1.29) x1 . u0 = .. . xn Es genügt also im folgenden, das Anfangswertproblem (1.29) zu untersuchen. Die Existenz und Eindeutigkeit von Lösungen von (1.29) ist unter den folgenden Bedingungen sichergestellt. 20 Satz 1.2 Seien U ⊂ Rn eine offene Menge, F : U × R → Rn eine Funktion und (u0 , t0 ) ∈ U × R. Dann gilt: (1) Ist F stetig, so existiert eine lokale Lösung u von (1.29), d.h., es existiert δ > 0, so daß u ∈ C 1 (t0 − δ, t0 + δ) eine Lösung von (1.29) ist. (2) Ist F lokal Lipschitzstetig bezüglich u gleichmäßig in t, so existiert eine eindeutige lokale Lösung von (1.29). (3) Ist F global Lipschitzstetig bezüglich u gleichmäßig in t, so eistiert eine eindeutige Lösung von (1.29), die für alle t ∈ R definiert ist. Für einen Beweis verweisen wir auf [4]. Beispiel 1.3 Das Problem u0 = √ u, u ≥ 0, t ∈ R, u(0) = 0, besitzt unendlich viele Lösungen, nämlich ( 0 : −∞ < t ≤ t0 u(t) = 1 2 (t − t0 ) : t ≥ t0 . 4 √ Beachte, daß die Funktion F (u) = u, u ≥ 0, nicht Lipschitzstetig auf U = [0, ∞) ist. √ Allerdings ist F (u) = u, definiert für u ∈ [u0 , ∞), u0 > 0, Lipschitzstetig, und das entsprechende Anfangswertproblem u0 = √ u, u ≥ u0 , t ∈ R, besitzt die eindeutige Lösung u(t) = (t/2 + √ u(0) = u0 , √ u0 )2 , t ≥ −2 u0 . ¤ Von besonderem Interesse sind Systeme linearer Differentialgleichungen u0 = Au, u ∈ Rn , t ∈ R, u(0) = u0 , (1.30) mit A ∈ Rn×n . Diese besitzen immer eine eindeutige Lösung für alle t ∈ R, da F (u) = Au global Lipschitzstetig ist. Wieviele Lösungen hat u0 = Au, u ∈ Rn , t ∈ R? Wir behaupten, daß der Lösungsraum U = {u ∈ C 1 (R; Rn ) : u0 = Au} 21 ein linearer Raum der Dimension n ist. Für den Beweis definieren wir eine Abbildung H : U → Rn durch H(u) = u(0). Die Funktion H ist linear (da die Differentialgleichung linear ist), injektiv (da die Differentialgleichung eindeutig lösbar ist) und surjektiv (da die Gleichung eine globale Lösung besitzt). Damit ist H ein Isomorphismus zwischen U und Rn , und es folgt dim U = dim Rn = n. Wie sehen die Lösungen von (1.30) aus? Die Matrix A kann durch eine Ähnlichkeitstransformation in die Jordansche Normalenform λk 1 0 λk 1 J = diag(B1 , . . . , Bm ) mit Bk = ... 1 0 λk gebracht werden, d.h., es existiert eine invertierbare Matrix Q mit A = Q −1 JQ. Sei nun u eine Lösung von u0 = Au und v := Qu. Dann löst v v 0 = Qu0 = QAu = QAQ−1 v = Jv. (1.31) Dieses System kann einfach rekursiv für jeden Block Bk gelöst werden. Aus λk 1 0 vk1 vk1 . λk 1 d . .. .. = . . dt . 1 vkN vkN 0 λk folgt 0 vkN = λk vkN , also vkN (t) = eλk t , 0 λk t , also vk,N −1 (t) = teλk t , vk,N −1 = λk vk,N −1 + e 2 0 λk t vk,N , also vk,N −2 (t) = t2 eλk t usw. −2 = λk vk,N −2 + te Die allgemeine Lösung von (1.31) hat die Struktur v(t) = X ti i,k i! e λk t . Folglich hat die Lösung u von u0 = Au die Lösungsstruktur X u(t) = Q−1 v(t) = qik ti eλk t , i,k wobei qik die Matrixelemente von Q−1 sind. Sind die Eigenwerte λk komplex, suchen wir jedoch reellwertige Lösungen, und u enthält dann wegen eλt = eReλ·t (cos(Imλ · t) + i sin(Imλ · t)) die Terme t i e λk t und ti eReλk ·t (ak cos(Imλk · t) + bk sin(Imλk · t)). 22 Die Lösung von (1.30) kann auch kompakt als u(t) = eAt u0 , geschrieben werden, wobei e At t ∈ R, ∞ X 1 k k t A . := k! k=0 Man kann zeigen, daß diese unendliche Reihe (in der Matrixnorm) konvergiert. Als nächsten Schritt betrachten wir die inhomogene lineare Gleichung u0 = Au + f (t), Die Lösung lautet At u(t) = e u0 + t ∈ R, Z u(0) = u0 . (1.32) t eA(t−s) f (s) ds. 0 Übungsaufgabe: Verifizieren Sie, daß diese Funktion eine Lösung von (1.32) ist. Häufig ist das Langzeitverhalten der Lösung u von u0 = Au von Interesse. Da u(t) eine Linearkombination von Termen der Form tk eλt ist und |tk eλt | = |t|k eReλ·t gilt, erhalten wir die folgende Aussage. Satz 1.4 Sei u eine Lösung von u0 = Au, t > 0. (1) Gilt für alle Eigenwerte λ von A, daß Reλ < 0, so folgt u(t) → 0 für t → ∞. (2) Existiert ein Eigenwert λ von A, mit Reλ > 0, so folgt |u(t)| → ∞ für t → ∞. Dieses Resultat kann für nichtlineare Gleichungen von der Form u0 = f (u), u ∈ U, t > 0, u(0) = u0 , in folgender Weise verallgemeinert werden. Satz 1.5 Sei U ⊂ Rn offen und f : U → Rn Lipschitzstetig. Sei weiter u∞ ∈ U mit f (u∞ ) = 0 und sei f in einer Umgebung von u∞ stetig differenzierbar. Dann gilt: (1) Gilt für alle Eigenwerte λ von f 0 (u∞ ), daß Reλ < 0, so ist u∞ asymptotisch stabil, d.h., es gibt eine Umgebung W von w0 , so daß für alle u0 ∈ W gilt |u(t) − u∞ | → 0 (t → ∞). 23 (1.33) (2) Gibt es einen Eigenwert λ von f 0 (u∞ ) mit Reλ > 0, so ist u∞ instabil, d.h., u∞ ist nicht stabil. Wir nennen einen stationären Punkt u∞ (d.h. u∞ ∈ U mit f (u∞ ) = 0) stabil, wenn es für alle offenen Mengen W ⊂ U mit u∞ ∈ W eine offene Menge V ⊂ W mit u∞ ∈ V gibt, so daß u0 ∈ W =⇒ u(t) ∈ W für alle t ≥ 0 (siehe Abbildung 1.8). Präsize definiert bedeutet asymptotische Stabilität eines stati- u u(t) 0 8 u V W Abbildung 1.8: Zur Stabilität eines stationären Punktes u∞ . onären Punktes u∞ , daß u∞ stabil ist und (1.33) gilt. Als Beispiel betrachten wir die Schwingungsgleichung ohne anregende Kraft aus dem vorigen Abschnitt: x00 + 2%x0 + ω 2 x = 0, t > 0, wobei % im wesentlichen eine Reibungskonstante darstellt. Die Matrix des Systems erster Ordnung mit u1 := x, u2 := x0 !µ ¶ µ ¶0 à 0 1 u1 u1 = , t > 0, 2 u2 u2 −ω −2% besitzt die Eigenwerte λ1,2 = −% ± p %2 − ω 2 , also Reλ1,2 < 0 genau dann, wenn % < 0. Damit ist u∞ = 0 asymptotisch stabil und u(t) → 0 für t → ∞. Dies ist physikalisch plausibel, da die Reibung der Schwingung so lange Energie entzieht, bis sie zur Ruhe kommt. Im Falle negativer Reibung % < 0 dagegen gilt Reλ1,2 > 0, und die Lösung ist instabil. Es ist sogar |u(t)| → ∞ für t → ∞. Ohne Reibung % = 0 erhalten wir die allgemeine Lösung x(t) = a sin ωt + b cos ωt, die ebenfalls instabil ist. Allerdings stellt diese Lösung einen periodischen Orbit dar. Für weitere Informationen verweisen wir auf [4]. 24 1.5 Regulär und singulär gestörte Probleme In Abschnitt 1.2 haben wir den Aufprallzeitpunkt eines senkrecht nach oben geworfenen Gegenstandes aus der Lösung des Anfangswertproblems x00 = − 1 , (εx + 1)2 t > 0, x(0) = 0, x0 (0) = 1 (1.34) bestimmt, indem wir das Problem für ε = 0 explizit gelöst haben. In diesem Abschnitt untersuchen wir, inwiefern die Lösung des Problems für ε = 0 die Lösung des vollen Problems approximiert und wie bessere Näherungslösungen gefunden werden können. Wir machen für das Problem (1.34) den Ansatz x(t) = x0 (t) + εx1 (t) + O(ε2 ) (ε → 0). Einsetzen in (1.34) und Taylorentwicklung um y = 0 von −1 = −1 + 2y + O(y 2 ) (1 + y)2 (y → 0) liefert −1 = −1 + 2εx0 + O(ε2 ), (1 + εx0 + O(ε2 ))2 x0 (0) + εx1 (0) + O(ε2 ) = 0, x000 + εx001 + O(ε2 ) = x00 (0) + εx01 (0) + O(ε2 ) = 1. Ein Koeffizientenvergleich ergibt dann für ε0 : x000 = −1, ε1 : x001 = 2x0 , x0 (0) = 0, x00 (0) = 1, (1.35) x1 (0) = 0, x01 (0) = 0. (1.36) Das Problem (1.35) entspricht gerade unserem Problem (1.34) für ε = 0 und besitzt die Lösung x0 (t) = t − t2 /2. Setzen wir dies in (1.36) ein, folgt x1 (t) = t3 /3 − t4 /12 und damit die verbesserte Näherungslösung ³ t´ t3 ³ t´ x(t) = t 1 − +ε 1− + O(ε2 ). 2 3 4 Es ist sogar möglich, die Approximation für x(t) durch den allgemeinen Ansatz x(t) = n X εk xk (t) + O(εn+1 ) k=0 zu verbessern. Der Faktor εx in der Gleichung (1.34) stört die Lösung also nur um Terme von der Größenordnung O(ε). Solche Probleme nennen wir regulär gestört. 25 Für eine präzisere Definition betrachten wir eine Abbildung F : B1 × [0, 1] → B2 , wobei (B1 , k · k1 ) und (B2 , k · k2 ) zwei Banachräume seien. Wir suchen Näherungen des Problems F (xε , ε) = 0. (1.37) Es ist naheliegend, eine Lösung x0 des sogenannten reduzierten Problems F (x0 , 0) = 0 als eine Näherung von xε zu verwenden. Um eine bessere Approximation zu finden, kann man versuchen, den Ansatz n X ε k xk xε,n := k=0 in (1.37) einzusetzen, die linke Seite nach Potenzen von ε zu entwickeln und einen Koeffizientenvergleich für εk durchzuführen. Kann man F (x, ε) = n X Fj (x)εj + O(εn+1 ) j=0 (ε → 0) entwickeln, so folgt 0 = F n ³X k=0 = n X ¡ j=0 n n ´ X ³X ´ Fj εk xk + O(εn+1 ), ε = εk xk + O(εn+1 ) εj + O(εn+1 ) j=0 k=0 ¢ Fj (x0 ) + Fj0 (x0 )εx1 + . . . εj + O(εn+1 ), also für ε0 : F0 (x0 ) = 0, ε1 : F00 (x0 )x1 + F1 (x0 ) = 0 usw. Wir nennen nun die Näherung xε,n konsistent, wenn das Residuum rε := F (xε,n , ε) für ε → 0 gegen Null konvergiert: kF (xε,n , ε)k2 → 0 (ε → 0). Ist es möglich, die Näherungen x0 , . . . , xn zu berechnen, und ist xε,n konsistent, so nennen wir xε,n eine formal asymptotische Entwicklung der Ordnung n von xε , und das Problem (1.34) heißt regulär gestört, wenn für alle n ∈ N eine formal asymptotische Entwicklung existiert. Anderenfalls nennen wir das Problem singulär gestört. Was geschieht bei singular gestörten Problemen? Dazu betrachten wir zwei Beispiele. 26 Beispiel 1.6 Die Schwingungen gewisser selbsterregter Systeme werden durch die Vander-Pol-Gleichung x00 + ε(x2 − 1)x0 + x = 0, t > 0, x0 (0) = 0, x(0) = x, (1.38) beschrieben. Hierbei ist ε > 0 ein im allgemeinen “kleiner” Parameter im Sinne von ε ¿ 1. Für |x| > 1 wird das System gedämpft, für |x| < 1 angeregt (negative Dämpfung). Wir sind an dem Verhalten der Lösung für Zeiten t → ∞ interessiert. Die Gleichung (1.38) ist nichtlinear und kann nicht explizit gelöst werden. Wir lösen zuerst das reduzierte Problem x000 + x0 = 0, x(0) = x, x00 (0) = 0. Die Lösung x0 (t) = x cos t, t ≥ 0, ist konsistent, denn für das Residuum rε gilt rε = x000 + ε(x20 − 1)x00 + x0 = ε(x20 − 1)x00 und damit krε k∞ := sup |rε (t)| ≤ εx(x2 + 1) → 0 0<t<∞ (ε → 0). Wir arbeiten mit der Supremumsnorm, da wir an dem Lösungsverhalten in t ∈ (0, ∞) interessiert sind. Der Ansatz x = x0 + εx1 + O(ε2 ) und Koeffizientenvergleich führt auf die Gleichung µ 2 ¶ x x3 2 2 00 2 0 x1 + x1 = −(x0 − 1)x0 = x(x cos t − 1) sin t = x − 1 sin t + sin(3t), 4 4 denn sin(3t) = (4 cos2 t − 1) sin t, und x1 (0) = x01 (0) = 0. Die Lösung lautet x x1 (t) = 2 µ ¶ x2 x3 1− (t cos t − sin t) − (3 sin t − sin 3t). 4 32 Ist x0 + εx1 konsistent? Es gilt rε = (x0 + εx1 )00 + ε((x0 + εx1 )2 − 1)(x0 + εx1 )0 + (x0 + εx1 ) = x000 + x0 +ε[x001 + (x20 − 1)x00 + x1 ] + ε2 [2x0 x1 x00 + (x20 − 1)x01 ] + O(ε3 ). | {z } {z } | =0 =0 Damit konvergiert zwar rε (t) → 0 für ε → 0 punktweise, aber nicht in der Supremumsnorm über (0, ∞), da x1 (t) unbeschränkt ist. Das Problem ist folglich singulär gestört auf (0, ∞). 27 Was ist schiefgegangen? Dazu nehmen wir an, daß x2 ≈ 1+ε mit ε > 0 und betrachten das Näherungsproblem x00 + ε2 x0 + x = 0, mit der Lösung x(t) = xe−ε 2 t/2 cos( x(0) = x, x0 (0) = 0, p 1 − ε2 /4 t), t ≥ 0. Diese Funktion hat zwei Zeitskalen: eine Skala einer “langsamen Zeit” der Größenordnung 2 O(1/ε2 ) durch den Term e−ε t/2 und eine Skala einer “schnellen Zeit” der Größenordnung p O(1) wegen des Terms cos( 1 − ε2 /4 t). Es ist naheliegend zu vermuten, daß auch die Van-der-Pol-Gleichung (1.38) zwei Zeitskalen besitzt. Wir machen daher den Ansatz x(t) = x0 (t0 , t1 ) + εx1 (t0 ) + O(ε2 ) mit t0 = t0 (t) = t, t1 = t1 (t) = εt. Mit der Kettenregel folgt ∂x0 dt0 ∂x0 dt1 ∂x0 ∂x0 dx0 = + = +ε , dt ∂t0 dt ∂t1 dt ∂t0 ∂t1 2 d 2 x0 ∂ 2 x0 ∂ 2 x0 2 ∂ x0 + 2ε . = + ε dt2 ∂t20 ∂t0 t1 ∂t21 Wir setzen den obigen Ansatz in (1.38) ein und erhalten 0 = x00 + ε(x2 − 1)x0 + x ∂ 2 x0 ∂ 2 x0 d 2 x1 ∂x0 = + 2ε + ε + ε(x20 − 1) + x0 + εx1 + O(ε2 ) 2 2 ∂t0 ∂t0 ∂t1 dt0 ∂t0 und x = x(0) = x0 (0, 0) + εx1 (0) + O(ε2 ), ∂x0 ∂x0 dx1 0 = x0 (0) = (0, 0) + ε (0, 0) + ε (0) + O(ε2 ). ∂t0 ∂t1 dt0 Ein Koeffizientenvergleich impliziert ∂ 2 x0 ∂ 2 x0 x, + x = 0, x (0, 0) = (0, 0) = 0, 0 0 ∂t20 ∂t0 ∂x0 ∂ 2 x0 d 2 x1 − (x20 − 1) , + x = −2 : 1 2 dt0 ∂t0 ∂t1 ∂t0 dx1 ∂x0 x1 (0) = 0, (0) = − (0, 0). dt0 ∂t1 ε0 : (1.39) ε1 (1.40) Die Lösung von (1.39) lautet x0 (t0 , t1 ) = a(t1 ) cos(t0 + b(t1 )), 28 wobei a und b beliebige (differenzierbare) Funktionen mit a(0) = x, b(0) = 0 sind. Setzen wir diese Lösung in (1.40) ein, so folgt nach etwas Rechnung ¶ µ d 2 x1 da a3 sin(t0 + b(t1 )) (1.41) + x1 = 2 −a+ dt20 dt1 4 db a3 +2a cos(t0 + b(t1 )) + sin 3(t0 + b(t1 )). dt1 4 In Abschnitt 1.2 haben wir gesehen, daß die Schwingungsgleichung x00 + x = sin t oder x00 + x = cos t (1.42) Resonanz erzeugt, d.h., die anregende Kraft schaukelt die Schwingungen immer stärker auf. Mathematisch bedeutet dies, daß die Lösungen von (1.42) unbeschränkt sind. Solche Lösungen schließen wir aus, da wir ja damit rechnen, daß Lösungen mit |x| > 1 gedämpft werden. Wir erhalten genau dann keine Resonanz, wenn die Koeffizienten vor den sinund cos-Termen in (1.42) verschwinden. Dies führt auf die folgenden Gleichungen für die Funktionen a und b: µ ¶ a2 a da 1− , a(0) = x, = dt1 2 4 db = 0, b(0) = 0, dt1 mit Lösungen Damit folgt 2x a(t1 ) = p 2 , x − (x2 − 4)e−t1 b(t1 ) = 0, 2x cos t , x0 (t, εt) = p 2 x − (x2 − 4)e−εt t1 ≥ 0. t ≥ 0. Dies ist sicherlich eine bessere Approximation als die Lösung u0 (t) = x cos t des reduzierten Problems. Insbesondere folgt |x0 (t, εt)2 − 4 cos2 t| = 4|x2 − 4|e−εt cos2 t →0 x2 − (x2 − 4)e−εt (t → ∞) und folglich u0 (t, εt) − 2 cos t → 0 (t → ∞). Damit ist das Verhalten der Näherungslösung u0 (t, εt) der Van-der-Pol-Gleichung geklärt. Man nennt übrigens 2 cos t auch Grenzzykel, da sich die Lösung für t → ∞ dem Graphen von 2 cos t annähert. Dies gilt auch für die Lösung des vollen Problems (1.38). 29 Beispiel 1.7 Wir betrachten −εu00 + u0 + u = 0, x ∈ (0, 1), u(0) = 1, u(1) = 0. (1.43) Da wir die Randwerte der gesuchten Funktion u(x) vorgegeben haben, nennt man (1.43) ein Randwertproblem. Das reduzierte Problem u0 + u = 0, x ∈ (0, 1), u(0) = 1, u(1) = 0 hat keine Lösung, da die allgemeine Lösung von u0 + u = 0, nämlich u(x) = ce−x mit c ∈ R, nicht beide Randbedingungen gleichzeitig erfüllen kann. Es gibt also nicht einmal eine formale asymptotische Näherung der Ordnung null. Das Problem (1.43) ist folglich singulär gestört. Wir erwarten, daß sich eine asymptotische Näherung im Innern von (0, 1) wie ce−x verhält, aber in der Nähe von x = 0 bzw. x = 1 eine Grenzschicht aufweist, um die Randbedingungen erfüllen zu können. Um das Verhalten in der Nähe der Grenzschicht analysieren zu können, verwenden wir eine Art “mathematische Lupe”, genauer eine Variablentransformation, etwa x α > 0, ξ = α, ε in der Nähe von x = 0. Wir nennen ξ eine Grenzschichtvariable. Die Funktion v(ξ) = u(x/εα ) erfüllt wegen v 0 = εα u0 die Gleichung −ε1−2α v 00 + ε−α v 0 + v = 0, ξ ∈ (0, ε−α ). (1.44) Beachte, daß u0 = du/dx, aber v 0 = dv/dξ. Die Frage ist nun, welches α zu wählen ist. Wir wollen ein α auswählen, so daß (1.44) im Grenzwert ε → 0 die “maximale” Information enthält. Wir gehen heuristisch vor, da das Auffinden von Grenzschichten nur schwer formalisiert werden kann. Die Vorgehensweise ist wie folgt. Wir setzen je zwei Exponenten in (1.44) gleich und setzen voraus, daß die übrigen Exponenten nicht kleiner sind: −α = 0 ≤ 1 − 2α impliziert α = 0 : das ist uninteressant; 1 1 − 2α = 0 ≤ −α impliziert α ≤ 0 und α = 2 : Widerspruch; 1 − 2α = −α ≤ 0 impliziert α ≥ 0 und α = 1. Der letzte Fall erscheint sinnvoll, so daß wir α = 1 wählen. Die Grenzschichtvariable an x = 0 lautet ξ = x/ε. Analog erhalten wir für die Grenzschichtvariable η an x = 1 die Beziehung η = (1 − x)/ε. Wir wissen allerdings noch nicht, ob es eine Grenzschicht nur an x = 0 oder nur an x = 1 oder ob es zwei Grenzschichten gibt. Um dies herauszufinden, machen wir den Ansatz uasym (x) = u(x) + u0 (ξ) + u1 (η) 30 für die asymptotische Näherung uasym der Lösung von u von (1.43). Wir setzen voraus, daß die Funktionen u0 und u1 außerhalb der Grenzschicht verschwinden, genauer d k u0 (ξ) = 0 und ξ→∞ dξ k lim d k u1 (η) = 0 η→∞ dη k lim für alle k ≥ 0. Wie lauten die Gleichungen für u, u0 und u1 ? Wir fordern ³ ´ 00 0 0 = lim − εuasym + uasym + uasym ε→0 ´ ³ 1 d2 u0 1 du0 1 d2 u1 1 du1 d2 u du + − = lim − ε 2 + +u− + u − + u 0 1 ε→0 dx dx ε dξ 2 ε dξ ε dη 2 ε dη ³ du 1 d2 u0 1 du0 1 d2 u1 1 du1 ´ +u− + − − = lim , ε→0 dx ε dξ 2 ε dξ ε dη 2 ε dη denn u0 (ξ) = u0 (x/ε) → 0 für ε → 0 bzw. ξ → ∞ (x > 0) und analog u1 (η) → 0 für ε → 0 bzw. η → ∞ (x > 0). Die obige Gleichung ist erfüllt, wenn du +u=0 dx und d2 u0 du0 − = 0, dξ 2 dξ (1.45) d2 u1 du1 − =0 dη 2 dη (1.46) gelten. Die allgemeine Lösung von (1.45) lautet u(x) = c1 e−x ; dies ist wie erwartet die Lösung im “Innern” von (0, 1). Die allgemeinen Lösungen von (1.46) lauten u0 (ξ) = c2 + c3 eξ und u1 (η) = c4 + c5 e−η . Wegen u0 (ξ) → 0 für ξ → ∞ muß c2 = c3 = 0 gelten. Die Forderung u1 (η) → 0 für η → ∞ impliziert c4 = 0. Wir erhalten also nur eine Grenzschicht an x = 1. Die Lösung lautet nun uasym (x) = c1 e−x + c5 e−(1−x)/ε . Die Konstanten c1 und c5 können aus den Randbedingungen uasym (0) = 1 und uasym (1) = 0 berechnet werden; das Resultat ist uasym (x) = e−x − e−1+(x−1)/ε , 1 − e−(1+1/ε) x ∈ [0, 1]. (1.47) Die Funktion uasym ist in Abbildung 1.9 dargestellt; die Grenzschicht in der Nähe von x = 1 ist deutlich erkennbar. Ist die Näherung von uasym konsistent? Dazu berechnen wir das Residuum rε (x) = −εu00asym + u0asym + uasym = − 31 εe−x + e−1+(x−1)/ε . 1 − e−(1+1/ε) 1 0.8 u(x) 0.6 0.4 0.2 0 0 0.2 0.4 0.6 0.8 1 x Abbildung 1.9: Plot der Funktion uasym aus (1.47) für ε = 0.01. Es gilt rε (x) → 0 für ε → 0, wenn x ∈ [0, 1), aber rε (1) = − εe−1 + e−1 1 →− , −(1+1/ε) 1−e e für ε → 0. Dies bedeutet, daß uasym nicht in der Supremumsnorm konsistent ist. Allerdings ist uasym in der sogenannten L2 -Norm k · k2 konsistent, wobei kuk2 := In der Tat, wir berechnen Z 1 rε (x)2 dx = 0 µZ 1 2 u(x) dx 0 1 (1 − e−(1+1/ε) )2 Z ¶1/2 . 1 (εe−x + e−1+(x−1)/ε )2 dx 0 −1/ε+1 ε2 ε −2 −1 −2/ε 2 −2 1 − e = (1 − e ) + e (1 − e ) + 2ε e 2 2 1−ε ≤ const. ε → 0 (ε → 0). Für weitere Informationen über das Verhalten von Lösungen von Differentialgleichungen mit kleinen Parameters verweisen wir auf [1, 7]. Übungsaufgabe: Ist das Problem x00 + x = εx, t > 0, x(0) = x, regulär oder singulär gestört auf t ∈ (0, ∞)? 32 x0 (0) = 0, Übungsaufgabe: Wir sagen, eine Funktionenfolge uε : U → R, ε > 0, hat ein Grenzschichtverhalten an x0 ∈ U genau dann, wenn der Grenzwert limε→0 uε in der Supremumsnorm über jede Menge V mit V ⊂ U \{x0 } existiert, aber nicht in der Supremumsnorm über U . (1) Hat die Lösung u von εu0 = −u + x + ε, x > 0, u(0) = 1, ein Grenzschichtverhalten? (2) Hat die Funktion uasym aus (1.47) ein Grenzschichtverhalten? 33 2 Dynamik In diesem Kapitel betrachten wir zeitabhängige Prozesse, die das dynamische Verhalten einer oder mehrerer Variablen beschreiben und die zumeist auf Anfangswertprobleme für Differentialgleichungen führen. 2.1 Populationsmodelle Kulturpflanzen werden zum Großteil unter kontrollierten Bedingungen in Gewächshäusern gezogen. Leider sind dies auch ideale Bedingungen für die Vermehrung von Schädlingen, wie etwa der gemeinen Spinnmilbe. Wird eine Pflanze von zu vielen Spinnmilben befallen, stirbt sie ab. Das Ziel ist also, die Anzahl der Spinnmilben möglichst gering zu halten. Prinzipiell kann dies durch den Einsatz von Insektiziden geschehen. Dies hat jedoch einige entscheidende Nachteile: Insektizide wirken im allgemeinen nur für kurze Zeit, die behandelten Pflanzen dürfen für einige Zeit nicht abgeerntet werden, und Insektizide haben negative Auswirkungen auf die Umwelt. Eine sinnvolle, ökologisch vertretbare Alternative ist das Aussetzen von natürlichen Feinden, etwa der Raubmilbe. Hierbei stellt sich die folgende Frage: Frage: Wieviel Raubmilben müssen ausgesetzt werden, damit die Anzahl der Spinnmilben unter eine vorgegebene Grenze sinkt? Um diese Frage zu beantworten, müssen wir uns etwas eingehender mit Populationsmodellen befassen. Sei x(t) ≥ 0 die Anzahl der Spinnmilben (etwa pro Pflanze) zur Zeit t. Die zeitliche Änderung der Spinnmilbenpopulation ist gegeben durch x0 = (g − s)x, t > 0, x(0) = x0 , (2.1) wobei g ≥ 0 die Geburtsrate und s ≥ 0 die Sterberate ist. Die Lösung lautet x(t) = x0 e(g−s)t . Ist die Geburtsrate größer als die Sterberate, so wächst die Spinnmilbenpopulation unbegrenzt. Das ist unrealistisch, da das begrenzte Nahrungsangebot nicht berücksichtigt wird. Ein Vorschlag ist, die Sterberate s = s(x) = s0 + ax zu wählen, wobei s0 ≥ 0 die natürliche Sterberate und a ≥ 0 ist. Ist die Population sehr groß, so wächst auch die Sterberate, und wir erwarten, daß sich die Population auf einen gewissen Wert einpendelt. Aus (2.1) ergibt sich mit b = g − s0 die sogenannte logistische Differentialgleichung (oder das Verhulst-Modell) x0 = x(b − ax), t > 0, 34 x(0) = x0 . Durch Integration ¶ Z x(t) µ 1 1 a dx dx dτ = = + t = b x b − ax x(0) x(b − ax) x0 0 µ ¶ 1 b − ax0 x(t) = + a ln ln b x0 b − ax(t) Z Z t x(t) und Auflösen nach x(t) erhalten wir die Lösung x(t) = bx0 , ax0 + (b − ax0 )e−bt Für t → ∞ folgt x(t) −→ ( t ≥ 0. b/a : b > 0, 0 : b < 0. Ist also die natürliche Sterberate mindestens so groß wie die Geburtsrate, sterben die Spinnmilben aus, andernfalls wächst die Population monoton gegen den Grenzwert b/a. Der Wert b/a kann als Aufnahmekapazität der Umgebung interpretiert werden. Wie kann die Raubmilbenpopulation modelliert werden? Sei y(t) die Anzahl der Raubmilben (pro Pflanze) zur Zeit t. Wir können für die zeitliche Entwicklung der Raubmilbenpopulation einen ähnlichen Ansatz wie oben machen: y 0 = y(d − cy), t > 0, y(0) = y0 , wobei c ≥ 0. Die Zuwachsrate d sollte aber nun von der Anzahl der Spinnmilben abhängen. Ist nämlich nicht genügend Beute vorhanden, werden die Raubmilben aussterben: d = d(x) = −d1 + d2 x mit d1 , d2 ≥ 0. Entsprechend müssen wir die Evolutionsgleichung für die Spinnmilben ändern: Die Zuwachsrate b vermindert sich um den Anteil gefressener Spinnmilben, der proportional zur Anzahl der Raubmilben ist: b = b(y) = b1 − b2 y mit b1 , b2 ≥ 0. Damit erhalten wir das Lotka-Volterrasche Populationsmodell x0 = x(b1 − b2 y − ax), y 0 = y(−d1 + d2 x − cy), t > 0, x(0) = x0 , (2.2) t > 0, y(0) = y0 . (2.3) Wir wollen verstehen, wie sich die Lösungen verhalten. Zuerst betrachten wir den Fall, daß die Koeffizienten a und c vernachlässigbar sind. Dies ist das Volterrasche Modell 0 x0 = x(b1 − b2 y), y = y(−d1 + d2 x), 35 t > 0, x(0) = x0 , (2.4) t > 0, y(0) = y0 . (2.5) Es besitzt die beiden stationären Punkte µ ¶ µ ¶ x1 0 und = 0 y1 µ ¶ µ ¶ x2 d1 /d2 = . y2 b1 /b2 Um herauszufinden, ob diese Punkte (asymptotisch) stabil oder instabil sind, berechnen wir die Ableitung der Funktion ¶ µ x(b1 − b2 y) , x, y ≥ 0, F (x, y) = y(−d1 + d2 x) in diesen Punkten: 0 F (0, 0) = à b1 0 0 −d1 ! , F 0 ³d b1 ´ , = d 2 b2 1 à 0 b1 d1 0 ! . Folglich ist (0, 0)> nicht stabil, wenn b1 > 0. Der Punkt (x2 , y2 ) ist instabil, da die Eigen√ werte von F 0 (x2 , y2 ) gerade λ1/2 = ± b1 d1 lauten. Wir können das Verhalten der Lösung in der Nähe dieses Punktes allerdings genauer wie folgt beschrieben. Dafür schreiben wir (2.4)–(2.5) in der Form dx/dt x0 x(b1 − b2 y) dx = = 0 = dy dy/dt y y(−d1 + d2 x) bzw. Z b1 − b 2 y −d1 + d2 x dx = dy = ln y b1 − b2 y − α, − ln x + d2 x = x y wobei α ∈ R eine Integrationskonstante ist. Daher erfüllen alle Lösungen (x(t), y(t)) die implizite Lösungsformel d1 Z ln x(t)d1 + ln y(t)b1 − d2 x(t) − b2 y(t) = α ∀ t ≥ 0. (2.6) Die Integrationskonstante kann aus den Anfangswerten (x0 , y0 ) berechnet werden: α = ln xd01 + ln y0b1 − d2 x0 − b2 y0 . Wir behaupten, daß die Menge aller (x(t), y(t)), die (2.6) erfüllen, eine geschlossene Kurve darstellt. Wir zeigen allerdings ein etwas schwächeres Resultat: In einer Umgebung von (x2 , y2 ) können wir (x(t), y(t)) näherungsweise durch x(t) = d1 + ε sin ωt, d2 y(t) = b1 + δ cos ωt b2 mit 0 < ε, δ ¿ 1 und ω > 0 darstellen. Insbesondere ist für t = 0 ³b ´ d1 1 α = d1 ln + b1 ln + δ − d 1 − b1 − b2 δ d2 b2 b1 d1 (δ → 0). = d1 ln + b1 ln − d1 − b1 + O(δ) d2 b2 36 Wir setzen den Ansatz für (x(t), y(t)) in (2.6) ein und approximieren um b1 /b2 bzw. d1 /d2 : d1 ln x(t) + b1 ln y(t) − d2 x(t) − b2 y(t) d1 b1 d22 2 2 b22 2 = d1 ln + d2 ε sin ωt + b1 ln + b2 δ cos ωt + ε sin ωt + δ cos2 ωt d2 b2 2d1 2b1 3 3 − d1 − d2 ε sin ωt − b1 − b2 ε cos ωt + O(ε + δ ) b1 d 2 ε2 b2 δ 2 d1 = d1 ln + b1 ln − d1 − b1 + 2 sin2 ωt + 2 cos2 ωt + O(ε3 + δ 3 ) d2 b2 2d1 2b1 2 = α + O(ε ), wenn wir b2 δ 2 d22 ε2 = 2 2d1 2b1 wählen. Wir schließen, daß (x(t), y(t)) die implizite Lösungsformel (2.6) bis auf einen Fehler der Ordnung O(ε2 ) löst. Die Trajektorien {(x(t), y(t)) : t ≥ 0} sind also näherungsweise Ellipsen um (x2 , y2 ). Das Resultat können wir folgendermaßen interpretieren: Starten wir bei einem Anfangswert x0 À y0 , so können sich die Spinnmilben so lange vermehren, bis genügend Raubmilben herangewachsen sind, die die Spinnmilbenpopulation verringern. Ist die Anzahl der Spinnmilben zu gering geworden, haben die Raubmilben zu wenig Nahrung und ihre Population schrumpft. Diese Reduktion erlaubt es den Spinnmilben, sich ungehindert zu vermehren, und der Kreislauf beginnt von vorne. Im Volterra-Modell kann also die Spinnmilbenpopulation nicht dauerhaft dezimiert werden. Allerdings setzt das Modell ein unbegrenztes Wachstum voraus, was nicht realistisch ist. Wir betrachten also im folgenden das Lotka-Volterra-Modell (2.2)–(2.3). Wir berechnen zuerst die stationären Punkte: µ ¶ µ ¶ µ ¶ µ ¶ µ ¶ µ ¶ x1 0 x2 0 x3 b1 /a = , = , = , y1 0 y2 −d1 /c y3 0 und (x4 , y4 )> ist die Lösung des linearen Gleichungssystems à !µ ¶ µ ¶ a b2 x4 b1 = . y4 d1 d2 −c (2.7) Da wir x, y ≥ 0 fordern, ist (x2 , y2 )> kein biologisch sinnvoller stationärer Punkt. Aus à ! b − b y − 2ax −b x 1 2 2 F 0 (x, y) = d2 y −d1 + d2 x − 2cy und Satz 1.5 schließen wir, daß (x1 , y1 ) instabil ist. Der Punkt (x3 , y3 ) ist instabil, wenn d1 /d2 < b1 /a, und asymptotisch stabil, wenn d1 /d2 > b1 /a. Da b1 /a gerade die asymptotische Anzahl der Spinnmilben im Verhulst-Modell ist, bedeutet d1 /d2 > b1 /a, daß 37 die Sterberate der Raubmilben zu groß ist, um durch das vorhandene Nahrungsangebot kompensiert zu werden; die Raubmilben sterben aus. Das lineare Gleichungssystem (2.7) besitzt die Lösung ¶ µ ¶ µ 1 x4 b1 c + b 2 d 1 = , y4 ac + b2 d2 b1 d2 − ad1 die genau dann im ersten Quadranten x, y ≥ 0 liegt, wenn d1 /d2 < b1 /a. Die Eigenwerte von F 0 (x4 , y4 ) lauten r 1 1 λ1,2 = − (aA + cB) ± (aA + cB)2 − (b2 d2 + ac)AB, 2 4 wobei A = b1 c + b2 d1 > 0 und B = b1 d2 − ad1 > 0. Wegen Reλ1,2 < 0 ist der stationäre Punkt (x4 , y4 ) asymptotisch stabil, d.h. (x(t), y(t)) → (x4 , y4 ) für t → ∞. Selbst wenn wir eine große Anzahl von Raubmilben aussetzen, wird die Anzahl der Spinnmilben nach hinreichend langer Zeit b1 c + b 2 d 1 x4 = ac + b2 d2 betragen. Wir fassen zusammen: b1 d1 > : x(t) → d2 a b1 d1 : x(t) → < d2 a b1 und y(t) → 0 für t → ∞; a b1 c + b 2 d 1 b1 d2 − ad1 und y(t) → ac + b2 d2 ac + b2 d2 für t → ∞. Übungsaufgabe: Lösen Sie das Lotka-Volterra-Modell numerisch für verschiedene Parameterwerte. Wie läßt sich die maximale Spinnmilbenanzahl effektiv begrenzen? Läßt sich das obige Modell verbessern? Wir haben angenommen, daß die Zuwachsrate durch b(y) = b1 − b2 y modelliert wird. Die Spinnmilben werden also von den Raubmilben dezimiert, wenn b(y) < 0 bzw. y > b1 /b2 gilt. Nun kann man argumentieren, daß die Zuwachsrate zusätzlich von der Spinnmilbenpopulation abhängen sollte: Sind sehr viele Spinnmilben vorhanden, muß die Anzahl der Raubmilben deutlich größer als b1 /b2 sein, um die Spinnmilben auffressen zu können. Wir fordern also b2 = b2 (x). Eine mögliche Wahl ist β0 b2 (x) = , β0 , β1 > 0. x + β1 Ist die Anzahl der Spinnmilben x deutlich größer als β1 , werden nur wenige Spinnmilben gefressen, da β0 y ≈ β0 y für x À β1 ; b2 (x)xy = 1 + β1 /x falls die Spinnmilbenpopulation den Wert β1 deutlich unterschreitet, erhalten wir den Lotka-Volterra-Term β0 b2 (x)xy ≈ xy für x ¿ β1 . β1 38 Eine andere Variante des Modells ist die verfeinerte Annahme, daß die maximal mögliche Raubmilbenpopulation von der Anzahl der Spinnmilben abhängt: je größer das Nahrungsangebot für die Raubmilben ist, desto stärker können sich diese vermehren. Andererseits ist die Spinnmilbenanzahl durch die Menge der Pflanzen im Gewächshaus begrenzt: a = const., c = c(x). Ein möglicher Ansatz ist c = c0 /x. Für x → 0 geht dann auch die maximal mögliche Raubmilbenpopulation gegen Null. In diesem Fall genügt es, die Zuwachsrate d als konstant anzunehmen. Wir erhalten das Modell ¶ µ β0 y 0 − ax , t > 0, x(0) = x0 , x = x b1 − x+ β1 ³ ´ c0 y0 = y d − y , t > 0, y(0) = y0 . x Übungsaufgabe: Bestimmen Sie die stationären Punkte und klassifizieren Sie diese (instabil oder asymptotisch stabil). Lösen Sie das System numerisch. Unterschied zum Lotka-Volterra-Modell? 2.2 Ein Modell für Aids Populationsmodelle können auch für die Modellierung und Simulation der körpereigenen Abwehrreaktionen nach einer Infektion mit dem HIV-Virus eingesetzt werden. In diesem Abschnitt stellen wir ein einfaches Modell vor. Es sollte erwähnt werden, daß die verschiedenen Mechanismen der Immunreaktion im menschlichen Körper derzeit noch nicht vollständig verstanden sind, so daß jedes Modell für Aids nur einen kleinen Ausschnitt aus der Realität darstellen kann. Für die Modellierung benötigen wir allerlei Kenntnisse über das Immunsystem. Ein zentraler Bestandteil sind die sogenannten T-Zellen, die laufend von der Thymusdrüse abgeschieden werden und die eine endliche Lebensdauer besitzen. Dringen Fremdkörper oder Viren in den Organismus ein, vermehren sich die T-Zellen durch Zellteilung, um die Eindringlinge abzuwehren. Genauer gesagt gibt es zwei Typen von T-Zellen: die CD4 + und die CD8+ T-Zellen. Werden Eindringliche erkannt, aktivieren die CD4+ T-Zellen die Produktion von CD8+ T-Zellen, die von einem Virus befallene Zellen oder den Virus direkt unschädlich machen. Außerdem aktivieren die CD4+ T-Zellen sogenannte B-Zellen (Blutzellen), die Antikörper produzieren können. Die Antikörper wiederum sind in der Lage, den Virus zu vernichten. Im folgenden vernachlässigen wir den Einfluß von B-Zellen. Wie wirkt sich eine HIV-Infektion aus? Der HIV-Virus dringt in CD4 + T-Zellen (aber nicht in CD8+ T-Zellen) ein und wird dann innerhalb der Zelle reproduziert. Bei dem Versuch, sich zu teilen, platzen die infizierten CD4+ T-Zellen, und alle zwischenzeitlich pro39 duzierten Viren gelangen auf diese Weise in den Blutkreislauf. Der Virus kann auch Thymozyten (eine Vorstufe der T-Lympozyten, die die Infektabwehr durch Abtöten infizierter Zellen unterstützen) und Makrophasen (Blutabwehrzellen, die Viren und geschädigte Zellen zerstören) befallen. Das Zusammenspiel des HIV-Virus, der CD4+ und CD8+ T-Zellen ist in Abbildung 2.1 zusammengefaßt. HIV zerfällt kranke CD4 + gesunde CD4 + zerstört infiziert zerstört CD8 + stimuliert Produktion Abbildung 2.1: Interaktionen zwischen dem HIV-Virus und den CD4+ und CD8+ T-Zellen. Die HIV-Erkrankung kann in vier Stadien unterteilt werden: Der Virus dringt in den Körper ein. Die Virus- und T-Zellenpopulationen wachsen an. Eine große Anzahl von Viren und T-Zellen interagieren miteinander. Dieser Zustand kann einen langen Zeitraum umfassen. Die Anzahl der T-Zellen geht gegen Null, während sich die Viren ungehindert vermehren. Die körpereigenen Abwehrkräfte schwinden zusehens, und der Patient stirbt an einem ansonsten harmlosen Infekt. Dies ist das Aids-Stadium. Zur Zeit gibt es keine Therapie, die Aids heilt. Allerdings sind Medikamente wie AZT (Azidothymidine) entwickelt worden, die die Vermehrung des Virus verhindern und damit die Erkrankung verzögern. Der Gewinn an Lebenszeit wird allerdings durch starke Nebenwirkungen (Blutarmut, Verminderung der weißen Blutkörperchen, Übelkeit, Erbrechen usw.) erkauft. Soll das Medikament eingesetzt werden, so stellt sich die folgende Frage: Frage: In welchem Stadium der Erkrankung und über welchen Zeitraum führt die Medikamentation von AZT bei Aids-Kranken zu einer möglichst optimalen Lebensverlängerung (bei gleichzeitiger Minimierung der Zeit, in der AZT verabreicht wird)? Die Aids-Erkrankung ist zu komplex, um diese Frage zufriedenstellend beantworten zu können. Wir wollen ein einfaches Modell aufstellen und die Frage anhand dieses Modells 40 untersuchen. Es ist klar, daß wir ein dynamisches Modell für die HIV-Viren, die gesunden und kranken CD4+ T-Zellen und die CD8+ T-Zellen aufstellen müssen. Wir wählen die folgenden Variablen: x(t) = Anzahl der gesunden CD4+ und der CD8+ T-Zellen (pro Milliliter Blut) zur Zeit t, y(t) = Anzahl der kranken CD4+ T-Zellen zur Zeit t, v(t) = Anzahl der HIV-Viren zur Zeit t. Die zeitliche Änderung x0 (t) der gesunden CD4+ und der CD8+ T-Zellen wird modelliert durch eine Quelle neuer T-Zellen vom Thymus, etwa a > 0 (eigentlich hängt a von v(t) ab, da der Virus Thymozyten infizieren kann); einen natürlichen Sterbeterm −s1 x mit der durchschnittlichen Lebenserwartung 1/s1 einer T-Zelle; eine Stimulation von T-Zellen durch Zellteilung mittels eines Terms, der mit der Anzahl der HIV-Viren wächst, aber insgesamt beschränkt bleibt, rxv/(v +D), wobei D die Virenzahl angibt, für die die Zellteilungsrate halb so groß wie die Maximalrate ist; eine Reduktion von T-Zellen durch Infektion, −bxv. Die Änderung y 0 (t) der kranken CD4+ T-Zellen beschreiben wir durch den Zuwachsterm bxv infolge Infektionen mit dem HIV-Virus; einen Verlustterm, der die endliche Lebenserwartung der T-Zellen modelliert, −s 2 y, und der das Zerplatzen der T-Zellen beschreibt, −ryv/(v + D). Die Änderung v 0 (t) der Virenzahl sei schließlich gegeben durch das Freisetzen von N Viren infolge einer geplatzten T-Zelle, N ryv/(v + D); einen Verlustterm, der die Vernichtung der Viren durch CD8+ T-Zellen modelliert, −dxv; die Vermehrung des Virus von anderen Zellen (z.B. Thymozyten und Mikrophagen), gv/(v + C), die pro Zeiteinheit beschränkt bleibt. 41 Wir nehmen an, daß alle auftretenden Konstanten positiv sind. Mit diesen Modellierungsannahmen lautet unser System von Differentialgleichungen wie folgt: rxv x0 = a − s 1 x + − bxv, (2.8) v+D ryv , (2.9) y 0 = bxv − s2 y − v+D ryv gv − dxv + , t > 0. (2.10) v0 = N v+D v+C Als Anfangswerte wählen wir x(0) = x0 , y(0) = 0, v(0) = v0 . (2.11) 5 10 4 10 Gesunde T−Zellen Infizierte T−Zellen HIV−Viren Anzahl 3 10 2 10 1 10 0 10 0 2 4 6 8 Zeit in Jahren 10 12 Abbildung 2.2: Simulierter Verlauf einer Aids-Infektion mit b = 2.4 · 10 −5 . Das System (2.8)–(2.11) ist nicht so einfach zu analysieren wie die Populationsmodelle aus dem vorigen Abschnitt. Wir präsentieren hier nur numerische Lösungen für die Parameter a = 10, s2 = 0.265, s1 = 0.01, N = 1000, r = 0.01, d = 7.64 · 10−4 , D = 100, g = 20, −5 b = 2.4 · 10 , C = 1. In Abbildung 2.2 sehen wir den zeitlichen Verlauf der Aids-Erkrankung mit x0 = 1000, v0 = 10. Der Virus verharrt nach der Infektion über Jahre hinweg im Körper des HIVpositiven Patienten, bevor schließlich nach mehreren Jahren die Immunschwächekrankheit 42 Aids ausbricht. Innerhalb relativ kurzer Zeit (in einem Zeitraum von etwa einem Jahr) nimmt die Anzahl der gesunden T-Zellen rapide ab; der Patient verfügt schließlich über keine nennenswerte Immunabwehr und stirbt. 5 10 4 10 Gesunde T−Zellen Infizierte T−Zellen HIV−Viren Anzahl 3 10 2 10 1 10 0 10 0 5 10 Zeit in Jahren 15 Abbildung 2.3: Simulierter Verlauf einer Aids-Infektion bei Medikamentengabe nach 5 Jahren für 200 Tage (B(t) = 0.4b für 1825 ≤ t ≤ 2025 Tage). Um die eingangs gestellt Frage zu erörtern, simulieren wir den Verlauf der Krankheit bei einmaliger Gabe eines Medikaments, das die Vermehrung des Virus bzw. die Infektionsrate mindert. Wir nehmen an, daß in dieser Zeit die Infektionsrate b durch B(t) = 0.4 · b ersetzt werden kann. In Abbildung 2.3 erkennen wir, daß nach der Medikamentengabe die Virenzahl rapide abnimmt, aber nach dem Absetzen des Medikaments schnell wieder den alten Wert erreicht. Allerdings ist der Ausbruch der Aids-Erkrankung um mehrere Jahre verschoben worden. Der Effekt der Medikamentation ist noch größer, wenn das Medikament erst im 7. Jahr kurz vor Ausbruch der Erkrankung verabreicht wird (siehe Abbildung 2.4). Die Krankheit bricht erst nach einem etwa doppelt so langen Zeitraum wie ohne Medikament aus. Wenngleich dieses Modell das qualitative Verhalten der Aids-Krankheit frappierend genau widerspiegelt, ist es weit von der Realität entfernt. Es ist etwa die Sterberate der Viren, die zwischen zwei bis fünf pro Tag liegt, zu berücksichtigen. Wir haben die Halbwertszeit des Medikaments im Körper vernachlässigt. Die Nebenwirkungen des Medikaments und damit die Lebensqualität – im Gegensatz zur puren Lebensverlängerung – sind nicht modelliert worden. Übungsaufgabe: Lösen Sie das Modell (2.8)–(2.11) numerisch und untersuchen Sie 43 5 10 4 10 Gesunde T−Zellen Infizierte T−Zellen HIV−Viren Anzahl 3 10 2 10 1 10 0 10 0 5 10 Zeit in Jahren 15 20 Abbildung 2.4: Simulierter Verlauf einer Aids-Infektion bei Medikamentengabe nach 7 Jahren für 200 Tage (B(t) = 0.4b für 2555 ≤ t ≤ 2755 Tage). den Einfluß der Länge des Medikamentationszeitraums auf den Beginn des Aids-Stadiums. Sind mehrere kurze Behandlungen einer einzigen längeren vorzuziehen oder abzulehnen? 2.3 Chemische Reaktionskinetik Ein Chemiekonzern hat eine Methode gefunden, ein Molekül A in ein Modekül C umzuwandeln. Als Zwischenprodukt wird das Molekül B erzeugt, das allerdings am Ende der Umwandlung nicht mehr auftritt. Da das Molekül B sehr aggressiv mit der Wand des Reaktors, in dem die Umwandlung stattfindet, reagiert, ist das Unternehmen an dem Wert der maximalen Konzentration von B interessiert, um einen geeigneten Schutz der Reaktorwand vornehmen zu können. Das Reaktionsschema sei wie folgt: α A −→ B, β 2B −→ B + C, (2.12) γ B + C −→ A + C, wobei die Buchstaben über den Pfeilen die Reaktionskoeffizienten, die proportional zu den Reaktionsgeschwindigkeiten sind, darstellen. Sie seien gegeben durch α = 0.04, β = 3·10 7 , γ = 104 . Während das Molekül A nur relativ langsam in die Zwischenform B übergeht, wirkt die Existenz von B katalytisch für eine weitere, sehr schnelle Transformation von B nach C. Daneben findet in Anwesenheit von C eine Rücktransformation von B nach A statt. Da die Substanz B sehr schnell reagiert, ist zu erwarten, daß sie nur einen 44 relativ kleinen Anteil im Molekülgemisch ausmacht. Dieser ist jedoch entscheidend, um die Weiterreaktion zu C in Gang zu halten. Die zu beantwortende Frage lautet nun: Frage: Wie groß wird die Konzentration der Substanz B im Verlauf der obigen Reaktion höchstens? Um zu verstehen, wie wir das obige Reaktionsschema modellieren können, betrachten wir zunächst ein einfacheres Beispiel: Ein Molekül A verwandelt sich in Anwesenheit eines Moleküls B in ein zweites Molekül B mit Reaktionskoeffizienten α: α A + B −→ 2B. Zu Beginn der Reaktion betrage die Konzentration von A gerade c0 ∈ [0, 1], und die Konzentration von B sei 1−c0 . Wir erwarten, daß die Konzentration von A stetig abnimmt und die von B zunimmt, bis keine Moleküle von A in dem Gemisch vorhanden sind. Wie schnell findet die Reaktion statt? Seien CA (t) und CB (t) die Konzentrationen von A und B zur Zeit t. Wie groß sind die Reaktionsgeschwindigkeiten CA0 bzw. CB0 ? Nach dem sogenannten Massenwirkungsgesetz ist sie (bei konstantem Druck, Volumen und Temperatur) proportional zu der Wahrscheinlichkeit, daß zwei Moleküle der entsprechenden Reaktion aufeinander treffen, also proportional zu dem Produkt der Konzentrationen von A und B. Die Proportionalitätskonstante ist der Reaktionskoeffizient α > 0. Folglich ist CA0 = −αCA CB , CB0 = αCA CB , t > 0, (2.13) mit Anfangskonzentrationen CA (0) = c0 , CB (0) = 1 − c0 . (2.14) Wir sind in der Lage, das Verhalten der Lösungen des Systems (2.13)–(2.14) präzise zu beschreiben, ohne das Problem explizit lösen zu müssen. Zuerst bemerken wir, daß wegen (CA + CB )0 = 0, (CA + CB )(0) = 1 die Summe der Konzentrationen stets gleich Eins ist. Außerdem ist wie erwartet C A monoton fallend und CB monton wachsend. Die stationären Punkte sind durch CA = 1, CB = 0 und CA = 0, CB = 1 gegeben. Die Eigenwerte der Ableitung der Abbildung (CA , CB ) 7→ (−αCA CB , αCA CB ) lauten λ1 = 0, λ2 = α im Punkt (1, 0) und λ1 = −α, λ2 = 0 im Punkt (0, 1). Der stationäre Punkt (1, 0) ist also instabil nach Satz 1.5; über den anderen ist keine Aussage möglich. 45 Wir behaupten, daß er asymptotisch stabil ist. Um dies einzusehen, multiplizieren wir die erste Gleichung in (2.13) mit CA und die zweite Gleichung mit CB − 1. Wir erhalten wegen CA + CB = 1: 1d 2 (C + (CB − 1)2 ) = CA0 CA + CB0 (CB − 1) 2 dt A = αCA CB (−CA + CB − 1) = −2αCA2 CB . Nun ist CB monoton wachsend, also CB (t) ≥ CB (0) = 1 − c0 . Dies impliziert d 2 (C + (CB − 1)2 ) ≤ −4α(1 − c0 )CA2 . dt A Integration von 0 bis t führt auf 2 2 2 2c20 CA (t) ≤ CA (t) + (CB (t) − 1) ≤ − 4α(1 − c0 ) Z t CA (s)2 ds. 0 Wir benutzen nun die Ungleichung von Gronwall: Lemma 2.1 Seien α ≥ 0, β ∈ R und f ∈ C 0 ([a, b]; [0, ∞)), und es gelte Z x f (x) ≤ α + β f (s) ds für alle a ≤ x ≤ b. 0 Dann folgt f (x) ≤ αeβx für alle a ≤ x ≤ b. Übungsaufgabe: Beweisen Sie Lemma 2.1. Es folgt (wenn CA ≥ 0) CA (t) ≤ √ 2c0 e−2(1−c0 )αt und CB (t) = 1 − CA (t) ≥ 1 − √ 2c0 e−2(1−c0 )αt , (2.15) t > 0. (2.16) Wie erwartet gilt CA (t) → 0, CB (t) → 1 (t → ∞), und die Konvergenz ist exponentiall schnell mit Konvergenzrate −2(1 − c0 )α. (Wir bemerken, daß die Abschätzungen (2.15)–(2.16), insbesondere für t = 0, nicht optimal sind.) Übungsaufgabe: Lösen Sie das Anfangswertproblem (2.13)–(2.14) analytisch, indem Sie die Variablentransformation x = CA − CB , y = CA + CB durchführen. 46 Wir kehren nun zu dem Reaktionsschema (2.12) zurück. Seien CA (t), CB (t) bzw. CC (t) die Konzentrationen der Substanzen A, B bzw. C zur Zeit t. Die Reaktionsgeschwindigkeit CA0 von A ist zum einen proportional zur Konzentration von A (mit Reaktionskoeffizient −α) und zum anderen proportional zum Produkt der Konzentrationen von B und C (mit Koeffizient +γ). Analog können die Reaktionsgeschwindigkeiten von B und C bestimmt werden. Das Resultat ist ein System gewöhnlicher Differentialgleichungen für CA , CB und CC : CA0 = −αCA + γCB CC , CB0 = αCA − γCB CC − βCB2 , CC0 = βCB2 , (2.17) t > 0. Als Anfangswerte wählen wir CA (0) = 1, CB (0) = CC (0) = 0. (2.18) Aus (2.17) können wir ablesen, daß CC während der Reaktion monoton wächst. Addition der drei Gleichungen ergibt (CA + CB + CC )0 = 0, also ist die Summe der Konzentrationen konstant: CA (t) + CB (t) + CC (t) = 1 für alle t ≥ 0. Wir bestimmen nun die stationären Punkte. Aus −αCA + γCB CC = 0, αCA − γCB CC − βCB2 = 0, βCB2 = 0 folgt, daß CB = 0, also CA = 0 und wegen CA + CB + CC = 1 daher CC = 1 die einzige Lösung dieses Gleichungssystems ist. Bezeichnen wir mit F (CA , CB , CC ) den Vektor der rechten Seiten von (2.17), so lautet die Ableitung von F im Punkt (0, 0, 1): −α γ 0 F 0 (0, 0, 1) = α −γ 0 , 0 0 0 und die Eigenwerte sind λ1/2 = 0 und λ3 = −(α + γ). Satz 1.5 erlaubt wieder keine Aussage. Auch die Technik, die oben zum exponentiellen Abklingen geführt hat, kann hier nicht verwendet werden. Der Grund ist, daß die Konzentrationen nicht alle monoton sind. In der Tat: Zur Zeit t = 0 ist kein Molekül der Substanz B vorhanden; es wird im Verlauf der Reaktionen gebildet und schließlich wieder abgebaut. Wir rechnen damit, daß 47 es einen Zeitpunkt gibt, an dem CB0 = 0 gilt. Zu dieser Zeit ist die Konzentration von B maximal. Aus (2.17) folgt γCC αCA CB2 + CB − = 0. β β Die (positive) Lösung lautet CB,max −γCC + = 2β sµ γCC 2β ¶2 + αCA . β (2.19) Nehmen wir nun an, daß die Konzentration CA und CC stets kleiner oder gleich Eins sind, erhalten wir die Abschätzung sµ ¶ r 2 α γ 10−6 4 −9 + = CB,max ≤ + 10 ≈ 1.71 · 10−4 . 2β β 36 3 −5 3.8 1 Substanz B Substanz A Substanz C 3.7 0.8 3.6 Konzentration Konzentration x 10 0.6 0.4 3.5 3.4 3.3 3.2 0.2 3.1 0 0 2000 4000 6000 8000 0 10000 0.02 0.04 0.06 0.08 0.1 Zeit Zeit Abbildung 2.5: Simulation des Reaktionsverlaufs der Substanzen A, C (links) und B (rechts) als Funktion der Zeit. Diese Schranke ist viel zu groß. Um dies zu sehen, lösen wir das Problem (2.17)–(2.18) numerisch. In Abbildung 2.5 sind die drei Konzentrationen als Funktion der Zeit dargestellt. Die Konzentration von B wächst zunächst sehr schnell und nimmt dann sehr langsam ab. Der Umschlagpunkt, an dem CB0 = 0 gilt, wird zu einer Zeit erreicht, zu der die Konzentration CA nahezu Eins und die Konzentration CC kaum größer als Null ist. Dies führt in (2.19) zu einer verbesserten Abschätzung r 4 −9 10 ≈ 3.65 · 10−5 . CB,max ≈ 3 Damit haben wir die eingangs gestellte Frage beantwortet. Die maximale Konzentration der Substanz C in dem Gemisch beträgt etwa 0.0365 . 48 Übungsaufgabe: Die chemische Reaktion A + B → C gehorche dem Massenwirkungsgesetz mit Reaktionskoeffizient α > 0. Seien CA , CB bzw. CC die Konzentrationen der Substanzen A, B, bzw. C. Zur Zeit t = 0 gelte CA (0) = a > 0, CB (0) = 1 − a > 0 und CC (0) = 0. Zeigen Sie, daß CA (t) und CB (t) exponentiell schnell für t → ∞ gegen Null konvergieren. Folgern Sie den Wert für limt→∞ CC (t). 2.4 Ein Wirtschaftsmodell Wir betrachten eine Nation A, die sehr enge wirtschaftliche Verbindungen zu einer Nation B pflegt. Die Nation A exportiere selbst hergestellte Waren an B und importiere dafür von B hergestellte Waren aus dem Erzeugerland. Wir wollen die folgende Frage erörtern: Frage: Wie wirkt sich die Änderung der Importrate der Nation A auf die “Zufriedenheit” der Nation aus, und wie beeinflußt dies die Dynamik der Warenproduktion? Diese Frage enthält den Begriff “Zufriedenheit”, den wir definieren müssen. Um die Situation zu vereinfachen, nehmen wir an, daß die beiden Nationen ausschließlich miteinander Handel treiben. Es seien x = Wert der von Nation A hergestellten Waren, y = Wert der von Nation B hergestellten Waren. Der Wert sei berechnet in Einheiten geleisteter Arbeitsstunden und sei diesen proportional; d.h., eine Ware sei doppelt soviel wert wie eine andere, wenn sie zur Produktion doppelt so viele Arbeitsstunden benötigt. Es gelte x ≥ 0, y ≥ 0. Weiter nehmen wir an, daß der Anteil der exportierten Waren für beide Nationen gleich groß ist. Wir definieren dann: p = Anteil der selbst verbrauchten Waren, 1 − p = Anteil der exportierten Waren. Um die “Zufriedenheit” oder “Nutzen” (im Englischen utility) einer Nation zu modellieren, machen wir die folgenden Annahmen: Annahme A: “Je mehr Waren der einen Sorte man hat, umso schwächer steigt der Nutzen, wenn man neue Waren derselben Sorte erhält.” Mit anderen Worten: Erhält man eine Ware erstmalig, erhöht dies die Zufriedenheit sehr; hat man bereits viele Waren derselben Sorte und bekommt dann eine weitere dazu, erhöht dies den Nutzen nur geringfügig. 49 Annahme B: “Zuviel Arbeit ist unbefriedigend.” Das heißt, die Zufriedenheit nimmt bei zunehmender Arbeit (die proportional zu dem erzeugten Warenwert ist) ab. Annahme C: “Die Warenproduktion steigt mit zunehmender Zufriedenheit.” Im folgenden setzen wir diese umgangssprachlichen Aussagen in mathematische Formeln um. Annahme A: Sei U (g) die Funktion, die den Nutzen bzw. die Zufriedenheit einer Nation in Abhängigkeit des Warenwerts g modelliert. Die Aussage A bedeutet, daß die Änderung des Nutzens dU kleiner bei fester Änderung des Warenwerts dg wird, je größer der Warenwert g selbst wird: dU = f (g) dg und f ist monoton fallend. Eine Möglichkeit ist die Wahl f (g) = k/g mit einer Konstanten k > 0. Sind keine Waren vorhanden (g = 0), so ist der Nutzen Null (U = 0). Wir müssen also das Anfangswertproblem k dU = , g > 0, U (0) = 0, dg g lösen. Die allgemeine Lösung der Differentialgleichung lautet U (g) = k ln g + c mit c ∈ R, doch ist U (0) nicht definiert! Es existiert also keine Lösung. Der Grund ist, daß das Modell unrealistisch ist: Besitzt man anfangs keine Waren (U = 0), so ist die Nutzenänderung U 0 (0) unendlich. Wir nehmen an, daß die Nutzenänderung proportional zur Änderung des Warenwertes dg ist, wenn g = 0, d.h. U 0 (0) = (dU/dg)(0) = k > 0. Wir machen den Ansatz f (g) = k/(1 + g) und lösen das Problem dU k = , dg 1+g g > 0, U (0) = 0. Die Lösung lautet U (g) = k ln(1 + g), g ≥ 0. Für die betrachteten Nationen setzt sich der Warenwert aus den Anteilen der Werte der selbst verbrauchten Waren und der importierten Waren zusammen: Nation A: g = px + (1 − p)y, Nation B: g = py + (1 − p)x. Folglich sind die Nutzenfunktionen UA der Nation A und UB der Nation B gegeben durch UA (x, y) = k ln(1 + px + (1 − p)y), UB (x, y) = k ln(1 + (1 − p)x + py), 50 x, y ≥ 0, wobei wir angenommen haben, daß der Proportionalitätsfaktor k für beide Nationen gleich ist. Annahme B: Die Zufriedenheit wäre maximal, gäbe es keine Arbeit, und nimmt ansonsten um einen Faktor ab, der von der geleisteten Arbeit und damit von dem produzierten Warenwert abhängt. Unterstellen wir auch hier Proportionalität, werden die Funktionen UA und UB um den Wert ax bzw. ay vermindert. Damit haben die Nutzenfunktionen die Gestalt UA (x, y) = k ln(1 + px + (1 − p)y) − ax, UB (x, y) = k ln(1 + (1 − p)x + py) − ay. Dieses Modell berücksichtigt, daß zuviel Arbeit zu einem negativen Nutzen führt. Bei festem y ≥ 0 existiert nämlich ein x0 , so daß UA (x, y0 ) ≤ 0 für x ≥ x0 (interpretiert als “zuviel Arbeit”). Werden überhaupt keine Waren produziert (x = 0, “keine Arbeit”), so hängt die Zufriedenheit ausschließlich von dem Warenwert der importierten Waren ab. Auf lange Sicht ist diese Situation natürlich unrealistisch, da die Importe nicht bezahlt werden können, wenn kein Geld durch Warenproduktion erwirtschaftet wird. Annahme C: Bei wachsender Zufriedenheit ∂UA /∂x > 0 steigt die Warenproduktion, d.h., x(t) wächst monoton: dx/dt > 0. Wir nehmen an, daß die zeitliche Änderung x0 (t) der Warenproduktion proportional zur Änderung der Zufriedenheit ist: x0 = c ckp ∂UA = − ca; ∂x 1 + px + (1 − p)y analog erhalten wir (mit derselben Proportionalitätskonstanten c > 0) y0 = c ∂UB ckp = − ca. ∂y 1 + (1 − p)x + py Wir haben vier Parameter (c, k, a und p). Durch Einführung einer neuen Zeit t0 = ckt und eines Parameters r = a/k läßt sich die Anzahl der Parameter auf zwei begrenzen: 1 dx p dx = = − r, 0 dt ck dt 1 + px + (1 − p)y dy 1 dy p = = − r. 0 dt ck dt 1 + (1 − p)x + py Im folgenden schreiben wir wieder t anstatt t0 ; das zu lösende Problem lautet p − r, 1 + px + (1 − p)y p = − r, 1 + px + (1 − p)y x0 = t > 0, x(0) = x0 , (2.20) y0 t > 0, y(0) = y0 , (2.21) 51 Wir bestimmen zuerst die stationären Punkte von (2.20)–(2.21) und untersuchen das System auf Stabilität bzw. Instabilität. Aus p p −r = −r =0 1 + px + (1 − p)y 1 + (1 − p)x + py folgt 1 + px + (1 − p)y = p = 1 + (1 − p)x + py r und damit (2p − 1)(x − y) = 0. Wir untersuchen zwei Fälle: 1. Fall: p 6= 12 . Es folgt x = y und p p =⇒ x = − 1. r r 1 + px + (1 − p)x = Es gibt genau einen stationären Punkt x0 = y 0 = p − 1, r sofern p ≥ r. Falls p < r, existieren keine stationären Punkte (in x, y ≥ 0). 2. Fall: p = 12 . Dies impliziert 1 1 1 1 =⇒ x + y = − 2 1+ x+ y = 2 2 2r r und daher die folgenden Fälle: 1 : 2 1 r= : 2 1 r< : 2 r> Es gibt keine stationären Punkte. Es existiert genau ein stationärer Punkt (0, 0). Es gibt unendlich viele stationäre Punkte (x1 , y1 ), gegeben durch x1 + y1 = 1/r − 2 > 0. Sind die stationären Punkte stabil oder instabil? Sei zuerst p 6= 21 und definiere ¶ µ p(1 + px + (1 − p)y)−1 − r , x, y ≥ 0. F (x, y) = p(1 + (1 − p)x + py)−1 − r Die Eigenwerte von F 0 (x0 , y0 ) = −p(1 + px0 + (1 − p)y0 )−2 à p 1−p 1−p p ! r2 =− p lauten λ1 = −r2 /p, λ2 = r2 (1 − 2p)/p. 52 à p 1−p 1−p p ! Folglich erhalten wir asymptotische Stabilität, wenn p > 12 , d.h., wenn die Nation die produzierten Waren eher selbst verbraucht, als sie zu exportieren. Im Fall p = 21 gilt 1 + px1 + (1 − p)y1 = 1/2r. Die Eigenwerte der Matrix à ! 1 1 F 0 (x1 , y1 ) = −r2 1 1 lauten λ2 = −2r2 . λ1 = 0, Der Satz 1.5 erlaubt keine Aussage. Der Fall p = 12 läßt sich dennoch vollständig behandeln. Addition und Subtraktion von (2.20) und (2.21) liefert die Gleichungen (x − y)0 = 0, 2 − 2r. 2+x+y (x + y)0 = Die erste Gleichung impliziert x(t) − y(t) = const. = x0 − y0 , und nach Einsetzen in die zweite Gleichung folgt y0 = 1 1 − rα − 2ry −r = , 2 + x0 − y0 + 2y α + 2y wobei α := 2 + x0 − y0 . Integration ergibt t= Z t dt = 0 Z y(t) y0 1 α + 2y dy = 1 − rα − 2ry r Z y(t) y0 t > 0, µ y(0) = y0 , 1 −1 + 1 − rα − 2ry ¶ dy. Sei zuerst 1−rα−2ry0 > 0. Dann ist, zumindest für kleine Zeiten, auch 1−rα−2ry(t) > 0, und wir erhalten rt = y0 − y(t) − 1 1 ln(1 − rα − 2ry(t)) + ln(1 − rα − 2ry0 ), 2r 2r t > 0. Für t → ∞ strebt die linke Seite gegen unendlich, also muß − ln(1 − rα − 2ry(t)) → ∞ folgen, da wir y(t) ≥ 0 vorausgesetzt haben. Dies impliziert 1 − rα − 2ry(t) → 0 oder y(t) → rα − 1 1 1 = 1 + (x0 − y0 ) − 2r 2 2r und damit 3 1 x(t) = x0 − y0 + y(t) → 1 + (x0 − y0 ) − 2 2r 53 für t → ∞. Wenn rα − 1 < 0 (oder x0 − y0 < −1/r), wird y(t) nach endlicher Zeit negativ werden, was wir ausgeschlossen haben. Also existiert in diesem Fall eine Lösung nur auf einem endlichen Zeitintervall, etwa auf [0, t0 ] und y(t0 ) = 0. Sei nun 1 − rα − 2ry0 < 0. Dann folgt, zumindest für kleine Zeiten, ¶ Z y(t) µ 1 dy −1 − rt = rα − 1 + 2ry y0 1 1 = y0 − y(t) − ln(rα − 1 + 2ry(t)) + ln(rα − 1 + 2ry0 ). 2r 2r Mit demselben Argument wie oben folgt rα − 1 + 2ry(t) → 0 für t → ∞ oder 1 − rα 1 1 = − 1 − (x0 − y0 ), 2r 2r 2 1 1 x(t) → − 1 + (x0 − y0 ) für t → ∞. 2r 2 y(t) → Wenn 1 − rα < 0 gilt, existiert die Lösung wieder nur auf einem endlichen Zeitintervall. Notwendige Bedingungen für globale Lösungen (d.h. nichtnegative Lösungen, die für alle t ≥ 0 existieren) sind also die Ungleichungen 1 − rα − 2ry0 > 0 und rα − 1 > 0 1 − rα − 2ry0 < 0 und rα − 1 < 0. oder Zusammengefaßt erhalten wir Lösungen, die nur auf einem endlichen Zeitintervall existieren, wenn 1 − rα − 2ry0 > 0 und rα − 1 < 0 oder wenn 1 − rα − 2ry0 < 0 und rα − 1 > 0 gelten. Dies ist äquivalent zu x0 − y 0 < 1 1 − 2 oder x0 − y0 > − 2. r r Dies bedeutet, daß im Falle p = 21 die Warenproduktion einer der beiden Nationen zum Erliegen kommt, wenn x0 − y0 6= 1/r − 2. Falls x0 − y0 = 1/r − 2, existiert eine globale Lösung, nämlich x(t) = x0 , y(t) = y0 für t > 0. Wir kommen nun auf die eingangs gestellte Frage zurück: Welchen Einfluß hat die Änderung der Importrate auf den Nutzen? Wir nehmen an, daß die Importrate der Nation A von p auf p − s mit 0 < s < p fällt. Wir setzen weiterhin voraus, daß p − s ≥ r gilt und daß die Änderung der Importrate zu einem Zeitpunkt stattfindet, in der sich die 54 Wirtschaft beider Nationen in einem stationären Zustand befindet. Wegen p > r lautet dieser stationäre Zustand p x2 = y2 = − 1. r Nach längerer Zeit nach der Änderung bewegt sich die Warenproduktion auf einen neuen stationären Zustand p−s x3 = y 3 = −1 r zu. Hier haben wir Gebrauch von der Voraussetzung p − s ≥ r gemacht. Es muß nun die Frage beantwortet werden, ob der “neue” Nutzen UA (x2 , y2 ) größer oder kleiner als der vorherige Nutzen UA (x3 , y3 ) ist. Wegen UA (p/r − 1, p/r − 1) = k ln kp − kp + a a ist die Monotonie der Funktion p 7→ UA (p/r − 1, p/r − 1) zu untersuchen. Sie hat genau ein Maximum bei p = 1 und ist monoton wachsend für p ≤ 1. Folglich gilt UA (x2 , y2 ) > UA (x3 , y3 ). Die Zufriedenheit der Nation A sinkt also bei Abfallen der Importrate (sofern p − s ≥ r = a/k). Übungsaufgabe: Wie ändert sich die Zufriedenheit der Nation A, wenn die Importrate von p ≥ a/k auf p − s mit s > p − a/k fällt? 2.5 Elektrische Schaltkreise Für die Entwicklung moderner Computerbauteile (Halbleiterprozessoren, Mobilfunkbauteile etc.) ist die Simulation elektrischer Schaltkreise mit einer sehr großen Anzahl von Bauteilen (Widerstände, Transistoren etc.) notwendig. In diesem Abschnitt betrachten wir eine sogenannte Emitterschaltung, die eine gängige Verstärkerstufe für eine Eingangswechselspannung US mit Hilfe eines Transistors darstellt (Abbildung 2.6). Ziel dieses Abschnittes ist es, das zeitliche Verhalten der elektrischen Spannung innerhalb des Schaltkreises zu modellieren. Dazu benötigen wir einige Grundbegriffe aus der Elektrotechnik. Der Schaltkreis enthält die Widerstände R1 , R2 , RC , RE und RL , die Kondensatoren C1 , C2 und CE und einen Transistor im Zentrum der Schaltung. Im allgemeinen unterscheidet man u.a. die folgenden Bauteile in elektrischen Schaltkreisen: Widerstände: Dies sind Bauteile (z.B. auch Drähte), an denen eine Spannung UR abfällt. Nach dem Ohmschen Gesetz ist der durch einen Widerstand fließende Strom IR proportional zur Spannung UR : UR = R · I R . 55 U0 R R1 C1 C B C2 C L < E U s(t) ο ο UL R 2 R E CE RL Abbildung 2.6: Eine Verstärker-Grundschaltung. Die Proportionalitätskonstante nennt man Widerstand. Kondensatoren: Sie speichern elektrische Ladungen. Der elektrische Strom IC durch einen Kondensator ist proportional zu Spannungsänderungen: dUC , dt wobei die Proportionalitätskonstante Kapazität genannt wird. IC = C Spulen: Sie speichern Energie in ihren magnetischen Feldern. Hier ist die abfallende Spannung UL proportional zu den Stromänderungen dIL dt mit der Induktivität als Proportionalitätskonstante. Die Verstärkerschaltung 2.6 enthält keine Spulen. UL = L Transistoren: Sie können als Verstärker genutzt werden. Sie sind über die Eingangskennlinien an der Basis B IB = IB (UB − UE , UC − UE ) und die Ausgangskennlinien am Kollektor C IC = IC (UC − UE , IB ) definiert, wobei IB bzw. IC die Ströme durch die Basis bzw. den Kollektor und UB − UE bzw. UC − UE die Spannungsdifferenzen zwischen Basis und Emitter bzw. Kollektor und Emitter sind. Die Funktionen IB und IC betrachten wir als gegeben (Abbildung 2.7). 56 U −U C E I B I C I B U −U C E U −U B E Abbildung 2.7: Kennlinien eines Transistors für verschiedene Werte von UC − UE (links) bzw. IB (rechts). Die Ströme und Spannungen an den einzelnen Bauteilen in einem Schaltkreis werden durch die Kirchhoffschen Gesetze in Zusammenhang gebracht: Knotenregel für Ströme: Die Summe der an einem Knoten zusammentreffenden Ströme durch die entsprechenden Leiter ist Null (Abbildung 2.8 links): X Ik = 0. k Maschenregel für Spannungen: Die Summe der zu einer Masche gehörenden Spannungen ist Null (Abbildung 2.8 rechts): X Uk = 0. k I 1 I 2 U2 U1 U3 I 4 I 3 U4 Abbildung 2.8: Zur Knoten- und Maschenregel. Als Beispiel betrachten wir einen RLC-Schaltkreis, bestehend aus einem Widerstand R, einer Induktivität L und einer Kapazität C in Reihe mit angelegter Spannung U = U (t) (Abbildung 2.9). Nach der Maschenregel gilt für die über die Bauteile abfallenden Spannungen: U = U R + UL + UC . (2.22) Nach der Knotenregel fließt durch jedes der drei Bauteile der gleiche Strom I := IR = IL = IC . 57 C U(t) ο ο L R Abbildung 2.9: Ein RLC-Schaltkreis. Setzen wir UR = RI und UL = LI 0 in (2.22) ein, leiten die Gleichung einmal ab und verwenden UC0 = I/C, so folgt 1 R 0 I + I = U 0 (t). L LC Dies ist eine Differentialgleichung für eine erschwungene Schwingung mit Eigenfrequenz √ 1/ LC und “Reibungskonstante” R/L. Die Lösung I dieser Gleichung liefert den unbekannten Strom durch das Bauteil. Bei der Verstärkerschaltung aus Abbildung 2.6 sind die Gleichspannung U0 und die Wechselspannung US (t) gegeben, und die Ausgangsspannung UL (t) ist gesucht. Wir erwarten, daß die Eingangsspannung US verstärkt wird. Genauer gesagt wollen wir die unbekannten Spannungen UB , UC , UE und UL an den vier Knoten B, C, E und L bestimmen. Dazu benutzen wir die Knotenregel: I 00 + Knoten B: 0 = = Knoten C: 0 = = Knoten E: 0 = Knoten L: 0 = I R1 + I C1 + I R2 + I B R1−1 (UB − U0 ) + C1 (UB0 − US0 ) + R2−1 UB + IB , I RC + I C2 + I C RC−1 (UC − U0 ) + C2 (UC0 − UL0 ) + IC , −1 UE + CE UE0 + IE , I RE + I CE + I E = R E IRL + IC2 = RL−1 UL + C2 (UL0 − UC0 ). Den Emitterstrom können wir durch die Knotenregel IE + I B + I C = 0 durch die Basis- und Kollektorströme ersetzen. Wir erhalten das folgende (nichtlineare) System Ax0 = b · x + f (x) (2.23) mit A= C1 0 0 0 0 C2 0 −C2 , 0 0 CE 0 0 −C2 0 C2 x= 58 UB UC UE UL , b = − R1−1 + R2−1 RC−1 −1 RE RL−1 und f (x) = R1−1 (U0 − UB ) + C1−1 US0 − IB (UB − UE , UC − UE ) RC−1 U0 − IC (UC − UE , IB ) IB + I C 0 . Die Matrix A ist singulär. Dies ist nicht erstaunlich, da wir das Ohmsche Gesetz verwendet haben, das keine Differentialgleichung ist. Allerdings kann das System (2.23) so nicht gelöst werden. Wir führen zuerst die folgende Variablentransformation durch y1 = U B , y2 = U C − U L , y3 = U E , z = U C − UB , mit der wir die vierte Zeile von (2.23) umschreiben können. Addition der Gleichungen am Knoten C und L ergibt eine algebraische Gleichung: 0 = RC−1 (UC − U0 ) + IC + RL−1 UL = (RC−1 + RL−1 )UC − RL−1 (UC − UL ) + IC − RC−1 U0 = (RC−1 + RL−1 )(y1 + z) − RL−1 y2 + IC − RC−1 U0 . Die ersten drei Zeilen von (2.23) und die algebraische Gleichung fassen wir dann wie folgt zusammen: y 0 = f (y, z), 0 = g(y, z), t > 0, (2.24) mit y = (y1 , y2 , y3 )> , und −[(C1 R2 )−1 + (C1 R1 )−1 ]y1 − C1−1 IB + (C1 R1 )−1 U0 + US0 f (y, z) = −(C2 RC )−1 (y1 + z) − C2−1 IC + (C2 RC )−1 U0 −1 −1 −(CE RE ) y3 + CE (IB + IC ) g(y, z) = (RC−1 + RL−1 )(y1 + z) − RL−1 y2 + IC − RC−1 U0 . Unter welchen Bedingungen ist das System (2.24), zusammen mit den Anfangsbedingungen y(0) = y0 , z(0) = z0 lösbar? Zum einen müssen die Anfangswerte mit der zweiten Gleichung in (2.24) konsistent sein, d.h., es muß g(y0 , z0 ) = 0 gelten. Gilt zum anderen, daß (∂g/∂z)(y0 , z0 ) invertierbar ist, so existiert nach dem Satz über implizite Funktionen eine eindeutig bestimmte Funktion ψ : U → R in einer Umgebung U ⊂ R3 von y0 mit ψ(y0 ) = z0 und g(y, ψ(y)) = 0. Mit Hilfe dieser Funktion kann (2.24) in das äquivalente System y 0 = f (y, ψ(y)), t > 0, y(0) = y0 , 59 z = ψ(y), überführt werden, dessen Lösbarkeit (unter geeigneten Voraussetzungen an f bzw. IB und IC ) durch Satz 1.2 garantiert ist. Die Frage, ob ∂g/∂z invertiert werden kann, hängt von der speziellen Struktur der Funktionen IB und IC ab. Eine hinreichende Bedingung ist 0 < = ∂ ∂g (y0 , z0 ) = IC (z + y1 − y3 ), IB (y1 − y3 , z + y1 − y3 )) ∂z ∂z ∂IC ∂IC ∂IB + , ∂(UC − UE ) ∂IB ∂(UC − UE ) ausgewertet an (y0 , z0 ). In der Praxis ist diese Bedingung erfüllt. Ein gekoppeltes Problem aus gewöhnlichen Differentialgleichungen und algebraischen Gleichungen nennt man übrigens ein differential-algebraisches Problem. Ist (∂g/∂z)(y0 , z0 ) invertierbar, so nennt man das System mit Index Eins, andernfalls mit Index größer Eins. Das differential-algebraische System (2.24) kann nur numerisch gelöst werden. Zum Glück ist die Transformation ψ(y) = z nicht zur Lösung notwendig. Eine andere Idee besteht darin, das Problem y 0 = f (y, z), εz 0 = g(y, z), t > 0, t > 0, y(0) = y0 , z(0) = z0 , numerisch zu diskretisieren und dann ε → 0 streben zu lassen. Wir verweisen für Details auf die Bücher [2, 3]. 2.6 Himmelsmechanik Wir wollen die folgende Frage beantworten: Frage: Wie stabil ist unser Sonnensystem gegenüber Störungen? Unser Sonnensystem besteht aus n Körpern mit Massen m1 , . . . , mn , die sich entlang gewisser Bahnen r1 (t), . . . , rn (t) ∈ R3 im Raum bewegen. Die Bewegung der Körper wird durch das Newtonsche Gesetz mi ri00 = Fi , i = 1, . . . , n, (2.25) beschrieben, wobei Fi die auf den i-ten Körper wirkenden Gravitationskräfte aller anderen Körper ist. In Abschnitt 1.2 hatten wir bereits die Gravitationskraft verwendet; sie lautet zwischen zwei Körpern (siehe Abbildung 2.10): F1 = − Gm1 m2 (r1 − r2 ), |r1 − r2 |3 F2 = − Gm1 m2 (r2 − r1 ) |r2 − r1 |3 wobei G = 6.7 · 10−11 m3 /s2 kg die Gravitationskonstante sei. 60 (2.26) F m 1 m 1 2 F2 r 1 r 2 0 Abbildung 2.10: Auf die Körper mit Massen m1 und m2 wirkende Gravitationskräfte. Betrachten wir zuerst ein System, bestehend aus der Sonne mit Masse m1 und der Erde mit Masse m2 . Die Bewegung der Bahnen der Sonne r1 (t) und der Erde r2 (t) sind nach (2.25) und (2.26) gegeben durch m1 r100 = − Gm1 m2 (r1 − r2 ), |r1 − r2 |3 m2 r200 = − Gm1 m2 (r2 − r1 ). |r2 − r1 |3 (2.27) Nun ist die Masse m2 der Erde sehr viel kleiner als die der Sonne, nämlich m1 = 2 · 1030 kg, m2 = 6 · 1024 kg, so daß wir die Hoffnung haben, das Problem (2.27) durch Reduktion vereinfachen zu können. Das System (2.27) hat die drei Parameter G, m1 , m2 , deren Einheiten gemäß Abschnitt 1.2 wie folgt in eine Koeffizientenmatrix geschrieben werden können: G m 1 m2 cm 3 0 0 g −1 1 1 . s −2 0 0 Der Kern dieser Matrix wird durch ven Vektor (0, −1, 1) aufgespannt, so daß wir den Parameter m2 ≈ 10−6 ε := m1 verwenden. Um (2.27) zu skalieren, verwenden wir die Referenzlänge L = Entfernung Erde–Sonne = 1.5 · 1011 m und die Referenzzeit T = s L3 = 5 · 106 s. Gm1 Da die Erde in einem Jahr (also 3.2 · 107 s) auf ihrem Weg um die Sonne die Entfernung 2πL mit Geschwindigkeit v = 2πL/3.2·107 s zurücklegt, entspricht T der Zeit, die die Erde braucht, um die Strecke vT = 2πL · 5 · 106 /3.2 · 107 ≈ L zu durchlaufen. Wir skalieren ri → Lri (i = 1, 2) 61 und t → Tt und erhalten die Gleichungen r100 = −ε r1 − r 2 , |r1 − r2 |3 r200 = − r2 − r 1 , |r2 − r1 |3 t > 0. (2.28) Wir wählen r0 = L für die Anfangsbedingung für r2 (0) und v0 = 2πL/(1 Jahr) für r20 (0). Die skalierten Anfangswerte lauten dann 0 1 0 0 0 r1 (0) = r1 (0) = 0 , r2 (0) = 0 , r2 (0) = 1 . (2.29) 0 0 0 Wir können das Problem (2.28) entkoppeln und auf die Bewegung eines einzigen Körpers reduzieren, indem wir die Bewegungsgleichungen für den Ortsvektor des gemeinsamen Schwerpunktes R = r1 + εr2 und den Abstandsvektor r = r1 − r2 einführen: R00 = 0, r00 = −(1 + ε) r . |r|3 (2.30) Die Wahl ε = 0 vereinfacht das Problem also nicht, so daß wir mit dem vollen Problem weiterarbeiten. Den Einfluß von ε untersuchen wir später. Die erste Gleichung bedeutet, daß sich der gemeinsame Schwerpunkt gleichförmig (d.h. mit konstanter Geschwindigkeit) durch den Raum bewegt. Um die zweite Gleichung mit Anfangswerten r0 (0) = V0 r(0) = R0 , (2.31) zu lösen, sind einige Vorbereitungen notwendig. (Im Fall der Erde gilt natürlich R0 = (−1, 0, 0)> und V0 = (0, −1, 0)> , doch wir wollen auch allgemeinere Bedingungen zulassen.) Zunächst bemerken wir, daß das Problem (2.30)–(2.31) auf zwei Raumdimensionen reduziert werden kann. Es gilt nämlich d 1+ε (r × r0 ) = r0 × r0 + r × r00 = r0 × r0 − r × r = 0, dt |r|3 wobei “×” das Kreuzprodukt sei. Folglich ist r(t) × r 0 (t) = const. =: L für alle t ≥ 0 und L = R0 × V0 . Da r × r0 den Drehimpluls darstellt, bedeutet dieses Resultat, daß der Drehimpuls zeitlich erhalten bleibt. Nun steht L senkrecht auf der durch r(t) und r0 (t) aufgespannten Ebene. Da L konstant ist, heißt dies, daß die Bewegung vollständig in dieser Ebene stattfindet. Verschwinden die dritten Komponenten von R0 und V0 (was wir im folgenden annehmen wollen), so kann man L = (0, 0, γ)> für ein γ ∈ R schreiben, und r(t) bewegt sich ausschließlich in der (x, y)-Ebene. 62 Wir transformieren (2.30) in Polarkoordinaten %(t) cos φ(t) r(t) = %(t) sin φ(t) , 0 woraus nach einer Rechnung folgt: cos φ − sin φ cos φ 1+ε (%00 − %φ02 ) sin φ + (2%0 φ0 + %φ00 ) cos φ = − 2 sin φ . % 0 0 0 Wir multiplizieren diese Gleichung zuerst mit dem Vektor (cos φ, sin φ, 0)> und dann mit (− sin φ, cos φ, 0)> , um zu erhalten: %00 − %(φ0 )2 = − 1+ε , %2 2%0 φ0 + %φ00 = 0. (2.32) %2 φ0 = const. (2.33) Die zweite Gleichung ist äquivalent zu 1d 2 0 (% φ ) = 0 % dt oder Dies bedeutet wieder die Erhaltung des Drehimpulses, denn 0 r × r0 = 0 , %2 φ 0 und dieser Vektor ist zeitlich konstant. Also ist die Konstante gleich γ und % 2 φ0 = γ. Setzen wir dies in die erste Gleichung von (2.32) ein, folgt %00 − γ2 1 + ε + 2 = 0. %3 % Wir multiplizieren die Gleichung mit %0 und integrieren über (0, t): 1 0 2 γ2 1+ε 1 0 2 γ2 1+ε % (t) + − = % (0) + − . 2 2 2 2%(t) %(t) 2 2%(0) %(0) Die linke Seite ist also zeitlich konstant und damit eine Erhaltungsgröße. Da 1 E := (%0 )2 + V (g) 2 mit V (g) = γ2 1+ε − 2%2 % die Energie bedeutet, drückt die obige Gleichung die Erhaltung der Energie aus. 63 (2.34) Aus (2.33) und (2.34) folgt und damit p d% = ± 2(E − V (%)) dt und dφ γ = 2 dt % dφ dt γ dφ = =± p . d% dt d% %2 2(E − V (%)) Integration über (%0 , %) ergibt schließlich φ = φ(%0 ) ± Z %(φ) %0 γ dr p . r2 2(E − V (r)) Dieses Integral kann explizit gelöst werden. Mit der Substitution u = 1/r und diversen Umformungen folgt, daß p , (2.35) %(φ) = 1 + q cos(φ − φ1 ) wobei γ2 p= , 1+ε q= s 1+2 γ2E , (1 + ε)2 φ1 = φ0 + arccos γ 2 − (1 + ε)%0 p . %0 2Eγ 2 + (1 + ε)2 Übungsaufgabe: Führen Sie die Umformungen, die auf (2.35) führen, durch. Die Gleichung (2.35) besitzt die Form eines Kegelschnittes. Die Art des Kegelschnittes hängt von q ab (siehe Tabelle 2.6). Parameter q Kegelschnitt q=1 Energie ³ ´2 E = − 12 1+ε γ ³ ´2 − 21 1+ε <E<0 γ E=0 Parabel q>1 E>0 Hyperbel q=0 0<q<1 Kreis Ellipse Tabelle 2.1: Art der Bahnkurve in Abhängigkeit des Wertes der Energie. In unserem Fall haben wir %(0) cos φ(0) −1 %(0) sin φ(0) = R0 = 0 , 0 0 64 %0 (0) cos φ(0) − %(0)φ0 (0) sin φ(0) 0 0 % (0) sin φ(0) + %(0)φ0 (0) cos φ(0) = V0 = −1 , 0 0 also %(0) = 1, φ(0) = π und %0 (0) = 0, φ0 (0) = 1. Dies ergibt L = %(0)2 φ0 (0) = 1 und E = − 12 − ε > − 12 (1 + ε)2 . Folglich beschreibt die Bahn der Erde um die Sonne eine Ellipse. Da ε = 10−6 ¿ 1, ist die Ellipse in guter Näherung ein Kreis. Welchen Einfluß hat die Anfangsgeschwindigkeit? Im Falle der Erde haben wir mit √ v = 1 gerechnet. Wählen wir ε = 0 und eine Geschwindigkeit v < 2, so folgt wegen L2 = v 2 v2 − 1 < 0, E= 2 √ und die Planetenbahn ist eine Ellipse. Im Falle v > 2 hat die Erde so viel Energie, daß sie das Sonnensystem verläßt (siehe Abbildung 2.11). 3 2.5 v=1.5 2 1.5 1 y v=1 v=0.7 0.5 Sonne • 0 Erde • −0.5 −1 −1.5 −3 −2 −1 0 1 x Abbildung 2.11: Bahnen der Erde um die Sonne für verschiedene Anfangsgeschwindigkeiten v (ε = 0). Wäre die Masse der Erde um den Faktor 104 größer (d.h. ε = 0.01), bewirkt ihre Gravitationsfeld, daß die Sonne kleine Bewegungen durchläuft, während sich die Erde weiterhin um die Sonne bewegt (siehe Abbildung 2.12). Ist das Massenverhältnis noch größer (ε = 0.2), so wird die Bewegung der Sonne stärker gestört (siehe Abbildung 2.13). Wie sehen die Bewegungen von Erde und Sonne aus, wenn das Gravitationsfeld des Jupiters berücksichtigt wird? Der Jupiter hat die Masse m3 = 2 · 1027 kg und bewegt sich in einer etwa 5.2-fachen Entfernung wie der Abstand Erde-Sonne um das Zentralgestirn. Die Bewegungsgleichungen sind komplizierter als oben, da auf jeden Planeten die Gravitationskräfte der anderen beiden Körper einwirken. Sei r3 (t) der Ortsvektor des Jupiters (siehe Abbildung 2.14). Dann lauten die Bewegungsgleichungen 65 3 2 y 1 0 Sonne • • Erde 0 1 −1 −2 −3 −2 −1 2 x Abbildung 2.12: Bahnen der Erde um die Sonne mit ε = 0.01 (v = 1.2). 20 y 15 10 5 0 −2 Sonne −1 • • 0 x 1 Erde 2 Abbildung 2.13: Bahnen der Erde um die Sonne mit ε = 0.2 (v = 1.2). mi ri00 = − X Gmi mk (r − rk ), 3 i |r i − rk | k6=i i = 1, 2, 3. Mit derselben Skalierung wie oben und dem zusätzlichen Parameter δ= m3 = 10−3 , m1 der das Massenverhältnis Jupiter–Sonne beschreibt, erhalten wir die folgenden skalierten Gleichungen: r1 − r 3 r1 − r 2 −δ , 3 |r1 − r2 | |r1 − r3 |3 r2 − r 1 r2 − r 3 = − −δ , 3 |r2 − r1 | |r2 − r3 |3 r3 − r 1 r3 − r 2 = − − ε , |r3 − r1 |3 |r3 − r2 |3 Sonne: r100 = −ε Erde: r200 Jupiter: r300 66 (2.36) t > 0. Sonne m Jupiter Erde m 1 m 2 r (t) 2 r (t) 1 3 r (t) 3 0 Abbildung 2.14: Das Drei-Körper-Problem, bestehend aus Sonne, Erde und Jupiter. Es handelt sich bei diesem Problem um ein Drei-Körper-Problem, das im Gegensatz zum obigen Zwei-Körper-Problem nicht explizit gelöst werden kann. Zur Vereinfachung nehmen wir an, daß sich alle drei Körper in einer Ebene bewegen. Wir wählen die (zweidimensionalen) Anfangswerte µ ¶ µ ¶ µ ¶ µ ¶ µ ¶ 0 r0 0 %0 w0 0 0 0 r1 (0) = r1 (0) = , r2 (0) = , r2 (0) = , r3 (0) = , r3 (0) = , 0 0 1 0 0 (2.37) mit r0 = 1 und %0 = 5.2. Welche Bahngeschwindigkeit hat der Jupiter? Er umkreist die Sonne etwa alle 11.3 Erdenjahre. Seine Bahngeschwindigkeit lautet daher w= 2π · 5.2 · 1.5 · 1011 m 2π · 5.2 · L 4m = ≈ 1.36 · 10 . 11.3 Jahre 11.3 · 3.2 · 107 s s Die skalierte Geschwindigkeit w0 berechnet sich dann aus w0 = 5 · 106 T v= 1.36 · 104 ≈ 0.45. L 1.5 · 1011 In Abbildung 2.15 präsentieren wir die numerische Lösung des Problems (2.36)–(2.37). Wie erwartet bewegen sich die Erde und der Jupiter (fast) auf Kreisbahnen um die Sonne, die im wesentlichen unbewegt ist. y 5 0 Sonne • −5 −5 0 x • Jupiter Erde • 5 Abbildung 2.15: Bahnen der Erde und des Jupiters um die Sonne. 67 200 r0=1.0002 y 150 r =1 0 100 50 0 •• 0 • 20 40 60 80 x Abbildung 2.16: Bahnen von Sonne, Erde und Jupiter (ε = 10−6 , δ = 0.4). Der Wert r0 bezieht sich auf den anfänglichen Abstand Erde–Sonne. Die Situation ändert sich drastisch, wenn der dritte Planet wesentlich schwerer ist und einen stärkeren Einfluß auf die Sonne und damit auf die Erde ausübt. Wir nehmen an, daß der dritte Planet 40 % der Sonnenmasse besitzt und nennen ihn wieder “Jupiter”. Abbildung 2.16 zeigt, daß sich Sonne und Jupiter um ihren gemeinsamen Schwerpunkt drehen, während die Erde aus dem Sonnensystem herausgeschleudert wird. Interessant ist in diesem Zusammenhang, daß die Erdbahn äußerst sensibel von dem Anfangsabstand Erde–Sonne r0 abhängt. Eine geringfügige Änderung des Anfangswerts führt zu einer völlig anderen Lösung der Erdbahn. Da der Anfangswert in der Praxis stets nur mit endlicher Genauigkeit bestimmt werden kann, folgt daraus, daß die Erdbewegung in diesem Fall praktisch nicht präzise vorhergesagt werden kann, obwohl sie einer vollständig deterministischen Differentialgleichung genügt. 2.7 Deterministisches Chaos Der Waschmaschinenhersteller aus Abschnitt 1.2 hat für eine neu konstruierte Maschine unkontrollierte Schwingungen festgestellt, die innerhalb kurzer Zeit das Gerät zerstören. Was ist passiert? Wir nehmen an, daß die (vertikalen) Auslenkungen x(t) der Maschine durch die Schwingungsgleichung x00 + 2%x0 + ω 2 sin x = γω02 sin ω0 t, t > 0, (2.38) beschrieben werden können (siehe Abschnitt 1.2). Beachte, daß wir hier die allgemeine Rückstellkraft ω 2 sin x anstelle der Approximation ω 2 x verwenden. Der Maschinenhersteller liefert uns die Daten 2 3 1 % = , ω 2 = 1, ω0 = , γ = . 20 3 2 68 Als Anfangswerte verwenden wir x0 (0) = 0. x(0) = 1, (2.39) Da das Problem (2.38)–(2.39) nichtlinear ist, lösen wir es numerisch. Ist die anregende Kraft Null (γ = 0), so führt das Gerät gedämpfte Schwingungen durch. Wir illustrieren die Kurve x(t) im sogenannten Phasendiagramm, das die Kurve t 7→ (x(t), x0 (t)) darstellt (Abbildung 2.17 links). An diesem Diagramm ist bequem zu erkennen, daß die Auslenkungen oszillierend für lange Zeiten zum Ursprung konvergieren. Bei nicht zu großer anregender Kraft (γ = 1), zwingt die Anregung dem System eine harmonische Schwingung auf (Abbildung 2.17 rechts). Die Frequenz entspricht nicht der Eigenfrequenz ω des frei schwingenden Systems, sondern ist ungefähr gleich der Frequenz ω0 der antreibenden Kraft. 2.5 0.8 2 0.6 1.5 Geschwindigkeit Geschwindigkeit 0.4 0.2 0 −0.2 −0.4 −0.6 0 −0.5 −1 −1.5 −0.8 −1 −1 1 0.5 −2 −0.5 0 Auslenkung 0.5 −2.5 1 −15 −10 −5 Auslenkung 0 Abbildung 2.17: Phasendiagramm der erzwungenen Schwingung für γ = 0 (links) und γ = 1 (rechts). Wird die Antreibkraft weiter erhöht, γ = 3/2, bewegt sich das Pendel nicht mehr gleichmäßig (Abbildung 2.18 links). Die Ausschläge scheinen völlig chaotisch. Dies erklärt das von dem Waschmaschinenhersteller beobachtete Verhalten des Geräts. Insbesondere werden die Auslenkungen schnell so groß, daß sie die Maschine zerstören. Die Bewegungen werden praktisch unvorhersagbar, da eine minimale Änderung der Anfangsbedingungen zu einer völlig anderen Bahnkurve führt (Abbildung 2.18 rechts). Diese Situation entspricht dem Drei-Körper-Problem aus dem letzten Abschnitt. Obwohl die Auslenkungen die Lösungen einer deterministischen Gleichung sind, sind ihre Werte praktisch nicht präzise vorhersagbar. Wir nennen dies deterministisches Chaos. Was ist Chaos? Der Begriff ist in der Literatur nicht einheitlich definiert. Wir geben im folgenden eine Definition nach Wiggings [8] an. Dazu benötigen wir allerlei Begriffe. Sei φ(t, x0 ) := x(t) die Lösung der Differentialgleichung x0 = f (x), t > 0, 69 x(0) = x0 , (2.40) 3 2 2 1 Geschwindigkeit Geschwindigkeit 3 0 −1 −2 −3 1 0 −1 −2 −20 −10 0 10 Auslenkung 20 −3 30 0 10 20 30 40 Auslenkung 50 60 70 Abbildung 2.18: Phasendiagramm der erzwungenen Schwingung für γ = 3/2 und x(0) = 1 (links) bzw. x(0) = 1.0001 (rechts). wobei f : Rn → Rn eine stetige Funktion und x0 ∈ Rn seien. Wir nehmen an, daß die Lösung eindeutig ist und für alle t > 0 existiert. Wir nennen die Abbildung (t, x0 ) 7→ φ(t, x0 ) auch den Fluß der Gleichung (2.40). Definition 2.2 Sei φ der Fluß von (2.40) und A ⊂ Rn eine kompakte Menge. (1) Die Menge A heißt invariant unter dem Fluß von φ genau dann, wenn ∀ t ≥ 0 : φ(t, A) ⊂ A. (2) Sei A abgeschlossen und invariant unter φ. Die Menge A heißt topologisch transitiv bezüglich φ genau dann, wenn ∀ U, V ⊂ A offen : ∃ t ≥ 0 : φ(t, U ) ∩ V 6= ∅. Unter dem Symbol φ(t, A) verstehen wir die Menge aller φ(t, x) mit x ∈ A. Eine Menge heißt also invariant, wenn der Fluß in der Menge bleibt (Abbildung 2.19 links). Eine Menge ist topologisch invariant, wenn der Fluß mit jeder offenen Menge nichtleeren Schnitt hat (Abbildung 2.19 rechts). Definition 2.3 Sei φ der Fluß von (2.40) und A invariant unter φ. (1) Der Fluß φ hängt sensitiv von den Anfangswerten in A ab, wenn ∃ε>0: ∀x∈A: ∀ Umgebungen U von x: ∃ y ∈ U : |φ(t, x) − φ(t, y)| > ε. 70 ∃t>0: φ (t,y) U y x φ (t,x) V A x Abbildung 2.19: Zur Definition einer invarianten bzw. topologisch transitiven Menge. Die Menge links ist nicht invariant, da φ(t, y) A verläßt. (2) Der Fluß φ heißt chaotisch bzgl. A genau dann, wenn er sensitiv von den Anfangswerten in A abhängt und topologisch transitiv bzgl. A ist. Eine sensitive Abhängigkeit von den Anfangsdaten bedeutet also, daß sich die Lösungen von (2.40) “weit” voneinander entfernen, selbst wenn die Anfangswerte sehr dicht beieinander liegen (Abbildung 2.20). A φ (t,y) y φ (t,x) x U Abbildung 2.20: Zur Definition der sensitiven Abhängigkeit von den Anfangswerten. Als ein Beispiel eines chaotischen Flusses präsentieren wir die sogenannten LorenzGleichungen: x0 = −%(x − y) y 0 = rx − y − xz, z 0 = xy − bz, t > 0, mit Anfangswerten x(0) = x0 , y(0) = y0 , z(0) = z0 , die die Strömung einer Flüssigkeit zwischen zwei horizontalen Platten, von denen die untere beheizt wird, modellieren (Abbildung 2.21). Hierbei haben die Variablen die folgende Bedeutung: x ist proportional zum Betrag der Konvektionsgeschwindigkeit, 71 < < < < < T < < 0 < T 1 Abbildung 2.21: Die Flüssigkeit zwischen zwei parallelen Platten wird von unten beheizt. Für genügend große Temperaturdifferenzen T1 − T0 bildet sich eine periodische Strömung, die bei sehr großen Temperaturdifferenzen in eine chaotische Strömung übergeht. Dazwischen bilden sich sogenannte Bénard-Zellen aus. y ist proportional zur Temperaturdifferenz zwischen aufsteigender und abfallender Strömung, z ist proportional zur Abweichung vom linearen vertikalen Temperaturprofil. Die Interpretation der drei Parameter %, b und r ist schwieriger: % ist proportional zur Viskosität, b ist ein Maß für die Geometrie der Bénard-Zellen, r ist unter anderem proportional zur Temperaturdifferenz T1 − T0 . Wir lösen die Lorenz-Gleichungen numerisch für % = 10, b = 8/3, r = 10 bzw. r = 28 und x0 = y0 = z0 = 10. Für genügend kleine Parameter r > 0 konvergiert (x(t), y(t), z(t)) gegen einen Fixpunkt (Abbildung 2.22 links), während für hinreichend große r > 0 sich ein chaotisches Verhalten zeigt. Man kann zeigen, daß der den Lorenz-Gleichungen entsprechende Fluß chaotisch ist. 72 50 40 z 15 30 z 10 20 5 10 0 8 20 6 0 4 y 2 2 8 6 4 −20 y x −15 −10 0 −5 5 10 15 x Abbildung 2.22: Lösungskurve der Lorenz-Gleichungen für % = 10, b = 8/3, r = 10 (links) und r = 28 (rechts). 3 Wellenphänomene In diesem Kapitel untersuchen wir verschiedene Wellenphänomene im weiteren Sinne, die auf Differentialgleichungen führen. 3.1 Wellengleichung Die Funktionsweise einer Quarzuhr basiert darauf, daß ein Quarzkristall zu Schwingungen angeregt wird. In diesem Abschnitt wollen wir die folgende Frage erörtern: Frage: Wie schwingt ein Kristall? Ein Kristall besteht aus Atomen, die idealerweise in regelmäßigen Abständen voneinander angeordnet sind. Die Atome können aus ihrer Ruhelage heraus in Schwingungen versetzt werden. Wir modellieren den Kristall zunächst in einer Raumdimension als eine lineare Kette gekoppelter Oszillatoren. Wir betrachten also ein System von n Massepunkten der Masse m, die die Kristallatome modellieren und die in einer eindimensionalen Kette jeweils im Abstand a angeordnet sind. Dabei seien benachbarte Massen über elastische Federn der Federkonstante D miteinander verbunden (Abbildung 3.1). Sei xi (t) die Auslenkung der i-ten Masse aus der Ruhelage (i = 1, . . . , n). Auf den i-ten Massepunkt wirken zwei Kräfte von den benachbarten Massepunkten: Fi = Fi,i+1 + Fi,i−1 . Vom (i ± 1)-ten Massepunkt wird eine Kraft ausgeübt, die proportional zum aktuellen Abstand der beiden Massepunkte ist: Fi,i±1 = D(xi±1 − xi ), 73 a m m m x (t) i Abbildung 3.1: Modell eines Systems gekoppelter Oszillatoren. wobei die Proportionalitätskonstante gerade die Federkonstante ist. Aus dem Newtonschen Gesetz folgt mx00i = Fi = D(xi+1 − xi ) + D(xi−1 − xi ) oder x00i = ω02 (xi+1 − 2xi + xi−1 ), i = 2, . . . , n − 1, (3.1) wobei ω02 := D/m. Wir nehmen an, daß die Auslenkungen des ersten und letzten Massepunktes gegeben seien: x1 (t) = x1,0 (t), xn (t) = xn,0 (t), t ≥ 0. Nun befinden sich im allgemeinen sehr viele Atome in einem sehr kleinen Abstand voneinander im Kristall, so daß es sinnvoll ist, das System (3.1) von gewöhnlichen Differentialgleichungen dadurch zu vereinfachen, daß wir den Grenzwert n→∞ und a→0 durchführen. Natürlich soll dabei die Gesamtlänge L = na konstant bleiben. In diesem Grenzübergang identifizieren wir die Auslenkungen der Massepunkte gemäß xi (t) = u(x, t), x = i · a. Setzen wir dies in (3.1) ein, erhalten wir ∂2u (x, t) = ω02 [u(x + a, t) − 2u(x, t) + u(x − a, t)]. ∂t2 Eine Taylorentwicklung u(x ± a, t) = u(x, t) ± 1 ∂2u ∂u (x, t)a + (x, t)a2 + O(a3 ) ∂x 2 ∂x2 (a → 0) liefert an der Stelle (x, t) ³ ´ 1 1 utt = ω02 u + ux a + uxx a2 − 2u + u − ux a + uxx a2 + O(a3 ) , 2 2 74 wobei wir die partiellen Ableitungen von f durch Indices gekennzeichnet haben. Im Grenzwert a → 0 folgt die partielle Differentialgleichung utt = c2 uxx , (x, t) ∈ (0, L) × (0, ∞), (3.2) wobei c2 der Grenzwert von ω02 a2 für a → 0 sei. Warum gilt nicht c = 0? Es gilt ω02 a2 = Da2 /m. Mit a → 0 und n → ∞ sollte auch m → 0 folgen, da nm die Gesamtmasse der Kette ist. Wir setzen voraus, daß im Grenzwert Da2 /m gegen die positive Konstante c2 konvergiert. Die Gleichung (3.2) heißt eindimensionale Wellengleichung. Sie ist zu lösen mit den beiden Anfangsbedingungen u(x, 0) = u0 (x), ut (x, 0) = u1 (x), x ∈ (0, L), (3.3) wobei u0 und u1 Funktionen sind, die sich aus dem Grenzwert a → 0, n → ∞ aus xi (0) und x0i (0) ergeben, und mit den Randbedingungen u(0, t) = g0 (t), u(L, t) = g1 (t), t > 0, wobei die Funktionen g0 und g1 sich im Grenzwert aus x1,0 (t) und xn,0 (t) ergeben. Die Wellengleichung (3.2) kann einfach auf (zwei oder) drei Raumdimensionen verallgemeinert werden. Dazu wird der Kristall durch ein dreidimensionales Gitter von Massepunkten mit Abstand a in jeder Richtung modelliert, wobei die Massepunkte entlang der kartesischen Koordinaten mit elastischen Federn verbunden seien. Die Massepunkte seien in jeder Koordinate durch die Indices i1 , i2 , i3 durchnumeriert. Definieren wir x1 = i1 a, x2 = i2 a und x3 = i3 a, so folgt nach Taylorentwicklung und dem Grenzwert a → 0, n → ∞ wie oben die dreidimensionale Wellengleichung utt = c2 ∆u, (x, t) ∈ (0, L)3 × (0, ∞), wobei x = (x1 , x2 , x3 )> , und ∆ ist der Laplace-Operator in drei Raumdimensionen ∆= ∂2 ∂2 ∂2 + + . ∂x21 ∂x22 ∂x23 Übrigens kann die Wellengleichung (3.2) auch zur Modellierung einer schwingenden Saite (z.B. Gitarrensaite) verwendet werden. Um dies einzusehen, betrachten wir eine Saite mit konstanter Massendichte % und Auslenkung u(x, t). Die Massendichte ist über m = % · (x2 − x1 ) definiert, wobei m die Masse der Saite im Interval [x1 , x2 ] sei. Auf den Punkt der Saite u(x, t) wirkt die Kraft (Abbildung 3.2) F = F0 (sin(α + dα) − sin α). 75 u α+dα du α dx x x x+dx Abbildung 3.2: Geometrie einer schwingenden Saite. Ist die Länge der Saite wesentlich größer als ihre Auslenkung, gilt α ¿ 1 und damit näherungsweise F ≈ F0 cos α dα ≈ F0 dα. Wir benötigen nun einen Ausdruck für die Winkeländerung dα. Wieder wegen α ¿ 1 folgt du (x), α ≈ tan α = dx und damit ist dα = (α + dα) − α = du du ∂2u (x + dx) − (x) ≈ (x)dx. dx dx ∂x2 Aus dem Newtongesetz ergibt sich dann m und mit m = %dx endlich ∂2u ∂2u = F = F dx 0 ∂t2 ∂x2 ∂2u F0 ∂ 2 u = . ∂t2 % ∂x2 Dies ist die Wellengleichung. Um zu verstehen, welche Gestalt Lösungen von (3.2) haben können, betrachten wir zunächst die Gleichung für alle x ∈ R. Mit der Variablentransformation ξ = x − ct, folgt η = x + ct ∂ 1∂ ∂ = − , ∂ξ ∂x c ∂t und 0= µ ∂2 1 ∂2 − ∂x2 c2 ∂t2 ¶ u= µ ∂ ∂ 1∂ = + ∂η ∂x c ∂t ∂ 1∂ − ∂x c ∂t 76 ¶µ ∂ 1∂ + ∂x c ∂t ¶ u= ∂2u . ∂ξ∂η Die Funktion ∂u = h02 (η) ∂η ist also konstant bzgl. ξ; hierbei ist die Funktion h02 (η) eine Integrationskonstante. Integrieren wir diese Gleichung bzgl. η, folgt u(ξ, η) = h2 (η) + h1 (ξ), wobei h1 (ξ) eine Integrationskonstante ist. Rücktransformation ergibt u(x, t) = h1 (x − ct) + h2 (x + ct). Die Funktionen h1 und h2 können wir aus den Anfangsbedingungen (3.3) bestimmen: u0 (x) = u(x, 0) = h1 (x) + h2 (x), u1 (x) = ut (x, 0) = −ch01 (x) + ch02 (x). Multipliziere die zweite Gleichung mit 1/c, integriere die resultierende Gleichung und addiere bzw. subtrahiere sie zur ersten Gleichung: µ ¶ Z 1 1 x h1 (x) = u0 (x) − u1 (s) ds − h1 (0) + h2 (0) , 2 c 0 µ ¶ Z 1 x 1 h2 (x) = u0 (x) + u1 (s) ds + h1 (0) − h2 (0) . 2 c 0 Daraus folgt für die Lösung von (3.2) für x ∈ R und (3.3): Z 1 x+ct 1 u1 (s) ds. u(x, t) = (u0 (x − ct) + u0 (x + ct)) + 2 c x−ct Diesen Ausdruck nennt man die d’Alembertsche Formel. Sie erlaubt eine Interpretation der Konstante c > 0. Betrachte dazu einen Anfangswert u0 wie in Abbildung 3.3. Zur Zeit t > 0 bilden sich zwei “Wellen”, die sich mit der Geschwindigkeit c nach links bzw. rechts bewegen. Die Konstante c kann daher als die Wellengeschwindigkeit interpretiert werden. Wie pflanzen sich die Wellen in dem Kristall fort? Wir betrachten wieder ein eindimensionales Modell für den Kristall, den wir an den Enden x = 0 und x = L fest einspannen. Wir müssen also das Anfangsrandwertproblem utt = c2 uxx , (x, t) ∈ (0, L) × (0, ∞), u(0, t) = u(L, t) = 0, u(x, 0) = u0 (x), lösen. Dazu machen wir den Ansatz u(x, t) = f (x) · g(t). 77 (3.4) ut (x, 0) = u1 (x), (3.5) u u t>0 t=0 1 1 2 −x x 0 0 x −x + ct 0 −x − ct 0 x − ct 0 x + ct 0 x Abbildung 3.3: Lösung u(x, t) nach der d’Alembertschen Formel. Setzen wir ihn in (3.4) ein, erhalten wir 1 g 00 f 00 = . c2 g f Die linke Seite hängt nur von t, die rechte Seite nur von x ab. Damit dies für alle (x, t) gilt, müssen beide Seiten konstant sein. Wir nennen die Konstante α ∈ R: f 00 − αf = 0, x ∈ (0, L), g 00 − c2 αg = 0, t > 0. (3.6) (3.7) Die erste Gleichung wird mit den Randbedingungen f (0) = f (L) = 0, die sich aus (3.5) ergeben, gelöst. Sei zuerst α > 0. Dann lautet die allgemeine Lösung von (3.6) f (x) = c1 e √ αx + c 2 e− √ αx , die jedoch nicht beide Randbedingungen erfüllen kann. Dies gilt auch für die allgemeine Lösung f (x) = c1 x + c2 im Falle α = 0. Folglich muß α < 0 gelten. Wir setzen k 2 := −α > 0. Die allgemeine Lösung von (3.6) lautet f (x) = c1 sin(kx) + c2 cos(kx). Aus den Randbedingungen folgt c2 = 0 und sin kL = 0, also k = kn = nπ , L n ∈ N. Wir erhalten die unendlich vielen Lösungen fn (x) = Cn sin(kn x), x ∈ [0, L]. Die Lösung von (3.7) ist gn (t) = An sin(ckn t) + Bn cos(ckn t). 78 Damit können wir die allgemeine Lösung von (3.4) schreiben als u(x, t) = ∞ X sin(kn x)(An sin(ckn t) + Bn cos(ckn t)). n=1 Die Konstanten An und Bn berechnen wir aus den Anfangsbedingungen in (3.5): u0 (x) = u(x, 0) ∞ X = n=1 ∞ X u1 (x) = ut (x, 0) = Bn sin(kn x), ckn An sin(kn x). n=1 Multiplizieren wir nämlich diese Gleichungen mit sin(km x), integrieren in x ∈ (0, L) und benutzen die Relation ( Z L L/2 : n = m, L sin(kn x) sin(km x) dx = δn,m = 2 0 : n 6= m, 0 so ergibt sich 2 Bm = L Z L 2 Am = ckm L u0 (y) sin(km y) dy, 0 Z L u1 (y) sin(km y) dy. (3.8) 0 Für die Lösung von (3.4)–(3.5) folgt schließlich u(x, t) = ∞ X n=1 sin ³ nπx ´ · L ¸ nπct nπct An sin + Bn cos , L L und die Koeffizienten An und Bn sind gegeben durch (3.8). Die Lösung beschreibt eine Überlagerung von Wellen mit Kreisfrequenzen ωn := nπc/L. Man nennt n=1: Grundschwingung, n>1: Oberschwingungen und die entsprechenden Töne Grundton bzw. Obertöne. Die mehrdimensionale Wellengleichung utt = c2 ∆u, x ∈ R3 , t > 0, besitzt unter anderem Lösungen der Form u(x, t) = ei(k·x+ωt) , 79 (3.9) wobei k = (k1 , k2 , k3 )> ∈ R3 , ω > 0, denn utt − c2 ∆u = (−ω 2 + c2 (k12 + k22 + k32 ))u = 0, sofern c|k| = ω gilt. Die Lösungen (3.9) können wir als ebene Wellen interpretieren, die sich mit der Geschwindigkeit c fortpflanzen. Abbildung 3.4 zeigt die Wellenfronten, d.h. die Mengen {(x, t) : k · x + ωt = const.}. Ein Punkt x auf der Wellenfront k · x + ωt = α ∈ R bewege sich in der Zeit dt um dx, liege aber noch immer auf der Wellenfront, d.h. k · (x + dx) + ω · (t + dt) = α und dx ist parallel zu k. Subtraktion der beiden Gleichungen ergibt k · dx + ωdt = 0 oder ¯ ¯ ¯ dx ¯ ¯ ¯ = ω = c. ¯ dt ¯ |k| Also ist die Geschwindigkeit des Punktes gerade gleich c. t x Abbildung 3.4: Wellenfronten k · x + ωt = const. Übungsaufgabe: Bestimmen Sie die Schwingungen einer rechteckigen Membran, d.h., lösen Sie die Schwingungsgleichung utt = c2 (uxx + uyy ), (x, y) ∈ (0, a) × (0, b), u(x, y, 0) = u0 (x, y), t > 0, ut (x, y, 0) = u1 (x, y), und u = 0 auf dem Rand des Rechtecks (0, a) × (0, b). 3.2 Schrödingergleichung Die Funktionsweise eines MOS-Transistors basiert darauf, daß der Elektronenfluß vom Emittor zum Kollektor durch eine angelegte Spannung am Basiskontakt gesteuert wird 80 (Abbildung 3.5). Eine Oxidschicht am Basiskontakt soll verhindern, daß Elektronen durch die Basis abfließen. Die Abmessungen der heutigen Bauteile sind jedoch so winzig (z.B. Abstand Emitter-Kollektor: 100 nm = 10−7 m, Dicke der Oxidschicht: 1.5 nm = 1.5 · 10−9 m), daß dennoch zahlreiche Elektronen durch Überwinden der Oxidschicht über die Basis und nicht über den Kollektor abfließen. In diesem Abschnitt wollen wir die Frage beantworten: B E K Elektronen Abbildung 3.5: Schematische Darstellung eines MOS-Transistors mit Emitter E, Basis B und Kollektor K. Die schraffierte Region stellt die Oxidschicht dar. Frage: Wann können Elektronen die Oxidschicht überwinden, und wie läßt sich das verhindern? Um diese Frage zu beantworten, müssen wir weit ausholen. Wir betrachten Elektronen zunächst als klassische Teilchen, die den Newtonschen Gleichungen x0 = v, mv 0 = −V (x), (3.10) genügen. Hierbei sind x = x(t) und v = v(t) der Ort bzw. die Geschwindigkeit eines Teilchens mit Masse m und V (x) das elektrostatische Potential. Die Ableitung von −V (x) ist das elektrische Feld (bzw. die elektrische Kraft), die gleich dem Produkt Masse × Beschleunigung ist. Multiplikation von (3.10) mit v und Integration liefert m |v(t)|2 + V (x(t)) = const. =: E. 2 (3.11) Dies drückt wieder die Energieerhaltung aus: Die Summe aus kinetischer Energie mv 2 /2 und potentieller Energie V (x) ist zeitlich konstant. Wir können die Oxidschicht als eine Potentialbarriere modellieren (Abbildung 3.6), z.B. V (x) = ( U : x ∈ Oxidschicht 0 : sonst. 81 V(x) Elektronen Oxid Basis Abbildung 3.6: Modellierung der Oxidschicht als Potentialbarriere. Elektronen, deren Energie E kleiner als U ist, können die Oxidschicht nicht überwinden, denn gäbe es ein Elektron innerhalb der Oxidschicht, so folgt aus (3.11) U≤ m |v(t)|2 + U = E < U 2 und damit ein Widerspruch. Nur Elektronen, für die E > U gilt, können die Oxidschicht mit Geschwindigkeit r 2 (E − U ) v(t) = m durchqueren. Durch Experimente konnte festgestellt werden, daß auch Elektronen mit Energien E < U die Potentialbarriere überwinden bzw. durchtunneln. Man spricht in diesem Fall auch vom Tunneleffekt. Dieser Effekt basiert darauf, daß Elektronen keine (makroskopischen) Teilchen sind, die den Newtonschen Bewegungsgleichungen genügen, sondern die quantenmechanisch beschrieben werden müssen. In der Quantenmechanik wird ein Elektron durch eine sogenannte Wellenfunktion ψ(x, t) ∈ C dargestellt. Das Integral Z |ψ(x, t)|2 dx B ist die Wahrscheinlichkeit, das Teilchen zur Zeit t im Gebiet B anzutreffen. Es können nur Wahrscheinlichkeitsaussagen getroffen werden, da der Ort und die Geschwindigkeit eines Elektrons nicht mehr mit beliebiger Genauigkeit gleichzeitig gemessen werden können. Dies liegt daran, daß ein Elektron auch Wellencharakter zeigen kann, und steht im Gegensatz zur klassischen Mechanik, in der ja gerade die Newtonschen Gleichungen Ort x(t) und Geschwindigkeit v(t) des Teilchens vollständig determinieren. Welcher Bewegungsgleichung genügt nun die Wellenfunktion? In der Quantenmechanik werden die klassischen Größen durch Operatoren ersetzt, nämlich 82 Ort x Impuls p := mv Energie E durch xOp , durch −i~∇, durch i~ ∂/∂t, (3.12) wobei ∇ = (∂/∂x1 , ∂/∂x2 , ∂/∂x3 ) der Nabla-Operator ist, ~ = h/2π die reduzierte PlanckKonstante und i2 = −1. Der Operator der Lagekoordinate xOp entspricht der Multiplikation mit der Variablen x, also ((xOp (ψ))(x) = x · ψ(x). Wir unterscheiden daher nicht zwischen xOp und x. Die Relationen (3.12) können nicht hergeleitet werden; sie sind axiomatisch gegeben. Beachte, daß die Wellenfunktion komplexwertig ist. Ihre Werte können nicht direkt interpretiert werden; nur die reellwertige Größe |ψ|2 besitzt eine physikalische Interpretation (als Wahrscheinlichkeit). Die Energiehaltung (3.11) ist auch quantenmechanisch gültig. Aus (3.12) folgt dann i~ ³p · p ´ ∂ψ ~2 = Eψ = + V (x) ψ = − ∆ψ + V (x)ψ, ∂t 2m 2m x ∈ R3 , t > 0, (3.13) denn p·p = −~2 ∇·∇ = −~2 ∆. Diese Bewegungsgleichung für ψ wird Schrödingergleichung genannt. Zur Zeit t = 0 ist die Anfangsbedingung ψ(x, 0) = ψ0 (x), x ∈ R3 , vorzuschreiben. Um die Schrödingergleichung zu lösen, machen wir den Anstz ψ(x, t) = φ(x)eiωt , der die Beziehung −~ωφe iωt = i~ψt = liefert. Wir setzen E := −~ω. Dann ist − µ ¶ ~ ∆φ + V φ eiωt − 2m ~ ∆φ + V (x)φ = Eφ, 2m x ∈ R3 , (3.14) die stationäre Schrödingergleichung. Sie ist eine Eigenwertgleichung. Definieren wir nämlich den Hamilton-Operator H := −(~/2m)∆ + V , so sind Eigenfunktion-Eigenwert-Paare (φ, E) der Operatorgleichung Hφ = Eφ zu bestimmen. Den Wert E interpretieren wir als die Energie des Teilchens. Wir betrachten im folgenden einige Beispiele. 83 Beispiel 3.1 (freies Teilchen) Die Bewegung eines freien Teilchens wird durch keine Kraft beeinflußt; also ist das Potential V konstant. Wir wählen V = 0 und lösen die Gleichung − ~2 ∆φ = Eφ, 2m x ∈ R3 . (3.15) Die Lösung lautet im eindimensionalen Fall φ(x) = ceikx , k= √ 2mE/~, c ∈ R, √ sofern E ≥ 0. Im Falle E < 0 wäre φ(x) = cekx mit k = −2mE/~ zwar eine Lösung von (3.15); jedoch würde |φ(x)| → ∞ für x → ∞ gelten, und dies würde der Interpretation, daß |φ|2 eine Wahrscheinlichkeit darstellt, widersprechen. Wir finden also für jede Energie E ≥ 0 eine Eigenfunktion φ. Die zeitabhängige Wellenfunktion lautet ψ(x, t) = cei(kx+ωt) . Ein Vergleich mit der Lösung (3.9) der klassischen Wellengleichung zeigt, daß wir ψ als eine komplexwertige ebene Welle interpretieren können. ¤ Beispiel 3.2 (Teilchen im Potentialtopf) Wir betrachten ein Teilchen in einem eindimensionalen Potentialtopf mit einem unendlich hohen Potential außerhalb des Topfes (Abbildung 3.7) ( 0 : x ∈ (0, a) V (x) = ∞ : sonst. Außerhalb des Potentialtopfs muß die Wellenfunktion φ = 0 sein, damit sie Lösung von 8 8 x 0 a Abbildung 3.7: Eigenzustände eines Teilchens in einem Potentialtopf. (3.14) sein kann. Im Innern des Topfes müssen wir − ~ φxx = Eφ, 2m 84 x ∈ (0, a), lösen. Wir fordern, daß φ in R stetig ist; dies impliziert die Randbedingungen φ(0) = φ(a) = 0. Der Ansatz φ(x) = eiλx führt auf die allgemeine Lösung φ(x) = c1 eikx + c2 e−ikx , k= √ 2mE/~. Einsetzen des Randbedingungen ergibt 0 = φ(0) = c1 + c2 , 0 = φ(a) = c1 eika + c2 e−ika = c1 (eika − e−ika ) = 2ic1 sin ka. Dies impliziert (um nicht die triviale Lösung c1 = c2 = 0 zu erhalten) ka = nπ, n ∈ N, und ¢ ¡ nπx , x ∈ [0, a], n ∈ N. φn (x) = c1 einπx/a − e−inπx/a = c sin a Die Konstante c := 2ic1 bestimmen wir aus der Normierungsforderung Z Z a¯ ³ ´¯ ¯ 2 nπx ¯2 1= |φn (x)| dx = c ¯sin ¯ dx, a R 0 die sich daraus ergibt, daß die Wahrscheinlichkeit, das Teilchen irgendwo im Intervall [0, a] zu finden, gerade Eins ist. Die Energie ist also diskret; sie kann nur die Werte En = ~2 kn2 ~2 π 2 2 = n 2m 2ma2 annehmen (Abbildung 3.7). Diese Situation ist ähnlich wie bei der Lösung der Wellengleichung in einem begrenzten Gebiet, widerspricht jedoch unserem intuitiven Verständnis eines Elektrons als Teilchen. Der Grund liegt darin, daß ein Elektron sowohl Teilchenals auch Welleneigenschaften zeigen kann. Man nennt dies Teilchen-Welle-Dualismus des Elektrons. ¤ Wir kehren wieder zu der Frage zurück, warum die Elektronen die Oxidschicht durchtunneln können. Wir modellieren diese wie in Abbildung 3.6 als ein Potential (siehe auch Abbildung 3.8): 0 : x < 0, V (x) = U : 0 ≤ x < d, 0 : x ≥ d. Wir nehmen zunächst an, daß die Energie der Teilchen kleiner als die Potentialbarriere 85 d x 0 Abbildung 3.8: Tunneleffekt bei einem rechteckigen Potentialwall in (0, d). ist, d.h. E < U . In den drei Teilgebieten sind die folgenden Gleichungen zu lösen: ~2 00 φ = Eφ, x < 0, 2m ~2 00 φ = (E − U )φ, 0 < x < d, − 2m 2 ~ 00 − φ = Eφ, x > d. 2m Die allgemeine Lösung in R lautet: ikx −ikx : x < 0, Ae + Be `x −`x φ(x) = Ce − De : 0 < x < d, ikx Fe : x > d, − wobei k= √ 2mE/~, `= p 2m(U − E)/~, und A, B, C, D, F sind komplexe Konstanten. Diese Lösung kann folgendermaßen interpretiert werden: Vor dem Wall (x < 0) gibt es eine nach rechts einlaufende Welle Aeikx und eine nach links laufende, am Wall reflektierte Welle Be−ikx . Im Wall (0 < x < d) werden die eindringende und die am Wallende reflektierte Welle gedämpft. Hinter dem Wall (x > d) gibt es nur eine auslaufende Welle. Den Lösungsanteil Ge−ikx haben wir verworfen, d.h. G = 0 gesetzt. Wir fordern, daß die Funktion φ stetig differenzierbar in R ist. Dies liefert die vier Randbedingungen an x = 0 und x = d: lim φ(j) (x) = lim φ(j) (x), x%0 x&0 lim φ(j) (x) = lim φ(j) (x), x%d x&d 86 j = 0, 1. Diese Bedingungen erlauben es, die vier Konstanten B, C, D und F als Funktion von k, `, d und A zu berechnen. Insbesondere kann die Transmissions- oder Tunnelwahrscheinlichkeit |F |2 T = |A|2 aus dem Verhältnis der Amplitudenquadrate vor und hinter dem Potentialwall bestimmt werden. Übungsaufgabe: Bestimmen Sie B, C, D und F als Funktion von A, und berechnen Sie T = |F |2 /|A|2 . Das Ergebnis lautet T = 1 − E/U , 1 − E/U + (U/4E) sinh2 (d`) U > E. (3.16) Im Falle starker Dämpfung (d` À 1) können wir sinh2 (d`) ≈ e−2d` /4 approximieren und erhalten die Näherung 1 − E/U 1 − E/U + (U/16E)e2d` T ≈ 1 − E/U 16E −2d` e U (1 − E/U )16E/U · e−2d` + 1 = 16E −2d` E e (1 − ) U U 16E(U − E) −2d√2m(U −E)/~ e = U2 ≈ U > E. Die Tunnelwahrscheinlichkeit hängt also exponentiell von der Barrierendicke d ab. Dies erklärt das experimentell in MOS-Transistoren beobachtete Phänomen, daß mehr Elektronen durch die Oxidschicht tunneln, wenn diese dünner wird. Übrigens ist die Tunnelwahrscheinlichkeit T auch im Fall E > U im allgemeinen kleiner als Eins – im Gegensatz zu klassischen Teilchen. Eine analoge Rechnung wie oben ergibt T = wobei `0 = p E/U − 1 , E/U − 1 + (U/4E) sin2 (d`0 ) E > U, (3.17) 2m(E − U )/~. Übungsaufgabe: Zeigen Sie, daß im Falle E > U die Transmissionswahrscheinlichkeit durch (3.17) gegeben ist. 87 Gilt nun d`0 = nπ (n ∈ N), so verschwindet der sin-Term, und für diese speziellen Energien gilt tatsächlich T = 1. Wie lauten die Transmissionswahrscheinlichkeiten bei einer Oxidschicht mit Dicke 1.5nm? Wir wählen die folgenden Werte: d = 1.5nm = 1.5 · 10−7 cm, Oxidschichtdicke: m = 9 · 10−31 kg, Masse eines Elektrons: ~ = 10−30 kg cm2 /s, reduzierte Planck-Konstante: U = 10eV = 1.6 · 10−14 kg cm2 /s2 . Potentialbarriere: Wir erhalten die in Abbildung 3.9 dargestellten Werte. Ein Elektron in einem Transistor 1 0.8 T 0.6 0.4 0.2 0 0 1 2 3 4 5 E/U Abbildung 3.9: Transmissionswahrscheinlichkeit T eines Elektrons bei einem Potentialwall in Abhängigkeit von der Energie E. mit einer Emitter-Kollektor-Spannung von 1 V besitzt die Energie 1eV, also E/U = 0.1. Die entsprechende Tunnelwahrscheinlichkeit beträgt nur T = 4 · 10−4 = 0.04%. Sie steigt bei Dünnerwerden der Oxidschickt jedoch rapide an: Bei d = 0.75 nm gilt bereits T = 4.5%. 3.3 Computertomographie Die Computertomographie ermöglicht es, Querschnitte eines lebenden menschlichen Körpers graphisch darzustellen. Im Gegensatz zu einer herkömmlichen Röntgenuntersuchung, bei der man die Projektion des Objekts auf eine Ebene betrachtet, werden bei der Computertomographie die Röntgenstrahlen in der Querschnittsebene aus vielen verschiedenen Richtungen durch den Körper geschickt. Die Daten liefern um den Patienten rotierende Röntgenquellen und Detektoren (Abbildung 3.10). Der Körper absorbiert die Röntgen- 88 Q Q D D Abbildung 3.10: Prinzipieller Aufbau eines Computertomographen mit Röntgenquellen Q und Detektoren D. strahlung unterschiedlich. Aus der Abschwächung der Strahlung können dann die Abschwächungskoeffizienten in der Querschnittsebene bestimmt und damit zwischen dichter und weniger dichter Materie (z.B. Knochen versus Gewebe) unterschieden werden. Übrigens beschrieb G.N. Hounsfield (zusammen mit J. Ambrose) 1972 das Prinzip der Computertomographie als erster und erhielt dafür 1979 den Nobelpreis der Medizin. Wir wollen in diesem Abschnitt die Frage beantworten: Frage: Wie kann das Schnittbild aus den Daten der Röntgendetektoren rekonstruiert werden? Die Schwächung der Röntgenstrahlung beim Durchgang durch Materie geschieht nach dem Lambert-Beer-Gesetz I(d) = I(0)e−µd , (3.18) wobei I(d) die Intensität des Strahles am Ort d und d die Dicke des homogenen Mediums seien. Die Konstante µ > 0 ist der Abschwächungskoeffizient und ist ein Maß für die Stärke der Abschwächung. Genauer gesagt ist µ eine Funktion des Materials und der Energie der Röntgenstrahlung. Das Gesetz (3.18) kann mit der Tunnelwahrscheinlichkeit aus Abschnitt 3.2 verglichen werden, die ebenfalls exponentiell von der Dicke des Hindernisses abhängt. Wegen der unterschiedlichen Materialien im menschlichen Körper ist der Koeffizient µ eine Funktion des Ortes. Die Abschwächung der Strahlungsintensität dI entlang eines kleinen Wegstückes dx ist dann proportional zu der Intensität: dI = −µ(x)I dx 89 oder dI = −µ(x)I. dx Integration dieser Differentialgleichung −µ(x) = 1 dI d = ln I I dx dx über einen Weg Γ von einer Quelle am Ort Q zu einem Detektor am Ort D liefert dann Z I(D) µ(x) dx = − ln I(D) + ln I(Q) = − ln . (3.19) I(Q) Γ Unser Ziel lautet, den ortsabhängigen Schwächungskoeffizienten µ eines Querschnitts zu bestimmen. Die Apparatur rotiere in nα gleichverteilten Schritten zwischen αmin und αmax , und jedes Strahlenbündel bestehe aus np gleichverteilten Strahlen zwischen pmin und pmax (Abbildung 3.10). Die Messungen mit dieser Geometrie liefern m := nα np Werte der nα np Linienintegrale (3.19) über µ(x) entlang der Geradenstücke Γ1 , . . . , Γm von den Quellen zu den Detektoren. Bezeichnen wir mit Qi und Di die durch das i-te Geradenstück Γi verbundenen Quellen und Detektoren und mit I(Qi ) und I(Di ) (i = 1, . . . , m) die zugehörigen Intensitäten, so gilt nach (3.19) Z µ(x) dx = bi , i = 1, . . . , m, (3.20) Γi wobei bi = − ln I(Di ) I(Qi ) die experimentell ermittelten Werte sind. Die Gleichung (3.20) ist die Radontransformation der Funktion µ. Bei (geeignet gewählten) unendlich vielen Strahlen ist µ eindeutig durch die rechten Seiten bestimmt. Bei endlich vielen Strahlen läßt sich µ nur approximativ bestimmen. Eine Möglichkeit, µ zu bestimmen, ist die Diskretisierung der Umkehrformel der Radontransformation. Wir wählen im folgenden einen sehr einfachen algebraischen Ansatz aus [5]: Wir suchen eine Näherungslösung µ des Systems (3.20). Dazu zerlegen wir die Querschnittsebene in n2 gleich große quadratische Elemente, im folgenden Pixel genannt (Abbildung 3.11). Wir suchen eine Bestapproximation an die Lösung von (3.20) im n2 dimensionalen Raum S = span{φ1 , . . . , φn2 } mit den Basisfunktionen φi : R2 → R, definiert durch ( 1 : falls x im Pixel der k-ten Zeile und `-ten Spalte liegt φ(k−1)n+` (x) = 0 : sonst. 90 Pmin Q α 1 2 3 Pmax n2 D Abbildung 3.11: Zur Approximation des Abschwächungskoeffizienten µ. Die Funktionen φi sind also die Indikatorfunktionen der n2 Pixel. Die Näherungslösung µ ist als Linearkombination aller φi dargestellt: 2 µ(x) = n X µi φi (x). (3.21) i=1 Dies bedeutet, daß µ auf jedem Pixel der Zerlegung konstant ist. Das medizinische Bild entsteht dann durch Darstellung der Werte µi als Grauwerte. Das Bild wird umso genauer, je mehr Pixel verwendet werden. Setzen wir (3.21) in (3.20) ein, so folgt näherungsweise bi = Z 2 µ(x) dx = Γi n X j=1 µj Z φj (x) dx, i = 1, . . . , m. (3.22) Γi Setzen wir aij = Z φj (x) dx, u = (µ1 , . . . , µn2 )> , b = (b1 , . . . , bm )> Γi und A = (aij ), können wir (3.22) als lineares Gleichungssystem Au = b (3.23) mit der Unbekannten u schreiben. Die Zahl der Messungen (d.h. die Zahl der Gleichungen in (3.22)) wird im allgemeinen wesentlich größer als die Anzahl der Pixel sein, um die Qualität der Rekonstruktion zu erhöhen. In diesem Fall ist (3.23) ein überbestimmtes 91 Gleichungssystem und daher im allgemeinen nicht lösbar oder nicht eindeutig lösbar. Wir suchen deshalb eine Lösung im Sinne der kleinsten Quadrate, d.h., u ist die Lösung von Q(u) = min2 Q(v) v∈Rn mit Q(v) := kAv − bk22 , (3.24) 2 und kxk22 := x> x ist die euklidische Norm auf Rn . Wie können wir nun (3.24) lösen? Wir behaupten, daß das Minimierungsproblem äquivalent ist zur Lösung der Gaußschen Normalengleichungen A> Au = A> b. (3.25) 2 Satz 3.3 Seien A ∈ Rm×n und b ∈ Rm . Dann sind die Probleme (3.24) und (3.25) äquivalent. Beweis: Wir berechnen die i-te Richtungsabteilung von Q: 1 1 1 (Q(v + sei ) − Q(v)) = (Av − b + sAei )> (Av − b + sAei ) − (Av − b)> (Av − b) s s s > > = 2(Av − b) Aei + s(Aei ) Aei , wobei ei der i-te Einheitsvektor des Rm sei. Der Grenzwert s → 0 ergibt ∂Q(v) = 2(Av − b)> Aei ∂ui und damit ∇u Q(v) = (2(Av − b)> A)> = 2A> (Av − b). Ist nun u eine Lösung von (3.24), gilt ∇u Q(u) = 0, und u löst (3.25). Ist umgekehrt u eine Lösung von (3.25), so ist u ein kritischer Punkt von Q. Die Funktion u ist ein 2 Minimum von Q, weil A> A wegen v > (A> A)v = kAvk22 ≥ 0 für v ∈ Rn positiv semidefinit ist. ¤ Wir bemerken, daß das lineare Gleichungssystem (3.25) im allgemeinen nur iterativ gelöst werden kann. Üblicherweise werden n2 = 5122 Pixel zur Bestimmung des Querschnittsbildes verwendet. Verwendet man nun m > n2 = 262144 Röntgenstrahlen, ist ein riesiges Gleichungssystem mit einer Matrix mit mindestens 262144 × 262144 Elementen zu lösen. Die Koeffizientenmatrix enthält sehr viele Nullen, da jeder Röntgenstrahl nur eine kleine Anzahl von Pixeln schneidet. Doch selbst wenn nur die von Null verschiedenen Einträge abgespeichert werden, erfordert die Matrix einen Speicherbedarf von etwa zwei Gigabyte. 92 4 Strömungen Eine große Anzahl von sich bewegenden Teilchen kann durch makroskopische Variablen wie Teilchendichte und mittlere Teilchengeschwindigkeit beschrieben werden. Räumliche und zeitliche Änderungen dieser Größen genügen häufig Erhaltungsgleichungen, die formal zu partiellen Differentialgleichungen äquivalent sind. In diesem Kapitel betrachten wir verschiedene Strömungen, die auf Erhaltungsgleichungen führen. 4.1 Verschmutzung eines Flusses Aufgrund eines Chemieunfalls gelangt eine giftige Substanz in einen Seitenarm eines großen Flusses, der 10km von der Verunreinigung entfernt ist. Die Strömungsgeschwindigkeit an der Unglücksstelle betrage 60m pro Minute. Bevor die giftige Substanz die Einmündungsstelle in dem großen Fluß erreicht, soll dort eine mobile Filteranlage installiert werden, um die Substanz aus dem Wasser zu entfernen. Frage: Wieviel Zeit verbleibt für die Installation der Filteranlage, und wieviel Substanz kann herausgefiltert werden? Naiverweise würden wir vermuten, daß 10000m ≈ 166.7 min, 60m/ min also gut zweieinhalb Stunden für die Installation zur Verfügung stehen. Allerdings wird die Berechnung durch folgende Fakten verkompliziert: Der kleine Fluß verbreitert sich von der Unglücksstelle bis zur Mündung; dabei nimmt die Strömungsgeschwindigkeit um 20% ab. Pro Minute setzt sich 1% der giftigen Substanz am Boden des Flusses ab. Die giftige Substanz wird 5 Minuten lang eingeleitet. Der anfängliche Anteil der Substanz im Flußwasser betrage 10%. Wir modellieren den Fluß durch ein Intervall [0, L] mit L = 10. Der Anteil der Substanz im Flußwasser pro Längen- und Zeiteinheit sei durch eine Funktion u(x, t) beschrieben; die Strömungsgeschwindigkeit sei v(x, t) (Abbildung 4.1). Zur Zeit t = 0 werde an der Stelle x = 0 die giftige Substanz eingeleitet. Wir benötigen eine Gleichung für die Evolution des Anteils u(x, t). Nehmen wir zunächst an, daß sich die Substanz nicht am Boden absetzt. Dann sollte die zeitliche Änderung des Anteils der Substanz in einem beliebigen 93 v(x,t) x 0 a b L Abbildung 4.1: Modellierung eines Flusses. Intervall [a, b] gleich dem Zu- bzw. Abfluß über den Rand x = a bzw. x = b sein, da die Substanzmenge erhalten bleibt: Z Z b d b ∂ (u, v)(x, t) dx. u(x, t) dx = u(a, t)v(a, t) − u(b, t)v(b, t) = dt a a ∂x Setzt sich die Verschmutzung am Boden ab, so ist auf der rechten Seite ein entsprechender Senkterm zu berücksichtigen: Z b f dx. a Wir nehmen an, daß die Funktionen glatt genug sind, damit wir Differentiation und Integration vertauschen dürfen. Dann erhalten wir Z b (ut + (uv)x − f ) dx = 0. a Da das Intervall (a, b) beliebig gewählt werden kann, ist diese Gleichung nur dann für alle Intervalle erfüllt, wenn der Integrand verschwindet: ut + (uv)x = f in (0, L). Dies ist eine partielle Differentialgleichung. Die Geschwindigkeit hängt vom Ort ab: v(x) = v0 (1 − αx), x ∈ [0, L], wobei v0 = 60m/ min und α = 2 · 10−5 m−1 , denn an der Stelle x = L soll die Strömung nach Vorausetzung nurmehr mit Geschwindigkeit 0.8v0 = 48m/ min strömen. Die zweite Voraussetzung impliziert f = −βu mit β = 0.01/ min . Das Problem ut + [v0 (1 − αx)u]x = −βu, u(x, 0) = u0 (x), 94 (x, t) ∈ (0, L) × (0, ∞), (4.1) (4.2) ist jedoch noch nicht wohlgestellt, da noch festgelegt werden muß, wieviel Substanz an x = 0 eingeleitet wird. Die Bedingung u(0, t) = u1 (t), t > 0, nennt man daher auch Einströmbedingung. Eine Randbedingung an x = L wird nicht benötigt, da an dieser Stelle die Werte der Funktion u(L, t) gerade gesucht sind. Um die folgenden Rechnungen zu vereinfachen, modellieren wir die Einleitung der Substanz in den Fluß dadurch, daß wir die Funktion auf R fortsetzen: ( γ : x ∈ [−a, 0] (4.3) u0 (x) = 0 : sonst. Nach der dritten Vorausetzung gilt γ = 0.1(min ·m)−1 und a = 5 min ·v0 = 300m. Wie lautet die Lösung von (4.1)–(4.3) für x ∈ R? Es gelte zunächst α = β = 0. Dann ist die Lösung einfach u(x, t) = u0 (x − v0 t). Die Substanz wird ähnlich wie eine Welle mit der Geschwindigkeit v0 transportiert. Nach der Zeit t∗ = L/v0 kommt die Welle an der Mündung an, denn u(L, t∗ ) > 0 ⇐⇒ −a ≤ L − v0 t∗ ≤ 0 ⇐⇒ L L+a ≤ t∗ ≤ . v0 v0 In der Zeit t = a/v0 wird die gesamte Substanz zur Stelle x = L transportiert. Streng genommen ist die obige Funktion u(x, t) keine Lösung von (4.1)–(4.3), da u0 nicht differenzierbar ist. Allerdings läßt sich ein schwächerer Lösungsbegriff definieren, so daß u(x, t) eine Lösung im Sinne dieser Definition ist (siehe nächsten Abschnitt), oder die Funktion u0 wird geeignet “geglättet”, so daß u(x, t) eine stetig differenzierbare Lösung ist. Im Falle α, β 6= 0 kann die Lösung von (4.1)–(4.3) nicht erraten werden. Wir lösen das Problem mit der Methode der Charakteristiken. Die Idee ist, die Funktion u(x, t) an jeder Stelle (x0 , t0 ) durch eine Kurve u(x(s), t(s)) zu parametrisieren (Abbildung 4.2). Der Startpunkt sei gerade (x0 , t0 , u0 ), d.h. x(0) = x0 , t(0) = t0 , u(x0 , t0 ) = u0 . (4.4) Wir erhalten Differentialgleichungen für x(s), t(s) und s 7→ u(x(s), t(s)), indem wir die Beziehung d dt dx u(x(s), t(s)) = ut + ux ds ds ds mit der Gleichung (4.1) oder ut + v0 (1 − αx)ux = (v0 α − β)u 95 u(x,t) u (x ,t ) 0 0 u(x(s),t(s)) x t Abbildung 4.2: Parametrisierung von u(x, t) durch Kurven (x(s), t(s)) durch den Punkt (x0 , t0 ). vergleichen: dt dx du = 1, = v0 (1 − αx), = (v0 α − β)u. (4.5) ds ds ds Die Anfangswertprobleme (4.1)–(4.2) können wir explizit lösen. Wegen dt = ds genügt es zu lösen: dx = v0 (1 − αx), x(0) = x0 , dt du = (v0 α − β)u, u(0) = u0 . dt Wir erhalten nach kurzer Rechnung x(t) = ¢ 1¡ 1 − (1 − αx0 )e−αv0 t , α u(t) = u0 e(v0 α−β)t . Wir können daraus die Lösung u(x, t) berechnen, indem wir in u0 = u(x0 , t0 ) die Umkehrfunktion x0 = x0 (x, t), nämlich x0 = einsetzen: u(x, t) = u0 · ¢ 1¡ 1 − (1 − αx)eαv0 t α ¸ ¢ −(αv0 −β)t 1¡ αv0 t e , 1 − (1 − αx)e α (x, t) ∈ (0, L) × (0, ∞). Die Substanz erreicht die Mündung, wenn u(L, t) > 0 oder −a ≤ 1¡ ∗¢ 1 − (1 − αL)eαv0 t ≤ 0 α ⇐⇒ 1 1 1 1 + αa ln ≤ t∗ ≤ ln . αv0 1 − αL αv0 1 − αL {z } {z } | | =:t1 96 =:t2 Wir erhalten 186 min ≤ t∗ ≤ 191 min . Die giftige Substanz erreicht also erst nach ca. 186 Minuten die Mündung. Nach 5 Minuten ist wie erwartet die Welle vorbei. Übungsaufgabe: Nach wieviel Minuten erreicht die Verunreinigung die Mündung, wenn √ sich der Fluß so verschmälert, daß die Strömungsgeschwindigkeit gemäß v(x) = v0 1 + αx berechnet werden kann? Wieviel Substanz kommt an der Mündung an, und wieviel setzt sich zwischendrin am Flußboden ab? An der Stelle x = 0 wird Z 5 min γ dt = 0.5/m 0 eingeleitet. An der Stelle x = L erhalten wir · ¸t2 Z t2 γ (αv0 −β)t u(L, t) dt = e αv0 − β t1 t1 · µ ¶ µ ¶¸ 1 αv0 − β αv0 − β 1 + αa γ ln ln exp − exp = αv0 − β αv0 1 − αL αv0 1 − αL = £ ¤ γ (1 − αL)β/αv0 −1 1 − (1 + αL)1−β/αv0 αv0 − β ≈ 0.095m−1 . Über 80% der Verschmutzung setzt sich am Boden ab. Es ist also ratsam, die Filteranlage so schnell wie möglich in möglichst kleinem Abstand zur Verunreinigungsstelle zu installieren. 4.2 Verkehrsflüsse An einer stark befahrenen Hauptstraße soll eine Ampel installiert werden. Dabei stellt sich die folgende Frage: Frage: Wie lang sollten die Ampelphasen sein, damit sich während der Grünphase der Stau vor der Ampel vollständig abbaut? Wir ignorieren Überholvorgänge und modellieren die einspurige Straße durch die reelle Zahlenachse. Ferner modellieren wir die Autos nicht individuell als einzelne Fahrzeuge, 97 sondern führen eine Fahrzeugdichte %(x, t) am Ort x ∈ R zur Zeit t ≥ 0 (in Fahrzeugen pro Längeneinheit) ein. Die Anzahl der Fahrzeuge im Intervall (a, b) zur Zeit t lautet Z b %(x, t) dx. a Sei v(x, t) die Geschwindigkeit der Autos in (x, t). Die Anzahl der Autos, die den Punkt x zur Zeit t passieren, lautet %(x, t)v(x, t). Wir suchen eine Bewegungsgleichung für die Dichte %. Die Anzahl der Autos in (a, b) ändert sich zeitlich gemäß der Fahrzeugzahl, die in das Intervall (a, b) hinein- oder herausfahren: Z b Z ∂% d b %(x, t) dx = %(a, t)v(a, t) − %(b, t)v(b, t) = (x, t) dx. dt a a ∂x Wie im letzten Abschnitt folgt daraus die Erhaltungsgleichung x ∈ R, %t + (%v)x = 0, t > 0, (4.6) mit der Anfangsbedingung %(x, 0) = %0 (x), Wegen d dt Z R %(x, t) dx = − Z R x ∈ R. ∂ (x, t) dx = 0 ∂x für alle t > 0 bleibt die Anzahl der Fahrzeuge erhalten; daher der Begriff “Erhaltungsgleichung”. Wir benötigen eine Gleichung für die Geschwindigkeit v. Wir nehmen an, daß sie nur von der Fahrzeugdichte abhängt und den folgenden Bedingungen genügt: v ist eine monton fallende Funktion von % (bei dichterem Verkehr fahren die Autofahrer langsamer); auf einer leeren Straße fahren die Autos mit der maximal zulässigen Geschwindigkeit: v(0) = vmax ; unter einem gewissen Mindestabstand steht die Autokolonne: v(%max ) = 0. Das einfachste Modell, das alle diese Bedingungen erfüllt, ist eine lineare Beziehung zwischen % und v: ¶ µ % , 0 ≤ % ≤ %max . v(%) = vmax 1 − %max Damit wird (4.6) zu · µ %t + vmax % 1 − % %max ¶¸ = 0, x 98 x ∈ R, t > 0. (4.7) Diese Gleichung kann durch Skalierung vereinfacht werden. Seien L und τ typische Längen- und Zeiteinheiten, so daß L/τ = vmax . Führen wir die dimensionslosen Größen xs = x , L ts = t , τ u=1− 2% %max ein, erhalten wir ∂% 1 = ∂t τ · µ ¶¸ % ∂ 1 vmax % 1 − = ∂x %max L i ∂ h %max %max ∂u (1 − u) = − , ∂ts 2 2τ ∂ts ¸ · µ ¶ ∂ 1 %max ∂x u2 %max (1 − u) (1 + u) = − , vmax ∂xs 2 2 2τ ∂xs 2 und damit können wir (4.7) (mit (x, t) anstatt (xs , ts )) schreiben als µ 2¶ u ut + = 0, x ∈ R, t > 0, 2 u(x, 0) = u0 (x), x ∈ R, (4.8) (4.9) wobei u0 = 1 − 2%0 /%max . Die Gleichung (4.8) heißt inviskose Burgers-Gleichung. Ist die Straße leer (% = 0), folgt u = 1; in einem Stau (% = %max ) gilt u = −1. Wie sehen die Lösungen von (4.8)–(4.9) aus? Wir betrachten den speziellen Anfangswert : x<0 1 u0 (x) = (4.10) 1−x : 0≤x<1 0 : x ≥ 1. Dies bedeutet, daß anfangs keine Autos in x < 0 vorhanden sind und in x ≥ 1 ein moderater Verkehr herrscht. Eine einfache Rechnung zeigt, daß x<t 1 : 1−x u(x, t) = (4.11) : t≤x<1 1−t 0 : x ≥ 1. eine Lösung von (4.8)–(4.9) für x ∈ R, t < 1 ist, die (4.8) punktweise außer an x = t und x = 1 erfüllt (Abbildung 4.3). Die Lösung wird unstetig an t = 1. Die Fahrzeuge, die sich anfangs im Intervall (0, 1) befinden, fahren von links nach rechts, bis keine Autos mehr übrig bleiben. Wegen u = 1 in x < t kommen auch keine Fahrzeuge nach. Existiert eine Lösung auch für t ≥ 1? Wie sieht diese Lösung aus? Wir wenden die Methode der Charakteristiken aus dem vorigen Abschnitt an. Es folgt dt = 1, ds dx = u, ds du =0 ds mit x(0) = x0 , u(0) = u0 . Aus der ersten Gleichung erhalten wir ds = dt. Daher ist u(t) = u0 , x(t) = u0 t + x0 , 99 t ≥ 0. u t=0 t= 1/2 t=1 1 x 1 1/2 Abbildung 4.3: Lösung von (4.8)–(4.10). Dies bedeutet ausgeschrieben, daß u(x(t), t) = u0 = const. für alle t ≥ 0. Da x(t) Geraden sind (dies sind gerade die Charakteristiken), folgt, daß u(x, t) konstant entlang Geraden ist. Die Lösung (4.11) können wir dann wie in Abbildung 4.4 illustrieren. Die Geraden stellen keine Fahrzeugtrajektorien dar, sondern eher die “Ausbreitung” der Dichtewerte. Da sich die Geraden bei t = 1/2 in einem Punkt treffen, ist die Lösung in t 1/2 x 0 1 Abbildung 4.4: Die Lösung u(x, t), definiert durch (4.11), ist konstant entlang der Geraden. diesem Punkt unstetig. Um den Lösungsbegriff zu erweitern, multiplizieren wir (4.8) mit einer Funktion φ ∈ 1 C (R2 ) und integrieren über R × (0, ∞): Z ∞Z µ ³ u2 ´ ¶ φ dxdt 0 = ut + 2 x 0 R ¶ Z Z ∞Z µ u2 (4.12) = − uφt + φx dxdt − u(x, 0)φ(x, 0) dx. 2 R 0 R Um die beiden letzten Integrale zu definieren, benötigen wir nur integrierbare Lösungen u. Funktionen u, die (4.12) für alle φ ∈ C 1 (R2 ) mit kompakten Träger erfüllen, nennen wir schwache Lösungen von (4.8)–(4.9). 100 Wir betrachten nun unstetige Anfangsdaten ( u` : x < 0 u0 (x) = ur : x ≥ 0. (4.13) Das Problem (4.8), (4.13) heißt Riemann-Problem. Wir unterscheiden die folgenden Fälle: Fall 1: u` > ur . Die Fahrzeugdichte in x > 0 ist größer als in x < 0. Wir erwarten, daß sich eine Staulinie ausbildet bzw. eine Unstetigkeitskurve x = ψ(t). Dann ist ( u` : x < st u(x, t) = (4.14) ur : x ≥ st eine schwache Lösung von (4.8), (4.13). Die Unstetigkeitskurve ist durch x = ψ(t) = st gegeben, und die Schockgeschwindigkeit s = ψ 0 (t) muß bestimmt werden. Wir beweisen, daß u(x, t) tatsächlich eine schwache Lösung ist und berechnen dabei die Schockgeschwindigkeit. Sei φ ∈ C 1 (R2 ) mit kompaktem Träger. Wegen u = const. außer an x = st folgt einerseits ¶ Z ∞Z Z ∞ µZ st Z ∞ uφt dxdt = uφt dx + uφt dx dt R 0 0 = Z −∞ ∞ ³∂ ∂t 0 ∂ + ∂t = − andererseits Z 0 ∞ Z R Z R Z st st −∞ Z uφ dx − s · u(st−, t)φ(st, t) ∞ st ´ uφ dx + s · u(st+, t)φ(st, t) dt u(x, 0)φ(x, 0) dx − s · (u` − ur ) Z ∞ φ(st, t) dt, 0 ¶ u2 u2 − φ dx + (st−, t)φ(st, t) 2 x 2 0 −∞ Z ∞ µ 2¶ ´ u u2 − φ dx − (st+, t)φ(st, t) 2 x 2 st µ 2 ¶ Z ∞ u2r u` = − φ(st, t) dt. 2 2 0 u2 φx dxdt = 2 Z ∞ ³ Z st µ Wählen wir also s · (u` − ur ) = u2 u2` − r 2 2 oder 1 s = (u` + ur ) 2 (4.15) so löst u die Integralbeziehung (4.12) und ist damit eine schwache Lösung. Die Bedingung (4.15) heißt Rankine-Hugoniot-Bedingung. 101 Betrachte als Beispiel die Situation, in der in x < 0 anfangs die Fahrzeugdichte moderat und in x > 0 maximal ist: u` = 0, ur = −1. Dann ist die Schockgeschwindigkeit s = −1/2. Die Staulinie bewegt sich also nach links, d.h., der Stau vergrößert sich (Abbildung 4.5). t x u =0 l u = −1 r Abbildung 4.5: Charakteristiken für u` = 0 und ur = −1. Fall 2: u` < ur . Die Funktion (4.14) ist auch hier eine Lösung, da der obige Beweis kein Vorzeichen von u` − ur benötigt hat. Allerdings ist auch x < u` t u` : u2 (x, t) = x/t : u` t ≤ x ≤ ur t ur : x > ur t eine schwache Lösung (Abbildung 4.6). Übungsaufgabe: Beweisen Sie dies. Man kann sogar zeigen, daß es unendlich viele Lösungen gibt. Was ist passiert? Unser Lösungsbegriff ist so schwach, daß die Eindeutigkeit von Lösungen verloren gegangen ist. Wir benötigen eine zusätzliche (physikalische) Bedingung, die die Eindeutigkeit wieder sicherstellt. Es zeigt sich, daß der Begriff Entropie das Gewünschte liefert. Wir sagen, daß eine schwache Lösung die Entropiebedingung von Oleinik erfüllt, wenn entlang jeder Unstetigkeitskurve x = ψ(t) u2` /2 − v 2 /2 u2 /2 − v 2 /2 ≥ ψ 0 (t) ≥ r u` − v ur − v (4.16) für alle v zwischen u` und ur gilt. Im Falle der Lösung (4.14) folgt aus ψ 0 (t) = s und (4.16) 1 1 (u` + v) ≥ s ≥ (ur + v) 2 2 die Bedingung u` ≥ ur – Widerspruch. Da die Funktion u2 stetig ist, ist die Ungleichung (4.16) gegenstandslos. 102 Intuitiv ist u2 die physikalisch relevante Lösung. Die Voraussetzung u` < ur bedeutet, daß es in x < 0 mehr Autos als in x > 0 gibt. Die Autofahrer in der Nähe von x = 0 werden beschleunigen, und nach einiger Zeit wird es Autofahrer mit Geschwindigkeiten zwischen v(u` ) und v(ur ) geben. Man nennt u2 übrigens auch eine Verdünnungwelle. t x u ur l Abbildung 4.6: Charakteristiken der Lösung u2 . Wir sind nun in der Lage, die eingangs gestellte Frage zu beantworten. Wir betrachten eine eindimensionale Straße, die zur Zeit t = 0 im Intervall (−∞, 0) mit Fahrzeugen der Dichte % > 0 gefüllt ist. An x = 0 sei eine rote Ampel, und hinter der Ampel in (0, ∞) sei die Straße leer. Die Ampelphase habe die Dauer ω > 0. Wir arbeiten mit der skalierten Gleichung (4.8). Dann ist u = 1 − 2%/%max . Bis zur Zeit t = ω wird sich ein Stau vor der Ampel bilden, der sich während der Grünphase t > ω abbauen wird. Schritt 1: Rotphase (0 ≤ t < ω). Wir lösen (4.8) in x < 0 mit der Anfangsfunktion u0 (x) = u, x < 0, und der Randbedingung u(0, t) = −1, die die rote Ampel modelliert. Die Lösung lautet nach dem obigen Fall 1: ( u : x < st x < 0, 0 < t < ω, u(x, t) = −1 : x ≥ st, und die Schockgeschwindigkeit ist gegeben durch u−1 1 s = (u` + ur ) = . 2 2 Die Lösung in x > 0 ist nach Voraussetzung gegeben durch u(x, t) = 1 (Abbildung 4.7). Schritt 2: Grünphase (t > ω). Wir lösen die Burgers-Gleichung (4.8) in R mit Anfangswert u0 (x) = u(x, ω). Wegen u` = u > −1 = ur entwickelt sich ein Schock ψ(t) = st, t > ω, mit Geschwindigkeit s = (u − 1)/2 < 0. Außerdem entsteht eine Verdünnungswelle an x = 0, da u` = −1 < 1 = ur . Die Lösung ist gegeben durch u : x < st −1 : st ≤ x < ω − t x ∈ R, t > ω. u(x, t) = x : ω − t ≤ x < t − ω t−ω 1 : x ≥ t − ω, 103 t t 1 Grün− phase u=1 ω Rot− phase u=u u = −1 u=1 x sω st 1 u=u u = −1 u=1 Abbildung 4.7: Charakteristiken für das Ampelproblem. Diese Lösung macht Sinn, solange st < ω − t oder t < t1 := ω/(s + 1) = 2ω/(u + 1). Schritt 3: Grünphase (t > t1 ). Was geschieht mit dem Schock für t > t1 ? Dazu benötigen wir die sogenannte verallgemeinerte Rankine-Hugoniot-Bedingung ´ ´ 1 ³ ψ(t) 1³ s(t) = ψ (t) = +u , u(ψ(t)+, t) + u(ψ(t)−, t) = 2 2 t−ω 0 für t > t1 . Dies ist eine lineare Differentialgleichung für ψ(t) mit Anfangswert ψ(t1 ) = st1 = ω u−1 . u+1 Die Lösung lautet ψ(t) = u(t − ω) − √ t−ω q ω(1 − u2 ), t ≥ t1 . Es gibt nun zwei Fälle. Wenn u ≤ 0 (oder % ≥ %max /2), gilt ψ(t) → −∞ für t → ∞, und es gibt einen Schock für alle Zeiten, der sich in der negativen x-Richtung mit Geschwindigkeit ψ 0 (t) → u (t → ∞) fortpflanzt. Die Unstetigkeitsstufe wird natürlich immer kleiner für größere Zeiten, aber die Autofahrer bemerken den Schock weit von der Ampel entfernt. Im Fall u > 0 (oder % < %max /2) bewegt sich der Schock in die positive x-Richtung. Wir nehmen an, daß die Ampel zur Zeit t = 2ω wieder von Grün auf Rot schaltet. Wie lang muß die Grünphase sein, um den Schock zu eliminieren? Dazu ist die Bedingung t2 ≤ 2ω notwendig, wobei t2 eine Nullstelle von ψ ist. Die Gleichung ψ(t2 ) = 0 hat die √ eindeutige Lösung t2 = ω/u2 . Also ist t2 ≤ 2ω genau dann erfüllt, wenn u ≥ 1/ 2 oder 104 in Originalvariablen %max ³ 1 ´ 1 − √ ≈ 0.146%max . 2 2 Der Schock vor der Ampel wird vollständig während der Grünphase aufgelöst, wenn diese Bedingung an % erfüllt ist. Erstaunlich an diesem Ergebnis ist, daß die maximale Verkehrsdichte %, die die Ampel verkraftet, von der Dauer der Ampelphasen unabhängig ist. Wir fassen zusammen: %≤ % ≥ %max /2: Schon eine Rotphase genügt, um den Verkehr auf Dauer zu stören. √ (1 − 1/ 2)%max /2 < % < %max /2: Die Effekte der Rotphasen akkumulieren sich mit der Zeit, würden jedoch bei Entfernung der Ampel wieder verschwinden. √ % ≤ (1 − 1/ 2)%max /2. Die Schockfront kehrt vor Beendigung der Grünphase wieder zur Ampel zurück, und der Einfluß der Rotphase ist damit verschwunden. Übungsaufgabe: Diskutieren Sie ³das Ampelproblem, ´wenn die Geschwindigkeit durch das Greenberg-Modell v(%) = vmax ln (1 + %max )/(1 + %) , 0 ≤ % ≤ %max , gegeben ist. 4.3 Strömungsmechanik In diesem Abschnitt gehen wir der Frage nach, welchen Bewegungsgleichungen eine Flüssigkeit oder ein Gas genügt. Diese Gleichungen analysieren wir weiter in den folgenden Abschnitten. Betrachte ein Teilchen der Masse m, auf das die äußere Kraft F wirkt. Beschreibt x(t) den Ort und v(t) die Geschwindigkeit des Teilchens zur Zeit t, so ist die Evolution durch die Newtonschen Gleichungen x0 = v, mv 0 = F, t > 0, (4.17) gegeben. Wir können die Bewegung auch mit Hilfe einer Wahrscheinlichkeitsverteilung f (x, v, t) beschreiben, wobei Z Z f (x, v, t) dxdv Ωx Ωv die Wahrscheinlichkeit angibt, das Teilchen zur Zeit t im Gebiet Ωx mit der Geschwindigkeit aus Ωv anzutreffen. Insbesondere gilt Z Z f (x, v, t) dxdv = 1. R3 R3 105 Sei w(t; x, v) := (x(t), v(t)) die Lösung von (4.17) zu den Anfangswerten x(0) = x, v(0) = v. Die Funktion w beschreibt die Bahn oder Trajektorie des Teilchens. Dann ist f (w(t; x, v), t) konstant entlang der Trajektorien und 0= d f (w(t; x, v), t) = ft + ∇x f · x0 + ∇v f · v 0 , dt also mit (4.17) ft + v · ∇ x f + F · ∇v f = 0. m (4.18) Wir nennen dies die Lionville-Gleichung. Betrachte nun eine sehr große Zahl N À 1 von Teilchen mit derselben Masse m (z.B. einer Flüssigkeit). Ist (xi (t), vi (t)) der Vektor aus Ort und Geschwindigkeit des i-ten Teilchens, so kann das Teilchenensemble wie oben durch die Newtonschen Gleichungen x0i = vi , mvi0 = Fi , i = 1, . . . , N, beschrieben werden. Die Lösung dieser Gleichungen kann sehr aufwendig sein. Es ist daher bequemer, die Evolution des Ensembles mit Hilfe der Verteilung f (x, v, t) zu berechnen. Streng genommen müßten x und v Vektoren aus R3N sein. Wir postulieren, daß die Verteilung f (x, v, t) den Anteil der N Teilchen an der Stelle (x, v, t) beschreibt und der Lionville-Gleichung F · ∇v f = 0, x, v ∈ R3 , t > 0, (4.19) m genügt. Die Kraft F ist dann die auf das Teilchenensemble wirkende effektive Kraft, die sich aus allen Einzelkräften Fi zusammensetzt. Die Gleichung (4.19) wird vervollständigt durch die Anfangsverteilung ft + v · ∇ x f + f (x, v, 0) = f0 (x, v), x, v ∈ R3 . Die obige Gleichung ermöglicht durch den Einbezug der äußeren Kraft F die Modellierung von Fernkräften (Gravitation, elektrische Kräfte etc.). Nahkräfte wie Teilchenkollisionen werden jedoch nicht modelliert. Um auch diese beschreiben zu können, nehmen wir an, daß die zeitliche Änderung der Verteilung f entlang der Trajektorien gleich ist der Änderungsrate von f aufgrund von Teilchenkollisionen: df = Q(f ) entlang der Trajektorien, dt wobei Q(f ) die Kollisionsrate ist. Ausgeschrieben bedeutet dies F · ∇v f = Q(f ), x, v ∈ R3 , t > 0. (4.20) M Diese Gleichung wird Boltzmann-Gleichung genannt. Um einen Ausdruck für Q(f ) herzuleiten, nehmen wir an, daß der Anteil P (x, v 0 → v, t) der Teilchen an (x, t), deren Geschwindigkeit v 0 nach v infolge der Kollision geändert wird, proportional ist zu ft + v · ∇ x f + 106 der Wahrscheinlichkeit f (x, v 0 , t) und der Wahrscheinlichkeit 1 − f (x, v, t), daß der Zustand (x, v) frei ist. Dann ist P (x, v 0 → v, t) = s(x, v 0 , v)f (x, v 0 , t)(1 − f (x, v, t)), wobei die Proportionalitätskonstante s(x, v 0 , v) Stoßrate genannt wird. Die Änderungsrate von f infolge von Kollisionen ist gegeben durch P (x, v 0 → v, t) − P (x, v → v 0 , t) für alle Geschwindigkeiten v 0 im Element dv 0 . Das Resultat ist das Integral Z [P (x, v 0 → v, t) − P (x, v → v 0 , t)] dv 0 (Q(f ))(x, v, t) = = Z R3 R3 [s(x, v 0 , v)f 0 (1 − f ) − s(x, v, v 0 )f (1 − f 0 )] dv 0 , (4.21) wobei f = f (x, v, t) und f 0 = f (x, v 0 , t). Die Analyse des Kollisionsoperators (4.21) ist im allgemeinen sehr aufwendig. Für allgemeine Stoßraten gilt Z Z Z 0 0 0 s(x, v, v 0 )f (1 − f 0 ) dv 0 dv s(x, v , v)f (1 − f )dv dv − Q(f ) dv = R3 = Z R3 R3 s(x, v 0 , v)f 0 (1 − f )dv 0 dv − Z R3 R3 s(x, v 0 , v)f 0 (1 − f ) dvdv 0 = 0. Nach (4.20) bedeut dies, daß die Teilchenzahl wegen Z Z Z Z ∂ divx (vf ) dxdv f (x, v, t) dxdv = − ∂t R3 R3 R3 R3 Z Z ³F ´ − divv f dvdx m R3 R3 Z Z + Q(f ) dvdx R3 R3 = 0 zeitlich konstant ist. Wir haben hier vorausgesetzt, daß die Kraft F nicht von v abhängt. Die Boltzmann-Gleichung ist also auch eine Erhaltungsgleichung. Die Lösung der Boltzmann-Gleichung ist sehr aufwendig, da die Funktion f von sieben Variablen abhängt. Unser Ziel ist es daher, einfachere Gleichungen herzuleiten. Dazu verwenden wir eine Variante der Momentenmethode. 107 Zuerst skalieren wir die Boltzmann-Gleichung. Wir definieren mit der typischen Länge L, der typischen Zeit T und der typischen Geschwindigkeit V = L/T , die sich daraus ergibt, daß ein Teilchen einen Weg der Länge L in der Zeit T durchquert, die dimensionslosen Größen x v t xs = , vs = , ts = . L V T Die Länge L kann etwa der Durchmesser des Gebietes sein, in dem sich die Flüssigkeit aufhält. Nun gibt es eine zweite typische Länge, nämlich die mittlere freie Weglänge λ, die die Länge bezeichnet, die ein Teilchen durchschnittlich zwischen zwei Kollisionen durchquert. Wir setzen voraus, daß λ ε= ¿1 L gilt. Der Parameter ε wird auch Knudsen-Zahl genannt. Es macht Sinn, den Kollisionsoperator gemäß Qs (f ) = τ Q(f ) zu skalieren, wobei τ = λ/V die Zeit ist, die ein Teilchen benötigt, um einen Weg der Länge λ mit der Geschwindigkeit V zu durchqueren, denn Q(f ) hat die Einheit 1/sec. Skalieren wir außerdem die Kräft gemäß Fs = T F , V m so erhalten wir die skalierte Boltzmann-Gleichung (wir lassen den Index “s” im folgenden fort) 1 (4.22) ft + v · ∇x f + F · ∇v f = Q(f ). ε Unser Ziel ist es, den Grenzwert ε → 0 zu studieren. Der Kollisionsoperator erfülle die folgenden Voraussetzungen: Es gelte für alle Lösungen f von (4.22) Z Z Z Q(f ) dv = Q(f )vi dv = R3 R3 Q(f )|v|2 dv = 0, i = 1, . . . , d. R3 Es gelte Q(f ) = 0 genau dann, wenn es Zahlen αi (x, t) ∈ R, i = 0, . . . , 4, gibt, so daß ln f = α0 + α1 v1 + α2 v2 + α3 v3 + α4 |v|2 . Diese Voraussetzungen können wir wie folgt interpretieren. Die erste Bedingung drückt in Abwesenheit äußerer Kräfte die Erhaltung von Masse, Impuls und Energie aus. Definiere 108 nämlich die Teilchendichte nf (x, t), mittlere Geschwindigkeit uf (x, t) und Energiedichte ef (x, t) bezüglich f durch nf (x, t) = hf (x, v, t)i, uf (x, t) = hvf (x, v, t)i, 1 ef (x, t) = h |v|2 f (x, v, t)i, 2 R wobei hgi := R3 g dv. Man nennt diese Integrale auch das nullte, erste und zweite Moment. Aus der ersten Bedingung folgt, sofern F = 0, Z Z Z Z Z ∂ Q(f ) dvdx = 0, divx (vf ) dvdx − nf dx = − ∂t R3 R3 R3 R3 R3 Z Z Z Z Z ∂ uf dx = − divx (v ⊗ vf ) dvdx − vQ(f ) dvdx = 0, ∂t R3 R3 R3 R3 R3 Z Z Z Z Z ³1 ´ 1 2 ∂ 2 divx |v| vf dvdx − ef dx = − |v| Q(f ) dvdx = 0, ∂t R3 2 R3 R3 R3 R3 2 wobei v ⊗ v die (3 × 3)-Matrix mit Elementen vi vj , i, j = 1, 2, 3, bezeichne. Die zweite Voraussetzung bedeutet, daß es (im Mittel) genau dann keine Kollisionen gibt, wenn f sich als ³ f (x, v, t) = exp α0 (x, t) + α(x, t) · v + α4 (x, t)|v|2 ), α = (α1 , α2 , α3 )> , darstellen läßt. Dies ist äquivalent zur Existenz von Konstanten n(x, t), u(x, t) und θ(x, t), so daß µ ¶ |v − u(x, t)|2 n(x, t) exp − f (x, v, t) = M (x, v, t) := (2πθ(x, t))3/2 2θ(x, t) gilt. Die Funktion M wird Maxwell-Verteilung genannt. Welche Bedeutung haben die Funktionen n, u und θ? Eine Rechnung zeigt hM (x, v, t)i = n(x, t), hvM (x, v, t)i = n(x, t)u(x, t), µ ¶ 1 1 2 3 2 h |v| M (x, v, t)i = n(x, t) |u(x, t)| + θ(x, t) . 2 2 2 Übungsaufgabe: Zeigen Sie die drei obigen Identitäten. Folglich können wir n = nM als Teilchendichte und u = uM als mittlere Geschwindigkeit (bezüglich M ) interpretieren. Das dritte Integral ist die Gesamtenergie, bestehend aus der kinetischen Energie 21 n|u|2 und der inneren Energie 23 nθ. Daher können wir θ als Temperatur interpretieren. Sei fε eine Lösung der skalierten Boltzmann-Gleichung (4.22). Wir treffen die folgenden Annahmen: 109 Die Kraft F hänge nicht von v ab. Die Funktion fε und ihre Ableitungen seien gleichmäßig beschränkt in ε > 0 und fε → f punktweise (fast überall) für ε → 0. Es gilt für ε → 0 g(v) ∈ {1, vi , vi vj , |v|2 vi : 1 ≤ i, j, ≤ 3}. hg(v)fε i → hg(v)f i, Die Funktion Q(fε ) konvergiere gegen Q(f ) für ε → 0. Multipliziere nun die Boltzmann-Gleichung (4.22) mit 1, v und v ∈ R3 und integriere partiell 1 |v|2 , 2 integriere über ∂t hfε i + divx hvfε i = 0, ∂t ¿ ∂t hvfε i + divx hv ⊗ vfε i − F hfε i = hvQ(fε )i, À À À ¿ ¿ 1 2 1 1 2 2 |v| fε + divx v|v| fε − F hvfε i = |v| Q(fε ) , 2 2 2 (4.23) (4.24) (4.25) denn hvF fε i = ¿ 1 2 |v| F fε 2 À Z R3 = − Z v divv (F fε ) dv = − R3 ∇v ³1 2 Z R3 F fε dv = −F hfε i, ´ |v|2 F fε dv = −F hvfε i Aus (4.22) folgt im Grenzwert ε → 0 die Gleichung Q(f ) = 0. Nach der obigen Voraussetzung an Q impliziert dies f = M . also konvergiert fε gegen M . Im Grenzwert ε → 0 erhalten wir aus (4.23)–(4.25) ∂t n + divx (nu) = 0, ∂t (nu) + divx hv ⊗ vM i − F n = 0, µ µ ¶¶ 1 2 3 1 ∂t n |u| + θ + divx h v|v|2 M i − F · (nu) = 0. 2 2 2 Es bleiben die zweiten und dritten Momente hv ⊗ vM i und h 12 v|v|2 M i zu berechnen: ¿ hv ⊗ vM i = n(u ⊗ u) + nθ Id, À ³1 1 5 ´ 2 v|v| M = nu |u|2 + θ , 2 2 2 wobei Id die Einheitsmatrix des R3×3 bezeichne. 110 Übungsaufgabe: Zeigen Sie die beiden obigen Identitäten. Daraus folgt divx hv ⊗ vM i = divx (nu ⊗ u) + ∇x (nθ), ¶¶ µ µ 1 1 2 5 2 |u| + θ . divx h v|v| M i = divx nu 2 2 2 Mit der Energiedichte 3 1 e := |u|2 + θ 2 2 erhalten wir schließlich die Euler-Gleichungen der Gasdynamik: ∂t n + div(nu) = 0, (4.26) ∂t (nu) + div(nu ⊗ u) + ∇(nθ) − nF = 0, (4.27) ∂t (ne) + div(nu(e + θ)) − (nu) · F = 0. (4.28) Wir haben div statt divx geschrieben, da die Funktionen nur von x und t, aber nicht von v abhängen. Die Euler-Gleichungen sind im wesentlichen aus der reduzierten Gleichung (4.22) mit ε = 0 und den entsprechenden Momenten gewonnen worden. Es ist möglich, die Funktion fε bezüglich ε zu entwickeln. fε = M + εgε + O(ε2 ) und diese Entwicklung in (4.22) einzusetzen, um Näherungen höherer Ordnung zu erhalten. Diese Methode, die man Chapman-Enskog-Entwicklung nennt, erfordert allerdings genauere Kenntnisse über den Kollisionsoperator. Diese Technik führt auf die NavierStokes-Gleichungen ∂t n + div(nu) = 0, ∂t (nu) + div(nu ⊗ u) + ∇(nθ) − nF = εdivτ, ∂t (ne) + divx (nu(e + θ)) − (nu) · F = εdiv(q + u · τ ), (4.29) (4.30) (4.31) wobei τ einen viskosen Spannungstensor darstellt, der Scherkräfte durch Reibung modelliert, und q die Wärmeflußdichte: τ = λ(divu)Id + µ(∇u + (∇u)> ), q = κ∇θ. Hierbei sind λ und µ von (x, t) abhängende, nicht-negative Viskositätskoeffizienten, κ > 0 ist die Wärmeleitfähigkeit und (∇u + (∇u)> )ij = 111 ∂ui ∂uj + . ∂xj ∂xi Im folgenden setzen wir ε = 1, da wir diesen Parameter in τ und q “verstecken” können. Für ε = 0 erhalten wir aus den Navier-Stokes-Gleichungen die Euler-Gleichungen (4.26)– (4.28). Sind die Viskositätskoeffizienten λ und µ konstant, können wir den Ausdruck divτ vereinfachen. Aus µ ¶ 3 X ∂ui ∂uj ∂ τ = (∆u + ∇(divu))i + div((∇ ⊗ u) + (∇ ⊗ u) )i = ∂xj ∂xj ∂xi k=1 folgt divτ = (λ + µ)∇(divu) + µ∆u. Ferner ergibt sich ¶ 3 3 µ X X ∂τij ∂ ∂ui div(u · τ ) = (ui τij ) = τij + ui ∂x ∂x ∂xj j j i,j=1 i,j=1 = ∇u : τ + u · divτ, wobei wir für zwei Matrizen A, B ∈ R3×3 A:B= 3 X aij bij i,j=1 definiert haben. Wir erhalten aus der obigen Gleichung für divτ div(u · τ ) = ∇u : τ + (λ + µ)u · ∇(divu) + µu · ∆u. Wegen der Terme µ∆u und div(κ∇θ) sind die Gleichungen (4.30) und (4.31) parabolische Differentialgleichungen. Der Ausdruck nθ ist der Druck einer Flüssigkeit. Dies gilt nur für ideale Fluide; im allgemeinen ist der Druck p ein unabhängige Variable. Damit erhalten wir (für konstante Viskositätskoeffizienten) die Gleichungen ∂t n + div(nu) = 0, (4.32) ∂t (nu) + div(nu ⊗ u) + ∇p − nF = ∇((λ + µ)divu) + µ∆u, ∂t (ne) + div(u(ne + p)) − (nu) · F = div(κ∇θ) (4.33) (4.34) +∇u : τ + (λ + µ)u · ∇(divu) + µu · ∆u. In dieser Formulierung ist p eine Funktion von n und θ oder umgekehrt θ eine Funktion von n und p. 112 4.4 Bluttransport durch Adern Das Rauchen von Zigaretten führt durch das in den Zigaretten enthaltene Nikotin zu einer Verengung der Adern, die dann weniger Blut transportieren können. Diese Durchblutungsstörungen treten besonders in den Extremitäten auf und können zu dem berüchtigten Raucherbein führen. In diesem Abschnitt beantworten wir die folgende Frage: Frage: Wieviel weniger Blut kann durch eine verengte Ader transportiert werden? Wir modellieren das Blut als eine Flüssigkeit durch ein dünnes Rohr mit Radius R (Abbildung 4.8). Die Länge L des Rohres sei viel größer als der Radius. Aus Symmetriegründen u R 0 L x3 = z Abbildung 4.8: Flüssigkeitsströmung in einem dünnen Rohr. können wir annehmen, daß die Geschwindigkeit u nur vom Abstand r von der Rohrachse abhängt. Außerdem vernachlässigen wir Strömungsanteile in x- und y-Richtung, so daß wir die Geschwindigkeit schreiben können als 0 u(x1 , x2 , x3 ) = 0 . (4.35) u3 (r) Es ist ferner sinnvoll anzunehmen, daß das Blut homogen ist, d.h., die Dichte n ist örtlich konstant. Dies impliziert aus (4.32) divu = 0. Wir nennen Flüssigkeiten mit der Eigenschaft divu = 0 inkompressibel. Das bedeutet, daß die Dichte entlang jeder Trajektorie x(t), wobei x(t) das Problem x0 (t) = u(x(t), t), t > 0, x(0) = x0 , löst, konstant ist, denn dies ist äquivalent zu 0= d n(x(t), t) = ∂t n + u · ∇n, dt und ein Vergleich mit (4.32) ergibt divu = 0. Beachte, daß es inkompressible Flüssigkeiten mit n 6= const. geben kann. Unsere letzte Voraussetzung ist, daß wir stationäre Strömungen betrachten, d.h. ∂t n = 0 und ∂t u = 0. 113 Wir wollen aus den Navier-Stokes-Gleichungen die Geschwindigkeit bestimmen. Die obigen Voraussetzungen einer homogenen und stationären Flüssigkeit vereinfachen (4.32)– (4.33) zu div(u ⊗ u) + ∇p = µ∆u, divu = 0. Der Einfachheit halber haben wir hier n = 1 angenommen. Wegen (4.35) lautet die letzte Gleichung ∂u3 /∂x3 = 0, also 3 ³ ´ X ∂ ∂ (uj u3 ) = (u23 ) = 0. div(u ⊗ u) = ∂xj ∂x3 3 j=1 Es bleibt zu lösen: ∂p = µ∆u3 . (4.36) ∂x3 Nun herrscht in dem Rohr ein Druckabfall; wir nehmen an, daß der Druck linear abfällt, d.h. p(L) − p(0) ∂p = < 0. ∂x3 L Es ist zweckmäßig, die Gleichung (4.36) in Zylinderkoordinaten zu lösen. Der LaplaceOperator in Zylinderkoordinaten x1 = r sin φ, lautet 1 ∂ ∆= r ∂r x2 = r cos φ, µ ∂ r ∂r ¶ + x 3 = x3 1 ∂2 ∂2 . + r2 ∂φ2 ∂x23 Übungsaufgabe: Beweisen Sie diese Beziehung. Da u3 nur vom Radius r abhängt, erhalten wir schließlich aus (4.36) µ ¶ 1 d d p(L) − p(0) r u3 (r) = , 0 < r < R. r dr dr µL (4.37) Als Randbedingungen nehmen wir an, daß u3 an r = 0 endlich ist und daß die Flüssigkeit am Rand r = R haftet: u3 (R) = 0. (4.38) u3 (0) = u, Die Gleichung (4.37) kann einfach durch Integration gelöst werden: u3 (r) = p(L) − p(0) 2 r + c1 ln r + c2 . 4µL Aus (4.38) ergibt sich c1 = 0 und c2 = −p(L) − p(0))R2 /4µ und damit u3 (r) = p(L) − p(0) 2 (r − R2 ). 4µL 114 Wieviel Blut fließt durch das Rohr? Durch eine Ringfläche, deren Mittelpunkt auf der Rohrachse liegt und deren Radien r und r + dr sind, fließt pro Sekunde die Blutmenge 2πru3 (r)dr. Durch den vollen Röhrenquerschnitt fließt pro Sekunde das Flüssigkeitsvolumen Z R Z R π π r(r2 − R2 ) dr = 2πru3 (r) dr = (p(L) − p(0)) (p(0) − p(L))R4 . V = 2µL 8µL 0 0 Man nennt diese Beziehung das Hagen-Poiseuillesche Gesetz. Es lehrt, daß schon eine geringfügige Verkleinerung des Rohrradius’ R eine beträchtliche Verringerung der durchströmenden Flüssigkeitsmenge zur Folge hat. Wird etwa der Radius einer Ader infolge des Nikotins halbiert, so fließt nur noch (1/2)4 ≈ 6% der ursprünglichen Blutmenge durch die Ader. 4.5 Strömung um einen Tragflügel In diesem Abschnitt gehen wir der Frage nach, wie eine Flüssigkeit oder ein Gas einen Körper, z.B. einen Flugzeugtragflügel, umströmt. Um das Problem zu vereinfachen, betrachten wir eine homogene, stationäre, zweidimensionale, nicht-viskose Strömung. Gemäß dem letzten Abschnitt bedeutet dies, daß die Geschwindigkeit u = (u1 , u2 )> und der Druck p den Gleichungen divu = 0, n0 (u · ∇)u + ∇p = 0 (4.39) genügen, die aus (4.26)–(4.27) folgen. Die Homogenitätsvoraussetzung impliziert, daß die Dichte n = n0 konstant ist. Unser Ziel ist es, die obigen Gleichungen weiter zu vereinfachen. Definiere dafür die sogenannte Wirbeldichte ∂u2 ∂u1 − . ∂x1 ∂x2 rotu := Wir behaupten, daß die Wirbeldichte entlang der Teilchenbahnen verschwindet. Lemma 4.1 Es gilt rotu(x(t), t) = const. für alle t > 0, wobei x0 (t) = u(x(t), t), t > 0. Beweis: Wir verwenden die Abkürzungen ∂ i uj = ∂uj , ∂xi 115 i, j = 1, 2. Differenzieren wir die u1 -Komponente der zweiten Gleichung von (4.39) nach x2 und die u2 -Komponente nach x1 und subtrahieren die entstehenden Gleichungen, erhalten wir 0 = ∂2 (u1 ∂1 u1 + u2 ∂2 u1 ) − ∂1 (u1 ∂1 u2 + u2 ∂2 u2 ) = u1 ∂1 (∂2 u1 − ∂1 u2 ) + u2 ∂2 (∂2 u1 − ∂1 u2 ) +∂2 u1 (∂1 u1 + ∂2 u2 ) − ∂1 u2 (∂1 u1 + ∂2 u2 ) und wegen 0 = divu = ∂1 u1 + ∂2 u2 0 = u · ∇rotu. Daher ist wegen ∂u/∂t = 0 d rotu(x(t)) = x0 · ∇rotu = u · ∇rotu = 0. dt Das Lemma ist bewiesen. ¤ Wir suchen nun spezielle ebene, homogene, stationäre Strömungen mit divu = 0, rotu = 0. (4.40) Strömungen, die (4.40) erfüllen, nennen wir Potentialströmungen. Wegen rotu = 0 in einem (einfach zusammenhängenden) Gebiet existiert nämlich ein Geschwindigkeitspotential φ, so daß u = ∇φ oder ∆φ = 0 gilt. Haben wir diese Gleichung gelöst (mit noch zu spezifizierenden Randbedingungen), können wir die Geschwindigkeit gemäß u = ∇φ berechnen. Wie können wir die zweite Variable, den Druck p, bestimmen? Lemma 4.2 Wenn rotu = 0 in Γ, dann gilt die Bernoulli-Gleichung n0 2 |u| + p = const. 2 Beweis: Wegen µ ¶ 1 2 ∇|u| − (u · ∇)u = 2 1 = ¶ µ 1 ∇|u|2 − (u · ∇)u = 2 2 = in Γ. u1 ∂1 u1 + u2 ∂1 u2 − (u1 ∂1 u1 + u2 ∂2 u1 ) −u2 (∂2 u1 − ∂1 u2 ), u1 ∂2 u1 + u2 ∂2 u2 − (u1 ∂1 u2 + u2 ∂2 u2 ) u1 (∂2 u1 − ∂1 u2 ) 116 folgt 1 ∇|u|2 − (u · ∇)u = 2 µ ¶ · rotu = 0 ³n ´ |u|2 + p . −u2 u1 und daher aus (4.39) 0 = n0 (u · ∇)u + ∇p = ∇ Die Behauptung folgt durch Integration. x 0 2 ¤ 2 ν Ω x R 1 ν Abbildung 4.9: Umströmung eines Kreiszylinders. Wir untersuchen nun die Umströmung eines Kreiszylinders mit Radius R (Abbildung 4.9) und Mittelpunkt im Koordinatenursprung. Wir nehmen an, daß die Geschwindigkeit und der Druck weit vom Hindernis entfernt konstant ist und daß die Normalenkomponente der Geschwindigkeit am Rand des Hindernisses verschwindet: µ ¶ u∞ u→ , p → p∞ (|x| → ∞) und u · ν = 0 auf ∂Ω. 0 Hierbei ist ν der äußere Normaleneinheitsvektor auf ∂Ω. Gemäß den obigen Überlegungen sind u = ∇φ und p Lösungen von µ ¶ u∞ 2 (|x| → ∞) (4.41) ∆φ = 0 in R \Ω, ∇φ · ν = 0 auf ∂Ω, ∇φ → 0 und (siehe Lemma 4.2) p = p∞ + n0 (|u∞ |2 − |u|2 ) 2 117 in R2 \Ω. (4.42) Wir transformieren das Randwertproblem (4.41) in Polarkoordinaten. Mit x 1 = r cos α, x2 = r sin α folgt ¶ µ 1 1 φr cos α − φα r−1 sin α , ∆φ = (rφr )r + 2 φαα ∇φ = (4.43) −1 r r φr sin α + φα r cos α und damit zum einen r(rφr )r + φαα = 0, 0 ≤ α < 2π, r > R, (4.44) und zum anderen aus φr cos α − φα sin α → u∞ , r φr sin α + φα cos α →0 r (|x| → ∞) durch geschickte Linearkombination φr → u∞ cos α, 1 φα → −u∞ sin α r für |x| → ∞ (4.45) und wegen ν = (cos α, sin α)> 0 = ∇φ · ν = (cos2 α + sin2 α)φr = φr , r = R, 0 ≤ α < 2π. (4.46) Das Problem (4.44)–(4.46) kann durch Separation der Variablen gelöst werden, d.h., wir machen den Ansatz φ(r, α) = f (r)g(α) in (4.44): r(rfr )r gαα =− =: c ∈ R. f g Die linke Seite der Gleichung hängt nur von r, die rechte nur von α ab; also sind beide Seiten konstant. Da g eine 2π-periodische Funktion sein soll, folgt c = 1 und g(α) = c1 cos α + c2 sin α. Um die verbleibende Gleichung r(rfr )r = f zu lösen, machen wir den Ansatz f (r) = r β : rβ = f (r) = r(rfr )r = β 2 rβ =⇒ β = ±1. Die allgemeine Lösung lautet also f (r) = r + c3 . r Eine Integrationskonstante genügt, da die zweite mit den Konstanten c1 und c2 integriert werden kann. Die drei Konstanten c1 , c2 , c3 bestimmen wir aus den drei Randbedingungen (4.45)–(4.46): ³ c3 ´ 0 = φr (R, α) = g(α) 1 − 2 =⇒ c3 = R2 . R 118 Aus (4.45) und c3 ´ φr (r, α) = (c1 cos α + c2 sin α) 1 − 2 → c1 cos α + c2 sin α r ³ 1 c3 ´ φα (r, α) = (−c1 sin α + c2 cos α) 1 + 2 → −c1 sin α + c2 cos α r r ³ für r → ∞ folgt c1 cos α + c2 sin α = u∞ cos α, −c1 sin α + c2 cos α = −u∞ sin α. Setzen wir α = π/2 ein, erhalten wir aus der ersten Gleichung c2 = 0 und aus der zweiten Gleichung c1 = u∞ . Die Lösung lautet also µ ¶ R2 φ(r, α) = u∞ cos α r + , r ≥ R, 0 ≤ α < 2π. r Wie können wir die Strömung visualisieren? Dazu betrachten wir die komplexe Erweiterung des Geschwindigkeitspotentials µ ¶ R2 F (z) = u∞ z + , |z| ≥ R. z Wir nennen F das komplexe Geschwindigkeitspotential. Der Realteil von F ist gerade φ. Allgemein schreiben wir für z = x1 + ix2 F (z) = φ(x1 , x2 ) + iψ(x1 , x2 ), wobei wir φ(r, α) und φ(x1 , x2 ) miteinander identifizieren. Die Funktion F ist in {|z| ≥ R} analytisch, also gelten die Cauchy-Riemannschen Differentialgleichungen u1 = ∂φ ∂ψ = , ∂x1 ∂x2 u2 = Dies impliziert ∂φ ∂ψ =− . ∂x2 ∂x1 ∂ψ ∂ψ + u2 = 0, ∂x1 ∂x2 und daher sind die Teilchenbahnen durch die Gleichung ψ(x1 , x2 ) = const. gegeben (Abbildung 4.10). Wir nennen die Teilchenbahnen auch Stromlinien; sie sind die Konturlinien von Im F . In Abbildung 4.11 sind diese Konturlinien dargestellt. Die Geschwindigkeit verschwindet genau dann, wenn sin α = 0 und r = R, also gerade an den beiden Punkten (−R, 0) und (R, 0). Nach (4.42) ist der Druck maximal an diesen Punkten; sie werden auch Staupunkte genannt. Diese symmetrische Druckverteilung kann keine resultierende Kraft auf den Kreiszylinder ausüben. Um sie mit konstanter Geschwindigkeit durch die ruhende Flüssigkeit (oder das ruhende Gas) zu ziehen, bräuchte man keine Kraft. Dieser Widerspruch zur u · ∇ψ = u1 119 ψ ∆ u ψ = const. Abbildung 4.10: Zur Beziehung u · ∇ψ = 0. 2.5 2 1.5 1 0.5 y 0 −0.5 −1 −1.5 −2 −2.5 −3 −2 −1 0 x 1 2 3 Abbildung 4.11: Stromlinien um einen Kreiszylinder mit Radius R = 1 und Grenzgeschwindigkeit u∞ = 1. Erfahrung löst sich folgendermaßen: Im ersten Anlaufen der Strömung sieht das Stromlinienbild wie in Abbildung 4.11 aus. Nach kurzer Zeit ändert jedoch die unvermeidliche Reibung in einer Grenzschicht um den Kreiszylinder und beim Wiederzusammenlaufen der Flüssigkeit hinter dem Kreiszylinder das Strömungsbild; es treten Wirbel hinter dem Hindernis auf, die Stromlinien und damit auch der Druck sind nicht mehr symmetrisch verteilt. Streng genommen existiert keine globale Potentialströmung auf dem Außenraum R2 \Ω, da dieses Gebiet nicht einfach zusammenhängend ist. Wir müssen eigentlich eine Lösung φ suchen von ∆φ = 0 in R2 \(Ω ∪ R+ ) (4.47) mit den Randbedingungen ∇φ · ν = 0 auf ∂Ω, ∇φ → µ u∞ 0 ¶ (|x| → ∞) (4.48) und φr und φα 2π-periodisch bezüglich α. 120 (4.49) Die letzte Bedingung stellt sicher, daß die Geschwindigkeit u = ∇φ stetig in R 2 \Ω ist. Das Gebiet R2 \(Ω ∪ R+ ) ist einfach zusammenhängend, so daß die Lösung von (4.47) Sinn macht. Allerdings verlieren wir die Stetigkeit von φ auf R2 \Ω. Die Funktionen ¶ µ R2 , r ≥ R, α ∈ R, (4.50) φ(r, α) = −Aα + u∞ cos α r + r sind für alle A ∈ R Lösungen von (4.47)–(4.49). Da wir den Parameter A ∈ R beliebig wählen können, ist die Lösung des Strömungsproblems nicht eindeutig bestimmt. Übrigens entspricht die Abbildung φA (r, α) = −Aα einem Rotationsfeld µ ¶ A x2 uA (r, α) := ∇φA (r, α) = 2 r −x1 (siehe (4.43) für ∇φA in Polarkoordinaten). Die Funktion ∇ψA = (x1 , x2 )> steht senkrecht auf der Geschwindigkeit uA , und es gilt ψA (x1 , x2 ) = (x21 + x22 )/2. Die Stromlinien von uA sind also konzentrische Kreise um den Ursprung (Abbildung 4.12). x 2 v v v x 1 Abbildung 4.12: Stromlinien zu uA (x1 , x2 ) = −A/(x21 + x22 ) · (x2 , −x1 )> . Übungsaufgabe: Das komplexe Geschwindigkeitspotential zu (4.50) lautet ¶ µ z R2 . F (z) = Ai ln + u∞ z + R z Zeichnen Sie die Stromlinien für 0 < A < 2Ru∞ und A > 2Ru∞ (u∞ > 0). Ein Kreiszylinder ist keine sehr effektive Tragfläche. Ein verhältnismäßig realistischer Tragflügelquerschnitt wird durch die sogenannte Joukowski-Transformation J(z) := z + c2 , z z ∈ ∂BR (z0 ) = {|z − z0 | = R}, mit c = z0 + Re−iβ dargestellt (Abbildung 4.13). Das komplexe Geschwindigkeitspotential des Kreises um z0 ist durch ¶ µ z − z0 R2 + u∞ z − z 0 + F (z) = Ai ln R z − z0 121 gegeben. Aus den Stromlinien ψ(z) = ImF (z) = const. für den Kreiszylinder können wir die entsprechenden Stromlinien um das Joukowski-Profil konstruieren. In der Tat: Da J eine konforme (d.h. winkeltreue) Abbildung ist, löst der Realteil des komplexen Geschwindigkeitspotentials x2 8 u γ z 0 β R 1 c x 1 0.5 0 −1.5 −1 −0.5 0 0.5 1 1.5 Abbildung 4.13: Der Kreis um z0 mit Radius R (links) wird durch die JoukowskiTransformation auf das Joukowski-Profil (rechts) abgebildet. Für die rechte Abbildung haben wir R = 1, β = π/10 und c = 3/4 gewählt. Der Punkt c wird auf die Hinterkante 2c abgebildet. G(w) := F (J −1 (w)), w ∈ J(R2 \BR (z0 )), das Strömungsproblem. Sei nämlich φJ (w) := ReG(w). Dann ist ∆φJ = 0 (denn G(w) ist analytisch), µ ¶ ReF 0 (J −1 (w)) ∇φ(z) u∞ ∇φJ (w) = = 0 → (|w| → ∞), 0 −1 J (J (w)) J (z) 0 wobei φ = ReF durch (4.50) gegeben ist, w = J(z) und J 0 (z) = 1 − c2 /z 2 → 1 (|z| → ∞), sowie ∇φ(z) · ν = 0, w ∈ J(∂BR (z0 )). ∇φJ (w) · ν = J 0 (z) Die Stromlinien sind durch die Gleichung ψJ (w) = ImG(w) = const. gegeben. Die Strömung um einen Tragflügel kann realistischer modelliert werden, wenn die Tragfläche durch eine um den Winkel γ gedrehte Strömung umflossen wird (Abbildung 4.13). 122 In diesem Fall lautet das komplexe Geschwindigkeitspotential ¶ µ z − z0 R2 eiγ −iγ . F (z) = Ai ln + u∞ (z − z0 )e + R z − z0 Diese Lösung hat zwei Nachteile: Da A ∈ R beliebig, ist F nicht eindeutig gegeben. Die Geschwindigkeit ∇φJ (w) = ∇φ(z) ∇φ(z) = , 0 J (z) 1 − c2 /z 2 w = J(z), ist singulär an den Punkten z = ±c bzw. w = ±2c. Dies bedeutet, daß die Geschwindigkeit an der Hinterkante 2c nicht definiert ist. Beide Nachteile können auf einen Schlag beseitigt werden, wenn wir fordern, daß an der Hinterkante ein Staupunkt ist, d.h., daß an der Hinterkante die Geschwindigkeit verschwindet. Dies ist eine rein heuristische Forderung, die erfüllt ist, wenn F 0 (c) = 0. Damit kann der Parameter A festgelegt werden. Es folgt wegen c − z0 = Re−iβ : ¶ µ ¡ −iγ ¢ Ai Ai iβ R2 eiγ 0 i(γ+2β) −iγ 0 = F (c) = + u∞ e − e + u e − e = ∞ c − z0 (c − z0 )2 R und folglich ¢ ¡ A = iRu∞ e−i(γ+β) − ei(γ+β) = 2Ru∞ sin(β + γ). Die Strömung um den Joukowski-Tragflügel haben wir damit bestimmt. 4.6 Hele-Shaw-Strömung Erdöl kann dadurch aus einem porösen Boden extrahiert werden, daß Wasser in den Boden gepumpt wird und das Erdöl durch spezielle Röhren nach oben drückt. Wegen der verschiedenen Zähigkeit (bzw. Viskosität) von Erdöl und Wasser können sich “Finger” ausbilden, die den Ertrag verringern (Abbildung 4.14). In diesem Abschnitt wollen wir eine Gleichung für die zeitliche Evolution des Randes ∂Ω(t) zwischen zwei verschieden viskosen Flüssigkeiten herleiten. Vereinfachend nehmen wir an, daß sich die Flüssigkeit zwischen zwei parallelen unendlich ausgedehnten Platten im Abstand 2h > 0 bewegt und dabei Luft verdrängt (Abbildung 4.15). Man nennt die Bewegung eine Hele-ShawStrömung. Die Bewegung der Flüssigkeit ist durch die Navier-Stokes-Gleichungen ∂t n + div(nu) = 0, ∂t (nu) + div(nu ⊗ u) + ∇p = ∇((λ + µ)divu) + µ∆u für die Teilchendichte n = n(x, t) und Geschwindigkeit u = u(x, t) gegeben. Wir machen die folgenden Annahmen: 123 ο) Ω (t) Erdöl Wasser Ω (t) Abbildung 4.14: Die Verdrängung von Erdöl durch Wasser führt zur Bildung von “Fingern”. z h −h x y Abbildung 4.15: Geometrie zweier paralleler Platten. Die Flüssigkeit sei homogen (n = n0 = const.) und stationär (∂t u = 0). Der halbe Plattenabstand h sei so klein, daß es keine Strömung in z-Richtung gibt, d.h. u = (u1 , u2 , 0)> . Die Ableitungen von u nach x1 und x2 seien vernachlässigbar verglichen mit den Ableitungen von u nach x3 . An den Platten ruhe die Flüssigkeit: u = 0 auf x3 = ±h. Die erste Voraussetzung impliziert divu = 0, n0 div(u ⊗ u) + ∇p = µ∆u. Wegen divu = 0 gilt div(u ⊗ u)i = X ∂ X ∂ (uj ui ) = uj ui = (u · ∇)ui , ∂xj ∂xj j j 124 so daß wir die zweite Gleichung auch schreiben können als n0 (u · ∇)u + ∇p = µ∆u. (4.51) Aus der zweiten und dritten Voraussetzung folgt (u · ∇)u = u1 Damit wird (4.51) zu ∂u ∂u + u2 ≈ 0, ∂x1 ∂x2 ∂ 2 u1 /∂x23 ∆u ≈ ∂ 2 u2 /∂x23 . 0 u 1 ∂2 ∇p = µ 2 u2 . ∂x3 0 Insbesondere ist ∂p/∂x3 = 0, d.h., der Druck ist eine Funktion nur von x1 und x2 . Integrieren wir ∂ 2 u1 ∂p =µ 2 ∂x1 ∂x3 bezüglich x3 , so erhalten wir, da ∂p/∂x1 konstant bezüglich x3 ist, u1 (x1 , x2 , x3 ) = A(x1 , x2 ) + B(x1 , x2 )x3 + x23 ∂p 2µ ∂x1 − h ≤ x3 ≤ h. Die Integrationskonstanten können aus der Randbedingung u = 0 für x3 = ±h (vierte Voraussetzung) bestimmt werden: A = −(h2 /2µ)∂p/∂x1 und B = 0. Damit folgt u1 (x1 , x2 , x3 ) = − h2 − x23 ∂p (x1 , x2 ). 2µ ∂x1 Analog ist h2 − x23 ∂p (x1 , x2 ). 2µ ∂x2 Wir mitteln über x3 ∈ (−h, h), um einen Geschwindigkeitsvektor zu erhalten, der nur noch von x1 und x2 abhängt: Z Z h 1 h2 ∂p 1 ∂p h 2 v1 := , (h − x23 ) dx3 = − u1 dx3 = − 2h −h 4µh ∂x1 −h 3µ ∂x1 u2 (x1 , x2 , x3 ) = − und analog v2 = −(h2 /3µ)∂p/∂x2 . Definieren wir v = (v1 , v2 )> , so erhalten wir die Strömungsgleichungen h2 v = − ∇p, divv = 0. 3µ Insbesondere erfüllt p die Laplace-Gleichung ∆p = 0 in der Flüssigkeit. Wir können die Variablen so umskalieren, daß v = −∇p, ∆p = 0 125 in Ω(t) (4.52) gilt, wobei Ω(t) ⊂ R2 die zweidimensionale Projektion des Flüssigkeitsgebietes sei. Wir wollen eine Gleichung herleiten, die die zeitliche Entwicklung der Grenzkurve ∂Ω(t) beschreibt. Dazu nehmen wir an, daß der Druck konstant auf ∂Ω(t) ist. Diese Voraussetzung ist näherungsweise erfüllt, wenn die Krümmung des Randes ∂Ω(t) nicht zu groß ist. Anderenfalls gilt p = γκ auf ∂Ω(t), wobei κ die Krümmung von ∂Ω(t) und γ den Koeffizient der Oberflächenspannung bezeichne. Durch Wahl eines Referenzpunktes für den Druck können wir also p=0 auf ∂Ω(t) (4.53) voraussetzen. Entlang der Trajektorien (x(t), y(t))> mit (x, y)0 = v gilt dann 0= d ∂p p(x(t), y(t), t) = ∇p · (x0 (t), y 0 (t))> + = pt + v · ∇p dt ∂t auf ∂Ω(t). Aus (4.52) folgt pt − |∇p|2 = 0 auf ∂Ω(t). (4.54) Wir nehmen nun an, daß sich in Ω(t) eine Quelle bzw. Senke befindet: p(x, y) ∼ − Q ln(x2 + y 2 )1/2 2π für (x, y) → (0, 0). (4.55) Hierbei gelte ohne Einschränkung (0, 0) ∈ Ω(t)0 . Die Notation bedeutet, daß im Grenzwert (x, y) → (0, 0) der Quotient p/(−Q/2π) ln(x2 + y 2 )1/2 gegen Eins konvergiert. Das Randwertproblem (4.52) und (4.53) (oder (4.54)) zusammen mit der Bedingung (4.55) ist ein freies Randwertproblem, da wir neben dem Druck noch den freien Rand ∂Ω(t) bestimmen müssen. Wir bestimmen den Rand, indem wir ihn auf den Rand des Einheitskreises transformieren. Dazu setzen wir z = x + iy und transformieren Ω(t) auf den Einheitskreis {ζ ∈ C : |ζ| < 1}. Ist Ω(t) endlich und einfach zusammenhängend, so existiert nach dem Abbildungssatz von Riemann eine Funktion f mit den folgenden Eigenschaften: f (·, t) : {|ζ| ≤ 1} → Ω(t), z = f (ζ, t), und f ({|ζ| = 1}) = ∂Ω(t), ζ 7→ ζf (ζ, t) ist analytisch und (für ζ = 0) reell und positiv. Außerdem gilt ∂f /∂ζ 6= 0. Welcher Differentialgleichung genügt f ? Dazu müssen wir den Druck auf die ζ-Ebene transformieren. Sei w(z) = p(x, y) + iψ(x, y) der komplexe Druck. Dann gilt w(f (ζ, t)) = − Q ln ζ, 2π denn ∆p = Re∆w = 0 in {|ζ| < 1}, p=− 126 Q ln |ζ| = 0 auf {|ζ| = 1} 2π (4.56) und Q ln |ζ| für ζ → 0. 2π Es bleibt die Gleichung (4.54) zu transformieren. Es gilt auf |ζ| = 1 wegen (4.54): ¯2 · ¸ ¯ ¯ dw ¯ ∂w Re (f (ζ, t)) = ¯¯ (f (ζ, t))¯¯ . (4.57) ∂t dz p∼− Aus (4.56) folgt einerseits ∂w Q 1 =− ∂ζ 2π ζ und andererseits dw ∂f ∂w = , ∂ζ dz ∂ζ also Q dw =− dz 2π µ ∂f ζ ∂ζ ¶−1 . Damit ergibt sich aus (4.57) " Q −Re 2π µ ∂f ζ ∂ζ ¶−1 ∂f ∂t # · dw ∂f = Re dz ∂t oder ¸ ¸ ¯¯ µ ¶−1 ¯¯2 ∂f Q ∂w ¯ ¯ = Re =¯ ζ ¯ ¯ 2π ¯ ∂t ∂ζ · "¯ # ¯ µ ¶−1 · ¸ · ¸ ¯ ∂f ¯2 Q ∂f ∂f ∂f ∂f ∂f ∂f ¯ ¯ − = Re ¯ζ ¯ ζ = Re ζ = Re ζ , 2π ∂ζ ∂ζ ∂t ∂ζ ∂t ∂ζ ∂t |ζ| = 1. (4.58) Jede injektive Funktion f , die die obigen Eigenschaften und (4.58) erfüllt, liefert eine Lösung der Hele-Shaw-Strömung. Als Beispiel wollen wir untersuchen, welche Hele-Shaw-Strömungen Funktionen der Form n X ak (t)ζ k , ak (t) reell, f (ζ, t) = k=−1 ergeben. Setzen wir diese Definition in (4.58) ein, sortieren nach Potenzen von ζ k und identifizieren die Koeffizienten der ζ k -Terme, erhalten wir n X k=−1 kak a0k = − Q 2π (4.59) für den ζ 0 -Term und für die restlichen Terme: n−j X (kak a0k+j + (k + j)ak+j a0k ) = 0, k=−1 127 j = 1, . . . , n + 1. (4.60) Dies sind gewöhnliche Differentialgleichungen für a−1 , . . . , an mit den Anfangswerten j = −1, . . . , n, aj (0) = αj , (4.61) die sich aus der Transformation f (ζ, 0) = n X αk ζ k k=−1 des gegebenen Gebietes Ω(0) ergeben. Wir behaupten nun: Die Lösung von (4.60)–(4.61) kann nicht für alle t ≥ 0 existieren, wenn n ≥ 2 und Q > 0. Um dies einzusehen, schreiben wir (4.60) für j = n + 1: −a−1 a0n + nan a0−1 = 0. Dies ist äquivalent zu n a0−1 a0n − =0 a−1 an d an ln n = 0. dt a−1 und Integration ergibt an (t) = αn µ a−1 (t) α−1 ¶n . (4.62) Die Gleichung (4.59) ist äquivalent zu à n ! d X 2 Q kak = − , dt k=−1 π was nach Integration n X k=−1 k(a2k (t) − αk2 ) = − Qt π liefert. Wir formulieren diese Gleichung um: n a2−1 (t) = 2 α−1 Qt X k(a2k (t) − αk2 ) → ∞ + + π k=1 für t → ∞, da Q > 0. Andererseits folgt aus dieser Gleichung und (4.62) n−1 a2−1 (t) = ≥ oder X Qt −2n 2n 2 + nαn2 α−1 a−1 (t) + k(a2k (t) − αk2 ) + α−1 − nαn2 π k=1 −2n 2n nαn2 α−1 a−1 (t) − n X kαk2 k=1 n h i X −2n 2(n−1) kαk2 > −∞. a−1 (t) ≥ a2−1 (t) 1 − nαn2 α−1 k=1 128 (4.63) Die linke Seite konvergiert jedoch für t → ∞ wegen (4.63) gegen −∞; Widerspruch. Folglich kann die Lösung von (4.60)–(4.61) nur in einem endlichen Zeitintervall existieren. Physikalisch erwarten wir natürlich zeitlich globale Lösungen. Was ist passiert? Dazu betrachten wir die spezielle Funktion f (ζ, t) = a1 (t)ζ + a2 (t)ζ 2 , |ζ| ≤ 1. Die Gleichungen (4.59) und (4.60) ergeben Q d 2 (a1 + 2a22 ) = − , dt π 1 d 2 (a a2 ) = a1 a02 + 2a2 a01 = 0, a1 dt 1 also Qt + (α12 + 2α22 ), π a21 (t)a2 (t) = α12 α2 . a21 (t) + 2a22 (t) = − (4.64) (4.65) Seien α1 , α2 > 0 so, daß t∗ = − Dann folgt aus (4.64)–(4.65) a21 (t∗ ) + 2a22 (t∗ ) = − ¢ π ¡ 2 2/3 3(α1 α2 ) − (α12 + 2α22 ) > 0. Q Qt∗ + α12 + 2α22 = 3(α12 α2 )2/3 = 3(a21 (t∗ )a2 (t∗ ))2/3 . π Diese Gleichung besitzt die Lösung a2 (t∗ ) = a1 (t∗ ). Dies impliziert jedoch ∂f (ζ, t∗ ) = a1 (t∗ ) + 2a2 (t∗ )ζ = a1 (t∗ ) − a2 (t∗ ) = 0 ∂ζ für ζ = −1/2, d.h., f (ζ, t∗ ) ist nicht mehr injektiv, und die Transformation ist nicht mehr zulässig. Dies ist ein mathematisches Argument. Was ist der physikalische Grund? Zeichnet man den Rand z ∈ ∂Ω(t), d.h. z = f (ζ, t) = a1 (t)ζ + a2 (t)ζ 2 , |ζ| = 1, so ergibt sich bei t = t∗ eine Singularität (Abbildung 4.16). Die Singularität bedeutet, daß die Krümmung des Randes unendlich wird. Nun ist bei der Herleitung vorausgesetzt worden, daß die Krümmung nicht zu groß werden darf. Diese Voraussetzung ist also verletzt. In realen Flüssigkeiten verhindert die Oberflächenspannung derartige Singularitäten. Da wir die Oberflächenspannung vernachlässigt haben, ist das Auftreten von Singularitäten nicht erstaunlich. Freilich gibt es andere Funktionen f , bei denen keine Singularitäten auftreten (siehe die Literatur in [6]). 129 2 1.5 Imaginärteil 1 0.5 0 −0.5 −1 −1.5 −2 −1.5 −1 −0.5 0 0.5 Realteil 1 1.5 2 Abbildung 4.16: Darstellung der Kurven {f (ζ, t) : |ζ| = 1} für t = 0, 0.8, 1.6, 1.942 mit den Parameterwerten α1 = α2 = 1 und Q = −1. 5 5.1 Diffusion Diffusionsgleichung In diesem Abschnitt wollen wir eine Gleichung herleiten, die die Diffusion von Teilchen oder allgemein von physikalischen Größen beschreibt. Wir beginnen mit einem Teilchen, das sich zur Zeit t = 0 an der Stelle x = 0 befindet und das sich in einer Zeitspanne 4t aufgrund von Kollisionen mit gleicher Wahrscheinlichkeit nach links oder rechts um eine Weglänge 4x bewegt. Mit welcher Wahrscheinlichkeit befindet sich das Teilchen zur Zeit tk = k · 4t (k ∈ N) an der Stelle xn = n · 4x (n ∈ Z)? Sei Xk des Ort des Teilchens zur Zeit tk , d.h. Xk ∈ 4x · Z = {0, ±4x, ±24x, . . .}, und sei u(xn , tk ) = P (Xk = xn ) die Wahrscheinlichkeit, daß sich das Teilchen zur Zeit tk in xn befindet. Die Wahrscheinlichkeit kann rekursiv berechnet werden (Abbildung 5.1): 1 1 u(xn , tk+1 ) = u(xn−1 , tk ) + u(xn+1 , tk ), 2 2 (5.1) wenn n und k entweder beide gerade oder beide ungerade sind, und u(xn , tk+1 ) = 0 sonst. Die Anfangsbedingung lautet ( 1 : n = 0, u(xn , 0) = (5.2) 0 : n 6= 0. Übungsaufgabe: Berechnen Sie u(xn , tk ) als Lösung der Rekursionsgleichungen (5.1)– (5.2). 130 ∆ x 1 k=0 1/2 1/2 k=1 1/4 1/4 2/4 k=2 1/8 k=3 x −3 3/8 x −2 x 3/8 x −1 0 x 1 1/8 x 2 x 3 Abbildung 5.1: Stochastische Irrfahrt. Die Zahlen geben die Wahrscheinichkeiten an, daß sich das Teilchen zur Zeit tk an der entsprechenden Stelle befindet. Was geschieht, wenn sowohl 4x als auch 4t gegen Null gehen? Wir nehmen an, daß diese Konvergenz so ist, daß (4x)2 σ := 24t konstant bleibt. Dann folgt aus (5.1) ´ ´ σ ³ 1 ³ u(xn , tk+1 ) − u(xn , tk ) u(xn−1 , tk ) − 2u(xn , tk ) + u(xn+1 , tk ) − (4x)2 4t ¶³ µ ´ 1 σ u(xn−1 , tk ) + u(xn+1 , tk ) − 2u(xn , tn ) − = (4x)2 24t = 0. Im Grenzwert 4x → 0 bzw. 4t → 0 folgt aus dieser Differenzengleichung die partielle Differentialgleichung σuxx − ut = 0, x ∈ R, t > 0, (5.3) die wir Diffusionsgleichung nennen. Der Parameter σ > 0 ist der Diffusionskoeffizient. Übrigens gibt es einen Zusammenhang zwischen der Lösung von (5.3) und der stochastischen Irrfahrt, die durch Xk beschrieben wird. Wir können Xk formulieren als Xk = k X Zj , j=1 wobei Zj sogenannte (unabhängige) Zufallsvariablen sind, die mit Wahrscheinlichkeit 1/2 den Wert −4x und mit Wahrscheinlichkeit 1/2 den Wert +4x annehmen, d.h., Zj ist eine (Zufalls-)Funktion mit Werten in {−4x, 4x}. Wir definieren den Erwartungswert und die Varianz von Zj durch E(Zj ) := −4x · P (Zj = −4x) + 4x · P (Zj = 4x), Var(Zj ) := E(Zj2 ) − E(Zj )2 . 131 Aus E(Zj ) = −4x · 1 2 + 4x · 1 2 = 0 folgt Var(Zj ) = E(Zj2 ) = (−4x)2 P (Zj = −4x) + (4x)2 P (Zj = 4x) = (4x)2 und daher E(Xk ) = k X E(Zj ) = 0, j=1 Var(Xk ) = E(Xk2 ) = k X j=1 E(Zj2 ) = k(4x)2 = k · 2σ4t = 2σtk . Im Grenzwert 4t → 0 (bzw. k → ∞, wenn wir t = tk fest wählen) konvergiert Xk gegen eine Funktion X mit den Eigenschaften E(X) = 0, Var(X) = 2σt. Der Grenzwert X wird Brownsche Bewegung genannt. Man kann außerdem zeigen, daß nach dem zentralen Grenzwertsatz µ ¶ Z x y2 1 √ exp − dy lim P (Xk ≤ x) = k→∞ 4σt 4πσt −∞ gilt, wobei t = tk fest gewählt sei. Andererseits erfüllt auch die Brownsche Bewegung diese Beziehung: ¶ µ Z x 1 y2 . (5.4) P (X ≤ x) = u(y, t) dy mit u(y, t) = √ exp − 4σt 4πσt −∞ Die Funktion u ist eine spezielle Lösung von (5.3): µ ¶· µ 2 ¶¸ −1 x 1 x2 x2 σ 1 √ +√ ut − σuxx = exp − −√ − 4σt 2 4πσ t3/2 4πσ 4σt3/2 4πσt 4σ 2 t2 2σt = 0. Beginnt die Diffusion mit einer endlichen Zahl von Teilchen, die über die reelle Zahlenachse verteilt sind, müssen wir (5.3) mit der Anfangsbedingung u(x, 0) = u0 (x), x ∈ R, (5.5) lösen. Durch Überlagerung der einzelnen Bewegungen, beschrieben durch (5.4), erhalten wir die Lösung µ ¶ Z 1 (x − y)2 u(x, t) = √ u0 (y)exp − dy 4σt 4σπt R von (5.3) und (5.5). Welchem Anfangswert entspricht die Lösung (5.4)? Offensichtlich gilt ( Z 0 : x 6= 0 lim u(x, t) = lim u(y, t) dy = 1. (5.6) t→0 t→0 R ∞ : x = 0, 132 Es gibt keine Funktion u0 (x) := lim u(x, t), t→0 die die Eigenschaften (5.6) erfüllt. Wir nennen u0 daher eine Distribution; das ist ein Funktional, definiert durch u0 [φ] = φ(0) für alle φ ∈ C0∞ (R), wobei C0∞ (R) der Raum aller C ∞ -Funktionen mit kompaktem Träger sei. Diese Definition ergibt sich formal aus Z Z u0 [φ] = u0 (x)φ(x) dx = lim u(x, t)φ(x) dx R t→0 µ R ¶ 1 x2 = lim √ exp − φ(x) dx t→0 4σt 4πσt R Z √ 1 2 e−y /2 φ( 2σt y) dy = lim √ t→0 2π R Z 1 2 = φ(0) √ e−y /2 dy 2π R Z = φ(0). Die Diffusionsgleichung (5.3) tritt auch bei Temperaturprozessen auf. Sei θ(x, t) die Temperatur eines Körpers zur Zeit t an der Stelle x ∈ R3 . Die zeitliche Änderung der Temperatur ist proportional zur Divergenz des Wärmestromes J: n0 cθt + divJ = 0, wobei n0 die Dichte des Körpers und c seine spezifische Wärme seien (siehe unten). Nach dem Fourier-Gesetz ist der Wärmestrom proportional zum Temperaturgradienten J = −λ∇θ, wobei λ > 0 die Wärmeleitfähigkeit genannt wird. Ist λ konstant, so folgt die Wärmeleitungsgleichung λ θt − 4θ = 0. n0 c Die Gleichung folgt auch aus der Energiebilanz (4.34) der Navier-Stokes-Gleichungen im Falle verschwindender Geschwindigkeit: ´ ³3 ∂t n0 θ = div(K∇θ). 2 Die spezifische Wärme ist hier c = 3/2, was drei Freiheitsgeraden entspricht (also einem Gas aus einzelnen Atomen). Wir betrachten folgendes Anwendungsbeispiel. 133 Beispiel 5.1 Wie lang sollte der metallene, nicht isolierte Griff einer Eisenpfanne sein, damit man sich nicht die Hände verbrennt? Wir modellieren den Griff durch das Intervall [0, L]. Sei θ(x, t) die Temperatur des Griffes. Wir nehmen an, daß der Griff zur Zeit t = 0 Raumtemperatur hat. An der Stelle x = 0 sei der Griff in Kontakt mit der Pfanne, die eine Maximaltemperatur von 200◦ C habe: θ(0, t) = 200◦ C. Wie lautet die Randbedingung am Ende des Griffes (x = L)? Es ist sicherlich unrealistisch anzunehmen, daß der Griff gegenüber der Umgebung völlig isoliert ist, da ein kleiner Wärmestrom stattfindet: J(L, t) = −λθx (L, t) = 0. Andererseits ist es unrealistisch anzunehmen, daß der Wärmefluß in die Umgebung so rasch ist, daß das Ende des Griffes Raumtemperatur aufweist: θ(L, t) = 20◦ C. Wir kombinieren stattdessen diese beiden Randbedingungen: −θx (L, t) = α(θ(L, t) − 20◦ C). Liegt die Temperatur über der Raumtemperatur, gibt es einen Wärmestrom in die Umgebung, anderenfalls erwärmt sich der Griff. Die Konstante α > 0 kann nur empirisch bestimmt werden. Wir nehmen an, daß α = 0.3/cm gilt. Die Temperatur erfülle die eindimensionale Wärmeleitungsgleichung θt − λ θxx = 0, n0 c x ∈ (0, L), t > 0. Für genügend große Zeiten erwarten wir, daß sich die Temperatur auf einen stationären Zustand einpendelt. Verschwinden die zeitlichen Änderungen (θt = 0), löst die stationäre Temperaturverteilung das Randwertproblem θxx = 0, ◦ θ(0) = 200 C, x ∈ (0, L), −θx (L) = α(θ(L, t) − 20◦ C). Die allgemeine Lösung lautet θ(x) = ax + b. Die Konstanten a und b können wir aus den Randbedingungen bestimmen; dies ergibt die Lösung θ(x) = −180◦ αx + 200◦ C. αL + 1 Soll die Temperatur am Griffende 40◦ C nicht überschreiten, ergibt sich die Grifflänge aus 40◦ C ≥ θ(L) = −180◦ C 134 αL + 200◦ C αL + 1 oder 80 8 = cm ≈ 27cm. α 3 Der Pfannengriff sollte also mindestens 27 cm lang sein. L≥ 5.2 Ein globales Klimamodell Nach einer Studie des “Intergovernmental Panel on Climate Change” der Vereinten Nationen aus dem Jahr 2001 könnte sich die Erde in diesem Jahrhundert um bis zu 5.8◦ C erwärmen. In diesem Abschnitt wollen wir die Konsequenzen der globalen Erwärmung auf die Ausbreitung der Eisflächen untersuchen, indem wir die Temperatur durch ein sehr einfaches Modell beschreiben. Sei θ(x, t) die Temperatur des Luft in Meereshöhen an der Stelle x auf der Erdoberfläche M zur Zeit t. Wir nehmen an, daß die zeitliche Wärmeänderung gegeben ist durch Diffusion + absorbierte Energie − emittierte Energie bzw. θt = D + Rab − Rem . Wir nehmen außerdem an: Die Diffusion wird durch das Fouriergesetz beschrieben: D = div(λ0 ∇θ), wobei λ0 > 0. Die Erde sei vollständig mit Wasser bedeckt. Dann ist die absorbierte Energie gegeben durch ( %ε : θ ≤ 0◦ C, Rab (θ) = % : θ > 0◦ C, wobei % die Solarkonstante sei und ε ∈ (0, 1). Dahinter steckt die Überlegung, daß eine Eisfläche weniger Energie als eine Wasserfläche absorbiert. Die emittierte Energie kann durch das Stefan-Boltzmann-Gesetz Rem = σ(θ − θ)4 mit σ > 0, θ > 0 beschrieben werden. Wir vernachlässigen diese Größe und setzen σ = 0. Damit erhalten wir θt − div(λ0 ∇θ) = Rab (θ), x ∈ M, t > 0, mit Anfangsbedingung θ(x, 0) = θ0 (x), 135 x ∈ M. (5.7) Da die Erdoberfläche M keinen Rand hat, sind keine Randbedingungen notwendig. Das obige Problem ist verhältnismäßig komplex, da M eine Mannigfaltigkeit ist. Die Differentialopertoren div und ∇ sind dementsprechend in den Koordinaten von M zu formulieren. Wir betrachten eine vereinfachte Situation, die es erlaubt, das Problem explizit zu lösen: Wegen der Rotationssymmetrie der Erdkugel betrachten wir die Gleichung (5.7) auf einem Längengrad, dargestellt durch das Intervall [−1, 1], wobei x = −1 den Südpol und x = 1 den Nordpol modelliere. Wir sind nur an stationären Zuständen interessiert, so daß θt = 0. Die Temperatur an den Polen sei −10◦ C. Die Wärmeleitfähigkeit λ0 sei konstant. Wir lösen also (5.1) auf dem Intervall (−1, 1): −λ0 θxx = Ra,b (θ), x ∈ (−1, 1), (5.8) θ(−1) = θ(1) = −10◦ C. Streng genommen ist dies nicht richtig, da der Operator div(λ0 ∇θ) = λ0 4θ entlang eines Längengrades nicht gleich λ0 θxx ist; wir modellieren die Erwärmung dennoch mit der Gleichung (5.8). Mit θ % u := ◦ + 1 und λ := 10 C λ0 folgt u00 + λg(u) = 0, x ∈ (−1, 1), u(−1) = u(1) = 0, (5.9) wobei g(u) = ( ε : u ≤ 1 (Eis), 1 : u > 1 (Wasser). Wir erwarten, daß physikalisch sinnvolle Lösungen von (5.9) um den Äquator x = 0 symmetrisch sind, und suchen nur solche Lösungen. Da g(u) unstetig ist, können wir keine klassischen, zweimal stetig differenzierbaren Lösungen erwarten. Die Lösungen können allenfalls einmal stetig differenzierbar sein. Um (5.9) auf x ∈ (0, 1) lösen zu können, benötigen wir eine Randbedingung an x = 0. Wir behaupten, daß u0 (0) = 0 gilt. Aus der Symmetrie von u um x = 0 und der formalen Taylor-Entwicklung folgt u(x) = u(0) + u0 (0)x + O(x2 ), u(x) = u(−x) = u(0) − u0 (0) + O(x2 ) 136 (x → 0), also nach Subtraktion 1 O(x2 ) = O(x). x Mit x → 0 ergibt sich dann u0 (0) = 0. Damit haben wir das zu lösende Problem reduziert auf u00 + λg(u) = 0, x ∈ (0, 1), u0 (0) = 0, u(1) = 0. (5.10) u0 (0) = Es gilt übrigens 0 u (x) = −λ und daher (Abbildung 5.2) Z x g(u(s)) ds < 0 für alle x > 0 0 u(0) = max u(x). (5.11) x∈[0,1] Wir unterscheiden also folgende Fälle. x −1 0 1 Abbildung 5.2: Qualitatives Verhalten der Lösung von (5.9). Fall 1: u(0) ≤ 1. Wegen (5.11) bedeutet dies, daß die gesamte Erde eisbedeckt ist. Insbesondere ist u(x) ≤ 1 für alle x ∈ [0, 1] und daher g(u) = ε. Das Problem (5.10) wird zu u00 + λε = 0, x ∈ (0, 1), u0 (0) = u(1) = 0. Die allgemeine Lösung lautet u(x) = − λε 2 x + ax + b, 2 und aus den Randbedingungen folgt a = 0 und b = λε/2, so daß u(x) = λε (1 − x2 ), 2 x ∈ [0, 1]. Damit u(0) ≤ 1 erfüllt ist, muß der Parameter λ die Bedingung λ≤ 2 ε erfüllen. 137 (5.12) Fall 2: u(0) > 1. Die Erde ist also teilweise eisbedeckt. Da u monoton fallend in (0, 1) ist, existiert eine eindeutig bestimmte Zahl r ∈ (0, 1), so daß u(r) = 1. Der Parameter r beschreibt die Grenze zwischen Wasser und Eis. Wir lösen das Problem ( −λ : x ∈ (0, r), u00 = u0 (0) = u(1) = 0. (5.13) −λε : x ∈ (r, 1), Der Wert r ist unbekannt; wir suchen also sowohl u als auch r. Man nennt daher r einen freien Rand und das Problem (5.13) (oder (5.11)) ein freies Randwertproblem. Die allgemeine Lösung von (5.13) lautet ( − λ2 x2 + ax + b : x ∈ (0, r), u00 = (5.14) − λε x2 + cx + d : x ∈ (r, 1). 2 Um die vier Konstanten a, b, c und d zu bestimmen, genügen die beiden Randbedingungen in (5.13) nicht. Wir fordern, daß u(x) an der Stelle x = r stetig differenzierbar ist. Dies liefert zwei weitere Gleichungen: u0 (r−) = u0 (r+). u(r−) = u(r+), Insgesamt erhalten wir die vier Gleichungen 0 = u0 (0) = a, λε 0 = u(1) = − + c + d, 2 λ 2 λε u(r) = − r + b = − r2 + cr + d, 2 2 u0 (r) = −λr = −λεr + c. (5.15) (5.16) (5.17) (5.18) Aus (5.15)–(5.18) folgt a = 0, c = −λ(1 − ε)r. Die Gleichung (5.16) impliziert d= λε λε −c= + λ(1 − ε)r. 2 2 Schließlich ergibt sich aus (5.17) b= λ λ λε (1 − ε)r 2 + cr + d = − (1 − ε)r 2 + + λ(1 − ε)r. 2 2 2 Zur Bestimmung des freien Randes benötigen wir eine weitere Gleichung: u(r) = 1. 138 (5.19) Da wegen (5.17) b = u(r) + λr 2 /2 = 1 + λr 2 /2 gilt, erhalten wir aus (5.19) λ λ λε 1 + r2 = − (1 − ε)r 2 + + λ(1 − ε)r 2 2 2 und nach einigen Umformungen r2 − 2 − λε 2(1 − ε) r+ = 0. 2−ε λ(2 − ε) (5.20) Dies ergibt zwei Werte r1,2 1−ε ± = 2−ε sµ 1−ε 2−ε r ¶2 − 2 − λε λ(2 − ε) 1 1−ε ± 2−ε 2−ε 1 (1 − ε)2 − (2 − λε)(2 − ε) λ r 1 2(2 − ε) 1−ε 1− ± . = 2−ε 2−ε λ = (5.21) Die quadratische Gleichung (5.20) ist nur dann reell lösbar, wenn λ ≥ 2(2 − ε). Außerdem gilt r2 ≥ 0 genau dann, wenn r 2(2 − ε) 2(2 − ε) ⇐⇒ 1 − ≤ (1 − ε)2 0 ≤ 1−ε− 1− λ λ ⇐⇒ λ ≤ 2 . ε Die Forderung r1 ≤ 1 wird für alle λ > 0 erfüllt. Damit haben wir zwei kritische Parameterwerte gefunden: 2 λ1 = 2(2 − ε), λ2 = . ε Wir unterscheiden nun drei Fälle: Fall A: λ < λ1 . Wegen λ1 < λ2 (weil ε < 1) existiert genau eine Lösung, nämlich (5.12). Insbesondere ist λ2 ε λε < = 1. u(0) = 2 2 Dies entspricht dem Fall 1; die Erde ist vollständig mit Eis bedeckt. Fall B: λ1 < λ < λ2 . Es existiert eine Lösung mit u(0) < 1 (nämlich gerade (5.12)) und zwei Lösungen mit u(0) > 1, nämlich (5.14)) mit r = r1 und r = r2 . Am Äquator x = 0 lautet die Temperatur λ 2 u1,2 (0) = b = 1 + r1,2 , 2 und r1,2 ist gegeben durch (5.21). 139 Fall C: λ > λ2 . In diesem Fall ist r2 < 0, also existiert nur eine Lösung mit u(0) > 1, nämlich (5.14) mit r = r1 . Falls λ = λ1 , existiert eine Lösung mit u(0) < 1 (gegeben durch (5.12)) und eine Lösung mit u(0) > 1 (gegeben durch (5.14) mit r = r1 = r2 = (1 − ε)/(2 − ε)). Im Falle λ = λ2 schließlich existiert eine Lösung mit u(0) = 1 (nämlich u(x) = x2 − 1) und eine Lösung mit u(0) > 1 (nämlich (5.14) mit r = r1 , da r2 = 0). 5 3 4 u(0) 3 2 2 1 1 0 0 2 4 λ 6 8 10 Abbildung 5.3: Temperatur am Äquator u(0) in Abhängigkeit des Parameters λ (ε = 0.25). Das Problem (5.10) und damit auch (5.9) ist also nicht eindeutig lösbar. Die Multiplizität der Lösungen in Abhängigkeit des Parameters λ läßt sich gut durch den Wert u(0) illustrieren, da u(0) das Maximum von u ist (Abbildung 5.3). Wir können die in Abbildung 5.3 dargestellte Kurve in drei Gebiete unterteilen: Gebiet 1: Die Erde ist vollständig eisbedeckt. Gebiet 2: Wegen r2 < (1 − ε)/(2 − ε) < 1/2 ist die Erde in (r2 , 1) überwiegend eisbedeckt. Gebiet 3. Wegen r1 → 1 (λ → ∞) ist die Erde (zumindest für genügend großes λ > λ1 ) wenig eisbedeckt. In der Nähe der Pole liegt Eis. Physikalisch entspricht die Mehrdeutigkeit von Lösungen instabilen Situationen. Nehmen wir etwa an, daß der aktuelle Zustand der Erde dem Parameter λ & λ1 entspricht. Bei Verminderung der Solarkonstanten (oder allgemeiner der Absorptionsfähigkeit infolge von Wolken oder Smog) kann sich der Parameter λ auf einen Wert kleiner als λ1 einstellen. Dies würde bedeuten, daß die Eisgrenze innerhalb kurzer Zeit den Äquator erreichen 140 würde. Eine sehr kleine Änderung eines Parameters, der sich in der Nähe eines kritischen Wertes befindet, kann also einschneidende Auswirkungen zur Folge haben. 5.3 Selbstentzündung von Kohlehaufen Bei der Lagerung von Materialien wie Altpapier, Haushaltsmüll oder Kohle in großen Mengen kann es nach längerer Zeit zu spontaner Selbstentzündung kommen. Betroffen von diesem Problem sind etwa Mülldeponien und Kohlekraftwerke. Wir wollen uns auf Kohlehaufen konzentrieren und die folgende Fragestellung untersuchen: Frage: Nach welche Kriterien kann man entscheiden, ob ein Kohlehaufen “sicher” ist, d.h. keine spontane Selbstentzündung erfährt? Wodurch wird die spontane Selbstentzündung ausgelöst? Im allgemeinen geschieht die Aufheizung nicht nur durch direkte Sonneneinstrahlung, sondern hauptsächlich durch Oxidation von Kohlenstoff C zu Kohlenmonoxid CO oder Kohlendioxid CO2 : C + O → CO + Energie, C + 2O → CO2 + Energie. Die Reaktionen sind exotherm, d.h., es entsteht Wärmeenergie. Überschreitet diese eine vom Material abhängige Schranke, kommt es zu der Selbstentzündung. Da die dreidimensionale Geometrie eines Kohlehaufens (insbesondere die Größe und Verteilung der Kohlepartikel) und die präzisen chemischen Reaktionen sehr kompliziert sind, beschränken wir uns auf einen vertikalen, eindimensionalen Schnitt x ∈ [0, h] durch den Kohlehaufen und modellieren die Temperatur θ(x, t) durch die Wärmeleitungsgleichung mit Quellterm Q: x ∈ (0, h), %cθt = λθxx + Q(θ), t > 0. (5.22) Hierbei beschreibt x = 0 den Boden und x = h die Spitze des Haufens, % > 0 ist die homogene Dichte des Materials, c > 0 seine spezifische Wärme und λ > 0 seine Wärmeleitfähigkeit. Wir nehmen an, daß der Kohlehaufen zur Zeit t = 0 die Umgebungstemperatur hat: e θ(x, 0) = θ(x), x ∈ (0, h). (5.23) Am Boden herrsche vereinfachend keine Wärmeleitung und an der Spitze die Umgebungstemperatur. Dies führt auf die Randbedingungen θx (0, t) = 0, θ(h, t) = θ0 , t > 0. (5.24) Wir sind vornehmlich am Langzeitverhalten der Temperatur interessiert. Der Kohlehaufen ist “sicher”, wenn die Temperatur für alle Zeiten kleiner als die Zündtemperatur ist. 141 Da diese wesentlich größer als die Umgebungstemperatur ist, muß die Temperatur eines “unsicheren” Haufens in einem endlichen Zeitraum sehr groß werden. Nun erwarten wir keine Abkühlungsmechanismen, d.h., die Temperatur als Lösung von (5.22)–(5.24) wird unendlich groß nach endlicher Zeit, und das Modell (5.22)–(5.24) verliert seine Gültigkeit. In diesem Fall können keine Lösungen des stationären Modells existieren. Damit haben wir ein Kriterium für die “Sicherheit” des Kohlehaufens gefunden: Der Haufen gilt als “sicher”, wenn es Lösungen des stationären Problems λθxx = −Q(θ), x ∈ (0, h), (5.25) mit den Randbedinungen (5.24) gibt, für die θ(x) nicht wesentlich größer als θ0 ist. Andernfalls ist der Haufen als kritisch einzustufen. Es bleibt der Reaktionsterm Q zu modellieren. Wir erwarten, daß die Reaktion umso größer ist, je größer die Temperatur des Haufens ist. Das einfachste Modell ist der lineare Zusammenhang mit α > 0, θ > 0. Q(θ) = α(θ − θ) Die allgemeine Lösung von α (θ − θ)xx = θxx = − (θ − θ) λ lautet wegen α/λ > 0 θ(x) − θ = A sin µr ¶ µr ¶ α α x + B cos x . λ λ Einsetzen des Randbedingungen liefert r α A, λ µr ¶ α θ0 − θ = (θ − θ)(h) = B cos h λ 0 = θx (0) = (θ − θ)x (0) = und damit p cos( α/λx) p θ(x) = (θ0 − θ) + θ, cos( α/λh) x ∈ [0, h]. Das Problem (5.24)–(5.25) ist also immer lösbar, d.h., alle Kohlehaufen sind sicher. Dies widerspricht der Erfahrung. Der Reaktionsterm sollte also besser modelliert werden. Ein genaueres Bild ist das folgende: Für niedrige Temperaturen sind die chemischen Reaktionen vernachlässigbar; wird eine gewisse Aktivierungstemperatur erreicht, kommen die Reaktionen in Gang. Für sehr große Temperaturen ist die Stärke der Reaktionen allerdings begrenzt. Dies wird durch den Reaktionsterm von Arrhenius Q(θ) = Ae−E/Rθ 142 (5.26) beschrieben, wobei E die Aktivierungsenergie, R die universelle Gaskonstante und A die Reaktionswärme ist. Wir können das Problem (5.24)–(5.25) mit dem Reaktionsterm (5.26) analytisch lösen, wenn wir die Annahme, daß die Temperatur nahe bei der Umgebungstemperatur liegen soll, verwenden: θ(x) = θ0 (1 + εT (x)), ε ¿ 1. Mit der Taylorentwicklung µ ¶ ¡ ¢ 1 exp − = exp −1 + εT + O(ε2 ) ≈ exp(−1 + εT ) 1 + εT erhalten wir aus (5.24)–(5.26) λεθ0 Txx · ¸ E = −Aexp − (1 − εT ) , Rθ0 Tx (0) = 0, Wir definieren ψ(x) := x ∈ (0, h), T (h) = 0. Eε T (x), Rθ0 q := AE −E/Rθ0 . e λRθ02 Dann folgt aus AEε −E/Rθ0 (Eε/Rθ0 )T Eε Txx = − e e Rθ0 Rθ0 die Differentialgleichung für ψ: λεθ0 ψxx + qeψ = 0, x ∈ (0, h), ψx (0) = ψ(h) = 0. (5.27) Multiplikation von (5.27) mit ψx ergibt ¶ µ d 1 2 ψ =0 ψ + qe dx 2 x und nach Integration 1 2 ψx (x) + qeψ(x) = qeψ(0) 2 oder ψx (x) = − p p 2q eψ(0) − eψ(x) . Das Minuszeichen steht, weil ψ(x) wegen (5.28), d.h. eψ(x) ≤ eψ(0) oder ψ(x) ≤ ψ(0) für alle x ∈ [0, h], und wegen ψxx = −qeψ < 0 monoton fallend ist. Wir integrieren ein zweites Mal: Z ψ(x) Z xp dy √ 2q dy. =− eψ(0) − ey 0 h 143 (5.28) Mit der Substitution z = e−y/2 und dy = −2dz/z sowie der Abkürzung z0 := e−ψ(0)/2 folgt p 2q(x − h) = Z e−ψ(x)/2 2dz p z eψ(0) − 1/z 2 1 Z 1 z dz p 0 z 2 − z02 e−ψ(x)/2 µ ¶¸1 · z −1 = −2z0 cosh z0 e−ψ(x)/2 · µ ¶ µ −ψ(x)/2 ¶¸ 1 e −1 −1 = −2z0 cosh − cosh . z0 z0 = −2 (5.29) Diese Gleichung definiert die Lösung ψ(x) implizit für gegebenes ψ(0). Da ψ monoton fallend auf [0, h] ist, wird die maximale Temperatur an der Stelle x = 0 angenommen. Die Temperatur an x = 0 lautet wegen (5.29) und cosh−1 (1) = 0 p − 2qh = −2e−ψ(0)/2 cosh−1 (eψ(0)/2 ) oder cosh µr α q ψ(0)/2 he 2 α 1 ¶ 0 α = eψ(0)/2 . 2 1 x 0 x 0 Abbildung 5.4: Die Gleichung cosh(αx) = x besitzt keine (α1 ), genau eine (α0 ) oder zwei (α2 ) Lösungen, wobei α2 < α0 < α1 . p Setze α := q/2h. Die Gleichung cosh(αx) = x besitzt keine Lösung, wenn α hinreichend groß ist, und zwei Lösungen, wenn α hinreichend klein ist (Abbildung 5.4). Es existiert also ein kritischer Wert α0 , bei dem die nichtlineare Gleichung genau eine Lösung x0 besitzt. Die Werte x0 und α0 bestimmen wir aus den beiden Gleichungen x0 = cosh(α0 x0 ), 1= d cosh(α0 x)|x=x0 = α0 sinh(α0 x0 ). dx 144 Aus der zweiten Gleichung folgt 1 x0 = sinh−1 α0 µ 1 α0 ¶ . Setzen wir dies in die erste Gleichung ein, erhalten wir 1 sinh−1 α0 µ 1 α0 ¶ µ = cosh sinh−1 µ 1 α0 ¶¶ = s 1 + 1, α02 denn aus cosh2 (x) = − sinh2 (x) = 1 für alle x ∈ R folgt q q √ 2 −1 2 x + 1 = sinh (sinh (x)) + 1 = cosh2 (sinh−1 (x)) = cosh(sinh−1 (x)). Der kritische Wert α0 ist also die eindeutige Lösung von q 1 = sinh α02 + 1. α0 Die Lösung lautet α0 ≈ 0.6627. Das Problem hat keine Lösung für α > α0 . In diesem Fall ist der Kohlehaufen kritisch. Wir fassen zusammen: Der Kohlehaufen ist kritisch, wenn α2 = qh2 AEh2 −E/Rθ0 = > α02 ≈ 0.439. e 2 2λRθ02 Es sind also die folgenden Fälle zu vermeiden: zu hohe Kohlehaufen (h “groß”); zu starke Reaktionen (A “groß”); zu geringe Wärmeleitfähigkeit (λ “klein”). Der Einfluß der Aktivierungsenergie E und der Umgebungstemperatur θ0 sind geringer, da E −E/Rθ0 e ≤ e−1 ≈ 0.368 Rθ0 für alle E > 0, θ0 > 0 gilt. 5.4 Elektronenverteilung in Halbleitern In Abschnitt 2.5 haben wir Netzwerke, die Halbleiterbauelemente wie z.B. einen Transistor enthalten, modelliert. Ziel dieses Abschnittes ist die Modellierung derartiger Bauelemente. Dabei wollen wir die folgende Frage beantworten: 145 Frage: Wie sind die Elektronen in einem Halbleiterbauteil räumlich verteilt? Was sind Halbleiter? Halbleiter sind Materialien mit einer wesentlich höheren elektrischen Leitfähigkeit als Isolatoren (z.B. Porzellan oder Gummi) und mit einer wesentlich geringeren Leitfähigkeit als Metalle (z.B. Eisen oder Kupfer). Beispiele für Halbleitermaterialien sind Silizium, Germanium und Galliumarsenid. Zur Erhöhung der Leitfähigkeit werden Halbleiter gezielt mit Fremdatomen dotiert; diese Atome werden durch einen Diffusionsprozeß in dem Halbleiter verteilt. Welchen Effekt hat die Dotierung? Nehmen wir an, jedes Atom des Halbleitermaterials habe vier Elektronen auf der äußersten Elektronenschale um den Atomkern (z.B. Silizium); man nennt sie Valenzelektronen. Jedes Valenzelektron geht eine Bindung (die sogenannte Valenzbindung) mit einem Valenzelektron eines umliegenden Atoms ein. Die Atome samt diesen Bindungen bilden den Halbleiterkristall. Das Fremdatom (z.B. Phospor) habe fünf äußere Elektronen. Vier dieser Elektronen gehen Valenzbindungen mit den Valenzelektronen der umliegenden Halbleiteratome ein; das übriggebleibende Elektron wird nicht gebunden und steht für den Ladungstransport zur Verfügung (Abbildung 5.5). Das übrigbleibende Fremdatom ist dann positiv geladen. Die Zufuhr von Energie in Form von Wärme oder Licht etwa führt dazu, daß Valenzbindungen aufgebrochen werden und die entsprechenden Elektronen ebenfalls für den Ladungstransport zu Verfügung stehen. Allerdings ist die hierfür benötigte Energie sehr viel größer als die, die benötigt wird, das übrigbleibende Valenzelektron vom Fremdatom zu lösen. Si Si Si Si Ph Si Abbildung 5.5: Halbleiterkristall aus Siliziumatomen mit einem Phosphoratom. Die kleinen Kreise stellen Elektronen mit ihren Valenzbindungen dar. Die totale Ladungsdichte % besteht also aus zwei Quellen: den negativ geladenen Elektronen und den positiv geladenen Atomrümpfen. Bezeichnet n(x, t) die Elektronendichte am Ort x zur Zeit t und C(x) die Dichte der Atomrümpfe (auch Dotierungsprofil genannt), so gilt: % = −qn + qC, (5.30) 146 wobei q die Elementarladung ist. Wir haben hier angenommen, daß sich die Dotierungskonzentration nicht zeitlich ändert. Die totale Ladungsdichte erzeugt ein elektrisches Feld. Andererseits erzeugt ein zeitlich variierendes elektrisches Feld ein Magnetfeld. Beide zusammen verändern wieder die totale Ladungsdichte. Das elektrische Feld E und das Magnetfeld B werden beschrieben durch die Maxwell-Gleichungen ε0 divE = %, divB = 0, rotE = − ∂B , ∂t µ rotB = µ0 ∂E Jtot + ε0 ∂t ¶ . Hierbei ist Jtot = Jtot (x, t) die Stromdichte, die mit der totalen Ladungsdichte über die Kontinuitätsgleichung ∂%/∂t + divJtot = 0 in Beziehung steht. Die Konstanten ε0 bzw. µ0 sind Proportionalitätskonstanten und werden als Dielektrizitätskonstante bzw. Permeabilität bezeichnet. Sie sind im allgemeinen materialabhängig. Wir nehmen nun an, daß die zeitliche Variation des Magnetfeldes vernachlässigt werden kann: ∂B/∂t = 0. Dann folgt aus ∂B rotE = − = 0, ∂t falls das Gebiet, in dem sich der Halbleiterkristall befindet, einfach zusammenhängend ist, die Existenz einer Potentials φ = φ(x, t), so daß E = −∇φ. Wegen der obigen Voraussetzung nennen wir φ das elektrostatische Potential. Aus der ersten Maxwell-Gleichung und (5.30) folgt die Gleichung für φ: ε0 ∆φ = q(n − C). (5.31) Nun fehlt noch eine Bewegungsgleichung für die Elektronendichte (das Dotierungsprofil ist gegeben und zeitunabhängig). Wir nehmen an, daß die Elektronendichte durch eine Variante der Euler-Gleichungen (4.26)–(4.27) mit konstanter Temperatur θ = k B T0 /m gegeben sei: ∂t n + div(nu) = 0, nu ∂t (nu) + div(nu ⊗ u) + ∇(nθ) − nF = − . τ (5.32) (5.33) Die physikalischen Konstanten sind die Boltzmann-Konstante kB , die Elektronenmasse m und die Relaxationszeit τ . Der Term auf der rechten Seite von (5.33) beschreibt das Bestreben des Systems, in Abwesenheit äußerer Kräfte gegen den Gleichgewichtszustand nu = 0 zu streben (oder zu relaxieren). Die typische Zeit, in der dies geschieht, ist gerade 147 τ . Die äußere Kraft ist durch das elektrische Feld gegeben: F = −qE/m. Definieren wir die Elektronenstromdichte J durch J = −qnu, so erhalten wir aus (5.32)–(5.33) und (5.31) die hydrodynamischen Halbleitergleichungen: 1 ∂t n − divJ = 0, q 1 ∂t J − div q µ J ⊗J n ¶ (5.34) qkB T0 q2 J − ∇n + n∇φ = − , m m τ (5.35) ε0 ∆φ = q(n − C). (5.36) Diese Gleichungen sind im Halbleitergebiet Ω ⊂ R3 mit geeigneten Rand- und Anfangsbedingungen zu lösen. Um die Gleichungen zu vereinfachen, skalieren wir sie. Wir wählen eine typische Teilchendichte, eine typische Länge und ein typisches Potential: C = sup |C(x)|, L = diam(Ω), UT = x∈Ω k B T0 . q Bei Raumtemperatur T0 = 300 K beträgt UT ≈ 0.026 V. Als typische Zeit wählen wir eine noch zu spezifizierende Konstante τ0 . Damit erhalten wir die Skalierung n = Cns , C = CCs , φ = U T φs , x = Lxs , t = τ 0 ts . Aus der Poisson-Gleichung (5.36) folgt λ2 ∆φ = n − C mit der skalierten Debye-Länge λ= s (5.37) ε0 U T . qL2 C Die Gleichung (5.34) kann geschrieben werden als ∂t s ns − τ0 divs J = 0. qLC Damit die Kontinuitätsgleichung dimensionslos wird, müssen wir die Stromdichte gemäß J= qLC Js τ0 skalieren: ∂ts ns − divs Js = 0. 148 (5.38) Für die Skalierung der verbleibenden Gleichung (5.35) setzen wir für den Quotienten aus kinetischer Energie m(L/τ0 )2 , die erforderlich ist, damit ein Elektron des Halbleitergebiet in der Zeit τ0 durchquert, und thermischer Energie kB T0 : m(L/τ0 )2 ε= . k B T0 Dann folgt aus (5.35) qLC qLC ∂ts Js − 2 divs 2 τ0 τ0 µ Js ⊗ J s ns ¶ − qkB T0 C qkB T0 C qLC ∇ s ns + ns ∇ s φ s = − Js . mL mL τ0 τ Definieren wir τ0 = mL2 /τ kB T0 , so erhalten wir nach Division von qkB T0 C/mL ¶ µ Js ⊗ J s 2 2 ε ∂ts Js − ε divs − ∇s ns + ns ∇s φs = −Js . ns Im folgenden lassen wir den Index “s” fort. Wir nehmen an, daß die thermische Energie kB T0 die kinetische Energie m(L/τ )2 dominiert, d.h. ε ¿ 1. Wir sind an der reduzierten Gleichung ε = 0 interessiert. Aus −∇n + n∇φ = −J (5.39) und (5.37)–(5.38) folgen dann die Drift-Diffusionsgleichungen für Halbleiter: ∂t n − div(∇n − n∇φ) = 0, (5.40) λ2 ∆φ = n − C, x ∈ Ω, t > 0. (5.41) Dies ist ein System nichtlinearer Gleichungen, die die zeitliche Entwicklung der Elektronendichte n und des elektrostatischen Potentials φ beschreiben. Die parabolische Gleichung (5.40) ist zu vervollständigen mit der Anfangsbedingung n(0, x) = n0 (x), x ∈ Ω. (5.42) Welche Randbedingungen sind für (5.40)–(5.41) vorzuschreiben? Wir nehmen an, daß der Rand ∂Ω aus zwei Teilen besteht: Auf dem Teil ΓD seien die Elektronendichte und das Potential gegeben: n = nD , φ = φD auf ΓD , t > 0. (5.43) Der andere Teil ΓN = ∂Ω\ΓD modelliere isolierende Ränder, d.h., die Normalkomponenten der Stromdichte und des elektrischen Feldes verschwinden auf ΓN : J · ν = ∇φ · ν = 0 149 auf ΓN , t > 0. Aus der Beziehung (5.39) für J folgt, daß dies äquivalent ist zu der Bedingung ∇n · ν = ∇φ · ν = 0, auf ΓN , t > 0. (5.44) Es bleiben die Randwerte nD und φD zu bestimmen. Dazu treffen wir die folgenden Annahmen: Die totale Ladungsdichte verschwinde auf ΓD : nD − C = 0. Das Randpotential ist die Summe aus dem Built-in-Potential φbi und der angelegten Spannung U : φD = φbi + U . Das Built-in-Potential ist das Randpotential, das sich im thermischen Gleichgewicht J = 0 einstellt. Um es zu berechnen, müssen wir das thermische Gleichgewicht etwas genauer untersuchen. Aus (5.40)–(5.41) folgt für J = 0, daß n nur eine Funktion des Ortes ist und daß 0 = ∇n − n∇φ = n∇(ln n − φ) in Ω. Gilt n > 0 (was physikalisch zu erwarten ist), so ist ln n − φ = const. Das Potential ist nur bis auf eine additive Konstante bestimmt, und wir wählen die Konstante so, daß ln n − φ = 0 in Ω. Das Built-in-Potential ist dann gegeben durch φbi = ln nD = ln C auf ΓD . Damit ist das Anfangsrandwertproblem (5.40)–(5.44) vollständig definiert. Es ist sehr schwierig, explizite Lösungen für (5.40)–(5.44) zu erhalten, und im allgemeinen ist man auf numerische Methoden angewiesen. Allerdings ist es in bestimmten Fällen möglich, Aussagen über das qualitative Verhalten der Lösungen zu erhalten. Im allgemeinen wird man als Anfangswert n0 die Lösung des thermischen Gleichgewichts wählen, da diese einem Halbleiter mit verschwindender angelegter Spannung entspricht. Das thermische Gleichgewicht wollen wir daher noch eingehender untersuchen. Aus den obigen Überlegungen folgt, daß eine Lösung (n, φ) des thermischen Gleichgewichts gegeben ist durch λ2 ∆φ = eφ − C, n = eφ in Ω, (5.45) φ = ln C auf Γ0 , ∇φ · ν = 0 auf ΓN . In Halbleiterbauteilen variiert das Dotierungsprofil im allgemeinen sehr stark mit großen Gradienten. Idealisierend können wir etwa annehmen, daß ( C1 : x ∈ Ω 1 C(x) = C2 : x ∈ Ω 2 150 gilt, wobei Ω = Ω1 ∪ Ω2 und 0 < C1 ¿ C2 . Dies bedeutet, daß die rechte Seite von (5.45) fast unstetig ist. Zudem ist der Parameter λ typischerweise sehr klein im Vergleich zu Eins. Mit den typischen Werten L = 10−6 m, C = 1023 m−3 , UT = 0.026V ε0 = 1.05 · 10−10 As/Vm, q = 1.60 · 10−19 As, folgt λ2 = 1.35 · 10−4 ¿ 1. Die reduzierte Gleichung λ = 0 lautet dann eφ − C = 0, d.h. φ(x) = ln C(x), n(x) = C(x), x ∈ Ω, sind unstetige Funktionen. Wir erwarten, daß die Gradienten von n und φ auch im allgemeinen Fall λ > 0 und U > 0 (positive angelegte Spannung) sehr groß sind. Dies führt zu numerischen Schwierigkeiten, die nur durch den Einsatz spezieller Methoden in den Griff zu bekommen sind. Literatur [1] A. Georgescu: Asymptotic treatment of differential equations. Chapman & Hall, London, 1995. [2] E. Hairer, G. Wanner: Solving Ordinary Differential Equations II. Springer, Berlin, 2002. [3] M. Hanke-Bourgeois: Grundlagen der Numerischen Mathematik und des wissenschaftlichen Rechnens. Teubner, Stuttgart, 2002. [4] H. Heuser: Gewöhnliche Differentialgleichungen. Teubner, Stuttgart, 1989. [5] M. Hochbruck, J.-M. Sautter: Mathematik fürs Leben am Beispiel der Computertomographie. Erscheint in Mathematische Semesterberichte, 2003. [6] S. Howison: Cusp development in Hele-Shaw flow with a free surface. SIAM J. Appl. Math. 46 (1986), 20-26. [7] C. Schmeiser: Angewandte Mathematik. Vorlesungsskript, TU Wien, www.anum.tuwien.ac.at/schmeiser. [8] S. Wiggings: Introduction to Applied Nonlinear Dynamical Systems and Chaos. Springer, New York, 1990. 151