Mathematische Modellierung mit Differentialgleichungen

Werbung
Mathematische Modellierung mit
Differentialgleichungen
Prof. Dr. Ansgar Jüngel
Fachbereich Mathematik und Informatik
Johannes Gutenberg-Universität Mainz
Sommer 2003
unkorrigiertes Vorlesungsskript
Inhaltsverzeichnis
1 Modellbildung und Asymptotik
1.1 Grundzüge der Modellbildung . . . . . . . . . . . . . .
1.2 Skalierungen . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Schwingungen . . . . . . . . . . . . . . . . . . . . . . .
1.4 Ein wenig Theorie gewöhnlicher Differentialgleichungen
1.5 Regulär und singulär gestörte Probleme . . . . . . . . .
2 Dynamik
2.1 Populationsmodelle . . . . .
2.2 Ein Modell für Aids . . . . .
2.3 Chemische Reaktionskinetik
2.4 Ein Wirtschaftsmodell . . .
2.5 Elektrische Schaltkreise . . .
2.6 Himmelsmechanik . . . . . .
2.7 Deterministisches Chaos . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
5
11
19
25
.
.
.
.
.
.
.
34
34
39
44
49
55
60
68
3 Wellenphänomene
73
3.1 Wellengleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.2 Schrödingergleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.3 Computertomographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
1
4 Strömungen
4.1 Verschmutzung eines Flusses .
4.2 Verkehrsflüsse . . . . . . . . .
4.3 Strömungsmechanik . . . . . .
4.4 Bluttransport durch Adern . .
4.5 Strömung um einen Tragflügel
4.6 Hele-Shaw-Strömung . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Diffusion
5.1 Diffusionsgleichung . . . . . . . . .
5.2 Ein globales Klimamodell . . . . .
5.3 Selbstentzündung von Kohlehaufen
5.4 Elektronenverteilung in Halbleitern
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
93
93
97
105
113
115
123
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
130
. 130
. 135
. 141
. 145
1
Modellbildung und Asymptotik
1.1
Grundzüge der Modellbildung
Das Grundziel der mathematischen Modellierung ist die Formulierung, Lösung und ggf.
Verfeinerung eines mathematischen Modells für ein reales Problem aus der Industrie,
Wirtschaft oder Wissenschaft. Obwohl der Weg der mathematischen Modellierung sehr
stark von dem konkreten Problem abhängt, wird er immer die folgenden sechs Schritte
beinhalten (siehe Abbildung 1.1):
1. Spezifikation des realen Problems,
2. Formulierung eines mathematischen Modells,
3. Analyse des Modells (Vereinfachungen, qualitatives Lösungsverhalten),
4. Lösung des Modells (analytisch oder numerisch),
5. Interpretation der Ergebnisse und Vergleich mit dem Ausgangsproblem,
6. eventuell Verfeinerung des Modells.
Diese Schritte können auch mehrmals durchlaufen werden, wenn das mathematische
Modell keine zufriedenstellenden Ergebnisse liefert und es geändert oder verfeinert werden
muß.
Im folgenden erläutern wir die obigen Schritte:
1. Spezifikation des Problems: Zuerst muß das reale Problem präzise spezifiziert werden, um die Fragestellung einzugrenzen. Der Sachverhalt sollte verdeutlicht und die relevanten Daten, Parameter und Variablen müssen identifiziert werden. Es ist zu erwarten,
daß der Sachverhalt vereinfacht werden muß. Welches sind die wichtigsten Prozesse oder
Variablen?
2. Mathematische Formulierung: Das spezifizierte Problem muß nun mit Hilfe mathematischer Methoden formuliert werden. Welche Techniken sind angemessen? Wie lauten die Größenordnungen der Parameter und Variablen? Sind weitere Vereinfachungen
möglich, bzw. gibt es einfache Spezialfälle?
3. Mathematische Analyse: Häufig stellt sich heraus, daß eine anfangs kompliziert
erscheinende Gleichung so umformuliert werden kann, daß sie eine einfachere Struktur
aufweist oder in eine bekannte Klasse von Gleichungen eingeordnet werden kann, für
die bereits mathematische Lösungstechniken existieren. Ist dies hier der Fall? Kann das
mathematische Problem oder können Spezialfälle explizit gelöst werden? Meistens sind
3
Mathematisches
Modell
Reales
Problem
Spezifikation
des
Problems
Mathematische
Formulierung
Mathematische
Analyse
Mathematisches
Ergebnis
Lösung des
Modells
Interpretation
der
Lösung
ggf.
Verfeinerung
des Modells
Abbildung 1.1: Der Modellierungskreislauf.
numerische Verfahren zur Lösung der Gleichung notwendig. Welche Verfahren sind in
diesem Fall angebracht?
4. Lösung des Modells: Nachdem die mathematische Struktur des Problems identifiziert ist, kann das Modell mit Hilfe analytischer und numerischer Methoden gelöst werden.
Dafür sind für die Anwendungen geeignete Werte der Parameter zu wählen. Werden numerische Techniken verwendet, ist sicherzustellen, daß die numerische Lösung tatsächlich
die Lösung des mathematischen Problems mit hinreichender Genauigkeit approximiert.
5. Interpretation der Lösung: In diesem Schritt wird untersucht, inwiefern die mathematische Lösung das reale Problem approximiert. Stimmt die Größenordnung der Lösung
mit der erwarteten Lösung überein? Wie groß ist der Gültigkeitsbereich der Approximation? Können die Resultate durch Experimente validiert werden?
6. Verfeinerung des Modells: Die mathematischen Resultate können Hinweise geben,
ob eine in der Modellierung vorgenommene Vereinfachung zu einem unrealistischen Ergebnis führt. In diesem Fall müssen das Modell oder die mathematischen Techniken verbessert
werden. Welche Modellierungsannahmen sollen abgeschwächt werden? Müssen verfeinerte
numerische Methoden zur Lösung verwendet werden? Dies führt zu einer neuen Spezifikation des realen Problems bzw. zu einer neuen mathematischen Formulierung, und der
Modellierungskreislauf beginnt von neuem, bis ein zufriedenstellendes Ergebnis erzielt
wird.
In den folgenden Kapiteln stellen wir einige konkrete Fragestellungen vor, die wir
exemplarisch mittels der obigen Modellierungsschritte lösen. Die Probleme repräsentieren einerseits typische Phänomene wie Dynamik, Wellen, Strömungen und Diffusion und
andererseits Beispiele aus verschiedenen Anwendungsgebieten wie Biologie, Chemie, Geowissenschaften, Physik und Wirtschaftswissenschaften. Insbesondere modellieren wir
den Krankheitsverlauf HIV-positiver Personen (Biologie),
4
die Ausbreitung von Verschmutzungen im Trinkwasser (Chemie),
den Einfluß der Sonneneinstrahlung auf das Weltklima (Geowissenschaften),
den Autoverkehr bei Anwesenheit von Ampeln (Physik),
die Handelsdynamik zwischen zwei Nationen (Wirtschaftswissenschaften).
1.2
Skalierungen
In diesem Abschnitt präsentieren wir ein einfaches Beispiel für die im vorigen Abschnitt
erläuterten Modellierungsschritte. Dieses Beispiel erlaubt es uns, gleichzeitig auf einige
wichtige Konzepte der Entdimensionalisierung und Skalierung einzugehen.
Frage: Werfe einen Gegenstand nach oben. Nach welcher Zeit prallt er wieder auf der
Erde auf ?
Um diese Aufgabe zu lösen, benötigen wir einige physikalische Gesetzmäßigkeiten,
nämlich
das Newtonsche Gesetz
F = m · a,
wobei m die Masse eines Gegenstands, a deren Beschleunigung (Geschwindigkeitsänderung pro Zeiteinheit) und F die auf dem Gegenstand einwirkende Kraft seien;
das Gravitationsgesetz
F = Gm1 m2
x
,
|x|3
wobei m1 und m2 die Massen zweier Gegenstände, x deren Abstandsvektor und G
die universelle Gravitationskonstante seien; F ist die auf die beiden Gegenstände
wirkende Gravitationskraft.
Nun können wir beginnen, eine Gleichung für die Bewegung des geworfenen Gegenstands herzuleiten (Schritt 1). Die Frage bedeutet, genauer formuliert, daß ein Gegenstand
der Masse m von der Erdoberfläche mit der Anfangsgeschwindigkeit v senkrecht nach oben
geworfen wird. Sei R der Erdradius und x(t) die Entfernung des Gegenstandes von der
Erdoberfläche zur Zeit t (siehe Abbildung 1.2).
Die mathematische Formulierung der obigen Aufgabe lautet dann: Bestimme den Aufprallzeitpunkt T > 0, für den x(T ) = 0 gilt. Um T > 0 zu berechnen, benötigen wir eine
Gleichung für x(t). Die Beschleunigung x00 (t) = d2 x/dt2 ist durch das Newtonsche Gesetz
mx00 = F
5
m
x(t)
M
R
Abbildung 1.2: Geometrie für den nach oben geworfenen Gegenstand.
gegeben. Die Kraft F ist die auf den Gegenstand wirkende Gravitationskraft
F =−
GmM
,
(x(t) + R)2
wobei M die Erdmasse bezeichne, so daß
mx00 = −
GmM
.
(x + R)2
Nach Division durch m und Definition der Gravitationskonstanten der Erde g := GM/R 2
folgt
gR2
x00 = −
,
t > 0.
(1.1)
(x + R)2
Diese Gleichung ist mit den Anfangsbedingungen
x0 (0) = v
x(0) = 0,
(1.2)
zu vervollständigen (Schritt 2). Hierbei haben wir benutzt, daß die Geschwindigkeit x 0 (0) =
dx(0)/dt zur Zeit t = 0 gleich v sein soll. Die Gleichung (1.1) ist eine gewöhnliche Differentialgleichung, und das Problem (1.1)–(1.2) ist ein Anfangswertproblem. Wir werden im
Abschnitt 1.4 die Theorie gewöhnlicher Differentialgleichungen auffrischen.
Das Problem (1.1)–(1.2) enthält drei physikalische Parameter: g, R und v. Um das Problem zu vereinfachen, wollen wir die Gleichung in eine dimensionslose Form mit möglichst
wenigen dimensionslosen Parametern umformulieren (Schritt 3). Dazu gehen wir in zwei
Schritten vor. Zuerst stellen wir eine Tabelle aller Variablen und Parameter samt Einheiten auf (Tabelle 1.1). Wir verwenden hierbei das cgs-Einheitensystem, d.h. Zentimeter
(cm), Gramm (g) und Sekunde (s).
Der zweite Schritt besteht darin, für alle Variablen intrinsische Referenzgrößen zu
definieren und damit die Variablen zu skalieren. Eine Möglichkeit ist es, den Erdradius R
6
Variable:
Dimension
cm
s
cm/s2
cm
cm/s
x
t
g
R
v
Parameter:
Tabelle 1.1: Auflistung aller Variablen und Parameter.
als charakteristische Länge und R/v als charakteristische Zeit zu wählen. Damit erhalten
wir dimensionslose Variablen
y :=
x
R
und
τ :=
t
.
R/v
(1.3)
Wie sieht die entsprechende dimensionslose Gleichung aus? Es folgt
y 00 =
R
gR
gR2
1
d2 y ³ R ´2 1 d2 x
=
=
−
=− 2
2
2
2
2
dτ
v R dt
v (Ry + R)
v (y + 1)2
und
R x(0)
dy
(0) =
= 1.
dτ
v R
Setzen wir ε = v 2 /gR, lautet das dimensionslose Problem
y 0 (0) =
εy 0 = −
1
,
(y + 1)2
τ > 0,
y(0) = 0,
y 0 (0) = 1.
(1.4)
Bevor wir das Problem (1.4) weiter analysieren, erklären wir genauer die allgemeine Vorgehensweise des Entdimensionalisierens von Gleichungen.
Seien dazu die Parameter α1 , . . . , αn gegeben, wobei αk die Einheit cm`k gmk stk (k =
1, . . . , n) besitzen. Wir schreiben dies kürzer als
[αk ] = (`k , mk , tk ).
Beispielsweise gilt [g] = (1, 0, −2) und [ε] = (0, 0, 0). Sei weiter α ein dimensionsloser
Parameter. Wir setzen voraus, daß mathematische Modelle von realen Problemen immer in
eine dimensionslose Form gebracht werden können, indem die dimensionslosen Parameter
α als Produkte von Potenzen der ursprünglichen Parameter gewählt werden. Daraus folgt,
daß Zahlen b1 , . . . , bn existieren, so daß
α=
n
Y
k=1
7
αkbk .
Um die Exponenten b1 , . . . , bn zu bestimmen, verwenden wir
(0, 0, 0) = [α] =
=
n
Y
cmbk `k gbk mk sbk tk
k=1
Ã
n
X
b k `k ,
n
X
bk m k ,
bk t k
k=1
k=1
k=1
n
X
!
.
Dies ergibt das lineare Gleichungssystem für b1 , . . . , bn mit Koeffizienten `k , mk und tk :
n
X
n
X
`k bk = 0,
k=1
mk bk = 0,
k=1
n
X
tk bk = 0.
(1.5)
k=1
Nach Voraussetzung besitzt das Gleichungssystem mindestens eine nicht-triviale Lösung.
Wieviele (linear unabhängige) Lösungen gibt es? Sei n∗ die Anzahl der linear unabhängigen Lösungen, d.h., n∗ ist die Dimension des Kerns der Koeffizientenmatrix


`1 · · · ` n


 m1 · · · m n  .
t1 · · · t n
Dann ist n∗ die Anzahl der relevanten dimensionslosen Parameter. Sind nämlich b =
(b1 , . . . bn ) und eb = (eb1 , . . . ebn ) zwei linear abhängige Lösungen des Gleichungssystems,
d.h., b = λeb, so folgt für die entsprechenden Parameter
α=
n
Y
αkbk
und
k=1
α
e=
n
Y
k=1
e
αkbk ,
daß α = α
eλ , und wir können etwa α
e durch α ersetzen. Es gilt (für n ≥ 3) 0 ≤ n∗ < n,
denn n∗ = n bedeutet, daß die Koeffizientenmatrix eine Nullmatrix sein muß, und dies
würde einem bereits dimensionslosen Problem entsprechen.
Im Beispiel des geworfenen Gegenstandes haben wir die Parameter
[g] = (1, 0, −2),
[R] = (1, 0, 0),
[v] = (1, 0, −1)
und damit die Koeffizientenmatrix


1 1
1


0 .
 0 0
−2 0 −1
Wegen n∗ = 1 existiert genau ein dimensionsloser Parameter, nämlich die Lösung (−1, −1,
2) von (1.5). Dies entspricht unserem Parameter
v2
ε=g R v =
.
gR
−1
−1 2
8
Schritt 4 des Modellierungsprozesses ist die Lösung des Problems (1.4). Das Problem
kann nicht explizit gelöst werden, so daß wir nach einer geeigneten Vereinfachung suchen.
Typische Werte für die Parameter sind
v = 102 . . . 104 cm/s,
g ≈ 980 cm/s2 ,
R ≈ 6500 km = 6.5 · 108 cm,
so daß
(104 )2
= 0.0002 ¿ 1.
1000 · 5 · 108
Weil ε “sehr klein” ist, sind wir versucht, das Problem (1.4) dadurch zu vereinfachen, daß
wir ε = 0 in (1.4) setzen:
ε≈
0=−
1
,
(y + 1)2
y(0) = 0,
y 0 (0) = 1.
Dieses Problem besitzt keine Lösung! Was ist schiefgegangen? Die Skalierung (1.3) ist
nicht sinnvoll. Das skalierte (dimensionslose) Problem sollte so gewählt werden, daß die
dimensionslosen Variablen die Größenordnung eins haben. Ist dies bei der Skalierung (1.3)
der Fall? Wir erwarten x = 10 . . . 103 m und t = 1 . . . 100 s. Dann sind
y=
x
105
= 0.0002,
≈
R
5 · 108
τ=
t
102
= 0.002
≈
R/v
5 · 108 /104
nicht von der Größenordnung eins.
Um eine sinnvolle Skalierung zu erhalten, machen wir die Annahme x ¿ R. Daraus
folgt, daß die Beschleunigung x00 die Größenordnung
|x00 | =
gR2
gR2
≈
=g
(x + R)2
R2
hat. Die typische Beschleunigung g ist gleich der Geschwindigkeit v dividiert durch die
typische Zeit θ: g = v/θ oder θ = v/g. Andererseits ist die typische Beschleunigung gleich
der typischen Länge L dividiert durch das Quadrat der Zeit: g = L/θ 2 oder L = gθ 2 =
v 2 /g. Die Referenzzeit und -länge lauten also
θ=
v
104
≈ 3 s = 10 s,
g
10
L=
v2
(104 )2
≈
cm = 105 cm = 1 km,
g
103
und die skalierten Variablen
x
t
,
τ :=
L
θ
sind von der Größenordnung eins. Mit dieser Skalierung lauten die dimensionslosen Gleichungen
y :=
y 00 =
gR2
d2 y
θ 2 d2 x
1
1
=
=
−
=
−
,
dτ 2
L dt2
g (v 2 y/g + R)2
(εy + 1)2
9
τ > 0,
(1.6)
wobei ε = v 2 /gR, und
θ 0
x (0) = 1.
L
Wegen ε ¿ 1 lösen wir das vereinfachte Problem
y 0 (0) =
y(0) = 0,
y 00 = −1,
τ > 0,
(1.7)
y 0 (0) = 1.
y(0) = 0,
Die Lösung lautet
τ2
, τ ≥ 0.
2
Der Aufprallzeitpunkt ist definiert durch y(τ ∗ ) = 0, τ ∗ > 0, also
y(τ ) = τ −
τ ∗ = 2.
Dies beendet Schritt 4.
In Schritt 5 interpretieren wir die gefundene Lösung: Dazu transformieren wir die
Variablen zurück in die dimensionsbehafteten Variablen:
T = θ · τ∗ =
2v
.
g
(1.8)
Der Aufprallzeitpunkt ist also proportional zur Anfangsgeschwindigkeit. Typische Werte
für T sind
2 · 102
2 · 104
T ≈
.
.
.
s = 0.2 . . . 20 s.
103
103
Wie genau ist dieses Ergebnis bzw. kann es verbessert werden (Schritt 6)? Wir können
das Problem (1.6)–(1.7) zwar nicht explizit lösen, sind aber in der Lage, eine implizite
Formel für die Lösung anzugeben. Dazu multiplizieren wir (1.6) mit y 0 und integrieren in
(0, τ ):
Z τ
Z τ
1 0 2 0
y 0 (s) ds
1
1
1 0 2 1
y (τ ) − =
(y (s) ) ds = −
=
− .
(1.9)
2
2
2
ε(εy(τ ) + 1) ε
0 2
0 (εy(s) + 1)
Schreiben wir
dy
=
dτ
so folgt
Z
y(τ )
0
µ
s
2
2
− + 1,
ε(εy + 1) ε
2
2
− +1
ε(εy + 1) ε
¶−1/2
dy =
Z
τ
dt = τ,
0
τ ≥ 0.
(1.10)
Der Aufprallzeitpunkt τ ∗ ist das Doppelte des Umkehrzeitpunktes τ0 , definiert durch
y 0 (τ0 ) = 0, denn zur Zeit τ0 hat der Gegenstand seine maximale Höhe erreicht. Aus (1.9)
folgt
1
1
1
− ,
− =
2
ε(εy(τ0 ) + 1) ε
10
also
1
.
2−ε
Setzen wir dieses Resultat in (1.10) ein, erhalten wir eine exakte Formel für den Aufprallzeitpunkt:
¶−1/2
Z 1/(2−ε) µ
2
2−ε
∗
τ = 2τ0 = 2
−
dy.
(1.11)
ε(εy + 1)
ε
0
y(τ0 ) =
Diese Formel macht nur Sinn, wenn ε < 2. Was passiert, wenn ε ≥ 2? Wir haben
implizit angenommen, daß der Gegenstand wieder auf der Erdoberfläche aufprallen wird.
√
√
Nun bedeutet ε < 2 gerade v < 2gR. Ist die Anfangsgeschwindigkeit größer als 2gR,
√
so wird der Gegenstand die Erde für immer verlassen. Der Grenzwert vg := 2gR wird
daher Fluchtgeschwindigkeit genannt. Tatsächlich folgt im Fall ε = 2 aus (1.10):
Z
y(τ )
0
p
2y + 1 dy = τ,
und für τ → ∞ muß das Integral divergieren, was y(τ ) → ∞ impliziert, d.h., der Gegenstand überwindet das Gravitationsfeld der Erde.
Diese Bemerkung zeigt, daß die ursprüngliche Fragestellung ungenau formuliert ist.
Es ist implizit angenommen, daß die Anfangsgeschwindigkeit v kleiner als die Fluchtgeschwindigkeit ist. Gilt v ¿ vg , d.h. ε ¿ 1, so ist die Formel (1.8) eine akzeptable
Approximation. Sie ist gegen
2v
T =
g
Z
1/(2−ε)
0
µ
2−ε
2
−
ε(εy + 1)
ε
¶−1/2
dy
auszutauschen, wenn v nicht sehr viel kleiner als vg ist.
Übungsaufgabe: Berechnen Sie das Integral (1.11) numerisch für ε = 1, 1.5, 1.8, 1.9,
1.95, 1.99, und vergleichen Sie die Ergebnisse mit dem approximativen Aufprallzeitpunkt
τ ∗ = 2.
Übungsaufgabe: Sie werfen einen Stein in einen Brunnen und hören nach t Sekunden
den Aufprall. Wie tief ist der Brunnen?
1.3
Schwingungen
Ist die Wäsche in einer Waschmaschinentrommel nicht gleichmäßig verteilt, beginnt die
Waschmaschine zu vibrieren. Ein Waschmaschinenhersteller muß sicherstellen, daß die
Schwingungen nicht zu groß sind, da die Waschmaschine ansonsten die Tendenz hat, sich
11
infolge der Vibrationen von ihrem Standort zu entfernen. Eine Möglichkeit, die Schwingungen zu bremsen, besteht darin, eine Dämpfung in der Schwingungsrichtung einzubauen. Der Hersteller plant, eine größere Trommel in seine Maschinen einzubauen. Er hat
Befürchtungen, daß wegen des nun möglichen höheren Befüllungsgewichtes die Vibrationen im Betrieb zu groß werden könnten.
Frage: Wie groß muß die Dämpfungskraft in der neuen Waschmaschine sein, damit die
Schwingungen nicht stärker als in der ursprünglichen Maschine sind?
Bevor wir diese Frage präzisieren und beantworten können, müssen wir uns mit dem
Phänomen der Schwingung beschäftigen. Zuerst betrachten wir ein Pendel (siehe Abbildung 1.3). Sei θ = θ(t) die Auslenkung des Pendels in Bogenmaß von der Ruhelage. Die
Pendelmasse betrage m.
θ
L
L
F
θL
θ
−mg
−mg sin θ
Abbildung 1.3: Darstellung der auf ein Pendel wirkenden Kräfte.
Ist das Pendel um den Betrag θL ausgelenkt, wirkt die Gravitationskraft −mg auf das
Pendel, genauer gesagt nur die tangentiale Komponente −mg sin θ. Man nennt −mg sin θ
auch die Rückstellkraft. Aus dem Newtonschen Gesetz folgt
m
d2
θL = −mg sin θ
dt2
oder
θ00 + ω 2 sin θ = 0,
t > 0,
(1.12)
wobei ω 2 := g/L. Diese gewöhnliche Differentialgleichung beschreibt die Dynamik des
Pendels. Es sind noch die Anfangsbedingungen
θ(0) = θ0 ,
θ0 (0) = v
(1.13)
vorzugeben. In diesem Abschnitt arbeiten wir mit unskalierten Gleichungen, da wir keine
“kleinen” Parameter haben.
12
Unser Ziel ist es, die Schwingungsdauer des Pendels zu finden. Wir nehmen dazu an,
daß das Pendel nur wenig ausgelenkt werde, d.h. θ ¿ 1. In diesem Fall können wir
sin θ ≈ θ approximieren und erhalten die Schwingungsgleichung
θ00 + ω 2 θ = 0,
t > 0.
Diese Gleichung kann explizit gelöst werden, und die allgemeine Lösung lautet
θ(t) = c1 sin ωt + c2 cos ωt,
t ≥ 0.
Die Konstanten c1 , c2 ∈ R können aus den Anfangsbedingungen (1.13) bestimmt werden:
θ0 = θ(0) = c2 ,
v = θ0 (0) = ωc1 ,
also c1 = ω/v, c2 = θ0 . Aus der Lösungsformel folgt die Schwingungsdauer
s
L
2π
= 2π
.
T =
ω
g
Wie groß ist die Schwingungsdauer bei “großen” Auslenkungen? Dazu gehen wir ähnlich wie im vorigen Abschnitt vor. Wir multiplizieren (1.12) mit θ 0 und integrieren über
(0, t):
1 0 2 1 2
θ (t) − v = ω 2 cos θ(t) − ω 2 cos θ0 ,
(1.14)
2
2
und aus
dθ p 2
= 2ω (cos θ − cos θ0 ) + v 2
(1.15)
dt
folgt
Z t
Z θ(t)
dθ
p
=
ds = t.
(1.16)
2ω 2 (cos θ − cos θ0 ) + v 2
0
θ0
Damit das Integral Sinn macht, muß 2ω 2 (cos θ − cos θ0 ) + v 2 > 0 gelten. Beginnt das
Pendel zur Zeit t = 0 aus der Ruhelage heraus zu pendeln (d.h. θ0 = 0), so erreicht das
Pendel nach t = T /4 die erste maximale Auslenkung θmax , für die θ0 (T /4) = 0 gilt. Für
Zeiten t > T /4 wird die Auslenkungsgeschwindigkeit negativ, und wir müssen in (1.15)
ein Minuszeichen vor die Wurzel setzen. Es folgt wegen θ0 = 0
p
0 = θ0 (T /4) = 2ω 2 (cos θmax − 1) + v 2
und damit
θmax
µ
v2
= arccos 1 − 2
2ω
¶
.
Dies macht genau dann Sinn, wenn −1 ≤ 1 − v 2 /2ω 2 ≤ 1 oder
√
|v| ≤ 2ω.
13
√
Für Anfangsgeschwindigkeiten größer als 2ω überschlägt sich das Pendel. Diese Situation
wollen wir hier ausschließen. Setzen wir den Ausdruck für θmax in (1.16) ein, so erhalten
wir eine Formel für die Schwingungsdauer:
¶
µ
Z θmax
v2
dθ
p
mit θmax = arccos 1 − 2 .
T =4
2ω
2ω 2 (cos θ − 1) + v 2
0
Übungsaufgabe: Berechnen Sie das Integral
Z θmax
4
dθ
p
T =√
cos θ − 1 + v 2 /2ω 2
2ω 2 0
numerisch für verschiedene Werte von v 2 /2ω 2 . Wie lautet die Schwingungsdauer, wenn
v 2 /2ω 2 → 0 bzw. v 2 /2ω 2 → 1?
Es gibt übrigens eine einfache physikalische Interpretation der Formel (1.14), geschrieben als
m 0 2
m
Lθ (t) + mg(1 − cos θ(t)) = Lv 2 + mg(1 − cos θ0 ).
(1.17)
2
2
Der Term (m/2)Lθ 0 (t)2 kann als eine kinetische Energie und mg(1 − cos θ0 ) als eine potentielle Energie interpretiert werden. Dann bedeutet (1.17) gerade, daß die Gesamtenergie
des Systems
m
E(t) = Ekin (t) + Epot (t) = Lθ0 (t)2 + mg(1 − cos θ(t))
2
für alle Zeiten t ≥ 0 konstant ist.
Wir kehren wieder zu dem Problem der vibrierenden Waschmaschine zurück. Der Einfachheit halber nehmen wir an, daß sich die Waschmaschinentrommel um ihre horizontale
Achse dreht und nur in vertikaler Richtung vibrieren kann. Wir modellieren die Waschmaschine als ein System, das aus einer gefüllten Waschmaschinentrommel, einer Feder und
einer Dämpfung besteht (siehe Abbildung 1.4). Der Schwerpunkt der Wäsche befinde sich
um die Länge R vom Trommelmittelpunkt entfernt. Wir bezeichnen mit M das Gewicht
der Trommel, mit m das effektive Gewicht der Wäsche und mit ω0 die Umdrehungsfrequenz der Trommel. Sei x(t) die Auslenkung der Trommel von ihrer Ruhelage. Nach dem
Newtonschen Gesetz gilt:
M x00 = Rückstellkraft + Reibungskraft + Anregungskraft.
Die Rückstellkraft lautet für kleine Auslenkungen x ¿ 1 gerade −kx, wobei k eine Proportionalitätskonstante sei. Wir nehmen an, daß die Reibungskraft proportional zur Geschwindigkeit der vertikalen Auslenkung ist, −rx0 , mit einer Proportionalitätskonstanten
r > 0. Die Wäsche in der Trommel werde angeregt durch die der Auslenkung R sin ω0 t
entsprechenden Kraft,
d2
m 2 (R sin ω0 t) = −mRω02 sin ω0 t.
dt
14
Trommel
R
Feder
Wäsche
Dämpfung
Abbildung 1.4: Vereinfachte Darstellung der schwingenden Waschmaschine.
Damit lautet die Bewegungsgleichung
M x00 = −kx − rx0 − mRω02 sin ω0 t
oder
x00 + 2%x0 + ω 2 x = −γω02 sin ω0 t,
wobei
2% :=
r
,
M
k
,
M
ω 2 :=
γ :=
t > 0,
(1.18)
mR
,
M
mit den Anfangsbedingungen
x(0) = 0,
x0 (0) = 0.
(1.19)
Der Waschmaschinenhersteller stellt uns die Daten
M = 10 kg,
m = 2 kg,
R = 10 cm,
k = 400 N/m,
r = 200 Ns/m,
ω0 = 50 Hz
zur Verfügung. Hierbei bezeichnet N = kg m/s2 die Einheit Newton und Hz = 1/s die
Einheit Hertz. Daraus folgt
% = 10 s−1 ,
ω 2 = 40 s−2 ,
γ = 2 cm.
(1.20)
Insbesondere hat ω die Einheit 1/s und ist daher eine Frequenz (was die Bezeichnung
rechtfertigt).
Der Hersteller plant, eine andere Trommel einzubauen, so daß das effektive Wäschegewicht auf m
e = 3 kg steigen kann. Der Abstand des Wäscheschwerpunktes zum Trommelmittelpunkt sei unverändert R = 10 cm. Wir können nun die zu Beginn dieses Abschnittes
15
gestellte Frage präziser formulieren: Wie groß muß der Reibungswiderstand r sein, damit
die maximale vertikale Auslenkung der neuen Trommel nicht größer ist als die der alten
Trommel (mit m = 2 kg)?
Um diese Frage zu beantworten, müssen wir zuerst die maximalen Auslenkungen
xmax = sup |x(t)|
0<t<∞
der alten Trommel berechnen. Dafür benötigen wir die Lösung x(t) des Anfangswertproblems (1.18)–(1.19). Glücklicherweise kann dieses Problem explizit gelöst werden. Dazu
betrachten wir zuerst die Schwingungsgleichung ohne Anregung:
x00 + 2%x0 + ω 2 x = 0,
t > 0.
(1.21)
Man nennt dies auch eine homogene Gleichung. Für die Lösung machen wir den Ansatz
x(t) = eλt ,
λ ∈ C.
Setzen wir diesen Ansatz in (1.21) ein, erhalten wir
eλt (λ2 + 2%λ + ω 2 ) = 0 für alle t > 0.
Da eλt 6= 0, folgt
λ2 + 2%λ + ω 2 = 0
mit Lösungen
λ1/2 = −% ±
p
%2 − ω 2 .
Sowohl eλ1 t als auch eλ2 t sind Lösungen von (1.21), also auch Linearkombinationen davon:
x(t) = c1 eλ1 t + c2 eλ2 t ,
t ≥ 0,
mit beliebigen Konstanten c1 , c2 ∈ C. Man kann zeigen, daß alle Lösungen von (1.21) von
dieser Form sind (siehe Abschnitt 1.4). In unserem Fall gilt %2 > ω 2 , also ist
p
x(t) = e−%t (c1 eδt + c2 e−δt ) mit δ = %2 − ω 2 ∈ R.
(1.22)
Ist die Reibung so klein, daß %2 < ω 2 , so folgt
x(t) = e−%t (c1 eiDt + c2 e−iDt ) mit D =
p
ω 2 − %2 ∈ R.
Da wir nur an reellwertigen Lösungen interessiert sind, können wir den Real- und Imaginärteil dieses Ausdruckes linear kombinieren und erhalten
x(t) = e−%t (c3 sin Dt + c4 cos Dt),
c3 , c4 ∈ R.
Eine einfache Rechnung zeigt, daß dies wirklich eine Lösung von (1.21) ist. Die Theorie
gewöhnlicher Differentialgleichungen zeigt, daß alle (reellwertigen) Lösungen diese Gestalt
haben.
16
Übungsaufgabe: Bestimmen Sie alle Lösungen von
(a)
x00 + 4x0 + 3x = 0,
t > 0;
(b)
x00 + 4x0 + 4x = 0,
t > 0;
Hinweis für (b): Versuchen Sie auch die Funktion x(t) = te−2t .
Wir lösen nun die inhomogene Gleichung (1.18). Wir rechnen damit, daß nach dem
Einschwingvorgang die Trommel gezwungen wird, mit der Frequenz ω0 zu schwingen.
Daher scheint der Ansatz
x(t) = a sin ω0 t + b cos ω0 t,
a, b ∈ R,
(1.23)
sinnvoll. Setzen wir ihn in (1.18) ein, erhalten wir
0 = (−aω02 − 2b%ω0 + aω 2 + γω02 ) sin ω0 t + (−bω02 + 2a%ω0 + bω 2 ) cos ω0 t,
t > 0.
Wählen wir zuerst t = π/2ω0 und dann t = 0, folgt
(ω 2 − ω02 ) · a − 2%ω0 · b = −γω02 ,
2%ω0 · a + (ω 2 − ω02 ) · b = 0.
(1.24)
(1.25)
Dies ist ein lineares Gleichungssystem für a und b, das genau dann eine eindeutige Lösung
besitzt, wenn
!
Ã
ω 2 − ω02 −2%ω0
= (ω 2 − ω02 )2 + 4%2 ω02 6= 0.
det
2%ω0
ω 2 − ω02
Das ist der Fall, wenn % > 0 und ω0 > 0. Wir schließen, daß der Ansatz (1.23) tatsächlich
eine Lösung von (1.18) ist.
Die Summe aus der allgemeinen Lösung (1.22) der homogenen Gleichung und der
(speziellen) Lösung (1.23) der inhomogenen Gleichung ist wieder eine Lösung von (1.18):
x(t) = e−%t (c1 eδt + c2 e−δt ) + a sin ω0 t + b cos ω0 t,
(1.26)
wobei (a, b) die Lösung von (1.24)–(1.25) ist und (c1 , c2 ) aus den Anfangsbedingungen
(1.19) bestimmt werden kann.
Übungsaufgabe: Berechnen Sie c1 , c2 , a und b.
Welchen Wert hat nun xmax = supt |x(t)|? Obwohl wir die Lösung x(t) explizit berechnet haben, ist die Frage anhand der Lösungformel nicht einfach zu beantworten. Wir geben
eine numerische Antwort. In Abbildung 1.5 ist die Lösung (1.26) mit den Daten (1.20)
17
6
5
Auslenkung in cm
4
3
2
1
0
−1
−2
0
0.5
1
Zeit in sec.
1.5
2
Abbildung 1.5: Lösung von (1.18)–(1.19) mit % = 10 s−1 , ω 2 = 40 s−2 , γ = 2 cm.
illustriert. Die maximale Auslenkung beträgt xmax ≈ 5.9 cm. Mit der neuen Trommel folgt
m
e = 3 kg und γ = 3 cm mit maximaler Auslenkung xmax ≈ 8.4 cm (Abbildung 1.6). Die
Dämpfung muß auf r = 380 Ns/m bzw. % = 19 s−1 erhöht werden, damit die Auslenkung
den ursprünglichen Wert von xmax = 5.9 cm nicht überschreitet (Abbildung 1.7).
Die Lösung (1.26) besteht aus zwei Anteilen: dem Einschwinganteil e−%t (c1 eδt + c2 e−δt )
und der dauerhaften Schwingung a sin ω0 t + b cos ω0 t. Zuweilen ist nicht nur die maximale
Auslenkung für alle t ≥ 0 von Bedeutung, sondern auch die größte Auslenkung x im
dauerhaften Betrieb der Trommel. Da der Einschwinganteil für t → ∞ abklingt, folgt
x = sup |a sin ω0 t + b cos ω0 t|
t
¯µ ¶ µ
¶¯
¯
¯ a
sin
ω
t
0
¯
·
= sup ¯¯
cos ω0 t ¯
b
t
√
≤
a2 + b 2 .
Eine einfache Rechnung zeigt, daß
µ
µ ¶
¶
−(ω 2 − ω02 )
a
γω02
= 2
(ω − ω02 )2 + (2%ω0 )2
2ω0
b
und damit
x ≤
γω02 ((ω 2 − ω02 )2 + (2%ω0 )2 )1/2
(ω 2 − ω02 )2 + (2%ω0 )2
18
10
Auslenkung in cm
8
6
4
2
0
−2
−4
0
0.5
1
Zeit in sec.
1.5
2
Abbildung 1.6: Lösung von (1.18)–(1.19) mit % = 10 s−1 , ω 2 = 40 s−2 , γ = 3 cm.
γω02
((ω 2 − ω02 )2 + (2%ω0 )2 )1/2
γω0
≤
.
2%
=
Für die alte Waschmaschinentrommel gilt x = 5 cm. Um den gleichen Wert für die neue
Trommel zu erhalten, genügt es, eine Dämpfung mit % = 15 s−1 bzw. r = 300 Ns/m
zu wählen. Beachte, daß der maximale Wert für x nur für ω = ω0 erreicht wird. Dies
bedeutet, daß die Eigenschwingungsfrequenz ω, die aus der Rückstellkraft resultiert und
die eine intrinsische Konstante der Waschmaschine ist, gleich der von außen aufgeprägten
Anregungsfrequenz ist. Dieser Fall wird Resonanz genannt. Im Falle verschwindender Reibung % = 0 folgt im Resonanzfall ω → ω0 , daß a → ∞ und b → ∞ und somit x → ∞.
Die maximale Auslenkung wächst also über alle Maßen. Dieses Verhalten wird Resonanzkatastrophe genannt.
1.4
Ein wenig Theorie gewöhnlicher Differentialgleichungen
Die Modellierung dynamischer Prozesse geschieht häufig – wie in den beiden vorigen
Abschnitten – mit Hilfe von gewöhnlichen Differentialgleichungen. In diesem Abschnitt
geben wir einige Resultate aus der Theorie der Differentialgleichungen an.
Definition 1.1 Sei f : Rn × R → R eine Funktion und seien t0 , x1 , . . . , xn ∈ R. Dann
heißt
x(n) = f (x(n−1) , . . . , x0 , x, t), t ∈ R,
(1.27)
19
6
5
Auslenkung in cm
4
3
2
1
0
−1
−2
0
0.5
1
Zeit in sec.
1.5
2
Abbildung 1.7: Lösung von (1.18)–(1.19) mit % = 19 s−1 , ω 2 = 40 s−2 , γ = 3 cm.
(explizite) gewöhnliche Differentialgleichunge n-ter Ordnung, und
x(t0 ) = x1 ,
x0 (t0 ) = x2 , . . . ,
x(n−1) (t0 ) = xn
(1.28)
heißen Anfangswerte für (1.27), wobei x(i) die i-te Ableitung von x bezeichne. Wir nennen
x : I → R eine Lösung von (1.27)–(1.28), wenn I ein offenes Intervall ist, das t0 enthält,
u ∈ C n (I), und u löst (1.27)–(1.28). Das Problem (1.27)–(1.28) bezeichnen wir auch als
ein Anfangswertproblem.
Jede Differentialgleichung n-ter Ordnung kann in ein System von Differentialgleichungen 1. Ordnung umformuliert werden. Definiere dazu die Funktionen
u1 := x, u2 := x0 , . . . ,
un := x(n−1) .
Dann sind (1.27)–(1.28) äquivalent zu
u0 = F (u, t),
wobei


u1
 .. 
u =  . ,
un
t ∈ R,



F (u, t) = 


u(t0 ) = u0 ,
u1
..
.
un
f (un , . . . , u1 , t)



,


(1.29)


x1
 . 
u0 =  ..  .
xn
Es genügt also im folgenden, das Anfangswertproblem (1.29) zu untersuchen.
Die Existenz und Eindeutigkeit von Lösungen von (1.29) ist unter den folgenden Bedingungen sichergestellt.
20
Satz 1.2 Seien U ⊂ Rn eine offene Menge, F : U × R → Rn eine Funktion und (u0 , t0 ) ∈
U × R. Dann gilt:
(1) Ist F stetig, so existiert eine lokale Lösung u von (1.29), d.h., es existiert δ > 0, so
daß u ∈ C 1 (t0 − δ, t0 + δ) eine Lösung von (1.29) ist.
(2) Ist F lokal Lipschitzstetig bezüglich u gleichmäßig in t, so existiert eine eindeutige
lokale Lösung von (1.29).
(3) Ist F global Lipschitzstetig bezüglich u gleichmäßig in t, so eistiert eine eindeutige
Lösung von (1.29), die für alle t ∈ R definiert ist.
Für einen Beweis verweisen wir auf [4].
Beispiel 1.3 Das Problem
u0 =
√
u,
u ≥ 0, t ∈ R,
u(0) = 0,
besitzt unendlich viele Lösungen, nämlich
(
0
: −∞ < t ≤ t0
u(t) =
1
2
(t − t0 ) : t ≥ t0 .
4
√
Beachte, daß die Funktion F (u) = u, u ≥ 0, nicht Lipschitzstetig auf U = [0, ∞) ist.
√
Allerdings ist F (u) = u, definiert für u ∈ [u0 , ∞), u0 > 0, Lipschitzstetig, und das
entsprechende Anfangswertproblem
u0 =
√
u,
u ≥ u0 , t ∈ R,
besitzt die eindeutige Lösung u(t) = (t/2 +
√
u(0) = u0 ,
√
u0 )2 , t ≥ −2 u0 .
¤
Von besonderem Interesse sind Systeme linearer Differentialgleichungen
u0 = Au,
u ∈ Rn , t ∈ R,
u(0) = u0 ,
(1.30)
mit A ∈ Rn×n . Diese besitzen immer eine eindeutige Lösung für alle t ∈ R, da F (u) = Au
global Lipschitzstetig ist. Wieviele Lösungen hat
u0 = Au,
u ∈ Rn , t ∈ R?
Wir behaupten, daß der Lösungsraum
U = {u ∈ C 1 (R; Rn ) : u0 = Au}
21
ein linearer Raum der Dimension n ist. Für den Beweis definieren wir eine Abbildung
H : U → Rn durch H(u) = u(0). Die Funktion H ist linear (da die Differentialgleichung
linear ist), injektiv (da die Differentialgleichung eindeutig lösbar ist) und surjektiv (da die
Gleichung eine globale Lösung besitzt). Damit ist H ein Isomorphismus zwischen U und
Rn , und es folgt dim U = dim Rn = n.
Wie sehen die Lösungen von (1.30) aus? Die Matrix A kann durch eine Ähnlichkeitstransformation in die Jordansche Normalenform


λk 1
0




λk 1


J = diag(B1 , . . . , Bm ) mit Bk = 
...

1 

0
λk
gebracht werden, d.h., es existiert eine invertierbare Matrix Q mit A = Q −1 JQ. Sei nun
u eine Lösung von u0 = Au und v := Qu. Dann löst v
v 0 = Qu0 = QAu = QAQ−1 v = Jv.
(1.31)
Dieses System kann einfach rekursiv für jeden Block Bk gelöst werden. Aus






λk 1
0
vk1
vk1


  . 
λk 1
d  .  
  .. 
 ..  = 
.


.
dt
.
1


vkN
vkN
0
λk
folgt
0
vkN
= λk vkN ,
also
vkN (t) = eλk t ,
0
λk t
, also vk,N −1 (t) = teλk t ,
vk,N
−1 = λk vk,N −1 + e
2
0
λk t
vk,N
, also vk,N −2 (t) = t2 eλk t usw.
−2 = λk vk,N −2 + te
Die allgemeine Lösung von (1.31) hat die Struktur
v(t) =
X ti
i,k
i!
e λk t .
Folglich hat die Lösung u von u0 = Au die Lösungsstruktur
X
u(t) = Q−1 v(t) =
qik ti eλk t ,
i,k
wobei qik die Matrixelemente von Q−1 sind. Sind die Eigenwerte λk komplex, suchen
wir jedoch reellwertige Lösungen, und u enthält dann wegen eλt = eReλ·t (cos(Imλ · t) +
i sin(Imλ · t)) die Terme
t i e λk t
und ti eReλk ·t (ak cos(Imλk · t) + bk sin(Imλk · t)).
22
Die Lösung von (1.30) kann auch kompakt als
u(t) = eAt u0 ,
geschrieben werden, wobei
e
At
t ∈ R,
∞
X
1 k k
t A .
:=
k!
k=0
Man kann zeigen, daß diese unendliche Reihe (in der Matrixnorm) konvergiert.
Als nächsten Schritt betrachten wir die inhomogene lineare Gleichung
u0 = Au + f (t),
Die Lösung lautet
At
u(t) = e u0 +
t ∈ R,
Z
u(0) = u0 .
(1.32)
t
eA(t−s) f (s) ds.
0
Übungsaufgabe: Verifizieren Sie, daß diese Funktion eine Lösung von (1.32) ist.
Häufig ist das Langzeitverhalten der Lösung u von u0 = Au von Interesse. Da u(t) eine
Linearkombination von Termen der Form tk eλt ist und
|tk eλt | = |t|k eReλ·t
gilt, erhalten wir die folgende Aussage.
Satz 1.4 Sei u eine Lösung von u0 = Au, t > 0.
(1) Gilt für alle Eigenwerte λ von A, daß Reλ < 0, so folgt u(t) → 0 für t → ∞.
(2) Existiert ein Eigenwert λ von A, mit Reλ > 0, so folgt |u(t)| → ∞ für t → ∞.
Dieses Resultat kann für nichtlineare Gleichungen von der Form
u0 = f (u),
u ∈ U, t > 0,
u(0) = u0 ,
in folgender Weise verallgemeinert werden.
Satz 1.5 Sei U ⊂ Rn offen und f : U → Rn Lipschitzstetig. Sei weiter u∞ ∈ U mit
f (u∞ ) = 0 und sei f in einer Umgebung von u∞ stetig differenzierbar. Dann gilt:
(1) Gilt für alle Eigenwerte λ von f 0 (u∞ ), daß Reλ < 0, so ist u∞ asymptotisch stabil,
d.h., es gibt eine Umgebung W von w0 , so daß für alle u0 ∈ W gilt
|u(t) − u∞ | → 0 (t → ∞).
23
(1.33)
(2) Gibt es einen Eigenwert λ von f 0 (u∞ ) mit Reλ > 0, so ist u∞ instabil, d.h., u∞ ist
nicht stabil.
Wir nennen einen stationären Punkt u∞ (d.h. u∞ ∈ U mit f (u∞ ) = 0) stabil, wenn es für
alle offenen Mengen W ⊂ U mit u∞ ∈ W eine offene Menge V ⊂ W mit u∞ ∈ V gibt, so
daß
u0 ∈ W =⇒ u(t) ∈ W für alle t ≥ 0
(siehe Abbildung 1.8). Präsize definiert bedeutet asymptotische Stabilität eines stati-
u
u(t)
0
8
u
V
W
Abbildung 1.8: Zur Stabilität eines stationären Punktes u∞ .
onären Punktes u∞ , daß u∞ stabil ist und (1.33) gilt.
Als Beispiel betrachten wir die Schwingungsgleichung ohne anregende Kraft aus dem
vorigen Abschnitt:
x00 + 2%x0 + ω 2 x = 0,
t > 0,
wobei % im wesentlichen eine Reibungskonstante darstellt. Die Matrix des Systems erster
Ordnung mit u1 := x, u2 := x0
!µ ¶
µ ¶0 Ã
0
1
u1
u1
=
,
t > 0,
2
u2
u2
−ω −2%
besitzt die Eigenwerte
λ1,2 = −% ±
p
%2 − ω 2 ,
also Reλ1,2 < 0 genau dann, wenn % < 0. Damit ist u∞ = 0 asymptotisch stabil und
u(t) → 0 für t → ∞. Dies ist physikalisch plausibel, da die Reibung der Schwingung
so lange Energie entzieht, bis sie zur Ruhe kommt. Im Falle negativer Reibung % < 0
dagegen gilt Reλ1,2 > 0, und die Lösung ist instabil. Es ist sogar |u(t)| → ∞ für t → ∞.
Ohne Reibung % = 0 erhalten wir die allgemeine Lösung x(t) = a sin ωt + b cos ωt, die
ebenfalls instabil ist. Allerdings stellt diese Lösung einen periodischen Orbit dar. Für
weitere Informationen verweisen wir auf [4].
24
1.5
Regulär und singulär gestörte Probleme
In Abschnitt 1.2 haben wir den Aufprallzeitpunkt eines senkrecht nach oben geworfenen
Gegenstandes aus der Lösung des Anfangswertproblems
x00 = −
1
,
(εx + 1)2
t > 0,
x(0) = 0,
x0 (0) = 1
(1.34)
bestimmt, indem wir das Problem für ε = 0 explizit gelöst haben. In diesem Abschnitt
untersuchen wir, inwiefern die Lösung des Problems für ε = 0 die Lösung des vollen
Problems approximiert und wie bessere Näherungslösungen gefunden werden können.
Wir machen für das Problem (1.34) den Ansatz
x(t) = x0 (t) + εx1 (t) + O(ε2 )
(ε → 0).
Einsetzen in (1.34) und Taylorentwicklung um y = 0 von
−1
= −1 + 2y + O(y 2 )
(1 + y)2
(y → 0)
liefert
−1
= −1 + 2εx0 + O(ε2 ),
(1 + εx0 + O(ε2 ))2
x0 (0) + εx1 (0) + O(ε2 ) = 0,
x000 + εx001 + O(ε2 ) =
x00 (0) + εx01 (0) + O(ε2 ) = 1.
Ein Koeffizientenvergleich ergibt dann für
ε0 : x000 = −1,
ε1 : x001 = 2x0 ,
x0 (0) = 0, x00 (0) = 1,
(1.35)
x1 (0) = 0, x01 (0) = 0.
(1.36)
Das Problem (1.35) entspricht gerade unserem Problem (1.34) für ε = 0 und besitzt die
Lösung x0 (t) = t − t2 /2. Setzen wir dies in (1.36) ein, folgt x1 (t) = t3 /3 − t4 /12 und damit
die verbesserte Näherungslösung
³
t´
t3 ³
t´
x(t) = t 1 −
+ε
1−
+ O(ε2 ).
2
3
4
Es ist sogar möglich, die Approximation für x(t) durch den allgemeinen Ansatz
x(t) =
n
X
εk xk (t) + O(εn+1 )
k=0
zu verbessern. Der Faktor εx in der Gleichung (1.34) stört die Lösung also nur um Terme
von der Größenordnung O(ε). Solche Probleme nennen wir regulär gestört.
25
Für eine präzisere Definition betrachten wir eine Abbildung F : B1 × [0, 1] → B2 ,
wobei (B1 , k · k1 ) und (B2 , k · k2 ) zwei Banachräume seien. Wir suchen Näherungen des
Problems
F (xε , ε) = 0.
(1.37)
Es ist naheliegend, eine Lösung x0 des sogenannten reduzierten Problems
F (x0 , 0) = 0
als eine Näherung von xε zu verwenden. Um eine bessere Approximation zu finden, kann
man versuchen, den Ansatz
n
X
ε k xk
xε,n :=
k=0
in (1.37) einzusetzen, die linke Seite nach Potenzen von ε zu entwickeln und einen Koeffizientenvergleich für εk durchzuführen. Kann man
F (x, ε) =
n
X
Fj (x)εj + O(εn+1 )
j=0
(ε → 0)
entwickeln, so folgt
0 = F
n
³X
k=0
=
n
X
¡
j=0
n
n
´ X
³X
´
Fj
εk xk + O(εn+1 ), ε =
εk xk + O(εn+1 ) εj + O(εn+1 )
j=0
k=0
¢
Fj (x0 ) + Fj0 (x0 )εx1 + . . . εj + O(εn+1 ),
also für
ε0 : F0 (x0 ) = 0,
ε1 : F00 (x0 )x1 + F1 (x0 ) = 0 usw.
Wir nennen nun die Näherung xε,n konsistent, wenn das Residuum rε := F (xε,n , ε) für
ε → 0 gegen Null konvergiert:
kF (xε,n , ε)k2 → 0
(ε → 0).
Ist es möglich, die Näherungen x0 , . . . , xn zu berechnen, und ist xε,n konsistent, so nennen
wir xε,n eine formal asymptotische Entwicklung der Ordnung n von xε , und das Problem
(1.34) heißt regulär gestört, wenn für alle n ∈ N eine formal asymptotische Entwicklung
existiert. Anderenfalls nennen wir das Problem singulär gestört.
Was geschieht bei singular gestörten Problemen? Dazu betrachten wir zwei Beispiele.
26
Beispiel 1.6 Die Schwingungen gewisser selbsterregter Systeme werden durch die Vander-Pol-Gleichung
x00 + ε(x2 − 1)x0 + x = 0,
t > 0,
x0 (0) = 0,
x(0) = x,
(1.38)
beschrieben. Hierbei ist ε > 0 ein im allgemeinen “kleiner” Parameter im Sinne von ε ¿ 1.
Für |x| > 1 wird das System gedämpft, für |x| < 1 angeregt (negative Dämpfung). Wir
sind an dem Verhalten der Lösung für Zeiten t → ∞ interessiert. Die Gleichung (1.38) ist
nichtlinear und kann nicht explizit gelöst werden. Wir lösen zuerst das reduzierte Problem
x000 + x0 = 0,
x(0) = x,
x00 (0) = 0.
Die Lösung x0 (t) = x cos t, t ≥ 0, ist konsistent, denn für das Residuum rε gilt
rε = x000 + ε(x20 − 1)x00 + x0 = ε(x20 − 1)x00
und damit
krε k∞ := sup |rε (t)| ≤ εx(x2 + 1) → 0
0<t<∞
(ε → 0).
Wir arbeiten mit der Supremumsnorm, da wir an dem Lösungsverhalten in t ∈ (0, ∞)
interessiert sind.
Der Ansatz x = x0 + εx1 + O(ε2 ) und Koeffizientenvergleich führt auf die Gleichung
µ 2
¶
x
x3
2
2
00
2
0
x1 + x1 = −(x0 − 1)x0 = x(x cos t − 1) sin t = x
− 1 sin t +
sin(3t),
4
4
denn sin(3t) = (4 cos2 t − 1) sin t, und
x1 (0) = x01 (0) = 0.
Die Lösung lautet
x
x1 (t) =
2
µ
¶
x2
x3
1−
(t cos t − sin t) − (3 sin t − sin 3t).
4
32
Ist x0 + εx1 konsistent? Es gilt
rε = (x0 + εx1 )00 + ε((x0 + εx1 )2 − 1)(x0 + εx1 )0 + (x0 + εx1 )
= x000 + x0 +ε[x001 + (x20 − 1)x00 + x1 ] + ε2 [2x0 x1 x00 + (x20 − 1)x01 ] + O(ε3 ).
| {z }
{z
}
|
=0
=0
Damit konvergiert zwar rε (t) → 0 für ε → 0 punktweise, aber nicht in der Supremumsnorm
über (0, ∞), da x1 (t) unbeschränkt ist. Das Problem ist folglich singulär gestört auf (0, ∞).
27
Was ist schiefgegangen? Dazu nehmen wir an, daß x2 ≈ 1+ε mit ε > 0 und betrachten
das Näherungsproblem
x00 + ε2 x0 + x = 0,
mit der Lösung
x(t) = xe−ε
2 t/2
cos(
x(0) = x,
x0 (0) = 0,
p
1 − ε2 /4 t),
t ≥ 0.
Diese Funktion hat zwei Zeitskalen: eine Skala einer “langsamen Zeit” der Größenordnung
2
O(1/ε2 ) durch den Term e−ε t/2 und eine Skala einer “schnellen Zeit” der Größenordnung
p
O(1) wegen des Terms cos( 1 − ε2 /4 t). Es ist naheliegend zu vermuten, daß auch die
Van-der-Pol-Gleichung (1.38) zwei Zeitskalen besitzt. Wir machen daher den Ansatz
x(t) = x0 (t0 , t1 ) + εx1 (t0 ) + O(ε2 ) mit t0 = t0 (t) = t, t1 = t1 (t) = εt.
Mit der Kettenregel folgt
∂x0 dt0 ∂x0 dt1
∂x0
∂x0
dx0
=
+
=
+ε
,
dt
∂t0 dt
∂t1 dt
∂t0
∂t1
2
d 2 x0
∂ 2 x0
∂ 2 x0
2 ∂ x0
+
2ε
.
=
+
ε
dt2
∂t20
∂t0 t1
∂t21
Wir setzen den obigen Ansatz in (1.38) ein und erhalten
0 = x00 + ε(x2 − 1)x0 + x
∂ 2 x0
∂ 2 x0
d 2 x1
∂x0
=
+
2ε
+
ε
+ ε(x20 − 1)
+ x0 + εx1 + O(ε2 )
2
2
∂t0
∂t0 ∂t1
dt0
∂t0
und
x = x(0) = x0 (0, 0) + εx1 (0) + O(ε2 ),
∂x0
∂x0
dx1
0 = x0 (0) =
(0, 0) + ε
(0, 0) + ε
(0) + O(ε2 ).
∂t0
∂t1
dt0
Ein Koeffizientenvergleich impliziert
∂ 2 x0
∂ 2 x0
x,
+
x
=
0,
x
(0,
0)
=
(0, 0) = 0,
0
0
∂t20
∂t0
∂x0
∂ 2 x0
d 2 x1
− (x20 − 1)
,
+
x
=
−2
:
1
2
dt0
∂t0 ∂t1
∂t0
dx1
∂x0
x1 (0) = 0,
(0) = −
(0, 0).
dt0
∂t1
ε0 :
(1.39)
ε1
(1.40)
Die Lösung von (1.39) lautet
x0 (t0 , t1 ) = a(t1 ) cos(t0 + b(t1 )),
28
wobei a und b beliebige (differenzierbare) Funktionen mit a(0) = x, b(0) = 0 sind. Setzen
wir diese Lösung in (1.40) ein, so folgt nach etwas Rechnung
¶
µ
d 2 x1
da
a3
sin(t0 + b(t1 ))
(1.41)
+ x1 =
2
−a+
dt20
dt1
4
db
a3
+2a
cos(t0 + b(t1 )) +
sin 3(t0 + b(t1 )).
dt1
4
In Abschnitt 1.2 haben wir gesehen, daß die Schwingungsgleichung
x00 + x = sin t oder x00 + x = cos t
(1.42)
Resonanz erzeugt, d.h., die anregende Kraft schaukelt die Schwingungen immer stärker
auf. Mathematisch bedeutet dies, daß die Lösungen von (1.42) unbeschränkt sind. Solche
Lösungen schließen wir aus, da wir ja damit rechnen, daß Lösungen mit |x| > 1 gedämpft
werden. Wir erhalten genau dann keine Resonanz, wenn die Koeffizienten vor den sinund cos-Termen in (1.42) verschwinden. Dies führt auf die folgenden Gleichungen für die
Funktionen a und b:
µ
¶
a2
a
da
1−
,
a(0) = x,
=
dt1
2
4
db
= 0,
b(0) = 0,
dt1
mit Lösungen
Damit folgt
2x
a(t1 ) = p 2
,
x − (x2 − 4)e−t1
b(t1 ) = 0,
2x cos t
,
x0 (t, εt) = p 2
x − (x2 − 4)e−εt
t1 ≥ 0.
t ≥ 0.
Dies ist sicherlich eine bessere Approximation als die Lösung u0 (t) = x cos t des reduzierten
Problems. Insbesondere folgt
|x0 (t, εt)2 − 4 cos2 t| =
4|x2 − 4|e−εt cos2 t
→0
x2 − (x2 − 4)e−εt
(t → ∞)
und folglich
u0 (t, εt) − 2 cos t → 0
(t → ∞).
Damit ist das Verhalten der Näherungslösung u0 (t, εt) der Van-der-Pol-Gleichung geklärt.
Man nennt übrigens 2 cos t auch Grenzzykel, da sich die Lösung für t → ∞ dem Graphen
von 2 cos t annähert. Dies gilt auch für die Lösung des vollen Problems (1.38).
29
Beispiel 1.7 Wir betrachten
−εu00 + u0 + u = 0,
x ∈ (0, 1),
u(0) = 1,
u(1) = 0.
(1.43)
Da wir die Randwerte der gesuchten Funktion u(x) vorgegeben haben, nennt man (1.43)
ein Randwertproblem. Das reduzierte Problem
u0 + u = 0,
x ∈ (0, 1),
u(0) = 1,
u(1) = 0
hat keine Lösung, da die allgemeine Lösung von u0 + u = 0, nämlich u(x) = ce−x mit
c ∈ R, nicht beide Randbedingungen gleichzeitig erfüllen kann. Es gibt also nicht einmal
eine formale asymptotische Näherung der Ordnung null. Das Problem (1.43) ist folglich
singulär gestört. Wir erwarten, daß sich eine asymptotische Näherung im Innern von (0, 1)
wie ce−x verhält, aber in der Nähe von x = 0 bzw. x = 1 eine Grenzschicht aufweist, um
die Randbedingungen erfüllen zu können. Um das Verhalten in der Nähe der Grenzschicht
analysieren zu können, verwenden wir eine Art “mathematische Lupe”, genauer eine Variablentransformation, etwa
x
α > 0,
ξ = α,
ε
in der Nähe von x = 0. Wir nennen ξ eine Grenzschichtvariable. Die Funktion v(ξ) =
u(x/εα ) erfüllt wegen v 0 = εα u0 die Gleichung
−ε1−2α v 00 + ε−α v 0 + v = 0,
ξ ∈ (0, ε−α ).
(1.44)
Beachte, daß u0 = du/dx, aber v 0 = dv/dξ. Die Frage ist nun, welches α zu wählen
ist. Wir wollen ein α auswählen, so daß (1.44) im Grenzwert ε → 0 die “maximale”
Information enthält. Wir gehen heuristisch vor, da das Auffinden von Grenzschichten nur
schwer formalisiert werden kann. Die Vorgehensweise ist wie folgt. Wir setzen je zwei
Exponenten in (1.44) gleich und setzen voraus, daß die übrigen Exponenten nicht kleiner
sind:
−α = 0 ≤ 1 − 2α impliziert α = 0 :
das ist uninteressant;
1
1 − 2α = 0 ≤ −α
impliziert α ≤ 0 und α = 2 : Widerspruch;
1 − 2α = −α ≤ 0
impliziert α ≥ 0 und α = 1.
Der letzte Fall erscheint sinnvoll, so daß wir α = 1 wählen.
Die Grenzschichtvariable an x = 0 lautet ξ = x/ε. Analog erhalten wir für die Grenzschichtvariable η an x = 1 die Beziehung η = (1 − x)/ε. Wir wissen allerdings noch nicht,
ob es eine Grenzschicht nur an x = 0 oder nur an x = 1 oder ob es zwei Grenzschichten
gibt. Um dies herauszufinden, machen wir den Ansatz
uasym (x) = u(x) + u0 (ξ) + u1 (η)
30
für die asymptotische Näherung uasym der Lösung von u von (1.43). Wir setzen voraus,
daß die Funktionen u0 und u1 außerhalb der Grenzschicht verschwinden, genauer
d k u0
(ξ) = 0 und
ξ→∞ dξ k
lim
d k u1
(η) = 0
η→∞ dη k
lim
für alle k ≥ 0.
Wie lauten die Gleichungen für u, u0 und u1 ?
Wir fordern
³
´
00
0
0 = lim − εuasym + uasym + uasym
ε→0
´
³
1 d2 u0 1 du0
1 d2 u1 1 du1
d2 u du
+
−
= lim − ε 2 +
+u−
+
u
−
+
u
0
1
ε→0
dx
dx
ε dξ 2
ε dξ
ε dη 2
ε dη
³ du
1 d2 u0 1 du0 1 d2 u1 1 du1 ´
+u−
+
−
−
= lim
,
ε→0 dx
ε dξ 2
ε dξ
ε dη 2
ε dη
denn u0 (ξ) = u0 (x/ε) → 0 für ε → 0 bzw. ξ → ∞ (x > 0) und analog u1 (η) → 0 für
ε → 0 bzw. η → ∞ (x > 0). Die obige Gleichung ist erfüllt, wenn
du
+u=0
dx
und
d2 u0 du0
−
= 0,
dξ 2
dξ
(1.45)
d2 u1 du1
−
=0
dη 2
dη
(1.46)
gelten. Die allgemeine Lösung von (1.45) lautet u(x) = c1 e−x ; dies ist wie erwartet die
Lösung im “Innern” von (0, 1). Die allgemeinen Lösungen von (1.46) lauten
u0 (ξ) = c2 + c3 eξ
und
u1 (η) = c4 + c5 e−η .
Wegen u0 (ξ) → 0 für ξ → ∞ muß c2 = c3 = 0 gelten. Die Forderung u1 (η) → 0 für
η → ∞ impliziert c4 = 0. Wir erhalten also nur eine Grenzschicht an x = 1. Die Lösung
lautet nun
uasym (x) = c1 e−x + c5 e−(1−x)/ε .
Die Konstanten c1 und c5 können aus den Randbedingungen uasym (0) = 1 und uasym (1) = 0
berechnet werden; das Resultat ist
uasym (x) =
e−x − e−1+(x−1)/ε
,
1 − e−(1+1/ε)
x ∈ [0, 1].
(1.47)
Die Funktion uasym ist in Abbildung 1.9 dargestellt; die Grenzschicht in der Nähe von
x = 1 ist deutlich erkennbar.
Ist die Näherung von uasym konsistent? Dazu berechnen wir das Residuum
rε (x) = −εu00asym + u0asym + uasym = −
31
εe−x + e−1+(x−1)/ε
.
1 − e−(1+1/ε)
1
0.8
u(x)
0.6
0.4
0.2
0
0
0.2
0.4
0.6
0.8
1
x
Abbildung 1.9: Plot der Funktion uasym aus (1.47) für ε = 0.01.
Es gilt rε (x) → 0 für ε → 0, wenn x ∈ [0, 1), aber
rε (1) = −
εe−1 + e−1
1
→− ,
−(1+1/ε)
1−e
e
für ε → 0.
Dies bedeutet, daß uasym nicht in der Supremumsnorm konsistent ist. Allerdings ist uasym
in der sogenannten L2 -Norm k · k2 konsistent, wobei
kuk2 :=
In der Tat, wir berechnen
Z 1
rε (x)2 dx =
0
µZ
1
2
u(x) dx
0
1
(1 − e−(1+1/ε) )2
Z
¶1/2
.
1
(εe−x + e−1+(x−1)/ε )2 dx
0
−1/ε+1
ε2
ε −2
−1
−2/ε
2 −2 1 − e
=
(1 − e ) + e (1 − e
) + 2ε e
2
2
1−ε
≤ const. ε → 0
(ε → 0).
Für weitere Informationen über das Verhalten von Lösungen von Differentialgleichungen mit kleinen Parameters verweisen wir auf [1, 7].
Übungsaufgabe: Ist das Problem
x00 + x = εx,
t > 0,
x(0) = x,
regulär oder singulär gestört auf t ∈ (0, ∞)?
32
x0 (0) = 0,
Übungsaufgabe: Wir sagen, eine Funktionenfolge uε : U → R, ε > 0, hat ein Grenzschichtverhalten an x0 ∈ U genau dann, wenn der Grenzwert limε→0 uε in der Supremumsnorm über jede Menge V mit V ⊂ U \{x0 } existiert, aber nicht in der Supremumsnorm
über U .
(1) Hat die Lösung u von
εu0 = −u + x + ε,
x > 0,
u(0) = 1,
ein Grenzschichtverhalten?
(2) Hat die Funktion uasym aus (1.47) ein Grenzschichtverhalten?
33
2
Dynamik
In diesem Kapitel betrachten wir zeitabhängige Prozesse, die das dynamische Verhalten
einer oder mehrerer Variablen beschreiben und die zumeist auf Anfangswertprobleme für
Differentialgleichungen führen.
2.1
Populationsmodelle
Kulturpflanzen werden zum Großteil unter kontrollierten Bedingungen in Gewächshäusern
gezogen. Leider sind dies auch ideale Bedingungen für die Vermehrung von Schädlingen,
wie etwa der gemeinen Spinnmilbe. Wird eine Pflanze von zu vielen Spinnmilben befallen,
stirbt sie ab. Das Ziel ist also, die Anzahl der Spinnmilben möglichst gering zu halten.
Prinzipiell kann dies durch den Einsatz von Insektiziden geschehen. Dies hat jedoch einige
entscheidende Nachteile: Insektizide wirken im allgemeinen nur für kurze Zeit, die behandelten Pflanzen dürfen für einige Zeit nicht abgeerntet werden, und Insektizide haben
negative Auswirkungen auf die Umwelt. Eine sinnvolle, ökologisch vertretbare Alternative ist das Aussetzen von natürlichen Feinden, etwa der Raubmilbe. Hierbei stellt sich die
folgende Frage:
Frage: Wieviel Raubmilben müssen ausgesetzt werden, damit die Anzahl der Spinnmilben unter eine vorgegebene Grenze sinkt?
Um diese Frage zu beantworten, müssen wir uns etwas eingehender mit Populationsmodellen befassen. Sei x(t) ≥ 0 die Anzahl der Spinnmilben (etwa pro Pflanze) zur Zeit
t. Die zeitliche Änderung der Spinnmilbenpopulation ist gegeben durch
x0 = (g − s)x,
t > 0,
x(0) = x0 ,
(2.1)
wobei g ≥ 0 die Geburtsrate und s ≥ 0 die Sterberate ist. Die Lösung lautet x(t) =
x0 e(g−s)t . Ist die Geburtsrate größer als die Sterberate, so wächst die Spinnmilbenpopulation unbegrenzt. Das ist unrealistisch, da das begrenzte Nahrungsangebot nicht berücksichtigt wird. Ein Vorschlag ist, die Sterberate
s = s(x) = s0 + ax
zu wählen, wobei s0 ≥ 0 die natürliche Sterberate und a ≥ 0 ist. Ist die Population sehr
groß, so wächst auch die Sterberate, und wir erwarten, daß sich die Population auf einen
gewissen Wert einpendelt. Aus (2.1) ergibt sich mit b = g − s0 die sogenannte logistische
Differentialgleichung (oder das Verhulst-Modell)
x0 = x(b − ax),
t > 0,
34
x(0) = x0 .
Durch Integration
¶
Z x(t) µ
1 1
a
dx
dx
dτ =
=
+
t =
b x b − ax
x(0) x(b − ax)
x0
0
µ
¶
1
b − ax0
x(t)
=
+ a ln
ln
b
x0
b − ax(t)
Z
Z
t
x(t)
und Auflösen nach x(t) erhalten wir die Lösung
x(t) =
bx0
,
ax0 + (b − ax0 )e−bt
Für t → ∞ folgt
x(t)
−→
(
t ≥ 0.
b/a : b > 0,
0 : b < 0.
Ist also die natürliche Sterberate mindestens so groß wie die Geburtsrate, sterben die
Spinnmilben aus, andernfalls wächst die Population monoton gegen den Grenzwert b/a.
Der Wert b/a kann als Aufnahmekapazität der Umgebung interpretiert werden.
Wie kann die Raubmilbenpopulation modelliert werden? Sei y(t) die Anzahl der Raubmilben (pro Pflanze) zur Zeit t. Wir können für die zeitliche Entwicklung der Raubmilbenpopulation einen ähnlichen Ansatz wie oben machen:
y 0 = y(d − cy),
t > 0,
y(0) = y0 ,
wobei c ≥ 0. Die Zuwachsrate d sollte aber nun von der Anzahl der Spinnmilben abhängen.
Ist nämlich nicht genügend Beute vorhanden, werden die Raubmilben aussterben:
d = d(x) = −d1 + d2 x
mit d1 , d2 ≥ 0.
Entsprechend müssen wir die Evolutionsgleichung für die Spinnmilben ändern: Die Zuwachsrate b vermindert sich um den Anteil gefressener Spinnmilben, der proportional zur
Anzahl der Raubmilben ist:
b = b(y) = b1 − b2 y
mit b1 , b2 ≥ 0.
Damit erhalten wir das Lotka-Volterrasche Populationsmodell
x0 = x(b1 − b2 y − ax),
y 0 = y(−d1 + d2 x − cy),
t > 0,
x(0) = x0 ,
(2.2)
t > 0,
y(0) = y0 .
(2.3)
Wir wollen verstehen, wie sich die Lösungen verhalten. Zuerst betrachten wir den Fall,
daß die Koeffizienten a und c vernachlässigbar sind. Dies ist das Volterrasche Modell
0
x0 = x(b1 − b2 y),
y = y(−d1 + d2 x),
35
t > 0,
x(0) = x0 ,
(2.4)
t > 0,
y(0) = y0 .
(2.5)
Es besitzt die beiden stationären Punkte
µ ¶ µ ¶
x1
0
und
=
0
y1
µ ¶ µ
¶
x2
d1 /d2
=
.
y2
b1 /b2
Um herauszufinden, ob diese Punkte (asymptotisch) stabil oder instabil sind, berechnen
wir die Ableitung der Funktion
¶
µ
x(b1 − b2 y)
,
x, y ≥ 0,
F (x, y) =
y(−d1 + d2 x)
in diesen Punkten:
0
F (0, 0) =
Ã
b1 0
0 −d1
!
,
F
0
³d
b1 ´
,
=
d 2 b2
1
Ã
0 b1
d1 0
!
.
Folglich ist (0, 0)> nicht stabil, wenn b1 > 0. Der Punkt (x2 , y2 ) ist instabil, da die Eigen√
werte von F 0 (x2 , y2 ) gerade λ1/2 = ± b1 d1 lauten. Wir können das Verhalten der Lösung
in der Nähe dieses Punktes allerdings genauer wie folgt beschrieben.
Dafür schreiben wir (2.4)–(2.5) in der Form
dx/dt
x0
x(b1 − b2 y)
dx
=
= 0 =
dy
dy/dt
y
y(−d1 + d2 x)
bzw.
Z
b1 − b 2 y
−d1 + d2 x
dx =
dy = ln y b1 − b2 y − α,
− ln x + d2 x =
x
y
wobei α ∈ R eine Integrationskonstante ist. Daher erfüllen alle Lösungen (x(t), y(t)) die
implizite Lösungsformel
d1
Z
ln x(t)d1 + ln y(t)b1 − d2 x(t) − b2 y(t) = α
∀ t ≥ 0.
(2.6)
Die Integrationskonstante kann aus den Anfangswerten (x0 , y0 ) berechnet werden:
α = ln xd01 + ln y0b1 − d2 x0 − b2 y0 .
Wir behaupten, daß die Menge aller (x(t), y(t)), die (2.6) erfüllen, eine geschlossene
Kurve darstellt. Wir zeigen allerdings ein etwas schwächeres Resultat: In einer Umgebung
von (x2 , y2 ) können wir (x(t), y(t)) näherungsweise durch
x(t) =
d1
+ ε sin ωt,
d2
y(t) =
b1
+ δ cos ωt
b2
mit 0 < ε, δ ¿ 1 und ω > 0 darstellen. Insbesondere ist für t = 0
³b
´
d1
1
α = d1 ln + b1 ln
+ δ − d 1 − b1 − b2 δ
d2
b2
b1
d1
(δ → 0).
= d1 ln + b1 ln − d1 − b1 + O(δ)
d2
b2
36
Wir setzen den Ansatz für (x(t), y(t)) in (2.6) ein und approximieren um b1 /b2 bzw. d1 /d2 :
d1 ln x(t) + b1 ln y(t) − d2 x(t) − b2 y(t)
d1
b1
d22 2 2
b22 2
= d1 ln + d2 ε sin ωt + b1 ln + b2 δ cos ωt +
ε sin ωt +
δ cos2 ωt
d2
b2
2d1
2b1
3
3
− d1 − d2 ε sin ωt − b1 − b2 ε cos ωt + O(ε + δ )
b1
d 2 ε2
b2 δ 2
d1
= d1 ln + b1 ln − d1 − b1 + 2 sin2 ωt + 2 cos2 ωt + O(ε3 + δ 3 )
d2
b2
2d1
2b1
2
= α + O(ε ),
wenn wir
b2 δ 2
d22 ε2
= 2
2d1
2b1
wählen. Wir schließen, daß (x(t), y(t)) die implizite Lösungsformel (2.6) bis auf einen Fehler der Ordnung O(ε2 ) löst. Die Trajektorien {(x(t), y(t)) : t ≥ 0} sind also näherungsweise
Ellipsen um (x2 , y2 ).
Das Resultat können wir folgendermaßen interpretieren: Starten wir bei einem Anfangswert x0 À y0 , so können sich die Spinnmilben so lange vermehren, bis genügend
Raubmilben herangewachsen sind, die die Spinnmilbenpopulation verringern. Ist die Anzahl der Spinnmilben zu gering geworden, haben die Raubmilben zu wenig Nahrung und
ihre Population schrumpft. Diese Reduktion erlaubt es den Spinnmilben, sich ungehindert
zu vermehren, und der Kreislauf beginnt von vorne.
Im Volterra-Modell kann also die Spinnmilbenpopulation nicht dauerhaft dezimiert
werden. Allerdings setzt das Modell ein unbegrenztes Wachstum voraus, was nicht realistisch ist. Wir betrachten also im folgenden das Lotka-Volterra-Modell (2.2)–(2.3). Wir
berechnen zuerst die stationären Punkte:
µ ¶ µ ¶
µ ¶ µ
¶
µ ¶ µ
¶
x1
0
x2
0
x3
b1 /a
=
,
=
,
=
,
y1
0
y2
−d1 /c
y3
0
und (x4 , y4 )> ist die Lösung des linearen Gleichungssystems
Ã
!µ ¶ µ ¶
a b2
x4
b1
=
.
y4
d1
d2 −c
(2.7)
Da wir x, y ≥ 0 fordern, ist (x2 , y2 )> kein biologisch sinnvoller stationärer Punkt. Aus
Ã
!
b
−
b
y
−
2ax
−b
x
1
2
2
F 0 (x, y) =
d2 y
−d1 + d2 x − 2cy
und Satz 1.5 schließen wir, daß (x1 , y1 ) instabil ist. Der Punkt (x3 , y3 ) ist instabil, wenn
d1 /d2 < b1 /a, und asymptotisch stabil, wenn d1 /d2 > b1 /a. Da b1 /a gerade die asymptotische Anzahl der Spinnmilben im Verhulst-Modell ist, bedeutet d1 /d2 > b1 /a, daß
37
die Sterberate der Raubmilben zu groß ist, um durch das vorhandene Nahrungsangebot
kompensiert zu werden; die Raubmilben sterben aus.
Das lineare Gleichungssystem (2.7) besitzt die Lösung
¶
µ ¶
µ
1
x4
b1 c + b 2 d 1
=
,
y4
ac + b2 d2 b1 d2 − ad1
die genau dann im ersten Quadranten x, y ≥ 0 liegt, wenn d1 /d2 < b1 /a. Die Eigenwerte
von F 0 (x4 , y4 ) lauten
r
1
1
λ1,2 = − (aA + cB) ±
(aA + cB)2 − (b2 d2 + ac)AB,
2
4
wobei A = b1 c + b2 d1 > 0 und B = b1 d2 − ad1 > 0. Wegen Reλ1,2 < 0 ist der stationäre
Punkt (x4 , y4 ) asymptotisch stabil, d.h. (x(t), y(t)) → (x4 , y4 ) für t → ∞. Selbst wenn
wir eine große Anzahl von Raubmilben aussetzen, wird die Anzahl der Spinnmilben nach
hinreichend langer Zeit
b1 c + b 2 d 1
x4 =
ac + b2 d2
betragen. Wir fassen zusammen:
b1
d1
>
: x(t) →
d2
a
b1
d1
: x(t) →
<
d2
a
b1
und y(t) → 0 für t → ∞;
a
b1 c + b 2 d 1
b1 d2 − ad1
und y(t) →
ac + b2 d2
ac + b2 d2
für t → ∞.
Übungsaufgabe: Lösen Sie das Lotka-Volterra-Modell numerisch für verschiedene Parameterwerte. Wie läßt sich die maximale Spinnmilbenanzahl effektiv begrenzen?
Läßt sich das obige Modell verbessern? Wir haben angenommen, daß die Zuwachsrate
durch b(y) = b1 − b2 y modelliert wird. Die Spinnmilben werden also von den Raubmilben
dezimiert, wenn b(y) < 0 bzw. y > b1 /b2 gilt. Nun kann man argumentieren, daß die
Zuwachsrate zusätzlich von der Spinnmilbenpopulation abhängen sollte: Sind sehr viele
Spinnmilben vorhanden, muß die Anzahl der Raubmilben deutlich größer als b1 /b2 sein,
um die Spinnmilben auffressen zu können. Wir fordern also b2 = b2 (x). Eine mögliche
Wahl ist
β0
b2 (x) =
,
β0 , β1 > 0.
x + β1
Ist die Anzahl der Spinnmilben x deutlich größer als β1 , werden nur wenige Spinnmilben
gefressen, da
β0 y
≈ β0 y
für x À β1 ;
b2 (x)xy =
1 + β1 /x
falls die Spinnmilbenpopulation den Wert β1 deutlich unterschreitet, erhalten wir den
Lotka-Volterra-Term
β0
b2 (x)xy ≈ xy
für x ¿ β1 .
β1
38
Eine andere Variante des Modells ist die verfeinerte Annahme, daß die maximal mögliche Raubmilbenpopulation von der Anzahl der Spinnmilben abhängt: je größer das Nahrungsangebot für die Raubmilben ist, desto stärker können sich diese vermehren. Andererseits ist die Spinnmilbenanzahl durch die Menge der Pflanzen im Gewächshaus begrenzt:
a = const.,
c = c(x).
Ein möglicher Ansatz ist c = c0 /x. Für x → 0 geht dann auch die maximal mögliche Raubmilbenpopulation gegen Null. In diesem Fall genügt es, die Zuwachsrate d als konstant
anzunehmen. Wir erhalten das Modell
¶
µ
β0 y
0
− ax , t > 0, x(0) = x0 ,
x = x b1 −
x+
β1
³
´
c0
y0 = y d − y ,
t > 0, y(0) = y0 .
x
Übungsaufgabe: Bestimmen Sie die stationären Punkte und klassifizieren Sie diese
(instabil oder asymptotisch stabil). Lösen Sie das System numerisch. Unterschied zum
Lotka-Volterra-Modell?
2.2
Ein Modell für Aids
Populationsmodelle können auch für die Modellierung und Simulation der körpereigenen
Abwehrreaktionen nach einer Infektion mit dem HIV-Virus eingesetzt werden. In diesem
Abschnitt stellen wir ein einfaches Modell vor. Es sollte erwähnt werden, daß die verschiedenen Mechanismen der Immunreaktion im menschlichen Körper derzeit noch nicht
vollständig verstanden sind, so daß jedes Modell für Aids nur einen kleinen Ausschnitt
aus der Realität darstellen kann.
Für die Modellierung benötigen wir allerlei Kenntnisse über das Immunsystem. Ein
zentraler Bestandteil sind die sogenannten T-Zellen, die laufend von der Thymusdrüse
abgeschieden werden und die eine endliche Lebensdauer besitzen. Dringen Fremdkörper
oder Viren in den Organismus ein, vermehren sich die T-Zellen durch Zellteilung, um die
Eindringlinge abzuwehren. Genauer gesagt gibt es zwei Typen von T-Zellen: die CD4 +
und die CD8+ T-Zellen. Werden Eindringliche erkannt, aktivieren die CD4+ T-Zellen die
Produktion von CD8+ T-Zellen, die von einem Virus befallene Zellen oder den Virus
direkt unschädlich machen. Außerdem aktivieren die CD4+ T-Zellen sogenannte B-Zellen
(Blutzellen), die Antikörper produzieren können. Die Antikörper wiederum sind in der
Lage, den Virus zu vernichten. Im folgenden vernachlässigen wir den Einfluß von B-Zellen.
Wie wirkt sich eine HIV-Infektion aus? Der HIV-Virus dringt in CD4 + T-Zellen (aber
nicht in CD8+ T-Zellen) ein und wird dann innerhalb der Zelle reproduziert. Bei dem Versuch, sich zu teilen, platzen die infizierten CD4+ T-Zellen, und alle zwischenzeitlich pro39
duzierten Viren gelangen auf diese Weise in den Blutkreislauf. Der Virus kann auch Thymozyten (eine Vorstufe der T-Lympozyten, die die Infektabwehr durch Abtöten infizierter
Zellen unterstützen) und Makrophasen (Blutabwehrzellen, die Viren und geschädigte Zellen zerstören) befallen. Das Zusammenspiel des HIV-Virus, der CD4+ und CD8+ T-Zellen
ist in Abbildung 2.1 zusammengefaßt.
HIV
zerfällt
kranke CD4
+
gesunde CD4
+
zerstört
infiziert
zerstört
CD8
+
stimuliert Produktion
Abbildung 2.1: Interaktionen zwischen dem HIV-Virus und den CD4+ und CD8+ T-Zellen.
Die HIV-Erkrankung kann in vier Stadien unterteilt werden:
Der Virus dringt in den Körper ein.
Die Virus- und T-Zellenpopulationen wachsen an.
Eine große Anzahl von Viren und T-Zellen interagieren miteinander. Dieser Zustand
kann einen langen Zeitraum umfassen.
Die Anzahl der T-Zellen geht gegen Null, während sich die Viren ungehindert vermehren. Die körpereigenen Abwehrkräfte schwinden zusehens, und der Patient stirbt
an einem ansonsten harmlosen Infekt. Dies ist das Aids-Stadium.
Zur Zeit gibt es keine Therapie, die Aids heilt. Allerdings sind Medikamente wie AZT
(Azidothymidine) entwickelt worden, die die Vermehrung des Virus verhindern und damit die Erkrankung verzögern. Der Gewinn an Lebenszeit wird allerdings durch starke
Nebenwirkungen (Blutarmut, Verminderung der weißen Blutkörperchen, Übelkeit, Erbrechen usw.) erkauft. Soll das Medikament eingesetzt werden, so stellt sich die folgende
Frage:
Frage: In welchem Stadium der Erkrankung und über welchen Zeitraum führt die Medikamentation von AZT bei Aids-Kranken zu einer möglichst optimalen Lebensverlängerung
(bei gleichzeitiger Minimierung der Zeit, in der AZT verabreicht wird)?
Die Aids-Erkrankung ist zu komplex, um diese Frage zufriedenstellend beantworten zu
können. Wir wollen ein einfaches Modell aufstellen und die Frage anhand dieses Modells
40
untersuchen. Es ist klar, daß wir ein dynamisches Modell für die HIV-Viren, die gesunden
und kranken CD4+ T-Zellen und die CD8+ T-Zellen aufstellen müssen. Wir wählen die
folgenden Variablen:
x(t) = Anzahl der gesunden CD4+ und der CD8+ T-Zellen (pro Milliliter Blut)
zur Zeit t,
y(t) = Anzahl der kranken CD4+ T-Zellen zur Zeit t,
v(t) = Anzahl der HIV-Viren zur Zeit t.
Die zeitliche Änderung x0 (t) der gesunden CD4+ und der CD8+ T-Zellen wird modelliert
durch
eine Quelle neuer T-Zellen vom Thymus, etwa a > 0 (eigentlich hängt a von v(t)
ab, da der Virus Thymozyten infizieren kann);
einen natürlichen Sterbeterm −s1 x mit der durchschnittlichen Lebenserwartung
1/s1 einer T-Zelle;
eine Stimulation von T-Zellen durch Zellteilung mittels eines Terms, der mit der
Anzahl der HIV-Viren wächst, aber insgesamt beschränkt bleibt, rxv/(v +D), wobei
D die Virenzahl angibt, für die die Zellteilungsrate halb so groß wie die Maximalrate
ist;
eine Reduktion von T-Zellen durch Infektion, −bxv.
Die Änderung y 0 (t) der kranken CD4+ T-Zellen beschreiben wir durch
den Zuwachsterm bxv infolge Infektionen mit dem HIV-Virus;
einen Verlustterm, der die endliche Lebenserwartung der T-Zellen modelliert, −s 2 y,
und der das Zerplatzen der T-Zellen beschreibt, −ryv/(v + D).
Die Änderung v 0 (t) der Virenzahl sei schließlich gegeben durch
das Freisetzen von N Viren infolge einer geplatzten T-Zelle, N ryv/(v + D);
einen Verlustterm, der die Vernichtung der Viren durch CD8+ T-Zellen modelliert,
−dxv;
die Vermehrung des Virus von anderen Zellen (z.B. Thymozyten und Mikrophagen),
gv/(v + C), die pro Zeiteinheit beschränkt bleibt.
41
Wir nehmen an, daß alle auftretenden Konstanten positiv sind.
Mit diesen Modellierungsannahmen lautet unser System von Differentialgleichungen
wie folgt:
rxv
x0 = a − s 1 x +
− bxv,
(2.8)
v+D
ryv
,
(2.9)
y 0 = bxv − s2 y −
v+D
ryv
gv
− dxv +
,
t > 0.
(2.10)
v0 = N
v+D
v+C
Als Anfangswerte wählen wir
x(0) = x0 ,
y(0) = 0,
v(0) = v0 .
(2.11)
5
10
4
10
Gesunde T−Zellen
Infizierte T−Zellen
HIV−Viren
Anzahl
3
10
2
10
1
10
0
10
0
2
4
6
8
Zeit in Jahren
10
12
Abbildung 2.2: Simulierter Verlauf einer Aids-Infektion mit b = 2.4 · 10 −5 .
Das System (2.8)–(2.11) ist nicht so einfach zu analysieren wie die Populationsmodelle aus dem vorigen Abschnitt. Wir präsentieren hier nur numerische Lösungen für die
Parameter
a = 10,
s2 = 0.265,
s1 = 0.01,
N = 1000,
r = 0.01,
d = 7.64 · 10−4 ,
D = 100,
g = 20,
−5
b = 2.4 · 10 ,
C = 1.
In Abbildung 2.2 sehen wir den zeitlichen Verlauf der Aids-Erkrankung mit x0 = 1000,
v0 = 10. Der Virus verharrt nach der Infektion über Jahre hinweg im Körper des HIVpositiven Patienten, bevor schließlich nach mehreren Jahren die Immunschwächekrankheit
42
Aids ausbricht. Innerhalb relativ kurzer Zeit (in einem Zeitraum von etwa einem Jahr)
nimmt die Anzahl der gesunden T-Zellen rapide ab; der Patient verfügt schließlich über
keine nennenswerte Immunabwehr und stirbt.
5
10
4
10
Gesunde T−Zellen
Infizierte T−Zellen
HIV−Viren
Anzahl
3
10
2
10
1
10
0
10
0
5
10
Zeit in Jahren
15
Abbildung 2.3: Simulierter Verlauf einer Aids-Infektion bei Medikamentengabe nach 5
Jahren für 200 Tage (B(t) = 0.4b für 1825 ≤ t ≤ 2025 Tage).
Um die eingangs gestellt Frage zu erörtern, simulieren wir den Verlauf der Krankheit
bei einmaliger Gabe eines Medikaments, das die Vermehrung des Virus bzw. die Infektionsrate mindert. Wir nehmen an, daß in dieser Zeit die Infektionsrate b durch B(t) = 0.4 · b
ersetzt werden kann. In Abbildung 2.3 erkennen wir, daß nach der Medikamentengabe
die Virenzahl rapide abnimmt, aber nach dem Absetzen des Medikaments schnell wieder
den alten Wert erreicht. Allerdings ist der Ausbruch der Aids-Erkrankung um mehrere
Jahre verschoben worden. Der Effekt der Medikamentation ist noch größer, wenn das
Medikament erst im 7. Jahr kurz vor Ausbruch der Erkrankung verabreicht wird (siehe
Abbildung 2.4). Die Krankheit bricht erst nach einem etwa doppelt so langen Zeitraum
wie ohne Medikament aus.
Wenngleich dieses Modell das qualitative Verhalten der Aids-Krankheit frappierend
genau widerspiegelt, ist es weit von der Realität entfernt. Es ist etwa die Sterberate
der Viren, die zwischen zwei bis fünf pro Tag liegt, zu berücksichtigen. Wir haben die
Halbwertszeit des Medikaments im Körper vernachlässigt. Die Nebenwirkungen des Medikaments und damit die Lebensqualität – im Gegensatz zur puren Lebensverlängerung
– sind nicht modelliert worden.
Übungsaufgabe: Lösen Sie das Modell (2.8)–(2.11) numerisch und untersuchen Sie
43
5
10
4
10
Gesunde T−Zellen
Infizierte T−Zellen
HIV−Viren
Anzahl
3
10
2
10
1
10
0
10
0
5
10
Zeit in Jahren
15
20
Abbildung 2.4: Simulierter Verlauf einer Aids-Infektion bei Medikamentengabe nach 7
Jahren für 200 Tage (B(t) = 0.4b für 2555 ≤ t ≤ 2755 Tage).
den Einfluß der Länge des Medikamentationszeitraums auf den Beginn des Aids-Stadiums.
Sind mehrere kurze Behandlungen einer einzigen längeren vorzuziehen oder abzulehnen?
2.3
Chemische Reaktionskinetik
Ein Chemiekonzern hat eine Methode gefunden, ein Molekül A in ein Modekül C umzuwandeln. Als Zwischenprodukt wird das Molekül B erzeugt, das allerdings am Ende
der Umwandlung nicht mehr auftritt. Da das Molekül B sehr aggressiv mit der Wand
des Reaktors, in dem die Umwandlung stattfindet, reagiert, ist das Unternehmen an dem
Wert der maximalen Konzentration von B interessiert, um einen geeigneten Schutz der
Reaktorwand vornehmen zu können. Das Reaktionsschema sei wie folgt:
α
A −→ B,
β
2B −→ B + C,
(2.12)
γ
B + C −→ A + C,
wobei die Buchstaben über den Pfeilen die Reaktionskoeffizienten, die proportional zu den
Reaktionsgeschwindigkeiten sind, darstellen. Sie seien gegeben durch α = 0.04, β = 3·10 7 ,
γ = 104 . Während das Molekül A nur relativ langsam in die Zwischenform B übergeht,
wirkt die Existenz von B katalytisch für eine weitere, sehr schnelle Transformation von
B nach C. Daneben findet in Anwesenheit von C eine Rücktransformation von B nach
A statt. Da die Substanz B sehr schnell reagiert, ist zu erwarten, daß sie nur einen
44
relativ kleinen Anteil im Molekülgemisch ausmacht. Dieser ist jedoch entscheidend, um
die Weiterreaktion zu C in Gang zu halten. Die zu beantwortende Frage lautet nun:
Frage: Wie groß wird die Konzentration der Substanz B im Verlauf der obigen Reaktion
höchstens?
Um zu verstehen, wie wir das obige Reaktionsschema modellieren können, betrachten
wir zunächst ein einfacheres Beispiel: Ein Molekül A verwandelt sich in Anwesenheit eines
Moleküls B in ein zweites Molekül B mit Reaktionskoeffizienten α:
α
A + B −→ 2B.
Zu Beginn der Reaktion betrage die Konzentration von A gerade c0 ∈ [0, 1], und die
Konzentration von B sei 1−c0 . Wir erwarten, daß die Konzentration von A stetig abnimmt
und die von B zunimmt, bis keine Moleküle von A in dem Gemisch vorhanden sind. Wie
schnell findet die Reaktion statt?
Seien CA (t) und CB (t) die Konzentrationen von A und B zur Zeit t. Wie groß sind die
Reaktionsgeschwindigkeiten CA0 bzw. CB0 ? Nach dem sogenannten Massenwirkungsgesetz
ist sie (bei konstantem Druck, Volumen und Temperatur) proportional zu der Wahrscheinlichkeit, daß zwei Moleküle der entsprechenden Reaktion aufeinander treffen, also
proportional zu dem Produkt der Konzentrationen von A und B. Die Proportionalitätskonstante ist der Reaktionskoeffizient α > 0. Folglich ist
CA0 = −αCA CB ,
CB0 = αCA CB ,
t > 0,
(2.13)
mit Anfangskonzentrationen
CA (0) = c0 ,
CB (0) = 1 − c0 .
(2.14)
Wir sind in der Lage, das Verhalten der Lösungen des Systems (2.13)–(2.14) präzise
zu beschreiben, ohne das Problem explizit lösen zu müssen. Zuerst bemerken wir, daß
wegen
(CA + CB )0 = 0,
(CA + CB )(0) = 1
die Summe der Konzentrationen stets gleich Eins ist. Außerdem ist wie erwartet C A
monoton fallend und CB monton wachsend. Die stationären Punkte sind durch
CA = 1,
CB = 0
und
CA = 0,
CB = 1
gegeben. Die Eigenwerte der Ableitung der Abbildung (CA , CB ) 7→ (−αCA CB , αCA CB )
lauten λ1 = 0, λ2 = α im Punkt (1, 0) und λ1 = −α, λ2 = 0 im Punkt (0, 1). Der stationäre
Punkt (1, 0) ist also instabil nach Satz 1.5; über den anderen ist keine Aussage möglich.
45
Wir behaupten, daß er asymptotisch stabil ist. Um dies einzusehen, multiplizieren wir
die erste Gleichung in (2.13) mit CA und die zweite Gleichung mit CB − 1. Wir erhalten
wegen CA + CB = 1:
1d 2
(C + (CB − 1)2 ) = CA0 CA + CB0 (CB − 1)
2 dt A
= αCA CB (−CA + CB − 1)
= −2αCA2 CB .
Nun ist CB monoton wachsend, also CB (t) ≥ CB (0) = 1 − c0 . Dies impliziert
d 2
(C + (CB − 1)2 ) ≤ −4α(1 − c0 )CA2 .
dt A
Integration von 0 bis t führt auf
2
2
2
2c20
CA (t) ≤ CA (t) + (CB (t) − 1) ≤
− 4α(1 − c0 )
Z
t
CA (s)2 ds.
0
Wir benutzen nun die Ungleichung von Gronwall:
Lemma 2.1 Seien α ≥ 0, β ∈ R und f ∈ C 0 ([a, b]; [0, ∞)), und es gelte
Z x
f (x) ≤ α + β
f (s) ds
für alle a ≤ x ≤ b.
0
Dann folgt
f (x) ≤ αeβx
für alle a ≤ x ≤ b.
Übungsaufgabe: Beweisen Sie Lemma 2.1.
Es folgt (wenn CA ≥ 0)
CA (t) ≤
√
2c0 e−2(1−c0 )αt
und
CB (t) = 1 − CA (t) ≥ 1 −
√
2c0 e−2(1−c0 )αt ,
(2.15)
t > 0.
(2.16)
Wie erwartet gilt
CA (t) → 0,
CB (t) → 1
(t → ∞),
und die Konvergenz ist exponentiall schnell mit Konvergenzrate −2(1 − c0 )α. (Wir bemerken, daß die Abschätzungen (2.15)–(2.16), insbesondere für t = 0, nicht optimal sind.)
Übungsaufgabe: Lösen Sie das Anfangswertproblem (2.13)–(2.14) analytisch, indem
Sie die Variablentransformation x = CA − CB , y = CA + CB durchführen.
46
Wir kehren nun zu dem Reaktionsschema (2.12) zurück. Seien CA (t), CB (t) bzw. CC (t)
die Konzentrationen der Substanzen A, B bzw. C zur Zeit t. Die Reaktionsgeschwindigkeit
CA0 von A ist zum einen proportional zur Konzentration von A (mit Reaktionskoeffizient
−α) und zum anderen proportional zum Produkt der Konzentrationen von B und C (mit
Koeffizient +γ). Analog können die Reaktionsgeschwindigkeiten von B und C bestimmt
werden. Das Resultat ist ein System gewöhnlicher Differentialgleichungen für CA , CB und
CC :
CA0 = −αCA + γCB CC ,
CB0 = αCA − γCB CC − βCB2 ,
CC0 = βCB2 ,
(2.17)
t > 0.
Als Anfangswerte wählen wir
CA (0) = 1,
CB (0) = CC (0) = 0.
(2.18)
Aus (2.17) können wir ablesen, daß CC während der Reaktion monoton wächst. Addition der drei Gleichungen ergibt (CA + CB + CC )0 = 0, also ist die Summe der Konzentrationen konstant:
CA (t) + CB (t) + CC (t) = 1
für alle t ≥ 0.
Wir bestimmen nun die stationären Punkte. Aus
−αCA + γCB CC = 0,
αCA − γCB CC − βCB2 = 0,
βCB2 = 0
folgt, daß CB = 0, also CA = 0 und wegen CA + CB + CC = 1 daher CC = 1 die einzige
Lösung dieses Gleichungssystems ist. Bezeichnen wir mit F (CA , CB , CC ) den Vektor der
rechten Seiten von (2.17), so lautet die Ableitung von F im Punkt (0, 0, 1):


−α
γ 0


F 0 (0, 0, 1) =  α −γ 0  ,
0
0 0
und die Eigenwerte sind λ1/2 = 0 und λ3 = −(α + γ). Satz 1.5 erlaubt wieder keine
Aussage. Auch die Technik, die oben zum exponentiellen Abklingen geführt hat, kann
hier nicht verwendet werden. Der Grund ist, daß die Konzentrationen nicht alle monoton
sind. In der Tat: Zur Zeit t = 0 ist kein Molekül der Substanz B vorhanden; es wird im
Verlauf der Reaktionen gebildet und schließlich wieder abgebaut. Wir rechnen damit, daß
47
es einen Zeitpunkt gibt, an dem CB0 = 0 gilt. Zu dieser Zeit ist die Konzentration von B
maximal. Aus (2.17) folgt
γCC
αCA
CB2 +
CB −
= 0.
β
β
Die (positive) Lösung lautet
CB,max
−γCC
+
=
2β
sµ
γCC
2β
¶2
+
αCA
.
β
(2.19)
Nehmen wir nun an, daß die Konzentration CA und CC stets kleiner oder gleich Eins sind,
erhalten wir die Abschätzung
sµ ¶
r
2
α
γ
10−6 4 −9
+ =
CB,max ≤
+ 10 ≈ 1.71 · 10−4 .
2β
β
36
3
−5
3.8
1
Substanz B
Substanz A
Substanz C
3.7
0.8
3.6
Konzentration
Konzentration
x 10
0.6
0.4
3.5
3.4
3.3
3.2
0.2
3.1
0
0
2000
4000
6000
8000
0
10000
0.02
0.04
0.06
0.08
0.1
Zeit
Zeit
Abbildung 2.5: Simulation des Reaktionsverlaufs der Substanzen A, C (links) und B
(rechts) als Funktion der Zeit.
Diese Schranke ist viel zu groß. Um dies zu sehen, lösen wir das Problem (2.17)–(2.18)
numerisch. In Abbildung 2.5 sind die drei Konzentrationen als Funktion der Zeit dargestellt. Die Konzentration von B wächst zunächst sehr schnell und nimmt dann sehr
langsam ab. Der Umschlagpunkt, an dem CB0 = 0 gilt, wird zu einer Zeit erreicht, zu der
die Konzentration CA nahezu Eins und die Konzentration CC kaum größer als Null ist.
Dies führt in (2.19) zu einer verbesserten Abschätzung
r
4 −9
10 ≈ 3.65 · 10−5 .
CB,max ≈
3
Damit haben wir die eingangs gestellte Frage beantwortet. Die maximale Konzentration
der Substanz C in dem Gemisch beträgt etwa 0.0365 .
48
Übungsaufgabe: Die chemische Reaktion A + B → C gehorche dem Massenwirkungsgesetz mit Reaktionskoeffizient α > 0. Seien CA , CB bzw. CC die Konzentrationen der
Substanzen A, B, bzw. C. Zur Zeit t = 0 gelte CA (0) = a > 0, CB (0) = 1 − a > 0 und
CC (0) = 0. Zeigen Sie, daß CA (t) und CB (t) exponentiell schnell für t → ∞ gegen Null
konvergieren. Folgern Sie den Wert für limt→∞ CC (t).
2.4
Ein Wirtschaftsmodell
Wir betrachten eine Nation A, die sehr enge wirtschaftliche Verbindungen zu einer Nation
B pflegt. Die Nation A exportiere selbst hergestellte Waren an B und importiere dafür
von B hergestellte Waren aus dem Erzeugerland. Wir wollen die folgende Frage erörtern:
Frage: Wie wirkt sich die Änderung der Importrate der Nation A auf die “Zufriedenheit”
der Nation aus, und wie beeinflußt dies die Dynamik der Warenproduktion?
Diese Frage enthält den Begriff “Zufriedenheit”, den wir definieren müssen. Um die Situation zu vereinfachen, nehmen wir an, daß die beiden Nationen ausschließlich miteinander
Handel treiben. Es seien
x = Wert der von Nation A hergestellten Waren,
y = Wert der von Nation B hergestellten Waren.
Der Wert sei berechnet in Einheiten geleisteter Arbeitsstunden und sei diesen proportional; d.h., eine Ware sei doppelt soviel wert wie eine andere, wenn sie zur Produktion
doppelt so viele Arbeitsstunden benötigt. Es gelte x ≥ 0, y ≥ 0. Weiter nehmen wir an,
daß der Anteil der exportierten Waren für beide Nationen gleich groß ist. Wir definieren
dann:
p = Anteil der selbst verbrauchten Waren,
1 − p = Anteil der exportierten Waren.
Um die “Zufriedenheit” oder “Nutzen” (im Englischen utility) einer Nation zu modellieren, machen wir die folgenden Annahmen:
Annahme A: “Je mehr Waren der einen Sorte man hat, umso schwächer steigt
der Nutzen, wenn man neue Waren derselben Sorte erhält.” Mit anderen Worten:
Erhält man eine Ware erstmalig, erhöht dies die Zufriedenheit sehr; hat man bereits
viele Waren derselben Sorte und bekommt dann eine weitere dazu, erhöht dies den
Nutzen nur geringfügig.
49
Annahme B: “Zuviel Arbeit ist unbefriedigend.” Das heißt, die Zufriedenheit
nimmt bei zunehmender Arbeit (die proportional zu dem erzeugten Warenwert ist)
ab.
Annahme C: “Die Warenproduktion steigt mit zunehmender Zufriedenheit.”
Im folgenden setzen wir diese umgangssprachlichen Aussagen in mathematische Formeln um.
Annahme A: Sei U (g) die Funktion, die den Nutzen bzw. die Zufriedenheit einer
Nation in Abhängigkeit des Warenwerts g modelliert. Die Aussage A bedeutet, daß die
Änderung des Nutzens dU kleiner bei fester Änderung des Warenwerts dg wird, je größer
der Warenwert g selbst wird:
dU
= f (g)
dg
und f ist monoton fallend.
Eine Möglichkeit ist die Wahl f (g) = k/g mit einer Konstanten k > 0. Sind keine Waren
vorhanden (g = 0), so ist der Nutzen Null (U = 0). Wir müssen also das Anfangswertproblem
k
dU
= ,
g > 0,
U (0) = 0,
dg
g
lösen. Die allgemeine Lösung der Differentialgleichung lautet U (g) = k ln g + c mit c ∈ R,
doch ist U (0) nicht definiert! Es existiert also keine Lösung. Der Grund ist, daß das Modell
unrealistisch ist: Besitzt man anfangs keine Waren (U = 0), so ist die Nutzenänderung
U 0 (0) unendlich. Wir nehmen an, daß die Nutzenänderung proportional zur Änderung
des Warenwertes dg ist, wenn g = 0, d.h. U 0 (0) = (dU/dg)(0) = k > 0. Wir machen den
Ansatz f (g) = k/(1 + g) und lösen das Problem
dU
k
=
,
dg
1+g
g > 0,
U (0) = 0.
Die Lösung lautet
U (g) = k ln(1 + g),
g ≥ 0.
Für die betrachteten Nationen setzt sich der Warenwert aus den Anteilen der Werte
der selbst verbrauchten Waren und der importierten Waren zusammen:
Nation A: g = px + (1 − p)y,
Nation B: g = py + (1 − p)x.
Folglich sind die Nutzenfunktionen UA der Nation A und UB der Nation B gegeben durch
UA (x, y) = k ln(1 + px + (1 − p)y),
UB (x, y) = k ln(1 + (1 − p)x + py),
50
x, y ≥ 0,
wobei wir angenommen haben, daß der Proportionalitätsfaktor k für beide Nationen gleich
ist.
Annahme B: Die Zufriedenheit wäre maximal, gäbe es keine Arbeit, und nimmt
ansonsten um einen Faktor ab, der von der geleisteten Arbeit und damit von dem produzierten Warenwert abhängt. Unterstellen wir auch hier Proportionalität, werden die
Funktionen UA und UB um den Wert ax bzw. ay vermindert. Damit haben die Nutzenfunktionen die Gestalt
UA (x, y) = k ln(1 + px + (1 − p)y) − ax,
UB (x, y) = k ln(1 + (1 − p)x + py) − ay.
Dieses Modell berücksichtigt, daß zuviel Arbeit zu einem negativen Nutzen führt. Bei
festem y ≥ 0 existiert nämlich ein x0 , so daß UA (x, y0 ) ≤ 0 für x ≥ x0 (interpretiert als
“zuviel Arbeit”). Werden überhaupt keine Waren produziert (x = 0, “keine Arbeit”), so
hängt die Zufriedenheit ausschließlich von dem Warenwert der importierten Waren ab.
Auf lange Sicht ist diese Situation natürlich unrealistisch, da die Importe nicht bezahlt
werden können, wenn kein Geld durch Warenproduktion erwirtschaftet wird.
Annahme C: Bei wachsender Zufriedenheit ∂UA /∂x > 0 steigt die Warenproduktion,
d.h., x(t) wächst monoton: dx/dt > 0. Wir nehmen an, daß die zeitliche Änderung x0 (t)
der Warenproduktion proportional zur Änderung der Zufriedenheit ist:
x0 = c
ckp
∂UA
=
− ca;
∂x
1 + px + (1 − p)y
analog erhalten wir (mit derselben Proportionalitätskonstanten c > 0)
y0 = c
∂UB
ckp
=
− ca.
∂y
1 + (1 − p)x + py
Wir haben vier Parameter (c, k, a und p). Durch Einführung einer neuen Zeit t0 = ckt
und eines Parameters r = a/k läßt sich die Anzahl der Parameter auf zwei begrenzen:
1 dx
p
dx
=
=
− r,
0
dt
ck dt
1 + px + (1 − p)y
dy
1 dy
p
=
=
− r.
0
dt
ck dt
1 + (1 − p)x + py
Im folgenden schreiben wir wieder t anstatt t0 ; das zu lösende Problem lautet
p
− r,
1 + px + (1 − p)y
p
=
− r,
1 + px + (1 − p)y
x0 =
t > 0,
x(0) = x0 ,
(2.20)
y0
t > 0,
y(0) = y0 ,
(2.21)
51
Wir bestimmen zuerst die stationären Punkte von (2.20)–(2.21) und untersuchen das
System auf Stabilität bzw. Instabilität. Aus
p
p
−r =
−r =0
1 + px + (1 − p)y
1 + (1 − p)x + py
folgt
1 + px + (1 − p)y =
p
= 1 + (1 − p)x + py
r
und damit
(2p − 1)(x − y) = 0.
Wir untersuchen zwei Fälle:
1. Fall: p 6= 12 . Es folgt x = y und
p
p
=⇒ x = − 1.
r
r
1 + px + (1 − p)x =
Es gibt genau einen stationären Punkt
x0 = y 0 =
p
− 1,
r
sofern p ≥ r. Falls p < r, existieren keine stationären Punkte (in x, y ≥ 0).
2. Fall: p = 12 . Dies impliziert
1
1
1
1
=⇒ x + y = − 2
1+ x+ y =
2
2
2r
r
und daher die folgenden Fälle:
1
:
2
1
r= :
2
1
r< :
2
r>
Es gibt keine stationären Punkte.
Es existiert genau ein stationärer Punkt (0, 0).
Es gibt unendlich viele stationäre Punkte (x1 , y1 ), gegeben durch
x1 + y1 = 1/r − 2 > 0.
Sind die stationären Punkte stabil oder instabil? Sei zuerst p 6= 21 und definiere
¶
µ
p(1 + px + (1 − p)y)−1 − r
,
x, y ≥ 0.
F (x, y) =
p(1 + (1 − p)x + py)−1 − r
Die Eigenwerte von
F 0 (x0 , y0 ) = −p(1 + px0 + (1 − p)y0 )−2
Ã
p
1−p
1−p
p
!
r2
=−
p
lauten
λ1 = −r2 /p,
λ2 = r2 (1 − 2p)/p.
52
Ã
p
1−p
1−p
p
!
Folglich erhalten wir asymptotische Stabilität, wenn p > 12 , d.h., wenn die Nation die
produzierten Waren eher selbst verbraucht, als sie zu exportieren.
Im Fall p = 21 gilt 1 + px1 + (1 − p)y1 = 1/2r. Die Eigenwerte der Matrix
Ã
!
1
1
F 0 (x1 , y1 ) = −r2
1 1
lauten
λ2 = −2r2 .
λ1 = 0,
Der Satz 1.5 erlaubt keine Aussage.
Der Fall p = 12 läßt sich dennoch vollständig behandeln. Addition und Subtraktion
von (2.20) und (2.21) liefert die Gleichungen
(x − y)0 = 0,
2
− 2r.
2+x+y
(x + y)0 =
Die erste Gleichung impliziert
x(t) − y(t) = const. = x0 − y0 ,
und nach Einsetzen in die zweite Gleichung folgt
y0 =
1
1 − rα − 2ry
−r =
,
2 + x0 − y0 + 2y
α + 2y
wobei α := 2 + x0 − y0 . Integration ergibt
t=
Z
t
dt =
0
Z
y(t)
y0
1
α + 2y
dy =
1 − rα − 2ry
r
Z
y(t)
y0
t > 0,
µ
y(0) = y0 ,
1
−1 +
1 − rα − 2ry
¶
dy.
Sei zuerst 1−rα−2ry0 > 0. Dann ist, zumindest für kleine Zeiten, auch 1−rα−2ry(t) > 0,
und wir erhalten
rt = y0 − y(t) −
1
1
ln(1 − rα − 2ry(t)) +
ln(1 − rα − 2ry0 ),
2r
2r
t > 0.
Für t → ∞ strebt die linke Seite gegen unendlich, also muß − ln(1 − rα − 2ry(t)) → ∞
folgen, da wir y(t) ≥ 0 vorausgesetzt haben. Dies impliziert 1 − rα − 2ry(t) → 0 oder
y(t) →
rα − 1
1
1
= 1 + (x0 − y0 ) −
2r
2
2r
und damit
3
1
x(t) = x0 − y0 + y(t) → 1 + (x0 − y0 ) −
2
2r
53
für t → ∞.
Wenn rα − 1 < 0 (oder x0 − y0 < −1/r), wird y(t) nach endlicher Zeit negativ werden,
was wir ausgeschlossen haben. Also existiert in diesem Fall eine Lösung nur auf einem
endlichen Zeitintervall, etwa auf [0, t0 ] und y(t0 ) = 0.
Sei nun 1 − rα − 2ry0 < 0. Dann folgt, zumindest für kleine Zeiten,
¶
Z y(t) µ
1
dy
−1 −
rt =
rα − 1 + 2ry
y0
1
1
= y0 − y(t) −
ln(rα − 1 + 2ry(t)) +
ln(rα − 1 + 2ry0 ).
2r
2r
Mit demselben Argument wie oben folgt rα − 1 + 2ry(t) → 0 für t → ∞ oder
1 − rα
1
1
=
− 1 − (x0 − y0 ),
2r
2r
2
1
1
x(t) →
− 1 + (x0 − y0 )
für t → ∞.
2r
2
y(t) →
Wenn 1 − rα < 0 gilt, existiert die Lösung wieder nur auf einem endlichen Zeitintervall.
Notwendige Bedingungen für globale Lösungen (d.h. nichtnegative Lösungen, die für alle
t ≥ 0 existieren) sind also die Ungleichungen
1 − rα − 2ry0 > 0
und
rα − 1 > 0
1 − rα − 2ry0 < 0
und
rα − 1 < 0.
oder
Zusammengefaßt erhalten wir Lösungen, die nur auf einem endlichen Zeitintervall
existieren, wenn
1 − rα − 2ry0 > 0
und
rα − 1 < 0
oder wenn
1 − rα − 2ry0 < 0
und
rα − 1 > 0
gelten. Dies ist äquivalent zu
x0 − y 0 <
1
1
− 2 oder x0 − y0 > − 2.
r
r
Dies bedeutet, daß im Falle p = 21 die Warenproduktion einer der beiden Nationen zum
Erliegen kommt, wenn x0 − y0 6= 1/r − 2. Falls x0 − y0 = 1/r − 2, existiert eine globale
Lösung, nämlich x(t) = x0 , y(t) = y0 für t > 0.
Wir kommen nun auf die eingangs gestellte Frage zurück: Welchen Einfluß hat die
Änderung der Importrate auf den Nutzen? Wir nehmen an, daß die Importrate der Nation
A von p auf p − s mit 0 < s < p fällt. Wir setzen weiterhin voraus, daß p − s ≥ r gilt
und daß die Änderung der Importrate zu einem Zeitpunkt stattfindet, in der sich die
54
Wirtschaft beider Nationen in einem stationären Zustand befindet. Wegen p > r lautet
dieser stationäre Zustand
p
x2 = y2 = − 1.
r
Nach längerer Zeit nach der Änderung bewegt sich die Warenproduktion auf einen neuen
stationären Zustand
p−s
x3 = y 3 =
−1
r
zu. Hier haben wir Gebrauch von der Voraussetzung p − s ≥ r gemacht. Es muß nun die
Frage beantwortet werden, ob der “neue” Nutzen UA (x2 , y2 ) größer oder kleiner als der
vorherige Nutzen UA (x3 , y3 ) ist. Wegen
UA (p/r − 1, p/r − 1) = k ln
kp
− kp + a
a
ist die Monotonie der Funktion p 7→ UA (p/r − 1, p/r − 1) zu untersuchen. Sie hat genau
ein Maximum bei p = 1 und ist monoton wachsend für p ≤ 1. Folglich gilt
UA (x2 , y2 ) > UA (x3 , y3 ).
Die Zufriedenheit der Nation A sinkt also bei Abfallen der Importrate (sofern p − s ≥ r =
a/k).
Übungsaufgabe: Wie ändert sich die Zufriedenheit der Nation A, wenn die Importrate
von p ≥ a/k auf p − s mit s > p − a/k fällt?
2.5
Elektrische Schaltkreise
Für die Entwicklung moderner Computerbauteile (Halbleiterprozessoren, Mobilfunkbauteile etc.) ist die Simulation elektrischer Schaltkreise mit einer sehr großen Anzahl von
Bauteilen (Widerstände, Transistoren etc.) notwendig. In diesem Abschnitt betrachten wir
eine sogenannte Emitterschaltung, die eine gängige Verstärkerstufe für eine Eingangswechselspannung US mit Hilfe eines Transistors darstellt (Abbildung 2.6). Ziel dieses Abschnittes ist es, das zeitliche Verhalten der elektrischen Spannung innerhalb des Schaltkreises
zu modellieren. Dazu benötigen wir einige Grundbegriffe aus der Elektrotechnik.
Der Schaltkreis enthält die Widerstände R1 , R2 , RC , RE und RL , die Kondensatoren
C1 , C2 und CE und einen Transistor im Zentrum der Schaltung. Im allgemeinen unterscheidet man u.a. die folgenden Bauteile in elektrischen Schaltkreisen:
Widerstände: Dies sind Bauteile (z.B. auch Drähte), an denen eine Spannung UR
abfällt. Nach dem Ohmschen Gesetz ist der durch einen Widerstand fließende Strom
IR proportional zur Spannung UR :
UR = R · I R .
55
U0
R
R1
C1
C
B
C2
C
L
<
E
U s(t)
ο
ο
UL
R
2
R
E
CE
RL
Abbildung 2.6: Eine Verstärker-Grundschaltung.
Die Proportionalitätskonstante nennt man Widerstand.
Kondensatoren: Sie speichern elektrische Ladungen. Der elektrische Strom IC
durch einen Kondensator ist proportional zu Spannungsänderungen:
dUC
,
dt
wobei die Proportionalitätskonstante Kapazität genannt wird.
IC = C
Spulen: Sie speichern Energie in ihren magnetischen Feldern. Hier ist die abfallende
Spannung UL proportional zu den Stromänderungen
dIL
dt
mit der Induktivität als Proportionalitätskonstante. Die Verstärkerschaltung 2.6
enthält keine Spulen.
UL = L
Transistoren: Sie können als Verstärker genutzt werden. Sie sind über die Eingangskennlinien an der Basis B
IB = IB (UB − UE , UC − UE )
und die Ausgangskennlinien am Kollektor C
IC = IC (UC − UE , IB )
definiert, wobei IB bzw. IC die Ströme durch die Basis bzw. den Kollektor und
UB − UE bzw. UC − UE die Spannungsdifferenzen zwischen Basis und Emitter bzw.
Kollektor und Emitter sind. Die Funktionen IB und IC betrachten wir als gegeben
(Abbildung 2.7).
56
U −U
C
E
I
B
I
C
I
B
U −U
C
E
U −U
B
E
Abbildung 2.7: Kennlinien eines Transistors für verschiedene Werte von UC − UE (links)
bzw. IB (rechts).
Die Ströme und Spannungen an den einzelnen Bauteilen in einem Schaltkreis werden
durch die Kirchhoffschen Gesetze in Zusammenhang gebracht:
Knotenregel für Ströme: Die Summe der an einem Knoten zusammentreffenden
Ströme durch die entsprechenden Leiter ist Null (Abbildung 2.8 links):
X
Ik = 0.
k
Maschenregel für Spannungen: Die Summe der zu einer Masche gehörenden Spannungen ist Null (Abbildung 2.8 rechts):
X
Uk = 0.
k
I
1
I
2
U2
U1
U3
I
4
I
3
U4
Abbildung 2.8: Zur Knoten- und Maschenregel.
Als Beispiel betrachten wir einen RLC-Schaltkreis, bestehend aus einem Widerstand
R, einer Induktivität L und einer Kapazität C in Reihe mit angelegter Spannung U =
U (t) (Abbildung 2.9). Nach der Maschenregel gilt für die über die Bauteile abfallenden
Spannungen:
U = U R + UL + UC .
(2.22)
Nach der Knotenregel fließt durch jedes der drei Bauteile der gleiche Strom
I := IR = IL = IC .
57
C
U(t) ο
ο
L
R
Abbildung 2.9: Ein RLC-Schaltkreis.
Setzen wir UR = RI und UL = LI 0 in (2.22) ein, leiten die Gleichung einmal ab und
verwenden UC0 = I/C, so folgt
1
R 0
I +
I = U 0 (t).
L
LC
Dies ist eine Differentialgleichung für eine erschwungene Schwingung mit Eigenfrequenz
√
1/ LC und “Reibungskonstante” R/L. Die Lösung I dieser Gleichung liefert den unbekannten Strom durch das Bauteil.
Bei der Verstärkerschaltung aus Abbildung 2.6 sind die Gleichspannung U0 und die
Wechselspannung US (t) gegeben, und die Ausgangsspannung UL (t) ist gesucht. Wir erwarten, daß die Eingangsspannung US verstärkt wird. Genauer gesagt wollen wir die unbekannten Spannungen UB , UC , UE und UL an den vier Knoten B, C, E und L bestimmen.
Dazu benutzen wir die Knotenregel:
I 00 +
Knoten B: 0 =
=
Knoten C: 0 =
=
Knoten E: 0 =
Knoten L: 0 =
I R1 + I C1 + I R2 + I B
R1−1 (UB − U0 ) + C1 (UB0 − US0 ) + R2−1 UB + IB ,
I RC + I C2 + I C
RC−1 (UC − U0 ) + C2 (UC0 − UL0 ) + IC ,
−1
UE + CE UE0 + IE ,
I RE + I CE + I E = R E
IRL + IC2 = RL−1 UL + C2 (UL0 − UC0 ).
Den Emitterstrom können wir durch die Knotenregel
IE + I B + I C = 0
durch die Basis- und Kollektorströme ersetzen. Wir erhalten das folgende (nichtlineare)
System
Ax0 = b · x + f (x)
(2.23)
mit



A=


C1
0
0
0
0
C2
0 −C2 

,
0
0
CE
0 
0 −C2 0
C2



x=

58
UB
UC
UE
UL



,




b = −

R1−1 + R2−1
RC−1
−1
RE
RL−1





und



f (x) = 

R1−1 (U0 − UB ) + C1−1 US0 − IB (UB − UE , UC − UE )
RC−1 U0 − IC (UC − UE , IB )
IB + I C
0



.

Die Matrix A ist singulär. Dies ist nicht erstaunlich, da wir das Ohmsche Gesetz verwendet
haben, das keine Differentialgleichung ist. Allerdings kann das System (2.23) so nicht
gelöst werden. Wir führen zuerst die folgende Variablentransformation durch
y1 = U B ,
y2 = U C − U L ,
y3 = U E ,
z = U C − UB ,
mit der wir die vierte Zeile von (2.23) umschreiben können. Addition der Gleichungen am
Knoten C und L ergibt eine algebraische Gleichung:
0 = RC−1 (UC − U0 ) + IC + RL−1 UL = (RC−1 + RL−1 )UC − RL−1 (UC − UL ) + IC − RC−1 U0
= (RC−1 + RL−1 )(y1 + z) − RL−1 y2 + IC − RC−1 U0 .
Die ersten drei Zeilen von (2.23) und die algebraische Gleichung fassen wir dann wie folgt
zusammen:
y 0 = f (y, z),
0 = g(y, z),
t > 0,
(2.24)
mit y = (y1 , y2 , y3 )> ,

und

−[(C1 R2 )−1 + (C1 R1 )−1 ]y1 − C1−1 IB + (C1 R1 )−1 U0 + US0


f (y, z) =  −(C2 RC )−1 (y1 + z) − C2−1 IC + (C2 RC )−1 U0

−1
−1
−(CE RE ) y3 + CE (IB + IC )
g(y, z) = (RC−1 + RL−1 )(y1 + z) − RL−1 y2 + IC − RC−1 U0 .
Unter welchen Bedingungen ist das System (2.24), zusammen mit den Anfangsbedingungen
y(0) = y0 ,
z(0) = z0
lösbar? Zum einen müssen die Anfangswerte mit der zweiten Gleichung in (2.24) konsistent
sein, d.h., es muß g(y0 , z0 ) = 0 gelten. Gilt zum anderen, daß (∂g/∂z)(y0 , z0 ) invertierbar ist, so existiert nach dem Satz über implizite Funktionen eine eindeutig bestimmte
Funktion ψ : U → R in einer Umgebung U ⊂ R3 von y0 mit
ψ(y0 ) = z0
und
g(y, ψ(y)) = 0.
Mit Hilfe dieser Funktion kann (2.24) in das äquivalente System
y 0 = f (y, ψ(y)),
t > 0,
y(0) = y0 ,
59
z = ψ(y),
überführt werden, dessen Lösbarkeit (unter geeigneten Voraussetzungen an f bzw. IB und
IC ) durch Satz 1.2 garantiert ist. Die Frage, ob ∂g/∂z invertiert werden kann, hängt von
der speziellen Struktur der Funktionen IB und IC ab. Eine hinreichende Bedingung ist
0 <
=
∂
∂g
(y0 , z0 ) =
IC (z + y1 − y3 ), IB (y1 − y3 , z + y1 − y3 ))
∂z
∂z
∂IC
∂IC
∂IB
+
,
∂(UC − UE ) ∂IB ∂(UC − UE )
ausgewertet an (y0 , z0 ).
In der Praxis ist diese Bedingung erfüllt.
Ein gekoppeltes Problem aus gewöhnlichen Differentialgleichungen und algebraischen
Gleichungen nennt man übrigens ein differential-algebraisches Problem. Ist (∂g/∂z)(y0 , z0 )
invertierbar, so nennt man das System mit Index Eins, andernfalls mit Index größer Eins.
Das differential-algebraische System (2.24) kann nur numerisch gelöst werden. Zum
Glück ist die Transformation ψ(y) = z nicht zur Lösung notwendig. Eine andere Idee
besteht darin, das Problem
y 0 = f (y, z),
εz 0 = g(y, z),
t > 0,
t > 0,
y(0) = y0 ,
z(0) = z0 ,
numerisch zu diskretisieren und dann ε → 0 streben zu lassen. Wir verweisen für Details
auf die Bücher [2, 3].
2.6
Himmelsmechanik
Wir wollen die folgende Frage beantworten:
Frage: Wie stabil ist unser Sonnensystem gegenüber Störungen?
Unser Sonnensystem besteht aus n Körpern mit Massen m1 , . . . , mn , die sich entlang
gewisser Bahnen r1 (t), . . . , rn (t) ∈ R3 im Raum bewegen. Die Bewegung der Körper wird
durch das Newtonsche Gesetz
mi ri00 = Fi ,
i = 1, . . . , n,
(2.25)
beschrieben, wobei Fi die auf den i-ten Körper wirkenden Gravitationskräfte aller anderen
Körper ist. In Abschnitt 1.2 hatten wir bereits die Gravitationskraft verwendet; sie lautet
zwischen zwei Körpern (siehe Abbildung 2.10):
F1 = −
Gm1 m2
(r1 − r2 ),
|r1 − r2 |3
F2 = −
Gm1 m2
(r2 − r1 )
|r2 − r1 |3
wobei G = 6.7 · 10−11 m3 /s2 kg die Gravitationskonstante sei.
60
(2.26)
F
m
1
m
1
2
F2
r
1
r
2
0
Abbildung 2.10: Auf die Körper mit Massen m1 und m2 wirkende Gravitationskräfte.
Betrachten wir zuerst ein System, bestehend aus der Sonne mit Masse m1 und der
Erde mit Masse m2 . Die Bewegung der Bahnen der Sonne r1 (t) und der Erde r2 (t) sind
nach (2.25) und (2.26) gegeben durch
m1 r100 = −
Gm1 m2
(r1 − r2 ),
|r1 − r2 |3
m2 r200 = −
Gm1 m2
(r2 − r1 ).
|r2 − r1 |3
(2.27)
Nun ist die Masse m2 der Erde sehr viel kleiner als die der Sonne, nämlich
m1 = 2 · 1030 kg,
m2 = 6 · 1024 kg,
so daß wir die Hoffnung haben, das Problem (2.27) durch Reduktion vereinfachen zu
können. Das System (2.27) hat die drei Parameter G, m1 , m2 , deren Einheiten gemäß
Abschnitt 1.2 wie folgt in eine Koeffizientenmatrix geschrieben werden können:

G m 1 m2

cm
3 0 0


g  −1 1 1  .
s
−2 0 0
Der Kern dieser Matrix wird durch ven Vektor (0, −1, 1) aufgespannt, so daß wir den
Parameter
m2
≈ 10−6
ε :=
m1
verwenden. Um (2.27) zu skalieren, verwenden wir die Referenzlänge
L = Entfernung Erde–Sonne = 1.5 · 1011 m
und die Referenzzeit
T =
s
L3
= 5 · 106 s.
Gm1
Da die Erde in einem Jahr (also 3.2 · 107 s) auf ihrem Weg um die Sonne die Entfernung
2πL mit Geschwindigkeit v = 2πL/3.2·107 s zurücklegt, entspricht T der Zeit, die die Erde
braucht, um die Strecke vT = 2πL · 5 · 106 /3.2 · 107 ≈ L zu durchlaufen. Wir skalieren
ri → Lri
(i = 1, 2)
61
und
t → Tt
und erhalten die Gleichungen
r100 = −ε
r1 − r 2
,
|r1 − r2 |3
r200 = −
r2 − r 1
,
|r2 − r1 |3
t > 0.
(2.28)
Wir wählen r0 = L für die Anfangsbedingung für r2 (0) und v0 = 2πL/(1 Jahr) für r20 (0).
Die skalierten Anfangswerte lauten dann
 
 
 
0
1
0
 
 
 
0
0
r1 (0) = r1 (0) =  0  ,
r2 (0) =  0  ,
r2 (0) =  1  .
(2.29)
0
0
0
Wir können das Problem (2.28) entkoppeln und auf die Bewegung eines einzigen
Körpers reduzieren, indem wir die Bewegungsgleichungen für den Ortsvektor des gemeinsamen Schwerpunktes R = r1 + εr2 und den Abstandsvektor r = r1 − r2 einführen:
R00 = 0,
r00 = −(1 + ε)
r
.
|r|3
(2.30)
Die Wahl ε = 0 vereinfacht das Problem also nicht, so daß wir mit dem vollen Problem
weiterarbeiten. Den Einfluß von ε untersuchen wir später. Die erste Gleichung bedeutet,
daß sich der gemeinsame Schwerpunkt gleichförmig (d.h. mit konstanter Geschwindigkeit)
durch den Raum bewegt. Um die zweite Gleichung mit Anfangswerten
r0 (0) = V0
r(0) = R0 ,
(2.31)
zu lösen, sind einige Vorbereitungen notwendig. (Im Fall der Erde gilt natürlich R0 =
(−1, 0, 0)> und V0 = (0, −1, 0)> , doch wir wollen auch allgemeinere Bedingungen zulassen.)
Zunächst bemerken wir, daß das Problem (2.30)–(2.31) auf zwei Raumdimensionen
reduziert werden kann. Es gilt nämlich
d
1+ε
(r × r0 ) = r0 × r0 + r × r00 = r0 × r0 −
r × r = 0,
dt
|r|3
wobei “×” das Kreuzprodukt sei. Folglich ist
r(t) × r 0 (t) = const. =: L
für alle t ≥ 0
und L = R0 × V0 . Da r × r0 den Drehimpluls darstellt, bedeutet dieses Resultat, daß
der Drehimpuls zeitlich erhalten bleibt. Nun steht L senkrecht auf der durch r(t) und
r0 (t) aufgespannten Ebene. Da L konstant ist, heißt dies, daß die Bewegung vollständig
in dieser Ebene stattfindet. Verschwinden die dritten Komponenten von R0 und V0 (was
wir im folgenden annehmen wollen), so kann man L = (0, 0, γ)> für ein γ ∈ R schreiben,
und r(t) bewegt sich ausschließlich in der (x, y)-Ebene.
62
Wir transformieren (2.30) in Polarkoordinaten


%(t) cos φ(t)


r(t) =  %(t) sin φ(t)  ,
0
woraus nach einer Rechnung folgt:






cos φ
− sin φ
cos φ
1+ε





(%00 − %φ02 )  sin φ  + (2%0 φ0 + %φ00 )  cos φ  = − 2  sin φ  .
%
0
0
0
Wir multiplizieren diese Gleichung zuerst mit dem Vektor (cos φ, sin φ, 0)> und dann mit
(− sin φ, cos φ, 0)> , um zu erhalten:
%00 − %(φ0 )2 = −
1+ε
,
%2
2%0 φ0 + %φ00 = 0.
(2.32)
%2 φ0 = const.
(2.33)
Die zweite Gleichung ist äquivalent zu
1d 2 0
(% φ ) = 0
% dt
oder
Dies bedeutet wieder die Erhaltung des Drehimpulses, denn


0


r × r0 =  0  ,
%2 φ 0
und dieser Vektor ist zeitlich konstant. Also ist die Konstante gleich γ und % 2 φ0 = γ.
Setzen wir dies in die erste Gleichung von (2.32) ein, folgt
%00 −
γ2 1 + ε
+ 2 = 0.
%3
%
Wir multiplizieren die Gleichung mit %0 und integrieren über (0, t):
1 0 2
γ2
1+ε
1 0 2
γ2
1+ε
% (t) +
−
=
%
(0)
+
−
.
2
2
2
2%(t)
%(t)
2
2%(0)
%(0)
Die linke Seite ist also zeitlich konstant und damit eine Erhaltungsgröße. Da
1
E := (%0 )2 + V (g)
2
mit
V (g) =
γ2
1+ε
−
2%2
%
die Energie bedeutet, drückt die obige Gleichung die Erhaltung der Energie aus.
63
(2.34)
Aus (2.33) und (2.34) folgt
und damit
p
d%
= ± 2(E − V (%))
dt
und
dφ
γ
= 2
dt
%
dφ dt
γ
dφ
=
=± p
.
d%
dt d%
%2 2(E − V (%))
Integration über (%0 , %) ergibt schließlich
φ = φ(%0 ) ±
Z
%(φ)
%0
γ dr
p
.
r2 2(E − V (r))
Dieses Integral kann explizit gelöst werden. Mit der Substitution u = 1/r und diversen
Umformungen folgt, daß
p
,
(2.35)
%(φ) =
1 + q cos(φ − φ1 )
wobei
γ2
p=
,
1+ε
q=
s
1+2
γ2E
,
(1 + ε)2
φ1 = φ0 + arccos
γ 2 − (1 + ε)%0
p
.
%0 2Eγ 2 + (1 + ε)2
Übungsaufgabe: Führen Sie die Umformungen, die auf (2.35) führen, durch.
Die Gleichung (2.35) besitzt die Form eines Kegelschnittes. Die Art des Kegelschnittes
hängt von q ab (siehe Tabelle 2.6).
Parameter q
Kegelschnitt
q=1
Energie
³ ´2
E = − 12 1+ε
γ
³ ´2
− 21 1+ε
<E<0
γ
E=0
Parabel
q>1
E>0
Hyperbel
q=0
0<q<1
Kreis
Ellipse
Tabelle 2.1: Art der Bahnkurve in Abhängigkeit des Wertes der Energie.
In unserem Fall haben wir




%(0) cos φ(0)
−1




 %(0) sin φ(0)  = R0 =  0  ,
0
0
64




%0 (0) cos φ(0) − %(0)φ0 (0) sin φ(0)
0
 0



 % (0) sin φ(0) + %(0)φ0 (0) cos φ(0)  = V0 =  −1  ,
0
0
also %(0) = 1, φ(0) = π und %0 (0) = 0, φ0 (0) = 1. Dies ergibt L = %(0)2 φ0 (0) = 1 und
E = − 12 − ε > − 12 (1 + ε)2 . Folglich beschreibt die Bahn der Erde um die Sonne eine
Ellipse. Da ε = 10−6 ¿ 1, ist die Ellipse in guter Näherung ein Kreis.
Welchen Einfluß hat die Anfangsgeschwindigkeit? Im Falle der Erde haben wir mit
√
v = 1 gerechnet. Wählen wir ε = 0 und eine Geschwindigkeit v < 2, so folgt wegen
L2 = v 2
v2
− 1 < 0,
E=
2
√
und die Planetenbahn ist eine Ellipse. Im Falle v > 2 hat die Erde so viel Energie, daß
sie das Sonnensystem verläßt (siehe Abbildung 2.11).
3
2.5
v=1.5
2
1.5
1
y
v=1
v=0.7
0.5
Sonne
•
0
Erde
•
−0.5
−1
−1.5
−3
−2
−1
0
1
x
Abbildung 2.11: Bahnen der Erde um die Sonne für verschiedene Anfangsgeschwindigkeiten v (ε = 0).
Wäre die Masse der Erde um den Faktor 104 größer (d.h. ε = 0.01), bewirkt ihre
Gravitationsfeld, daß die Sonne kleine Bewegungen durchläuft, während sich die Erde
weiterhin um die Sonne bewegt (siehe Abbildung 2.12). Ist das Massenverhältnis noch
größer (ε = 0.2), so wird die Bewegung der Sonne stärker gestört (siehe Abbildung 2.13).
Wie sehen die Bewegungen von Erde und Sonne aus, wenn das Gravitationsfeld des
Jupiters berücksichtigt wird? Der Jupiter hat die Masse m3 = 2 · 1027 kg und bewegt sich
in einer etwa 5.2-fachen Entfernung wie der Abstand Erde-Sonne um das Zentralgestirn.
Die Bewegungsgleichungen sind komplizierter als oben, da auf jeden Planeten die Gravitationskräfte der anderen beiden Körper einwirken. Sei r3 (t) der Ortsvektor des Jupiters
(siehe Abbildung 2.14). Dann lauten die Bewegungsgleichungen
65
3
2
y
1
0
Sonne
•
• Erde
0
1
−1
−2
−3
−2
−1
2
x
Abbildung 2.12: Bahnen der Erde um die Sonne mit ε = 0.01 (v = 1.2).
20
y
15
10
5
0
−2
Sonne
−1
•
•
0
x
1
Erde
2
Abbildung 2.13: Bahnen der Erde um die Sonne mit ε = 0.2 (v = 1.2).
mi ri00 = −
X Gmi mk
(r − rk ),
3 i
|r
i − rk |
k6=i
i = 1, 2, 3.
Mit derselben Skalierung wie oben und dem zusätzlichen Parameter
δ=
m3
= 10−3 ,
m1
der das Massenverhältnis Jupiter–Sonne beschreibt, erhalten wir die folgenden skalierten
Gleichungen:
r1 − r 3
r1 − r 2
−δ
,
3
|r1 − r2 |
|r1 − r3 |3
r2 − r 1
r2 − r 3
= −
−δ
,
3
|r2 − r1 |
|r2 − r3 |3
r3 − r 1
r3 − r 2
= −
−
ε
,
|r3 − r1 |3
|r3 − r2 |3
Sonne:
r100 = −ε
Erde:
r200
Jupiter: r300
66
(2.36)
t > 0.
Sonne
m
Jupiter
Erde
m
1
m
2
r (t)
2
r (t)
1
3
r (t)
3
0
Abbildung 2.14: Das Drei-Körper-Problem, bestehend aus Sonne, Erde und Jupiter.
Es handelt sich bei diesem Problem um ein Drei-Körper-Problem, das im Gegensatz zum
obigen Zwei-Körper-Problem nicht explizit gelöst werden kann. Zur Vereinfachung nehmen
wir an, daß sich alle drei Körper in einer Ebene bewegen.
Wir wählen die (zweidimensionalen) Anfangswerte
µ ¶
µ ¶
µ ¶
µ ¶
µ ¶
0
r0
0
%0
w0
0
0
0
r1 (0) = r1 (0) =
, r2 (0) =
, r2 (0) =
, r3 (0) =
, r3 (0) =
,
0
0
1
0
0
(2.37)
mit r0 = 1 und %0 = 5.2. Welche Bahngeschwindigkeit hat der Jupiter? Er umkreist die
Sonne etwa alle 11.3 Erdenjahre. Seine Bahngeschwindigkeit lautet daher
w=
2π · 5.2 · 1.5 · 1011 m
2π · 5.2 · L
4m
=
≈
1.36
·
10
.
11.3 Jahre
11.3 · 3.2 · 107 s
s
Die skalierte Geschwindigkeit w0 berechnet sich dann aus
w0 =
5 · 106
T
v=
1.36 · 104 ≈ 0.45.
L
1.5 · 1011
In Abbildung 2.15 präsentieren wir die numerische Lösung des Problems (2.36)–(2.37).
Wie erwartet bewegen sich die Erde und der Jupiter (fast) auf Kreisbahnen um die Sonne,
die im wesentlichen unbewegt ist.
y
5
0
Sonne
•
−5
−5
0
x
•
Jupiter
Erde
•
5
Abbildung 2.15: Bahnen der Erde und des Jupiters um die Sonne.
67
200
r0=1.0002
y
150
r =1
0
100
50
0
••
0
•
20
40
60
80
x
Abbildung 2.16: Bahnen von Sonne, Erde und Jupiter (ε = 10−6 , δ = 0.4). Der Wert r0
bezieht sich auf den anfänglichen Abstand Erde–Sonne.
Die Situation ändert sich drastisch, wenn der dritte Planet wesentlich schwerer ist und
einen stärkeren Einfluß auf die Sonne und damit auf die Erde ausübt. Wir nehmen an,
daß der dritte Planet 40 % der Sonnenmasse besitzt und nennen ihn wieder “Jupiter”.
Abbildung 2.16 zeigt, daß sich Sonne und Jupiter um ihren gemeinsamen Schwerpunkt
drehen, während die Erde aus dem Sonnensystem herausgeschleudert wird. Interessant
ist in diesem Zusammenhang, daß die Erdbahn äußerst sensibel von dem Anfangsabstand Erde–Sonne r0 abhängt. Eine geringfügige Änderung des Anfangswerts führt zu
einer völlig anderen Lösung der Erdbahn. Da der Anfangswert in der Praxis stets nur
mit endlicher Genauigkeit bestimmt werden kann, folgt daraus, daß die Erdbewegung in
diesem Fall praktisch nicht präzise vorhergesagt werden kann, obwohl sie einer vollständig
deterministischen Differentialgleichung genügt.
2.7
Deterministisches Chaos
Der Waschmaschinenhersteller aus Abschnitt 1.2 hat für eine neu konstruierte Maschine
unkontrollierte Schwingungen festgestellt, die innerhalb kurzer Zeit das Gerät zerstören.
Was ist passiert?
Wir nehmen an, daß die (vertikalen) Auslenkungen x(t) der Maschine durch die
Schwingungsgleichung
x00 + 2%x0 + ω 2 sin x = γω02 sin ω0 t,
t > 0,
(2.38)
beschrieben werden können (siehe Abschnitt 1.2). Beachte, daß wir hier die allgemeine
Rückstellkraft ω 2 sin x anstelle der Approximation ω 2 x verwenden. Der Maschinenhersteller liefert uns die Daten
2
3
1
% = , ω 2 = 1, ω0 = , γ = .
20
3
2
68
Als Anfangswerte verwenden wir
x0 (0) = 0.
x(0) = 1,
(2.39)
Da das Problem (2.38)–(2.39) nichtlinear ist, lösen wir es numerisch.
Ist die anregende Kraft Null (γ = 0), so führt das Gerät gedämpfte Schwingungen
durch. Wir illustrieren die Kurve x(t) im sogenannten Phasendiagramm, das die Kurve
t 7→ (x(t), x0 (t)) darstellt (Abbildung 2.17 links). An diesem Diagramm ist bequem zu
erkennen, daß die Auslenkungen oszillierend für lange Zeiten zum Ursprung konvergieren.
Bei nicht zu großer anregender Kraft (γ = 1), zwingt die Anregung dem System eine
harmonische Schwingung auf (Abbildung 2.17 rechts). Die Frequenz entspricht nicht der
Eigenfrequenz ω des frei schwingenden Systems, sondern ist ungefähr gleich der Frequenz
ω0 der antreibenden Kraft.
2.5
0.8
2
0.6
1.5
Geschwindigkeit
Geschwindigkeit
0.4
0.2
0
−0.2
−0.4
−0.6
0
−0.5
−1
−1.5
−0.8
−1
−1
1
0.5
−2
−0.5
0
Auslenkung
0.5
−2.5
1
−15
−10
−5
Auslenkung
0
Abbildung 2.17: Phasendiagramm der erzwungenen Schwingung für γ = 0 (links) und
γ = 1 (rechts).
Wird die Antreibkraft weiter erhöht, γ = 3/2, bewegt sich das Pendel nicht mehr
gleichmäßig (Abbildung 2.18 links). Die Ausschläge scheinen völlig chaotisch. Dies erklärt
das von dem Waschmaschinenhersteller beobachtete Verhalten des Geräts. Insbesondere
werden die Auslenkungen schnell so groß, daß sie die Maschine zerstören. Die Bewegungen
werden praktisch unvorhersagbar, da eine minimale Änderung der Anfangsbedingungen
zu einer völlig anderen Bahnkurve führt (Abbildung 2.18 rechts). Diese Situation entspricht dem Drei-Körper-Problem aus dem letzten Abschnitt. Obwohl die Auslenkungen
die Lösungen einer deterministischen Gleichung sind, sind ihre Werte praktisch nicht
präzise vorhersagbar. Wir nennen dies deterministisches Chaos.
Was ist Chaos? Der Begriff ist in der Literatur nicht einheitlich definiert. Wir geben
im folgenden eine Definition nach Wiggings [8] an. Dazu benötigen wir allerlei Begriffe.
Sei φ(t, x0 ) := x(t) die Lösung der Differentialgleichung
x0 = f (x),
t > 0,
69
x(0) = x0 ,
(2.40)
3
2
2
1
Geschwindigkeit
Geschwindigkeit
3
0
−1
−2
−3
1
0
−1
−2
−20
−10
0
10
Auslenkung
20
−3
30
0
10
20
30
40
Auslenkung
50
60
70
Abbildung 2.18: Phasendiagramm der erzwungenen Schwingung für γ = 3/2 und x(0) = 1
(links) bzw. x(0) = 1.0001 (rechts).
wobei f : Rn → Rn eine stetige Funktion und x0 ∈ Rn seien. Wir nehmen an, daß die
Lösung eindeutig ist und für alle t > 0 existiert. Wir nennen die Abbildung (t, x0 ) 7→
φ(t, x0 ) auch den Fluß der Gleichung (2.40).
Definition 2.2 Sei φ der Fluß von (2.40) und A ⊂ Rn eine kompakte Menge.
(1) Die Menge A heißt invariant unter dem Fluß von φ genau dann, wenn
∀ t ≥ 0 : φ(t, A) ⊂ A.
(2) Sei A abgeschlossen und invariant unter φ. Die Menge A heißt topologisch transitiv
bezüglich φ genau dann, wenn
∀ U, V ⊂ A offen : ∃ t ≥ 0 : φ(t, U ) ∩ V 6= ∅.
Unter dem Symbol φ(t, A) verstehen wir die Menge aller φ(t, x) mit x ∈ A. Eine
Menge heißt also invariant, wenn der Fluß in der Menge bleibt (Abbildung 2.19 links).
Eine Menge ist topologisch invariant, wenn der Fluß mit jeder offenen Menge nichtleeren
Schnitt hat (Abbildung 2.19 rechts).
Definition 2.3 Sei φ der Fluß von (2.40) und A invariant unter φ.
(1) Der Fluß φ hängt sensitiv von den Anfangswerten in A ab, wenn
∃ε>0:
∀x∈A:
∀ Umgebungen U von x: ∃ y ∈ U :
|φ(t, x) − φ(t, y)| > ε.
70
∃t>0:
φ (t,y)
U
y
x
φ (t,x)
V
A
x
Abbildung 2.19: Zur Definition einer invarianten bzw. topologisch transitiven Menge. Die
Menge links ist nicht invariant, da φ(t, y) A verläßt.
(2) Der Fluß φ heißt chaotisch bzgl. A genau dann, wenn er sensitiv von den Anfangswerten in A abhängt und topologisch transitiv bzgl. A ist.
Eine sensitive Abhängigkeit von den Anfangsdaten bedeutet also, daß sich die Lösungen von (2.40) “weit” voneinander entfernen, selbst wenn die Anfangswerte sehr dicht
beieinander liegen (Abbildung 2.20).
A
φ (t,y)
y
φ (t,x)
x
U
Abbildung 2.20: Zur Definition der sensitiven Abhängigkeit von den Anfangswerten.
Als ein Beispiel eines chaotischen Flusses präsentieren wir die sogenannten LorenzGleichungen:
x0 = −%(x − y)
y 0 = rx − y − xz,
z 0 = xy − bz,
t > 0,
mit Anfangswerten
x(0) = x0 ,
y(0) = y0 ,
z(0) = z0 ,
die die Strömung einer Flüssigkeit zwischen zwei horizontalen Platten, von denen die untere beheizt wird, modellieren (Abbildung 2.21). Hierbei haben die Variablen die folgende
Bedeutung:
x ist proportional zum Betrag der Konvektionsgeschwindigkeit,
71
<
<
<
<
<
T
<
<
0
<
T
1
Abbildung 2.21: Die Flüssigkeit zwischen zwei parallelen Platten wird von unten beheizt.
Für genügend große Temperaturdifferenzen T1 − T0 bildet sich eine periodische Strömung,
die bei sehr großen Temperaturdifferenzen in eine chaotische Strömung übergeht. Dazwischen bilden sich sogenannte Bénard-Zellen aus.
y ist proportional zur Temperaturdifferenz zwischen aufsteigender und abfallender
Strömung,
z ist proportional zur Abweichung vom linearen vertikalen Temperaturprofil.
Die Interpretation der drei Parameter %, b und r ist schwieriger:
% ist proportional zur Viskosität,
b ist ein Maß für die Geometrie der Bénard-Zellen,
r ist unter anderem proportional zur Temperaturdifferenz T1 − T0 .
Wir lösen die Lorenz-Gleichungen numerisch für % = 10, b = 8/3, r = 10 bzw. r = 28
und x0 = y0 = z0 = 10. Für genügend kleine Parameter r > 0 konvergiert (x(t), y(t), z(t))
gegen einen Fixpunkt (Abbildung 2.22 links), während für hinreichend große r > 0 sich
ein chaotisches Verhalten zeigt. Man kann zeigen, daß der den Lorenz-Gleichungen entsprechende Fluß chaotisch ist.
72
50
40
z
15
30
z
10
20
5
10
0
8
20
6
0
4
y
2
2
8
6
4
−20
y
x
−15
−10
0
−5
5
10
15
x
Abbildung 2.22: Lösungskurve der Lorenz-Gleichungen für % = 10, b = 8/3, r = 10 (links)
und r = 28 (rechts).
3
Wellenphänomene
In diesem Kapitel untersuchen wir verschiedene Wellenphänomene im weiteren Sinne, die
auf Differentialgleichungen führen.
3.1
Wellengleichung
Die Funktionsweise einer Quarzuhr basiert darauf, daß ein Quarzkristall zu Schwingungen
angeregt wird. In diesem Abschnitt wollen wir die folgende Frage erörtern:
Frage: Wie schwingt ein Kristall?
Ein Kristall besteht aus Atomen, die idealerweise in regelmäßigen Abständen voneinander
angeordnet sind. Die Atome können aus ihrer Ruhelage heraus in Schwingungen versetzt
werden. Wir modellieren den Kristall zunächst in einer Raumdimension als eine lineare
Kette gekoppelter Oszillatoren. Wir betrachten also ein System von n Massepunkten der
Masse m, die die Kristallatome modellieren und die in einer eindimensionalen Kette jeweils
im Abstand a angeordnet sind. Dabei seien benachbarte Massen über elastische Federn
der Federkonstante D miteinander verbunden (Abbildung 3.1). Sei xi (t) die Auslenkung
der i-ten Masse aus der Ruhelage (i = 1, . . . , n).
Auf den i-ten Massepunkt wirken zwei Kräfte von den benachbarten Massepunkten:
Fi = Fi,i+1 + Fi,i−1 .
Vom (i ± 1)-ten Massepunkt wird eine Kraft ausgeübt, die proportional zum aktuellen
Abstand der beiden Massepunkte ist:
Fi,i±1 = D(xi±1 − xi ),
73
a
m
m
m
x (t)
i
Abbildung 3.1: Modell eines Systems gekoppelter Oszillatoren.
wobei die Proportionalitätskonstante gerade die Federkonstante ist. Aus dem Newtonschen Gesetz folgt
mx00i = Fi = D(xi+1 − xi ) + D(xi−1 − xi )
oder
x00i = ω02 (xi+1 − 2xi + xi−1 ),
i = 2, . . . , n − 1,
(3.1)
wobei ω02 := D/m. Wir nehmen an, daß die Auslenkungen des ersten und letzten Massepunktes gegeben seien:
x1 (t) = x1,0 (t),
xn (t) = xn,0 (t),
t ≥ 0.
Nun befinden sich im allgemeinen sehr viele Atome in einem sehr kleinen Abstand
voneinander im Kristall, so daß es sinnvoll ist, das System (3.1) von gewöhnlichen Differentialgleichungen dadurch zu vereinfachen, daß wir den Grenzwert
n→∞
und
a→0
durchführen. Natürlich soll dabei die Gesamtlänge L = na konstant bleiben. In diesem
Grenzübergang identifizieren wir die Auslenkungen der Massepunkte gemäß
xi (t) = u(x, t),
x = i · a.
Setzen wir dies in (3.1) ein, erhalten wir
∂2u
(x, t) = ω02 [u(x + a, t) − 2u(x, t) + u(x − a, t)].
∂t2
Eine Taylorentwicklung
u(x ± a, t) = u(x, t) ±
1 ∂2u
∂u
(x, t)a +
(x, t)a2 + O(a3 )
∂x
2 ∂x2
(a → 0)
liefert an der Stelle (x, t)
³
´
1
1
utt = ω02 u + ux a + uxx a2 − 2u + u − ux a + uxx a2 + O(a3 ) ,
2
2
74
wobei wir die partiellen Ableitungen von f durch Indices gekennzeichnet haben. Im Grenzwert a → 0 folgt die partielle Differentialgleichung
utt = c2 uxx ,
(x, t) ∈ (0, L) × (0, ∞),
(3.2)
wobei c2 der Grenzwert von ω02 a2 für a → 0 sei. Warum gilt nicht c = 0? Es gilt ω02 a2 =
Da2 /m. Mit a → 0 und n → ∞ sollte auch m → 0 folgen, da nm die Gesamtmasse der
Kette ist. Wir setzen voraus, daß im Grenzwert Da2 /m gegen die positive Konstante c2
konvergiert. Die Gleichung (3.2) heißt eindimensionale Wellengleichung. Sie ist zu lösen
mit den beiden Anfangsbedingungen
u(x, 0) = u0 (x),
ut (x, 0) = u1 (x),
x ∈ (0, L),
(3.3)
wobei u0 und u1 Funktionen sind, die sich aus dem Grenzwert a → 0, n → ∞ aus xi (0)
und x0i (0) ergeben, und mit den Randbedingungen
u(0, t) = g0 (t),
u(L, t) = g1 (t),
t > 0,
wobei die Funktionen g0 und g1 sich im Grenzwert aus x1,0 (t) und xn,0 (t) ergeben.
Die Wellengleichung (3.2) kann einfach auf (zwei oder) drei Raumdimensionen verallgemeinert werden. Dazu wird der Kristall durch ein dreidimensionales Gitter von Massepunkten mit Abstand a in jeder Richtung modelliert, wobei die Massepunkte entlang der
kartesischen Koordinaten mit elastischen Federn verbunden seien. Die Massepunkte seien
in jeder Koordinate durch die Indices i1 , i2 , i3 durchnumeriert. Definieren wir x1 = i1 a,
x2 = i2 a und x3 = i3 a, so folgt nach Taylorentwicklung und dem Grenzwert a → 0,
n → ∞ wie oben die dreidimensionale Wellengleichung
utt = c2 ∆u,
(x, t) ∈ (0, L)3 × (0, ∞),
wobei x = (x1 , x2 , x3 )> , und ∆ ist der Laplace-Operator in drei Raumdimensionen
∆=
∂2
∂2
∂2
+
+
.
∂x21 ∂x22 ∂x23
Übrigens kann die Wellengleichung (3.2) auch zur Modellierung einer schwingenden
Saite (z.B. Gitarrensaite) verwendet werden. Um dies einzusehen, betrachten wir eine
Saite mit konstanter Massendichte % und Auslenkung u(x, t). Die Massendichte ist über
m = % · (x2 − x1 ) definiert, wobei m die Masse der Saite im Interval [x1 , x2 ] sei. Auf den
Punkt der Saite u(x, t) wirkt die Kraft (Abbildung 3.2)
F = F0 (sin(α + dα) − sin α).
75
u
α+dα
du
α
dx
x
x
x+dx
Abbildung 3.2: Geometrie einer schwingenden Saite.
Ist die Länge der Saite wesentlich größer als ihre Auslenkung, gilt α ¿ 1 und damit
näherungsweise
F ≈ F0 cos α dα ≈ F0 dα.
Wir benötigen nun einen Ausdruck für die Winkeländerung dα. Wieder wegen α ¿ 1
folgt
du
(x),
α ≈ tan α =
dx
und damit ist
dα = (α + dα) − α =
du
du
∂2u
(x + dx) − (x) ≈
(x)dx.
dx
dx
∂x2
Aus dem Newtongesetz ergibt sich dann
m
und mit m = %dx endlich
∂2u
∂2u
=
F
=
F
dx
0
∂t2
∂x2
∂2u
F0 ∂ 2 u
=
.
∂t2
% ∂x2
Dies ist die Wellengleichung.
Um zu verstehen, welche Gestalt Lösungen von (3.2) haben können, betrachten wir
zunächst die Gleichung für alle x ∈ R. Mit der Variablentransformation
ξ = x − ct,
folgt
η = x + ct
∂
1∂
∂
=
−
,
∂ξ
∂x c ∂t
und
0=
µ
∂2
1 ∂2
−
∂x2 c2 ∂t2
¶
u=
µ
∂
∂
1∂
=
+
∂η
∂x c ∂t
∂
1∂
−
∂x c ∂t
76
¶µ
∂
1∂
+
∂x c ∂t
¶
u=
∂2u
.
∂ξ∂η
Die Funktion
∂u
= h02 (η)
∂η
ist also konstant bzgl. ξ; hierbei ist die Funktion h02 (η) eine Integrationskonstante. Integrieren wir diese Gleichung bzgl. η, folgt
u(ξ, η) = h2 (η) + h1 (ξ),
wobei h1 (ξ) eine Integrationskonstante ist. Rücktransformation ergibt
u(x, t) = h1 (x − ct) + h2 (x + ct).
Die Funktionen h1 und h2 können wir aus den Anfangsbedingungen (3.3) bestimmen:
u0 (x) = u(x, 0) = h1 (x) + h2 (x),
u1 (x) = ut (x, 0) = −ch01 (x) + ch02 (x).
Multipliziere die zweite Gleichung mit 1/c, integriere die resultierende Gleichung und
addiere bzw. subtrahiere sie zur ersten Gleichung:
µ
¶
Z
1
1 x
h1 (x) =
u0 (x) −
u1 (s) ds − h1 (0) + h2 (0) ,
2
c 0
µ
¶
Z
1 x
1
h2 (x) =
u0 (x) +
u1 (s) ds + h1 (0) − h2 (0) .
2
c 0
Daraus folgt für die Lösung von (3.2) für x ∈ R und (3.3):
Z
1 x+ct
1
u1 (s) ds.
u(x, t) = (u0 (x − ct) + u0 (x + ct)) +
2
c x−ct
Diesen Ausdruck nennt man die d’Alembertsche Formel. Sie erlaubt eine Interpretation
der Konstante c > 0. Betrachte dazu einen Anfangswert u0 wie in Abbildung 3.3. Zur Zeit
t > 0 bilden sich zwei “Wellen”, die sich mit der Geschwindigkeit c nach links bzw. rechts
bewegen. Die Konstante c kann daher als die Wellengeschwindigkeit interpretiert werden.
Wie pflanzen sich die Wellen in dem Kristall fort? Wir betrachten wieder ein eindimensionales Modell für den Kristall, den wir an den Enden x = 0 und x = L fest einspannen.
Wir müssen also das Anfangsrandwertproblem
utt = c2 uxx ,
(x, t) ∈ (0, L) × (0, ∞),
u(0, t) = u(L, t) = 0,
u(x, 0) = u0 (x),
lösen. Dazu machen wir den Ansatz
u(x, t) = f (x) · g(t).
77
(3.4)
ut (x, 0) = u1 (x),
(3.5)
u
u
t>0
t=0
1
1
2
−x
x
0
0
x
−x + ct
0
−x − ct
0
x − ct
0
x + ct
0
x
Abbildung 3.3: Lösung u(x, t) nach der d’Alembertschen Formel.
Setzen wir ihn in (3.4) ein, erhalten wir
1 g 00
f 00
=
.
c2 g
f
Die linke Seite hängt nur von t, die rechte Seite nur von x ab. Damit dies für alle (x, t)
gilt, müssen beide Seiten konstant sein. Wir nennen die Konstante α ∈ R:
f 00 − αf = 0,
x ∈ (0, L),
g 00 − c2 αg = 0,
t > 0.
(3.6)
(3.7)
Die erste Gleichung wird mit den Randbedingungen f (0) = f (L) = 0, die sich aus
(3.5) ergeben, gelöst. Sei zuerst α > 0. Dann lautet die allgemeine Lösung von (3.6)
f (x) = c1 e
√
αx
+ c 2 e−
√
αx
,
die jedoch nicht beide Randbedingungen erfüllen kann. Dies gilt auch für die allgemeine
Lösung f (x) = c1 x + c2 im Falle α = 0. Folglich muß α < 0 gelten. Wir setzen k 2 :=
−α > 0. Die allgemeine Lösung von (3.6) lautet
f (x) = c1 sin(kx) + c2 cos(kx).
Aus den Randbedingungen folgt c2 = 0 und sin kL = 0, also
k = kn =
nπ
,
L
n ∈ N.
Wir erhalten die unendlich vielen Lösungen
fn (x) = Cn sin(kn x),
x ∈ [0, L].
Die Lösung von (3.7) ist
gn (t) = An sin(ckn t) + Bn cos(ckn t).
78
Damit können wir die allgemeine Lösung von (3.4) schreiben als
u(x, t) =
∞
X
sin(kn x)(An sin(ckn t) + Bn cos(ckn t)).
n=1
Die Konstanten An und Bn berechnen wir aus den Anfangsbedingungen in (3.5):
u0 (x) = u(x, 0)
∞
X
=
n=1
∞
X
u1 (x) = ut (x, 0) =
Bn sin(kn x),
ckn An sin(kn x).
n=1
Multiplizieren wir nämlich diese Gleichungen mit sin(km x), integrieren in x ∈ (0, L) und
benutzen die Relation
(
Z L
L/2 : n = m,
L
sin(kn x) sin(km x) dx = δn,m =
2
0 : n 6= m,
0
so ergibt sich
2
Bm =
L
Z
L
2
Am =
ckm L
u0 (y) sin(km y) dy,
0
Z
L
u1 (y) sin(km y) dy.
(3.8)
0
Für die Lösung von (3.4)–(3.5) folgt schließlich
u(x, t) =
∞
X
n=1
sin
³ nπx ´ ·
L
¸
nπct
nπct
An sin
+ Bn cos
,
L
L
und die Koeffizienten An und Bn sind gegeben durch (3.8).
Die Lösung beschreibt eine Überlagerung von Wellen mit Kreisfrequenzen ωn := nπc/L.
Man nennt
n=1:
Grundschwingung,
n>1:
Oberschwingungen
und die entsprechenden Töne Grundton bzw. Obertöne.
Die mehrdimensionale Wellengleichung
utt = c2 ∆u,
x ∈ R3 ,
t > 0,
besitzt unter anderem Lösungen der Form
u(x, t) = ei(k·x+ωt) ,
79
(3.9)
wobei k = (k1 , k2 , k3 )> ∈ R3 , ω > 0, denn
utt − c2 ∆u = (−ω 2 + c2 (k12 + k22 + k32 ))u = 0,
sofern c|k| = ω gilt. Die Lösungen (3.9) können wir als ebene Wellen interpretieren, die
sich mit der Geschwindigkeit c fortpflanzen. Abbildung 3.4 zeigt die Wellenfronten, d.h.
die Mengen {(x, t) : k · x + ωt = const.}. Ein Punkt x auf der Wellenfront k · x + ωt =
α ∈ R bewege sich in der Zeit dt um dx, liege aber noch immer auf der Wellenfront, d.h.
k · (x + dx) + ω · (t + dt) = α und dx ist parallel zu k. Subtraktion der beiden Gleichungen
ergibt k · dx + ωdt = 0 oder
¯ ¯
¯ dx ¯
¯ ¯ = ω = c.
¯ dt ¯ |k|
Also ist die Geschwindigkeit des Punktes gerade gleich c.
t
x
Abbildung 3.4: Wellenfronten k · x + ωt = const.
Übungsaufgabe: Bestimmen Sie die Schwingungen einer rechteckigen Membran, d.h.,
lösen Sie die Schwingungsgleichung
utt = c2 (uxx + uyy ),
(x, y) ∈ (0, a) × (0, b),
u(x, y, 0) = u0 (x, y),
t > 0,
ut (x, y, 0) = u1 (x, y),
und u = 0 auf dem Rand des Rechtecks (0, a) × (0, b).
3.2
Schrödingergleichung
Die Funktionsweise eines MOS-Transistors basiert darauf, daß der Elektronenfluß vom
Emittor zum Kollektor durch eine angelegte Spannung am Basiskontakt gesteuert wird
80
(Abbildung 3.5). Eine Oxidschicht am Basiskontakt soll verhindern, daß Elektronen durch
die Basis abfließen. Die Abmessungen der heutigen Bauteile sind jedoch so winzig (z.B.
Abstand Emitter-Kollektor: 100 nm = 10−7 m, Dicke der Oxidschicht: 1.5 nm = 1.5 ·
10−9 m), daß dennoch zahlreiche Elektronen durch Überwinden der Oxidschicht über die
Basis und nicht über den Kollektor abfließen. In diesem Abschnitt wollen wir die Frage
beantworten:
B
E
K
Elektronen
Abbildung 3.5: Schematische Darstellung eines MOS-Transistors mit Emitter E, Basis B
und Kollektor K. Die schraffierte Region stellt die Oxidschicht dar.
Frage: Wann können Elektronen die Oxidschicht überwinden, und wie läßt sich das
verhindern?
Um diese Frage zu beantworten, müssen wir weit ausholen. Wir betrachten Elektronen
zunächst als klassische Teilchen, die den Newtonschen Gleichungen
x0 = v,
mv 0 = −V (x),
(3.10)
genügen. Hierbei sind x = x(t) und v = v(t) der Ort bzw. die Geschwindigkeit eines
Teilchens mit Masse m und V (x) das elektrostatische Potential. Die Ableitung von −V (x)
ist das elektrische Feld (bzw. die elektrische Kraft), die gleich dem Produkt Masse ×
Beschleunigung ist. Multiplikation von (3.10) mit v und Integration liefert
m
|v(t)|2 + V (x(t)) = const. =: E.
2
(3.11)
Dies drückt wieder die Energieerhaltung aus: Die Summe aus kinetischer Energie mv 2 /2
und potentieller Energie V (x) ist zeitlich konstant.
Wir können die Oxidschicht als eine Potentialbarriere modellieren (Abbildung 3.6),
z.B.
V (x) =
(
U : x ∈ Oxidschicht
0 : sonst.
81
V(x)
Elektronen
Oxid
Basis
Abbildung 3.6: Modellierung der Oxidschicht als Potentialbarriere.
Elektronen, deren Energie E kleiner als U ist, können die Oxidschicht nicht überwinden,
denn gäbe es ein Elektron innerhalb der Oxidschicht, so folgt aus (3.11)
U≤
m
|v(t)|2 + U = E < U
2
und damit ein Widerspruch. Nur Elektronen, für die E > U gilt, können die Oxidschicht
mit Geschwindigkeit
r
2
(E − U )
v(t) =
m
durchqueren.
Durch Experimente konnte festgestellt werden, daß auch Elektronen mit Energien
E < U die Potentialbarriere überwinden bzw. durchtunneln. Man spricht in diesem Fall
auch vom Tunneleffekt. Dieser Effekt basiert darauf, daß Elektronen keine (makroskopischen) Teilchen sind, die den Newtonschen Bewegungsgleichungen genügen, sondern die
quantenmechanisch beschrieben werden müssen.
In der Quantenmechanik wird ein Elektron durch eine sogenannte Wellenfunktion
ψ(x, t) ∈ C dargestellt. Das Integral
Z
|ψ(x, t)|2 dx
B
ist die Wahrscheinlichkeit, das Teilchen zur Zeit t im Gebiet B anzutreffen. Es können nur
Wahrscheinlichkeitsaussagen getroffen werden, da der Ort und die Geschwindigkeit eines
Elektrons nicht mehr mit beliebiger Genauigkeit gleichzeitig gemessen werden können.
Dies liegt daran, daß ein Elektron auch Wellencharakter zeigen kann, und steht im Gegensatz zur klassischen Mechanik, in der ja gerade die Newtonschen Gleichungen Ort x(t)
und Geschwindigkeit v(t) des Teilchens vollständig determinieren. Welcher Bewegungsgleichung genügt nun die Wellenfunktion?
In der Quantenmechanik werden die klassischen Größen durch Operatoren ersetzt,
nämlich
82
Ort
x
Impuls p := mv
Energie E
durch xOp ,
durch −i~∇,
durch i~ ∂/∂t,
(3.12)
wobei ∇ = (∂/∂x1 , ∂/∂x2 , ∂/∂x3 ) der Nabla-Operator ist, ~ = h/2π die reduzierte PlanckKonstante und i2 = −1. Der Operator der Lagekoordinate xOp entspricht der Multiplikation mit der Variablen x, also
((xOp (ψ))(x) = x · ψ(x).
Wir unterscheiden daher nicht zwischen xOp und x. Die Relationen (3.12) können nicht
hergeleitet werden; sie sind axiomatisch gegeben. Beachte, daß die Wellenfunktion komplexwertig ist. Ihre Werte können nicht direkt interpretiert werden; nur die reellwertige
Größe |ψ|2 besitzt eine physikalische Interpretation (als Wahrscheinlichkeit).
Die Energiehaltung (3.11) ist auch quantenmechanisch gültig. Aus (3.12) folgt dann
i~
³p · p
´
∂ψ
~2
= Eψ =
+ V (x) ψ = −
∆ψ + V (x)ψ,
∂t
2m
2m
x ∈ R3 ,
t > 0,
(3.13)
denn p·p = −~2 ∇·∇ = −~2 ∆. Diese Bewegungsgleichung für ψ wird Schrödingergleichung
genannt. Zur Zeit t = 0 ist die Anfangsbedingung
ψ(x, 0) = ψ0 (x),
x ∈ R3 ,
vorzuschreiben.
Um die Schrödingergleichung zu lösen, machen wir den Anstz
ψ(x, t) = φ(x)eiωt ,
der die Beziehung
−~ωφe
iωt
= i~ψt =
liefert. Wir setzen E := −~ω. Dann ist
−
µ
¶
~
∆φ + V φ eiωt
−
2m
~
∆φ + V (x)φ = Eφ,
2m
x ∈ R3 ,
(3.14)
die stationäre Schrödingergleichung. Sie ist eine Eigenwertgleichung. Definieren wir nämlich den Hamilton-Operator H := −(~/2m)∆ + V , so sind Eigenfunktion-Eigenwert-Paare
(φ, E) der Operatorgleichung
Hφ = Eφ
zu bestimmen. Den Wert E interpretieren wir als die Energie des Teilchens. Wir betrachten
im folgenden einige Beispiele.
83
Beispiel 3.1 (freies Teilchen)
Die Bewegung eines freien Teilchens wird durch keine Kraft beeinflußt; also ist das Potential V konstant. Wir wählen V = 0 und lösen die Gleichung
−
~2
∆φ = Eφ,
2m
x ∈ R3 .
(3.15)
Die Lösung lautet im eindimensionalen Fall
φ(x) = ceikx ,
k=
√
2mE/~,
c ∈ R,
√
sofern E ≥ 0. Im Falle E < 0 wäre φ(x) = cekx mit k = −2mE/~ zwar eine Lösung von
(3.15); jedoch würde |φ(x)| → ∞ für x → ∞ gelten, und dies würde der Interpretation,
daß |φ|2 eine Wahrscheinlichkeit darstellt, widersprechen.
Wir finden also für jede Energie E ≥ 0 eine Eigenfunktion φ. Die zeitabhängige Wellenfunktion lautet
ψ(x, t) = cei(kx+ωt) .
Ein Vergleich mit der Lösung (3.9) der klassischen Wellengleichung zeigt, daß wir ψ als
eine komplexwertige ebene Welle interpretieren können.
¤
Beispiel 3.2 (Teilchen im Potentialtopf)
Wir betrachten ein Teilchen in einem eindimensionalen Potentialtopf mit einem unendlich
hohen Potential außerhalb des Topfes (Abbildung 3.7)
(
0 : x ∈ (0, a)
V (x) =
∞ : sonst.
Außerhalb des Potentialtopfs muß die Wellenfunktion φ = 0 sein, damit sie Lösung von
8
8
x
0
a
Abbildung 3.7: Eigenzustände eines Teilchens in einem Potentialtopf.
(3.14) sein kann. Im Innern des Topfes müssen wir
−
~
φxx = Eφ,
2m
84
x ∈ (0, a),
lösen. Wir fordern, daß φ in R stetig ist; dies impliziert die Randbedingungen
φ(0) = φ(a) = 0.
Der Ansatz φ(x) = eiλx führt auf die allgemeine Lösung
φ(x) = c1 eikx + c2 e−ikx ,
k=
√
2mE/~.
Einsetzen des Randbedingungen ergibt
0 = φ(0) = c1 + c2 ,
0 = φ(a) = c1 eika + c2 e−ika = c1 (eika − e−ika )
= 2ic1 sin ka.
Dies impliziert (um nicht die triviale Lösung c1 = c2 = 0 zu erhalten) ka = nπ, n ∈ N,
und
¢
¡
nπx
,
x ∈ [0, a], n ∈ N.
φn (x) = c1 einπx/a − e−inπx/a = c sin
a
Die Konstante c := 2ic1 bestimmen wir aus der Normierungsforderung
Z
Z a¯
³
´¯
¯ 2 nπx ¯2
1=
|φn (x)| dx = c
¯sin
¯ dx,
a
R
0
die sich daraus ergibt, daß die Wahrscheinlichkeit, das Teilchen irgendwo im Intervall [0, a]
zu finden, gerade Eins ist. Die Energie ist also diskret; sie kann nur die Werte
En =
~2 kn2
~2 π 2 2
=
n
2m
2ma2
annehmen (Abbildung 3.7). Diese Situation ist ähnlich wie bei der Lösung der Wellengleichung in einem begrenzten Gebiet, widerspricht jedoch unserem intuitiven Verständnis
eines Elektrons als Teilchen. Der Grund liegt darin, daß ein Elektron sowohl Teilchenals auch Welleneigenschaften zeigen kann. Man nennt dies Teilchen-Welle-Dualismus des
Elektrons.
¤
Wir kehren wieder zu der Frage zurück, warum die Elektronen die Oxidschicht durchtunneln können. Wir modellieren diese wie in Abbildung 3.6 als ein Potential (siehe auch
Abbildung 3.8):


 0 : x < 0,
V (x) =
U : 0 ≤ x < d,


0 : x ≥ d.
Wir nehmen zunächst an, daß die Energie der Teilchen kleiner als die Potentialbarriere
85
d
x
0
Abbildung 3.8: Tunneleffekt bei einem rechteckigen Potentialwall in (0, d).
ist, d.h. E < U . In den drei Teilgebieten sind die folgenden Gleichungen zu lösen:
~2 00
φ = Eφ,
x < 0,
2m
~2 00
φ = (E − U )φ,
0 < x < d,
−
2m
2
~ 00
−
φ = Eφ,
x > d.
2m
Die allgemeine Lösung in R lautet:

ikx
−ikx

: x < 0,
 Ae + Be
`x
−`x
φ(x) =
Ce − De
: 0 < x < d,


ikx
Fe
: x > d,
−
wobei
k=
√
2mE/~,
`=
p
2m(U − E)/~,
und A, B, C, D, F sind komplexe Konstanten.
Diese Lösung kann folgendermaßen interpretiert werden:
Vor dem Wall (x < 0) gibt es eine nach rechts einlaufende Welle Aeikx und eine
nach links laufende, am Wall reflektierte Welle Be−ikx .
Im Wall (0 < x < d) werden die eindringende und die am Wallende reflektierte
Welle gedämpft.
Hinter dem Wall (x > d) gibt es nur eine auslaufende Welle. Den Lösungsanteil
Ge−ikx haben wir verworfen, d.h. G = 0 gesetzt.
Wir fordern, daß die Funktion φ stetig differenzierbar in R ist. Dies liefert die vier Randbedingungen an x = 0 und x = d:
lim φ(j) (x) = lim φ(j) (x),
x%0
x&0
lim φ(j) (x) = lim φ(j) (x),
x%d
x&d
86
j = 0, 1.
Diese Bedingungen erlauben es, die vier Konstanten B, C, D und F als Funktion von k,
`, d und A zu berechnen. Insbesondere kann die Transmissions- oder Tunnelwahrscheinlichkeit
|F |2
T =
|A|2
aus dem Verhältnis der Amplitudenquadrate vor und hinter dem Potentialwall bestimmt
werden.
Übungsaufgabe: Bestimmen Sie B, C, D und F als Funktion von A, und berechnen
Sie T = |F |2 /|A|2 .
Das Ergebnis lautet
T =
1 − E/U
,
1 − E/U + (U/4E) sinh2 (d`)
U > E.
(3.16)
Im Falle starker Dämpfung (d` À 1) können wir sinh2 (d`) ≈ e−2d` /4 approximieren und
erhalten die Näherung
1 − E/U
1 − E/U + (U/16E)e2d`
T ≈
1 − E/U
16E −2d`
e
U
(1 − E/U )16E/U · e−2d` + 1
=
16E −2d`
E
e
(1 − )
U
U
16E(U − E) −2d√2m(U −E)/~
e
=
U2
≈
U > E.
Die Tunnelwahrscheinlichkeit hängt also exponentiell von der Barrierendicke d ab. Dies
erklärt das experimentell in MOS-Transistoren beobachtete Phänomen, daß mehr Elektronen durch die Oxidschicht tunneln, wenn diese dünner wird.
Übrigens ist die Tunnelwahrscheinlichkeit T auch im Fall E > U im allgemeinen kleiner
als Eins – im Gegensatz zu klassischen Teilchen. Eine analoge Rechnung wie oben ergibt
T =
wobei `0 =
p
E/U − 1
,
E/U − 1 + (U/4E) sin2 (d`0 )
E > U,
(3.17)
2m(E − U )/~.
Übungsaufgabe: Zeigen Sie, daß im Falle E > U die Transmissionswahrscheinlichkeit
durch (3.17) gegeben ist.
87
Gilt nun d`0 = nπ (n ∈ N), so verschwindet der sin-Term, und für diese speziellen Energien
gilt tatsächlich T = 1.
Wie lauten die Transmissionswahrscheinlichkeiten bei einer Oxidschicht mit Dicke
1.5nm? Wir wählen die folgenden Werte:
d = 1.5nm = 1.5 · 10−7 cm,
Oxidschichtdicke:
m = 9 · 10−31 kg,
Masse eines Elektrons:
~ = 10−30 kg cm2 /s,
reduzierte Planck-Konstante:
U = 10eV = 1.6 · 10−14 kg cm2 /s2 .
Potentialbarriere:
Wir erhalten die in Abbildung 3.9 dargestellten Werte. Ein Elektron in einem Transistor
1
0.8
T
0.6
0.4
0.2
0
0
1
2
3
4
5
E/U
Abbildung 3.9: Transmissionswahrscheinlichkeit T eines Elektrons bei einem Potentialwall
in Abhängigkeit von der Energie E.
mit einer Emitter-Kollektor-Spannung von 1 V besitzt die Energie 1eV, also E/U = 0.1.
Die entsprechende Tunnelwahrscheinlichkeit beträgt nur T = 4 · 10−4 = 0.04%. Sie steigt
bei Dünnerwerden der Oxidschickt jedoch rapide an: Bei d = 0.75 nm gilt bereits T =
4.5%.
3.3
Computertomographie
Die Computertomographie ermöglicht es, Querschnitte eines lebenden menschlichen Körpers graphisch darzustellen. Im Gegensatz zu einer herkömmlichen Röntgenuntersuchung,
bei der man die Projektion des Objekts auf eine Ebene betrachtet, werden bei der Computertomographie die Röntgenstrahlen in der Querschnittsebene aus vielen verschiedenen
Richtungen durch den Körper geschickt. Die Daten liefern um den Patienten rotierende
Röntgenquellen und Detektoren (Abbildung 3.10). Der Körper absorbiert die Röntgen-
88
Q
Q
D
D
Abbildung 3.10: Prinzipieller Aufbau eines Computertomographen mit Röntgenquellen Q
und Detektoren D.
strahlung unterschiedlich. Aus der Abschwächung der Strahlung können dann die Abschwächungskoeffizienten in der Querschnittsebene bestimmt und damit zwischen dichter und weniger dichter Materie (z.B. Knochen versus Gewebe) unterschieden werden.
Übrigens beschrieb G.N. Hounsfield (zusammen mit J. Ambrose) 1972 das Prinzip der
Computertomographie als erster und erhielt dafür 1979 den Nobelpreis der Medizin.
Wir wollen in diesem Abschnitt die Frage beantworten:
Frage: Wie kann das Schnittbild aus den Daten der Röntgendetektoren rekonstruiert
werden?
Die Schwächung der Röntgenstrahlung beim Durchgang durch Materie geschieht nach
dem Lambert-Beer-Gesetz
I(d) = I(0)e−µd ,
(3.18)
wobei I(d) die Intensität des Strahles am Ort d und d die Dicke des homogenen Mediums seien. Die Konstante µ > 0 ist der Abschwächungskoeffizient und ist ein Maß für
die Stärke der Abschwächung. Genauer gesagt ist µ eine Funktion des Materials und der
Energie der Röntgenstrahlung. Das Gesetz (3.18) kann mit der Tunnelwahrscheinlichkeit
aus Abschnitt 3.2 verglichen werden, die ebenfalls exponentiell von der Dicke des Hindernisses abhängt. Wegen der unterschiedlichen Materialien im menschlichen Körper ist
der Koeffizient µ eine Funktion des Ortes. Die Abschwächung der Strahlungsintensität dI
entlang eines kleinen Wegstückes dx ist dann proportional zu der Intensität:
dI = −µ(x)I dx
89
oder
dI
= −µ(x)I.
dx
Integration dieser Differentialgleichung
−µ(x) =
1 dI
d
=
ln I
I dx
dx
über einen Weg Γ von einer Quelle am Ort Q zu einem Detektor am Ort D liefert dann
Z
I(D)
µ(x) dx = − ln I(D) + ln I(Q) = − ln
.
(3.19)
I(Q)
Γ
Unser Ziel lautet, den ortsabhängigen Schwächungskoeffizienten µ eines Querschnitts
zu bestimmen. Die Apparatur rotiere in nα gleichverteilten Schritten zwischen αmin und
αmax , und jedes Strahlenbündel bestehe aus np gleichverteilten Strahlen zwischen pmin
und pmax (Abbildung 3.10). Die Messungen mit dieser Geometrie liefern m := nα np Werte
der nα np Linienintegrale (3.19) über µ(x) entlang der Geradenstücke Γ1 , . . . , Γm von den
Quellen zu den Detektoren. Bezeichnen wir mit Qi und Di die durch das i-te Geradenstück
Γi verbundenen Quellen und Detektoren und mit I(Qi ) und I(Di ) (i = 1, . . . , m) die
zugehörigen Intensitäten, so gilt nach (3.19)
Z
µ(x) dx = bi ,
i = 1, . . . , m,
(3.20)
Γi
wobei
bi = − ln
I(Di )
I(Qi )
die experimentell ermittelten Werte sind. Die Gleichung (3.20) ist die Radontransformation der Funktion µ. Bei (geeignet gewählten) unendlich vielen Strahlen ist µ eindeutig
durch die rechten Seiten bestimmt. Bei endlich vielen Strahlen läßt sich µ nur approximativ bestimmen.
Eine Möglichkeit, µ zu bestimmen, ist die Diskretisierung der Umkehrformel der Radontransformation. Wir wählen im folgenden einen sehr einfachen algebraischen Ansatz
aus [5]: Wir suchen eine Näherungslösung µ des Systems (3.20). Dazu zerlegen wir die
Querschnittsebene in n2 gleich große quadratische Elemente, im folgenden Pixel genannt
(Abbildung 3.11). Wir suchen eine Bestapproximation an die Lösung von (3.20) im n2 dimensionalen Raum
S = span{φ1 , . . . , φn2 }
mit den Basisfunktionen φi : R2 → R, definiert durch
(
1 : falls x im Pixel der k-ten Zeile und `-ten Spalte liegt
φ(k−1)n+` (x) =
0 : sonst.
90
Pmin
Q
α
1
2
3
Pmax
n2
D
Abbildung 3.11: Zur Approximation des Abschwächungskoeffizienten µ.
Die Funktionen φi sind also die Indikatorfunktionen der n2 Pixel. Die Näherungslösung µ
ist als Linearkombination aller φi dargestellt:
2
µ(x) =
n
X
µi φi (x).
(3.21)
i=1
Dies bedeutet, daß µ auf jedem Pixel der Zerlegung konstant ist. Das medizinische Bild
entsteht dann durch Darstellung der Werte µi als Grauwerte. Das Bild wird umso genauer,
je mehr Pixel verwendet werden.
Setzen wir (3.21) in (3.20) ein, so folgt näherungsweise
bi =
Z
2
µ(x) dx =
Γi
n
X
j=1
µj
Z
φj (x) dx,
i = 1, . . . , m.
(3.22)
Γi
Setzen wir
aij =
Z
φj (x) dx,
u = (µ1 , . . . , µn2 )> ,
b = (b1 , . . . , bm )>
Γi
und A = (aij ), können wir (3.22) als lineares Gleichungssystem
Au = b
(3.23)
mit der Unbekannten u schreiben. Die Zahl der Messungen (d.h. die Zahl der Gleichungen
in (3.22)) wird im allgemeinen wesentlich größer als die Anzahl der Pixel sein, um die
Qualität der Rekonstruktion zu erhöhen. In diesem Fall ist (3.23) ein überbestimmtes
91
Gleichungssystem und daher im allgemeinen nicht lösbar oder nicht eindeutig lösbar. Wir
suchen deshalb eine Lösung im Sinne der kleinsten Quadrate, d.h., u ist die Lösung von
Q(u) = min2 Q(v)
v∈Rn
mit Q(v) := kAv − bk22 ,
(3.24)
2
und kxk22 := x> x ist die euklidische Norm auf Rn .
Wie können wir nun (3.24) lösen? Wir behaupten, daß das Minimierungsproblem äquivalent ist zur Lösung der Gaußschen Normalengleichungen
A> Au = A> b.
(3.25)
2
Satz 3.3 Seien A ∈ Rm×n und b ∈ Rm . Dann sind die Probleme (3.24) und (3.25)
äquivalent.
Beweis: Wir berechnen die i-te Richtungsabteilung von Q:
1
1
1
(Q(v + sei ) − Q(v)) =
(Av − b + sAei )> (Av − b + sAei ) − (Av − b)> (Av − b)
s
s
s
>
>
= 2(Av − b) Aei + s(Aei ) Aei ,
wobei ei der i-te Einheitsvektor des Rm sei. Der Grenzwert s → 0 ergibt
∂Q(v)
= 2(Av − b)> Aei
∂ui
und damit
∇u Q(v) = (2(Av − b)> A)> = 2A> (Av − b).
Ist nun u eine Lösung von (3.24), gilt ∇u Q(u) = 0, und u löst (3.25). Ist umgekehrt
u eine Lösung von (3.25), so ist u ein kritischer Punkt von Q. Die Funktion u ist ein
2
Minimum von Q, weil A> A wegen v > (A> A)v = kAvk22 ≥ 0 für v ∈ Rn positiv semidefinit
ist.
¤
Wir bemerken, daß das lineare Gleichungssystem (3.25) im allgemeinen nur iterativ
gelöst werden kann. Üblicherweise werden n2 = 5122 Pixel zur Bestimmung des Querschnittsbildes verwendet. Verwendet man nun m > n2 = 262144 Röntgenstrahlen, ist ein
riesiges Gleichungssystem mit einer Matrix mit mindestens 262144 × 262144 Elementen
zu lösen. Die Koeffizientenmatrix enthält sehr viele Nullen, da jeder Röntgenstrahl nur
eine kleine Anzahl von Pixeln schneidet. Doch selbst wenn nur die von Null verschiedenen
Einträge abgespeichert werden, erfordert die Matrix einen Speicherbedarf von etwa zwei
Gigabyte.
92
4
Strömungen
Eine große Anzahl von sich bewegenden Teilchen kann durch makroskopische Variablen
wie Teilchendichte und mittlere Teilchengeschwindigkeit beschrieben werden. Räumliche
und zeitliche Änderungen dieser Größen genügen häufig Erhaltungsgleichungen, die formal
zu partiellen Differentialgleichungen äquivalent sind. In diesem Kapitel betrachten wir
verschiedene Strömungen, die auf Erhaltungsgleichungen führen.
4.1
Verschmutzung eines Flusses
Aufgrund eines Chemieunfalls gelangt eine giftige Substanz in einen Seitenarm eines
großen Flusses, der 10km von der Verunreinigung entfernt ist. Die Strömungsgeschwindigkeit an der Unglücksstelle betrage 60m pro Minute. Bevor die giftige Substanz die
Einmündungsstelle in dem großen Fluß erreicht, soll dort eine mobile Filteranlage installiert werden, um die Substanz aus dem Wasser zu entfernen.
Frage: Wieviel Zeit verbleibt für die Installation der Filteranlage, und wieviel Substanz
kann herausgefiltert werden?
Naiverweise würden wir vermuten, daß
10000m
≈ 166.7 min,
60m/ min
also gut zweieinhalb Stunden für die Installation zur Verfügung stehen. Allerdings wird
die Berechnung durch folgende Fakten verkompliziert:
Der kleine Fluß verbreitert sich von der Unglücksstelle bis zur Mündung; dabei
nimmt die Strömungsgeschwindigkeit um 20% ab.
Pro Minute setzt sich 1% der giftigen Substanz am Boden des Flusses ab.
Die giftige Substanz wird 5 Minuten lang eingeleitet. Der anfängliche Anteil der
Substanz im Flußwasser betrage 10%.
Wir modellieren den Fluß durch ein Intervall [0, L] mit L = 10. Der Anteil der Substanz
im Flußwasser pro Längen- und Zeiteinheit sei durch eine Funktion u(x, t) beschrieben; die
Strömungsgeschwindigkeit sei v(x, t) (Abbildung 4.1). Zur Zeit t = 0 werde an der Stelle
x = 0 die giftige Substanz eingeleitet. Wir benötigen eine Gleichung für die Evolution
des Anteils u(x, t). Nehmen wir zunächst an, daß sich die Substanz nicht am Boden
absetzt. Dann sollte die zeitliche Änderung des Anteils der Substanz in einem beliebigen
93
v(x,t)
x
0
a
b
L
Abbildung 4.1: Modellierung eines Flusses.
Intervall [a, b] gleich dem Zu- bzw. Abfluß über den Rand x = a bzw. x = b sein, da die
Substanzmenge erhalten bleibt:
Z
Z b
d b
∂
(u, v)(x, t) dx.
u(x, t) dx = u(a, t)v(a, t) − u(b, t)v(b, t) =
dt a
a ∂x
Setzt sich die Verschmutzung am Boden ab, so ist auf der rechten Seite ein entsprechender
Senkterm zu berücksichtigen:
Z
b
f dx.
a
Wir nehmen an, daß die Funktionen glatt genug sind, damit wir Differentiation und
Integration vertauschen dürfen. Dann erhalten wir
Z b
(ut + (uv)x − f ) dx = 0.
a
Da das Intervall (a, b) beliebig gewählt werden kann, ist diese Gleichung nur dann für alle
Intervalle erfüllt, wenn der Integrand verschwindet:
ut + (uv)x = f
in (0, L).
Dies ist eine partielle Differentialgleichung. Die Geschwindigkeit hängt vom Ort ab:
v(x) = v0 (1 − αx),
x ∈ [0, L],
wobei v0 = 60m/ min und α = 2 · 10−5 m−1 , denn an der Stelle x = L soll die Strömung
nach Vorausetzung nurmehr mit Geschwindigkeit 0.8v0 = 48m/ min strömen. Die zweite
Voraussetzung impliziert
f = −βu
mit β = 0.01/ min .
Das Problem
ut + [v0 (1 − αx)u]x = −βu,
u(x, 0) = u0 (x),
94
(x, t) ∈ (0, L) × (0, ∞),
(4.1)
(4.2)
ist jedoch noch nicht wohlgestellt, da noch festgelegt werden muß, wieviel Substanz an
x = 0 eingeleitet wird. Die Bedingung
u(0, t) = u1 (t),
t > 0,
nennt man daher auch Einströmbedingung. Eine Randbedingung an x = L wird nicht
benötigt, da an dieser Stelle die Werte der Funktion u(L, t) gerade gesucht sind. Um die
folgenden Rechnungen zu vereinfachen, modellieren wir die Einleitung der Substanz in
den Fluß dadurch, daß wir die Funktion auf R fortsetzen:
(
γ : x ∈ [−a, 0]
(4.3)
u0 (x) =
0 : sonst.
Nach der dritten Vorausetzung gilt γ = 0.1(min ·m)−1 und a = 5 min ·v0 = 300m.
Wie lautet die Lösung von (4.1)–(4.3) für x ∈ R? Es gelte zunächst α = β = 0. Dann
ist die Lösung einfach
u(x, t) = u0 (x − v0 t).
Die Substanz wird ähnlich wie eine Welle mit der Geschwindigkeit v0 transportiert. Nach
der Zeit t∗ = L/v0 kommt die Welle an der Mündung an, denn
u(L, t∗ ) > 0
⇐⇒
−a ≤ L − v0 t∗ ≤ 0
⇐⇒
L
L+a
≤ t∗ ≤
.
v0
v0
In der Zeit t = a/v0 wird die gesamte Substanz zur Stelle x = L transportiert. Streng
genommen ist die obige Funktion u(x, t) keine Lösung von (4.1)–(4.3), da u0 nicht differenzierbar ist. Allerdings läßt sich ein schwächerer Lösungsbegriff definieren, so daß u(x, t)
eine Lösung im Sinne dieser Definition ist (siehe nächsten Abschnitt), oder die Funktion
u0 wird geeignet “geglättet”, so daß u(x, t) eine stetig differenzierbare Lösung ist.
Im Falle α, β 6= 0 kann die Lösung von (4.1)–(4.3) nicht erraten werden. Wir lösen
das Problem mit der Methode der Charakteristiken. Die Idee ist, die Funktion u(x, t) an
jeder Stelle (x0 , t0 ) durch eine Kurve u(x(s), t(s)) zu parametrisieren (Abbildung 4.2). Der
Startpunkt sei gerade (x0 , t0 , u0 ), d.h.
x(0) = x0 ,
t(0) = t0 ,
u(x0 , t0 ) = u0 .
(4.4)
Wir erhalten Differentialgleichungen für x(s), t(s) und s 7→ u(x(s), t(s)), indem wir die
Beziehung
d
dt
dx
u(x(s), t(s)) = ut + ux
ds
ds
ds
mit der Gleichung (4.1) oder
ut + v0 (1 − αx)ux = (v0 α − β)u
95
u(x,t)
u
(x ,t )
0 0
u(x(s),t(s))
x
t
Abbildung 4.2: Parametrisierung von u(x, t) durch Kurven (x(s), t(s)) durch den Punkt
(x0 , t0 ).
vergleichen:
dt
dx
du
= 1,
= v0 (1 − αx),
= (v0 α − β)u.
(4.5)
ds
ds
ds
Die Anfangswertprobleme (4.1)–(4.2) können wir explizit lösen. Wegen dt = ds genügt es
zu lösen:
dx
= v0 (1 − αx),
x(0) = x0 ,
dt
du
= (v0 α − β)u,
u(0) = u0 .
dt
Wir erhalten nach kurzer Rechnung
x(t) =
¢
1¡
1 − (1 − αx0 )e−αv0 t ,
α
u(t) = u0 e(v0 α−β)t .
Wir können daraus die Lösung u(x, t) berechnen, indem wir in u0 = u(x0 , t0 ) die Umkehrfunktion x0 = x0 (x, t), nämlich
x0 =
einsetzen:
u(x, t) = u0
·
¢
1¡
1 − (1 − αx)eαv0 t
α
¸
¢ −(αv0 −β)t
1¡
αv0 t
e
,
1 − (1 − αx)e
α
(x, t) ∈ (0, L) × (0, ∞).
Die Substanz erreicht die Mündung, wenn u(L, t) > 0 oder
−a ≤
1¡
∗¢
1 − (1 − αL)eαv0 t ≤ 0
α
⇐⇒
1
1
1
1 + αa
ln
≤ t∗ ≤
ln
.
αv0 1 − αL
αv0 1 − αL
{z
}
{z
}
|
|
=:t1
96
=:t2
Wir erhalten
186 min ≤ t∗ ≤ 191 min .
Die giftige Substanz erreicht also erst nach ca. 186 Minuten die Mündung. Nach 5 Minuten
ist wie erwartet die Welle vorbei.
Übungsaufgabe: Nach wieviel Minuten erreicht die Verunreinigung die Mündung, wenn
√
sich der Fluß so verschmälert, daß die Strömungsgeschwindigkeit gemäß v(x) = v0 1 + αx
berechnet werden kann?
Wieviel Substanz kommt an der Mündung an, und wieviel setzt sich zwischendrin am
Flußboden ab? An der Stelle x = 0 wird
Z 5 min
γ dt = 0.5/m
0
eingeleitet. An der Stelle x = L erhalten wir
·
¸t2
Z t2
γ
(αv0 −β)t
u(L, t) dt =
e
αv0 − β
t1
t1
·
µ
¶
µ
¶¸
1
αv0 − β
αv0 − β 1 + αa
γ
ln
ln
exp
− exp
=
αv0 − β
αv0
1 − αL
αv0
1 − αL
=
£
¤
γ
(1 − αL)β/αv0 −1 1 − (1 + αL)1−β/αv0
αv0 − β
≈ 0.095m−1 .
Über 80% der Verschmutzung setzt sich am Boden ab. Es ist also ratsam, die Filteranlage so schnell wie möglich in möglichst kleinem Abstand zur Verunreinigungsstelle zu
installieren.
4.2
Verkehrsflüsse
An einer stark befahrenen Hauptstraße soll eine Ampel installiert werden. Dabei stellt
sich die folgende Frage:
Frage: Wie lang sollten die Ampelphasen sein, damit sich während der Grünphase der
Stau vor der Ampel vollständig abbaut?
Wir ignorieren Überholvorgänge und modellieren die einspurige Straße durch die reelle
Zahlenachse. Ferner modellieren wir die Autos nicht individuell als einzelne Fahrzeuge,
97
sondern führen eine Fahrzeugdichte %(x, t) am Ort x ∈ R zur Zeit t ≥ 0 (in Fahrzeugen
pro Längeneinheit) ein. Die Anzahl der Fahrzeuge im Intervall (a, b) zur Zeit t lautet
Z b
%(x, t) dx.
a
Sei v(x, t) die Geschwindigkeit der Autos in (x, t). Die Anzahl der Autos, die den Punkt
x zur Zeit t passieren, lautet %(x, t)v(x, t). Wir suchen eine Bewegungsgleichung für die
Dichte %. Die Anzahl der Autos in (a, b) ändert sich zeitlich gemäß der Fahrzeugzahl, die
in das Intervall (a, b) hinein- oder herausfahren:
Z b
Z
∂%
d b
%(x, t) dx = %(a, t)v(a, t) − %(b, t)v(b, t) =
(x, t) dx.
dt a
a ∂x
Wie im letzten Abschnitt folgt daraus die Erhaltungsgleichung
x ∈ R,
%t + (%v)x = 0,
t > 0,
(4.6)
mit der Anfangsbedingung
%(x, 0) = %0 (x),
Wegen
d
dt
Z
R
%(x, t) dx = −
Z
R
x ∈ R.
∂
(x, t) dx = 0
∂x
für alle t > 0
bleibt die Anzahl der Fahrzeuge erhalten; daher der Begriff “Erhaltungsgleichung”.
Wir benötigen eine Gleichung für die Geschwindigkeit v. Wir nehmen an, daß sie nur
von der Fahrzeugdichte abhängt und den folgenden Bedingungen genügt:
v ist eine monton fallende Funktion von % (bei dichterem Verkehr fahren die Autofahrer langsamer);
auf einer leeren Straße fahren die Autos mit der maximal zulässigen Geschwindigkeit:
v(0) = vmax ;
unter einem gewissen Mindestabstand steht die Autokolonne: v(%max ) = 0.
Das einfachste Modell, das alle diese Bedingungen erfüllt, ist eine lineare Beziehung zwischen % und v:
¶
µ
%
,
0 ≤ % ≤ %max .
v(%) = vmax 1 −
%max
Damit wird (4.6) zu
·
µ
%t + vmax % 1 −
%
%max
¶¸
= 0,
x
98
x ∈ R,
t > 0.
(4.7)
Diese Gleichung kann durch Skalierung vereinfacht werden. Seien L und τ typische
Längen- und Zeiteinheiten, so daß L/τ = vmax . Führen wir die dimensionslosen Größen
xs =
x
,
L
ts =
t
,
τ
u=1−
2%
%max
ein, erhalten wir
∂%
1
=
∂t
τ
·
µ
¶¸
%
∂
1
vmax % 1 −
=
∂x
%max
L
i
∂ h %max
%max ∂u
(1 − u) = −
,
∂ts
2
2τ ∂ts
¸
·
µ ¶
∂
1
%max ∂x u2
%max
(1 − u) (1 + u) = −
,
vmax
∂xs
2
2
2τ ∂xs 2
und damit können wir (4.7) (mit (x, t) anstatt (xs , ts )) schreiben als
µ 2¶
u
ut +
= 0,
x ∈ R, t > 0,
2
u(x, 0) = u0 (x),
x ∈ R,
(4.8)
(4.9)
wobei u0 = 1 − 2%0 /%max . Die Gleichung (4.8) heißt inviskose Burgers-Gleichung. Ist die
Straße leer (% = 0), folgt u = 1; in einem Stau (% = %max ) gilt u = −1.
Wie sehen die Lösungen von (4.8)–(4.9) aus? Wir betrachten den speziellen Anfangswert


:
x<0
 1
u0 (x) =
(4.10)
1−x : 0≤x<1


0
:
x ≥ 1.
Dies bedeutet, daß anfangs keine Autos in x < 0 vorhanden sind und in x ≥ 1 ein
moderater Verkehr herrscht. Eine einfache Rechnung zeigt, daß


x<t
 1 :
1−x
u(x, t) =
(4.11)
: t≤x<1
1−t


0 :
x ≥ 1.
eine Lösung von (4.8)–(4.9) für x ∈ R, t < 1 ist, die (4.8) punktweise außer an x = t und
x = 1 erfüllt (Abbildung 4.3). Die Lösung wird unstetig an t = 1. Die Fahrzeuge, die sich
anfangs im Intervall (0, 1) befinden, fahren von links nach rechts, bis keine Autos mehr
übrig bleiben. Wegen u = 1 in x < t kommen auch keine Fahrzeuge nach. Existiert eine
Lösung auch für t ≥ 1? Wie sieht diese Lösung aus?
Wir wenden die Methode der Charakteristiken aus dem vorigen Abschnitt an. Es folgt
dt
= 1,
ds
dx
= u,
ds
du
=0
ds
mit x(0) = x0 , u(0) = u0 . Aus der ersten Gleichung erhalten wir ds = dt. Daher ist
u(t) = u0 ,
x(t) = u0 t + x0 ,
99
t ≥ 0.
u
t=0
t= 1/2
t=1
1
x
1
1/2
Abbildung 4.3: Lösung von (4.8)–(4.10).
Dies bedeutet ausgeschrieben, daß
u(x(t), t) = u0 = const.
für alle t ≥ 0.
Da x(t) Geraden sind (dies sind gerade die Charakteristiken), folgt, daß u(x, t) konstant
entlang Geraden ist. Die Lösung (4.11) können wir dann wie in Abbildung 4.4 illustrieren.
Die Geraden stellen keine Fahrzeugtrajektorien dar, sondern eher die “Ausbreitung” der
Dichtewerte. Da sich die Geraden bei t = 1/2 in einem Punkt treffen, ist die Lösung in
t
1/2
x
0
1
Abbildung 4.4: Die Lösung u(x, t), definiert durch (4.11), ist konstant entlang der Geraden.
diesem Punkt unstetig.
Um den Lösungsbegriff zu erweitern, multiplizieren wir (4.8) mit einer Funktion φ ∈
1
C (R2 ) und integrieren über R × (0, ∞):
Z ∞Z µ
³ u2 ´ ¶
φ dxdt
0 =
ut +
2 x
0
R
¶
Z
Z ∞Z µ
u2
(4.12)
= −
uφt + φx dxdt − u(x, 0)φ(x, 0) dx.
2
R
0
R
Um die beiden letzten Integrale zu definieren, benötigen wir nur integrierbare Lösungen
u. Funktionen u, die (4.12) für alle φ ∈ C 1 (R2 ) mit kompakten Träger erfüllen, nennen
wir schwache Lösungen von (4.8)–(4.9).
100
Wir betrachten nun unstetige Anfangsdaten
(
u` : x < 0
u0 (x) =
ur : x ≥ 0.
(4.13)
Das Problem (4.8), (4.13) heißt Riemann-Problem. Wir unterscheiden die folgenden Fälle:
Fall 1: u` > ur . Die Fahrzeugdichte in x > 0 ist größer als in x < 0. Wir erwarten,
daß sich eine Staulinie ausbildet bzw. eine Unstetigkeitskurve x = ψ(t). Dann ist
(
u` : x < st
u(x, t) =
(4.14)
ur : x ≥ st
eine schwache Lösung von (4.8), (4.13). Die Unstetigkeitskurve ist durch x = ψ(t) = st
gegeben, und die Schockgeschwindigkeit s = ψ 0 (t) muß bestimmt werden. Wir beweisen,
daß u(x, t) tatsächlich eine schwache Lösung ist und berechnen dabei die Schockgeschwindigkeit. Sei φ ∈ C 1 (R2 ) mit kompaktem Träger. Wegen u = const. außer an x = st folgt
einerseits
¶
Z ∞Z
Z ∞ µZ st
Z ∞
uφt dxdt =
uφt dx +
uφt dx dt
R
0
0
=
Z
−∞
∞
³∂
∂t
0
∂
+
∂t
= −
andererseits
Z
0
∞
Z
R
Z
R
Z
st
st
−∞
Z
uφ dx − s · u(st−, t)φ(st, t)
∞
st
´
uφ dx + s · u(st+, t)φ(st, t) dt
u(x, 0)φ(x, 0) dx − s · (u` − ur )
Z
∞
φ(st, t) dt,
0
¶
u2
u2
−
φ dx + (st−, t)φ(st, t)
2 x
2
0
−∞
Z ∞ µ 2¶
´
u
u2
−
φ dx − (st+, t)φ(st, t)
2 x
2
st
µ 2
¶
Z ∞
u2r
u`
=
−
φ(st, t) dt.
2
2
0
u2
φx dxdt =
2
Z
∞
³
Z
st
µ
Wählen wir also
s · (u` − ur ) =
u2
u2`
− r
2
2
oder
1
s = (u` + ur )
2
(4.15)
so löst u die Integralbeziehung (4.12) und ist damit eine schwache Lösung. Die Bedingung
(4.15) heißt Rankine-Hugoniot-Bedingung.
101
Betrachte als Beispiel die Situation, in der in x < 0 anfangs die Fahrzeugdichte moderat und in x > 0 maximal ist: u` = 0, ur = −1. Dann ist die Schockgeschwindigkeit
s = −1/2. Die Staulinie bewegt sich also nach links, d.h., der Stau vergrößert sich (Abbildung 4.5).
t
x
u =0
l
u = −1
r
Abbildung 4.5: Charakteristiken für u` = 0 und ur = −1.
Fall 2: u` < ur . Die Funktion (4.14) ist auch hier eine Lösung, da der obige Beweis
kein Vorzeichen von u` − ur benötigt hat. Allerdings ist auch


x < u` t
 u` :
u2 (x, t) =
x/t : u` t ≤ x ≤ ur t


ur :
x > ur t
eine schwache Lösung (Abbildung 4.6).
Übungsaufgabe: Beweisen Sie dies.
Man kann sogar zeigen, daß es unendlich viele Lösungen gibt. Was ist passiert? Unser
Lösungsbegriff ist so schwach, daß die Eindeutigkeit von Lösungen verloren gegangen ist.
Wir benötigen eine zusätzliche (physikalische) Bedingung, die die Eindeutigkeit wieder
sicherstellt. Es zeigt sich, daß der Begriff Entropie das Gewünschte liefert. Wir sagen,
daß eine schwache Lösung die Entropiebedingung von Oleinik erfüllt, wenn entlang jeder
Unstetigkeitskurve x = ψ(t)
u2` /2 − v 2 /2
u2 /2 − v 2 /2
≥ ψ 0 (t) ≥ r
u` − v
ur − v
(4.16)
für alle v zwischen u` und ur gilt. Im Falle der Lösung (4.14) folgt aus ψ 0 (t) = s und
(4.16)
1
1
(u` + v) ≥ s ≥ (ur + v)
2
2
die Bedingung u` ≥ ur – Widerspruch. Da die Funktion u2 stetig ist, ist die Ungleichung
(4.16) gegenstandslos.
102
Intuitiv ist u2 die physikalisch relevante Lösung. Die Voraussetzung u` < ur bedeutet,
daß es in x < 0 mehr Autos als in x > 0 gibt. Die Autofahrer in der Nähe von x = 0
werden beschleunigen, und nach einiger Zeit wird es Autofahrer mit Geschwindigkeiten
zwischen v(u` ) und v(ur ) geben. Man nennt u2 übrigens auch eine Verdünnungwelle.
t
x
u
ur
l
Abbildung 4.6: Charakteristiken der Lösung u2 .
Wir sind nun in der Lage, die eingangs gestellte Frage zu beantworten. Wir betrachten
eine eindimensionale Straße, die zur Zeit t = 0 im Intervall (−∞, 0) mit Fahrzeugen der
Dichte % > 0 gefüllt ist. An x = 0 sei eine rote Ampel, und hinter der Ampel in (0, ∞) sei
die Straße leer. Die Ampelphase habe die Dauer ω > 0. Wir arbeiten mit der skalierten
Gleichung (4.8). Dann ist u = 1 − 2%/%max . Bis zur Zeit t = ω wird sich ein Stau vor der
Ampel bilden, der sich während der Grünphase t > ω abbauen wird.
Schritt 1: Rotphase (0 ≤ t < ω). Wir lösen (4.8) in x < 0 mit der Anfangsfunktion
u0 (x) = u, x < 0, und der Randbedingung u(0, t) = −1, die die rote Ampel modelliert.
Die Lösung lautet nach dem obigen Fall 1:
(
u : x < st
x < 0, 0 < t < ω,
u(x, t) =
−1 : x ≥ st,
und die Schockgeschwindigkeit ist gegeben durch
u−1
1
s = (u` + ur ) =
.
2
2
Die Lösung in x > 0 ist nach Voraussetzung gegeben durch u(x, t) = 1 (Abbildung 4.7).
Schritt 2: Grünphase (t > ω). Wir lösen die Burgers-Gleichung (4.8) in R mit Anfangswert u0 (x) = u(x, ω). Wegen u` = u > −1 = ur entwickelt sich ein Schock ψ(t) = st,
t > ω, mit Geschwindigkeit s = (u − 1)/2 < 0. Außerdem entsteht eine Verdünnungswelle
an x = 0, da u` = −1 < 1 = ur . Die Lösung ist gegeben durch

u :
x < st



 −1 :
st ≤ x < ω − t
x ∈ R, t > ω.
u(x, t) =
x

:
ω
−
t
≤
x
<
t
−
ω


 t−ω
1 :
x ≥ t − ω,
103
t
t
1
Grün−
phase
u=1
ω
Rot−
phase
u=u
u = −1
u=1
x
sω
st 1
u=u
u = −1
u=1
Abbildung 4.7: Charakteristiken für das Ampelproblem.
Diese Lösung macht Sinn, solange st < ω − t oder t < t1 := ω/(s + 1) = 2ω/(u + 1).
Schritt 3: Grünphase (t > t1 ). Was geschieht mit dem Schock für t > t1 ? Dazu
benötigen wir die sogenannte verallgemeinerte Rankine-Hugoniot-Bedingung
´
´ 1 ³ ψ(t)
1³
s(t) = ψ (t) =
+u ,
u(ψ(t)+, t) + u(ψ(t)−, t) =
2
2 t−ω
0
für t > t1 . Dies ist eine lineare Differentialgleichung für ψ(t) mit Anfangswert
ψ(t1 ) = st1 = ω
u−1
.
u+1
Die Lösung lautet
ψ(t) = u(t − ω) −
√
t−ω
q
ω(1 − u2 ),
t ≥ t1 .
Es gibt nun zwei Fälle. Wenn u ≤ 0 (oder % ≥ %max /2), gilt ψ(t) → −∞ für t →
∞, und es gibt einen Schock für alle Zeiten, der sich in der negativen x-Richtung mit
Geschwindigkeit ψ 0 (t) → u (t → ∞) fortpflanzt. Die Unstetigkeitsstufe wird natürlich
immer kleiner für größere Zeiten, aber die Autofahrer bemerken den Schock weit von der
Ampel entfernt.
Im Fall u > 0 (oder % < %max /2) bewegt sich der Schock in die positive x-Richtung.
Wir nehmen an, daß die Ampel zur Zeit t = 2ω wieder von Grün auf Rot schaltet. Wie
lang muß die Grünphase sein, um den Schock zu eliminieren? Dazu ist die Bedingung
t2 ≤ 2ω notwendig, wobei t2 eine Nullstelle von ψ ist. Die Gleichung ψ(t2 ) = 0 hat die
√
eindeutige Lösung t2 = ω/u2 . Also ist t2 ≤ 2ω genau dann erfüllt, wenn u ≥ 1/ 2 oder
104
in Originalvariablen
%max ³
1 ´
1 − √ ≈ 0.146%max .
2
2
Der Schock vor der Ampel wird vollständig während der Grünphase aufgelöst, wenn diese
Bedingung an % erfüllt ist. Erstaunlich an diesem Ergebnis ist, daß die maximale Verkehrsdichte %, die die Ampel verkraftet, von der Dauer der Ampelphasen unabhängig
ist.
Wir fassen zusammen:
%≤
% ≥ %max /2: Schon eine Rotphase genügt, um den Verkehr auf Dauer zu stören.
√
(1 − 1/ 2)%max /2 < % < %max /2: Die Effekte der Rotphasen akkumulieren sich mit
der Zeit, würden jedoch bei Entfernung der Ampel wieder verschwinden.
√
% ≤ (1 − 1/ 2)%max /2. Die Schockfront kehrt vor Beendigung der Grünphase wieder
zur Ampel zurück, und der Einfluß der Rotphase ist damit verschwunden.
Übungsaufgabe: Diskutieren Sie ³das Ampelproblem, ´wenn die Geschwindigkeit durch
das Greenberg-Modell v(%) = vmax ln (1 + %max )/(1 + %) , 0 ≤ % ≤ %max , gegeben ist.
4.3
Strömungsmechanik
In diesem Abschnitt gehen wir der Frage nach, welchen Bewegungsgleichungen eine Flüssigkeit oder ein Gas genügt. Diese Gleichungen analysieren wir weiter in den folgenden Abschnitten.
Betrachte ein Teilchen der Masse m, auf das die äußere Kraft F wirkt. Beschreibt x(t)
den Ort und v(t) die Geschwindigkeit des Teilchens zur Zeit t, so ist die Evolution durch
die Newtonschen Gleichungen
x0 = v,
mv 0 = F,
t > 0,
(4.17)
gegeben. Wir können die Bewegung auch mit Hilfe einer Wahrscheinlichkeitsverteilung
f (x, v, t) beschreiben, wobei
Z Z
f (x, v, t) dxdv
Ωx
Ωv
die Wahrscheinlichkeit angibt, das Teilchen zur Zeit t im Gebiet Ωx mit der Geschwindigkeit aus Ωv anzutreffen. Insbesondere gilt
Z Z
f (x, v, t) dxdv = 1.
R3
R3
105
Sei w(t; x, v) := (x(t), v(t)) die Lösung von (4.17) zu den Anfangswerten x(0) = x,
v(0) = v. Die Funktion w beschreibt die Bahn oder Trajektorie des Teilchens. Dann
ist f (w(t; x, v), t) konstant entlang der Trajektorien und
0=
d
f (w(t; x, v), t) = ft + ∇x f · x0 + ∇v f · v 0 ,
dt
also mit (4.17)
ft + v · ∇ x f +
F
· ∇v f = 0.
m
(4.18)
Wir nennen dies die Lionville-Gleichung.
Betrachte nun eine sehr große Zahl N À 1 von Teilchen mit derselben Masse m
(z.B. einer Flüssigkeit). Ist (xi (t), vi (t)) der Vektor aus Ort und Geschwindigkeit des i-ten
Teilchens, so kann das Teilchenensemble wie oben durch die Newtonschen Gleichungen
x0i = vi ,
mvi0 = Fi ,
i = 1, . . . , N,
beschrieben werden. Die Lösung dieser Gleichungen kann sehr aufwendig sein. Es ist
daher bequemer, die Evolution des Ensembles mit Hilfe der Verteilung f (x, v, t) zu berechnen. Streng genommen müßten x und v Vektoren aus R3N sein. Wir postulieren, daß
die Verteilung f (x, v, t) den Anteil der N Teilchen an der Stelle (x, v, t) beschreibt und
der Lionville-Gleichung
F
· ∇v f = 0,
x, v ∈ R3 ,
t > 0,
(4.19)
m
genügt. Die Kraft F ist dann die auf das Teilchenensemble wirkende effektive Kraft, die
sich aus allen Einzelkräften Fi zusammensetzt. Die Gleichung (4.19) wird vervollständigt
durch die Anfangsverteilung
ft + v · ∇ x f +
f (x, v, 0) = f0 (x, v),
x, v ∈ R3 .
Die obige Gleichung ermöglicht durch den Einbezug der äußeren Kraft F die Modellierung von Fernkräften (Gravitation, elektrische Kräfte etc.). Nahkräfte wie Teilchenkollisionen werden jedoch nicht modelliert. Um auch diese beschreiben zu können, nehmen
wir an, daß die zeitliche Änderung der Verteilung f entlang der Trajektorien gleich ist der
Änderungsrate von f aufgrund von Teilchenkollisionen:
df
= Q(f )
entlang der Trajektorien,
dt
wobei Q(f ) die Kollisionsrate ist. Ausgeschrieben bedeutet dies
F
· ∇v f = Q(f ),
x, v ∈ R3 , t > 0.
(4.20)
M
Diese Gleichung wird Boltzmann-Gleichung genannt. Um einen Ausdruck für Q(f ) herzuleiten, nehmen wir an, daß der Anteil P (x, v 0 → v, t) der Teilchen an (x, t), deren
Geschwindigkeit v 0 nach v infolge der Kollision geändert wird, proportional ist zu
ft + v · ∇ x f +
106
der Wahrscheinlichkeit f (x, v 0 , t) und
der Wahrscheinlichkeit 1 − f (x, v, t), daß der Zustand (x, v) frei ist.
Dann ist
P (x, v 0 → v, t) = s(x, v 0 , v)f (x, v 0 , t)(1 − f (x, v, t)),
wobei die Proportionalitätskonstante s(x, v 0 , v) Stoßrate genannt wird. Die Änderungsrate
von f infolge von Kollisionen ist gegeben durch
P (x, v 0 → v, t) − P (x, v → v 0 , t)
für alle Geschwindigkeiten v 0 im Element dv 0 . Das Resultat ist das Integral
Z
[P (x, v 0 → v, t) − P (x, v → v 0 , t)] dv 0
(Q(f ))(x, v, t) =
=
Z
R3
R3
[s(x, v 0 , v)f 0 (1 − f ) − s(x, v, v 0 )f (1 − f 0 )] dv 0 ,
(4.21)
wobei f = f (x, v, t) und f 0 = f (x, v 0 , t).
Die Analyse des Kollisionsoperators (4.21) ist im allgemeinen sehr aufwendig. Für
allgemeine Stoßraten gilt
Z
Z
Z
0
0
0
s(x, v, v 0 )f (1 − f 0 ) dv 0 dv
s(x, v , v)f (1 − f )dv dv −
Q(f ) dv =
R3
=
Z
R3
R3
s(x, v 0 , v)f 0 (1 − f )dv 0 dv −
Z
R3
R3
s(x, v 0 , v)f 0 (1 − f ) dvdv 0
= 0.
Nach (4.20) bedeut dies, daß die Teilchenzahl wegen
Z Z
Z Z
∂
divx (vf ) dxdv
f (x, v, t) dxdv = −
∂t R3 R3
R3 R3
Z Z
³F ´
−
divv
f dvdx
m
R3 R3
Z Z
+
Q(f ) dvdx
R3
R3
= 0
zeitlich konstant ist. Wir haben hier vorausgesetzt, daß die Kraft F nicht von v abhängt.
Die Boltzmann-Gleichung ist also auch eine Erhaltungsgleichung.
Die Lösung der Boltzmann-Gleichung ist sehr aufwendig, da die Funktion f von sieben
Variablen abhängt. Unser Ziel ist es daher, einfachere Gleichungen herzuleiten. Dazu
verwenden wir eine Variante der Momentenmethode.
107
Zuerst skalieren wir die Boltzmann-Gleichung. Wir definieren mit der typischen Länge
L, der typischen Zeit T und der typischen Geschwindigkeit V = L/T , die sich daraus
ergibt, daß ein Teilchen einen Weg der Länge L in der Zeit T durchquert, die dimensionslosen Größen
x
v
t
xs = ,
vs = ,
ts = .
L
V
T
Die Länge L kann etwa der Durchmesser des Gebietes sein, in dem sich die Flüssigkeit
aufhält. Nun gibt es eine zweite typische Länge, nämlich die mittlere freie Weglänge λ, die
die Länge bezeichnet, die ein Teilchen durchschnittlich zwischen zwei Kollisionen durchquert. Wir setzen voraus, daß
λ
ε= ¿1
L
gilt. Der Parameter ε wird auch Knudsen-Zahl genannt. Es macht Sinn, den Kollisionsoperator gemäß
Qs (f ) = τ Q(f )
zu skalieren, wobei τ = λ/V die Zeit ist, die ein Teilchen benötigt, um einen Weg der
Länge λ mit der Geschwindigkeit V zu durchqueren, denn Q(f ) hat die Einheit 1/sec.
Skalieren wir außerdem die Kräft gemäß
Fs =
T F
,
V m
so erhalten wir die skalierte Boltzmann-Gleichung (wir lassen den Index “s” im folgenden
fort)
1
(4.22)
ft + v · ∇x f + F · ∇v f = Q(f ).
ε
Unser Ziel ist es, den Grenzwert ε → 0 zu studieren. Der Kollisionsoperator erfülle die
folgenden Voraussetzungen:
Es gelte für alle Lösungen f von (4.22)
Z
Z
Z
Q(f ) dv =
Q(f )vi dv =
R3
R3
Q(f )|v|2 dv = 0,
i = 1, . . . , d.
R3
Es gelte Q(f ) = 0 genau dann, wenn es Zahlen αi (x, t) ∈ R, i = 0, . . . , 4, gibt, so
daß
ln f = α0 + α1 v1 + α2 v2 + α3 v3 + α4 |v|2 .
Diese Voraussetzungen können wir wie folgt interpretieren. Die erste Bedingung drückt in
Abwesenheit äußerer Kräfte die Erhaltung von Masse, Impuls und Energie aus. Definiere
108
nämlich die Teilchendichte nf (x, t), mittlere Geschwindigkeit uf (x, t) und Energiedichte
ef (x, t) bezüglich f durch
nf (x, t) = hf (x, v, t)i,
uf (x, t) = hvf (x, v, t)i,
1
ef (x, t) = h |v|2 f (x, v, t)i,
2
R
wobei hgi := R3 g dv. Man nennt diese Integrale auch das nullte, erste und zweite Moment.
Aus der ersten Bedingung folgt, sofern F = 0,
Z Z
Z Z
Z
∂
Q(f ) dvdx = 0,
divx (vf ) dvdx −
nf dx = −
∂t R3
R3 R3
R3 R3
Z
Z Z
Z Z
∂
uf dx = −
divx (v ⊗ vf ) dvdx −
vQ(f ) dvdx = 0,
∂t R3
R3 R3
R3 R3
Z Z
Z
Z Z
³1
´
1 2
∂
2
divx |v| vf dvdx −
ef dx = −
|v| Q(f ) dvdx = 0,
∂t R3
2
R3 R3
R3 R3 2
wobei v ⊗ v die (3 × 3)-Matrix mit Elementen vi vj , i, j = 1, 2, 3, bezeichne.
Die zweite Voraussetzung bedeutet, daß es (im Mittel) genau dann keine Kollisionen
gibt, wenn f sich als
³
f (x, v, t) = exp α0 (x, t) + α(x, t) · v + α4 (x, t)|v|2 ),
α = (α1 , α2 , α3 )> ,
darstellen läßt. Dies ist äquivalent zur Existenz von Konstanten n(x, t), u(x, t) und θ(x, t),
so daß
µ
¶
|v − u(x, t)|2
n(x, t)
exp −
f (x, v, t) = M (x, v, t) :=
(2πθ(x, t))3/2
2θ(x, t)
gilt. Die Funktion M wird Maxwell-Verteilung genannt. Welche Bedeutung haben die
Funktionen n, u und θ? Eine Rechnung zeigt
hM (x, v, t)i = n(x, t),
hvM (x, v, t)i = n(x, t)u(x, t),
µ
¶
1
1 2
3
2
h |v| M (x, v, t)i = n(x, t)
|u(x, t)| + θ(x, t) .
2
2
2
Übungsaufgabe: Zeigen Sie die drei obigen Identitäten.
Folglich können wir n = nM als Teilchendichte und u = uM als mittlere Geschwindigkeit
(bezüglich M ) interpretieren. Das dritte Integral ist die Gesamtenergie, bestehend aus
der kinetischen Energie 21 n|u|2 und der inneren Energie 23 nθ. Daher können wir θ als
Temperatur interpretieren.
Sei fε eine Lösung der skalierten Boltzmann-Gleichung (4.22). Wir treffen die folgenden
Annahmen:
109
Die Kraft F hänge nicht von v ab.
Die Funktion fε und ihre Ableitungen seien gleichmäßig beschränkt in ε > 0 und
fε → f punktweise (fast überall) für ε → 0.
Es gilt für ε → 0
g(v) ∈ {1, vi , vi vj , |v|2 vi : 1 ≤ i, j, ≤ 3}.
hg(v)fε i → hg(v)f i,
Die Funktion Q(fε ) konvergiere gegen Q(f ) für ε → 0.
Multipliziere nun die Boltzmann-Gleichung (4.22) mit 1, v und
v ∈ R3 und integriere partiell
1
|v|2 ,
2
integriere über
∂t hfε i + divx hvfε i = 0,
∂t
¿
∂t hvfε i + divx hv ⊗ vfε i − F hfε i = hvQ(fε )i,
À
À
À
¿
¿
1 2
1
1 2
2
|v| fε + divx
v|v| fε − F hvfε i =
|v| Q(fε ) ,
2
2
2
(4.23)
(4.24)
(4.25)
denn
hvF fε i =
¿
1 2
|v| F fε
2
À
Z
R3
= −
Z
v divv (F fε ) dv = −
R3
∇v
³1
2
Z
R3
F fε dv = −F hfε i,
´
|v|2 F fε dv = −F hvfε i
Aus (4.22) folgt im Grenzwert ε → 0 die Gleichung Q(f ) = 0. Nach der obigen Voraussetzung an Q impliziert dies f = M . also konvergiert fε gegen M . Im Grenzwert ε → 0
erhalten wir aus (4.23)–(4.25)
∂t n + divx (nu) = 0,
∂t (nu) + divx hv ⊗ vM i − F n = 0,
µ µ
¶¶
1 2 3
1
∂t n
|u| + θ
+ divx h v|v|2 M i − F · (nu) = 0.
2
2
2
Es bleiben die zweiten und dritten Momente hv ⊗ vM i und h 12 v|v|2 M i zu berechnen:
¿
hv ⊗ vM i = n(u ⊗ u) + nθ Id,
À
³1
1
5 ´
2
v|v| M
= nu |u|2 + θ ,
2
2
2
wobei Id die Einheitsmatrix des R3×3 bezeichne.
110
Übungsaufgabe: Zeigen Sie die beiden obigen Identitäten.
Daraus folgt
divx hv ⊗ vM i = divx (nu ⊗ u) + ∇x (nθ),
¶¶
µ µ
1
1 2 5
2
|u| + θ
.
divx h v|v| M i = divx nu
2
2
2
Mit der Energiedichte
3
1
e := |u|2 + θ
2
2
erhalten wir schließlich die Euler-Gleichungen der Gasdynamik:
∂t n + div(nu) = 0,
(4.26)
∂t (nu) + div(nu ⊗ u) + ∇(nθ) − nF = 0,
(4.27)
∂t (ne) + div(nu(e + θ)) − (nu) · F = 0.
(4.28)
Wir haben div statt divx geschrieben, da die Funktionen nur von x und t, aber nicht von
v abhängen.
Die Euler-Gleichungen sind im wesentlichen aus der reduzierten Gleichung (4.22) mit
ε = 0 und den entsprechenden Momenten gewonnen worden. Es ist möglich, die Funktion
fε bezüglich ε zu entwickeln.
fε = M + εgε + O(ε2 )
und diese Entwicklung in (4.22) einzusetzen, um Näherungen höherer Ordnung zu erhalten. Diese Methode, die man Chapman-Enskog-Entwicklung nennt, erfordert allerdings
genauere Kenntnisse über den Kollisionsoperator. Diese Technik führt auf die NavierStokes-Gleichungen
∂t n + div(nu) = 0,
∂t (nu) + div(nu ⊗ u) + ∇(nθ) − nF = εdivτ,
∂t (ne) + divx (nu(e + θ)) − (nu) · F = εdiv(q + u · τ ),
(4.29)
(4.30)
(4.31)
wobei τ einen viskosen Spannungstensor darstellt, der Scherkräfte durch Reibung modelliert, und q die Wärmeflußdichte:
τ = λ(divu)Id + µ(∇u + (∇u)> ),
q = κ∇θ.
Hierbei sind λ und µ von (x, t) abhängende, nicht-negative Viskositätskoeffizienten, κ > 0
ist die Wärmeleitfähigkeit und
(∇u + (∇u)> )ij =
111
∂ui ∂uj
+
.
∂xj
∂xi
Im folgenden setzen wir ε = 1, da wir diesen Parameter in τ und q “verstecken” können.
Für ε = 0 erhalten wir aus den Navier-Stokes-Gleichungen die Euler-Gleichungen (4.26)–
(4.28).
Sind die Viskositätskoeffizienten λ und µ konstant, können wir den Ausdruck divτ
vereinfachen. Aus
µ
¶
3
X
∂ui ∂uj
∂
τ
= (∆u + ∇(divu))i
+
div((∇ ⊗ u) + (∇ ⊗ u) )i =
∂xj ∂xj
∂xi
k=1
folgt
divτ = (λ + µ)∇(divu) + µ∆u.
Ferner ergibt sich
¶
3
3 µ
X
X
∂τij
∂
∂ui
div(u · τ ) =
(ui τij ) =
τij + ui
∂x
∂x
∂xj
j
j
i,j=1
i,j=1
= ∇u : τ + u · divτ,
wobei wir für zwei Matrizen A, B ∈ R3×3
A:B=
3
X
aij bij
i,j=1
definiert haben. Wir erhalten aus der obigen Gleichung für divτ
div(u · τ ) = ∇u : τ + (λ + µ)u · ∇(divu) + µu · ∆u.
Wegen der Terme µ∆u und div(κ∇θ) sind die Gleichungen (4.30) und (4.31) parabolische
Differentialgleichungen.
Der Ausdruck nθ ist der Druck einer Flüssigkeit. Dies gilt nur für ideale Fluide; im
allgemeinen ist der Druck p ein unabhängige Variable. Damit erhalten wir (für konstante
Viskositätskoeffizienten) die Gleichungen
∂t n + div(nu) = 0,
(4.32)
∂t (nu) + div(nu ⊗ u) + ∇p − nF = ∇((λ + µ)divu) + µ∆u,
∂t (ne) + div(u(ne + p)) − (nu) · F = div(κ∇θ)
(4.33)
(4.34)
+∇u : τ + (λ + µ)u · ∇(divu) + µu · ∆u.
In dieser Formulierung ist p eine Funktion von n und θ oder umgekehrt θ eine Funktion
von n und p.
112
4.4
Bluttransport durch Adern
Das Rauchen von Zigaretten führt durch das in den Zigaretten enthaltene Nikotin zu einer Verengung der Adern, die dann weniger Blut transportieren können. Diese Durchblutungsstörungen treten besonders in den Extremitäten auf und können zu dem berüchtigten
Raucherbein führen. In diesem Abschnitt beantworten wir die folgende Frage:
Frage: Wieviel weniger Blut kann durch eine verengte Ader transportiert werden?
Wir modellieren das Blut als eine Flüssigkeit durch ein dünnes Rohr mit Radius R (Abbildung 4.8). Die Länge L des Rohres sei viel größer als der Radius. Aus Symmetriegründen
u
R
0
L
x3 = z
Abbildung 4.8: Flüssigkeitsströmung in einem dünnen Rohr.
können wir annehmen, daß die Geschwindigkeit u nur vom Abstand r von der Rohrachse
abhängt. Außerdem vernachlässigen wir Strömungsanteile in x- und y-Richtung, so daß
wir die Geschwindigkeit schreiben können als


0


u(x1 , x2 , x3 ) =  0  .
(4.35)
u3 (r)
Es ist ferner sinnvoll anzunehmen, daß das Blut homogen ist, d.h., die Dichte n ist örtlich
konstant. Dies impliziert aus (4.32)
divu = 0.
Wir nennen Flüssigkeiten mit der Eigenschaft divu = 0 inkompressibel. Das bedeutet, daß
die Dichte entlang jeder Trajektorie x(t), wobei x(t) das Problem
x0 (t) = u(x(t), t),
t > 0,
x(0) = x0 ,
löst, konstant ist, denn dies ist äquivalent zu
0=
d
n(x(t), t) = ∂t n + u · ∇n,
dt
und ein Vergleich mit (4.32) ergibt divu = 0. Beachte, daß es inkompressible Flüssigkeiten mit n 6= const. geben kann. Unsere letzte Voraussetzung ist, daß wir stationäre
Strömungen betrachten, d.h. ∂t n = 0 und ∂t u = 0.
113
Wir wollen aus den Navier-Stokes-Gleichungen die Geschwindigkeit bestimmen. Die
obigen Voraussetzungen einer homogenen und stationären Flüssigkeit vereinfachen (4.32)–
(4.33) zu
div(u ⊗ u) + ∇p = µ∆u,
divu = 0.
Der Einfachheit halber haben wir hier n = 1 angenommen. Wegen (4.35) lautet die letzte
Gleichung ∂u3 /∂x3 = 0, also
3
³
´
X
∂
∂
(uj u3 ) =
(u23 ) = 0.
div(u ⊗ u) =
∂xj
∂x3
3
j=1
Es bleibt zu lösen:
∂p
= µ∆u3 .
(4.36)
∂x3
Nun herrscht in dem Rohr ein Druckabfall; wir nehmen an, daß der Druck linear
abfällt, d.h.
p(L) − p(0)
∂p
=
< 0.
∂x3
L
Es ist zweckmäßig, die Gleichung (4.36) in Zylinderkoordinaten zu lösen. Der LaplaceOperator in Zylinderkoordinaten
x1 = r sin φ,
lautet
1 ∂
∆=
r ∂r
x2 = r cos φ,
µ
∂
r
∂r
¶
+
x 3 = x3
1 ∂2
∂2
.
+
r2 ∂φ2 ∂x23
Übungsaufgabe: Beweisen Sie diese Beziehung.
Da u3 nur vom Radius r abhängt, erhalten wir schließlich aus (4.36)
µ
¶
1 d
d
p(L) − p(0)
r
u3 (r) =
,
0 < r < R.
r dr
dr
µL
(4.37)
Als Randbedingungen nehmen wir an, daß u3 an r = 0 endlich ist und daß die Flüssigkeit
am Rand r = R haftet:
u3 (R) = 0.
(4.38)
u3 (0) = u,
Die Gleichung (4.37) kann einfach durch Integration gelöst werden:
u3 (r) =
p(L) − p(0) 2
r + c1 ln r + c2 .
4µL
Aus (4.38) ergibt sich c1 = 0 und c2 = −p(L) − p(0))R2 /4µ und damit
u3 (r) =
p(L) − p(0) 2
(r − R2 ).
4µL
114
Wieviel Blut fließt durch das Rohr? Durch eine Ringfläche, deren Mittelpunkt auf der
Rohrachse liegt und deren Radien r und r + dr sind, fließt pro Sekunde die Blutmenge
2πru3 (r)dr. Durch den vollen Röhrenquerschnitt fließt pro Sekunde das Flüssigkeitsvolumen
Z R
Z R
π
π
r(r2 − R2 ) dr =
2πru3 (r) dr =
(p(L) − p(0))
(p(0) − p(L))R4 .
V =
2µL
8µL
0
0
Man nennt diese Beziehung das Hagen-Poiseuillesche Gesetz. Es lehrt, daß schon eine
geringfügige Verkleinerung des Rohrradius’ R eine beträchtliche Verringerung der durchströmenden Flüssigkeitsmenge zur Folge hat. Wird etwa der Radius einer Ader infolge des
Nikotins halbiert, so fließt nur noch (1/2)4 ≈ 6% der ursprünglichen Blutmenge durch die
Ader.
4.5
Strömung um einen Tragflügel
In diesem Abschnitt gehen wir der Frage nach, wie eine Flüssigkeit oder ein Gas einen
Körper, z.B. einen Flugzeugtragflügel, umströmt. Um das Problem zu vereinfachen, betrachten wir eine homogene, stationäre, zweidimensionale, nicht-viskose Strömung. Gemäß
dem letzten Abschnitt bedeutet dies, daß die Geschwindigkeit u = (u1 , u2 )> und der Druck
p den Gleichungen
divu = 0,
n0 (u · ∇)u + ∇p = 0
(4.39)
genügen, die aus (4.26)–(4.27) folgen. Die Homogenitätsvoraussetzung impliziert, daß die
Dichte n = n0 konstant ist. Unser Ziel ist es, die obigen Gleichungen weiter zu vereinfachen. Definiere dafür die sogenannte Wirbeldichte
∂u2 ∂u1
−
.
∂x1 ∂x2
rotu :=
Wir behaupten, daß die Wirbeldichte entlang der Teilchenbahnen verschwindet.
Lemma 4.1 Es gilt
rotu(x(t), t) = const.
für alle t > 0,
wobei x0 (t) = u(x(t), t), t > 0.
Beweis: Wir verwenden die Abkürzungen
∂ i uj =
∂uj
,
∂xi
115
i, j = 1, 2.
Differenzieren wir die u1 -Komponente der zweiten Gleichung von (4.39) nach x2 und die
u2 -Komponente nach x1 und subtrahieren die entstehenden Gleichungen, erhalten wir
0 = ∂2 (u1 ∂1 u1 + u2 ∂2 u1 ) − ∂1 (u1 ∂1 u2 + u2 ∂2 u2 )
= u1 ∂1 (∂2 u1 − ∂1 u2 ) + u2 ∂2 (∂2 u1 − ∂1 u2 )
+∂2 u1 (∂1 u1 + ∂2 u2 ) − ∂1 u2 (∂1 u1 + ∂2 u2 )
und wegen 0 = divu = ∂1 u1 + ∂2 u2
0 = u · ∇rotu.
Daher ist wegen ∂u/∂t = 0
d
rotu(x(t)) = x0 · ∇rotu = u · ∇rotu = 0.
dt
Das Lemma ist bewiesen.
¤
Wir suchen nun spezielle ebene, homogene, stationäre Strömungen mit
divu = 0,
rotu = 0.
(4.40)
Strömungen, die (4.40) erfüllen, nennen wir Potentialströmungen. Wegen rotu = 0 in
einem (einfach zusammenhängenden) Gebiet existiert nämlich ein Geschwindigkeitspotential φ, so daß u = ∇φ oder
∆φ = 0
gilt. Haben wir diese Gleichung gelöst (mit noch zu spezifizierenden Randbedingungen),
können wir die Geschwindigkeit gemäß u = ∇φ berechnen. Wie können wir die zweite
Variable, den Druck p, bestimmen?
Lemma 4.2 Wenn rotu = 0 in Γ, dann gilt die Bernoulli-Gleichung
n0 2
|u| + p = const.
2
Beweis: Wegen
µ
¶
1
2
∇|u| − (u · ∇)u
=
2
1
=
¶
µ
1
∇|u|2 − (u · ∇)u
=
2
2
=
in Γ.
u1 ∂1 u1 + u2 ∂1 u2 − (u1 ∂1 u1 + u2 ∂2 u1 )
−u2 (∂2 u1 − ∂1 u2 ),
u1 ∂2 u1 + u2 ∂2 u2 − (u1 ∂1 u2 + u2 ∂2 u2 )
u1 (∂2 u1 − ∂1 u2 )
116
folgt
1
∇|u|2 − (u · ∇)u =
2
µ
¶
· rotu = 0
³n
´
|u|2 + p .
−u2
u1
und daher aus (4.39)
0 = n0 (u · ∇)u + ∇p = ∇
Die Behauptung folgt durch Integration.
x
0
2
¤
2
ν
Ω
x
R
1
ν
Abbildung 4.9: Umströmung eines Kreiszylinders.
Wir untersuchen nun die Umströmung eines Kreiszylinders mit Radius R (Abbildung 4.9) und Mittelpunkt im Koordinatenursprung. Wir nehmen an, daß die Geschwindigkeit und der Druck weit vom Hindernis entfernt konstant ist und daß die Normalenkomponente der Geschwindigkeit am Rand des Hindernisses verschwindet:
µ ¶
u∞
u→
, p → p∞ (|x| → ∞)
und
u · ν = 0 auf ∂Ω.
0
Hierbei ist ν der äußere Normaleneinheitsvektor auf ∂Ω. Gemäß den obigen Überlegungen
sind u = ∇φ und p Lösungen von
µ ¶
u∞
2
(|x| → ∞)
(4.41)
∆φ = 0 in R \Ω,
∇φ · ν = 0 auf ∂Ω,
∇φ →
0
und (siehe Lemma 4.2)
p = p∞ +
n0
(|u∞ |2 − |u|2 )
2
117
in R2 \Ω.
(4.42)
Wir transformieren das Randwertproblem (4.41) in Polarkoordinaten. Mit x 1 = r cos α,
x2 = r sin α folgt
¶
µ
1
1
φr cos α − φα r−1 sin α
,
∆φ = (rφr )r + 2 φαα
∇φ =
(4.43)
−1
r
r
φr sin α + φα r cos α
und damit zum einen
r(rφr )r + φαα = 0,
0 ≤ α < 2π,
r > R,
(4.44)
und zum anderen aus
φr cos α −
φα sin α
→ u∞ ,
r
φr sin α +
φα cos α
→0
r
(|x| → ∞)
durch geschickte Linearkombination
φr → u∞ cos α,
1
φα → −u∞ sin α
r
für |x| → ∞
(4.45)
und wegen ν = (cos α, sin α)>
0 = ∇φ · ν = (cos2 α + sin2 α)φr = φr ,
r = R,
0 ≤ α < 2π.
(4.46)
Das Problem (4.44)–(4.46) kann durch Separation der Variablen gelöst werden, d.h.,
wir machen den Ansatz φ(r, α) = f (r)g(α) in (4.44):
r(rfr )r
gαα
=−
=: c ∈ R.
f
g
Die linke Seite der Gleichung hängt nur von r, die rechte nur von α ab; also sind beide
Seiten konstant. Da g eine 2π-periodische Funktion sein soll, folgt c = 1 und
g(α) = c1 cos α + c2 sin α.
Um die verbleibende Gleichung r(rfr )r = f zu lösen, machen wir den Ansatz f (r) = r β :
rβ = f (r) = r(rfr )r = β 2 rβ
=⇒
β = ±1.
Die allgemeine Lösung lautet also
f (r) = r +
c3
.
r
Eine Integrationskonstante genügt, da die zweite mit den Konstanten c1 und c2 integriert
werden kann. Die drei Konstanten c1 , c2 , c3 bestimmen wir aus den drei Randbedingungen
(4.45)–(4.46):
³
c3 ´
0 = φr (R, α) = g(α) 1 − 2
=⇒ c3 = R2 .
R
118
Aus (4.45) und
c3 ´
φr (r, α) = (c1 cos α + c2 sin α) 1 − 2 → c1 cos α + c2 sin α
r
³
1
c3 ´
φα (r, α) = (−c1 sin α + c2 cos α) 1 + 2 → −c1 sin α + c2 cos α
r
r
³
für r → ∞ folgt
c1 cos α + c2 sin α = u∞ cos α,
−c1 sin α + c2 cos α = −u∞ sin α.
Setzen wir α = π/2 ein, erhalten wir aus der ersten Gleichung c2 = 0 und aus der zweiten
Gleichung c1 = u∞ . Die Lösung lautet also
µ
¶
R2
φ(r, α) = u∞ cos α r +
,
r ≥ R, 0 ≤ α < 2π.
r
Wie können wir die Strömung visualisieren? Dazu betrachten wir die komplexe Erweiterung des Geschwindigkeitspotentials
µ
¶
R2
F (z) = u∞ z +
,
|z| ≥ R.
z
Wir nennen F das komplexe Geschwindigkeitspotential. Der Realteil von F ist gerade φ.
Allgemein schreiben wir für z = x1 + ix2
F (z) = φ(x1 , x2 ) + iψ(x1 , x2 ),
wobei wir φ(r, α) und φ(x1 , x2 ) miteinander identifizieren. Die Funktion F ist in {|z| ≥ R}
analytisch, also gelten die Cauchy-Riemannschen Differentialgleichungen
u1 =
∂φ
∂ψ
=
,
∂x1
∂x2
u2 =
Dies impliziert
∂φ
∂ψ
=−
.
∂x2
∂x1
∂ψ
∂ψ
+ u2
= 0,
∂x1
∂x2
und daher sind die Teilchenbahnen durch die Gleichung ψ(x1 , x2 ) = const. gegeben (Abbildung 4.10). Wir nennen die Teilchenbahnen auch Stromlinien; sie sind die Konturlinien
von Im F . In Abbildung 4.11 sind diese Konturlinien dargestellt. Die Geschwindigkeit
verschwindet genau dann, wenn sin α = 0 und r = R, also gerade an den beiden Punkten
(−R, 0) und (R, 0).
Nach (4.42) ist der Druck maximal an diesen Punkten; sie werden auch Staupunkte genannt. Diese symmetrische Druckverteilung kann keine resultierende Kraft auf den
Kreiszylinder ausüben. Um sie mit konstanter Geschwindigkeit durch die ruhende Flüssigkeit (oder das ruhende Gas) zu ziehen, bräuchte man keine Kraft. Dieser Widerspruch zur
u · ∇ψ = u1
119
ψ
∆
u
ψ = const.
Abbildung 4.10: Zur Beziehung u · ∇ψ = 0.
2.5
2
1.5
1
0.5
y
0
−0.5
−1
−1.5
−2
−2.5
−3
−2
−1
0
x
1
2
3
Abbildung 4.11: Stromlinien um einen Kreiszylinder mit Radius R = 1 und Grenzgeschwindigkeit u∞ = 1.
Erfahrung löst sich folgendermaßen: Im ersten Anlaufen der Strömung sieht das Stromlinienbild wie in Abbildung 4.11 aus. Nach kurzer Zeit ändert jedoch die unvermeidliche
Reibung in einer Grenzschicht um den Kreiszylinder und beim Wiederzusammenlaufen
der Flüssigkeit hinter dem Kreiszylinder das Strömungsbild; es treten Wirbel hinter dem
Hindernis auf, die Stromlinien und damit auch der Druck sind nicht mehr symmetrisch
verteilt.
Streng genommen existiert keine globale Potentialströmung auf dem Außenraum R2 \Ω,
da dieses Gebiet nicht einfach zusammenhängend ist. Wir müssen eigentlich eine Lösung
φ suchen von
∆φ = 0
in R2 \(Ω ∪ R+ )
(4.47)
mit den Randbedingungen
∇φ · ν = 0 auf ∂Ω,
∇φ →
µ
u∞
0
¶
(|x| → ∞)
(4.48)
und
φr
und φα
2π-periodisch bezüglich α.
120
(4.49)
Die letzte Bedingung stellt sicher, daß die Geschwindigkeit u = ∇φ stetig in R 2 \Ω ist.
Das Gebiet R2 \(Ω ∪ R+ ) ist einfach zusammenhängend, so daß die Lösung von (4.47) Sinn
macht. Allerdings verlieren wir die Stetigkeit von φ auf R2 \Ω. Die Funktionen
¶
µ
R2
,
r ≥ R, α ∈ R,
(4.50)
φ(r, α) = −Aα + u∞ cos α r +
r
sind für alle A ∈ R Lösungen von (4.47)–(4.49). Da wir den Parameter A ∈ R beliebig
wählen können, ist die Lösung des Strömungsproblems nicht eindeutig bestimmt.
Übrigens entspricht die Abbildung φA (r, α) = −Aα einem Rotationsfeld
µ
¶
A x2
uA (r, α) := ∇φA (r, α) = 2
r −x1
(siehe (4.43) für ∇φA in Polarkoordinaten). Die Funktion ∇ψA = (x1 , x2 )> steht senkrecht
auf der Geschwindigkeit uA , und es gilt ψA (x1 , x2 ) = (x21 + x22 )/2. Die Stromlinien von uA
sind also konzentrische Kreise um den Ursprung (Abbildung 4.12).
x
2
v
v
v
x
1
Abbildung 4.12: Stromlinien zu uA (x1 , x2 ) = −A/(x21 + x22 ) · (x2 , −x1 )> .
Übungsaufgabe: Das komplexe Geschwindigkeitspotential zu (4.50) lautet
¶
µ
z
R2
.
F (z) = Ai ln + u∞ z +
R
z
Zeichnen Sie die Stromlinien für 0 < A < 2Ru∞ und A > 2Ru∞ (u∞ > 0).
Ein Kreiszylinder ist keine sehr effektive Tragfläche. Ein verhältnismäßig realistischer
Tragflügelquerschnitt wird durch die sogenannte Joukowski-Transformation
J(z) := z +
c2
,
z
z ∈ ∂BR (z0 ) = {|z − z0 | = R},
mit c = z0 + Re−iβ dargestellt (Abbildung 4.13). Das komplexe Geschwindigkeitspotential
des Kreises um z0 ist durch
¶
µ
z − z0
R2
+ u∞ z − z 0 +
F (z) = Ai ln
R
z − z0
121
gegeben. Aus den Stromlinien ψ(z) = ImF (z) = const. für den Kreiszylinder können
wir die entsprechenden Stromlinien um das Joukowski-Profil konstruieren. In der Tat:
Da J eine konforme (d.h. winkeltreue) Abbildung ist, löst der Realteil des komplexen
Geschwindigkeitspotentials
x2
8
u
γ
z
0
β
R
1
c
x
1
0.5
0
−1.5
−1
−0.5
0
0.5
1
1.5
Abbildung 4.13: Der Kreis um z0 mit Radius R (links) wird durch die JoukowskiTransformation auf das Joukowski-Profil (rechts) abgebildet. Für die rechte Abbildung
haben wir R = 1, β = π/10 und c = 3/4 gewählt. Der Punkt c wird auf die Hinterkante
2c abgebildet.
G(w) := F (J −1 (w)),
w ∈ J(R2 \BR (z0 )),
das Strömungsproblem. Sei nämlich φJ (w) := ReG(w). Dann ist ∆φJ = 0 (denn G(w) ist
analytisch),
µ ¶
ReF 0 (J −1 (w))
∇φ(z)
u∞
∇φJ (w) =
= 0
→
(|w| → ∞),
0
−1
J (J (w))
J (z)
0
wobei φ = ReF durch (4.50) gegeben ist, w = J(z) und J 0 (z) = 1 − c2 /z 2 → 1 (|z| → ∞),
sowie
∇φ(z) · ν
= 0,
w ∈ J(∂BR (z0 )).
∇φJ (w) · ν =
J 0 (z)
Die Stromlinien sind durch die Gleichung
ψJ (w) = ImG(w) = const.
gegeben.
Die Strömung um einen Tragflügel kann realistischer modelliert werden, wenn die Tragfläche durch eine um den Winkel γ gedrehte Strömung umflossen wird (Abbildung 4.13).
122
In diesem Fall lautet das komplexe Geschwindigkeitspotential
¶
µ
z − z0
R2 eiγ
−iγ
.
F (z) = Ai ln
+ u∞ (z − z0 )e +
R
z − z0
Diese Lösung hat zwei Nachteile:
Da A ∈ R beliebig, ist F nicht eindeutig gegeben.
Die Geschwindigkeit
∇φJ (w) =
∇φ(z)
∇φ(z)
=
,
0
J (z)
1 − c2 /z 2
w = J(z),
ist singulär an den Punkten z = ±c bzw. w = ±2c. Dies bedeutet, daß die Geschwindigkeit an der Hinterkante 2c nicht definiert ist.
Beide Nachteile können auf einen Schlag beseitigt werden, wenn wir fordern, daß an der
Hinterkante ein Staupunkt ist, d.h., daß an der Hinterkante die Geschwindigkeit verschwindet. Dies ist eine rein heuristische Forderung, die erfüllt ist, wenn F 0 (c) = 0. Damit
kann der Parameter A festgelegt werden. Es folgt wegen c − z0 = Re−iβ :
¶
µ
¡ −iγ
¢
Ai
Ai iβ
R2 eiγ
0
i(γ+2β)
−iγ
0 = F (c) =
+ u∞ e −
e
+
u
e
−
e
=
∞
c − z0
(c − z0 )2
R
und folglich
¢
¡
A = iRu∞ e−i(γ+β) − ei(γ+β) = 2Ru∞ sin(β + γ).
Die Strömung um den Joukowski-Tragflügel haben wir damit bestimmt.
4.6
Hele-Shaw-Strömung
Erdöl kann dadurch aus einem porösen Boden extrahiert werden, daß Wasser in den
Boden gepumpt wird und das Erdöl durch spezielle Röhren nach oben drückt. Wegen der
verschiedenen Zähigkeit (bzw. Viskosität) von Erdöl und Wasser können sich “Finger”
ausbilden, die den Ertrag verringern (Abbildung 4.14). In diesem Abschnitt wollen wir
eine Gleichung für die zeitliche Evolution des Randes ∂Ω(t) zwischen zwei verschieden
viskosen Flüssigkeiten herleiten. Vereinfachend nehmen wir an, daß sich die Flüssigkeit
zwischen zwei parallelen unendlich ausgedehnten Platten im Abstand 2h > 0 bewegt
und dabei Luft verdrängt (Abbildung 4.15). Man nennt die Bewegung eine Hele-ShawStrömung. Die Bewegung der Flüssigkeit ist durch die Navier-Stokes-Gleichungen
∂t n + div(nu) = 0,
∂t (nu) + div(nu ⊗ u) + ∇p = ∇((λ + µ)divu) + µ∆u
für die Teilchendichte n = n(x, t) und Geschwindigkeit u = u(x, t) gegeben. Wir machen
die folgenden Annahmen:
123
ο) Ω (t)
Erdöl
Wasser
Ω (t)
Abbildung 4.14: Die Verdrängung von Erdöl durch Wasser führt zur Bildung von “Fingern”.
z
h
−h
x
y
Abbildung 4.15: Geometrie zweier paralleler Platten.
Die Flüssigkeit sei homogen (n = n0 = const.) und stationär (∂t u = 0).
Der halbe Plattenabstand h sei so klein, daß es keine Strömung in z-Richtung gibt,
d.h. u = (u1 , u2 , 0)> .
Die Ableitungen von u nach x1 und x2 seien vernachlässigbar verglichen mit den
Ableitungen von u nach x3 .
An den Platten ruhe die Flüssigkeit: u = 0 auf x3 = ±h.
Die erste Voraussetzung impliziert
divu = 0,
n0 div(u ⊗ u) + ∇p = µ∆u.
Wegen divu = 0 gilt
div(u ⊗ u)i =
X ∂
X
∂
(uj ui ) =
uj
ui = (u · ∇)ui ,
∂xj
∂xj
j
j
124
so daß wir die zweite Gleichung auch schreiben können als
n0 (u · ∇)u + ∇p = µ∆u.
(4.51)
Aus der zweiten und dritten Voraussetzung folgt
(u · ∇)u = u1
Damit wird (4.51) zu
∂u
∂u
+ u2
≈ 0,
∂x1
∂x2


∂ 2 u1 /∂x23


∆u ≈  ∂ 2 u2 /∂x23  .
0


u
1
∂2 

∇p = µ 2  u2  .
∂x3
0
Insbesondere ist ∂p/∂x3 = 0, d.h., der Druck ist eine Funktion nur von x1 und x2 . Integrieren wir
∂ 2 u1
∂p
=µ 2
∂x1
∂x3
bezüglich x3 , so erhalten wir, da ∂p/∂x1 konstant bezüglich x3 ist,
u1 (x1 , x2 , x3 ) = A(x1 , x2 ) + B(x1 , x2 )x3 +
x23 ∂p
2µ ∂x1
− h ≤ x3 ≤ h.
Die Integrationskonstanten können aus der Randbedingung u = 0 für x3 = ±h (vierte
Voraussetzung) bestimmt werden: A = −(h2 /2µ)∂p/∂x1 und B = 0. Damit folgt
u1 (x1 , x2 , x3 ) = −
h2 − x23 ∂p
(x1 , x2 ).
2µ
∂x1
Analog ist
h2 − x23 ∂p
(x1 , x2 ).
2µ
∂x2
Wir mitteln über x3 ∈ (−h, h), um einen Geschwindigkeitsvektor zu erhalten, der nur
noch von x1 und x2 abhängt:
Z
Z h
1
h2 ∂p
1 ∂p h 2
v1 :=
,
(h − x23 ) dx3 = −
u1 dx3 = −
2h −h
4µh ∂x1 −h
3µ ∂x1
u2 (x1 , x2 , x3 ) = −
und analog v2 = −(h2 /3µ)∂p/∂x2 . Definieren wir v = (v1 , v2 )> , so erhalten wir die
Strömungsgleichungen
h2
v = − ∇p,
divv = 0.
3µ
Insbesondere erfüllt p die Laplace-Gleichung ∆p = 0 in der Flüssigkeit. Wir können die
Variablen so umskalieren, daß
v = −∇p,
∆p = 0
125
in Ω(t)
(4.52)
gilt, wobei Ω(t) ⊂ R2 die zweidimensionale Projektion des Flüssigkeitsgebietes sei.
Wir wollen eine Gleichung herleiten, die die zeitliche Entwicklung der Grenzkurve
∂Ω(t) beschreibt. Dazu nehmen wir an, daß der Druck konstant auf ∂Ω(t) ist. Diese
Voraussetzung ist näherungsweise erfüllt, wenn die Krümmung des Randes ∂Ω(t) nicht
zu groß ist. Anderenfalls gilt p = γκ auf ∂Ω(t), wobei κ die Krümmung von ∂Ω(t) und γ
den Koeffizient der Oberflächenspannung bezeichne. Durch Wahl eines Referenzpunktes
für den Druck können wir also
p=0
auf ∂Ω(t)
(4.53)
voraussetzen. Entlang der Trajektorien (x(t), y(t))> mit (x, y)0 = v gilt dann
0=
d
∂p
p(x(t), y(t), t) = ∇p · (x0 (t), y 0 (t))> +
= pt + v · ∇p
dt
∂t
auf ∂Ω(t).
Aus (4.52) folgt
pt − |∇p|2 = 0
auf ∂Ω(t).
(4.54)
Wir nehmen nun an, daß sich in Ω(t) eine Quelle bzw. Senke befindet:
p(x, y) ∼ −
Q
ln(x2 + y 2 )1/2
2π
für (x, y) → (0, 0).
(4.55)
Hierbei gelte ohne Einschränkung (0, 0) ∈ Ω(t)0 . Die Notation bedeutet, daß im Grenzwert
(x, y) → (0, 0) der Quotient p/(−Q/2π) ln(x2 + y 2 )1/2 gegen Eins konvergiert.
Das Randwertproblem (4.52) und (4.53) (oder (4.54)) zusammen mit der Bedingung
(4.55) ist ein freies Randwertproblem, da wir neben dem Druck noch den freien Rand
∂Ω(t) bestimmen müssen. Wir bestimmen den Rand, indem wir ihn auf den Rand des
Einheitskreises transformieren. Dazu setzen wir z = x + iy und transformieren Ω(t) auf
den Einheitskreis {ζ ∈ C : |ζ| < 1}. Ist Ω(t) endlich und einfach zusammenhängend,
so existiert nach dem Abbildungssatz von Riemann eine Funktion f mit den folgenden
Eigenschaften:
f (·, t) : {|ζ| ≤ 1} → Ω(t),
z = f (ζ, t),
und f ({|ζ| = 1}) = ∂Ω(t), ζ 7→ ζf (ζ, t) ist analytisch und (für ζ = 0) reell und positiv.
Außerdem gilt ∂f /∂ζ 6= 0.
Welcher Differentialgleichung genügt f ? Dazu müssen wir den Druck auf die ζ-Ebene
transformieren. Sei w(z) = p(x, y) + iψ(x, y) der komplexe Druck. Dann gilt
w(f (ζ, t)) = −
Q
ln ζ,
2π
denn
∆p = Re∆w = 0 in {|ζ| < 1},
p=−
126
Q
ln |ζ| = 0 auf {|ζ| = 1}
2π
(4.56)
und
Q
ln |ζ|
für ζ → 0.
2π
Es bleibt die Gleichung (4.54) zu transformieren. Es gilt auf |ζ| = 1 wegen (4.54):
¯2
·
¸ ¯
¯ dw
¯
∂w
Re
(f (ζ, t)) = ¯¯ (f (ζ, t))¯¯ .
(4.57)
∂t
dz
p∼−
Aus (4.56) folgt einerseits
∂w
Q 1
=−
∂ζ
2π ζ
und andererseits
dw ∂f
∂w
=
,
∂ζ
dz ∂ζ
also
Q
dw
=−
dz
2π
µ
∂f
ζ
∂ζ
¶−1
.
Damit ergibt sich aus (4.57)
"
Q
−Re
2π
µ
∂f
ζ
∂ζ
¶−1
∂f
∂t
#
·
dw ∂f
= Re
dz ∂t
oder
¸
¸ ¯¯ µ
¶−1 ¯¯2
∂f
Q
∂w
¯
¯
= Re
=¯
ζ
¯
¯ 2π
¯
∂t
∂ζ
·
"¯
#
¯ µ
¶−1
·
¸
·
¸
¯ ∂f ¯2
Q
∂f ∂f
∂f
∂f ∂f
∂f
¯
¯
−
= Re ¯ζ ¯ ζ
= Re ζ
= Re ζ
,
2π
∂ζ
∂ζ
∂t
∂ζ ∂t
∂ζ ∂t
|ζ| = 1. (4.58)
Jede injektive Funktion f , die die obigen Eigenschaften und (4.58) erfüllt, liefert eine
Lösung der Hele-Shaw-Strömung.
Als Beispiel wollen wir untersuchen, welche Hele-Shaw-Strömungen Funktionen der
Form
n
X
ak (t)ζ k ,
ak (t) reell,
f (ζ, t) =
k=−1
ergeben. Setzen wir diese Definition in (4.58) ein, sortieren nach Potenzen von ζ k und
identifizieren die Koeffizienten der ζ k -Terme, erhalten wir
n
X
k=−1
kak a0k = −
Q
2π
(4.59)
für den ζ 0 -Term und für die restlichen Terme:
n−j
X
(kak a0k+j + (k + j)ak+j a0k ) = 0,
k=−1
127
j = 1, . . . , n + 1.
(4.60)
Dies sind gewöhnliche Differentialgleichungen für a−1 , . . . , an mit den Anfangswerten
j = −1, . . . , n,
aj (0) = αj ,
(4.61)
die sich aus der Transformation
f (ζ, 0) =
n
X
αk ζ k
k=−1
des gegebenen Gebietes Ω(0) ergeben. Wir behaupten nun: Die Lösung von (4.60)–(4.61)
kann nicht für alle t ≥ 0 existieren, wenn n ≥ 2 und Q > 0. Um dies einzusehen, schreiben
wir (4.60) für j = n + 1:
−a−1 a0n + nan a0−1 = 0.
Dies ist äquivalent zu
n
a0−1 a0n
−
=0
a−1 an
d
an
ln n = 0.
dt a−1
und
Integration ergibt
an (t) = αn
µ
a−1 (t)
α−1
¶n
.
(4.62)
Die Gleichung (4.59) ist äquivalent zu
à n
!
d X 2
Q
kak = − ,
dt k=−1
π
was nach Integration
n
X
k=−1
k(a2k (t) − αk2 ) = −
Qt
π
liefert. Wir formulieren diese Gleichung um:
n
a2−1 (t)
=
2
α−1
Qt X
k(a2k (t) − αk2 ) → ∞
+
+
π
k=1
für t → ∞,
da Q > 0. Andererseits folgt aus dieser Gleichung und (4.62)
n−1
a2−1 (t) =
≥
oder
X
Qt
−2n 2n
2
+ nαn2 α−1
a−1 (t) +
k(a2k (t) − αk2 ) + α−1
− nαn2
π
k=1
−2n 2n
nαn2 α−1
a−1 (t)
−
n
X
kαk2
k=1
n
h
i X
−2n 2(n−1)
kαk2 > −∞.
a−1 (t) ≥
a2−1 (t) 1 − nαn2 α−1
k=1
128
(4.63)
Die linke Seite konvergiert jedoch für t → ∞ wegen (4.63) gegen −∞; Widerspruch.
Folglich kann die Lösung von (4.60)–(4.61) nur in einem endlichen Zeitintervall existieren.
Physikalisch erwarten wir natürlich zeitlich globale Lösungen. Was ist passiert? Dazu
betrachten wir die spezielle Funktion
f (ζ, t) = a1 (t)ζ + a2 (t)ζ 2 ,
|ζ| ≤ 1.
Die Gleichungen (4.59) und (4.60) ergeben
Q
d 2
(a1 + 2a22 ) = − ,
dt
π
1 d 2
(a a2 ) = a1 a02 + 2a2 a01 = 0,
a1 dt 1
also
Qt
+ (α12 + 2α22 ),
π
a21 (t)a2 (t) = α12 α2 .
a21 (t) + 2a22 (t) = −
(4.64)
(4.65)
Seien α1 , α2 > 0 so, daß
t∗ = −
Dann folgt aus (4.64)–(4.65)
a21 (t∗ ) + 2a22 (t∗ ) = −
¢
π ¡ 2 2/3
3(α1 α2 ) − (α12 + 2α22 ) > 0.
Q
Qt∗
+ α12 + 2α22 = 3(α12 α2 )2/3 = 3(a21 (t∗ )a2 (t∗ ))2/3 .
π
Diese Gleichung besitzt die Lösung a2 (t∗ ) = a1 (t∗ ). Dies impliziert jedoch
∂f
(ζ, t∗ ) = a1 (t∗ ) + 2a2 (t∗ )ζ = a1 (t∗ ) − a2 (t∗ ) = 0
∂ζ
für ζ = −1/2, d.h., f (ζ, t∗ ) ist nicht mehr injektiv, und die Transformation ist nicht
mehr zulässig. Dies ist ein mathematisches Argument. Was ist der physikalische Grund?
Zeichnet man den Rand z ∈ ∂Ω(t), d.h.
z = f (ζ, t) = a1 (t)ζ + a2 (t)ζ 2 ,
|ζ| = 1,
so ergibt sich bei t = t∗ eine Singularität (Abbildung 4.16). Die Singularität bedeutet, daß
die Krümmung des Randes unendlich wird. Nun ist bei der Herleitung vorausgesetzt worden, daß die Krümmung nicht zu groß werden darf. Diese Voraussetzung ist also verletzt.
In realen Flüssigkeiten verhindert die Oberflächenspannung derartige Singularitäten. Da
wir die Oberflächenspannung vernachlässigt haben, ist das Auftreten von Singularitäten
nicht erstaunlich. Freilich gibt es andere Funktionen f , bei denen keine Singularitäten
auftreten (siehe die Literatur in [6]).
129
2
1.5
Imaginärteil
1
0.5
0
−0.5
−1
−1.5
−2
−1.5
−1
−0.5
0
0.5
Realteil
1
1.5
2
Abbildung 4.16: Darstellung der Kurven {f (ζ, t) : |ζ| = 1} für t = 0, 0.8, 1.6, 1.942 mit
den Parameterwerten α1 = α2 = 1 und Q = −1.
5
5.1
Diffusion
Diffusionsgleichung
In diesem Abschnitt wollen wir eine Gleichung herleiten, die die Diffusion von Teilchen
oder allgemein von physikalischen Größen beschreibt. Wir beginnen mit einem Teilchen,
das sich zur Zeit t = 0 an der Stelle x = 0 befindet und das sich in einer Zeitspanne 4t
aufgrund von Kollisionen mit gleicher Wahrscheinlichkeit nach links oder rechts um eine
Weglänge 4x bewegt. Mit welcher Wahrscheinlichkeit befindet sich das Teilchen zur Zeit
tk = k · 4t (k ∈ N) an der Stelle xn = n · 4x (n ∈ Z)?
Sei Xk des Ort des Teilchens zur Zeit tk , d.h. Xk ∈ 4x · Z = {0, ±4x, ±24x, . . .},
und sei
u(xn , tk ) = P (Xk = xn )
die Wahrscheinlichkeit, daß sich das Teilchen zur Zeit tk in xn befindet. Die Wahrscheinlichkeit kann rekursiv berechnet werden (Abbildung 5.1):
1
1
u(xn , tk+1 ) = u(xn−1 , tk ) + u(xn+1 , tk ),
2
2
(5.1)
wenn n und k entweder beide gerade oder beide ungerade sind, und u(xn , tk+1 ) = 0 sonst.
Die Anfangsbedingung lautet
(
1 : n = 0,
u(xn , 0) =
(5.2)
0 : n 6= 0.
Übungsaufgabe: Berechnen Sie u(xn , tk ) als Lösung der Rekursionsgleichungen (5.1)–
(5.2).
130
∆ x
1
k=0
1/2
1/2
k=1
1/4
1/4
2/4
k=2
1/8
k=3
x
−3
3/8
x
−2
x
3/8
x
−1
0
x
1
1/8
x
2
x
3
Abbildung 5.1: Stochastische Irrfahrt. Die Zahlen geben die Wahrscheinichkeiten an, daß
sich das Teilchen zur Zeit tk an der entsprechenden Stelle befindet.
Was geschieht, wenn sowohl 4x als auch 4t gegen Null gehen? Wir nehmen an, daß
diese Konvergenz so ist, daß
(4x)2
σ :=
24t
konstant bleibt. Dann folgt aus (5.1)
´
´
σ ³
1 ³
u(xn , tk+1 ) − u(xn , tk )
u(xn−1 , tk ) − 2u(xn , tk ) + u(xn+1 , tk ) −
(4x)2
4t
¶³
µ
´
1
σ
u(xn−1 , tk ) + u(xn+1 , tk ) − 2u(xn , tn )
−
=
(4x)2 24t
= 0.
Im Grenzwert 4x → 0 bzw. 4t → 0 folgt aus dieser Differenzengleichung die partielle
Differentialgleichung
σuxx − ut = 0,
x ∈ R, t > 0,
(5.3)
die wir Diffusionsgleichung nennen. Der Parameter σ > 0 ist der Diffusionskoeffizient.
Übrigens gibt es einen Zusammenhang zwischen der Lösung von (5.3) und der stochastischen Irrfahrt, die durch Xk beschrieben wird. Wir können Xk formulieren als
Xk =
k
X
Zj ,
j=1
wobei Zj sogenannte (unabhängige) Zufallsvariablen sind, die mit Wahrscheinlichkeit 1/2
den Wert −4x und mit Wahrscheinlichkeit 1/2 den Wert +4x annehmen, d.h., Zj ist
eine (Zufalls-)Funktion mit Werten in {−4x, 4x}. Wir definieren den Erwartungswert
und die Varianz von Zj durch
E(Zj ) := −4x · P (Zj = −4x) + 4x · P (Zj = 4x),
Var(Zj ) := E(Zj2 ) − E(Zj )2 .
131
Aus E(Zj ) = −4x ·
1
2
+ 4x ·
1
2
= 0 folgt
Var(Zj ) = E(Zj2 ) = (−4x)2 P (Zj = −4x) + (4x)2 P (Zj = 4x) = (4x)2
und daher
E(Xk ) =
k
X
E(Zj ) = 0,
j=1
Var(Xk ) =
E(Xk2 )
=
k
X
j=1
E(Zj2 ) = k(4x)2 = k · 2σ4t = 2σtk .
Im Grenzwert 4t → 0 (bzw. k → ∞, wenn wir t = tk fest wählen) konvergiert Xk gegen
eine Funktion X mit den Eigenschaften E(X) = 0, Var(X) = 2σt. Der Grenzwert X
wird Brownsche Bewegung genannt. Man kann außerdem zeigen, daß nach dem zentralen
Grenzwertsatz
µ
¶
Z x
y2
1
√
exp −
dy
lim P (Xk ≤ x) =
k→∞
4σt
4πσt
−∞
gilt, wobei t = tk fest gewählt sei. Andererseits erfüllt auch die Brownsche Bewegung diese
Beziehung:
¶
µ
Z x
1
y2
.
(5.4)
P (X ≤ x) =
u(y, t) dy
mit u(y, t) = √
exp −
4σt
4πσt
−∞
Die Funktion u ist eine spezielle Lösung von (5.3):
µ
¶·
µ 2
¶¸
−1
x
1
x2
x2
σ
1
√
+√
ut − σuxx = exp −
−√
−
4σt
2 4πσ t3/2
4πσ 4σt3/2
4πσt 4σ 2 t2 2σt
= 0.
Beginnt die Diffusion mit einer endlichen Zahl von Teilchen, die über die reelle Zahlenachse verteilt sind, müssen wir (5.3) mit der Anfangsbedingung
u(x, 0) = u0 (x),
x ∈ R,
(5.5)
lösen. Durch Überlagerung der einzelnen Bewegungen, beschrieben durch (5.4), erhalten
wir die Lösung
µ
¶
Z
1
(x − y)2
u(x, t) = √
u0 (y)exp −
dy
4σt
4σπt R
von (5.3) und (5.5).
Welchem Anfangswert entspricht die Lösung (5.4)? Offensichtlich gilt
(
Z
0 : x 6= 0
lim u(x, t) =
lim u(y, t) dy = 1.
(5.6)
t→0
t→0 R
∞ : x = 0,
132
Es gibt keine Funktion
u0 (x) := lim u(x, t),
t→0
die die Eigenschaften (5.6) erfüllt. Wir nennen u0 daher eine Distribution; das ist ein
Funktional, definiert durch
u0 [φ] = φ(0)
für alle φ ∈ C0∞ (R),
wobei C0∞ (R) der Raum aller C ∞ -Funktionen mit kompaktem Träger sei. Diese Definition
ergibt sich formal aus
Z
Z
u0 [φ] =
u0 (x)φ(x) dx = lim u(x, t)φ(x) dx
R
t→0
µ
R
¶
1
x2
= lim √
exp −
φ(x) dx
t→0
4σt
4πσt R
Z
√
1
2
e−y /2 φ( 2σt y) dy
= lim √
t→0
2π R
Z
1
2
= φ(0) √
e−y /2 dy
2π R
Z
= φ(0).
Die Diffusionsgleichung (5.3) tritt auch bei Temperaturprozessen auf. Sei θ(x, t) die
Temperatur eines Körpers zur Zeit t an der Stelle x ∈ R3 . Die zeitliche Änderung der
Temperatur ist proportional zur Divergenz des Wärmestromes J:
n0 cθt + divJ = 0,
wobei n0 die Dichte des Körpers und c seine spezifische Wärme seien (siehe unten). Nach
dem Fourier-Gesetz ist der Wärmestrom proportional zum Temperaturgradienten
J = −λ∇θ,
wobei λ > 0 die Wärmeleitfähigkeit genannt wird. Ist λ konstant, so folgt die Wärmeleitungsgleichung
λ
θt −
4θ = 0.
n0 c
Die Gleichung folgt auch aus der Energiebilanz (4.34) der Navier-Stokes-Gleichungen im
Falle verschwindender Geschwindigkeit:
´
³3
∂t n0 θ = div(K∇θ).
2
Die spezifische Wärme ist hier c = 3/2, was drei Freiheitsgeraden entspricht (also einem
Gas aus einzelnen Atomen). Wir betrachten folgendes Anwendungsbeispiel.
133
Beispiel 5.1 Wie lang sollte der metallene, nicht isolierte Griff einer Eisenpfanne sein,
damit man sich nicht die Hände verbrennt?
Wir modellieren den Griff durch das Intervall [0, L]. Sei θ(x, t) die Temperatur des
Griffes. Wir nehmen an, daß der Griff zur Zeit t = 0 Raumtemperatur hat. An der Stelle
x = 0 sei der Griff in Kontakt mit der Pfanne, die eine Maximaltemperatur von 200◦ C
habe:
θ(0, t) = 200◦ C.
Wie lautet die Randbedingung am Ende des Griffes (x = L)? Es ist sicherlich unrealistisch
anzunehmen, daß der Griff gegenüber der Umgebung völlig isoliert ist, da ein kleiner
Wärmestrom stattfindet:
J(L, t) = −λθx (L, t) = 0.
Andererseits ist es unrealistisch anzunehmen, daß der Wärmefluß in die Umgebung so
rasch ist, daß das Ende des Griffes Raumtemperatur aufweist:
θ(L, t) = 20◦ C.
Wir kombinieren stattdessen diese beiden Randbedingungen:
−θx (L, t) = α(θ(L, t) − 20◦ C).
Liegt die Temperatur über der Raumtemperatur, gibt es einen Wärmestrom in die Umgebung, anderenfalls erwärmt sich der Griff. Die Konstante α > 0 kann nur empirisch
bestimmt werden. Wir nehmen an, daß α = 0.3/cm gilt.
Die Temperatur erfülle die eindimensionale Wärmeleitungsgleichung
θt −
λ
θxx = 0,
n0 c
x ∈ (0, L),
t > 0.
Für genügend große Zeiten erwarten wir, daß sich die Temperatur auf einen stationären
Zustand einpendelt. Verschwinden die zeitlichen Änderungen (θt = 0), löst die stationäre
Temperaturverteilung das Randwertproblem
θxx = 0,
◦
θ(0) = 200 C,
x ∈ (0, L),
−θx (L) = α(θ(L, t) − 20◦ C).
Die allgemeine Lösung lautet θ(x) = ax + b. Die Konstanten a und b können wir aus den
Randbedingungen bestimmen; dies ergibt die Lösung
θ(x) = −180◦
αx
+ 200◦ C.
αL + 1
Soll die Temperatur am Griffende 40◦ C nicht überschreiten, ergibt sich die Grifflänge aus
40◦ C ≥ θ(L) = −180◦ C
134
αL
+ 200◦ C
αL + 1
oder
80
8
= cm ≈ 27cm.
α
3
Der Pfannengriff sollte also mindestens 27 cm lang sein.
L≥
5.2
Ein globales Klimamodell
Nach einer Studie des “Intergovernmental Panel on Climate Change” der Vereinten Nationen aus dem Jahr 2001 könnte sich die Erde in diesem Jahrhundert um bis zu 5.8◦ C
erwärmen. In diesem Abschnitt wollen wir die Konsequenzen der globalen Erwärmung
auf die Ausbreitung der Eisflächen untersuchen, indem wir die Temperatur durch ein sehr
einfaches Modell beschreiben.
Sei θ(x, t) die Temperatur des Luft in Meereshöhen an der Stelle x auf der Erdoberfläche M zur Zeit t. Wir nehmen an, daß die zeitliche Wärmeänderung gegeben ist durch
Diffusion + absorbierte Energie − emittierte Energie
bzw.
θt = D + Rab − Rem .
Wir nehmen außerdem an:
Die Diffusion wird durch das Fouriergesetz beschrieben: D = div(λ0 ∇θ), wobei
λ0 > 0.
Die Erde sei vollständig mit Wasser bedeckt. Dann ist die absorbierte Energie gegeben durch
(
%ε : θ ≤ 0◦ C,
Rab (θ) =
% : θ > 0◦ C,
wobei % die Solarkonstante sei und ε ∈ (0, 1). Dahinter steckt die Überlegung, daß
eine Eisfläche weniger Energie als eine Wasserfläche absorbiert.
Die emittierte Energie kann durch das Stefan-Boltzmann-Gesetz
Rem = σ(θ − θ)4
mit σ > 0, θ > 0
beschrieben werden. Wir vernachlässigen diese Größe und setzen σ = 0.
Damit erhalten wir
θt − div(λ0 ∇θ) = Rab (θ),
x ∈ M, t > 0,
mit Anfangsbedingung
θ(x, 0) = θ0 (x),
135
x ∈ M.
(5.7)
Da die Erdoberfläche M keinen Rand hat, sind keine Randbedingungen notwendig.
Das obige Problem ist verhältnismäßig komplex, da M eine Mannigfaltigkeit ist. Die
Differentialopertoren div und ∇ sind dementsprechend in den Koordinaten von M zu formulieren. Wir betrachten eine vereinfachte Situation, die es erlaubt, das Problem explizit
zu lösen:
Wegen der Rotationssymmetrie der Erdkugel betrachten wir die Gleichung (5.7) auf
einem Längengrad, dargestellt durch das Intervall [−1, 1], wobei x = −1 den Südpol
und x = 1 den Nordpol modelliere.
Wir sind nur an stationären Zuständen interessiert, so daß θt = 0.
Die Temperatur an den Polen sei −10◦ C.
Die Wärmeleitfähigkeit λ0 sei konstant.
Wir lösen also (5.1) auf dem Intervall (−1, 1):
−λ0 θxx = Ra,b (θ),
x ∈ (−1, 1),
(5.8)
θ(−1) = θ(1) = −10◦ C.
Streng genommen ist dies nicht richtig, da der Operator div(λ0 ∇θ) = λ0 4θ entlang eines
Längengrades nicht gleich λ0 θxx ist; wir modellieren die Erwärmung dennoch mit der
Gleichung (5.8). Mit
θ
%
u := ◦ + 1
und
λ :=
10 C
λ0
folgt
u00 + λg(u) = 0,
x ∈ (−1, 1),
u(−1) = u(1) = 0,
(5.9)
wobei
g(u) =
(
ε : u ≤ 1 (Eis),
1 : u > 1 (Wasser).
Wir erwarten, daß physikalisch sinnvolle Lösungen von (5.9) um den Äquator x = 0
symmetrisch sind, und suchen nur solche Lösungen. Da g(u) unstetig ist, können wir keine
klassischen, zweimal stetig differenzierbaren Lösungen erwarten. Die Lösungen können
allenfalls einmal stetig differenzierbar sein. Um (5.9) auf x ∈ (0, 1) lösen zu können,
benötigen wir eine Randbedingung an x = 0. Wir behaupten, daß u0 (0) = 0 gilt. Aus der
Symmetrie von u um x = 0 und der formalen Taylor-Entwicklung folgt
u(x) = u(0) + u0 (0)x + O(x2 ),
u(x) = u(−x) = u(0) − u0 (0) + O(x2 )
136
(x → 0),
also nach Subtraktion
1
O(x2 ) = O(x).
x
Mit x → 0 ergibt sich dann u0 (0) = 0. Damit haben wir das zu lösende Problem reduziert
auf
u00 + λg(u) = 0,
x ∈ (0, 1),
u0 (0) = 0,
u(1) = 0.
(5.10)
u0 (0) =
Es gilt übrigens
0
u (x) = −λ
und daher (Abbildung 5.2)
Z
x
g(u(s)) ds < 0
für alle x > 0
0
u(0) = max u(x).
(5.11)
x∈[0,1]
Wir unterscheiden also folgende Fälle.
x
−1
0
1
Abbildung 5.2: Qualitatives Verhalten der Lösung von (5.9).
Fall 1: u(0) ≤ 1. Wegen (5.11) bedeutet dies, daß die gesamte Erde eisbedeckt ist.
Insbesondere ist u(x) ≤ 1 für alle x ∈ [0, 1] und daher g(u) = ε. Das Problem (5.10) wird
zu
u00 + λε = 0,
x ∈ (0, 1),
u0 (0) = u(1) = 0.
Die allgemeine Lösung lautet
u(x) = −
λε 2
x + ax + b,
2
und aus den Randbedingungen folgt a = 0 und b = λε/2, so daß
u(x) =
λε
(1 − x2 ),
2
x ∈ [0, 1].
Damit u(0) ≤ 1 erfüllt ist, muß der Parameter λ die Bedingung
λ≤
2
ε
erfüllen.
137
(5.12)
Fall 2: u(0) > 1. Die Erde ist also teilweise eisbedeckt. Da u monoton fallend in (0, 1)
ist, existiert eine eindeutig bestimmte Zahl r ∈ (0, 1), so daß u(r) = 1. Der Parameter r
beschreibt die Grenze zwischen Wasser und Eis. Wir lösen das Problem
(
−λ : x ∈ (0, r),
u00 =
u0 (0) = u(1) = 0.
(5.13)
−λε : x ∈ (r, 1),
Der Wert r ist unbekannt; wir suchen also sowohl u als auch r. Man nennt daher r
einen freien Rand und das Problem (5.13) (oder (5.11)) ein freies Randwertproblem. Die
allgemeine Lösung von (5.13) lautet
(
− λ2 x2 + ax + b : x ∈ (0, r),
u00 =
(5.14)
− λε
x2 + cx + d : x ∈ (r, 1).
2
Um die vier Konstanten a, b, c und d zu bestimmen, genügen die beiden Randbedingungen
in (5.13) nicht. Wir fordern, daß u(x) an der Stelle x = r stetig differenzierbar ist. Dies
liefert zwei weitere Gleichungen:
u0 (r−) = u0 (r+).
u(r−) = u(r+),
Insgesamt erhalten wir die vier Gleichungen
0 = u0 (0) = a,
λε
0 = u(1) = − + c + d,
2
λ 2
λε
u(r) = − r + b = − r2 + cr + d,
2
2
u0 (r) = −λr = −λεr + c.
(5.15)
(5.16)
(5.17)
(5.18)
Aus (5.15)–(5.18) folgt
a = 0,
c = −λ(1 − ε)r.
Die Gleichung (5.16) impliziert
d=
λε
λε
−c=
+ λ(1 − ε)r.
2
2
Schließlich ergibt sich aus (5.17)
b=
λ
λ
λε
(1 − ε)r 2 + cr + d = − (1 − ε)r 2 +
+ λ(1 − ε)r.
2
2
2
Zur Bestimmung des freien Randes benötigen wir eine weitere Gleichung:
u(r) = 1.
138
(5.19)
Da wegen (5.17) b = u(r) + λr 2 /2 = 1 + λr 2 /2 gilt, erhalten wir aus (5.19)
λ
λ
λε
1 + r2 = − (1 − ε)r 2 +
+ λ(1 − ε)r
2
2
2
und nach einigen Umformungen
r2 −
2 − λε
2(1 − ε)
r+
= 0.
2−ε
λ(2 − ε)
(5.20)
Dies ergibt zwei Werte
r1,2
1−ε
±
=
2−ε
sµ
1−ε
2−ε
r
¶2
−
2 − λε
λ(2 − ε)
1
1−ε
±
2−ε 2−ε
1
(1 − ε)2 − (2 − λε)(2 − ε)
λ
r
1
2(2 − ε)
1−ε
1−
±
.
=
2−ε 2−ε
λ
=
(5.21)
Die quadratische Gleichung (5.20) ist nur dann reell lösbar, wenn λ ≥ 2(2 − ε). Außerdem
gilt r2 ≥ 0 genau dann, wenn
r
2(2 − ε)
2(2 − ε)
⇐⇒ 1 −
≤ (1 − ε)2
0 ≤ 1−ε− 1−
λ
λ
⇐⇒ λ ≤
2
.
ε
Die Forderung r1 ≤ 1 wird für alle λ > 0 erfüllt. Damit haben wir zwei kritische Parameterwerte gefunden:
2
λ1 = 2(2 − ε), λ2 = .
ε
Wir unterscheiden nun drei Fälle:
Fall A: λ < λ1 . Wegen λ1 < λ2 (weil ε < 1) existiert genau eine Lösung, nämlich
(5.12). Insbesondere ist
λ2 ε
λε
<
= 1.
u(0) =
2
2
Dies entspricht dem Fall 1; die Erde ist vollständig mit Eis bedeckt.
Fall B: λ1 < λ < λ2 . Es existiert eine Lösung mit u(0) < 1 (nämlich gerade (5.12))
und zwei Lösungen mit u(0) > 1, nämlich (5.14)) mit r = r1 und r = r2 . Am Äquator
x = 0 lautet die Temperatur
λ 2
u1,2 (0) = b = 1 + r1,2
,
2
und r1,2 ist gegeben durch (5.21).
139
Fall C: λ > λ2 . In diesem Fall ist r2 < 0, also existiert nur eine Lösung mit u(0) > 1,
nämlich (5.14) mit r = r1 .
Falls λ = λ1 , existiert eine Lösung mit u(0) < 1 (gegeben durch (5.12)) und eine
Lösung mit u(0) > 1 (gegeben durch (5.14) mit r = r1 = r2 = (1 − ε)/(2 − ε)). Im Falle
λ = λ2 schließlich existiert eine Lösung mit u(0) = 1 (nämlich u(x) = x2 − 1) und eine
Lösung mit u(0) > 1 (nämlich (5.14) mit r = r1 , da r2 = 0).
5
3
4
u(0)
3
2
2
1
1
0
0
2
4
λ
6
8
10
Abbildung 5.3: Temperatur am Äquator u(0) in Abhängigkeit des Parameters λ (ε = 0.25).
Das Problem (5.10) und damit auch (5.9) ist also nicht eindeutig lösbar. Die Multiplizität der Lösungen in Abhängigkeit des Parameters λ läßt sich gut durch den Wert
u(0) illustrieren, da u(0) das Maximum von u ist (Abbildung 5.3). Wir können die in
Abbildung 5.3 dargestellte Kurve in drei Gebiete unterteilen:
Gebiet 1: Die Erde ist vollständig eisbedeckt.
Gebiet 2: Wegen r2 < (1 − ε)/(2 − ε) < 1/2 ist die Erde in (r2 , 1) überwiegend
eisbedeckt.
Gebiet 3. Wegen r1 → 1 (λ → ∞) ist die Erde (zumindest für genügend großes
λ > λ1 ) wenig eisbedeckt. In der Nähe der Pole liegt Eis.
Physikalisch entspricht die Mehrdeutigkeit von Lösungen instabilen Situationen. Nehmen wir etwa an, daß der aktuelle Zustand der Erde dem Parameter λ & λ1 entspricht.
Bei Verminderung der Solarkonstanten (oder allgemeiner der Absorptionsfähigkeit infolge
von Wolken oder Smog) kann sich der Parameter λ auf einen Wert kleiner als λ1 einstellen. Dies würde bedeuten, daß die Eisgrenze innerhalb kurzer Zeit den Äquator erreichen
140
würde. Eine sehr kleine Änderung eines Parameters, der sich in der Nähe eines kritischen
Wertes befindet, kann also einschneidende Auswirkungen zur Folge haben.
5.3
Selbstentzündung von Kohlehaufen
Bei der Lagerung von Materialien wie Altpapier, Haushaltsmüll oder Kohle in großen
Mengen kann es nach längerer Zeit zu spontaner Selbstentzündung kommen. Betroffen
von diesem Problem sind etwa Mülldeponien und Kohlekraftwerke. Wir wollen uns auf
Kohlehaufen konzentrieren und die folgende Fragestellung untersuchen:
Frage: Nach welche Kriterien kann man entscheiden, ob ein Kohlehaufen “sicher” ist,
d.h. keine spontane Selbstentzündung erfährt?
Wodurch wird die spontane Selbstentzündung ausgelöst? Im allgemeinen geschieht
die Aufheizung nicht nur durch direkte Sonneneinstrahlung, sondern hauptsächlich durch
Oxidation von Kohlenstoff C zu Kohlenmonoxid CO oder Kohlendioxid CO2 :
C + O → CO + Energie,
C + 2O → CO2 + Energie.
Die Reaktionen sind exotherm, d.h., es entsteht Wärmeenergie. Überschreitet diese eine
vom Material abhängige Schranke, kommt es zu der Selbstentzündung.
Da die dreidimensionale Geometrie eines Kohlehaufens (insbesondere die Größe und
Verteilung der Kohlepartikel) und die präzisen chemischen Reaktionen sehr kompliziert
sind, beschränken wir uns auf einen vertikalen, eindimensionalen Schnitt x ∈ [0, h] durch
den Kohlehaufen und modellieren die Temperatur θ(x, t) durch die Wärmeleitungsgleichung mit Quellterm Q:
x ∈ (0, h),
%cθt = λθxx + Q(θ),
t > 0.
(5.22)
Hierbei beschreibt x = 0 den Boden und x = h die Spitze des Haufens, % > 0 ist die
homogene Dichte des Materials, c > 0 seine spezifische Wärme und λ > 0 seine Wärmeleitfähigkeit. Wir nehmen an, daß der Kohlehaufen zur Zeit t = 0 die Umgebungstemperatur hat:
e
θ(x, 0) = θ(x),
x ∈ (0, h).
(5.23)
Am Boden herrsche vereinfachend keine Wärmeleitung und an der Spitze die Umgebungstemperatur. Dies führt auf die Randbedingungen
θx (0, t) = 0,
θ(h, t) = θ0 ,
t > 0.
(5.24)
Wir sind vornehmlich am Langzeitverhalten der Temperatur interessiert. Der Kohlehaufen ist “sicher”, wenn die Temperatur für alle Zeiten kleiner als die Zündtemperatur ist.
141
Da diese wesentlich größer als die Umgebungstemperatur ist, muß die Temperatur eines
“unsicheren” Haufens in einem endlichen Zeitraum sehr groß werden. Nun erwarten wir
keine Abkühlungsmechanismen, d.h., die Temperatur als Lösung von (5.22)–(5.24) wird
unendlich groß nach endlicher Zeit, und das Modell (5.22)–(5.24) verliert seine Gültigkeit.
In diesem Fall können keine Lösungen des stationären Modells existieren. Damit haben
wir ein Kriterium für die “Sicherheit” des Kohlehaufens gefunden: Der Haufen gilt als
“sicher”, wenn es Lösungen des stationären Problems
λθxx = −Q(θ),
x ∈ (0, h),
(5.25)
mit den Randbedinungen (5.24) gibt, für die θ(x) nicht wesentlich größer als θ0 ist. Andernfalls ist der Haufen als kritisch einzustufen.
Es bleibt der Reaktionsterm Q zu modellieren. Wir erwarten, daß die Reaktion umso
größer ist, je größer die Temperatur des Haufens ist. Das einfachste Modell ist der lineare
Zusammenhang
mit α > 0, θ > 0.
Q(θ) = α(θ − θ)
Die allgemeine Lösung von
α
(θ − θ)xx = θxx = − (θ − θ)
λ
lautet wegen α/λ > 0
θ(x) − θ = A sin
µr
¶
µr ¶
α
α
x + B cos
x .
λ
λ
Einsetzen des Randbedingungen liefert
r
α
A,
λ
µr ¶
α
θ0 − θ = (θ − θ)(h) = B cos
h
λ
0 = θx (0) = (θ − θ)x (0) =
und damit
p
cos( α/λx)
p
θ(x) = (θ0 − θ)
+ θ,
cos( α/λh)
x ∈ [0, h].
Das Problem (5.24)–(5.25) ist also immer lösbar, d.h., alle Kohlehaufen sind sicher. Dies
widerspricht der Erfahrung. Der Reaktionsterm sollte also besser modelliert werden.
Ein genaueres Bild ist das folgende: Für niedrige Temperaturen sind die chemischen
Reaktionen vernachlässigbar; wird eine gewisse Aktivierungstemperatur erreicht, kommen
die Reaktionen in Gang. Für sehr große Temperaturen ist die Stärke der Reaktionen
allerdings begrenzt. Dies wird durch den Reaktionsterm von Arrhenius
Q(θ) = Ae−E/Rθ
142
(5.26)
beschrieben, wobei E die Aktivierungsenergie, R die universelle Gaskonstante und A die
Reaktionswärme ist.
Wir können das Problem (5.24)–(5.25) mit dem Reaktionsterm (5.26) analytisch lösen,
wenn wir die Annahme, daß die Temperatur nahe bei der Umgebungstemperatur liegen
soll, verwenden:
θ(x) = θ0 (1 + εT (x)),
ε ¿ 1.
Mit der Taylorentwicklung
µ
¶
¡
¢
1
exp −
= exp −1 + εT + O(ε2 ) ≈ exp(−1 + εT )
1 + εT
erhalten wir aus (5.24)–(5.26)
λεθ0 Txx
·
¸
E
= −Aexp −
(1 − εT ) ,
Rθ0
Tx (0) = 0,
Wir definieren
ψ(x) :=
x ∈ (0, h),
T (h) = 0.
Eε
T (x),
Rθ0
q :=
AE −E/Rθ0
.
e
λRθ02
Dann folgt aus
AEε −E/Rθ0 (Eε/Rθ0 )T
Eε
Txx = −
e
e
Rθ0
Rθ0
die Differentialgleichung für ψ:
λεθ0
ψxx + qeψ = 0,
x ∈ (0, h),
ψx (0) = ψ(h) = 0.
(5.27)
Multiplikation von (5.27) mit ψx ergibt
¶
µ
d 1 2
ψ
=0
ψ + qe
dx 2 x
und nach Integration
1 2
ψx (x) + qeψ(x) = qeψ(0)
2
oder
ψx (x) = −
p p
2q eψ(0) − eψ(x) .
Das Minuszeichen steht, weil ψ(x) wegen (5.28), d.h.
eψ(x) ≤ eψ(0)
oder
ψ(x) ≤ ψ(0) für alle x ∈ [0, h],
und wegen ψxx = −qeψ < 0 monoton fallend ist. Wir integrieren ein zweites Mal:
Z ψ(x)
Z xp
dy
√
2q dy.
=−
eψ(0) − ey
0
h
143
(5.28)
Mit der Substitution z = e−y/2 und dy = −2dz/z sowie der Abkürzung z0 := e−ψ(0)/2 folgt
p
2q(x − h) =
Z
e−ψ(x)/2
2dz
p
z eψ(0) − 1/z 2
1
Z
1
z dz
p 0
z 2 − z02
e−ψ(x)/2
µ ¶¸1
·
z
−1
= −2z0 cosh
z0 e−ψ(x)/2
·
µ ¶
µ −ψ(x)/2 ¶¸
1
e
−1
−1
= −2z0 cosh
− cosh
.
z0
z0
= −2
(5.29)
Diese Gleichung definiert die Lösung ψ(x) implizit für gegebenes ψ(0). Da ψ monoton
fallend auf [0, h] ist, wird die maximale Temperatur an der Stelle x = 0 angenommen. Die
Temperatur an x = 0 lautet wegen (5.29) und cosh−1 (1) = 0
p
− 2qh = −2e−ψ(0)/2 cosh−1 (eψ(0)/2 )
oder
cosh
µr
α
q ψ(0)/2
he
2
α
1
¶
0
α
= eψ(0)/2 .
2
1
x
0
x
0
Abbildung 5.4: Die Gleichung cosh(αx) = x besitzt keine (α1 ), genau eine (α0 ) oder zwei
(α2 ) Lösungen, wobei α2 < α0 < α1 .
p
Setze α := q/2h. Die Gleichung cosh(αx) = x besitzt keine Lösung, wenn α hinreichend
groß ist, und zwei Lösungen, wenn α hinreichend klein ist (Abbildung 5.4). Es existiert
also ein kritischer Wert α0 , bei dem die nichtlineare Gleichung genau eine Lösung x0
besitzt. Die Werte x0 und α0 bestimmen wir aus den beiden Gleichungen
x0 = cosh(α0 x0 ),
1=
d
cosh(α0 x)|x=x0 = α0 sinh(α0 x0 ).
dx
144
Aus der zweiten Gleichung folgt
1
x0 =
sinh−1
α0
µ
1
α0
¶
.
Setzen wir dies in die erste Gleichung ein, erhalten wir
1
sinh−1
α0
µ
1
α0
¶
µ
= cosh sinh−1
µ
1
α0
¶¶
=
s
1
+ 1,
α02
denn aus cosh2 (x) = − sinh2 (x) = 1 für alle x ∈ R folgt
q
q
√
2
−1
2
x + 1 = sinh (sinh (x)) + 1 = cosh2 (sinh−1 (x)) = cosh(sinh−1 (x)).
Der kritische Wert α0 ist also die eindeutige Lösung von
q
1
= sinh α02 + 1.
α0
Die Lösung lautet α0 ≈ 0.6627. Das Problem hat keine Lösung für α > α0 . In diesem Fall
ist der Kohlehaufen kritisch.
Wir fassen zusammen: Der Kohlehaufen ist kritisch, wenn
α2 =
qh2
AEh2 −E/Rθ0
=
> α02 ≈ 0.439.
e
2
2λRθ02
Es sind also die folgenden Fälle zu vermeiden:
zu hohe Kohlehaufen (h “groß”);
zu starke Reaktionen (A “groß”);
zu geringe Wärmeleitfähigkeit (λ “klein”).
Der Einfluß der Aktivierungsenergie E und der Umgebungstemperatur θ0 sind geringer,
da
E −E/Rθ0
e
≤ e−1 ≈ 0.368
Rθ0
für alle E > 0, θ0 > 0 gilt.
5.4
Elektronenverteilung in Halbleitern
In Abschnitt 2.5 haben wir Netzwerke, die Halbleiterbauelemente wie z.B. einen Transistor
enthalten, modelliert. Ziel dieses Abschnittes ist die Modellierung derartiger Bauelemente.
Dabei wollen wir die folgende Frage beantworten:
145
Frage: Wie sind die Elektronen in einem Halbleiterbauteil räumlich verteilt?
Was sind Halbleiter? Halbleiter sind Materialien mit einer wesentlich höheren elektrischen Leitfähigkeit als Isolatoren (z.B. Porzellan oder Gummi) und mit einer wesentlich
geringeren Leitfähigkeit als Metalle (z.B. Eisen oder Kupfer). Beispiele für Halbleitermaterialien sind Silizium, Germanium und Galliumarsenid. Zur Erhöhung der Leitfähigkeit
werden Halbleiter gezielt mit Fremdatomen dotiert; diese Atome werden durch einen Diffusionsprozeß in dem Halbleiter verteilt. Welchen Effekt hat die Dotierung? Nehmen wir
an, jedes Atom des Halbleitermaterials habe vier Elektronen auf der äußersten Elektronenschale um den Atomkern (z.B. Silizium); man nennt sie Valenzelektronen. Jedes Valenzelektron geht eine Bindung (die sogenannte Valenzbindung) mit einem Valenzelektron
eines umliegenden Atoms ein. Die Atome samt diesen Bindungen bilden den Halbleiterkristall. Das Fremdatom (z.B. Phospor) habe fünf äußere Elektronen. Vier dieser Elektronen
gehen Valenzbindungen mit den Valenzelektronen der umliegenden Halbleiteratome ein;
das übriggebleibende Elektron wird nicht gebunden und steht für den Ladungstransport
zur Verfügung (Abbildung 5.5). Das übrigbleibende Fremdatom ist dann positiv geladen.
Die Zufuhr von Energie in Form von Wärme oder Licht etwa führt dazu, daß Valenzbindungen aufgebrochen werden und die entsprechenden Elektronen ebenfalls für den
Ladungstransport zu Verfügung stehen. Allerdings ist die hierfür benötigte Energie sehr
viel größer als die, die benötigt wird, das übrigbleibende Valenzelektron vom Fremdatom
zu lösen.
Si
Si
Si
Si
Ph
Si
Abbildung 5.5: Halbleiterkristall aus Siliziumatomen mit einem Phosphoratom. Die kleinen Kreise stellen Elektronen mit ihren Valenzbindungen dar.
Die totale Ladungsdichte % besteht also aus zwei Quellen: den negativ geladenen Elektronen und den positiv geladenen Atomrümpfen. Bezeichnet n(x, t) die Elektronendichte
am Ort x zur Zeit t und C(x) die Dichte der Atomrümpfe (auch Dotierungsprofil genannt),
so gilt:
% = −qn + qC,
(5.30)
146
wobei q die Elementarladung ist. Wir haben hier angenommen, daß sich die Dotierungskonzentration nicht zeitlich ändert.
Die totale Ladungsdichte erzeugt ein elektrisches Feld. Andererseits erzeugt ein zeitlich
variierendes elektrisches Feld ein Magnetfeld. Beide zusammen verändern wieder die totale
Ladungsdichte. Das elektrische Feld E und das Magnetfeld B werden beschrieben durch
die Maxwell-Gleichungen
ε0 divE = %,
divB = 0,
rotE = −
∂B
,
∂t
µ
rotB = µ0
∂E
Jtot + ε0
∂t
¶
.
Hierbei ist Jtot = Jtot (x, t) die Stromdichte, die mit der totalen Ladungsdichte über die
Kontinuitätsgleichung ∂%/∂t + divJtot = 0 in Beziehung steht. Die Konstanten ε0 bzw. µ0
sind Proportionalitätskonstanten und werden als Dielektrizitätskonstante bzw. Permeabilität bezeichnet. Sie sind im allgemeinen materialabhängig. Wir nehmen nun an, daß die
zeitliche Variation des Magnetfeldes vernachlässigt werden kann: ∂B/∂t = 0. Dann folgt
aus
∂B
rotE = −
= 0,
∂t
falls das Gebiet, in dem sich der Halbleiterkristall befindet, einfach zusammenhängend
ist, die Existenz einer Potentials φ = φ(x, t), so daß
E = −∇φ.
Wegen der obigen Voraussetzung nennen wir φ das elektrostatische Potential. Aus der
ersten Maxwell-Gleichung und (5.30) folgt die Gleichung für φ:
ε0 ∆φ = q(n − C).
(5.31)
Nun fehlt noch eine Bewegungsgleichung für die Elektronendichte (das Dotierungsprofil ist gegeben und zeitunabhängig). Wir nehmen an, daß die Elektronendichte durch eine
Variante der Euler-Gleichungen (4.26)–(4.27) mit konstanter Temperatur θ = k B T0 /m
gegeben sei:
∂t n + div(nu) = 0,
nu
∂t (nu) + div(nu ⊗ u) + ∇(nθ) − nF = − .
τ
(5.32)
(5.33)
Die physikalischen Konstanten sind die Boltzmann-Konstante kB , die Elektronenmasse
m und die Relaxationszeit τ . Der Term auf der rechten Seite von (5.33) beschreibt das
Bestreben des Systems, in Abwesenheit äußerer Kräfte gegen den Gleichgewichtszustand
nu = 0 zu streben (oder zu relaxieren). Die typische Zeit, in der dies geschieht, ist gerade
147
τ . Die äußere Kraft ist durch das elektrische Feld gegeben: F = −qE/m. Definieren wir die
Elektronenstromdichte J durch J = −qnu, so erhalten wir aus (5.32)–(5.33) und (5.31)
die hydrodynamischen Halbleitergleichungen:
1
∂t n − divJ = 0,
q
1
∂t J − div
q
µ
J ⊗J
n
¶
(5.34)
qkB T0
q2
J
−
∇n + n∇φ = − ,
m
m
τ
(5.35)
ε0 ∆φ = q(n − C).
(5.36)
Diese Gleichungen sind im Halbleitergebiet Ω ⊂ R3 mit geeigneten Rand- und Anfangsbedingungen zu lösen.
Um die Gleichungen zu vereinfachen, skalieren wir sie. Wir wählen eine typische Teilchendichte, eine typische Länge und ein typisches Potential:
C = sup |C(x)|,
L = diam(Ω),
UT =
x∈Ω
k B T0
.
q
Bei Raumtemperatur T0 = 300 K beträgt UT ≈ 0.026 V. Als typische Zeit wählen wir
eine noch zu spezifizierende Konstante τ0 . Damit erhalten wir die Skalierung
n = Cns ,
C = CCs ,
φ = U T φs ,
x = Lxs ,
t = τ 0 ts .
Aus der Poisson-Gleichung (5.36) folgt
λ2 ∆φ = n − C
mit der skalierten Debye-Länge
λ=
s
(5.37)
ε0 U T
.
qL2 C
Die Gleichung (5.34) kann geschrieben werden als
∂t s ns −
τ0
divs J = 0.
qLC
Damit die Kontinuitätsgleichung dimensionslos wird, müssen wir die Stromdichte gemäß
J=
qLC
Js
τ0
skalieren:
∂ts ns − divs Js = 0.
148
(5.38)
Für die Skalierung der verbleibenden Gleichung (5.35) setzen wir für den Quotienten
aus kinetischer Energie m(L/τ0 )2 , die erforderlich ist, damit ein Elektron des Halbleitergebiet in der Zeit τ0 durchquert, und thermischer Energie kB T0 :
m(L/τ0 )2
ε=
.
k B T0
Dann folgt aus (5.35)
qLC
qLC
∂ts Js − 2 divs
2
τ0
τ0
µ
Js ⊗ J s
ns
¶
−
qkB T0 C
qkB T0 C
qLC
∇ s ns +
ns ∇ s φ s = −
Js .
mL
mL
τ0 τ
Definieren wir τ0 = mL2 /τ kB T0 , so erhalten wir nach Division von qkB T0 C/mL
¶
µ
Js ⊗ J s
2
2
ε ∂ts Js − ε divs
− ∇s ns + ns ∇s φs = −Js .
ns
Im folgenden lassen wir den Index “s” fort. Wir nehmen an, daß die thermische Energie
kB T0 die kinetische Energie m(L/τ )2 dominiert, d.h. ε ¿ 1. Wir sind an der reduzierten
Gleichung ε = 0 interessiert. Aus
−∇n + n∇φ = −J
(5.39)
und (5.37)–(5.38) folgen dann die Drift-Diffusionsgleichungen für Halbleiter:
∂t n − div(∇n − n∇φ) = 0,
(5.40)
λ2 ∆φ = n − C,
x ∈ Ω, t > 0.
(5.41)
Dies ist ein System nichtlinearer Gleichungen, die die zeitliche Entwicklung der Elektronendichte n und des elektrostatischen Potentials φ beschreiben. Die parabolische Gleichung (5.40) ist zu vervollständigen mit der Anfangsbedingung
n(0, x) = n0 (x),
x ∈ Ω.
(5.42)
Welche Randbedingungen sind für (5.40)–(5.41) vorzuschreiben? Wir nehmen an, daß
der Rand ∂Ω aus zwei Teilen besteht: Auf dem Teil ΓD seien die Elektronendichte und
das Potential gegeben:
n = nD ,
φ = φD
auf ΓD , t > 0.
(5.43)
Der andere Teil ΓN = ∂Ω\ΓD modelliere isolierende Ränder, d.h., die Normalkomponenten
der Stromdichte und des elektrischen Feldes verschwinden auf ΓN :
J · ν = ∇φ · ν = 0
149
auf ΓN , t > 0.
Aus der Beziehung (5.39) für J folgt, daß dies äquivalent ist zu der Bedingung
∇n · ν = ∇φ · ν = 0,
auf ΓN , t > 0.
(5.44)
Es bleiben die Randwerte nD und φD zu bestimmen. Dazu treffen wir die folgenden
Annahmen:
Die totale Ladungsdichte verschwinde auf ΓD : nD − C = 0.
Das Randpotential ist die Summe aus dem Built-in-Potential φbi und der angelegten
Spannung U : φD = φbi + U .
Das Built-in-Potential ist das Randpotential, das sich im thermischen Gleichgewicht J = 0
einstellt. Um es zu berechnen, müssen wir das thermische Gleichgewicht etwas genauer
untersuchen. Aus (5.40)–(5.41) folgt für J = 0, daß n nur eine Funktion des Ortes ist und
daß
0 = ∇n − n∇φ = n∇(ln n − φ)
in Ω.
Gilt n > 0 (was physikalisch zu erwarten ist), so ist
ln n − φ = const.
Das Potential ist nur bis auf eine additive Konstante bestimmt, und wir wählen die Konstante so, daß ln n − φ = 0 in Ω. Das Built-in-Potential ist dann gegeben durch
φbi = ln nD = ln C
auf ΓD .
Damit ist das Anfangsrandwertproblem (5.40)–(5.44) vollständig definiert.
Es ist sehr schwierig, explizite Lösungen für (5.40)–(5.44) zu erhalten, und im allgemeinen ist man auf numerische Methoden angewiesen. Allerdings ist es in bestimmten Fällen
möglich, Aussagen über das qualitative Verhalten der Lösungen zu erhalten. Im allgemeinen wird man als Anfangswert n0 die Lösung des thermischen Gleichgewichts wählen, da
diese einem Halbleiter mit verschwindender angelegter Spannung entspricht. Das thermische Gleichgewicht wollen wir daher noch eingehender untersuchen. Aus den obigen
Überlegungen folgt, daß eine Lösung (n, φ) des thermischen Gleichgewichts gegeben ist
durch
λ2 ∆φ = eφ − C,
n = eφ in Ω,
(5.45)
φ = ln C
auf Γ0 ,
∇φ · ν = 0 auf ΓN .
In Halbleiterbauteilen variiert das Dotierungsprofil im allgemeinen sehr stark mit großen
Gradienten. Idealisierend können wir etwa annehmen, daß
(
C1 : x ∈ Ω 1
C(x) =
C2 : x ∈ Ω 2
150
gilt, wobei Ω = Ω1 ∪ Ω2 und 0 < C1 ¿ C2 . Dies bedeutet, daß die rechte Seite von (5.45)
fast unstetig ist. Zudem ist der Parameter λ typischerweise sehr klein im Vergleich zu
Eins. Mit den typischen Werten
L = 10−6 m,
C = 1023 m−3 ,
UT = 0.026V
ε0 = 1.05 · 10−10 As/Vm,
q = 1.60 · 10−19 As,
folgt
λ2 = 1.35 · 10−4 ¿ 1.
Die reduzierte Gleichung λ = 0 lautet dann eφ − C = 0, d.h.
φ(x) = ln C(x),
n(x) = C(x),
x ∈ Ω,
sind unstetige Funktionen. Wir erwarten, daß die Gradienten von n und φ auch im allgemeinen Fall λ > 0 und U > 0 (positive angelegte Spannung) sehr groß sind. Dies führt zu
numerischen Schwierigkeiten, die nur durch den Einsatz spezieller Methoden in den Griff
zu bekommen sind.
Literatur
[1] A. Georgescu: Asymptotic treatment of differential equations. Chapman & Hall, London, 1995.
[2] E. Hairer, G. Wanner: Solving Ordinary Differential Equations II. Springer, Berlin,
2002.
[3] M. Hanke-Bourgeois: Grundlagen der Numerischen Mathematik und des wissenschaftlichen Rechnens. Teubner, Stuttgart, 2002.
[4] H. Heuser: Gewöhnliche Differentialgleichungen. Teubner, Stuttgart, 1989.
[5] M. Hochbruck, J.-M. Sautter: Mathematik fürs Leben am Beispiel der Computertomographie. Erscheint in Mathematische Semesterberichte, 2003.
[6] S. Howison: Cusp development in Hele-Shaw flow with a free surface. SIAM J. Appl.
Math. 46 (1986), 20-26.
[7] C. Schmeiser: Angewandte Mathematik. Vorlesungsskript, TU Wien,
www.anum.tuwien.ac.at/schmeiser.
[8] S. Wiggings: Introduction to Applied Nonlinear Dynamical Systems and Chaos. Springer, New York, 1990.
151
Herunterladen