Mathematik I - IV für Elektrotechniker, Maschinenbauer und Mechatroniker Skript zur Vorlesung Mathematik IV (Oberflächenintegrale, Vektoranalysis, Variationsrechnung, partielle Differentialgleichungen, Wahrscheinlichkeitsrechnung) Doz. Dr. Harald Abeßer 15–2 Vorwort Dieses Vorlesungsskript bezieht sich auf das vierte Semester einer viersemestrigen Mathematikvorlesung für Studenten der Fachrichtungen Elektrotechnik, Maschinenbau und Mechatronik. Sie ist als studienbegleitendes Material gedacht. Die Arbeit mit einem Skript kann nur ein Mittel zur Erreichung des Studienzieles sein. Vorlesungsbesuch, selbstständiges und regelmäßiges Rechnen von Übungsaufgaben sowie die Arbeit mit Lehrbüchern sind daneben unerläßlich. Auf studentischen Wunsch sollte aus einer großen Anzahl guter Bücher zur Ingenieurmathematik eines ausgewählt werden, an welches sich die Vorlesung anlehnt. Ich habe ausgewählt: Höhere Mathematik I und II von Meyberg/Vachenauer, Springer-Verlag. Nach zweijähriger Arbeit mit einem Vorlesungsskript lassen sich diverse Vor- und Nachteile erkennen. Zu den Vorteilen zähle ich: (1) Einige Informationen aus der Vorlesung (Motivationen, Bemerkungen, Übergänge und Beispiele), die Studenten der ersten Semester z. T. nur unvollkommen auf das Papier bringen, können zu Hause in aller Ruhe aufgearbeitet werden. (2) Für manche Studenten, die die Arbeit mit den Lehrbuch (noch) scheuen, ist die Arbeit mit einem Skript eine erste Beschäftigung mit wissenschaftlichen Texten. (3) Eine Entlastung von der Mitschreibearbeit schafft Raum zum Mitdenken und eigene Überlegungen. Nachteile sind: (1) Ein Skript kann eine gewisse Unselbstständigkeit befördern. (2) Für einige Studenten ersetzt der Besitz eines Skriptes den Besuch einer Vorlesung und mit dem Erwerb desselben hört das Bemühen (Studieren) auf. (3) Die durch das Vorliegen eines Skriptes in der Vorlesung gewonnene Zeit wird dort zur außerplanmäßigen Konversation mit allen Nachbarn genutzt. Ingesamt denke ich, überwiegen die Vorteile, insbesondere für zielstrebige Studenten. Fachliche Anfragen und Druckfehlerlisten zeigen, daß es genügend Studenten gibt, die mit dem Skript arbeiten und ihren Nutzen daraus ziehen. Für die Mithilfe beim Auffinden von Druckfehlern möchte ich einigen Studenten herzlich danken. Bedanken möchte ich mich auch bei Frau K. Knabe für das mühevolle Schreiben des größeren Teiles des Skriptes in Latex und bei Frau G. Käppler für die technische Herstellung der Zeichnungen und Skizzen. Ilmenau, November 2002 Harald Abeßer 15–3 Aus der Denkschrift der GAMM “Zur Mathematikausbildung der Ingenieure an Wissenschaftlichen Hochschulen” 1982 Grundsätzlich ist es notwendig, den logischen Charakter der Mathematik auch in der Ingenieurausbildung den Studenten nahezubringen. Dementsprechend kann und darf die Mathematik nicht als eine Sammlung von Formeln (“Kochrezepten”) vermittelt werden, sondern die Studenten müssen in vertretbarem Rahmen auch mit mathematischen Schlußweisen und mit instruktiven Beweisen vertraut gemacht werden. Allerdings reden wir hier nicht einer beweisvollständigen Höheren Mathematik das Wort, sondern einer sorgfältig erwogenen, sinnvollen und dem willigen Studenten einsichtigen, exemplarischen Darstellung. Eine strikte logische Entwicklung eines Themas nur als eine Reihe von Definitionen, Sätzen, Beweisen wäre dem Ingenieurstudenten unangemessen, der eher einer geometrischanschaulichen als einer logisch-abstrakten Denkweise zuneigt. Ihm leuchten Zusammenhänge und Methoden eher am Einzelfall denn am allgemeinen Fall ein; häufig wird die Aussage eines Satzes durch abgrenzende Beispiele besser beleuchtet als durch einen vollständigen Beweis. Es ist also eine Vermittlung der Mathematik erforderlich, bei der mit exemplarischen Beweisen der logische Aspekt mathematischer Analyse und Aussage gezeigt wird, bei der man sich aber auch nicht scheut, häufig mit heuristischen Überlegungen und Plausibilitätsargumenten zu arbeiten. Quelle: GAMM, Bd. 20, H2, 1997 15–4 Inhaltsverzeichnis 16 Oberflächenintegrale 16.1 Flächen im R3 . . . . . . . . . . . . . . . . . 16.2 Oberflächenintegral für eine skalare Funktion 16.3 Oberflächenintegrale für ein Vektorfeld . . . . 16.4 Zusatz: Landkarten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16–7 . 16–7 . 16–16 . 16–19 . 16–25 17 Vektoranalysis 17.1 Felder und Differentialoperatoren . . . . . . . . . . . . . . . . . . . . . . 17.2 Integralsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17.3 Differentialoperatoren und Koordinatentransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17–33 . . 17–33 . . 17–40 18 Variationsrechnung 18.1 Problemstellung an Beispielen . . . . . . . . . . . . . . . . . . . . . . . . 18.2 Das Festrandproblem der Variationsrechnung . . . . . . . . . . . . . . . 18.3 Problemerweiterungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18–65 . . 18–65 . . 18–67 . . 18–79 19 Partielle Differentialgleichungen 19.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . 19.2 Lineare partielle Differentialgleichungen 1. Ordnung 19.3 Klassifikation der quasilinearen pDGL 2. Ordnung . 19.4 Parabolische partielle Differentialgleichung . . . . . . 19.5 Hyperbolische partielle Differentialgleichung . . . . . 19.6 Elliptische partielle Differentialgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19–85 . . 19–85 . . 19–89 . . 19–95 . . 19–103 . . 19–108 . . 19–115 20 Wahrscheinlichkeitsrechnung 20.1 Zufällige Ereignisse . . . . . . . . . . . . . 20.2 Wahrscheinlichkeit . . . . . . . . . . . . . 20.3 Zufallsvariable und Verteilungsfunktionen 20.4 Einige spezielle Verteilungsfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20–125 . . . 20–125 . . . 20–128 . . . 20–134 . . . 20–145 15–5 . . . . . . . . . . . . . . . . . . . . . . . . . . 17–57 15–6 INHALTSVERZEICHNIS Kapitel 16 Oberflächenintegrale Gegeben sei ein Flächenstück S im R3 , (Abb. 16.1). z y S x Abbildung 16.1: Flächenstück Im Zusammenhang mit diesem Flächenstück lassen sich zwei Typen von Oberflächenintegralen definieren: (1) Falls auf S eine skalare Funktion f (x, y, z) gegeben ist (z.B. Ladungsdichte, Massedichte), kann ein Oberflächenintegral 1.Art erklärt werden. Mit diesem wird dann z.B. die Ladung auf S, die Masse von S und für f ≡ 1 der Inhalt von S berechnet. (2) Falls auf S ein Vektorfeld ϕ : R3 → R3 gegeben ist (z.B. das Geschwindigkeitsfeld einer Flüssigkeitsströmung), so kann man ein Oberflächenintegral 2.Art einführen und damit z.B. die Flüssigkeitsmenge berechnen, die pro Zeiteinheit in Richtung des Normalenvektors durch S strömt. 16.1 Flächen im R3 Flächendarstellung: Sei D ⊂ R2 ein Bereich des R2 , w : D → R3 mit x(u, v) w(u, v) = y(u, v) , (u, v) ∈ D. z(u, v) 16–7 16–8 KAPITEL 16. OBERFLÄCHENINTEGRALE Dann heißt S = {w = (x, y, z)T : w = w(u, v), (u, v) ∈ D} Flächenstück in Parameterdarstellung. (u, v) sind die Parameter der Flächendarstellung und D heißt Parameterbereich, Abb. 16.2. v z D w y u S x Abbildung 16.2: Eine zweite Möglichkeit der Flächendarstellung ist die explizite Flächendarstellung des Flächenstücks S: Für einen Bereich G ⊂ R2 g : G → R1 , z = g(x, y), (x, y) ∈ G ist S gegeben durch S:=graph g, Abb. 16.3. S z y x G Abbildung 16.3: Flächenstück S Bemerkung: Die Parameterdarstellung ist die allgemeinere Darstellung für ein Flächenstück S. Mit ihr ist z.B. auch die Darstellung von vertikalen Flächenstücken (Zylindermantel u.ä.) möglich. Eine explizite Flächendarstellung läßt sich immer auch als Parameterdarstellung schreiben: x , y S = {w =: w(x, y) = g(x, y) (x, y) ∈ G}. Beispiel 16.1 (Zylindermantel, r0 > 0 fest) 16.1. FLÄCHEN IM R3 16–9 x r0 cos ϕ (1) D = [0, 2π] × [−1, 1], (u, v) := (ϕ, z), w = y = r0 sin ϕ , Abb. 16.4, z z S = {w : w = w(ϕ, z), (ϕ, z) ∈ D}. z z 1 1 w D y S 2π ϕ x Abbildung 16.4: Parameterdarstellung der Mantelfläche eines Zylinders x r cos ϕ (2) D = [0, 1] × [0, 2π], (u, v) := (r, ϕ), w = y = r sin ϕ , Abb. 16.5 z 1 S = {w : w = w(r, ϕ), (r, ϕ) ∈ D}, z r w D 1 1 y S 2π ϕ x Abbildung 16.5: Parameterdarstellung einer Deckelfläche eines Zylinders Aufgabe: Deute diese Flächenstücke als Koordinatenflächen für die Zylinderkoordinaten. Beispiel 16.2 (Kegel) Gesucht ist die Parameterdarstellung für den Kegelmantel eines Kegels der Höhe b mit dem Radius a. Für das Schnittgebilde (Abb. 16.6) gilt z = − ab r + b. Hieraus ergibt sich mit einer Parameterwahl (u, v) = (r, ϕ) die Parameterdarstellung, Abb. 16.7: r cos ϕ w(u, v) = w(r, ϕ) = r sin ϕ , (r, ϕ) ∈ [0, a] × [0, 2π]. b(1 − ar ) 16–10 KAPITEL 16. OBERFLÄCHENINTEGRALE z b a r Abbildung 16.6: z r D b w a y 2π ϕ a x Abbildung 16.7: Kegelmantel Beispiel 16.3 (Kugel) Zur Erinnerung: Kugelkoordinaten (r, ϕ, ψ) wurden eingeführt in Verbindung mit einer Koordinatentransformation (x, y, z) ↔ (r, ϕ, ψ), Abb. 16.8: z ψ 1 0 P (x, y, z) y ϕ x Abbildung 16.8: Kugelkoordinaten (x, y, z)T = (r sin ψ cos ϕ, r sin ψ sin ϕ, r cos ψ)T . Eine Parameterdarstellung für die Kugeloberfläche S findet man mit Hilfe der Koordinatenfläche r = const. = r0 für die Kugelkoordinaten, Abb. 16.9): 16.1. FLÄCHEN IM R3 16–11 ψ z D π S y w x 2π ϕ Abbildung 16.9: Sphäre r0 sin ψ cos ϕ D = [0, 2π] × [0, π], (u, v) = (ϕ, ψ) ∈ D, w(ϕ, ψ) = r0 sin ψ sin ϕ . r0 cos ψ Definition 16.1 Sei D ein regulärer Bereich der (u,v)-Ebene, w ∈ C 1 (D), w : D → R3 , x(u, v) w(u, v) = y(u, v) . z(u, v) Falls w,u (u, v) × w,v (u, v) =: n(u, v) 6= 0 für alle (u, v) ∈ D und die Abbildung w eineindeutig ist ((u, v) 6= (ū, v̄) ⇒ w 6= w̄), ist das Flächenstück S = {w : w = w(u, v), (u, v) ∈ D} regulär (siehe auch Kap. 15.5). Diskussion: Der Vektor n(u, v) heißt Stellungsvektor oder Normalenvektor. Er steht senkrecht auf S in jedem Flächenpunkt. Dies läßt sich zeigen, indem man die Koordinatenlinien der Abbildung w(u, v) untersucht: Mit u = u0 folgt z.B. x(u0 , v) w(u0 , v) = y(u0 , v) , v ∈ [v0 , v1 ]. z(u0 , v) Dieses Bild der Koordinatenlinie u = u0 ist die Parameterdarstellung einer Kurve auf dem Flächenstück S; deren Tangente hat den Anstieg w,v (u0 , v0 ) im Punkt w0 = w(u0 , v0 ). Entsprechend ist der Anstieg der Bildkurve der Koordinatenlinie v = v0 dort gleich w,u (u0 , v0 ). Damit steht n(u0 , v0 ) = w,u (u0 , v0 ) × w,v (u0 , v0 ) senkrecht auf den Tangenten in w0 und damit auf S, Abb. 16.10. Ein infinitesimales Oberflächenstück O mit dem Inhalt dO läßt sich durch ein Parallelogramm P , dessen Seiten durch die Tangentenstücke w,u du und w,v dv gebildet werden, approximieren. Der Flächeninhalt |P | des Parallelogramms P ist durch |P | = |w,u du × w,v dv| = |n| du dv 16–12 KAPITEL 16. OBERFLÄCHENINTEGRALE v z n w v0 w,v y u0 w,u u x Abbildung 16.10: Normalenvektor z w(u0 , v) P O w(u0 + du, v) y w(u, v0 + dv) x w(u, v0 ) Abbildung 16.11: Approximation eines Flächenstücks O bestimmt, also gilt dO ∼ |n(u0 , v0 )| du dv. Die (infinitesimale) Approximation dO ∼ |n(u0 , v0 )| du dv, Abb. 16.11, führt unter Verwendung der entsprechenden Riemannsummen nach einem Grenzübergang (du → 0, dv → 0) auf: Definition 16.2 ZZ ZZ ZZ O=F = |w,u (u, v) × w,v (u, v)| du dv = |n(u, v)| du dv =: dO D D S ist ein Oberflächenintegral 1.Art zu einem Flächenstück S und gibt den Inhalt von S (Oberfläche) an. Bemerkung: (1) Es läßt sich zeigen, daß dieses Integral unabhängig von der gewählten Parameterdarstellung für RR das Flächenstück S ist. (2) O = S dO ist somit als spezielles ebenes Bereichsintegral über der (u, v)-Ebene aufzufassen. Beispiel 16.4 Berechne den Inhalt der Mantelfläche des Zylinders Z Z = {(r, ϕ, z), 0 ≤ r ≤ r0 , 0 ≤ ϕ ≤ 2π, −1 ≤ z ≤ 1}. 16.1. FLÄCHEN IM R3 16–13 (1) Parameterdarstellung der Mantelfläche: (ϕ, z) ∈ D := [0, 2π] × [−1, 1]. r0 cos ϕ w(ϕ, z) = r0 sin ϕ z (2) Stellungsvektor n = w,ϕ ×w,z −r0 sin ϕ 0 r0 cos ϕ n = r0 cos ϕ × 0 = r0 sin ϕ , |n| = r0 . 0 1 0 R 2π R 1 (3) Oberfläche: F = 0 −1 r0 dz dϕ = 4πr0 . (4) Durch Abwicklung des Zylinders in der Ebene wäre man hier natürlich elementargeometrisch schneller zum Ziel gekommen. Beispiel 16.5 (Inhalt des Kegelmantels) Die Parametrisierung r cos ϕ w(ϕ, r) = r sin ϕ , (ϕ, r) ∈ [0, 2π] × [0, a] b(1 − ar ) führt zum Stellungsvektor b cos ϕ −r sin ϕ − a r cos ϕ n = w,ϕ ×w,r = r cos ϕ × sin ϕ = − ab r sin ϕ 0 − ab −r q 2 und zu |n| = |w,ϕ ×w,r | = r2 ( ab 2 + 1). Der Mantelinhalt ist dann r Z 2πZ a r 2 b b2 a2 r F = + 1 dr dϕ = 2π + 1. 2 a 2 a2 0 0 Aufgabe: Bestimme den Mantelinhalt elementargeometrisch durch Abwicklung des Kegels in der Ebene. Diskussion: (1) Für eine explizite Flächendarstellung z = g(x, y), (x, y) ∈ D liefert die äquivalente Parameterdarstellung x , (x, y) ∈ D y w(x, y) = g(x, y) eine einfache Formel für den Flächeninhalt: Mit −g,x 0 1 n = w,x ×w,y = 0 × 1 = −g,y 1 g,y g,x 16–14 und |n| = KAPITEL 16. OBERFLÄCHENINTEGRALE q g,2x +g,2y +1 folgt ZZ q g,2x (x, y) + g,2y (x, y) + 1 dx dy. O= D (2) Unter Benutzung der Lagrangeidentität für die Beträge von Kreuzprodukten (|w,u ×w,v |2 = |w,u |2 |w,v |2 −(w,u , w,v )) ergibt sich für den Flächeninhalt eine Formel, die die sogenannten metrischen Fundamentalgrößen E := (w,u , w,u ), F := (w,u , w,v ), G := (w,v , w,v ) benutzt: ZZ p O= EG − F 2 du dv. D Hierin kommen statt der Kreuzprodukte von Vektoren die einfacheren Skalarprodukte zum Einsatz. (3) Oberflächenstück eines Rotationskörpers (Drehflächen) In der (x, z)-Ebene wird ein reguläres Kurvenstück K in Parameterdarstellung K: x(t) 0 , t ∈ [t0 , t1 ], x(t) > 0, z(t) betrachtet. Dieses Kurvenstück K erzeugt bei Drehung um die z-Achse eine Drehfläche mit 0 ≤ ϕ ≤ ϕ0 , ϕ0 ≤ 2π, Abb. 16.12. y P 00 11 ϕ Drehfläche x(t̄) x Schnitt durch die Drehfläche für t = t̄, z = z(t̄) = const. Abbildung 16.12: Drehflächen Hieraus ergibt sich die Parameterdarstellung für die Drehfläche x(t) cos ϕ w(t, ϕ) = x(t) sin ϕ , (t, ϕ) ∈ [t0 , t1 ] × [0, ϕ0 ] = D. z(t) 16.1. FLÄCHEN IM R3 Mit ẋ cos ϕ w,t = ẋ sin ϕ , ż 16–15 −x sin ϕ w,ϕ = x cos ϕ 0 ergeben sich die metrischen Fundamentalgrößen E = ẋ2 + ż 2 , F = 0 und G = x2 , woraus sich eine Oberflächenformel aufstellen läßt: ZZ p O= x2 (t)(ẋ2 (t) + ż 2 (t)) dt dϕ. D Die Koordinatenlinien auf der Drehfläche (ϕ=const. bzw. t=const.) heißen Meridiane bzw. Breitenkreise. Beispiel 16.6 Kugelfläche (Sphäre) Die Sphäre kann als Drehfläche aufgefaßt werden, die durch Rotation eines Meridians um die z-Achse erzeugt wird, Abb. 16.13. ψ K Abbildung 16.13: Die Sphäre als Drehfläche Die erzeugende Kurve K ist ein Halbkreis mit der Parameterdarstellung x(ψ) r sin ψ , ψ ∈ [0, π]. 0 w̄(ψ) = y(ψ) = z(ψ) r cos ψ Diese erzeugt eine Parameterdarstellung der Sphäre: r sin ψ cos ϕ w(ϕ, ψ) = r sin ψ sin ϕ , (ϕ, ψ) ∈ [0, 2π] × [0, π], r cos ψ r = const. . Nach kleiner Rechnung folgen hieraus die metrischen Fundamentalgrößen E = (w,ψ , w,ψ ) = r2 , F = (w,ψ , w,ϕ ) = 0, G = (w,ϕ , w,ϕ ) = r2 sin2 ψ. Dann läßt sich die Sphärenfläche leicht berechnen: ZZ p Z 2π Z π 2 O= EG − F dψ dϕ = r2 sin ψ dψ dϕ = 4πr2 . D 0 0 16–16 KAPITEL 16. OBERFLÄCHENINTEGRALE Beispiel 16.7 Torus (durch einen Kreis erzeugter Drehkörper), Abb. 16.14 z 1 0 0 1 ψ x 00 11 1 0 R+r −R y R Abbildung 16.14: Der Torus als Drehfläche Der erzeugende Kreis hat die Parameterdarstellung x(ψ) R + r sin ψ y(ψ) = , ψ ∈ [0, 2π]. 0 z(ψ) r cos ψ Für die Torusfläche ergibt sich hieraus die Parameterdarstellung (R + r sin ψ) cos ϕ w(ψ, ϕ) = (R + r sin ψ) sin ϕ , (ψ, ϕ) ∈ [0, 2π] × [0, 2π]. r cos ψ Die Fundamentalgrößen sind: E = r2 , F = 0 G = (R + r sin ψ)2 ; die Torusfläche wird: O= ZZ p Z EG − F 2 dψ dϕ = D 16.2 0 2πZ 2π r(R + r sin ψ) dψ dϕ = 4π 2 rR. 0 Oberflächenintegral für eine skalare Funktion Gegeben ist ein Flächenstück S mit einer skalaren Belegung, d.h. mit einer Funktion f : S → R1 . Die Funktion f kann z.B. f = µ(w), die Massedichte von S oder f = ²(w) die Ladungsdichte auf S sein. In diesen Fällen wäre die Masse von S b.z.w. die Ladung auf S gesucht. Für diese Aufgaben ist der folgende Integrationsbegriff geeignet: Definition 16.3 Betrachte ein reguläres Flächenstück S mit der Parameterdarstellung x(u, v) w : D ⊂ R2 → R3 , w(u, v) = y(u, v) , (u, v) ∈ D z(u, v) 16.2. OBERFLÄCHENINTEGRAL FÜR EINE SKALARE FUNKTION 16–17 und eine Funktion f : S ⊂ R3 → R1 (skalares Feld), f ∈ C 0 (S). Dann heißt das Integral ZZ ZZ I= f dO := f (x(u, v), y(u, v), z(u, v)) |w,u (u, v) × w,v (u, v)| du dv S D Oberflächenintegral von f über S. Bemerkungen: (1) Falls das Flächenstück S stückweise regulär und stetig ist, d.h. falls gilt: S = S1 ∪ ... ∪ Sm , Si regulär, Si ∩ Sj = N, i 6= j, i, j = 1...m, N Nullmenge, wird die Definition ergänzt durch: ZZ ZZ ZZ f dO := f dO + ... + f dO. S S1 (Bereichsadditivität) Sm (2) Das Integral ist linear bez. f und additiv bez. S. (3) Es läßt sich ein Mittelwertsatz beweisen. (4) I ist ein Oberflächenintegral 1.Art Anwendungen: RR (1) Für f (w) = µ(w) (Massedichte) ist M = S µ dO die Masse von S. RR Für f (w) = ε(w) (Ladungsdichte) ist L = S ² dO die Ladung auf S. (2) Die k-ten Momente des Flächenstücks bez. der entsprechenden Ebenen sind: ZZ Myz,k = xk µ(x, y, z) dO S ZZ Mzx,k = y k µ(x, y, z) dO S ZZ Mxy,k = z k µ(x, y, z) dO. S Für k = 1 ist auch die Bezeichnungen statische Moment üblich. RR (3) Mit M = S µ dO (Gesamtmasse) berechnet sich der Massemittelpunkt (Schwerpunkt) SM = (xS , yS , zS ) durch (xS , yS , zS ) = 1 (Myz,1 , Mzx,1 , Mxy,1 ) M und für f = µ ≡ 1 der geometrische Schwerpunkt S = (x̄, ȳ, z̄) µZ Z ¶ ZZ ZZ ZZ 1 (x̄, ȳ, z̄) = x dO, y dO, z dO mit O = dO. O S S S S 16–18 KAPITEL 16. OBERFLÄCHENINTEGRALE Beispiel 16.8 Gesucht ist die Ladung auf einem Flächenstück S bei einer Ladungsdichte ²(x, y, z) = √ 21 2 = 1r . Das Flächenstück S sei ein Kegelmantel S := {(x, y, z) : x +y x2 + y 2 = z 2 , z ∈ [0, 1], Abb. 16.15. z 11 00 00 11 1 x y Abbildung 16.15: Ladung auf dem Kegelmantel S hat mit r = z die Parameterdarstellung r cos ϕ w(ϕ, r) = r sin ϕ , (ϕ, r) ∈ [0, 2π] × [0, 1]. r Die Ladungsdichte ² ist von z unabhängig und hat in (x, y) = (0, 0) für alleRRz eine Unstetigkeitsstelle; für (x, y) → (0, 0) wächst ² über alle Grenzen, deshalb ist S ² dO ein uneigentliches Parameterintegral. Bei uneigentlichen Riemannintegralen im R1 versucht man in den Fällen, in denen der Integrand eine Unendlichkeitsstelle hat, in einem eingeschränkten Bereich zu integrieren und untersucht nach der Integration einen entsprechenden Grenzwert. Dieses Verfahren soll hier sinngemäß angewendet werden: Statt S betrachte man eine Teilmenge S̃ des Mantels, Abb. 16.16: z η x y Abbildung 16.16: Ladung auf dem Kegelstumpfmantel 16.3. OBERFLÄCHENINTEGRALE FÜR EIN VEKTORFELD 16–19 S̃ = {(x, y, z) : x2 + y 2 = z 2 , z = r ∈ [η, 1], η > 0}. Auf S̃ berechnet man die Ladung LS̃ (η) und untersucht den Grenzwert limη→0 LS̃ (η). Dieser Grenzwert (falls er existiert) ist dann gleich LS , der Gesamtladung. Die Parametrisierung von S̃ ist die gleiche, wie für S, der Parameterbereich D̃ ist eine Untermenge von D. Mit −r sin ϕ cos ϕ r cos ϕ w,ϕ = r cos ϕ , w,r = sin ϕ , n = w,ϕ ×w,r = r sin ϕ 0 1 −r und |n| = √ 2r folgt für LS̃ ZZ LS̃ = Z 2π Z ² dO = S̃ 0 η 1 √ 1 √ r 2 dr dϕ = 2π 2(1 − η) r √ und LS = limη→0 LS̃ = 2π 2. √ Dem Kegelmantel kann man die (endliche) Ladung 2π 2 zuordnen. Aufgabe: Untersuche LS für eine Ladungsdichte ² = 16.3 1 x2 +y 2 = 1 . r2 Oberflächenintegrale für ein Vektorfeld Definition 16.4 Betrachte ein reguläres Flächenstück S mit der Parameterdarstellung x(u, v) w(u, v) = y(u, v) , (u, v) ∈ D ⊂ R2 z(u, v) mit dem Normaleneinheitsvektor n0 = n w,u ×w,v = , n0 ∈ C 0 (D) |n| |w,u ×w,v | und ein Vektorfeld Φ auf S, Φ : R3 → R3 , Φ ∈ C 0 (S). Dann heißt das Oberflächenintegral des Skalarproduktes (Φ, n0 ) Fluß von Φ durch S (Oberflächenintegral 2.Art): ZZ ZZ ZZ 0 ~ F = Φ dO := (Φ, n ) dO = (Φ, (w,u ×w,v )) du dv S S D Diskussion: (1) (Φ, n0 ) ist die skalare Normalkomponente von Φ bzw. die Projektion von Φ auf den Normalenvektor an die Fläche S. (Φ, (w,u ×w,v )) = [Φ, w,u w,v ] ist das Spatprodukt der Vektoren Φ, w,u w,v . 16–20 KAPITEL 16. OBERFLÄCHENINTEGRALE (2) ~ = n0 dO = dO (w,u ×w,v ) |w,u ×w,v | du dv = (w,u ×w,v ) du dv |w,u ×w,v | wird häufig das vektorielle Oberflächenelement genannt. (3) Geometrie (Abb. 16.17): S (φ, no ) no 1 0 1 0 Fluß φ φ φ Abbildung 16.17: Einheitsnormale an ein Flächenstück (4) Falls Φ das Geschwindigkeitsfeld einer Flüssigkeitsströmung ist, ist F das Gesamtvolumen der durch S in Richtung n0 hindurchströmenden Flüssigkeitsmenge (pro Zeiteinheit). Vertauscht man u und v, so ergibt sich ein Normalenvektor n̄0 = −n0 . Der Fluß ist vom gewählten Normalenvektor abhängig (Vorzeichen). (5) Bei geschlossenen Flächen eignet sich das Integral für Bilanzaussagen bei Strömungsproblemen: Was im Inneren entsteht oder vergeht muß durch die Oberfläche fließen. Näheres dazu im Kapitel 17 Vektoranalysis/Satz von Gauß. Hier sind dann für die zwei Normalenvektoren die Bezeichnungen Innen- und Außennormale üblich. Beispiel 16.9 In einer Kugel mit dem Radius R in Mittelpunktslage sei das elektrische Feld einer Punktladung im Ursprung gegeben. Gesucht ist der Fluß des Feldes durch die Kugeloberfläche S. S ist also durch S := {(x, z) : x2 + y 2 + z 2 = R2 } gegeben. Die y, x y . Sie steht senkrecht auf S. Die NorAußennormale der Kugel ist bekannt: n = z x x x cq 1 y = R1 y . Das elektrische Feld Φ = E = |w| y mierung ergibt: n0 = |n| 3 z z z fällt quadratisch mit wachsendem Radius |w|, ((c, q)=const.), ist mit n0 gleichgerichtet und ist in (x,y,z)=(0,0,0) singulär. RR Für die Flußberechnung wird die bekannte Formel für den Inhalt der Kugeloberfläche ( S dO = 4πR2 ) benutzt: ZZ ZZ cq cq F = (Φ, n0 ) dO = dO = 2 4πR2 = cq4π. 2 R S S R 16.3. OBERFLÄCHENINTEGRALE FÜR EIN VEKTORFELD 16–21 Bemerkenswert ist, daß der Fluß F nicht von R abhängt. Beispiel 16.10 Zu einem Flächenstück u , v S := {(x, y, z) : w(u, v) = 1 3 (4 − u − 2v) (u, v) ∈ D} mit 4−u , 0 ≤ u ≤ 4} 2 2z und zum Vektorfeld Φ(w) = Φ(x, y, z) = x + y ist der Fluß F durch S gesucht, Abb. 0 16.18. D := {(u, v) : 0 ≤ v ≤ z 4 3 11 00 x 1 0 1 0 4 S 11 00 2 11 00 D y x + 2y + 3z = 4 Abbildung 16.18: Fluß durch eine Ebene 1 0 Nach w,u = 0 , w,v = 1 folgt für das Spatprodukt − 13 − 23 2 2 [Φ, w,u , w,v ] = (Φ, (w,u ×w,v )) = (4 − u − 2v) + (u + v). 9 3 Damit ergibt sich für den Fluß: RR RR F = S (Φ, n0 ) dO = D (Φ, (w,u ×w,v )) dv du R 4 R 1 (4−u) 2 ( 9 (4 − u − 2v) + 23 (u + v)) dv du = ... = = 0 02 176 27 . Beispiel 16.11 Eine Dachkonstruktion habe die Form eines hyperbolischen Paraboloides z = x2 − y 2 . Gesucht ist der Inhalt der Dachfläche über einem fiktiven Grundriß 16–22 KAPITEL 16. OBERFLÄCHENINTEGRALE K = {(x, y) : x2 + y 2 ≤ 2}. Um eine Vorstellung von der Fläche zu erhalten, betrachte man Schnitte der Fläche mit Ebenen z = c : x2 − y 2 = c (Hyperbeln), y = c : z = x2 − c (Parabeln), Abb. 16.19). z y x Abbildung 16.19: z = x2 − y 2 (Sattelfläche), hyperbolisches Paraboloid Zur Berechnung des Flächeninhaltes: Mit x , (x, y) ∈ K = {(x, y) : x2 + y 2 ≤ 2} y w(x, y) = x2 − y 2 und 0 w,y = 1 , −2y ZZ ZZ p 1 w,x = 0 , 2x −2x w,x ×w,y = 2y 1 folgt F = K |w,x ×w,y | dx dy = 4(x2 + y 2 ) + 1 dx dy K und unter Verwendung von Polarkoordinaten (r, ϕ): Z 2π Z √ 2p Z 4r2 + 1 r dr dϕ = 2π F = 0 0 1 9 1√ π 2 3 ¯¯9 π z 2 ¯ = 26. z dz = 8 43 6 1 Zusatzbetrachtung Die Fläche wird durch zwei Geradenscharen erzeugt (Spannbeton, Bewehrung). Diese Erkenntnis läßt sich leicht nachvollziehen, wenn man für die Flächendarstellung eine andere Parametrisierung wählt: u+v 1 u − v , (u, v) ∈ D. w(u, v) = 2 2uv 16.3. OBERFLÄCHENINTEGRALE FÜR EIN VEKTORFELD 16–23 Für diese Parameterdarstellung gilt 1 1 x2 − y 2 = ((u + v)2 − (u − v)2 ) = uv = z und x2 + y 2 = ((u + v)2 + (u − v)2 ) ≤ 2, 4 4 also D = {(u, v) : u2 + v 2 ≤ 4}. Aufgabe Berechne zur Übung den Flächeninhalt des Daches unter Nutzung der neuen Parametrisierung. Die Koordinatenlinien auf der Fläche sind Parameterdarstellungen von Geradenscharen im R3 mit den Scharparanetern ū und v̄. ū + v u + v̄ 1 1 u = ū : w(ū, v) = ū − v und v = v̄ : w(u, v̄) = u − v̄ . 2 2 2ūv 2uv̄ Die Koordinatenlinien auf der (gekrümmten) Fläche sind also Geraden; die Fläche wird durch Geradenscharen erzeugt. Beispiel 16.12 Gesucht ist: (1) Das Volumen des Körpers, den ein Zylinder x2 + y 2 = Rx, R = const. aus der Kugel x2 + y 2 + z 2 = R2 schneidet und (2) der Inhalt des Teiles der Kugeloberfläche, der vom Zylinder herausgeschnitten wird (Vivianifenster). Geometrie (Abb. 16.20): z y 11 00 11 00 R R ϕ 11 0 1 0 0 1 01 0 R R 2 x R x y Abbildung 16.20: Volumen und Oberfläche bei Durchdringungsgebilden Die Volumenberechnung wird mit einem räumlichen Bereichsintegral durchgeführt. Der Bereich B wird durch ( µ ¶ µ ¶2 ) n o\ R 2 R 2 2 2 2 2 B = (x, y, z) : x + y + z ≤ R (x, y, z) : x − +y ≤ 2 2 16–24 KAPITEL 16. OBERFLÄCHENINTEGRALE beschrieben. Aus Symmetriegründen wird nur eine Viertelfigur berechnet. Dabei werden Zylinderkoordinaten benutzt. r cos ϕ π w(r, ϕ, z) = r sin ϕ , (ϕ, r) ∈ [0, ] × [0, R cos ϕ], 2 z p p R2 − (x2 + y 2 )] = [0, R2 − r2 ], z ∈ [0, det J = r Dann folgt: Z V (B) = 4 π 2 Z Z =4 Z π 2 4 =− 3 0 R2 (1−cos2 ϕ) R2 0 Z Z R2 −r2 π 2 r dz dr dϕ = 4 0 0 √ R cos ϕ Z 0 1√ − u du dϕ = 4 2 Z 0 π 2 Z R cos ϕ r p R2 − r2 dr dϕ 0 ¯ 2 2 1 3 ¯¯R sin 2 (− u )¯ 3 R2 ϕ dϕ ¯π ¯2 4R3 1 4 π 2 3 R (sin ϕ − 1) dϕ = (ϕ − (− cos ϕ + cos ϕ))¯¯ = R3 ( − ). 3 3 3 2 3 0 π 2 3 0 3 Zur Oberflächenberechnung wird -aus Symmetriegründen- wieder nur ein Viertelfenster betrachtet. Für die Oberfläche wird die Parameterdarstellung r cos ϕ π w(r, ϕ) = √r sin ϕ , (r, ϕ) ∈ [0, R cos ϕ] × [0, ] 2 R2 − r 2 gewählt. Zur Bestimmung des Oberflächenintegrals werden nun die benötigten Größen w,r , w,ϕ , n und |n| berechnet: w,r = cos ϕ sin ϕ − √R2r−r2 , −r sin ϕ w,ϕ = r cos ϕ , 0 x r y , n = w,r ×w,ϕ = √ 2 R − r2 z p √ r rR r x2 + y 2 + z 2 = √ R2 = √ . |n| = √ 2 2 2 2 R −r R +r R2 − r 2 Hieraus folgt: π O =4 R2 R cos R ϕ 0 0 π √ rR R2 −r2 ¯ 2 R 1 ¯R = 4R (−u 2 )¯ 2 π 2 = 0 2 4R (ϕ dr dϕ = 4R sin2 ϕ R π 2 + cos ϕ)|0 = R2 2 ϕ) R2 (1−cos R 0 π 2 R2 − 2√1 u du dϕ R dϕ = 4R (−R sin ϕ + R) dϕ 0 4R2 ( π2 − 1). 16.4. ZUSATZ: LANDKARTEN 16–25 v v0 z S w D y w u0 −1 u x Abbildung 16.21: Parameterdarstellung eins Flächenstücks 16.4 Zusatz: Landkarten Urbild einer Parameterdarstellung für Kugeloberflächen Allgemeines: Betrachtet werden Abbildungen w : D ⊂ R2 → R3 , Abb. 16.21. x(u, v) w(u, v) = y(u, v) , (u, v) ∈ [a, b] × [c, d] =: D z(u, v) Koordinatenlinien in der (u, v)-Ebene u = u0 = const. werden auf x(u0 , v) w(u0 , v) = y(u0 , v) , v ∈ [c, d] z(u0 , v) abgebildet, einer Kurvenschar auf dem Flächenstück S im R3 . Ein Netz von Koordinatenlinien u = const. und v = const. wird durch die Abbildung w auf ein Netz von Kurven auf dem Flächenstück S abgebildet. Dieses Netz wird Gradnetz genannt (manchmal auch Koordinatenlinien auf S). Dieses Gradnetz ist orthogonal, falls die Tangentialvektoren w,u und w,v an die Netzkurven in jedem Punkt des Netzes orthogonal zueinander sind. Bezeichnung: Die Menge D als Urbild der Abbildung w für das gekrümmte Flächenstück wird Landkarte von S genannt. Zur Diskussion des Landkartenproblems für die Erde geht man von S als Teil der Kugeloberfläche (Erde) aus. Verschiedene Kartentypen entstehen, wenn man verschiedene Parameterdarstellungen der Sphäre betrachtet: (1) Kugelkoordinaten Die Koordinatenfläche r = r0 = const. für die Kugelkoordinaten liefert eine Parameterdarstellung der Kugeloberfläche: x = x(r0 , ϕ, ψ) = r0 cos ϕ cos ψ y = y(r0 , ϕ, ψ) = r0 sin ϕ cos ψ z = z(r0 , ϕ, ψ) = r0 sin ψ, r0 := 1 16–26 KAPITEL 16. OBERFLÄCHENINTEGRALE £ ¤ mit dem Parameterbereich (ϕ, ψ) ∈ D := [−π, π] × − π2 , π2 , Abb. 16.22. z ψ π 2 00 11 00 D 11 1 0 π ϕ y 00 11 0 1 0 1 11 00 0 1 0 1 0 1 ψ 000 111 0 0 01 1 111 000 ϕ1 1 0 1 0 x Abbildung 16.22: Parameterdarstellung der Sphäre D ist also eine Landkarte der Erdoberfläche, Die Koordinatenlinien ϕ = const. in der (ϕ, ψ)-Ebene liefern die Längenkreise auf der Sphäre, ψ = const. führt auf die Breitenkreise (ψ wird hier nicht zur Nordpolachse, sondern zur (x, y)-Ebene gemessen). Das Gradnetz der Längen und Breitenkreise ist orthogonal: Die Tangentialvektoren − sin ϕ cos ψ cos ϕ (− sin ψ) w,ϕ = cos ϕ cos ψ , w,ψ = sin ϕ (− sin ψ) 0 cos ψ sind zueinander orthogonal, da ihr Skalarprodukt (w,ϕ , w,ψ ) für alle (ϕ, ψ) ∈ D verschwindet. Die durch die Kugelkoordinaten induzierte Landkarte hat für ψ = π2 , ψ = − π2 ihre größte Verzerrung, da Nord- und Südpol der Erde auf den oberen und unteren Rand von D abgebildet werden. Dort ist auch die Abbildung w nicht eineindeutig, Abb. 16.23. In welcher Relation stehen die Entfernungen auf der Karte und die realen Entfernungen ψ π 2 11 00 11 00 D 1 0 1 0 π ϕ Abbildung 16.23: Landkarte bei Verwendung von Kugelkoordinaten auf der Sphäre für verschiedene Breitenkreise ψ = ψ0 ? Untersuche zuerst den Abstand % von Punkten auf einem Breitenkreis zur Polachse, Abb. 16.4. ZUSATZ: LANDKARTEN 16–27 16.24, x2 + y 2 = %2 = cos2 ψ, also gilt % = cos ψ und die Länge eines Breitenkreises Lψ0 ist z ϕ ψ r Abbildung 16.24: zulässige Kurven Lψ0 = 2π% = 2π cos ψ0 . Auf der Karte hingegen ist die Länge aller Breitenkreise konstant: L = 2π. Hieraus ergibt sich der Darstellungsfehler einer Breitenkreislänge in Abhängigheit von ϕ0 , Abb. 16.25: ∆Lψ0 = 2π(1 − cos ψ0 ). Der Fehler und damit die Verzerrung wächst also mit wachsendem ψ0 . ψ ∆Lψ0 π 2 ψ0 − π2 Lψ0 2π = L L Abbildung 16.25: Abbildungsfehler Andere Parameterdarstellungen der Sphäre und damit andere Kartentypen haben andere Fehlerdiagramme. (2) Mercatorprojektion der Sphäre Betrachte cos u 1 sin u , (u, v) ∈ [−π, π] × R. w(u, v) = cosh v sinh v Dies ist eine Parametrisierung der Kugeloberfläche mit r = 1: x2 + y 2 + z 2 = 1 (cos2 u + sin2 u + sinh2 v) = 1. cosh2 v 16–28 KAPITEL 16. OBERFLÄCHENINTEGRALE D = [−π, π] × R ist damit eine Karte der Erdoberfläche (r = 1), Abb. 16.26. v 11 00 00 11 11 00 11 00 −π π D w 1 0 0 1 u Karte Sphäre Abbildung 16.26: Die Abbildung Sphäre auf Karte, vermittelt durch w−1 heißt Mercatorprojektion. Die Bilder der Koordinatenlinien v = v0 : cos u 1 w(u, v0 ) = sin u cosh v0 sinh v0 sind wegen x2 + y 2 = 1 := %2 , cosh2 v0 z = const. Breitenkreise, für die Koordinatenlinien u = u0 ergeben sich als Bilder die Längenkreise. Zum Beispiel folgt für u = u0 = 0 aus 1 1 0 w(0, v) = cosh v sinh v die Gleichung x2 + z 2 = 1 (1 + sinh2 v) = 1. cosh2 v Dies ist die Gleichung für den Nullmeridian. Die Winkeltreue der Abbildung w läßt sich wieder aus (w,u , w,v ) = 0 (Orthogonalität der Tangentialvektoren) ablesen. Wegen 1 1 % = cosh v und ∆Lv = 2π(1 − cosh2 v ) = L − Lv (Kartenlänge eines Breitenkreises minus wahre Länge) folgt ein Fehlerdiagramm, Abb. 16.27. Hieraus erkennt man, daß die Mercatorprojektion insbesondere in den mittleren und kleineren Breiten bessere Abbildungsverhältnisse liefert. In den Polregionen dagegen werden 16.4. ZUSATZ: LANDKARTEN 16–29 v ∆Lv0 π 2 v0 Lv0 2π = L − π2 Abbildung 16.27: Fehlerdiagramm die Verhältnisse extrem ungünstig: Es gilt 0 0 f ür alle u ∈ [−π, π]. lim w(u, v) = v→∞ 1 Die Breitenkreise unterhalb des Nordpols werden auf Geradenstücke mit sehr großen vWerten abgebildet. Lambertsche Parametrisierung der Sphäre Die Parameterdarstellung der Sphäre wird zunächst durch eine geometrische Beschreibung gegeben. Die Sphäre x2 + y 2 + z 2 = 1 soll horizontal auf einen berührenden Zylinder projeziert werden. Der Zylinder ist durch x2 + y 2 = 1, −1 ≤ z ≤ 1 gegeben, Abb. 16.28. 1 0 Abbildung 16.28: Projektion der Sphäre auf einen Zylindermantel Eine Abwicklung des Zylinders in der Ebene ergibt ein Rechteck D := {(u, v) ∈ [0, 2π] × [−1, 1]}, dabei ist u der Winkel in der (x, y)-Ebene und v die Höhe über dieser Ebene. D soll die Karte für die Sphäre sein und damit der Parameterbereich der gewünschtem Parameterdarstellung. Zur Bestimmung der Abbildung w zwischen Sphäre und Zylindermantel 16–30 KAPITEL 16. OBERFLÄCHENINTEGRALE genügt -wegen der Radialsymmetrie- eine Betrachtung in der (t, z)-Ebene, Abb. 16–30. z =v 11 00 1 ϕ v r Zylinder Abbildung 16.29: Abbildungsverhältnisse bei Lambert Der zu z = const. gehörende Breitenkreisradius % ist % = % sin u folgt die Parameterdarstellung √ 2 √1 − v cos u w = 1 − v 2 sin u , (u, v) ∈ D. v √ 1 − v 2 und mit x = % cos u, y = Die Koordinatenlinien v = v0 bzw. u = u0 bilden √ auf Breiten- bzw. Längenkreise ab. Für das Fehlerdiagramm ergeben sich wegen % = 1 − v 2 die Verhältnisse nach Abb. 16.30. v 1 2π L −1 Abbildung 16.30: Abbildungsfehler Die Abbildung √ w ist winkeltreu ((w,u , w,v ) = 0). Eine genauere Untersuchung der Fehlers ∆Lv = 2π(1 − 1 − v 2 ) zeigt, daß die äußerst plausible Lambertsche Projektion nicht die besten Darstellungsergebnisse liefert. Bemerkung: Gute Ergebnisse für mittlere Breitengrade gibt eine Projektion der Sphäre auf einen in den mittleren Breiten anliegenden Kegel. 16.4. ZUSATZ: LANDKARTEN 16–31 Polgebiete lassen sich durch eine stereographische Projektion gut abbilden: Durch den Äquator einer Kugel mit dem Radius 1 wird eine Ebene E gelegt. Eine Verbindungsgerade zwischen dem Nordpol der Kugel und einem beliebigen Sphärenpunkt schneidet E genau in einem Punkt. Damit wird eine Abbildung zwischen der Sphäre und der Ebene (Kartenabbildung) erzeugt, die für alle Punkte der Sphäre (außer für den Nordpol) erklärt ist. Die Südhalbkugel wird auf das Innere des Einheitskreises abgebildet. 16–32 KAPITEL 16. OBERFLÄCHENINTEGRALE Kapitel 17 Vektoranalysis 17.1 Felder und Differentialoperatoren Der Begriff des Differentialoperators (z. B. Gradient einer Funktion, Rotor eines Vektorfeldes) wurde in einigen vorherigen Kapiteln (Kap. 9 und 12) schon erläutert. In 17.1 sollen diese und weitere Differentialoperatoren nochmals vorgestellt, einige Rechenregeln und Anwendungen zusammengestellt und damit das Teilkapitel 17.2 (Integralsätze) vorbereitet werden. Dabei erfolgt eine Beschränkung auf den R3 . Skalares Feld: (z. B. (1) f : G → R, Gebiet G ⊂ R3 , (x, y, z) 7→ f (x, y, z) heißt stationäres Feld. Dichte, Ladungsdichte) (2) f : G × T → R, Gebiet G ⊂ R3 , T = [t0 , t1 ] ⊂ R1 , (x, y, z, t) 7→ f (x, y, z, t) heißt instationäres Feld. (z. B. Temperatur eines Körpers G) Vektorfeld: (1) v : G → R3 , Gebiet G ⊂ R3 , (x, y, z) 7→ (v1 (x, y, z), v2 (x, y, z), v3 (x, y, z))T heißt stationäres Vektorfeld. (z. B. Kraft, Geschwindigkeit) (2) v : G × T → R3 , Gebiet G ⊂ R3 , T = [to , t1 ] ⊂ R heißt instationäres Vektorfeld. (z. B. zeitabhängiges Kraftfeld) Die Felder können stetig oder stetig differenzierbar sein. Bekanntlich schreibt man: f ∈ C o (G, R), v ∈ C o (G, R3 ), f ∈ C 1 (G, R) . . . oder falls die Bildräume aus dem allgemeinen Kontext klar sind: f ∈ C o (G), V ∈ C o (G), f ∈ C 1 (G) . . .. Bekanntes über skalare Felder: Niveaufläche von f := {(x, y, z) : f (x, y, z) = c} Gradienten(feld) zu f := v := grad f = (f,x , f,y , f,z ), umgekehrt ist dann f ein Potential zum Vektorfeld v. ³ ´ ∂(·) ∂(·) Nablaoperator := 5(·) = ∂(·) , , ∂x ∂y ∂z , d. h. 5f = (f,x , f,y , f,z ) = grad f 17–33 17–34 KAPITEL 17. VEKTORANALYSIS Diskussion: Sei (x(t), y(t), z(t)) eine beliebige C 1 -Vektorfunktion auf der Niveaufläche. Aus f (x(t), y(t), z(t)) = const. für alle t folgt f,x ẋ + f,y ẏ + f,z ż = 0, woraus sich die Aussage 5f steht senkrecht auf der Niveaufläche“ ergibt. ” Bekanntes über Vektorfelder: Betrachte v : G → R3 , v ∈ C 1 (G). Feldlinien sind glatte Kurven in G, deren Tangentialvektor in jedem Punkt von G parallel zur Vektorfeldrichtung ist, Abb. 17.1. y 1 0 0 1 1 0 00 11 11 00 G x Abbildung 17.1: Feldlinien in G ⊂ R2 Feldlinien sind also Kurven w(t) = (x(t), y(t), z(t))T mit ẇ(t) k v(w(t)) bzw. ẇ(t) × v(w(t)) = 0. Hieraus ergibt sich ein System von Differentialgleichungen für die Feldlinien eines gegebenen Vektorfeldes v(w): ẇ = 1 v(w), v 6= 0. | v(w) | Weitere Differentialoperatoren: Definition 17.1 Für ein Vektorfeld v ∈ C 1 (G), v = v(w) heißt der Differentialoperator, der die Abbildung v 7→ v1,x + v2,y + v3,z bewirkt, die Divergenz von v. Also gilt div v : R3 → R1 und div v(w) = v1,x (w) + v2,y (w) + v3,z (w). Die Divergenz wird auch Quelldichte genannt. (Zur Begründung siehe Teilkapitel 17.2) Diskussion: (1) div v ist gleich der Spur der Jacobimatrix des Vektorfeldes v. (2) formale Umformregel: ¶ v1 µ ∂ ∂ ∂ v2 = 5v (Skalarprodukt) , , div v = ∂x ∂y ∂z v3 17.1. FELDER UND DIFFERENTIALOPERATOREN 17–35 Beispiel 17.1 v(w) = (−y, x, −1)T , div v = 0; v(w) = (x, y, z)T , div v = 3 p Beispiel 17.2 v(w) = f (r)w, r = x2 + y 2 + z 2 (Zentralfeld), v1,x = f 0 (r) · r,x x + f (r), . . . , v3,z = f 0 (r)r,z z + f (r). Also 0 div v = v1,x + v2,y + vµ 3,z = 3f (r) + (r,x x + r,y y + r,z z) ¶ · f (r) = 3f (r) + f 0 (r) x·x x2 +y 2 +z 2 √ z·z x2 +y 2 +z 2 + ··· + √ = 3f (r) + f 0 (r) · r Aufgabe: Für welche f (r) gilt div v = 0? Die entstehende Differentialgleichung für f (r) (3f + f 0 · r = 0) läßt sich nach dem Verfahren Trennung der Variablen lösen: f (r) = c r−3 , c ∈ R. Damit ist nur das spezielle Zentralfeld v(w) = rc3 w quellenfrei. Definition 17.2 Für ein f : G → R1 , f ∈ C 2 (G) heißt die Abbildung 4, die f 7→ f,xx +f,yy +f,zz bewirkt Laplaceoperator . Somit gilt f,xx (w)+f,yy (w)+f,zz (w) =: 4f (w). formale Umformregel: mit v = grad f = 5f gilt: div v = div grad f = 5 · 5f = (5 · 5)f = 4f . v3,y − v2,z Definition 17.3 Für ein v : G → R3 , v ∈ C 1 (G) heißt die Abbildung v → 7 v1,z − v3,x v2,x − v1,y Rotation von v oder Rotor v. Somit gilt elementweise: (v3,y (w) − v2,z (w))i + (v1,z (w) − v3,x (w))j + (v2,x (w) − v1,y (w))k =: rot v(w) Die Rotation ist das Maß für die Wirbeldichte eines Vektorfeldes (Begründung siehe 17.2) Diskussion: Eine formale Berechnungsvorschrift ist rot v(w) = 5 × v(w). Eigenschaften: (A) HAus dem Kapitel 11 Kurvenintegrale folgt: Sei G einfach zusammenhängend. Dann gilt vdw = 0 für alle geschlossenen Wege in G ⇔ rot v = 0 ⇔ v = grad f = 5f , d. h., rot (grad f ) = 5 × 5f = 0. Jedes Gradientenfeld ist wirbelfrei; jedes wirbelfreie Feld ist ein Gradientenfeld. Rechenregeln: (1) rot grad f = 0 (bekannt) (2) div rot v = 0, da div rot v = v3,yx −v2,zx +v1,zy −v3,xy +v2,xz −v1,yz = 0. Verbal: Jedes Rotationsfeld ist quellenfrei. Offen bleibt zunächst die Frage, ob auch jedes quellenfreie Feld ein Rotationsfeld ist (s. u.). (3) div (grad f ) = 4f (bekannt) 17–36 KAPITEL 17. VEKTORANALYSIS (4) div(f · v) = grad f · v + f div v, da div (f · v) = (f v1 ),x + (f v2 ),y + (f v3 ),z = f,x v1 + f v1,x + · · · = (grad f ) · v + f div v (5) rot (f · v) = grad f × v + f rot v o. B. 4v1 (6) rot (rot v) = grad (div v) − 4v, wobei 4v := 4v2 , o. B. 4v3 Beispiel 17.3 v = f (r)w (Zentralfeld, z. B. Gravitationsfeld) rot v = rot (f (r)w) = grad f × w + f rot w = f 0 (r) · wr × w = 0 (Zentralfelder sind wirbelfrei). (B) Für ein Vektorfeld v gelte rot v = 0 und div v = 0. Aus rot v = 0 folgt v = grad f und weiter div v = div grad f = 4f = 0. Also ist f ein Laplacefeld“. ” Definition 17.4 Sei W = rot A. Dann ist Feld A ein Vektorpotential von W und W ist Wirbelfeld bezüglich A. Problem: Die Bedingung dafür, daß ein Vektorfeld ein Potential hat (also ein Gradientenfeld ist) ist die Wirbelfreiheit (rot v = 0). Unter welcher Bedingung hat ein Vektorfeld W ein Vektorpotential A? Satz 17.1 Sei G sternförmiges Gebiet im R3 und W : G → R3 , W ∈ C 1 (G): ∃A : W = rot A ⇔ div W = 0. D. h., jedes quellenfreie Vektorfeld ist ein Wirbelfeld und umgekehrt. Beweis: (Notwendigkeit) W = rot A ⇒ div W = div rot A = 0 (Wiederholung des Begriffes Sternförmigkeit: G ist sternförmig, wenn es ein Zentrum wo in G gibt, so daß für alle w in G die Strecke wo w ganz in G liegt.) Diskussion: A ist nicht eindeutig, da alle Vektorpotentiale zu W die Form à = A+grad u mit beliebigem u haben. rot à = rot A + rot grad u = rot A = W A läßt sich aus W gegebenenfalls aus einem System von partiellen Differentialgleichungen berechnen. 17.1. FELDER UND DIFFERENTIALOPERATOREN 17–37 Anwendungen in der Elektrotechnik Satz 17.2 Zerlegungssatz von Helmholtz: (i) G ⊂ R3 sternförmig W : G → R3 , W ∈ C 1 (G), ∂G stückweise glatt, (ii) auf G gibt es eine Lösung der partiellen Differentialgleichung 4u = f (Direchletproblem). Dann folgt W = W1 + W2 = grad u + rot A Verbal: W ist zerlegbar in ein wirbelfreies Feld W1 (rot W1 = 0) und ein quellenfreies Feld W2 (div W2 = 0). Beweisskizze: W = W1 + W2 ⇒ div W = div grad u + div rot A div W := f = 4u + 0 Annahme: u löst 4u = f ⇒ div (W − grad u) = 0 ⇒ ∃A : W − grad u = rot A Diskussion einiger Aspekte der Maxwellschen Gleichungen Bezeichnungen: w = (x, y, z)T ∈ G ⊂ R3 , E(w, t) elektrische Feldstärke, H(w, t) magnetische Feldstärke, µ, ² Feldkonstanten, % räumliche Ladungsdichte. Also E : R4 → R3 , H : R4 → R3 , E, H ∈ C 2 (G × T ). Elektrische Felder in Isolatoren: rot H = ²E,t div H = 0 rot E = −µH,t div E = % ² Das System ist ein System von partiellen Differentialgleichungen 1. Ordnung (8 Gleichungen für die Funktionen (E, H) : R4 → R6 ). Da bisher keine mathematischen Hilfsmittel zur Lösung von partiellen Differentialgleichungen zur Verfügung stehen, werden mit vektoranalytischen Hilfsmitteln Entkopplungsprobleme gelöst. Diese sollten auf Standardprobleme für partielle Differentialgleichungen führen (skalare und vektorielle Wellengleichung, Poissongleichung, Laplacegleichung) und im Fall von Feldern in Leitern auf die Telegraphengleichung. Entkopplung der Maxwellschen Gleichungen (unter Verwendung der Regeln (1) - (6)) Bilde rot (rot H) = grad div H − 4H = − 4 H = ² rot E,t = −² µ H,tt . Also gilt die vektorielle Wellengleichung (3 gekoppelte partielle Differentialgleichungen 2. Ordnung) 4H = ² µ H,tt bzw. H,xx + H,yy + H,zz = ² µ H,tt . (Bemerkung: für % = 0 würde analog 4E = ²µE,tt folgen) Ziel der weiteren Untersuchungen ist die Herleitung einer skalaren Wellengleichung: Wegen div H = 0 folgt: es gibt ein Vektorpotential A : H = rot A, also H,t = rot A,t . 17–38 KAPITEL 17. VEKTORANALYSIS Hieraus folgt 0 = rot E + µ H,t = rot (E + µ A,t ) = 0 ⇒ es gibt eine (skalare) Potentialfunktion U mit E + µ A,t = grad U bzw. E,t + µ A,tt = grad U,t . Die Maxwellschen Gleichungen liefern nun rot H = ² E,t = −² µ A,tt + ² grad U,t nach Gleichung (6) folgt rot H = rot (rot A) = grad div A − 4A. Falls A und U so bestimmt werden, daß div A = ² U,t , folgt wieder 4A = ² µ A,tt für das Vektorpotential A und aus E + µA,t = grad U ergibt sich div E + µ div A,t = div grad u bzw. % + µ ² U,tt = 4U. ² Diese partielle Differentialgleichung 2. Ordnung für U = U (t, x, y, z) nennt man für % = 0 Wellengleichung für µ = 0 Poissongleichung und für %, µ = 0 Laplacegleichung für ein U = U (x, y, z). Zur Lösung dieser Standardformen gibt es in Abhängigkeit von der Gestalt der Gebiete G ⊂ R3 eine umfangreiche Literatur. Zu bemerken ist jedoch, daß in der Wellengleichung und ihren Derivaten die gesuchten Vektorfelder C 2 -Eigenschaften haben müssen (in Erweiterung der Anforderungen, die durch die Maxwellschen Gleichungen gestellt werden). Elektrische Felder in Leitern rot H = ² E,t + σ E rot E = −µ H,t div H = 0 div E = 0 , % konstante Leitfähigkeit Entsprechende Entkopplungsmechanismen führen – wie im Fall der Isolatoren – unter der Zusatzbedingung div A = ² U,t + σ U für das Vektorpotential A und das Potential U auf die sogenannte Telegraphengleichung 4U = ² µ U,tt + σ µ U,t bzw. auf die entsprechende vektorielle Telegraphengleichung für A, H und E. Beispiel 17.4 Erste Interpretation der Divergenz als Maß für die Ergiebigkeit eines räumlichen Bereiches in Bezug auf eine strömende Flüssigkeit. Sei V := α(x, y, z)T , α ∈ R das Geschwindigkeitsfeld einer radial strömenden Flüssigkeit im R3 , Abb. 17.2. Bekanntlich gilt rot v = 0 und div v = 3α. Für α > 0 strömt die p Flüssigkeit vom Ursprung weg; für α < 0 strömt sie zum Ursprung hin. Wegen | v |=| α | x2 + y 2 + z 2 =| α | r ist die Geschwindigkeit proportional dem Abstand vom Ursprung. Betrachte einen Kegel Ke mit Spitze im Ursprung und eine innen anliegende Kugel Ku, Abb. 17.3. Da das Geschwindigkeitsfeld radial strukturiert ist, bleibt eine Flüssigkeitsmenge, die sich im Kegel befindet für alle Zeiten im Kegel. Betrachte den Fall α < 0. Dann ist die Außenoberfläche der Kugel bzgl. des Kegels größer als die Innenoberfläche und außerdem ist die Geschwindigkeit des Strömungsfeldes außen größer als innen. Deshalb füllt sich die Kugel mit Flüssigkeit (div v = 3α < 0). Die Kugel ist eine Senke. Für α > 0 fließt mehr ab als zu (div v > 0, Quelle). 17.1. FELDER UND DIFFERENTIALOPERATOREN 17–39 111 000 000 111 000 111 00 11 000 111 00 11 111 000 00 11 00 11 0 1 00 11 00 11 00 11 0 1 00 11 00 11 0 1 00 11 11111111 00000000 00 0 11 1 00 11 00 11 x 00 11 00 11 00 11 00 11 11 0011 00 y Abbildung 17.2: Geschwindigkeitsfeld V im R2 mit α > 0 Ku Ke 1111111111 0000000000 0000000000 1111111111 00 11 0000000000 1111111111 00 11 0000000000 1111111111 00 11 0000000000 1111111111 0000000000 1111111111 00 11 0000000000 1111111111 00 11 11 00 0000000000 1111111111 1111111111 0000000000 Abbildung 17.3: Divergenz als Maß für die Ergiebigkeit Beispiel 17.5 Erste Interpretation der Rotation als Drehungsmaß eines Feldes. Betrachte das Geschwindigkeitsfeld einer Strömung v = β(−y, x, 0)T , α ∈ R. Dieses Feld ist orthogonal zu allen Ortsvektoren w = (x, y, z)T , da (w, v) = β(−xy + xy + 0 · z) = 0. Zu allen Ortsvektoren w mit gleichen (x, y) und beliebigen z gehören gleiche v, sei α > 0, Abb. 17.4. Abbildung 17.4: Geschwindigkeitsfeld v = α(−y, x, 0), α > 0 Die Flüssigkeit dreht um die z-Achse gegen den Uhrzeigersinn. Wegen div v = 0 nimmt die Flüssigkeit in Kugeln um beliebige Punkte weder zu noch ab (Quellen und Senkenfreiheit), 17–40 KAPITEL 17. VEKTORANALYSIS rot v = β(0, 0, 2)T = const. für alle möglichen Kugeln charakterisiert bzw. ist ein Maß für die Drehung des Feldes in z-Achse). 17.2 Integralsätze In diesem Kapitel sollen Integralsätze im R2 und im R3 behandelt werden. Sie geben Zusammenhänge und damit Umrechnungsmöglichkeiten zwischen verschiedenen ebenen bzw. räumlichen Bereichsintegralen zu Kurven- bzw. Oberflächenintegralen an. Sie sind insbesondere nützlich zur direkten Berechnung verschiedener Integraltypen sowie für die Strömungslehre und Feldtheorie, wo man z. B. aus Bilanzgleichungen für Strömungen und Temperaturen mit Hilfe von Integralsätzen die entsprechenden partiellen Differentialgleichungen herleiten kann. 3 Typen von Integralsätzen werden hier vorgestellt: (1) Ebene: (Abb. 17.5) ∂B B Abbildung 17.5: Zum Satz von Green Der Satz von Green zeigt Zusammenhänge zwischen einem ebenen Bereichsintegral über B und einem (geschlossenen) Kurvenintegral über ∂B auf. (2) Raum: (Abb. 17.6) S ∂S Abbildung 17.6: Zum Satz von Stokes (a) Der Satz von Stokes zeigt Beziehungen zwischen einem Oberflächenintegral über dem Flächenstück S und einem geschlossenen Kurvenintegral über dessen Rand ∂S, Abb. 17.6. (b) Der Satz von Gauß gibt die Überführung eines räumlichen Bereichsintegrals über dem Bereich B in ein (geschlossenes) Oberflächenintegral über dem Rand ∂B von B, Abb. 17.7. 17.2. INTEGRALSÄTZE 17–41 ∂B B Abbildung 17.7: Zum Satz von Gauß Satz 17.3 Satz von Green: (Abb. 17.8) B B̃ B ∂B ∂B2 ∂B1 Abbildung 17.8: Zum Satz von Green Betrachte einen regulären Bereich B ⊂ R2 mit stückweise glattem (regulärem) Rand ∂B. Der Rand ∂B soll so parametrisiert µ werden, ¶ daß B zur Linken liegt. Auf einer offenen v1 Menge B̃ ⊃ B sei ein Vektorfeld v = gegeben mit v ∈ C 1 (B̃). Dann gilt v2 v1 dx + v2 dy = vdw = ∂B ZZ Z Z ∂B Beweisskizze: (v2,x (x, y) − v1,y (x, y))dxdy. B µ ¶ v1 (x, y) Der Beweis soll für den Spezialfall v(x, y) = ; der allgemeine Fall ergibt sich 0 µ ¶ 0 durch Addition dieses Falls mit v(t) = . Betrachte einen Normalbereich vom v2 (x, y) Typ 1: B = {(x, y) : a ≤ x ≤ b, g(x) ≤ y ≤ h(x)}, Abb. 17.9. Parametrisierung µ ¶von ∂B = w1 ∪ w2 ∪ wµ3 ∪ w ¶4 : x b w1 (x) = , x ∈ [a, b], w2 (y) = , y ∈ [g(b), h(b)], g(x) y µ ¶ µ ¶ x a −w3 (x) = w3∗ (x) = , x ∈ [a, b], −w4 (y) = w4∗ (y) = , y = [g(a), h(a)]. h(x) y Berechnung des Kurvenintegrals mit vdw = v1 dx = v1 (x(t), y(x))ẋ(t)dt 17–42 KAPITEL 17. VEKTORANALYSIS y h(x) w3 B w4 w1 w2 g(x) a b x Abbildung 17.9: Zum Satz von Green R vdw = ∂B = R w1 Rb a v1 dx + R w2 v1 dx − R w3∗ v1 (x, g(x))dx + 0 − =− Rb h(x) R a g(x) v1 dx − Rb a R w4∗ v1 dx v1 (x, h(x))dx − 0 v1,y (x, y)dy dx = − RR v1,y dx dy B µ ¶ R 0 Analog folgt für v(x, y) = mit einem Normalbereich vom Typ 2: vdw = v2 (x, y) ∂B RR v2,x (x, y)dx dy und nach Addition der Fallergebnisse folgt die Behauptung. B Diskussion: Falls B kein Normalbereich ist, kann eine Zerlegung von B in Normalbereiche helfen: (Abb. 17.10). B Abbildung 17.10: Zerlegung von B in Normalbereiche Die Kurvenintegrale längs der Hilfslinien fallen weg, da sie - bei gleichem Integranden zweimal in entgegengesetzter Richtung durchlaufen werden. Beispiel 17.6 Z v = (−y, x) : ZZ −y dx + x dy = ∂B (1 + 1)dx dy = 2F (B) B 17.2. INTEGRALSÄTZE 17–43 Dies ist die bekannte Sektorformel zur Flächenberechnung Z 1 F (B) = x dy − y dx. 2 ∂B Beispiel 17.7 µ ¶ y x v= − 2 , x + y 2 x2 + y 2 I I= ∂B x dy − y dx = x2 + y 2 ZZ (v2,x −v1,y )dx dy = 0 , da v2,x = v1,y (Integrabilitätsbedingung) B Aufgabe: Bestimme F (x, y) : v = grad F . Der Greensche Integralsatz gibt also eine schöne direkte Einsicht in den H Zusammenhang vdw = 0) und der zwischen der Wegunabhängigkeit des Kurvenintegrals über ∂B (bzw. ∂B Integrabilitätsbedingung v1,y = v2,x . Vergleiche dies mit den entsprechenden Aussagen des Kapitels 12 Kurvenintegrale. Vorbereitung des Satzes von Stokes In die Formulierung des Stokesschen Satzes gehen Oberflächenintegrale über Flächenstücke S im R3 und Kurvenintegrale über den Rand ∂S ein. Dazu bedarf es des Begriffes eines zweiseitigen Flächenstückes. Bevor man also den Satz von Stokes formulieren kann, muß noch (teilweise in Wiederholung) Einiges zur Flächendarstellung im Raum gesagt werden. Betrachtet wird ein Flächenstück S ⊂ R3 mit S = {w(u, v) : (u, v) ∈ D}, w : D ⊂ R2 → R3 . D Parameterbereich, Abb. 17.11. z 1 y x Abbildung 17.11: Flächenstück S cos ϕ Beispiel eines Flächenstücks S : sin ϕ (u, v) := (ϕ, z) ∈ [0, 3π 2 ] × [0, 1]. z 17–44 KAPITEL 17. VEKTORANALYSIS Die zu S gehörigen Normalen n= w,u × w,v | w,u × w,v | bzw. n∗ = w,v × w,u = −n | w,u × w,v | heißen Außen- bzw. Innennormalen an S und definieren damit eine Oberseite bzw. Unterseite des Flächenstückes S. S heißt regulär falls w ∈ C 1 (D), w eineindeutig; S heißt stückweise regulär , falls S aus endlich vielen regulären Teilstücken Si besteht, die auf gewissen Kanten stetig ineinander übergehen, Abb. 17.12. n 1 0 0 1 n 11 00 1 0 n Abbildung 17.12: a) Sphäre S ist regulär (ausgenommen Nord- und Südpol) b) Würfeloko S berfläche stückweise regulär S = Sk , Si ∩ Sk Kante 1 Definition 17.5 S sei stückweise regulär. S heißt zweiseitig oder ortientierbar , falls sich eine Oberseite“ so wählen läßt, daß sich der Umlaufsinn geschlossener Kurven auf ” S stetig über die Kanten Si ∩ Sj fortsetzt. übergehen, Abb. 17.13 und 17.14. Abbildung 17.13: a) Sphäre als zweiseitige Fläche b) Zylinderoberfläche stückweise regulär orientierbar Voraussetzungen für den Satz von Stokes V1: Sei S ein zweiseitiges (und damit stückweise reguläres) Flächenstück mit dem Rand ∂S 17.2. INTEGRALSÄTZE 17–45 unstetiger Ü bergang Abbildung 17.14: Möbiusband als nicht orientierbare einseitige Fläche V2: ∂S sei ein Rand, überschneidungsfrei mit einer Parameterdarstellung geschlossener x(t) w(t) = y(t) , t ∈ I so, daß der Umlaufsinn von w(t) auf ∂S mit der Normalen z(t) w,u ×w,v n = |w,u ×w,v | , eine Rechtsschraube beschreibt. V3: Auf einer offenen Menge S̃ mit R3 ⊃ S̃ ⊃ S ist ein Vektorfeld V : S̃ → R3 , V ∈ C 1 (S̃) gegeben, Abb. 17.15. n S 1 0 v ∂S, [w] Abbildung 17.15: Zum Satz von Stokes Satz 17.4 Satz von Stokes Unter den Voraussetzungen V 1 − V 3 gilt H RR RR vdw = (rot v · n)do = rot v · N du dv, S ∂S mit n = N |N | , do D =| N | du dv, N = w,u × w,v . Diskussion: 1. Verbale Umschreibungen des Satzes von Stokes sind: 17–46 KAPITEL 17. VEKTORANALYSIS A. Der Fluß der Wirbeldichte durch eine nicht geschlossene Fläche S ist gleich der Zirkulation über die Randkurve oder B. Die Umströmung einer Fläche (Zirkulation) resultiert aus den Wirbeln in der Fläche. 2. Die geometrische Zuordnung Fläche S zum Rand ∂S ist eindeutig, nicht dagegen eine Zuordnung einer Fläche bei gegebenem Rand ∂S. Nach dem Satz von Stokes sollen alle Flächen S, die eine gegebene geschlossene Kurve ∂S als Rand haben, das gleiche Integral RR rot v · n do haben. S 3. Der Satz vonGreenist der R2 -Spezialfall Stokes: des Satzes von 0 −v2,z v1 , rot v · n = v1,z S ⊂ R2 , v = v2 , Normale n = 0 , rot v = 0 1 v2,x − v1,y v2,x − v1,y , Abb. 17.16. n S ∂S Abbildung 17.16: Satz von Green als Speziallfall des Satzes von Stokes Der Satz von Stokes Z ZZ v1 dx + v2 dy = (v2,x − v1,y )dx dy ∂S S entspricht dann genau der Aussage des Greenschen Satzes. H 4. rot v = 0 im R3 liefert sofort vdw = 0 ∀∂S, also die Wegunabhängigkeit des Kurvenintegrals im Vektorfeld v. ∂S 5. Eine Idee zum Beweis des Satzes wäre eine Projektion in die 3 Koordinatenebenen (siehe z. B. 3.) und dort jeweils eine Anwendung des Greenschen Satzes. Anwendungen des Satzes von Stokes −y 3 Betrachtet wird ein Strömungsfeld v = x3 und eine Schnittkurve W = {(x, y, z) : −z 3 xH2 + y 2 = 1, x + y + z = 1}. Gesucht ist die Zirkulation des Vektorfeldes v längs w (also vdw). W erweist sich als Schnittkurve der Zylinderfläche x2 + y 2 = 1 mit der Ebene W x + y + z = 1. Für die Anwendung des Satzes von Stokes muß eine Fläche S gefunden 17.2. INTEGRALSÄTZE 17–47 werden, deren Rand W ist. Man wähle die einfachste, einen Teil der Ebene x + y + z = 1. 2 2 S = {(x, y, z) : x = u, y= v, z = 1 − u − v}, (u, v) ∈ D = {(u, v) :u + v ≤ 1} 0 1 N 0 1 = N und n = |N rot v = , Normale zu S = Normale zu E = | = 2 2 3(x + y ) 1 1 u die Normalenberechnung √1 1 . Natürlich wäre auch mit w(u, v) = v 3 1 1−u−v durch N = w,u ×w,v möglich. Die Durchlaufrichtung der wird durch die Rechts Randkurve 1 schraubenbedingung mit dem Normalenvektor N = 1 festgelegt. Damit ergibt sich 1 für die Zirkulation I ZZ vdw = W ZZ rot v · N du dv = D Z2π Z1 2 2 3(x + y )dx dy = 0 D 0 3 3r2 · rdr dϕ = 2π · . 4 Jedes andere Flächenstück S mit ∂S = W liefert den gleichen Wert, Abb. 17.17. E w S Abbildung 17.17: Schnittkurve W cos ϕ √ t 2 und W2 = sind 2 Para1− sin ϕ Aufgabe: W1 (t) = √t 2 1 − cos ϕ − sin ϕ 1−t− 1−t meterdarstellungen für die Schnittkurve. Versuche unter Berücksichtigung der Orientierung die Zirkulation direkt zu berechnen. Bemerkung: In der Regel versucht man mit Hilfe des Satzes von Stokes komplizierte ebene Bereichsintegrale auf einfache Kurvenintegrale zurückzuführen. Koordinatenunabhängige Interpretation der Rotation: Zu einer gegebenen Fläche S betrachte man eine S schneidende Kugel K mit dem Radius r. Das Schnittgebilde S ∩ K =: Sr , eine Fläche mit Rand ∂Sr , Abb. 17.18. Auf Sr und ∂Sr soll der Satz von Stokes angewendet werden: 17–48 KAPITEL 17. VEKTORANALYSIS K S 0 1 0 1 Sr 0 1 11 00 01 1 00 11 0 1 0 1 0 0 1 0 1 00 0 1 11 0 1 00 11 0 0 1 1 0w 1 01 0 0 1 01 1 Abbildung 17.18: koordinatenunabhängige Interpretation der Rotation I ZZ vdw = ∂Sr (rot v · n)do Sr Für Oberflächenintegrale mit stetigem Integranden gilt ein Mittelwertsatz, der besagt hier ZZ (rot v · n)do = (rot v · n)(w̃) · O(Sr ), w̃ ∈ int Sr , w̃ → w für r → 0. Sr Hieraus folgt nach Grenzübergang H vdw (rot v · n)(w) = lim r→0 ∂Sr O(Sr ) Der rechte Grenzwert kann als Zirkulation des Vektorfeldes pro Oberflächeneinheit aufgefaßt werden und definiert damit die linke Seite der Gleichung als die Wirbelstärke von v um die Normale n im Punkt w. Die Wirbelstärke ist am größten, wenn rot v k n, Abb. 17.19. Satz 17.5 Satz von Gauß/Divergenzsatz Voraussetzungen: V1: Betrachte einen regulären Bereich B ⊂ R3 mit einer Randfläche ∂B, die orientierbar N und damit stückweise regulär ist. n sei die nach außen gerichtete Normale |N | auf ∂B. V2: Sei B̃ eine offene Menge mit B̃ ⊃ B und v ein Vektorfeld v : B̃ → R3 mit v ∈ C 1 (B̃). 17.2. INTEGRALSÄTZE 17–49 n 111 000 v 11 00 000 00111 11 000 111 00 000 111 rot v11 00 11 000 111 0 1 11 001 111 000 0 w S Abbildung 17.19: Zur Wirbelstärke eines Vektorfeldes ∂B1 B ∂B2 1 0 n ∂B3 Abbildung 17.20: Zum Satz von Gauß Unter den Voraussetzungen V 1 und V 2 gilt: RRR RR RR div v dV = (v · n)do = (v · N )du dv. B mit n = ∂B N |N | , D do =| N | du dv, N = w,u × w,v , Abb. 17.20. Diskussion: (1) Eine verbale Umschreibung des Gaußschen Satzes im Sinne der Strömungslehre wäre: Das Integral der Quelldichte div v über B (Ergiebigkeit) ist gleich dem Fluß der Feldgröße v durch die Berandung ∂B (Nettoergiebigkeit). Es können also im Inneren von B mehrere Quellen und Senken vorhanden sein; die Nettoergiebigkeit wird durch den Fluß von v durch die Oberfläche bestimmt. (2) Im Sinne der Strömungslehre sind also die mathematisch schon etwas anspruchsvolleren Integralsätze von Stokes und Gauß einfache Bilanzgleichungen. xy 2 Beispiel 17.8 Gesucht ist der Fluß des Feldes v = x2 y durch die Oberfläche des y Körpers B := {(x, y, z) : x2 + y 2 ≤ 1, −1 ≤ z ≤ 1} (Zylinder). 17–50 KAPITEL 17. VEKTORANALYSIS Nach dem Integralsatz von Gauß gilt für den Fluß F (v) ZZ ZZZ F (v) = (v · n)do = div v dV, B ∂B da B regulär, ∂B (= Zylinderoberfläche) stückweise regulär und zweiseitig und V ein C 1 Vektorfeld ist. Also ergibt für den Fluß F (v) mit div v = y 2 + x2 ZZZ Z1 Z2π Z1 2 F (v) = 2 r2 · r dr dϕ dz = π. (x + y )dx dy dz = −1 0 B 0 Hier ist natürlich das räumliche Bereichsintegral entschieden leichter zu berechnen als der Fluß direkt als Oberflächenintegral über die 3 regulären Teilflächen ∂Bi (Boden, Deckel und Zylindermantel). Koordinatenunabhängige Interpretation der Divergenz Bisher wurde für div v = v1,x + v2,y + v3,z die Bezeichnung Quelldichte durch Definition eingeführt bzw. durch Bilanzdiskussion an Kugeln in Kegeln bei einem speziellen Vektorfeld motiviert. Der Satz von Gauß läßt nun eine koordinatenfreie Interpretation zu: Betrachte eine Kugel Kr = {w0 ∈ R3 :| w − w0 |≤ r}, w so daß Kr ⊂ B. Falls v ∈ C 1 (B̃) das gegebene Vektorfeld ist, sind für Kr und ∂Kr die Voraussetzungen des Gaußschen Satzes erfüllt und es gilt, Abb. 17.21, ZZZ ZZ (v · n)do. div v dV = Kr ∂Kr 11 00 11w∗ 00 11 00 111 000 1 w 0 111 000 K r B Abbildung 17.21: koordinatenunabhängige Interpretation der Divergenz Die linke Seite dieser Gleichung läßt sich aufgrund der Stetigkeit des Integranden nach einem Mittelwertsatz für räumliche Bereichsintegrale umformen: ∃w∗ ∈ Kr , so daß ZZZ div v dv = div v(w∗ ) · V (Kr ). Kr 17.2. INTEGRALSÄTZE 17–51 Für r → 0 folgt wegen v ∈ C 1 : div v(w∗) → div v(w) und damit 1 div v(w) = lim r→0 V (Kr ) ZZ (v · n) do. ∂Kr Der Fluß durch die Oberfläche pro Volumeneinheit ist gleich div v(w) =: Quelldichte . Bezeichnung: w = (x, y, z) heißt Quelle des Vektorfeldes v, falls div v(w) > 0 ist und w(x, y, z) heißt Senke des Vektorfeldes v, falls div v(w) < 0 ist. Ein Vektorfeld heißt in B quellenfrei, falls div v(w) = 0 ∀w ∈ B. Beispiel 17.9 Innerhalb und außerhalb eines unendlichlangen Zylinder Z mit Radius % (Leiter) wird durch einen Strom I ein Magnetfeld induziert, Abb. 17.22. z I y H x Abbildung 17.22: Magnetfeld in einem Leiter H(x, y, z) = −y I x , 2πr2 0 −y I x , 2π%2 0 r>%, r = x2 + y 2 r≤% H ist stetig, insbesondere für r = %, H ist konzentrisch zur Mittelfaser des Leiters sowohl I I innerhalb als auch außerhalb des Leiters. Wegen |H| = 2πr 2 · r, r > % und |H| = 2π%2 · r, r ≤ %, Abb. 17.23. folgt: |H| wächst mit r linear bis r = % und fällt danach wie 1r . Dieses Feld ist quellenfrei: ³ ³ ´ ´ −y y·2x x·2y I x I r > % : div H = 2π div x2 +y2 , y2 +x2 , 0 = 2π (x2 +y2 )2 − (x2 +y2 )2 = 0, r ≤ % : div H = I 2π%2 div (−y, x, 0) = 0. 17–52 KAPITEL 17. VEKTORANALYSIS 2π|H| I 1 % % r Abbildung 17.23: Zum Magnetfeld im Leiter v1 (x, y) Beispiel 17.10 Betrachte das spezielle Vektorfeld v = v2 (x, y) in einem zylindri0 2 schen Bereich B = B̄ × [0, 1] B̄ ⊂ R Normalbereich, Abb. 17.24. 1 B 0 B̄ Abbildung 17.24: Zylindermantel: ∂B = 3 S i=1 dermantel Fi : Grundfläche B̃, F2 : Deckfläche, F3 : Zylin- Dann gilt nach dem Gaußschen Integralsatz: ZZZ ZZ Z1 Z Z div v dV = (v1,x + v2,y )dx dy dz = (v1,x + v2,y )dx dy und B 0 ZZ ZZ (v · n)do = ZZ . . . do + F1 ∂B B̄ B̄ ZZ . . . do + F2 ZZ . . . do = F3 (v · n)do, da die F3 v1 0 0 Normalen n1 = 0 zu F1 und n2 = 0 zu F2 senkrecht auf v = v2 0 1 −1 stehen. Für F3 wird eine durch ∂ B̄ induzierte Parametrisierung gewählt: F3 = {(x, y, z) : x = x(t), y = y(t), z = z, t ∈ [a, b], z ∈ [0, 1)} und x(t), y(t) ist die vorgegebene Parameterdarstellung für ∂ B̃. Der Außennormalenvektor 17.2. INTEGRALSÄTZE 17–53 ẋ 0 ẏ N = w,t × w,z = ẏ × 0 = −ẋ 0 1 0 erlaubt dann die Berechnung RR RR R1 Rb R (v · n)do = (v · N )dt dz = v1 ẏ − v2 ẋdt dz = v1 dx − v2 dy. a 0 D ∂B ∂B RR R Also folgt (v1,x + v2,y )dx dy = v1 dy − v2 dx und der Satz von Green erweist sich auch B̄ ∂ B̄ als Spezialfall des Gaußschen Satzes. Beispiel 17.11 In Fortsetzung von Beispiel (17.9) soll der Fluß des Vektorfeldes H durch eine Fläche F , die nicht parallel zur (x, y)-Ebene ist, berechnet werden. Nach dem Satz von Stokes gilt ZZ I (H · n)do = A dw, falls H = rot A F ∂F In Beispiel (17.9) wurde div H = 0 gezeigt, woraus im Falle der Sternförmigkeit des Zylinders nach dem Zerlegungssatz auf die Existenz eines Vektorfeldes A mit H = rot A (Vektorpotential) geschlossen werden darf. Der Rest der Betrachtungen in diesem Beispiel ist der Bestimmung eines Vektorpotentials A zu gegebenem H = rot A gewidmet. Für dieses A müßte dann noch ein Kurvenintegral über ∂F berechnet werden. Bestimmung eines Vektorpotentials A1 x 1. Fall: r ≤ % , A := A2 , w = y , A3 z Es muß also gelten I − 2π% A2,z − A3,y 2y I A3,x − A1,z rot A = = 2π%2 x A1,y − A2,x 0 A = A(w) =H (1) (2) (3) Nach (3) folgt A1,y = A2,x ⇔ ∃B(x, y, z) : A1 = B,x , A2 = B,y ⇒ A2,z = B,yz und nach (IB) (1) A3,y = I y 2π%2 + B,yz , d. h., A3 = I y2 4π%2 + B,z + w(x) (eigentlich: . . . + w̃(z, x) + w(x), w̃ kann in B,z eingehen). Nach (2) folgt nun A3,x = B,zx + w0 (x) = B,xz + w0 (x) = I x, 2π%2 A3 = w(x) = I x2 4π%2 I · r2 + B,z , 4π%2 + K, und A1 = B,x , A2 = B,y . D. h., A ist bis auf grad B mit willkürlichem B ∈ C 2 bestimmt. 0 + grad B(w) =: AB (w) 0 A(w) = I 2 r 4π%2 I x, 2π%2 also 17–54 KAPITEL 17. VEKTORANALYSIS I Wähle z. B. ³ 2B so,´daß AB (w) → 0 für r → %. Mit B1 := − 4π z folgt I r AB1 = 4π − 1 · k → 0, für r → %. %2 2. Fall: r > % 0 + grad B(w), B ∈ C 2 willkürlich. Durch 0 Analoges Vorgehen bringt A(w) = I 2π ln r ³ 2´ I I ln %r 2 · k, so daß für w̄ = (x, y, z) Wahl von B2 := − 2π (ln %)z ergibt sich AB2 (w) = 4π mit x2 + y 2 + z 2 = r2 = %2 AB1 (w̄) = AB2 (w̄) = 0 (Stetigkeit) folgt. Diskussion: Es läßt sich sogar eine allgemeine Form zur Bestimmung von A angeben: In einem sternförmigen Bereich B ⊂ R3 sei wo ein Zentrum. Dann liefert das vektorielle Parameterintegral Z1 A(w) := (tH(wo + t(w − wo )) × (w − wo )) dt 0 oder speziell für wo := 0 Z1 A(w) = t(H(tw) × w) dt 0 eine Lösung der Vektorgleichung H = rot A. Aufgabe: Zeige dies unter Verwendung der Regeln für die Ableitung von Parameterintegralen und der Umrechnungsformel für rot (B × C). Beispiel 17.12 (siehe Vorbeispiel Maxwellsche Gleichungen beim Isolator) RR Wegen div H = 0 folgt nach dem Gaußschen Satz (H · n) do = 0, d. h., der magnetische ∂B Fluß durch jede geschlossene Fläche ∂B im R3 ist Null (keine Quellen). Wegen div E = %² folgt nach Gauß ZZ ZZ 1 % dV = QB , (E · n) do = ² ² ∂B B wobei % die Ladungsdichte und QB dieRRGesamtladung auf B sind. Die Gesamtladung QB wird also durch den elektrischen Fluß (E · n) do durch die Oberfläche bestimmt. ∂B Anwendungen 1. Zur Wärmeleitungsgleichung Betrachtet wird ein erwärmter Körper K mit konstanter Massedichte %, konstanter spezifischer Wärme σ und konstanter Wärmeleitfähigkeit K. Der Zustand von K wird durch 17.2. INTEGRALSÄTZE 17–55 die Temperatur T = T (x, y, z, t) beschrieben. Die Wärmemenge dW , die in einem infinitesimalen Volumenelement dV gespeichert ist, wird mit dW = σ%T (x, y, z, t) dV angegeben und daraus folgt für die Gesamtwärme in einem regulären Teilbereich B von K ZZZ W (t) = σ%T (x, y, z, t) dV. B dW Nach RR Fourier wird für den Wärmeaustausch über die Oberfläche ∂B angesetzt dt = k(grad T · n) do, d. h., er ist proportional der Projektion des Gradienten von T auf ∂B die Normale an die Oberfläche. Der Gaußsche Integralsatz gestattet die Überführung des Oberflächenintegrals in ein räumliches Bereichsintegral ZZZ ZZZ dW = k div grad T dV = k 4 T dV dt B B und nach Differentiation des Parameterintegrals W (t) ZZZ dW = σ %T,t dV ∀B dt B D. h., die Temperatur T = T (x, y, z, t) genügt einer partiellen Differentialgleichung T,t = k σ% (T,xx + T,yy + T,zz ) oder T,t = k̄ 4 T der sogenannten Wärmeleitungsgleichung . Es wird der Gegenstand des Kapitels 19 Partielle Differentialgleichungen sein, ob man aus dieser Gleichung bei Kenntnis der Temperatur auf der Oberfläche ∂K und bei Kenntnis der Temperatur zu einem Zeitpunkt t = to (Rand- und Anfangswerte) auf die Temperatur in jedem inneren Punkt von K zu jedem Zeitpunkt schließen kann. 2. Zur Hydrodynamik: (Abb. 17.25) Betrachte eine strömende Flüssigkeit, darin ein regulärer Festkörper B. Die Zustandsbeschreibung wird durch eine orts- und zeitabhängige Massedichte % = %(w, t) geliefert. Das Geschwindigkeitsfeld sei v ∈ C 1 (R3 ). Die Gesamtmasse der Flüssigkeit, die aus B pro Zeiteinheit ausströmt ist ZZ dM (t) = %(v · n) do. dt ∂B Diese Masseänderung läßt sich auch durch ZZZ ZZZ d %(w, t) dV = %,t (w, t) dV dt B B 17–56 KAPITEL 17. VEKTORANALYSIS B Abbildung 17.25: Zur Kontinuitätsgleichung der Hydrodynamik beschreiben. Der Integralsatz von Gauß liefert ZZZ ZZ ZZZ %,t dV = %(v · w)do = div (% · v)dV ∀ Testkörper B. B B ∂B Also muß %(w, t) und v(w) der sogenannten Kontinuitätsgleichung der Hydrodynamik genügen div (% · v) = %,t . Aufgabe: Diese Gleichung soll für verschiedene Spezialfälle der Massedichte %(w, t) dikutiert werden. Integralformeln von Green Diese Formeln sind ein sehr nützliches Hilfsmittel beim Umformen von Gleichungen in Physik und Technik, beim Aufstellen und Lösen von partiellen Differentialgleichungen, insbesondere auch bei der Begründung von Verfahren zur näherungsweisen Lösung von speziellen partiellen Differentialgleichungen. Bausteine zur Begründung der Greenschen Formeln sind hauptsächlich die bisher behandelten Integralsätze. (1) Aus dem Integralsatz von Gauß ZZZ ZZ div v dV = (v · n) do B ∂B folgt speziell für v = grad f ZZZ ZZZ ZZ div grad f dV = 4f dV = (grad f · n) do. B B ∂B ∂f (2) Die Richtungsableitung ∂n einer Funktion f (x, y, z) in Richtung n führt dann zu ZZZ ZZ ∂f 4f dV = do. ∂n B ∂B h ∂f ∂n i = (grad f · n) 17.3. DIFFERENTIALOPERATOREN UND KOORDINATENTRANS-FORMATION17–57 (3) Für zwei Funktionen f, g ∈ C 2 (R3 ) gilt: div (g grad f ) = (grad f · grad g) + g 4 f Beweis: div (gf,x , gf,y , gf,z ) = g,x f,x + gf,xx + · · · + g,z f,z + gf,zz = (grad g · grad f ) + g 4 f (4) Der Satz von Gauß für v = g grad f liefert RRR RRR RRR div (g grad f ) dV = (grad g · grad f ) dV + g 4 f dV B B B RR = (g grad f · n) do ∂B RR ∂f = g ∂n do ∂B Hieraus ergeben sich die Formeln von Green RR ∂f RRR RRR g 4 f dV = g ∂n do (grad g · grad f ) dV + 1. Formel: B B ∂B 2. Formel: (f = g) ZZZ ZZZ ZZ ∂g (grad g)2 dV + g 4 g dV = g do ∂n B B ∂B 3. Formel: (Vertausche f und g in der 1. Formel, bilde Differenz) ¶ ZZZ ZZ µ ∂f ∂g g −f do (g 4 f − f 4 g) dV = ∂n ∂n G 17.3 ∂B Differentialoperatoren und Koordinatentransformation Beim Lösen von partiellen Differentialgleichungen auf zylindrischen oder kugelförmigen räumlichen Bereichen B ist der Übergang von kartesischen Koordinaten (x, y, z) zu Zylinderbzw. Kugelkoordinaten (r, ϕ, z) bzw. (r, ϕ, ψ) sehr zweckmäßig, insbesondere dann, wenn sich der Rand des Bereiches B als Koordinatenfläche des gewählten Koordinatensystems darstellen läßt. Damit lassen sich Randbedingungen einfach formulieren und Integrationsgrenzen konstant halten. Beim Übergang von einem Koordinatensystem zu einem anderen müssen natürlich auch die Differentialoperatoren (grad, div, 4), die zur Formulierung der partiellen Differentialgleichung benutzt werden, mittransformiert werden. Dies soll in diesem Teilkapitel exemplarisch für den Fall der Transformation kartesischer Koordinaten in Zylinderkoordinaten geschehen. 17–58 KAPITEL 17. VEKTORANALYSIS 1. Wiederholung und Zusammenstellung von Eigenschaften der Zylinderkoordinaten x Die kartesischen Koordinaten w = y induzieren das orthogonale Dreibein (i, j, k) := z (ex , ey , ez ), wobei z. B. ex = i tangential an die Koordinatenlinie l (y = const. und z = const.) ist (für ey , ez gilt Analoges), Abb. 17.26. y z k j i l(y = c, z = d) x Abbildung 17.26: orthogonales Dreibein für kartesische Koordinaten r cos ϕ x Eine Transformation T, w = T (w̄) = r sin ϕ überführt w = y in die Zylinz z r derkoordinaten w̄ := ϕ . Diese Transformation ist orthogonal falls die zugehörige z Jacobimatrix (T,w̄ ) orthogonal für alle (r, ϕ, z) ist (d. h. det T,w̄ 6= 0, (T,w̄i · T,w̄j ) = δij ). Da T,w̄ = (T,r , T,ϕ , T,z ) genügt der Nachweis, daß die Spaltenvektoren von T,w̄ ein Orthonormalsystem sind. Betrachte also die Tangenten an den Koordinatenlinien: −r sin ϕ = r cos ϕ oder normiert 0 − sin ϕ (a) r = const., z = const. : ẽϕ := T,ϕ eϕ = cos ϕ 0 cos ϕ (b) z = const., ϕ = const. er = sin ϕ 0 0 0 . (c) r = const., ϕ = const. ez = 1 Damit ist (eϕ , er , ez ) ein (nichtkonstantes) orthonormales Dreibein für die Zylinderkoordinaten, Abb. 17.27. 17.3. DIFFERENTIALOPERATOREN UND KOORDINATENTRANS-FORMATION17–59 z = const, r = const r = const, φ = const Abbildung 17.27: orthonormales Dreibein (eϕ , er , ez ) und Koordinatenlinien für Zylinderkoordinaten ro Beispiel 17.13 orthonormales Dreibein in w̄o = 3π 2 zo : 1 0 0 eϕ = 0 , er = −1 , ez = 0 , Abb. 17.28. 0 0 1 z 11 00 y x Abbildung 17.28: spezielles orthogonales Dreibein 2. Gradient in Zylinderkoordinaten Betr.: f : R3 → R1 , f ∈ C 1 (R3 ), f sei also ein glattes Skalarfeld. Dann gilt f (w) = f (r cos ϕ, r sin ϕ, z) =: f˜(r, ϕ, z) = f˜(r(x, y), ϕ(x, y), z) und grad f = f,x = (f˜,r r,x + f˜,ϕ ϕ,x ) i + f,y i + (f˜,r r,y + f˜,ϕ ϕ,y ) j + f,z k j + f˜,z k ϕ = (f˜,r cos ϕ + f˜,ϕ ( − sin )) i + (f˜,r sin ϕ + f˜,ϕ cosr ϕ ) j + f˜,z k (siehe unten) r − sin ϕ cos ϕ 0 f˜,ϕ ˜ ˜ sin ϕ 0 + r cos ϕ = f,r +f,z 0 1 0 Also grad f = f˜,r er + f˜,ϕ r eϕ + f˜,z ez und speziell in ϕ = 0 : grad f = (f,x , f,y , f,z ) = 17–60 (f˜,r , KAPITEL 17. VEKTORANALYSIS f˜,ϕ ˜ ϕ=0 r , f,z ) | Hilfsrechnung zur Bestimmung von r,x . . . ϕ,y : ϕ p r,x = √ 2x 2 = r cos = cos ϕ r x +y r = r(x, y) = x2 + y 2 y ϕ = ϕ(x, y) = arctan xy ⇒ ϕ,x = − xy2 2 = 2−y 2 = − sin ϕ , r x +y 1+( x ) z=z r,y = sin ϕ, ϕ,y = cosr ϕ 3. Divergenz in Zylinderkoordinaten: Betrachtet wird V : R3 → R3 , v ∈ C 1 (R3 ) (glattes Vektorfeld) und es soll für v = v(w) = v(r cos ϕ, r sin ϕ, z) =: ṽ(r, ϕ, z) die Divergenz berechnet werden. Vorausgesetzt wird eine Zerlegung von ṽ über dem Dreibein (er , eϕ , ez ): 0 cos ϕ − sin ϕ v(w) = ṽ(r, ϕ, z) = ṽ1 sin ϕ + ṽ2 cos ϕ + ṽ2 0 = ṽ1 er + ṽ2 eϕ + ṽ3 ez . 1 0 0 div v = v1,x + v2,y + v3,z = (ṽ1,r r,x + ṽ1,ϕ ϕ,x ) cos ϕ + ṽ1 (− sin ϕ)ϕ,x +(ṽ2,r r,x + ṽ2,ϕ ϕ,x )(− sin ϕ) + ṽ2 (− cos ϕ) · ϕ,x +(ṽ1,r r,y + ṽ1,ϕ ϕ,y ) sin ϕ + ṽ1 cos ϕ · ϕ,y +(ṽ2,r r,y + ṽ2,ϕ ϕ,y ) cos ϕ + ṽ2 (− sin ϕ)ϕ,y + ṽ3,z . Unter Verwendung der Formeln der Hilfsrechnung aus 2. ergibt sich div v = 1r ṽ2,ϕ + ṽ1,r + 1 r ṽ1 + ṽ3,z . Bei einer zugrunde liegenden Zerlegung ṽ(r, ϕ, z) = ṽ1 er + ṽ2 eϕ + ṽ3 ez , ṽ ∈ C 1 (R3 ) gilt also div ṽ = 1r (rṽ1 ),r + 1r ṽ2,ϕ + ṽ3,z . 4. Transformation der Laplaceschen Differentialgleichung 4u = u,xx + u,yy + u,zz = 0, u = u(x, y, z), u ∈ C 2 (R3 ) u(w) = u(x, y, z) = u(r cos ϕ, r sin ϕ, z) =: ũ(r, ϕ, z) = ũ(r(x, y), ϕ(x, y), z) Für die partiellen Ableitungen u,xx bis u,zz ist die Mehrfachanwendung der Kettenregel erforderlich: u,x = ũ,r · r,x + ũ,ϕ · ϕ,x u,y = ũ,r · r,y + ũ,ϕ · ϕ,y u,z = ũ,z und 2 2 + ũ u,xx = ũ,rr r,x ,rϕ r,x ϕ,x + ũ,r r,xx + ũ,ϕϕ ϕ,x + ũ,ϕr ϕ,x ϕ,y + ũ,ϕ ϕ,xx 2 u,yy = ũ,rr r,y + 2ũ,rϕ r,y ϕ,y + ũ,r r,yy + ũ,ϕϕ ϕ2,y + ũ,ϕ ϕ,yy u,zz = ũ,zz Nach Hilfsrechnung von Punkt 2. gilt r,x = cos ϕ und r,y = sin ϕ ϕ,x = − sinr ϕ ϕ,y = cos ϕ r 17.3. DIFFERENTIALOPERATOREN UND KOORDINATENTRANS-FORMATION17–61 Hieraus folgt 2 sin2 ϕ r,yy = cosr ϕ r , − cos ϕ·ϕ,x ·r+sin ϕ·r,x = 2 sin rϕ2cos ϕ r2 −2 sin ϕ cos ϕ . r2 r,xx = − sin ϕ · ϕ,x = ϕ,xx = ϕ,yy = Damit läßt sich nun 4 = 0 umformen u,xx + u,yy + u,zz = ³ ´ 2 + ũ,r sinr ϕ ũ,rr cos2 ϕ + 2ũ,rϕ − sin ϕr cos ϕ ³ ´ 2 +ũ,ϕϕ sinr2 ϕ + ũ,ϕ 2 sin rϕ2cos ϕ ³ ´ ³ 2 ´ +ũ,rr sin2 ϕ + 2ũ,rϕ sin ϕrcos ϕ + ũ,r cosr ϕ ³ ´ 2 +ũ,ϕϕ cosr2 ϕ + ũ,ϕ −2 sinrϕ2 cos ϕ + ũ,zz = ũ,rr + 1 ũ r2 ,ϕϕ + u,r · 1 r + ũ,zz . Die Laplacesche Differentialgleichung 4u = 0 hat also für eine Funktion u(w(r, ϕ, z) =: ũ(r, ϕ, z) in Zylinderkoordinaten die Form ũ,rr + 1r ũ,r + 1 ũ r2 ,ϕϕ + ũ,zz = 0 . Bemerkung: Insbesondere ergibt sich aus der Laplacegleichung im R2 4u = u,xx + u,yy = 0 die Laplacegleichung in Polarkoordinaten 1 1 ũ,rr + ũ,r + 2 ũ,ϕϕ = 0. r r Die Laplacegleichungen in Polar- bzw. Zylinderkoordinaten erscheinen komplizierter gebaut als die Originalgleichungen. Diese Nachteile werden aber häufig durch eine einfache Randbeschreibung kompensiert, falls man ein Anfangs-/Randwertproblem oder ein Randwertproblem mit kreisförmigen bzw. zylindrischem Randgebilde vorliegen hat. 5. Zusatz: Beispiel für eine partielle Differentialgleichung, die durch Transformation auf Zylinderkoordinaten gelöst wird. Gesucht ist u = u(x, y), u : D → R1 , D = {(x, y) · x2 + y 2 ≤ R2 }, u ∈ C 2 (D) mit 4u = u,xx + u,yy = 0 und u(x, y) |∂D = 1 + 1 R (x + 2y) |x2 +y2 =R2 (Randwertproblem), Abb. 17.29. Gesucht ist also eine solche C 2 -Funktion u(x, y) die über ∂D vorgeschriebene Werte annimmt (Randwerte) und über D der Laplacegleichung genügt. Die Gestalt von D und die Randbedingung über ∂D erfordern die Transformation auf Polarkoordinaten: x = r cos ϕ, y = r sin ϕ: u(x, y) = u(r cos ϕ, r sin ϕ) =: v(r, ϕ) 17–62 KAPITEL 17. VEKTORANALYSIS z u(x, y) u |∂G x y D ∂D Abbildung 17.29: ein Randwertproblem 4u = 0 ⇔ v,rr + 1r v,r + 1 v r2 ,ϕϕ =0 RB: u(x, y) |∂D = v(R, ϕ) = 1 + 1 R (r cos ϕ + 2r sin ϕ) |r=R = 1 + cos ϕ + 2 sin ϕ Lösungsmethode: Separationsansatz v(r, ϕ) := R(r)φ(ϕ) (6= 0). Mit diesem Ansatz bekommt die Differentialgleichung für v die Form R00 (r)φ(ϕ) + 1r R0 (r)φ(ϕ) + r2 R00 (r) R(r) + rR0 (r) R(r) 00 (ϕ) = − φφ(ϕ) 1 R(r)φ00 (ϕ) r2 =0 oder nach Sortierung ∀(r, ϕ) ∈ D. Dies bedeutet, daß die rechte und linke Seite konstant (= λ) sein müssen. Damit zerfällt die partielle Differentialgleichung in zwei gewöhnliche Differentialgleichungen mit dem Kopplungsparameter λ: φ00 + λφ = 0 r2 R00 + rR0 − λR = 0 für die Ansatzfunktionen R(r) und φ(ϕ). Da φ(ϕ) 2π-periodisch ist, muß λ > 0 sein, und die allgemeine Lösung ergibt sich nach Ansatz φ(ϕ) = eµϕ zu √ √ φ(ϕ) = C cos λϕ + d sin λϕ. Die R-Differentialgleichung ist eine Eulersche und kann mit dem Ansatz R(r) = rn über √ r2 (n − 1)nrn−1 + r · nru−1 − λrn = 0, n2 = λ und n = λ gelöst werden. Es gibt also abzählbar unendlich viele Kopplungsparameter λn = n2 , n = 0, 1, 2, . . . und damit auch Lösungen vn = rn (cn cos nϕ + dn sin nϕ), n = 0, 1, 2, . . .. Da das Problem linear ist, ist natürlich auch n X (cn cos nϕ + dn sin nϕ)rn ∀n ṽ = n=0 17.3. DIFFERENTIALOPERATOREN UND KOORDINATENTRANS-FORMATION17–63 Lösung und damit v= ∞ X (cn cos nϕ + dn sin nϕ)rn . n=0 Die cn , dn müssen so bestimmt werden, daß die Randbedingung erfüllt wird: v |∂D = ∞ P 1 + cos ϕ + 2 sin ϕ = (cn cos nϕ + dn sin nϕ)Rn . Damit sind die cn und dn quasi die 0 Fourierkoeffizienten der linken Seite, die aber im vorliegenden Fall sofort abgelesen werden können: co = 1, c1 R = 1, d1 R = 2, ci = 0, i ≥ 2, di = 0, i ≥ 2. Damit ergibt sich eine Lösung v(r, ϕ) = 1 + r 2r cos ϕ + sin ϕ, R R v(x, y) = 1 + x 2 + y. R R Für dieses v gilt v(R, ϕ) = 1 + cos ϕ + 2 sin ϕ und 1r v,r + 1 v r2 ,ϕϕ = 0. 17–64 KAPITEL 17. VEKTORANALYSIS Kapitel 18 Variationsrechnung 18.1 Problemstellung an Beispielen Beispiel 18.1 Problem der minimalen Bogenlänge. Von allen C 2 -Kurven (t, x(t)), die die Punkte P1 und P2 verbinden, ist diejenige gesucht, die die kleinste Bogenlänge hat, Abb. 18.1. Mathematische Problemformulierung: Das Funktional x x2 x1 P2 P1 t1 t2 t Abbildung 18.1: zulässige Kurven Z t2 I(x) = p 1 + ẋ2 dt t1 soll über der Menge D = {x : x ∈ C 2 [t1 , t2 ], x(t1 ) = x1 , x(t2 ) = x2 } minimiert werden. Diskussion: (1) Natürlich ’weiß’ man, daß die Gerade die kürzeste Verbindung zweier Punkte in der Ebene ist. Wie kann man jedoch die Lösung des Problem systematisch angehen? (2) Die Kanditaten dieses Optimierungsproblems sind also Funktionen aus dem Funktionenraum C 2 [t1 , t2 ]. (3) Das Minimierungsproblem läßt sich auch in anderen Funktionenräumen (z.B. im C 1 [t1 , t2 ] 18–65 18–66 KAPITEL 18. VARIATIONSRECHNUNG oder im D1 [t1 , t2 ]) behandeln. Hierzu wird auf Standardliteratur der Variationrechnung verwiesen. Beispiel 18.2 Problem der minimalen Rotationsfläche, Abb. 18.2 Unter allen C 2 -Kurven, die P1 = (t1 , x1 ) und P2 = (t2 , x2 ) verbinden, ist diejenige x x2 x1 t1 t2 t Abbildung 18.2: minimale Rotationsfläche gesucht, die einen Rotationskörper kleinster Oberfläche erzeugt. Mathematische Problemformulierung: Z t2 M (x) := 2π p x(t) 1 + ẋ2 dt → min t1 über D = {x : x ∈ C 2 [t1 , t2 ], x(t1 ) = x1 , x(t2 ) = x2 }. Dabei ist M (x) die Mantelfläche des durch x(t) erzeugten Rotationskörpers. Bemerkung: Eine experimentelle Lösung des Problems läßt sich mit Hilfe einer homogenen Seifenlösung gewinnen: Man untersucht die Oberfläche einer Seifenhaut, die sich als Schlauch, erzeugt durch zwei Drahtringe mit den Radien x1 und x2 , ergibt. Hier entspricht die minimale Oberfläche einer minimalen Oberflächenspannung. Beispiel 18.3 Problem der Brachystochrone, Johann Bernoulli 1696, Abb. 18.3 Gesucht ist diejenige Kurve (x, y(x)), die P1 und P2 verbindet und die ein Massepunkt reibungsfrei in kürzester Zeit durchläuft (Schwereeinfluß). Die Formel für die Durchlaufungszeit T (y) in Abhängigkeit von der gewählten Kurve y(x) ergibt sich nach dem Energiesatz: m 2 v (x) − mgy(x) = const.(:= 0). 2 √ Hieraus folgt wegen v = ds 2gy und dt = 18.2. DAS FESTRANDPROBLEM DER VARIATIONSRECHNUNG b P1 a 1 0 000000 111111 1 0 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 000000 111111 00 11 111111 000000 11 00 P2 18–67 x y Abbildung 18.3: Brachistochrone q 1 + y 0 2 (x) p dx 2gy(x) q Z a 1 + y 0 2 (x) p dt = dx. 2gy(x) 0 ds dt = √ = 2gy Z T T (y) = 0 Mathematisches Problem: Minimiere T (y) über D := {y : y ∈ C 2 [0, a], y(0) = 0, y(a) = b} 18.2 Das Festrandproblem der Variationsrechnung Die in 18.1 erwähnten Beispiele (und weitere) lassen sich zur Grundaufgabe der Variationsrechnung zusammenfassen ( Festrandproblem ): Z t2 I(x) = f (t, x(t), ẋ(t)) dt → min t1 über D = {x : x ∈ C 2 [t1 , t2 ], x(t1 ) = x1 , x(t2 ) = x2 }. Dabei ist f : R3 → R1 eine beliebige Funktion mit f ∈ C 2 (R3 , R1 ) und die t1 , t2 , x1 , x2 sind fest. Definition 18.1 (1) x ∈ D ist ein globales Minimum, falls I(x) ≤ I(x), ∀x ∈ D. (2) x ∈ D ist ein lokales Minimum, falls I(x) ≤ I(x) ∀x ∈ D mit kx − xkC 1 := max{max |x(t) − x(t)|, max |ẋ(t) − ẋ(t)|} < ε. [t1 ,t2 ] [t1 ,t2 ] 18–68 KAPITEL 18. VARIATIONSRECHNUNG Ein solches Minimum heißt auch schwaches lokales Minimum. Es werden nur solche x(t) und ẋ(t) zur Konkurenz zugelassen, die sich in einem ε-Schlauch um x(t) und ẋ(t) befinden. (3) Läßt man eine umfangreichere Konkurenzmenge zu x für die Optimierung zu, spricht man von einem starken lokalen Minimum: I(x) ≤ I(x) ∀x ∈ D mit kx − xkC 0 := max |x(t) − x(t)| < ε [t1 ,t2 ] (keine Einschränkungen an die Wahl von ẋ(t)). Notwendige Optimalitätsbedingungen Idee: Vergleiche x(t) mit speziellen x(t) := x(t, a), a ∈ R oder a ∈ U (0), also einer speziellen Vergleichskurvenschar. Für die Zulässigkeit dieser Schar muß gefordert werden: (i) x(t) = x(t, 0), das vorliegende x(t) soll für den speziellen Parameter a = 0 in der Schar enthalten sein (Einbettungsbedingung), (ii) x(t1 , a) = x1 , x(t2 , a) = x2 ∀a ∈ U (0), alle Exemplare der Schar sollen den Randbedingungen genügen. (iii) x(t, ·) ∈ C 1 (U (0)), die Schar soll bzgl. des Parameters a stetig differenzierbar sein, (iv) x(·, a) ∈ C 2 [t1 , t2 ] ∀a, alle Exemplare der Schar sollen bezüglich t zweimal stetig differenzierbar sein. Es ist relativ leicht solche Scharen anzugeben: Wähle eine Funktion h(t) mit h ∈ C 2 [t1 , t2 ] und h(t1 ) = h(t2 ) = 0. Dann sind für x(t, a) := x(t) + ah(t) die Bedingungen (i) - (iv) erfüllt. (Überprüfen!) Geometrische Veranschaulichung: Abb. 18.4 o Bezeichnung: C 2 [t1 , t2 ] := {y : y ∈ C 2 [t1 , t2 ], y(t1 ) = 0, y(t2 ) = 0} x x x x(t, a) x(t) a = −1 a=0 a=1 h(t) t1 t2 t t1 t2 t t1 t2 t Abbildung 18.4: zulässige Vergleichskurvenschar Dann gilt für die Kurvenschar x(t) + ah(t) = x(t, a) : Für zulässige x(t) ist x(t, a) zulässig, o falls h ∈ C 2 [t1 , t2 ]. 18.2. DAS FESTRANDPROBLEM DER VARIATIONSRECHNUNG 18–69 Weitere Betrachtungen erfordern das Fundamentallemma der Variationsrechnung: Für beliebige k ∈ C 0 [t1 , t2 ] gilt: Z b o k(t)g(t) dt = 0 ∀g ∈ C 2 [a, b] ⇒ k(t) ≡ 0 auf [a, b]. a indirekter Beweis: Annahme: ∃t ∈ [a, b] mit k(t) > 0. Dann gibt es eine Umgebung U (t) mitTk(t) > 0 ∀t ∈ U (t). Dort konstruiere man ein spezielles g ∈ C 2 mit g(t) > 0 auf U (t) [a, b] und Rb g(t) = 0 sonst. Für dieses g(t) ist dann a k(t)g(t) dt > 0, im Widerpruch zur Prämisse des Satzes. Falls nun x(t) das Funktional I(x) minimiert, muß I(x) ≤ I(x) = I(xa ) = I(x + ah) ∀a sein. Das Parameterintegral Z t2 I(x + ah) = f (t, x(t) + ah(t), ẋ(t) + aḣ(t)) dt t1 ist bei festem x(t) und h(t) eine Abbildung Φ : R → R, also I(x + ah) =: Φ(a) mit differenzierbarem Φ (siehe Kap. 11, Differentation von Parameterintegralen). I(x) ≤ I(x + ah) ∀a ∈ U (0) ist dann zu Φ(a) ≥ Φ(0) ∀a ∈ U (0) äquivalent. Für dieses Minimierungsproblem ist Φ0 (0) = 0 eine notwendige Bedingung: Aus Z t2 Φ0 (a) = (f,x (t, x + ah, ẋ + aḣ)h + f,ẋ (t, x + ah, ẋ + aḣ)ḣ dt t1 folgt Z 0 t2 Φ (0) = t1 o (f,x (t, x, ẋ)h + f,ẋ (t, x, ẋ)ḣ dt = 0 ∀h ∈ C 2 [t1 , t2 ]. d d Unter Verwendung von dt (f,ẋ h) = dt (f,ẋ )h + f,ẋ ḣ ergibt sich hieraus wegen h(t1 ) = h(t2 ) = 0: Z t2 d 0 Φ (0) = (f,x (t, x, ẋ) − f,ẋ (t, x, ẋ))h(t)dt + (fẋ h) |tt21 dt t1 Z Φ0 (0) = t2 t1 (f,x − o d f,ẋ )h dt = 0 ∀h ∈ C 2 [t1 , t2 ] dt und nach dem Fundamentallemma f,x (t, x, ẋ) = d f,ẋ (t, x, ẋ). dt (E) 18–70 KAPITEL 18. VARIATIONSRECHNUNG Diese notwendige Optimalitätsbedingung (E) ist eine Differentialgleichung 2. Ordnung für die gesuchte Funktion x(t) und heißt Euler-Lagrange-Gleichung. Diskussion: (1) Unter Verwendung der Kettenregel kann (E) in die explizite Form f,x (t, x, ẋ) − f,ẋt (t, x, ẋ) − f,ẋx (t, x, ẋ)ẋ − f,ẋẋ (t, x, ẋ)ẍ = 0 überführt werden. (E) ist also in der Regel eine nichtlineare Differentialgleichung, nur bezüglich ẍ liegt Linearität vor (quasilineare Differentialgleichung). (2) Die Lösungen von (E) heißen in der mathematischen und mechanischen Literatur Extremalen. Sie sind aber nicht unbedingt extremal (minimal), da (E) nur eine notwendige Optimalitätsbedingung ist. R1√ Beispiel 18.4 0 1 + ẋ2 dt → min, x(0) = 0, x(1) = 2 (minimale Bogenlänge) (E) ⇒ d ẋ d 1 f,ẋ = √ = 3 ẍ = 0, ẍ = 0, x = ct + d. 2 dt dt 1 + ẋ (1 + ẋ2 ) 2 Die Integrationskonstanten c und d werden durch die Randbedingungen bestimmt: x(0) = d = 0, x(1) = c = 2. Die Gerade x(t) = 2t genügt der notwendigen Bedingung (E) und den Randbedingungen. Beispiel 18.5 R π 2 0 (ẋ2 − x2 ) dt → min, D = {x : x ∈ C 2 [0, π2 ], x(0) = 0, x( π2 ) = 1}. (E) ⇒ −2x − 2ẍ = 0, ẍ + x = 0, x = c1 sin t + c2 cos t, die Randbedingungen liefern x(0) = c2 , x( π2 ) = c1 = 1. Also ist sin t eine Extremale des Problems. Rπ Beispiel 18.6 0 (ẋ2 − x2 ) dt → min, D{x : x ∈ C 2 [0, π], x(0) = 0, x(π) = 0} (E) ⇒ x(t) = c1 sin t + c2 cos t, x(0) = c2 = 0, x(π) = 0 = c1 sin π. Also erfüllen alle x(t) = c1 sin t, c1 ∈ R beliebig, die notwendigen Optimalitätsbedingungen, sowie die Randbedingungen (Nichteindeutigkeit der Extremale). Rt Satz 18.1 Falls x(t) Lösung des Problems I(x) = t12 f (t, x, ẋ) dt → min auf D = {x : x ∈ C 2 [t1 , t2 ], x(t1 ) = x1 , x(t2 ) = x2 } ist, dann muß x(t) Lösung der Differentialgleichungen f,x (t, x, ẋ) = d f,ẋ (t, x, ẋ) dt (E) und d (f − ẋf,ẋ ) = f,t dt sein. (E0 ) 18.2. DAS FESTRANDPROBLEM DER VARIATIONSRECHNUNG 18–71 Beweis: Da die Notwendigkeit von (E) schon gezeigt wurde, bleibt (E0 ): d d d (f − ẋf,ẋ ) = f,t +f,x ẋ + f,ẋ ẍ − ẍf,ẋ −ẋ f,ẋ = f,t +(f,x − f,ẋ )ẋ = f,t , dt dt dt da x der Differentialgleichung (E) genügen muß. Folgerung: Für autonome Probleme (d.h. für Probleme mit f,t = 0) ist f − ẋf,ẋ = const. f ür alle t ∈ [t1 , t2 ] eine notwendige Optimalitätsbedingung. Beispiel 18.7 f= p 1 1 + ẋ2 , f − ẋf,ẋ = √ = const., ẋ = c, x = ct + d, c, d ∈ R. 1 + ẋ2 Beispiel 18.8 (minimale Rotationsfläche) p f = (2π)x 1 + ẋ2 , p x ẋ2 )= √ = c > 0, (E0 ) ⇒ f − ẋf,ẋ = x( 1 + ẋ2 − √ 2 1 + ẋ 1 + ẋ2 r x2 x2 − c2 + 2 dx = ẋ = = 1 + ẋ , , c 6= 0, x 6= c. 2 (−) c dt c2 Die Lösungen x ≡ c > 0, x = 0 sind bei den Randbedingungen x(t1 ) > 0, x(t2 ) > 0, x(t1 ) 6= x(t2 ) nicht zulässig. Die Differetialgleichung Verfahrens der R dx Rkann mittels des 1 x Trennung der Variablen gelöst werden: √x2 −c2 = c dt, c arcosh c = t + a, x(t) = + c cosh t+a c , a ∈ R, c ∈ R . Die Integrationskonstanten c und a müssen aus den Randbedinτ −τ gungen bestimmt werden. Die Extremalen sind also Kettenkurven (cosh τ = e +e ).Für 2 spezielle Randbedingungen x(t1 ) = x(0) = 1 und x(ln 2) = 54 folgt z.B. a c a 1 = (e c + e− c ) 2 und ln 2+a 5 c ln 2+a = (e c + e− c ) 4 2 und daraus c = 1 und a = 0, also x(t) = cosh t, Abb. 18–72. Bemerkung: Nicht für alle Anfangs- und Endlagen existiert eine Lösung des Problems. Beispiel 18.9 Brachistochrone Z bp 1 + y02 1 1 1 I(y) = ( √ ) dx, (E0 ) ⇒ f − y 0 fy0 = const. = √ ( p ) = c̄ > 0 √ y y 2g a 1 + y02 18–72 KAPITEL 18. VARIATIONSRECHNUNG x x = cos ht 5 4 1 ln 2 t Abbildung 18.5: Kettenkurve als Erzeugende einer Rotationsfläche oder y(1 + y 0 2 ) = c12 . Für diese Differentialgleichung erster Ordnung ist eine Lösung in Parameterdarstellung gesucht: x = x(ϕ), y = y(ϕ), ϕ ∈ [ϕ0 , ϕ1 ]. 1 1+y 0 2 Wegen 0 ≤ c2 y = c2 y =: sin2 ≤ 1 ist eine Substitution ϕ 1 = (1 − cos ϕ) 2 2 möglich. Man kann also y 0 2 = y 0 (x) = cot ϕ(x) 2 . 1−c2 y c2 y = 1−sin2 ϕ 2 sin2 ϕ 2 = cot2 ϕ 2 berechnen und erhält Für y = y(x(ϕ)) ergibt sich nach Kettenregel dy dϕ = dy dx dx dϕ und ϕ ϕ 1 dy 1 sin 2 cos 2 1 dx 1 ϕ dx = 0 = . = 2 sin2 = 2 (1 − cos ϕ) = ϕ 2 dϕ y (x(ϕ)) dϕ cot 2 c c 2 2c dϕ Nach Integration folgt hieraus x(ϕ); für y(ϕ) wird die Substitution benutzt: x(ϕ) = 1 1 (ϕ − sin ϕ) + A, y(ϕ) = 2 (1 − cos ϕ) 2 2c 2c c, A ∈ R. Das ist die Parameterdarstellung einer Zykloide (Rollkurve: Kreis auf Gerade). Um eine konkrete Kurve für konkrete Randbedingungen zu erhalten, muß noch der Parameterbereich [ϕ0 , ϕ1 ] bestimmt werden. Dies soll am Beispiel für die Randbedingungen y(0) = 0 und y( π2 ) = 1 erfolgen. (Man beachte, daß in x = 0 der Integrand unbeschränkt ist und somit ein uneigentliches Integral minimiert wird.) Aus den Festlegungen x(ϕ0 ) = 0 = 1 π 1 (ϕ0 − sin ϕ0 ) + A, x(ϕ1 ) = = 2 (ϕ1 − sin ϕ1 ) + A 2c2 2 2c y(ϕ0 ) = 0 = 1 1 (1 − cos ϕ0 ), y(ϕ1 ) = 1 = 2 (1 − cos ϕ1 ) 2 2c 2c 18.2. DAS FESTRANDPROBLEM DER VARIATIONSRECHNUNG 18–73 müssen die Integrationskonstanten c2 und A, sowie ϕ0 und ϕ1 bestimmt werden: A = 0, c2 = 1, ϕ0 = 0, ϕ1 = π. Die Extremale ist also durch 1 1 x(ϕ) = (ϕ − sin ϕ), y(ϕ) = (1 − cos ϕ), ϕ ∈ [0, π] 2 2 bestimmt. Abb. 18.6) P1 00 11 000000000 111111111 11 00 x 00 11 00 11 11 11 00 00 00 11 11 00 P y 2 Abbildung 18.6: Zykloide als Brachistochrone Diskussion: (1) Für jeden (festen) Parameterwert ϕ liegen die Funktionswerte x(ϕ), y(ϕ) auf dem Kreis (x − 1 1 ϕ 2 ) + (y − )2 = . 2 2 4 Für alle ϕ liegen die Kreismittelpunkte in ( ϕ2 , 12 ); die Radien sind konstant r = 12 . (2) Für große ϕ1 , ϕ1 > 2π verliert die Zykloide ihren Minimalcharakter. Um dies zu zeigen, braucht man weitere notwendige und hinreichende Optimalitätsbedingungen. Begriffe und Bezeichnungen: (1) Für eine Kurvenschar x = x(t, a), a ∈ R mit x(t) = x(t, 0) heißt δx(t) := ∂(x(t, a)) a=0 | = x,a (t, a) |a=0 ∂a die erste Variation von x(t, a) in a = 0. δ 2 x(t) := x,aa (t, a) |a=0 ist die zweite Variation von x(t, a) in a = 0. Für die spezielle Kurvenschar x(t, a) = x(t) + ah(t) ist also δx(t) = h(t) und damit hat x(t, a) die Form x(t, a) = x(t) + aδx(t). Da in den Betrachtungen die ’Zeit’ t nicht variiert wird, spricht man auch von einer Ortsvariation δx. Diese spielt bei mechanischen Problemen mit Zwangsbedingungen als virtuelle Verrückung bei der Formulierung des Prinzips von d’Alembert eine wichtige Rolle. 18–74 KAPITEL 18. VARIATIONSRECHNUNG (2) Für eine Kurvenschar x(t, a), die bezüglich a beliebig oft differenzierbar ist und die sich (bei festem t) in eine Taylorreihe entwickeln läßt sind die Variationen als Taylorkoeffizienten zu deuten: 1 1 x(t, a) = x(t, 0) + x,a (t, 0)a + x,aa (t, 0)a2 + ... = x(t) + δx(t)a + δ 2 x(t)a2 + ... . 2 2 Falls man x(t, a) als Störung von x(t) auffaßt, ist z.B. x(t) + δx(t)a die lineare Approximation (= Linearisierung) der Störung. (3) Variation des Funktionals Rb Das Integral I(x) = a f (t, x, ẋ) dt ist ein Spezialfall eines Funktionals I, also einer Abbildung eines linearen Funktionenraums X (hier: X = C 2 ) in den R1 . Dann läßt sich in Analogie zu (1) auch hier eine Variation einführen: Sei D ⊂ X, D offen, X ein linearer Funktionraum, x ∈ D, h ∈ X. Betrachte x + ah ∈ D mit a ∈ U (0) ⊂ R, Abb. 18.7. Dann heißt X x+h 1 0 0 1 1 x + ah 1 0 0 1 0 x D 0≤a≤1 Abbildung 18.7: Zur allgemeinen Variation δI(x, h) := lim a→0 I(x + ah) − I(x) = I,a (x + ah) |a=0 a die erste Variation des Funktionals I oder auch Richtungsableitung von I in x in Richtung h. Es läßt sich zeigen: Falls x das Funktional I(x) auf D minimiert, muß die erste Variation von I verschwinden, das heißt es muß gelten: δI(x, h) = 0 für alle zulässigen h. Rb (Für das bisher behandelte spezielle Funktional I(x) = a f (t, x, ẋ) dt folgt aus δI(x, h) = 0 für alle zulässigen h die Eulergleichung.) Anwendung: das Fermatprinzip Betrachte ein ebenes anisotropes Medium M mit einer (nichtkonstanten) Lichtgeschwindigkeit v(x, y). Fermatprinzip: Der Lichtstrahl nimmt denjenigen Weg zwischen zwei Punkten A und B aus M , der die kürzeste Übergangzeit liefert (minimaler Lichtweg), Abb. 18.8. Die Bestimmung des Lichtweges zwischen A und B bei gegebener Lichtgeschwindigkeit 18.2. DAS FESTRANDPROBLEM DER VARIATIONSRECHNUNG 18–75 x y = y(x) 00 11 y2 B 11 00 0 1 y1 A1 0 x1 x2 x Abbildung 18.8: Problem des minimalen Lichtweges ist ein√Variationsproblem. Unter Nutzung der Formel für die Geschwindigkeit v(x, y(x)) = ds dt 1+y 0 2 (x) dx dt = Z folgt für das Übergangszeitproblem Z T T (y) = x2 dt = 0 q 1 + y 0 2 (x) v(x, y(x)) x1 dx → min auf D = {y : y ∈ C 2 [x1 , x2 ], y(x1 ) = y1 , y(x2 ) = y2 }. Diskussion: (1) Falls v(x, y) = const. für alle (x, y) ∈ M ist, sind die minimalen Lichtwege Geraden, da dann das Variationsproblem T (y) → min die gleichen Lösungen wie das Variationsproblem ’minimaler Abstand zwischen zwei festen Punkten’ hat. 1 heißt Brechungsindex des Mediums und die Lichtwege sind dann als (2) n(x, y) := v(x,y) Extremalen von Z x2 q T (y) = n(x, y) 1 + y 0 2 dx x1 erklärt. (3) Für n = n(y) = √1y sind die Lichtwege Zykloidenbögen, für n(y) = y sind sie Stücke der Kettenkurve (siehe vorherige Beispiele). (4) Diskussion des Falles: der Brechungsundex hängt nur von y (Höhe) ab, n = n(y). Mit p d f = n(y) 1 + y 0 2 folgt für die Eulergleichung dx f,y0 = f,y (E): ny 0 d (p )= dx 1 + y02 = p 0 (n0 y 0 y 0 + ny 00 ) 1 + y 0 2 − ny 0 √ y 1+y 0 2 y 00 1 + y02 (ny 0 2 + ny 00 )(1 + y 0 2 ) − ny 0 2 y 00 3 (1 + y 0 2 ) 2 = f,y = n0 q 1 + y02, 18–76 KAPITEL 18. VARIATIONSRECHNUNG also 2 2 2 2 n0 y 0 (1 + y 0 ) + ny 00 = n0 (1 + y 0 )2 , n0 (1 + y 0 ) = ny 00 und y 00 = n0 (y) 2 (1 + y 0 ). n(y) (E) Dies ist die Differentialgleichung für Lichtwege bei höhenabhängigen Brechungsindex n = n(y). d Beispiel 18.10 n(y) = y1 , n0 (y) = − y12 < 0, y 00 = − y12 y(1+y 0 2 ), yy 00 +y 0 2 = −1 = dx (yy 0 ), yy 0 = −x + a. Diese Differentialgleichung kann durch Trennung der Veränderlichen gelöst werden. Die Extremalen sind Kreisbögen vom Typ: y 2 + (x − c)2 = a2 . Betrachte eine Klasse von Aufgaben, bei der der Brechungsindex mit der Höhe abnimmt: y 00 n = n(y), n0 (y) < 0. Benutzt man die Formel k = 3 für die Krümmung einer (1+y 0 2 ) 2 ebenen Kurve y = y(x) läßt sich aus (E) das Vorzeichen der Krümmung für die ganze Klasse bestimmen: k= n0 (y) p < 0. n(y) 1 + y 0 2 Die Lichtwege sind in diesen Fällen also immer konkav. Eine andere Eigenschaft dieser Klasse wird durch das Brechungsgesetz von Snellius beschrieben, Abb. 18.9. Hierzu läßt sich die notwendige Optimalitätsbedingung (E0 ) verwenden: f − y 0 f,y0 = y α Lichtstrahl β 11111111 00000000 x Abbildung 18.9: Zum Brechungsgesetz von Snellius const. ∀x. Aus q y02 n(y) )= p = const. n( 1 + y 0 2 − p 2 1 + y0 1 + y02 1 1+tan2 β folgt mit y 0 = tan β(x), √ = cos β, β = n(y(x))sin α(x) = const. ∀x. π 2 − α, cos β = sin α das Gesetz: 18.2. DAS FESTRANDPROBLEM DER VARIATIONSRECHNUNG 18–77 Bemerkung: Für Probleme mit nichtdifferenzierbarem y(x) (Grenzschichten) lassen sich entsprechende Variationsprobleme formulieren. Da der Durchstoßpunkt durch die Grenzschicht P3 nicht bekannt ist, sind dies keine Festrandprobleme mehr., Abb. 18.10 Anwendung: das Hamiltonprinzip der kleinsten Wirkung y n P2 11 00 1 11 00 11 00 11 00 00 11 00 11 00 11 00 11 00 11 11 00 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 11 11 11 11 11 11 11 11 00 00 00 00 00 00 00 00 M edium 1 00 11 00 11 00 11 0 01 1 00 11 P 311 00 11 00 11 00 x 00 11 00 11 01 1 0 00 00 11 00 11 00 11 00 11 00 11 0 11 1 00 11 M edium 2 00 11 00 11 00 11 00 11 00 11 1 0 P111 00 11 11 11 00 00 00 11 11 00 00 00 n2 11 Abbildung 18.10: Lichtweg durch eine Grenzschicht Betrachte ein mechanisches System, bestehend aus n Massepunkten, deren Lage durch x(t) := (x1 (t), ..., xn (t)) und deren Geschwindigkeit durch ẋ = (ẋ1 (t), ..., ẋn (t)) beschrieben wird. Die kinetische Energie des Systems sei T = T (t, x, ẋ) und die potentielle Energie U = U (t, x). Mit Hilfe einer Lagrangefunktion L(t, x, ẋ) := T (t, x, ẋ) − U (t, x) wird der Begriff der Wirkung eingeführt: Z t2 W (x) := L(t, x, ẋ) dt. t1 Hamiltonprinzip der Mechanik: In konservativen Systemen verlaufen die tatsächlichen Vorgänge mit extremaler (minimaler) Wirkung. Dies bedeutet, daß die Lage des Systems in der Zeit x = x(t) Extremale des folgenden Variationsproblems ist: Z t2 W (x) = t1 L(t, x, ẋ) dt → extr, D = {x : x ∈ Cn2 [t1 , t2 ], x(t1 ) = x1 , x(t2 ) = x2 }. Vorausgesetzt wird: L ∈ C 2 (R2n+1 , R). Neu ist hier: es wird ein Funktionenvektor x(t) = (x1 (t), ..., xn (t)) gesucht. Satz 18.2 Betrachte Z t2 f (t, x, ẋ) dt → extr., D = {x : x ∈ Cn2 [t1 , t2 ], x(t1 ) = x1 , x(t2 ) = x2 } t1 18–78 KAPITEL 18. VARIATIONSRECHNUNG unter der Voraussetzung f ∈ C 2 (R2n+1 , R). Falls x(t) das Variationsproblem löst, muß x(t) Lösung von f,xi − d f,ẋ = 0, i = 1...n, t ∈ [t1 , t2 ] dt i (E) sein. Der Beweis wird analog zum erbrachten Beweis für das einfache Festrandproblem (eine gesuchte Funktion) geführt. Diskussion: (1) (Ei ) ist ein System von n quasilinearen Differentialgleichungen 2. Ordnung. Die 2n Integrationskonstanten der Lösung müssen aus den 2n Randbedingungen x(t1 ) = x1 , x(t2 ) = x2 bestimmt werden. (2) Falls f die Lagrangefunktion nach dem Hamiltonprinzip ist, müssen die den Zustand des Systems beschreibenden Funktionen x(t) Lösungen des entsprechenden Systems (Ei ) von Differentialgleichungen sein. (3) Die Wirkung ist ’fast immer’ minimal. Beispiel 18.11 Feder-Masse-Schwinger , Abb. 18.11 Für das in Abbildung 18.11 skizzierte Feder-Masse-System sollen die Auslenkungen aus k m k x(t) m k y(t) Abbildung 18.11: Feder-Masse-Schwinger der Ruhelage mit x(t) und y(t) bezeichnet werden. Die kinetische Energie des Systems ist 1 1 1 2 2 2 2 2 T (ẋ, ẏ) = m 2 (ẋ + ẏ ), die potentielle Energie U (x, y) = 2 kx + 2 k(y − x) + 2 ky . Das Variationsproblem nach dem Hamiltonprinzip ergibt sich mit L = T − U zu Z t2 W (x, y) = L(x, y, ẋ, ẏ) dt → extr t1 auf D = {(x, y) : (x, y) ∈ C22 [t1 , t2 ], x(t1 ) = x1 , y(t1 ) = y1 , x(t2 ) = x2 , y(t2 ) = y2 }. Das System der Eulergleichungen (Ei ) liefert L,x − d L,ẋ = 0, also − kx + k(y − x) − mẍ = 0 dt 18.3. PROBLEMERWEITERUNGEN 18–79 und d L,ẏ = 0, also − ky − k(y − x) − mÿ = 0. dt Die Extremalen x(t), y(t) sind also Lösungen des Systems L,y − mẍ + 2kx − ky = 0 mÿ + 2ky − kx = 0. 1 1 Eine Substitution ẋ =: v, ẏ =: w mit v̇ = m (−2kx + ky), ẇ = m (−2ky + kx) überführt dieses System in ein lineares System gewöhnlicher Differentialgleichungen mit konstanten Koeffizienten. . 0 0 1 0 x x y 0 0 1 = 02k y . k − v 0 0 v m m k 2k w w −m 0 0 m Die vier Integrationskonstanten berechnen sich aus den vier Randbedingungen. 18.3 Problemerweiterungen (1) Variationsprobleme mit freiem Rand Die Standardform eines solchen Problems ist (f ∈ C 2 (R2n+1 , R)): Z t2 f (t, x, ẋ) dt, D = {x : x ∈ Cn2 [t1 , t2 ] x(t1 ) = x1 , x2 f rei, t2 f est}. (P F ) t1 Abb. 18.12 x x2 1 0 0 1 00 x11 1 00 11 11 00 t1 t2 t Abbildung 18.12: Variationsproblem mit freiem rechten Rand Satz 18.3 x(t) löst (PF). Dann folgt (i) d f,ẋ = f,xi dt i (ii) f,ẋi (t, x(t), ẋ(t)) |t=t2 = 0, i = 1...n, t ∈ [t1 , t2 ] i = 1...n. (Ei ) (T B) 18–80 KAPITEL 18. VARIATIONSRECHNUNG Die Bedingung (ii) heißt Transversalitätsbedingung. Sie schreibt vor, wie die Extremale x(t) in die Endmannigfaltigkeit einmünden muß. √ Beispiel 18.12 f = xα 1 + ẋ2 , xα ẋ f,ẋ = √ , 1 + ẋ2 (T B) x 6= 0, α ∈ R. xα ẋ √ |t=t2 = 0 1 + ẋ2 ⇒ ẋ(t2 ) = 0. Die Extremale mündet waagerecht in die vertikale Endmannigfaltigkeit t = t2 ein. Bei √ der ganzen Klasse von Aufgaben mit dem Integranden f = xα 1 + ẋ2 , α ∈ R ist also Transversalität gleich Orthogonalität. √ Beispiel 18.13 f = x1 1 + ẋ2 , x(1) = 1, x(3) frei. Die Eulergleichungen (E) ergeben x2 + (t − c)2 = a2 (siehe Beispiel oben). Die Randbedingung x(1) = 1 und die Tranversalitätsbedingung ẋ(3) = 0 liefern als Extremale den Kreisbogen x2 + (t − 3)2 = 5 auf [1, 3], Abb.18.13. x 11 00 11 00 00 11 1 3 t Abbildung 18.13: Transversalität gleich Orthogonalität (2) Variationsprobleme mit höheren Ableitungen am Beispiel eines Problems mit zweiten Ableitungen im Integranden Betrachte Z t2 I(x) = f (t, x(t), ẋ(t), ẍ(t)) dt → min (P H) t1 auf D = {x : x ∈ C 4 [t1 , t2 ], x(t1 ) = x1 , ẋ(t1 ) = ẋ1 , x(t2 ) = x2 , ẋ(t2 ) = ẋ2 }, f ∈ C 4 (R4 , R1 ). Satz 18.4 x(t) löst (P H). Dann muß x(t) die Differentialgleichung f,x − erfüllen. d d2 (f,ẋ ) + 2 (f,ẍ ) = 0 dt dt ∀t ∈ [t1 , t2 ] (E) 18.3. PROBLEMERWEITERUNGEN 18–81 Der Beweis erfolgt -in Analogie zum einfachen Variationsproblem- durch Auswertung der notwendigen Optimalitätsbedingungen δI(x, h) = 0 ∀h. Beispiel 18.14 Balkengleichung, Abb. 18.14 Für einen in x = 0 und x = 1 eingespannten Balken mit spezifischer Streckenlast q(x) q(x) 111111 000000 0 1 0 1 0 1 0 1 0 1 0 1 0 1 000000000 111111111 1 1 1 1 1 1 1 0 0 0 0 0 0 01 x 111111 0 000000 y Abbildung 18.14: Biegung eines eingespannten Balkens mit einer Biegesteifigkeit EI(x), dessen Krümmung der Mittellinie durch y 00 angenähert wird, beträgt die Formänderungsarbeit Z 1 1 2 W (y) = ( EI(x)y 00 (x) + y(x)q(x)) dt. 2 0 Das Prinzip der minimalen Formänderungsarbeit besagt: Die reale Lage eines Körpers ist so, daß die Formänderungsarbeit minimal wird. Hieraus ergibt sich das folgende Variationsproblem für die Auslenkung/Lage y(x): W (y) → min, D = {y : y ∈ C 4 [0, 1], y(0) = y(1) = 0, y 0 (0) = y 0 (1) = 0}. Die Eulergleichung (E) für dieses Problem ergibt die sogenannte Balkengleichung q(x) + (EI(x)y 00 )00 = 0. Bei konstanter Biegesteifigkeit EI(x) ist dies eine lineare inhomogene Differentialgleichung 4.Ordnung mit konstanten Koeffizienten. Die vier Integrationskonstanten in der Lösung sollten sich aus den vier Randbedingungen ergeben (Randwertproblem). (3) Isoperimetrische Probleme Betrachtet wird Z t2 f (t, x, ẋ) dt → min, (P I) t1 auf D = {x : x ∈ C 2 [t1 , t2 ], x(t1 ) = x1 , x(t2 ) = x2 , Z t2 g(t, x, ẋ) dt = const.}, f, g ∈ C 2 (R3 , R1 ). t1 Probleme mit Nebenbedingungen in Form bestimmter Integrale heißen isoperimetrische Probleme. 18–82 KAPITEL 18. VARIATIONSRECHNUNG Beispiel 18.15 Z t2 Z x(t) dt → max, t2 t1 t1 p 1 + ẋ2 dt = const., x(t1 ) = x1 , x(t2 ) = x2 Unter allen C 2 −Kurven gegebener Länge durch die beiden Punkte P1 und P2 ist diejenige x 00 11 00000000 11111111 11 00 11 00 P P t 1 2 Abbildung 18.15: Ein isoperimetrisches Problem gesucht, die mit der t − Achse maximalen Flächeninhalt einschließt, Abb. 18.15. Ein dazu duales Problem wäre: Z t2 p Z 1 + ẋ2 → min, t1 t2 t1 x(t) dt = const., x(t1 ) = x1 , x(t2 ) = x2 . Satz 18.5 x(t) löst (P I). Dann folgt: Es gibt einen Multiplikator λ ∈ R, so daß mit L := f + λg L,x − d L,ẋ = 0 dt (E) gilt. Bezeichnung: L ist eine sogenannte Lagrangefunktion; der Satz eine Multiplikatorenregel. Bemerkung: Die beiden Integrationskonstanten, die bei der Lösung der Eulergleichung (E) entstehen und der MultiplikatorR λ müssen aus den beiden Randbedingungen und der t isoperimetrischen Nebenbedingung t12 g dt = const. bestimmt werden. Satz 18.6 (Folgesatz) (x, λ) löst (P I). Dann folgt: (x, λ) löst d (L − ẋL,ẋ ) = L,t dt (E0 ) Beispiel 18.16 Z 2 Z x(t) dt → max, x ∈ C 2 [0, 2], x(0) = x(2) = 0, 0 0 2p 1 + ẋ2 dt = π. 18.3. PROBLEMERWEITERUNGEN 18–83 Unter allen C 2 − Kurven der Länge π, die (0, 0) mit (2, 0) verbinden, ist diejenige gesucht, die mit der positiven t R− Achse maximalen Flächeninhalt einschließt. Statt des 2 Maximierungsproblems wird − 0 x(t) dt → min gelöst. Für die Lagrangefunktion L = √ −x + λ 1 + ẋ2 muß wegen L,t = 0 nach dem Folgesatz L − ẋL,ẋ = const. gelten, also p λẋ2 λ −x + λ 1 + ẋ2 − √ = −x + √ = c. 1 + ẋ2 1 + ẋ2 Diese Differentialgleichung 1.Ordnung wird mittels Trennung der Variablen gelöst: Z Z dx 2 λ2 c+x 2 − 1, ± p dx = dt, ( ) = ẋ = dt (c + x)2 λ2 − (c + x)2 (x + c)2 + (t + d)2 = λ2 , Kreisschar. R2√ Unter Verwendung von x(0) = x(2) = 0 und 0 1 + ẋ2 dt = π folgt λ = 1, c = 0, d = −1, x2 + (t − 1)2 = 1. Der Halbkreis (x ≥ 0) liefert also (vermutlich) die größte Fläche. Vermutlich deshalb,Rweil√keine hinreichende Optimalitätsbedingung in Anwendung t kam. Für den Halbkreis ist t12 1 + ẋ2 dt ein uneigentliches Integral, da in t = 0, t = 2 ẋ unbeschränkt wächst. Bemerkung: Falls man zeigen kann, daß die Lösung eines Variationsproblems existiert und es genau ein zulässiges Element gibt, welches den notwendigen Bedingungen genügt, so ist dieses Element auch optimal. Diskussion: (1) Weitere Klassen von Variationsproblemen sind: Probleme mit freier Endzeit, Probleme mit Differentialgleichungen als Nebenbedingungen, Probleme mit Nebenbedingungen in der Form finiter Gleichungen g(t, x(t)) = 0 (z.B, kürzeste Entfernung zweier Punkte auf der Erdoberfläche), Minimierungsprobleme in der Klasse geknickter Extremalen, Probleme der optimalen Steuerung u.a.. Deren Behandlung würde jedoch den zeitlichen Rahmen einer Einführung in die Variationsrechnung sprengen. (2) Wesentliche Anwendungsbereiche der Variationsrechnung in den Ingenieurdisziplinen wurden z.T. schon exemplarisch behandelt: die Prinzipienphysik (kürzester Lichtweg, extremale Wirkung, kleinste Formänderungsarbeit). Ein anderes wichtiges Anwendungsgebiet sind Verfahren zur näherungsweisen Lösung von Differentialgleichungen: Ritzverfahren und finite Elementemethoden basieren auf Variationsproblemen. Für Stabilitätsbetrachtungen lassen sich Eigenwertkriterien einsetzen. Dort - und auch bei weiteren Problemen - ist der kleinste bzw. der größte Eigenwert gefragt. Diese Eigenwerte lassen sich mit Variationsmethoden gewinnen. 18–84 KAPITEL 18. VARIATIONSRECHNUNG Kapitel 19 Partielle Differentialgleichungen 19.1 Einführung (Begriffe, Beispiele, Problemstellung) Betrachtet werden ein Gebiet G ⊂ Rn , (offen, zusammenhängend), und eine Funktion u : Rn → R1 , u = u(x1 , . . . , xn ), u ∈ C m (G), u ∈ C o (Ḡ) Bezeichnung: µ F x1 , . . . , xn , u, u,x1 , . . . u,xn . . . , ∂mu ∂xk1 . . . ∂xsn ¶ = 0, k + . . . + s = m (P ) heißt partielle Differentialgleichung m-ter Ordnung (pDGL). u ∈ C m (G), u ∈ C o (Ḡ) ist Lösung der pDGL (P ) in G, falls F (x, u(x), u,x (x), . . .) = 0 erfüllt ist für alle x = (x1 , . . . , xn ) ∈ G. Insbesondere ist F (x, y, u, u,x , u,y , u,xx , u,xy , u,yy ) = 0, u = u(x, y) die allgemeine Form einer pDGL 2. Ordnung für n = 2. Die Lösung u = u(x, y) wird hier als Integralfläche bezeichnet. Beispiel 19.1 u(x, y), u,x = 0 ⇒ Lösung u = a(y), a willkürliche Funktion u(x, y, z), u,x = 0 ⇒ Lösung u = b(y, z), b willkürliche Funktion Beispiel 19.2 u(x, y), u,xx = 0 ⇒ u,x = a(y), u = Ra(y)x + b(y), a, b willkürlich u,xy = 0 ⇒ u,x = c(x), u = c(x)dx + g(y) =: f (x) + g(y) f, g willkürlich, f, g ∈ C 1 Beobachtung: Die Lösungen dieser pDGLn sind bestimmt bis auf willkürliche Funktionen. 19–85 19–86 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN Beispiel 19.3 u(x, y), u,x + yu = 0 für u 6= 0 ⇒ −xy + c̄(y), u = C(y)e−xy ∂u ∂x · 1 u = −y = ∂ ∂x ln |u| ⇒ ln |u| = Beispiel 19.4 u = u(x, y), au,x + bu,y = f (x, y), a, b ∈ R, a · b 6= 0, f ∈ C · (G), lineare pDGL 1. Ordnung, inhomogen mit konstanten Koeffizienten, Lösung mit der Methode Variablensubstitution (siehe auch Kapitel 19.3). Es werden neue unabhängige Variable (ξ, η) eingeführt: ξ+η ξ−η ξ := bx + ay ⇔x= , y= . η := bx − ay 2b 2a ³ ´ ³ ´ ξ−η ξ+η ξ−η =: U (ξ, η) und f (x, y) = f =: F (ξ, η). Damit wird u(x, y) = u ξ+η , , 2b 2a 2b 2a Für die gesuchte Funktion U (ξ, η) muß die pDGL aufgestellt werden: Mit u,x = U,ξ · ξ,x + U,η η,x und entsprechendem u,y erhält man aus au,x + bu,y = f a(U,ξ b + U,η b) + b(U,ξ a + U,η (−a)) = F (ξ, η) bzw. 2ab U,ξ = F (ξ, η). Durch Integration à nach ξ ergibt sich ! Rξ 1 ¯ η)dξ¯ + G(η) , G(η) beliebig oder nach Rücksubstitution U (ξ, η) = 2ab F (ξ, ξ0 à ! bx+ay R 1 u(x, y) = 2ab F (ξ, bx − ay)dξ + G(bx − ay) . bx0 +ay0 Aufgabe: Zeige, daß dieses u für alle G der Differentialgleichung genügt. Beispiel 19.5 ξ−η u = u(x, y), 2u,x + 3u,y = exp (x + y) = ex+y , x = ξ+η 6 , y = 4 ¢ ¡5 ¢ ¡ 1 ξ − 12 η und F (ξ, η) = exp 61 (ξ + η) + 14 (ξ − η) = exp 12 U (ξ, η) Also Rξ ¡5 ¢ 1 exp 12 ξ¯ − 12 η dξ¯ + g(η) ξ0 ¡ ¢ 1 5 exp 12 ξ − 12 η + g(η). = 1 12 = 1 5 u(x, y) = 1 5 exp (x + y) + g(3x − 2y). Aufgabe: Wähle spezielle Funktionen g und zeige, daß die sich ergebenden u(x, y) Lösungen sind. Beispiel 19.6 eindimensionale Wellengleichung u = u(x, t), u,tt − c2 u,xx = f (x, t). Dabei ist u(x, t) die Auslenkung einer (eindimensionalen) Saite am Ort x zur Zeit t, c ∈ R. c 6= 0 ist die Geschwindigkeit und f (x, t) eine äußere Kraft, die auf die Saite wirkt. (Modell siehe auch Kap. 17). Diese Wellengleichung ist eine lineare pDGL 2. Ordnung, inhomogen mit konstanten Koeffizienten, deren allgemeine Lösung u sich additiv zusammensetzt aus der allgemeinen Lösung der homogenen pDGL und einer partikulären Lösung der inhomogenen pDGL (Argumentation wie bei entsprechender Aussage für lineare gewöhnliche DGL). Also u = uh + up , wobei uh allgemeine Lösung von u,tt − c2 u,xx = 0 und up partikuläre Lösung von u,tt − c2 u,xx = f (x, y) ist. Die Lösung von u,tt − c2 u,xx = 0 wird 19.1. EINFÜHRUNG 19–87 wieder durch eine Variablensubstitution gewonnen. Die neuen unabhängigen Variablen sollen (ξ, η) sein: ¯ ¯ µ ¶ µ ¶ ¯ 1 −c ¯ ξ := x − ct t = t(ξ, η) ¯ ¯ = 2c 6= 0 ⇔ (die Funktionaldeterminante: ¯ η := x + ct x = x(ξ, η) 1 c ¯ ist). Mit U (ξ, η) := u(x(ξ, η), t(ξ, η)) bzw. u(x, t) = U (x − ct, x + ct) folgt u,t = U,ξ ξ,t + U,η η,t = −cU,ξ + cU,η und durch weitere Anwendung der Kettenregel u,tt = −c(U,ξξ ξ,t + U,ξη η,t ) + c(U,ηξ ξ,t + U,ηη η,t ), u,tt = c2 (U,ξξ − 2U,ξη + U,ηη ) und analog u,xx = U,ξξ + 2U,ξη + U,ηη . Die pDGL u,tt − c2 u,xx = f (x, t) wird zur pDGL für U (ξ, η) −4c2 U,ξη = F (ξ, η). Die allgemeine Lösung von U,ξ,η = 0 ist Uh (ξ, η) = ϕ(η) + ψ(ξ) ϕ, ψ ∈ C 1 beliebig (siehe obiges Beispiel), also in Originalkoordinaten uh (x, t) = ϕ(x + ct) + ψ(x − ct). Eine partikuläre Lösung ist Up (ξ, η) = − 4c12 uh (x, t) + up (x, t) folgt. RR F (ξ, η) dξ dη, woraus up (x, t) und u(x, t) = Diskussion: Die Lösung uh (x, t) = ϕ(x + ct) + ψ(x − ct) kann nach d’Alembert als Überlagerung zweier laufender Wellen gedeutet werden. Beispiel 19.7 Sei ψ(z) := −z 2 + 1, z ∈ [−1, 1], ψ(z) = 0, sonst. Dann wird u = ψ(x − ct) = −(x − ct)2 + 1 und man kann u für verschiedene t-Werte betrachten. (s. Abb. 19.1) u 1 1 t=0 ψ(x) c t=1 ψ(x − c) 2c x t=2 ψ(x − 2c) Abbildung 19.1: laufende Welle ψ(x + ct) repräsentiert eine nach links laufende Erregung (Welle). Entsprechend wird die Anfangsauslenkung ϕ(x + c · 0) mit fortschreitender Zeit nach links laufen. Wegen uh = ϕ(x + ct) + ψ(x − ct) ergibt sich eine Überlagerung beider Vorgänge. Eine 2 andere mögliche Darstellung ist der (u, x, t)-Raum: Für ϕ(z) = ψ(z) = e−z ergibt sich die Lösung u = u(x, t). (s. Abb. 19.2) 2 Durch Schnitte t = const. sieht man, wie sich die Anfangsauslenkung 2e−x in zwei nach 19–88 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN u t x Abbildung 19.2: laufende Welle der (x, t)-Ebene rechts bzw. nach links laufende Wellen aufspaltet. Die Diskussion läuft auf die Behandlung eines Anfangswertproblems (AWP) hinaus: Löse u,tt − c2 u,xx = 0 mit den Anfangsbedingungen u(x, 0) = f (x), Anfangsauslenkung und u,t (x, 0) = g(x), Anfangsgeschwindigkeit. Es sollen die willkürlichen Funktionen ϕ und ψ in der allgemeinen Lösung uh (x, t) in Abhängigkeit von den gegebenen f und g bestimmt werden: u(x, 0) = ϕ(x) + ψ(x) = f (x) u,t (x, 0) = cϕ0 (x) − cψ 0 (x) = g(x). Hieraus folgt c(ϕ(x) − ψ(x)) = Auflösung ϕ(x) = 21 (f (x) + Lösung 1 c Rx g(τ )dτ + k und mit ϕ(x) + ψ(x) = f (x) ergibt sich die x0 Rx x0 g(τ )dτ + k) ψ(x) = 21 (f (x) − u(x, t) = 12 (f (x + ct) + f (x − ct)) + = 21 (f (x + ct) + f (x − ct)) + 1 2c x+ct R 1 c Rx g(τ )dτ − k), also die x0 g(τ )dτ x−ct 1 2c (G(x + ct) − G(x − ct)) Dies ist die Lösungsformel von d’Alembert für die Lösung des Anfangswertproblems einer (unendlich langen) schwingenden Saite ohne äußere Krafteinwirkung. Der erste Teil repräsentiert die Fortpflanzung (laufende Welle) der Anfangsauslenkung f (x) und der zweite Teil die Fortpflanzung der Anfangsgeschwindigkeit g(x). Die Ausgangsdaten pflanzen sich mit endlicher Geschwindigkeit c fort. Aufgabe: Für f (x) = 1 − |x| in [−1, 1], f (x) = 0, sonst und g(x) = 0 ∀x zeichne man 19.2. LINEARE PARTIELLE DIFFERENTIALGLEICHUNGEN 1. ORDNUNG 19–89 u(x, t) für t = 0, ±1/2, ±1, ±2. Eine mehr oder weniger theoretisch anmutende Begriffsbildung ist die Frage nach der sachgerechten Problemstellung bei der Behandlung von pDGL. Definition 19.1 Ein Problem heißt sachgerecht gestellt , falls (i) eine Lösung existiert, (ii) diese Lösung eindeutig ist und (iii) die stetige Abhängigkeit der Lösung von Rand- und Anfangswerten gesichert ist. Selbst wenn man bei konkreten Problemstellungen die Eigenschaften (i) - (iii) nicht immer zeigen kann, so sollte man – auch als Praktiker – die Wichtigkeit dieser Fragestellung erfaßt haben. Falls (i) - (iii) nicht nachgewiesen werden (können), kann es im konkreten Fall zu gravierenden Fehlschlüssen kommen. Die sachgerechte Problemstellung bei pDGL hängt wesentlich vom Typ einer pDGL ab (siehe unten). Beispiele für nicht sachgerecht gestellte Probleme: Beispiel 19.8 u,xx − u,tt = 0 (Wellengleichung mit c = 1), u = u(x, t), (x, t) ∈ G ⊂ R2 . Die Lösung der pDGL hat bekanntlich die Struktur u(x, t) = α(x − t) + β(x + t). Falls nun u auf ∂G vorgegeben ist etwa u|∂G = v(x, t). Dann muß dort v die Struktur v(x, t)|∂G = (α(x − t) + β(x + t))|∂G haben. Dies gilt jedoch i. a. nicht und damit ist die Existenz dann nicht gesichert. Beispiel 19.9 u,xx + u,yy = 0 (Laplacegleichung), u = u(x, y), (x, y) ⊂ G ⊂ R2 . Für ∂u die Lösung u(x, y) wird gefordert: ∂n |∂G = (grad u · n)|∂G = 0 (die Richtungsableitung von u in Normalenrichtung n auf dem Rand ∂G verschwindet). Dann ist mit u(x, y) auch u(x, y) + const. Lösung und (ii) ist verletzt. Beispiel 19.10 u,xx + u,yy = 0 mit u(x, 0) = u,y (x, 0) = 0 für alle x. Dann ist u = u1 ≡ 0 eine Lösung. Für uk,xx + uk,yy = 0 mit uk (x, 0) = 0, uk,y (x, 0) = k1 sin kx für alle x sind uk (x, y) = k12 sin kx sinh ky Lösungen dieses Problems. (Probe!) Für die Anfangsbedingungen uk,y gilt: lim uk,y (x, 0) = u,y (x, 0) = 0, für die Lösungen k→∞ sinh ky k2 jedoch lim uk (x, y) 6= u1 ≡ 0(x 6= π), da k→∞ mit k → ∞ über alle Grenzen wächst. D. h., kleine Störungen“ von u,y (x, 0) = 0 können große Änderungen der Lösung u(x, y) ” bewirken. 19.2 Lineare partielle Differentialgleichungen 1. Ordnung Wiederholung des Begriffes erstes Integral bei autonomen gewöhnlichen Differentialgleichungen: Betrachte für x : [t1 , t2 ] → Rn das System ẋ = V (x), V : D ⊂ Rn → Rn , D offen , V ∈ C 1 (D), x(t1 ) = x1 . Nach dem Existenzsatz von Picard-Lindelöf gibt es eine eindeutige Lösung x = x(t; t1 , x1 ) := x(t, a). 19–90 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN Definition 19.2 Eine Funktion u(x) mit u : D → R heißt erstes Integral der DGL ẋ = V (x), falls u(x(t)) = const. längs aller Lösungen der DGL ist. (D. h. u(x(t, a)) = const. =: u(a) ∀a, ∀t ∈ [t1 , t2 ]). Beispiel 19.11 Für ẋ = x(y − z), ẏ = y(z − x), ż = z(x − y) ist u(x, y, z) = x + y + z ein erstes Integral: ẋ du = grad u · ẏ = u,x ẋ + u,y ẏ + u,z · ż = x(y − z) + y(z − x) + z(x − y) = 0, dt ż d. h. u(x, y, z) ist längs Lösungen (x(t), y(t), z(t)) konstant. Bemerkung: Auch u2 (x, y, z) = x · y · z ist erstes Integral. (Probe!) Beispiel 19.12 Feder-Masse-System mit m = k = 1 : ẍ + x = 0. Das mittels y := x zugeordnete System ẋ = y, ẏ = −x hat eine Lösung x = c sin t, y = c cos t. Für diese Lösung gilt x2 (t) + y 2 (t) = const. für alle t. Gesucht ist ein erstes Integral des Systems, d. h. eine Funktion u = u(x, y) mit u(x(t), y(t)) = const. längs Lösungen. Aus dem obigen ist ersichtlich, daß u = f (x2 + y 2 ) ein erstes Integral für 0 0 0 beliebige, differenzierbare Funktionen f ist: du dt = f 2xẋ + f 2y ẏ = f (2xy − 2yx) = 0. Diskussion: Falls also u(x) erstes Integral zu ẋ = V (x) ist, muß gelten n X d u(x(t, a)) = u,xi (x(t))vi (x(t)) = 0 ∀t. dt i=1 Man könnte ein u(x) bestimmen, falls man die pDGL 1. Ordnung u,x1 v1 + . . . + u,xn vn = 0 lösen könnte. Umgekehrt könnte man vermuten, daß man zur Lösung solcher pDGL kommt, wenn man erste Integrale eines Systems gewöhnlicher DGL bestimmt. Dieser Lösungsidee wird im folgenden weiter nachgegangen. Bezeichnung: Sei G ⊂ Rn ein Gebiet, ai , d, c, u : G → R1 , i = 1 . . . n, ai ∈ C 1 (G) (a1 , . . . , an ) 6= 0. Dann heißt a1 (x)u,x1 + . . . + an (x)u,xn + c(x)u + d(x) = 0 (l) lineare pDGL 1. Ordnung . Deren allgemeine Lösung u(x) setzt sich wieder additiv zusammen: u = uh + up , wobei uh die allgemeine Lösung von a1 (x)u,x1 + . . . + an (x)u,xn + c(x)u = 0 19.2. LINEARE PARTIELLE DIFFERENTIALGLEICHUNGEN 1. ORDNUNG 19–91 ist und up eine partikuläre Lösung von (l). Die Bestimmung von uh wird in erster Stufe für Probleme mit c ≡ 0 diskutiert und später für beliebige c erweitert. Zwecks erster Einsicht erfolgt vorläufig die Behandlung des Falles n = 2, u = u(x, y), also a1 (x, y)u,x + a2 (x, y)u,y = 0, ai ∈ C 1 (G). (V L) Diese pDGL wird häufig verkürzt linear genannt, sie ist die um das Glied c(x)u verkürzte homogene pDGL. Es erfolgt nun eine Zuordnung a1 (x, y)u,x + a2 (x, y)u,y = 0 mit Lösung u(x, y) zu ẋ = a1 (x, y) ẏ = a2 (x, y), (CS) einem System nichtlinearer gewöhnlicher DGL mit Lösung (x(t), y(t)). Definition 19.3 System (CS) heißt charakteristisches System zur pDGL (V L). Die Lösungen von (CS) heißen Charakteristiken (charakteristische Kurven) von (V L). Satz 19.1 Sei G ⊂ R2 ein Gebiet, u ∈ C 1 (G). u(x, y) ist genau dann Lösung von (V L), wenn u(x, y) erstes Integral von (CS) ist. Beweis: ⇒: Sei u Lösung von (V L) und (x(t), y(t)) Lösung von (CS). Dann gilt: u,x ẋ + u,y ẏ = u,x a1 + u,y a2 = 0 ∀t, also ist u erstes Integral. ⇐: Sei u erstes Integral. Dann gilt für alle Lösungen (x(t), y(t)) von (CS) 0= d dt u(x(t), y(t)) d dt u(x(t), y(t)) = u,x ẋ + u,y ẏ = u,x (x(t), y(t)) a1 (x(t), y(t)) + u,y (x(t), y(t)) a2 (x(t), y(t)) = u,x a1 (x, y) + u,y a2 (x, y). Also löst u die pDGL. Diskussion: (1) u ≡ 0 ist immer Lösung von (V L). (2) Falls u(x, y) erstes Integral von (CS) ist, dann ist auch f (u(x, y)) erstes Integral mit beliebigem f : R1 → R1 , f ∈ C 1 (R1 ) (siehe auch obiges Beispiel). (3) Geometrische Deutung: Betrachte Charakteristiken von (CS) durch einen Punkt (c1 , c2 ) ∈ R2 . Dann gilt für die Lösung der pDGL (V L) u(x(t), y(t)) = u(c1 , c2 ) = const. D. h., die Lösung u = u(x, y) von (V L) sind solche Flächen, die längs der Charakteristiken konstant sind. (s. Abb. 19.3) Für die praktische Lösungsbestimmung der Gleichung (V L) bedeutet dies: Man bestimme die Lösungen (x(t), y(t)) des Systems von gewöhnlichen DGL (CS) und finde Flächen u = u(x, y), deren Höhenlinien genau diese Kurven (x(t), y(t)) sind. = 19–92 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN z u(x, y) u(x, y) = u(c1 , c2 ) 1111 0000 1111 0000= const. (H öhenlinie) y 00 11 (x(t), y(t)) 11 1 00 0 x (c1 , c2 ) Abbildung 19.3: Höhenlinie (4) Falls also u(x, y) ein erstes Integral ist, ist ū(x, y) = f (u(x, y)) mit f ∈ C 1 beliebig eine allgemeine Lösung von (V L). (Lösung einer pDGL ist bis auf willkürliche Funktionen bestimmt.) Beispiel 19.13 yu,x + xu,y = 0 Das zugeordnete charakteristische System ẋ = y ẏ = x hat ein erstes Integral u(x, y) = y 2 − x2 , da u,x ẋ + u,y ẏ = −2xy + 2yx = 0. Hieraus ergibt sich die allgemeine Lösung der pDGL ū(x, y) = f (y 2 − x2 ), f ∈ C 1 beliebig. 2 2 Für verschiedene f ergeben sich die speziellen Lösungen ū = ey −x , ū = sin(y 2 − x2 ), ū = (y 2 − x2 )2 . . .. Eine Methode zur systematischen Bestimmung erster Integrale für n = 2: Man löse die 2 2 dy zu (CS) gehörige Phasendifferentialgleichung dx = ẋẏ = xy , y2 − x2 = const., ū(x, y) = y 2 − x2 . Zusatz: Gesucht 2 ist eine Lösung (Integralfläche) durch die Raumkurve x τ y = 2τ 2 , τ ∈ R. Cauchyproblem u τ q 2 2 u = τ, y 2 − x2 = 4τ 4 − τ 4 = 3τ 4 = 3u4 , u(x, y) = 4 y −x 3 . Beispiel 19.14 u,t + a(x)u,x = 0, a 6= 0 (lineare Transportgleichung). Charakteristisches System: ṫ = 1, ẋ = a(x), R R 1 ẋ Phasendifferentialgleichung: dx dx =: A(x) dt = a(x) dt = ṫ = a(x), A(x) − t = const., u(x, t) = A(x) − t (spezielle Lösung), ū(x, t) = f (A(x) − t), f ∈ C 1 beliebig (allgemeine Lösung) R Insbesondere: u,t + ex u,x , A(x) = e−x dx = −e−x + c, ū(x, t) = f (t + e−x ) (allgemeine Lösung), (Probe!) 19.2. LINEARE PARTIELLE DIFFERENTIALGLEICHUNGEN 1. ORDNUNG 19–93 Für allgemeines n gilt: Zu n X ai (x)u,xi = grad u a(x) = 0 (V L) i=1 ist ẋi = ai (x), i = 1 . . . n (CS) das charakteristische System. Dessen Lösungen xi (t), i = 1 . . . n, heißen Charakteristiken zu (V L). Jede Lösung von (V L) ist längs Charakteristiken konstant, es sind also auch hier erste Integrale von (CS) gesucht. Wieviele erste Integrale sind für eine allgemeine Lösung der pDGL (V L) nötig? Wie muß eine Integralbasis aussehen? Um zu Integralbasen und allgemeiner Lösung von (V L) zu kommen, braucht man den Begriff der Unabhängigkeit von Funktionen. Definition 19.4 Sei B ⊂ Rn ein Bereich (abgeschlossen und beschränkt). p Funktionen f1 (x), . . . , fp (x) sind in B abhängig , falls ein F : Rp → R existiert, so daß mit F (f1 (x), . . . , fp (x)) gilt (i) F,fr (·) ∈ C o (Rp ), r = 1 . . . p (ii) F 6≡ 0 in Teilgebieten des Rp (iii) F (f1 (x), . . . , fp (x)) ≡ 0 in B. Falls es kein solches F gibt, sind f1 (x), . . . , fp (x) unabhängig . Beispiel 19.15 f1 (x) = sin x, f2 (x) = cos x, F := f12 + f22 − 1. Dann gilt: (i) F,fr stetig, (ii) F ≡ 0 nur auf Einheitskreis, dieser ist aber kein Gebiet im R2 , (iii) F (sin x, cos x) ≡ 0. D. h., sin x und cos x sind im R1 abhängig. (Untersuche sin x, cos x auf lineare Abhängigkeit.) Für die Abhängigkeit von Funktionen gibt es Kriterien (siehe auch mathematische Literatur) von der Art: Für n < p sind die Funktionen immer abhängig, für n = p sind sie abhängig genau dann, wenn die Funktionaldeterminante J verschwindet und für n > p := ³ ´ ∂f r n − 1 sind sie unabhängig, falls rg ∂xi = p = n − 1, r = 1 . . . p, i = 1 . . . n gilt. Eigenschaften der Lösungen von (V L): (1) n Lösungen u1 (x), . . . , un (x) von (V L) sind immer abhängig. (2) Es kann nicht mehr als n − 1 unabhängige Lösungen u1 (x), . . . , un−1 (x) von (V L) geben. (3) n − 1 unabhängige Lösungen von (V L) bilden eine Integralbasis . 19–94 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN (4) Die allgemeine Lösung u(x) von (V L) hat die Form u(x) = f (u1 (x), . . . , un−1 (x)) mit f ∈ C 1 (Rn−1 ) und u1 , . . . , un−1 sind eine Integralbasis. Damit ist der Fall c = 0 behandelt. Für den Fall c 6= 0 wird wieder die Annahme n = 2 gemacht. Für beliebige n läßt sich der Grundgedanke leicht übertragen. Für ein u = u(x, y) ist zu untersuchen: a(x, y, u)u,x + b(x, y, u)u,y + c(x, y, u) = 0. (QL) Diese pDGL 1. Ordnung ist quasilinear , also linear in den höchsten Ableitungen (hier: u,x und u,y ) und beinhaltet also den oben erwähnten Fall c(x, y, u) = c(x, y) · u. Gesucht wird eine Lösung in impliziter Form f (x, y, u) = const.(= 0) mit f,u 6= 0. Falls u(x, y) Lösung ist, muß dann f (x, y, u(x, y)) ≡ 0 ∀(x, y) ∈ G sein. Hieraus folgt f,x + f,u u,x = 0, f,x f,y also u,x = − f,u und analog u,y = − f,u . Setzt man dies in (QL) ein, ergibt sich eine lineare Differentialgleichung für die Hilfsfunktion f : a(x, y, u)f,x + b(x, y, u)f,y − c(x, y, u)f,u = 0. Diese pDGL ist genau vom oben behandelten Typ (V L) (n = 3). Für die allgemeine Lösung von (QL) sind zwei unabhängige erste Integrale f1 (x, y, u) und f2 (x, y, u) erforderlich. Dann ist die allgemeine Lösung (QL) f (x, y, u) = F (f1 (x, y, u), f2 (x, y, u)) = const. = 0, F ∈ C 1 beliebig. (Falls eine Auflösung möglich ist, folgt hieraus u = u(x, y).) Beispiel 19.16 (x + u)u,x + (y + u)u,y + u = 0. für f (x, y, u) = 0 folgt die Hilfsdifferentialgleichung (x + u)f,x + (y + u)f,y − uf,u = 0 und hierfür das charakteristische System ẋ = x + u ẏ = y + u u̇ = −u. dx Erste Integrale lassen sich z. B. über die Phasendifferentialgleichungen du = − x+u u und dy y+u dx x du = − u finden: du = − u − 1 ist eine Ähnlichkeitsdifferentialgleichung. dz 2 1 k k u u2 1 z(u) := x(u) u , du = − u z − u , z(u) = u2 − 2 , x(u) = u − 2 ⇒ xu + 2 = k oder das erste Integral f1 (x, u) = u2 + 2xu = const. Analog folgt f2 (y, u) = u2 + 2yu = const. Integralbasis/Unabhängigkeit: n ¶= 3, p = 2. Da der Rang der Funktionalmatrix µ ³ ´ 2u 0 2(u + x) ∂(f1 ,f2 ) rg ∂(x,y,u) = rg = 2 = p ist für u 6= 0 (u = 0 : kein Gebiet), folgt 0 2u 2(u + y) die Unabhängigkeit. Damit wird die allgemeine Lösung f (x, y, u) = F (u2 + 2xu, u2 + 2yu), F ∈ C 1 beliebig und f (x, y, u) = c liefert die implizite Lösungsdarstellung für u = u(x, y). Insbesondere c für F (f1 , f2 ) := f1 − f2 folgt f = 2xu − 2yu = 2(x − y)u = c, u(x, y) = 2(x−y) , x 6= y. 19.3. KLASSIFIKATION DER QUASILINEAREN PDGL 2. ORDNUNG 19–95 Beispiel xuu,x + yuu,y = −xy. Die Lösung u = u(x, y) soll durch die Raumkurve 19.17 x t y = t2 , t ∈ R gehen (Cauchyproblem). Die zugeordnete pDGL u t3 xuf,x + yuf,y − xyf,u = 0 hat das charakteristische System ẋ = xu ẏ = yu u̇ = −xy. x x Aus dx dy = y , y 6= 0 folgt das erste Integral f1 (x, y) = y (= k) und aus 2uu̇ + y ẋ + xẏ = 0 folgt u2 + xy = c, also f2 (x, y, u) = u2 + xy. f1 und f2 sind wegen µ rg ∂(f1 , f2 ) ∂(x, y, u) ¶ µ = rg 1 y y − yx2 x 0 2u ¶ = 2, x 6= 0, y 6= 0 unabhängig und ³ ´ bilden eine Integralbasis. Die allgemeine Lösung u(x, y) folgt aus f (x, y, u) = x 2 F y , u + xy = const.(= 0) oder aus µ ¶ x u =ϕ − xy. y 2 Aus den vorgeschriebenen Werten von u auf der Raumkurve ergibt sich µ ¶ 1 6 t =ϕ − t3 bzw. t mit z = 1 t ϕ(z) = 1 1 + 6. 3 z z Die Lösung des Cauchyproblems ist also 1 1 y3 y6 u2 = ³ ´3 + ³ ´6 − xy = 3 + 6 − xy. x x x x y 19.3 y Klassifikation der quasilinearen pDGL 2. Ordnung Die allgemeine Form dieser Klasse von pDGL ist A(x, y)u,xx + 2B(x, y)u,xy + C(x, y)u,yy + F (x, y, u, u,x , u,y ) = 0 19–96 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN mit Gebiet G ⊂ R2 , u ∈ C 2 (G), u ∈ C 0 (Ḡ), (A, B, C) 6= 0, A, B, C ∈ C 0 (G). Für beliebiges n schreibt man n P aij (x)u,xi xj + F (x, u, u,x1 , . . . , u,xn ) = 0, x ∈ G ⊂ Rn . (D2) i,j=1 Dies ist eine quasilineare pDGL 2. Ordnung , da sie linear in den höchsten Ableitungen (hier: in u,xi xj ) ist. Bemerkung: Für die Lösung von pDGL gibt es keine einheitliche Theorie: Existenzund Unitätsaussagen, Lösungsverfahren, sachgerechte Problemstellung sind abhängig von gewissen Typen von pDGL. Im weiteren soll die Klassifizierung der pDGL (D2) nach Typen erfolgen und für jeden Typ eine repräsentative Beispielklasse behandelt werden. Technische Vorbemerkung: Da u,xi xj = u,xj xi läßt sich die Matrix (aij (x))i,j=1...n durch eine symmetrische Matrix ersetzen: Betrachte aij u,xi xj + aji u,xj xi = (aij + aji )u,xi xj und setze āij := n X i,j=1 aij +aji 2 aij u,xi xj = = āji . Die Matrix (āij ) ist also symmetrisch. Da nun gilt n X āij u,xi xj , i,j=1 kann man (D2) immer in eine Form mit symmetrischer Matrix (aij ) bringen. n P Für die Typisierung einer pDGL (D2) ist ausschließlich der Teil aij (x)u,xi xj , i,j=1 (aij ) symmetrisch, zuständig. Es sind 2 Fälle zu unterscheiden: Fall 1: A = (aij )i,j=1...n ∈ Rn×n (konstant) Hier kann die Typisierung für alle x ∈ G vorgenommen werden: Durch eine passende Variablentransformation läßt sich (D2) in eine Standardform mit einer Koeffizientenmatrix λ1 0 . . Ā = bringen, wobei λi die Eigenwerte von A sind (Hauptachsenform) . 0 λu und es läßt sich eine Typisierung mit Hilfe dieser Eigenwerte vornehmen. Einschub: Wiederholung quadratische Formen und Eigenwerte n P Problemstellung: Zu einer gegebenen quadratischen Form Q(ξ) := aij ξi ξj = ξ T Aξ ist i,j=1 eine orthonormale Matrix C ∈ Rn×n (C −1 = C T ) gesucht, so daß mit η := Cξ gilt: λ1 0 n X −1 T T T . .. Q̄(η) := Q(C η) = η CAC η = η λi ηi2 (HA) η = i=1 0 λn (Hauptachsenform). Der Weg zur Konstruktion einer solchen Matrix: Man löse das Eigenwertproblem: Az = λz. Falls A symmetrisch ist, sind die Eigenwerte λ reell. Eigenvektoren 19.3. KLASSIFIKATION DER QUASILINEAREN PDGL 2. ORDNUNG 19–97 z zu verschiedenen λ sind orthonormal. Man wähle nun die Matrix C, so daß die n Zeilen durch die n Eigenvektoren (zu den n Eigenwerten) z(m) , m = 1 . . . n, belegt werden: · · · z(1) · · · .. C := . Dieses C leistet das Gewünschte. . ··· µ z(n) · · · ½ T Az T Elementeweise gilt : z(m) (l) = z(m) λl z(l) = λl δlm = 1, l = m . 0, sonst ¶ Variablentransformation: y := Cx, x = C −1 y, x, y ∈ Rn . Damit wird u(x) = u(C −1 y =: x(y) = W (Cx) und es ist die neue pDGL (D2) für W (y) gesucht. n n n P P P W,yl Cli , u,xi xj = W,yl yk Cli Ckj und yl = Cli xi , u,xi = n P i,j=1 i=1 aij u,xi xj = n P l=1 i,j,l,k=1 aij Cli Ckj W,yl yk = l,k=1 n P k=1 λk W,yk yk aufgrund der Eigenschaft (HA). Die restlichen Terme in (D2) spielen für die Typisierung keine Rolle; sie werden natürlich mittransformiert: F (x, u, u,x1 , . . . , uxn ) = F (C −1 y, u(C −1 y), W,y C) =: F̃ (y, W, W,y ). Die gesuchte Normalform ist also λ1 W,y1 y1 + . . . + λn W,yn yn + F̃ (y, W, W, y) = 0. Definition 19.5 Die pDGL (D2) heißt (i) elliptisch , wenn alle Eigenwerte λi von A ungleich Null sind und alle gleiches Vorzeichen haben, (ii) hyperbolisch , wenn alle λi 6= 0 und alle λi außer genau einem λ gleiches Vorzeichen haben, (iii) parabolisch , falls ein i0 ∈ {1 . . . n} existiert mit λi0 = 0. Bemerkung: Die Bezeichnungen entstammen der linearen Algebra, wo entsprechende quadratische Formen mit den oben angeführten Eigenwerteigenschaften auf Ellipsen, Hyperbeln und Parabeln führen. Bezüglich weiterer Klassifizierungen (n > 3) wird auf die Literatur verwiesen (ultrahyperbolisch ...). Fall 2: A = A(x), x ∈ G, A(x) ∈ Rn×n ∀x In diesem Fall muß die Typisierung für jedes feste x ∈ G vorgenommen werden. Die entsprechende Definition würde sein: (D2) in x ∈ G elliptisch, falls ... . Der Typ einer pDGL (D2) kann in G wechseln (Beispiel siehe unten). Nur im Spezialfall n = 2 kann die Typisierung gebietsweise µ ¶ vorgenommen werden: a(x, y) b(x, y) Zu A(x, y) = lassen sich Eigenwerte λ(x, y) bestimmen: b(x, y) c(x, y) ¯ ¯ ¯ a−λ b ¯¯ ¯ = λ2 − (a + c)λ + ac − b2 = λ − (λ1 + λ2 )λ + λ1 λ2 = 0. | A − λE |= ¯ b c−λ ¯ 19–98 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN Diskutiere λ1 · λ2 = a(x, y)c(x, y) − b2 (x, y) : (i) ac−b2 > 0 ⇒ λ1,2 6= 0, λ1 und λ2 haben gleiches Vorzeichen, die pDGL ist elliptisch, d. h., ∀(x, y) ∈ G mit a(x, y)c(x, y) − b2 (x, y) > 0 ist die pDGL elliptisch. (ii) ac − b2 < 0, λ1,2 6= 0, λ haben verschiedenes Vorzeichen, pDGL ist hyperbolisch. (iii) ac − b2 = 0, ∃λ = 0, pDGL ist parabolisch. Satz 19.2 Betrachte a(x, y)u,xx + 2b(x, y)u,xy + c(x, y)u,yy + F (x, y, u, u,x , u,y ) = 0. Die pDGL ist in (x, y) ∈ G (mit D(x, y) := a(x, y)c(x, y) − b2 (x, y)) (i) elliptisch, falls D(x, y) > 0, (ii) hyperbolisch, falls D(x, y) < 0, (iii) parabolisch, falls D(x, y) = 0. Beispiel 19.18 yu,xx + 2yu,xy + (x + y)u,yy + F = 0 D = ac − b2 = y(y + x) − y 2 = xy (s. Abb. 19.4) y 11 11 00 00 11 00 11 00 11 00 00 11 00 11 00 11 00 00 11 00 11 00 11 0011 11 00 11 00 11 00 11 00 11 11 00 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 11 00 00 11 00 00 00 0011 00 00 00 00 11 11 11 11 11 11 11 11 00 0 1 1 0 elliptisch 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 1111111111 0000000000 11 11 11 11 11 11 11 11 11 11 00 00 00 00 00 00 00 00 00 00 00 11 00 11 00 11 00 11 00 11 x 00 11 parabolisch 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 11 00 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 11 00 11 11 11 11 00 00 00 00 00 11 00 11 00 11 00 11 00 11 00hyperbolisch 00 11 00 11 00 11 0011 11 Abbildung 19.4: Gebiete verschiedenen Typs Beispiel ,xx + 2u,xy + u,yy + F = 0, u = u(x, y, z) 19.19 −u −1 1 0 √ A = 1 1 0 , die Eigenwerte sind λ1 = 0, λ2 = ± 2. 0 0 0 Die pDGL ist parabolisch mit der Normalform für w = w(ξ, η, %) √ √ 2w,ξξ − 2w,ηη + 0 · w,%% + F̃ = 0 19.3. KLASSIFIKATION DER QUASILINEAREN PDGL 2. ORDNUNG 19–99 Beispiel 19.20 Die Laplacegleichung u,xx + u,yy + u,zz = 0 ist schon in Normalform (λ1 = λ2 = λ3 = 1), sie ist vom elliptischen Typ , die Wellengleichung u,xx + u,yy + u,zz − 1 u c2 ,tt = 0 ist in Normalform (λ1 = λ2 = λ3 = 1, λ4 = − c12 und vom hyperbolischen Typ , die Wärmeleitungsgleichung u,xx + u,yy + u,zz − au,t = 0 ist parabolisch (λ4 = 0). Für die Typisierung reicht Satz 19.2 aus. Falls man sich aber tatsächlich für die Normalform der pDGL gebietsweise interessiert, muß man entsprechend transformieren. Der Nutzen einer Normalform besteht u. a. darin, daß für Normalformen Grundlösungen bekannt sind und Aussagen über das qualitative Verhalten der Lösungen einfacher zu treffen sind. Hat man die Lösungen der pDGL in Normalform gefunden, muß nur noch rücktransformiert werden. Transformation der pDGL (n = 2) A(x, y)u,xx + 2B(x, y)u,xy + C(x, y)u,yy + F = 0 auf Normalform: Betrachte eine Koordinatentransformation ¯ ¯ ¯ ∂(ξ, η) ¯ ξ = ξ(x, y) ¯ ¯ 6= 0, ξ, η ∈ C 1 mit , ¯ η = η(x, y) ∂(x, y) ¯ (D22) x = x(ξ, η) . y = y(ξ, η) Dann gilt U (ξ, η) := u(x(ξ, η), y(ξ, η)) bzw. U (ξ(x, y), η(x, y)) = u(x, y), u,x = U,ξ ξ,x + U,η η,x 2 + 2U 2 u,xx = U,ξξ ξ,x ,ξη ξ,x η,x + U,ηη η,x + U,ξ ξ,xx + U,η ηxx . Die u,y , u,yy , u,xy lassen sich analog berechnen. Aus (D22) ergibt sich dann die transformierte pDGL für U (ξ, η): aU,ξξ + 2bU,ξη + cU,ηη + F̃ (ξ, η, U, U,ξ , U,η ) = 0 (D̃22 ) mit 2 + 2B ξ ξ + C ξ 2 a = A ξ,x ,x ,y ,y b = A ξ,x η,x + B(ξ,x η,y + η,x ξ,y ) + Cξ,y η,y = A(ξ,x + c B A ξ,y )(η,x + 2 + 2B η η + = A η,x ,x ,y B A η,y ), 2. C η,y A 6= 0, AC − B 2 = 0 Satz 19.3 Die pDGL (D22 ) und (D̃22 ) sind vom gleichen Typ. ¯ ¯ ¯ ∂(ξ,η) ¯2 Beweis: Rechne die Beziehung (ac − b2 ) = ¯ ∂(x,y) ¯ (AC − B 2 ) nach. Ziel der folgenden Untersuchung ist: Bestimme die Transformation ξ(x, y), η(x, y) so, daß in Abhängigkeit vom (vorher bestimmten) Typ einige der Koeffizienten a, b, c in (D̃22 ) Null werden. Das Verschwinden von z. B. a erfordert natürlich wieder die Lösung einer pDGL, allerdings nur von 1. Ordnung. 19–100 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN B 2 +2B ξ ξ +C ξ 2 = (ξ −w ξ )(ξ −w ξ ) mit w Fall: a = 0 = A ξ,x ,x ,y ,x 1 ,y ,x 2 ,y 1,2 = − A ± ,y q B 2 −AC . A2 ξ,x − w1 ξ,y = 0 und ξ,x − w2 ξ,y = 0 heißen charakteristische Differentialgleichungen zu (D22), deren Lösungen heißen Charakteristiken . Bemerkung: c = 0 führt auf die gleichen charakteristischen Gleichungen. Gesucht sind also 2 Lösungen ¯der charakteristischen Differentialgleichungen ξ1 = ξ = ϕ(x, y) und ξ2 = ¯ ¯ ∂(ϕ,ψ) ¯ η = ψ(x, y) mit ¯ ∂(x,y) ¯ 6= 0. Die weitere Vorgehensweise hängt nun vom Vorzeichen von B 2 − AC und damit vom Typ der pDGL ab. 1. Fall: AC − B 2 < 0 (hyperbolischer Typ), w1 6= w2 . Falls man nun aus ¯ ξ,x −¯ w1 ξ,y = 0 und ξ,x − w2 ξ,y = 0 zwei Lösungen ξ = ϕ(x, y) und ¯ ¯ η = ψ(x, y) mit ¯ ∂(ϕ,ψ) ∂(x,y) ¯ 6= 0 gefunden hat, so sind a = c = 0 und die transformierte Gleichung (D̃22 ) hat die hyperbolische Standardform U,ξη = G(ξ, η, U, U,ξ , U,η ) oder nach anschließender Drehung des Koordinatensystems (entspricht einer neuen Transformation ξ = x + y, η = x − y) die zweite Standardform . U,xx − U,yy = H(x, y, U, U,x , U,y ). 2. Fall: AC − B 2 = 0 (parabolischer Typ), w1 = w2 . Es bleibt nur eine charakteristische Gleichung A ξ,x + B¯ ξ,y = ¯0. Zu deren Lösung ξ = ¯ ¯ ϕ(x, y) wähle man ein beliebige Funktion η = ψ(x, y) mit ¯ ∂(ϕ,ψ) ∂(x,y) ¯ 6= 0. Die Transformation ξ = ϕ(x, y), η = ψ(x, y) führt dann auf die parabolische Standardform U,ηη = G(ξ, η, U, U,ξ , U,η ). 3. Fall: AC − B 2 > 0 (elliptischer Typ), es gibt keine reellen wi . Dann bestimme man die komplexe Lösung z = ϕ(x, y) + iψ(x, y) der (komplexen) charakteristischen ¯Gleichung z,x − w1 z,y = 0, w1 komplex. Die Substitution ξ = ϕ(x, y), η = ¯ ¯ ∂(ϕ,ψ) ¯ ψ(x, y) mit ¯ ∂(x,y) ¯ 6= 0 führt auf die elliptische Standardform U,ξξ + Uηη = G(ξ, η, U, U,ξ , U,η ). Beispiel 19.21 y u,xx + (x + y)u,xy + xu,yy = 0 2 < 0, y 6= x hyperbolischer Typ. D = AC − B 2 = xy − 14 (x + y)2 = − (x−y) 4 q q 2 (x−y)2 B −AC 1 w1,2 = − B = − (x+y) , w1 = −1, w2 = − xy , A ± 2y ± 2 A2 y2 Charakteristische Gleichungen: ξ,x + ξ,y = 0, y ξ,x + x ξ,y = 0 ¯ ¯ ¯ ¯ Für deren Lösungen ξ1 = ϕ(x, y) = y − x und ξ2 = ψ(x, y) = y 2 − x2 gilt ¯ ∂(ϕ,ψ) ∂(x,y) ¯ = 19.3. KLASSIFIKATION DER QUASILINEAREN PDGL 2. ORDNUNG 19–101 ¯ ¯ ¯ −1 1 ¯ ¯ ¯ ¯ −2x 2y ¯ = 2(−y + x) 6= 0, x 6= y. Die so bestimmte Koordinatentransformation ξ = y − x, η = y 2 − x2 führt für U (ξ, η) = U (y − x, y 2 − x2 ) = u(x, y) auf u,x u,xx u,xy u,yy = U,ξ (−1) + U,η (−2x), u,y = U,ξ + U,η 2y, = U,ξξ + 4xU,ξη + 4x2 U,ηη − 2U,η = −U,ξξ − (2x + 2y)U,ξη − 4xy U,ηη = U,ξξ + 4y U,ξη + 4y 2 U,ηη + 2U,η . Die transformierte pDGL für U = U (ξ, η) erhält man aus yu,xx + (x + y)u,xy + xu,yy = . . . = −2(x2 − 2xy + y 2 )U,ξη − 2(y − x)U,η = 0 nach Division durch y − x 6= 0: ξU,ξη + U,η = (U,η · ξ),ξ = 0. Diese läßt sich leicht lösen: U,η · ξ = h(η), U = 1 ξ Rη a h(η̄)dη̄ + g(ξ) := 1ξ H(η) + g(ξ) mit H, g beliebig, H, g ∈ C 2 (Probe!), woraus sich durch Rücktransformation die Lösung des Originalproblems u(x, y) = U (ξ(x, y), η(x, y)) = 1 H(y 2 − x2 ) + g(y − x) y−x ergibt. Beispiel 19.22 u,xx − 2u,xy + u,yy = 0 D = AC − B 2 = 0 (parabolischer Typ), w1,2 = − B A = 1. Die charakteristische Gleichung ξ,x − ξ,y = 0 hat die Lösung ξ = ϕ(x, y) = x + y. η = ψ(x, y) := x wurde so gewählt, ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ 1 1 ¯ daß ¯ ∂(ϕ,ψ) ∂(x,y) ¯ = ¯ 1 0 ¯ 6= 0 wird. Diese Koordinatentransformation führt für U (ξ, η) := u(η, ξ − η) auf die Standardform U,ηη = 0. Deren Lösung U (ξ, η) = h(ξ)η + g(ξ) liefert nach Rücksubstitution u(x, y) = xh(x + y) + g(x + y), h, g ∈ C 2 beliebig. Beispiel 19.23 u,xx + 2u,xy + 5u,yy = 0 D = AC − B 2 = 5 − 1 = 4 > 0 (elliptischer Typ), w1,2 = −1 ± 2i. Die komplexe charakteristische Gleichung ξ,x − w1 ξ,y = ξ,x + (1 + 2i)ξ,y = 0 kann gelöst werden: ẋ = dy 1, ẏ = 1 + 2i, dx = 1 + 2i, y = (1 + 2i)x + K ⇒ z(x, y) = y − (1 + 2i)x = y − x − 2ix = ϕ(x, y) + iψ(x, y). ¯ ¯ ¯ ¯ ¯ ∂(ϕ,ψ) ¯ ¯¯ −1 1 ¯¯ 6= 0 : ξ = y − x, η = −2x ist die gesuchte Daraus ergibt sich wegen ¯ ∂(x,y) ¯ = ¯ −2 0 ¯ Transformation und führt auf die Normalform U,ξξ + U,ηη = 0. Aufgabe: Man zeige, daß u,xx + 2u,xy + (1 − sgn y)u,yy = 0 für y > 0, x beliebig, hyperbolisch und für y < 0, x beliebig, elliptisch ist. Man bestimme für diese beiden Teilgebiete die Transformation, die auf die Normalformen U,ξη = 0 (hyperbolischer Fall) und U,ξξ + U,ηη = 0 (elliptischer Fall) führen. 19–102 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN Beispiel 19.24 Cauchyproblem : ³ ´ ) Zu einer gegebenen Kurve x(τ ; τ ∈ I im R2 ist eine Lösung der pDGL (D22) gesucht, t(τ ) die längs der Kurve vorgeschriebene Werte annimmt. (D22) Konkret: Gegeben ist die Kurve x = τ, t = sin τ oder t = sin x im R2 . Gesucht ist eine Lösung u(x, t) der pDGL u,xx + 2 cos x u,xt − sin2 x u,tt − sin x u,t = 0 auf R × [0, ∞) mit u(x, sin x) = ϕ0 (x), u,t (x, sin x) = ϕ1 (x), ϕ0 , ϕ1 ∈ C 2 [0, ∞) gegeben. Typbestimmung: D = AC − B 2 = 1(− sin2 x) −q cos2 x = −1 < 0 (hyperbolisch) Bestimmung der Transformation: w1,2 = − B A± −D A2 = − cos x ± 1, ξ,x + (cos x − 1)ξ,t = 0 dt und ξ,x +(cos x+1)ξ,t = 0 führen über ẋ = 1, ṫ = cos x±1, dx = cos x±1, t = sin x±x+K auf die Lösungen ξ = t − x − sin x = ϕ(t, x), η =¯ t + x − sin x = ψ(t, x). Diese können als ¯ ¯ ∂(ϕ,ψ) ¯ Transformationsgleichungen benutzt werden, da ¯ ∂(x,y) ¯ 6= 0 ist. Transformierte DGL: Sei U (ξ, η) = u(x(ξ, η), y(ξ, η)) und damit u(x, y) = U (t − x − sin x, t + x − sin x). Die erforderlichen partiellen Ableitungen sind: u,t = U,ξ + U,η , u,x = U,ξ · (−1 − cos x) + U,η · (1 − cos x), u,tt = U,ξξ + 2U,ξη + U,ηη , u,xt = U,ξξ · (−1 − cos x) − 2 cos xU,ξη + U,ηη (1 − cos x) u,xx = U,ξξ (1 + cos x)2 − 2(1 − cos2 x)U,ξη + (1 − cos x)2 U,ηη + U,ξ sin x + U,η sin x. Mit diesen Ausdrücken liefert die Ausgangsdifferentialgleichung die Standardform für U (ξ, η) : 2U,ξη = 0, deren Lösung U (ξ, η) = A(ξ) + B(η) sofort folgt. Die Rücktransformation ergibt dann die Lösung des Originalproblems: u(x, t) = A(t − x − sin x) + B(t + x − sin x), A, B ∈ C 2 beliebig Anpassung der Lösung an die Kurvenbedingung: u(x, sin x) = ϕ0 (x) = A(−x) + B(x) oder ϕ00 (x) = −A0 (−x) + B 0 (x) u,t (x, sin x) = ϕ1 (x) = A0 (−x) + B 0 (x). Aus diesen beiden Bedingungen ergibt sich B 0 (x) = 12 (ϕ00 (x)+ϕ1 (x)) bzw. B(x) = 21 (ϕ0 (x)− Rx ϕ0 (x0 )) + 21 ϕ1 (x̄)dx̄, x0 ∈ R beliebig. Dann folgt x0 A(−x) = ϕ0 (x)−B(x) oder A(x) = ϕ0 (−x)−B(−x) = 12 (ϕ0 (−x)+ϕ0 (x0 ))− 21 und damit die Lösung u(x, t) = A(t − x − sin x) + B(t + x − sin x) = 12 (ϕ0 (x + sin x − t) + ϕ0 (x − sin x + t)) + 1 2 x−sin R x+t x+sin x−t ϕ1 (x̄)dx̄. −x R x0 ϕ1 (x̄)dx̄ 19.4. PARABOLISCHE PARTIELLE DIFFERENTIALGLEICHUNG 19–103 Sei z. B. ϕ0 (x) := x und ϕ1 (x) := 1, so folgt u(x, t) = 12 (x + sin x − t + x − sin x + t) + 1 2 x−sin R x+t dx̄ x+sin x−t u(x, t) = x − sin x + t. Einige Bemerkungen zu speziellen Ansätzen: Häufig sucht man bei pDGL keine allgemeine Lösung, sondern versucht partikuläre Lösungen in Funktionenklassen zu finden, die durch einen physikalisch-technischen Erwartungs” horizont“ bestimmt werden. Beispiel 19.25 u,xx +u,yy = 0 (Laplace). Mit einem Ansatz u(x, y) := eαx+βx kommt man über (α2 +β 2 )eαx+βx = 0, β = ±iα zu komplexen Lösungen u1 (x, y) = eα(x+iy) , u2 (x, y) = eα(x−iy) , deren Real- bzw. Imaginarteil dann reelle Lösungen sind: ũ1 = eαx cos βy, ũ2 = eαx sin βy (harmonische Funktionen). (Schwingungsgleichung) Beispiel 19.26 u,xx + u,yy − c2 u,tt = 0 Der Ansatz u(x, y, t) := v(x, y) · eiwt reduziert diese pDGL auf (v,xx + v,yy + c2 w2 v)eiwt = 0, also auf v,xx + v,yy + c2 w2 v = 0. (Helmholtzgleichung). Für Rand- und Anfangswertprobleme kann eine zu frühe Einschränkung der Allgemeinheit einer Lösung durch spezielle Ansätze zu Problemen führen: Der verbliebene Freiheitsgrad der Lösung reicht nicht aus, um vorgegebene Rand- und Anfangswerte zu erfüllen. Dieser Problematik läßt sich in manchen Fällen dadurch beikommen, daß man – im Falle linearer pDGL – statt Linearkombinationen von partikulären Lösungen Reihen von Lösungen betrachtet. Näheres dazu in den nächsten Abschnitten bei Diskussion und Anwendung des Produktansatzes u(x, y) := X(x) · Y (y). 19.4 Parabolische partielle Differentialgleichung am Beispiel der Wärmeleitungsgleichung Wärmeleitungsgleichung am Stab: %(x)u,t = (k(x)u,x ),x + F̃ (x, t). Dabei sind u(x, t) die Temperatur des Stabes an der Stelle x zur Zeit t, F̃ (x, t) ein äußerer Temperatureinfluß, %(x), k(x) Materialgrößen. Zunächst soll die Wärmeleitungsgleichung für den homogenen Stab (% = const., k = const.) ohne äußeren Einfluß (F̃ = 0) untersucht werden u,t = a2 u,xx . Später werden Rand- und Anfangswertprobleme behandelt. Lösung mit Produktansatz (Separation) u(x, t) := X(x) · T (t) 19–104 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN (Selbstverständlich gibt es auch Lösungen, die keine Produktform haben; es geht aber hier darum, mit diesem Ansatz Lösungen zu erzeugen, die an Anfangs- und Randwerte angepaßt werden können.) Aus u(x, t) = X(x) · T (t) folgt nach Wärmeleitungsgleichung XT · = a2 X 00 T 00 (x) T · (t) = XX(x) für u 6= 0 für alle (x, t) ∈ a2³T (t) ´ ³ · ´ 00 X (x) T (t) X 00 (x) d d = dx dx a2 T (t) = 0, folgt X(x) X(x) oder G ⊂ R2 . · Da = λ = aT2 T(t) , λ ∈ R. (t) Die pDGL zerfällt also in ein durch λ gekoppeltes System gewöhnlicher Differentialgleichungen (linear, konstante Koeffizienten) X 00 − λX = 0 T · − λa2 T = 0. Deren allgemeine Lösung ist von λ abhängig: Fall: λ=0: X 00 = 0, X(x) = a1 x + a2 Fall: λ > 0, X 00 − λX = 0, X(x) = a1 e Fall: λ < 0, √ λx √ + a2 e− λx p p X(x) = a1 cos | λ |x + a1 sin | λ |x, a1 , a2 ∈ R 2 und aus T · − λa2 T = 0 folgt: T = beλa t . Wärmeleitungsgleichung am homogenen Stab der Länge l: u = u(x, t), (x, t) ∈ G = [0, l] × [0, ∞), u,t = a2 u,xx + F (x, t) mit einer Anfangsbedingung u(x, 0) = f (x) und den Randbedingungen u(0, t) = g(t), u(l, t) = h(t) (s. Abb. 19.5) 00 11 1 0 00 11 0 1 00 11 00 11 0 1 00 11 11 00 00 11 00 11 00 11 0 1 11 00 00 11 00 11 0 1 0 1 00 11 11 00 1 0 0 1111 0000 1 0 1 11 00 t l x Abbildung 19.5: Definitionsbereich für u(x, t) g(t) und h(t) sind zeitabhängige Temperaturvorgaben an den Stabenden, f (x) ist die Temperaturverteilung des Stabes zur Zeit t = 0. Hinzu kommen Übergangsbedingungen f (0) = u(0, 0) = g(0) und f (l) = u(l, 0) = h(0). Es können auch Randbedingungen 2. und 19.4. PARABOLISCHE PARTIELLE DIFFERENTIALGLEICHUNG 19–105 3. Art behandelt werden. (etwa Vorgabe des Wärmeflusses u,x an den Stabenden) Die Lösung des inhomogenen Rand- und Anfangswertproblems wird auf die Lösung zweier einfacherer Teilprobleme zurückgeführt. (1) Zunächst wird eine Funktion w(x, t) := g(t) + x (h(t) − g(t)) l eingeführt. g(t) und h(t) sind den Randbedingungen zu entnehmen. (2) Teilprobleme (P 1): u,t = a2 u,xx , (P 1) u(x, 0) = f ∗ (x) := f (x) − w(x, 0) u(0, t) = 0 u(l, t) = 0 Die Lösung von (P 1) sei u1 (x, t) (3) Teilproblem (P 2): u,t = a2 u,xx + F ∗ (x, t), (P 2) u(x, 0) = 0 u(0, t) = 0 u(l, t) = 0 mit F ∗ (x, t) := F (x, t) − w,t (x, t). Die Lösung von (P 2) sei u2 (x, t) (4) Für die Gesamtlösung des inhomogenen Rand- und Anfangswertproblems gilt dann u(x, t) = u1 (x, t) + u2 (x, t) + w(x, t). Beweis: (a) u,t − a2 u,xx = u1,t + u2,t + w,t − a2 u1,xx − a2 u2,xx = F − w,t + w,t = F (b) u(x, 0) = u1 (x, 0) + u2 (x, 0) + w(x, 0) = f (x) − w(x, 0) + w(x, 0) = f (c) u(0, t) = u1 (0, t) + u2 (0, t) + w(0, t) = g(t) u(l, t) = u1 (l, t) + u2 (l, t) + w(l, t) = h(t). Das weitere Programm zeigt Lösungsmöglichkeiten für die Probleme (P 1) und (P 2) auf. (Hierbei wird der Einfachheit halber wieder mit den alten Bezeichnungen F und f statt mit F ∗ und f ∗ gearbeitet.) Zum Problem (P1): u,t = a2 u,xx , u(x, 0) = f (x), u(0, t) = u(l, t) = 0. Für u(x, t) = X(x) · T (t) ergeben sich nun die Randbedingungen für X(x) : u(0, t) = X(0) · T (t) = 0 ∀t, u(l, t) = 0 = X(l) · T (t) ∀t, woraus X(0) = X(l) = 0 für die Differentialgleichung X 00 − λX = 0 folgt. Es muß also λ < 0 sein. Mit λ =: −k 2 und der Lösung X(x) = a1 cos kx + a2 sin kx ergibt sich aus den Randbedingungen X(0) = 0, a1 = 0 und X(l) = a2 sin kl = 0. X(x) soll 19–106 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN nichttrivial sein. Deshalb muß kl = nπ, n = 1, 2, . . . sein und deshalb gibt es für die nπ kn := nπ l , n = 1, 2 . . . unendlich viele Lösungen Xn (x) = sin l x, n = 1, 2, . . .. (Die kn heißen Eigenwerte , die Xn (x) Eigenfunktionen des Eigenwertproblems X 00 − λX = 0, X(0) = X(l) = 0.) a2 n2 π 2 Die Lösungen von T · − a2 λn T = 0 werden dann durch Tn (t) = ea λn t = e− l2 t beschrieben. a2 λn t , n = 1, 2, . . . heißen Grundlösungen. Da das Rand- und Anun (x, t) = sin nπ l xe N P cn un (x, t), cn ∈ R Lösung und damit fangswertproblem linear ist, ist auch uN (x, t) = 2 auch u(x, t) = n=1 ∞ P n=1 cn un (x, t), falls die Reihe gleichmäßig konvergiert und die benötigten ∞ P Ableitungen existieren. Die Anfangsbedingung u(x, 0) = f (x) = n=1 cn sin nπ l x erfordert: Bestimme die Fourierkoeffizienten cn für ein gegebenes f (x). Annahme: f (x) ist in [0, l] in eine Fourierreihe entwickelbar. Da die Reihe eine reine Sinusreihe ist, muß f (x) notfalls ungerade periodisch fortgesetzt werden. Die Fourierkoeffizienten 2 cn = l Zl f (τ ) sin 0 nπ τ dτ l sind eindeutig bestimmt. Die Lösung eines hat die Darstellung à Problems (P 1) ! l ∞ 2 R P t −( anπ 2 l ) f (τ ) sin nπ sin nπ u(x, t) = l l τ dτ e l x. n=1 0 Eine in der Literatur häufig zu findende Darstellung entsteht nach Vertauschung von Summation und Integration (gleichmäßige Konvergenz!) ¸ · ∞ 2 Rl 2 P −( anπ t nπ nπ ) l u(x, t) = e sin L x sin L τ f (τ )dτ l 0 =: Rl n=1 G(t, x; τ )f (τ )dτ. 0 G(t, x; τ ) heißt lösender Kern oder Green’sche Funktion. Aufgabe: Untersuche die Temperatur für t → ∞. Zum Problem (P2): u,t = a2 u,xx + F (x, t), u(x, 0) = u(l, t) = 0 Für die Lösung wird angesetzt u(x, t) = ∞ X n=1 un (t) sin nπ x, un ∈ C 1 beliebig mit un (0) = 0. l Annahmen: u,t und u,xx läßt sich durch gliedweise Differentiation gewinnen (gleichmäßige Konvergenz der entsprechenden Reihe) und die äußere Einflußfunktion F (x, t) ist in eine 19.4. PARABOLISCHE PARTIELLE DIFFERENTIALGLEICHUNG 19–107 ∞ Rl P 2 Fourierreihe entwickelbar: F (x, t) = Fn (t) sin nπ F (ξ, t) sin nπ l x mit Fn (t) = l l ξdξ. n=1 0 ´ ∞ ³ ¡ ¢2 P u,t − a2 u,xx − F (x, t) = u·n + a2 nπ u − F (t) sin nπ n n l l x = 0. n=1 Falls die un (t) Lösungen der gewöhnlichen Differentialgleichungen u·n = − ³ anπ ´2 l un + Fn (t), un (0) = 0, n = 1, 2, . . . sind, löst das angesetzte u(x, t) das Problem. Zusammenstellung: Entwickle F (x, t) in eine Fourierreihe mit Fourierkoeffizienten Fn (t). ¢2 ¡ Löse mit diesen Fn (t) die (unendlich vielen) Anfangswertprobleme u·n + anπ un = l ∞ P nπ Fn (t), un (0) = 0. Dann ist u(x, t) = un (t) sin l x eine Lösung von (P 2). n=1 Beispiel 19.27 Auf einen Stab der Länge π wirkt ein Heizregime F (x, t) = e−2t sin x. Gesucht ist die Temperaturverteilung u(x, t) des Stabes, falls die Anfangstemperatur u(x, 0) = 2 sin x ist, die Stabenden in Eis liegen und a2 = 1 ist. u,t = u,xx + e−2t sin x, u(x, 0) = 2 sin x, u(0, t) = u(π, t) = 0, (x, t) ∈ [0, π] × [0, ∞). Die Lösung u(x, t) setzt sich additiv aus den Lösungen u1 (x, t) und u2 (x, t) der Teilprobleme (P 1) und (P 2). (P1) u,t = u,xx , u(x, 0) = 2 sin x, u(0, t) = u(π, t) = 0 ∞ ∞ P P 2 u(x, t) = cn sin nx e−n t , u(x, 0) = cn sin nx = 2 sin x, n=1 n=1 Damit wird (c1 = 2, cn = 0, n > 1) die Lösung u1 (x, t) = 2 sin x e−t . (P2) u,t = u,xx + e−2t sin x, u(x, 0) = 0, u(0, t) = u(π, 0. µ t) = ¶ ∞ P −2t Die Fourierkoeffizienten zu F (x, t) = e sin x = Fn (t) sin nx sind n=1 F1 (t) = e−2t , Fn (t) = 0, n > 2. Aus dem Ansatz für die Lösung u(x, t) = ∞ P un (t) sin nx, un (0) = 0 ergibt sich das System von Anfangswertproblemen für die n=1 Ansatzfunktionen un (t) : n=1 u·1 + u1 − e−2t = 0, u1 (0) = 0, u1 (t) = e−t − e−2t n≥2 u·n + n2 un = 0, un (0) = 0, un (t) ≡ 0. Damit ist u2 (x, t) = (e−t − e−2t ) sin x. Die Gesamtlösung (w = 0!) u(x, t) = u1 (x, t) + u2 (x, t) = (3e−t − e−2t ) sin x beschreibt den Abkühlungsprozeß des Stabes. 19–108 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN y b 11 00 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 000 111 11 00 00 11 000 111 00 11 000 111 11 00 000 111 a x 111 000 t G Abbildung 19.6: Definitionsbereich für die Temperatur u(x, y, t) Diskussion: Betrachte die Temperaturverteilung u(x, y, t) einer homogenen Platte P mit der Länge b und der Breite a. (x, y, t) ∈ G = [0, a] × [0, b] × [0, ∞) (s. Abb. 19.6) u,t = a2 (u,xx + u,yy ) + F (x, y, t), mit der Anfangsbedingung u(x, y, 0) = f (x, y) und der Randbedingung u|∂P = g(t). Die Behandlung dieses Problems erfolgt nach dem gleichen Schema wie beim Stabproblem, wenn man für u(x, y, t) den Separationsansatz u(x, y, t) = X(x)·Y (y)·T (t) macht. Aus der Differentialgleichung ergibt sich stufenweise ein verkoppeltes System von 3 gewöhnlichen Differentialgleichungen: Ṫ a2 T = X 00 X also Ṫ = gungen. 19.5 Y 00 Ṫ X 00 Y , a2 T =: λ = const., X = λa2 T, X 00 = µX, Y 00 = (λ − µ)Y + 00 − YY + λ =: µ = const. mit entsprechenden Rand- und Anfangsbedin- Hyperbolische partielle Differentialgleichung am Beispiel der Wellengleichung Schwingende Saite: u(x, t) ist die Auslenkung an der Stelle x zur Zeit t einer homogenen Saite der Länge l. F (x, t) sei eine äußere Anregung. Für u wird vorausgesetzt: u : G → R1 , G = [0, l] × [0, ∞) und u ∈ C 2 (int G), u ∈ C 0 (G). Zuständig für die Auslenkung ist die hyperbolische pDGL u,tt = c2 u,xx + F (x, t). Die sachgerechte Problemstellung ist ein Anfangs-/Randwertproblem u(x, 0) = f (x), u(0, t) = ϕ(t) u,t (x, 0) = g(x) u(l, t) = ψ(t). f und g beschreibt die Anfangslage und die Anfangsgeschwindigkeit, ϕ und ψ beschreibt eine Führung an den Saitenenden. Hinzu kommen noch Verträglichkeits- oder Übergangs- 19.5. HYPERBOLISCHE PARTIELLE DIFFERENTIALGLEICHUNG 19–109 bedingungen, z. B. f (0) = u(0, 0) = ϕ(0), f (l) = u(l, 0) = ψ(0), . . . Andere mögliche Randbedingungen sind Winkelvorschriften an den Rändern, z. B. u,x (0, t) = α(t) oder u,x (l, t) = β(t), man denke sich etwa einen einseitig eingespannten schwingenden Stab. Geometrische Deutung: (s. Abb. 19.7) u ϕ(t) t U (x, t) 1111 0000 0000 1111 0000 1111 0000 1111 0000 1111 000 111 0000 1111 000 111 0000 1111 ψ(t) 000 111 0000 1111 000 f (x) 111 l 111 000 x Abbildung 19.7: Rand- und Anfangsbedingungen für die schwingende Saite Gesucht ist also eine C 2 -Funktion u(x, t), die der pDGL genügt mit vorgegebenen Werten über ∂G (gesucht ist eine Fläche durch die gegebenen Raumkurven). Wie bei der Behandlung des Wärmeleitungsproblems wird die Lösung dieses Problems auf die Lösung mehrerer einfacherer Teilprobleme zurückgeführt. Hier soll nur eines der Teilprobleme behandelt werden: u,tt = c2 u,xx , u(x, 0) = f (x), u,t (x, 0) = g(x), u(0, t) = 0, u(l, t) = 0. Die Saite ist fest eingespannt. Für eine Anfangsauslenkung f (x) und eine Anfangsgeschwindigkeit g(x) soll bei fehlender äußerer Anregung das Schwingungsverhalten für alle x und für alle Zeiten t vorhergesagt werden. Eine erfolgreiche Lösungsmethode ist auch hier ein Separationsansatz, der auf Fourierreihen hinführt ( Fouriermethode ). Der Separationsansatz u(x, t) = X(x) · T (t) und T̈ X = c2 T X 00 bringt X 00 − λX = 0, T̈ − λc2 T = 0 und die Randbedingungen X(0)T (t) = X(l)T (t) = 0 ∀t bringen X(0) = X(l) = 0. Zu untersuchen ist also auch hier das Eigenwertproblem X 00 − λX = 0, X(0) = X(l) = 0. Aufgrund der Randwerte muß wieder (wie beim entsprechenden Wärmeleitungsproblem) λ < 0 sein. Aus der allgemeinen √ √ Lösung X(x) = c1 sin −λx + c2 cos −λx folgt aus X(0) = 0 c2 = 0 und aus X(l) = 0, 19–110 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN √ ¡ ¢2 , n = 1, 2, . . . (Eigenwerte) sowie die Eigenlösungen l −λ = nπ oder λn = − nπ l Xn (x) = sin nπ x. l ¡ ¢2 Die DGL T̈ − λn c2 T = T̈ + cnπ T = 0 hat die allgemeine Lösung l Tn (t) = an sin cnπ cnπ t + bn cos l l und hieraus folgt die n-te Eigenschwingung un (x, t) = Xn (x) · Tn (t) = sin nπ ³ cnπ cnπ ´ x an sin t + bn cos t , n∈N l l l u1 heißt Grundschwingung , un , n > 1 heißen Oberschwingungen . Die Frequenz der p n-ten Oberschwingung ist wn = cnπ a2n + b2n . l =: 2πνn , die Amplitude von Tn (t) ist An = Anpassung der Lösung an die Anfangsbedingungen: Die Linearität des Problems bewirkt wieder, daß mit den un auch u(x, t) = ∞ X un (x, t) n=1 Lösung ist (unter der Annahme der gleichmäßigen Konvergenz der entsprechenden Reihen). Mithin folgt aus u(x, 0) = u,t (x, 0) = ∞ P n=1 ∞ P n=1 bn sin nπ l x = f (x) und cnπ l an sin nπ l x = g(x) , x ∈ [0, l]. Falls nun f (x) und g(x) notfalls ungerade fortgesetzt werden, kann man die Koeffizienten bn und ãn := cnπ l an als (eindeutige) Fourierkoeffizienten der Funktionen f (x) und g(x) bzgl. einer reinen Sinusreihe bestimmen: bn = cnπ l 2 l Rl f (ξ) sin nπ l ξdξ =: fn 0 an = 2 l Rl 0 g(ξ) sin nπ l ξdξ =: gn . Damit ist ¶ ∞ µ X l cnπ cnπ nπ u(x, t) = gn sin t + fn cos t sin x cnπ l l l n=1 eine Lösung des Anfangs-/Randwertproblems (falls die entsprechenden Reihen gleichmäßig konvergieren). 19.5. HYPERBOLISCHE PARTIELLE DIFFERENTIALGLEICHUNG 19–111 Diskussion: 1. Für das Studium laufender Wellen und für die Beschreibung der entsprechenden Phänomene ist die im ersten Teilkapitel behandelte Methode von d’Alembert günstig, für die Untersuchung von stehenden Wellen ist die Fouriermethode besser. q p l2 2 2 2. Die Amplitude An = a2n + b2n = (cnπ) 2 gn + fn wird also entscheidend durch die Fourierkoeffizienten gn und fn bestimmt. Im Falle einer schwingenden Saite charakterisiert die Folge (An ) die Klangfarbe. Ein Ton wird als rein empfunden, wenn die Amplituden An der Oberschwingungen schnell“ nach Null gehen. ” 3. Bei inhomogenen Schwingungsgleichungen (F (x, t) 6= 0 entwickle man F (x, t) in eine passende Fourierreihe und verfahre analog wie bei der Wärmeleitungsgleichung. 4. Modelldiskussion Beispiel 19.28 Die angezupfte Saite hat die Anfangsbedingung u(x, 0) = f (x) u,t (x, 0) = 0. Eine Rechnung für eine Näherung mit ( £ l¤ βx, 0, 2 f (x) = £l ¤ β(l − x), 2 , l (s. Abb. 19.8) f l 2 l x Abbildung 19.8: führt für l = 1 auf eine Amplitudenfolge An = Oberschwingungen gehen schnell“ nach Null. ” 4β π2 ¡ ¢ 1 1, 0, 19 , 0, 25 , . . . . Die Amplituden der Beispiel 19.29 ¡ 1 1Eine¢Anfangsauslenkung der Form f (x) = αx führt (l = 1) auf eine Folge 2α (An ) = π2 1, 2 , 3 , . . . . Die An gehen langsam“ nach Null; der Ton wirkt grell. ” Aufgabe: Welche Anfangs- und Randwertprobleme sind für das Klavierspielen (angehämmerte Saite) und für das Spielen einer Geige zuständig? Schwingende Kreismembran: Um einen kleinen Einblick in die Probleme bei der Untersuchung des Schwingungsverhaltens höherdimensionaler Objekte zu geben, soll eine 19–112 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN kreisförmige Membran M = {(x, y) : x2 + y 2 ≤ 1} ⊂ R2 betrachtet werden. Zugrunde liegt dann die Wellengleichung u,tt = c2 4 u = c2 (u,xx + u,yy ). Dabei ist u = u(x, y, t) die Auslenkung zur Zeit t am Ort (x, y). G := M × [0, ∞), u : G → R1 , u ∈ C 2 (int G), u ∈ C(G) Die Membran soll auf einem Kreisring eingespannt sein, es wird eine Anfangsauslenkung und Anfangsgeschwindigkeit angenommen. √ u(x, y, t) = 0 auf ∂M = {(x, y) : x2 + y 2 = 1}, d. h., u(x, ± 1 − x2 , t) = 0 ∀x, t u(x, y, 0) = u0 (x, y), u,t (x, y, 0) = v0 (x, y). (s. Abb. 19.9) G ist also zylindrisch. Der geometrische Grundbereich M ist ein Kreis. In Polarkoordinaten t G y M x Abbildung 19.9: schwingende Membran wird die Beschreibung der Randbedingung besonders einfach: Die Koordinatentransformation x = r cos ϕ, y = r sin ϕ und die neue Variable U , definiert durch U (r, ϕ, t) := u(r cos ϕ, r sin ϕ, t) überführen Rand- und Anfangsbedingung in U (r, ϕ, 0) = u0 (r cos ϕ, r sin ϕ) =: f (r, ϕ) U,t (r, ϕ, 0) = v0 (r cos ϕ, r sin ϕ) =: v(r, ϕ) und U (1, ϕ, t) = 0 ∀t, ϕ, einfache Beschreibung Die Laplacegleichung in Polarkoordinaten wurde im 3. Teilkapitel Vektoranalysis bereitgestellt: 1 1 4U = U,rr + U,r + 2 U,ϕϕ . r r Deshalb folgt für die Wellengleichung 1 1 U,tt = c2 (U,rr + U,r + 2 U,ϕϕ ). r r 19.5. HYPERBOLISCHE PARTIELLE DIFFERENTIALGLEICHUNG 19–113 Als Lösungsmethode zur Lösung der Wellengleichung in Polarkoordinaten soll wieder die Fouriermethode (Separationsansatz, Fourierreihe) gewählt werden. U (r, ϕ, t) = R(r) · Φ(ϕ) · T (t), T̈ ΦR = c2 (R00 ΦT + 1r R0 ΦT + r12 RΦ00 T ) bzw. ´ ³ 00 T̈ R R0 1 Φ00 := c1 ∈ R. = + + R rR c2 T r2 Φ Die Differentialgleichung zerfällt in T̈ − c1 c2 T = 0 und 2 00 0 Φ00 c1 r2 − r RR − rR R = Φ := c2 ∈ R, Damit zerfällt die zweite Gleichung in zwei weitere: Φ00 − c2 Φ = 0 und r2 R00 + rR0 + (c2 − c1 r2 )R = 0. Diskussion der neuen Randbedingung: U (1, ϕ, t) = R(1)Φ(ϕ)·T (t) = 0 ∀ϕ, t bewirkt R(1) = 0. Da Φ(0) = Φ(2π), Φ0 (0) = Φ0 (2π) muß Φ(ϕ) eine 2π-periodische Funktion sein und Lösung der DGL Φ00 − c2 Φ = 0. Deshalb muß c2 negativ sein. Eine kleine Rechnung ergibt c2 = −n2 , aus physikalischen Gründen folgt ebenso c1 := −w2 . Damit erhält man ein System von verkoppelten gewöhnlichen DGLn (Kopplungsparameter n, w) T̈ + c2 w2 T = 0 Φ00 + n2 Φ = 0 r2 R00 + rR0 + (r2 w2 − n2 )R = 0, R(1) = 0 mit den Kopplungsparametern w2 und cn = −n2 . Die letzte DGL heißt Besselsche Differentialgleichung . Deren Lösungen sind die Besselfunktionen n-ter Ordnung Bn (wr) Rn (r) = Bn (wr) und Bn (w) = 0 = Rn (1) Das Funktionensystem der Besselfunktion spielt bei vielen Anwendungen eine große Rolle. Eine Zusammenstellung seiner Eigenschaften findet sich in jedem besseren Tafelwerk (siehe auch Bemerkung am Ende dieses Kapitels). Die Eigenwerte w in den DGL für T und R sind die Nullstellen wn der Besselfunktionen Bn (w) (Bn (w) = 0). Die Lösungen der DGL für T und Φ sind aus den vorherigen Abschnitten bekannt und man erhält die Grundlösungen Un = Rn · Tn · Φn mit Tn (t) = an sin cwt + bn cos cwt Φn (ϕ) = cn sin nϕ + dn cos nϕ Rn (r) = Bn (wr). 19–114 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN Die n-te Besselfunktion Bn (w) hat unendlich viele Nullstellen etwa wn,0 < wn,1 < . . .. Deshalb muß man Bn (wn,k r) betrachten und schreibt man in Kurzform Bn (wn,k · r) =: Bn,k (r), also eine doppelindizierte Funktionenfamilie. Aufgrund der Produktstruktur der Lösung Un gibt es also 4 strukturell verschiedene Grundlösungen, die auf ∂P verschwinden: z. B. Bn,k (r) sin nϕ sin cwn,k t, Bn,k (r) cos nϕ sin cwn,k t usw. n, k = 0, 1, 2, . . . Die Linearität des Anfangs-/Randwertproblems gibt Anlaß zur Lösung u(r, ϕ, t) := ∞ P n,k=0 Bn,k (r) [an,k sin nϕ sin cwn,k t + bn,k cos nϕ sin cwn,k t +cn,k sin nϕ cos cwn,k t + dn,k cos nϕ cos cwn,k t] mit unbestimmten an,k , bn,k , cn,k , dn,k , n, k = 0, 1, 2, . . .. Diese reellen Zahlen sind nun so zu bestimmen, daß die Anfangsbedingung erfüllt wird: u(r, ϕ, 0) = f (r, ϕ) ∞ P = Bn,k (r)[cn,k sin nϕ + dn,k cos nϕ] n,k=0 und Analoges für u,t (r, ϕ, 0) = v(r, ϕ). Die cn,k , dn,k , an,k , bn,k sind die Fourierkoeffizienten der Funktionen f (r, ϕ) und v(r, ϕ) nach den Orthogonalsystemen {sin nx, cos nx} und {Bn,k (r)}. Das System der Besselfunktionen ist orthogonal im folgenden Sinne: ½ Z1 Bn,k (r)Bn,l (r)rdr = 0 0 1 2 2 Bn+1 (wn,k ) , k 6= l = const. , k = l, n fest! Aufgabe: Vergleiche diese Orthogonalitätsrelation mit der entsprechenden Relation für das trigonometrische System {sin nx, cos nx}, n = 0, 1, 2, . . .. Die Fourierkoeffizienten lassen sich dann durch ebene Bereichsintegrale berechnen: z. B. 2π R R1 cn,l = πBn+11(w )2 f (r, ϕ) Bn,l (r) · r sin nϕdr dϕ. n,l 0 0 Bemerkung: Die Besselfunktionen sind ein Beispiel dafür, das Eigenwertprobleme (hier: gewöhnliche DGL und RB) ein System von Eigenfunktionen generieren, nach denen man Funktionen in Fourierreihen entwickeln kann. (Das trigonometrische Orthogonalsystem {sin nx} ist das System der Eigenfunktionen zum Eigenwertproblem X 00 +n2 X = 0, X(0) = X(2π) = 0 siehe Wärmeleitungsgleichung.) Zusatz: nichthomogene eindimensionale Wellengleichung (Spezialfall) u,tt = c2 u,xx + F (x) 19.6. ELLIPTISCHE PARTIELLE DIFFERENTIALGLEICHUNG 19–115 mit (AB) u(x, 0) = g(x), u,t (x, 0) = h(x) und (RB) u(0, t) = k1 , u(l, t) = k2 . Die äußere Einflußfunktion F (x) ist dabei nicht von t abhängig. Durch eine Substitution soll dieses Problem auf ein wesentlich einfacheres Problem (homogene pDGL, einfache Randbedingungen) zurückgeführt werden. Ansatz: u(x, t) = v(x, t) + S(x) Die pDGL führt auf v,tt = c2 (v,xx + S 00 ) + F (x) mit (RB) u(0, t) = k1 = v(0, t) + S(0), u(l, t) = k2 = v(l, t) + S(l) 1. Teilproblem: Gesucht ist ein S(x) mit c2 S 00 = −F (x) und S(0) = k1 , S(l) = k2 . Dann bleibt 2. Teilproblem: Gesucht v(x, t) mit v,tt = c2 v,xx und den (RB) v(0, t) = v(l, t) = 0 so wie den (AB) v(x, 0) = u(x, 0) − S(x) = g(x) − S(x) =: g ∗ (x) v,t (x, 0) = h(x). Dann löst u(x, t) = v(x, t) + S(x) das Anfangsproblem. Beispiel 19.30 u,tt = u,xx − 1, RB: u(0, t) = 0, u,x (0, t) = 2 Ansatz: v(x, t) + S(x) = u(x, t), AB. 1. Teilproblem: S 00 = 1, S(0) = 0, Ṡ(0) = 2 ⇒ S = x2 2 + 2x 2. Teilproblem: v,tt = v,xx , RB: v(0, t) = 0, v,x (0, t) = 0, AB Lösung siehe Kapitelanfang. 19.6 Elliptische partielle Differentialgleichung am Beispiel der Laplacegleichung 4u = 0 (Laplace), 4u = f (Poisson) Beispiele für Laplace oder Poissonprobleme wurden in Kapitel 17.3 (Vektoranalysis) gegeben. Falls % die Ladungsdichte eines elektrischen Feldes mit Feldstärke E gilt div E = %² , wobei ² die Dielektrizitätskonstante ist. Für wirbelfreie Felder E gilt: E hat ein Potential, also ∃u : E = −grad u oder div grad u = 4u = − %² (Poissonproblem). Für ladungsfreie Räume (% = 0) muß 4u = 0 (Laplaceproblem) sein. Für stationäre Wärmeleitungsprobleme u,t = 0) folgt nach 0 = u,t = a2 (u,xx + u,yy ) = a2 4 u, also ein Laplaceproblem. Sachgemäße Problemstellung für elliptische Differentialgleichungen sind Randwertprobleme . Diese werden klassifiziert: Das 1. Randwertproblem für ein Gebiet G ⊂ R2 oder G ⊂ R3 mit u : G → R1 und hinreichend glattem Rand ∂G ist: Gesucht ist ein u ∈ C 0 (Ḡ), u ∈ C 2 (G) mit 4u = 0 und einer Randbedingung der Form 19–116 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN u|∂G = g, g ∈ C 0 (∂G) vorgegeben. Das 1. RWP wird auch Dirichletproblem genannt. Das 2. Randwertproblem für gleiche Gebiete G und Funktionen u(x) ist: ∂u Gesucht ist ein u : 4u = 0 mit einer Randbedingung ∂n |∂G = h, h ∈ C 0 (∂G) beliebig, n Außennormale. Das 2. RWP wird auch Neumannproblem genannt. Beim 3. Randwertproblem sind gemischte Randbedingungen zugelassen (Bedingungen für ∂u u|∂G und ∂n |∂G ). Eine weitere Klassifizierungsmöglichkeit ist die Unterscheidung zwischen inneren Problemen : 4u = 0 in G, u|∂G = g und (s. Abb. 19.10) ∂G G G beschränkt Abbildung 19.10: inneres Problem bei der Laplacegleichung äußeren Problemen : 4u = 0 in CG (Komplement von G), u|∂G = g, Vorschrift für p lim u(x, y, z) mit r = x2 + y 2 + z 2 . r→∞ Betrachtet werden im weiteren nur Dirichletprobleme 4u = f, u|∂G = g. Sei u := u0 + v, wobei (i) u0 löst das erste Teilproblem (P 1) : 4u0 = f (Gesucht ist eine partikuläre Lösung von 4u = f ohne weitere Randbedingung) (ii) v löst das Teilproblem (P 2) := 4v = 0, v|∂G = u|∂G −u0 |∂G = g|∂G −u0 |∂G := g ∗ |∂G (verkürztes Dirichletproblem mit Laplacegleichung) Dann gilt für u = v + u0 4u = 4v + 4u0 = 0 + f = f und u|∂G = u0 |∂G + v|∂G = g|∂G . d. h., u löst Originalproblem. Diskussion: Beschäftigung mit (P 1) ist Inhalt der Potentialtheorie . Lösungen von (P 2) baut man sich aus bekannten Grundlösungen der Laplacegleichung auf (harmonische Funktionen, Funktionentheorie). 19.6. ELLIPTISCHE PARTIELLE DIFFERENTIALGLEICHUNG 19–117 Potentialtheorie: (P 1) Lösungsformel für Problem (P 1) : u = u(x, y, z), 4u = f (x, y, z), w = (x, y, z). Betrachte G ⊂ R3 beschränkt, f sei auf G beschränkt und integrierbar. (s. Abb. 19.11) z y x 11111 00000 11 00 00000 11111 w Auf punkt 00000 11111 00000 11111 11111 00000 w0 1 0 w0 ∈ G G Abbildung 19.11: Poissonproblem im R3 p Bezeichnung: Mit |w − w0 | = (x − x0 )2 + (y − y 0 )2 + (z − z 0 )2 heißt RRR %(w0 ) 0 u(w) = u(x, y, z) = |w−w0 | dw G das Raumpotential zur Raumdichte % : R3 → R1 ( Newtonpotential ). Diskussion: Das Raumpotential ist ein räumliches Bereichsintegral mit den Integrationsvariablen w0 = (x0 , y 0 , z 0 ) und den Parametern w = (x, y, z). Falls der Aufpunkt w in G liegt (∃w0 : |w − w0 | = 0) muß das Raumpotential über ein uneigentliches Integral bestimmt werden. Satz 19.4 Sei G ⊂ R3 beschränkt, f auf G beschränkt und integrierbar. Dann gilt (i) ∃u(w) ∀w ∈ R3 und u ∈ C 0 (R3 ) (ii) ∃u,x , u,y , u,z (iii) u ∈ C ∞ ∀w ∈ R3 ∀w ∈ intCG (Innere des Äußeren von G) und es gilt dort 4u = 0 (iv) falls % ∈ C 1 (G) ⇒ u ∈ C 2 (G) und es gibt dort 4u = −4π% Bemerkungen: 1. für % = f −4π ist das Raumpotential Lösung von Problem (P 1) 2. Unter den angegebenen Voraussetzungen existiert das in G uneigentliche Integral nicht nur, sondern es ist sogar zweimal stetig nach den Parametern (x, y, z) differenzierbar. 3. Falls die Belegung % auf Flächen gegeben ist, gibt es eine ähnliche Formel zur Potentialberechnung in Form von Oberflächenintegralen (Potential der einfachen bzw. Doppelschicht). 19–118 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN Beispiel 19.31 Berechnung eines Raumpotentials für eine homogene Kugel K = {(x, y, z) : x2 + y 2 + z 2 ≤ R2 } (d. h., für die Dichte %(x, y, z) = const.) Aus Symmetriegründen hängt das Potential u nur vom Abstand r vom Nullpunkt ab. Es wird deshalb nur u(0, 0, z)(w = (0, 0, z), z = r) berechnet. Dann ist |w − w0 |2 = x02 + y 02 + (z − z 0 )2 = x02 + y 02 + z 02 − 2zz 0 + z 2 . Transformation auf Kugelkoordinaten: z 0 = r0 cos ϑ0 , J = r02 sin ϑ0 : |w − w0 |2 = x02 + y 02 + z 02 − 2zr0 cos ϑ + z 2 und RR Rπ 2π R r02 sin ϑ0 √ u(0, 0, z) = % dϕ0 dϑ0 dr0 . r02 −2zr0 cos ϑ0 +z 2 0 0 0 Substituiert man ξ = cos ϑ0 und berücksichtigt z > 0, so erhält man u(0, 0, z) = 2π% = 2π% RR ³ r0 p 0 RR 0 z r0 0 z (|r ´¯ ¯ 0 r02 − 2zr0 ξ + z 2 ¯ξ=−1 ξ=1 dr + z| − |r0 − z|)dr0 . Der Integrand hängt nun von der Lage des Aufpunktes z ab: Fall 1: z ≥ R : |r0 + z| − |r0 − z| = 2r0 (außen) ½ Fall 2: 0 < z < R : |r0 + z| − |r0 − z| = 2r0 , r0 < z 2z, r0 > z (innen) Fall 3: z = 0 : direkte Berechnung des vorletzten Integrals Die Lösung ist ( u(r) = 4πR3 % 3 1 r ¡ 2 1 2¢ 2π% R − 3 r · ,r ≥ R (außen) ,0 ≤ r ≤ R (innen) Diskussion 1. Verifikation von Poisson- und Laplacegleichung ¡1¢ 3% r ≥ R : 4u = 4πR 4 3 r =0 0 ≤ r ≤ R : 4u = −2π% · 31 4 (r2 ) = − 2π 3 % · 6 = −4π% 2. Potentialabfall: Betrachte u(r) 3% 2 · R1 = 4π% u ist stetig insbesondere in r = R : u1 (R) = 4πR 3 3 R = u2 (R), es gilt lim u(r) = 0, u(r) hat in r = R eine unstetige 2. Ableitung. r→∞ (s. Abb. 19.12) Die Behandlung von (P 2) wird hier auf die Behandlung zweier Spezialfälle reduziert, an denen die Probleme für andere Fälle erkennbar sind. Dirichletproblem für den Kreis (n = 2) Sei G = {(x, y) : x2 + y 2 ≤ %2 } eine Kreisscheibe. Gesucht ist eine Lösung u = u(x, y) von 19.6. ELLIPTISCHE PARTIELLE DIFFERENTIALGLEICHUNG 19–119 u 0 1 1 0 0 1 2π%R2 4 π%R2 3 1111111 0000000 r R Abbildung 19.12: Potentialabfall an der Kugel u u(x, y) g(x, y) y ϕ G ∂G x Abbildung 19.13: Dirichletproblem für den Kreis 4u = 0, u|∂G = g(x, y), g ∈ C 0 (∂G) gegeben (s. Abb. 19.13) Dieses einfache Randwertproblem soll – da G kreisförmig ist – mit Hilfe einer Koordinatentransformation (Polarkoordinaten) gelöst werden: u(x, y) = u(r cos ϕ, r sin ϕ) := U (r, ϕ). Der Laplace-Operator in Polarkoordinaten ist bekannt (Kap. 17). Gesucht ist also ein U (r, ϕ) : 1 1 4U = U,rr + U,r + 2 U,ϕϕ = 0, r 6= 0 r r mit den RB U (%, ϕ) = g(% cos ϕ, % sin ϕ) := h(ϕ), 0 ≤ ϕ ≤ 2π. Ein Separationsansatz U (r, ϕ) = R(r) · Φ(ϕ) führt auf r2 R00 rR0 Φ00 + =− := λ, R R Φ also auf Φ00 + λΦ = 0 und r2 R00 + rR0 − λR = 0. Randbedingungen für Φ00 + λΦ = 0 ergeben sich aus der Periodizität von Φ(ϕ) : Φ(0) = Φ(2π) und Φ0 (0) = Φ0 (2π). Periodische Lösungen Φ(ϕ) erfordern λ c1 und c2 in der allgemei√ > 0. Die Integrationskonstanten √ nen Lösung Φ(ϕ) = c1 sin λϕ + c2 cos λϕ werden durch die Periodizitätsbedingungen 19–120 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN Φ0 (0) = Φ0 (2π) bestimmt: Die Bedingungen ergeben ein homogenes Gleichungssystem für c1 und c2 . Seine nichttriviale Lösbarkeit erfordert das Verschwinden der Koeffizientende√ terminante: cos 2π λ = 1, also λn = n2 . Deshalb sind die Eigenlösungen des Φ-Problems Φn (ϕ) = cn sin nϕ + dn cos nϕ, cn , dn ∈ R. Die R-Gleichung wird dann r2 R00 + rR0 − n2 R = 0. Diese DGL ist vom Eulertyp und läßt sich mit dem Ansatz R(r) = rk lösen: die Lösung für k = ±n ist Rn (r) = r±n . Eine spezielle Lösung für U (r, ϕ) = U (r) (radialsymmetrisches U ) ist wegen U 00 + 1r U 0 = 0 U (r) = c1 ln r+c2 , ci ∈ R. Damit kann man alle Grundlösungen des Dirichletproblems für den Kreis auflisten: 1, ln r, rn sin nϕ, rn cos nϕ, r−n sin nϕ, r−n cos nϕ. Durch einen Reihenansatz U (r, ϕ) := ∞ X (an cos nϕ + bn sin nϕ)rn n=0 mit ai , bi ∈ R soll eine Anpassung an die Randbedingung möglich werden. h(ϕ) = ∞ X %n (an cos nϕ + bn sin nϕ) n=0 %n an und %n bn sind also die Fourierkoeffizienten der Funktion h(ϕ) bzgl. des trigonometrischen Systems {cos nϕ, sin nϕ} : an %n = bn %n = 1 π 1 π R2π 0 2π R h(ϕ) cos nϕdϕ =: An , n = 0, 1, . . . h(ϕ) sin nϕdϕ =: Bn , n = 1, 2, . . . 0 Dies setzt natürlich voraus, daß h(ϕ) in eine Fourierreihe entwickelbar ist. Die Lösung des Dirichletproblems für die Kreisscheibe ist also ∞ A0 X U (r, ϕ) = + 2 n=1 µ ¶n r (An cos nϕ + Bn sin nϕ), % ¯ ¯ ¯ ¯ falls die Reihe so gut“ konvergiert, daß U,r , U,rr , U,ϕϕ existiert. Sicher ist (obwohl ¯ %r ¯ < 1), ” daß sich die Konvergenz für r → % verschlechtert. Dirichletproblem für die Kugel (n = 3) G = K = {(x, y, z) : x2 + y 2 + z 2 ≤ %2 }, u = u(x, y, z), p 4u = 0, u|∂k = g, u(x, y, ± %2 − x2 − y 2 ) = g(x, y) 19.6. ELLIPTISCHE PARTIELLE DIFFERENTIALGLEICHUNG 19–121 Da das Grundgebiet eine Kugel ist, bietet sich zwecks einfacherer Formulierung der Randbedingung eine Transformation auf Kugelkoordinaten an: (x, y, z) ⇔ (r, ϕ, ϑ). Die Laplacegleichung in Kugelkoordinaten für U (r, ϕ, ϑ) = u(x(r, ϕ, ϑ), y(r, ϕ, ϑ), z(r, ϑ)) 4U = (r2 U,r ),r + 1 1 (sin ϑU,ϑ ),ϑ + U,ϕϕ = 0 sin ϑ sin2 ϑ ist etwas komplizierter, die neuen Randbedingungen dagegen sind einfach: U (%, ϕ, ϑ) = h(ϕ, ϑ). Im folgenden sollen nur die Grundlösungen bereitgestellt werden. Mit diesen werden dann über die entsprechenden Fourierreihen die Lösungen konstruiert. Es werden verschiedene Fälle diskutiert. Fall Lösung). Dann folgt aus der Laplacegleichung ¡ 2A: ¢U = U (r) (kugelsymmetrische d dU 2 dU =: −c̃ und U (r) = c1 + c . Dies liefert die ersten beiden r = 0, also r 1 2 dr dr dr r Grundlösungen 1, 1r (Man vergleiche diese mit den Grundlösungen (1, ln r) für das ebene Problem). Fall B: U (r, ϕ, ϑ) = R(r) · Y (ϑ, ϕ). Dieser Separationsansatz führt auf die beiden Differentialgleichungen für R(r) und Y (ϑ, ϕ) : r2 R00 + 2rR0 − λR = 0, eine DGL vom Eulertyp (Ein Lösungsansatz R(r) = rn , n ganz führt auf λn = n(n + 1), n = 0, 1, 2, . . . .) und auf 1 1 (sin ϑY,ϑ ),r + Y,ϕϕ + n(n + 1)Y = 0. sin ϑ sin2 ϑ Die Lösungen dieser Differentialgleichung sind wohldefinierte Funktionen und heißen Kugelfunktionen Yn (ϑ, ϕ) (siehe Tafelwerk). Hieraus ergeben sich rn Yn (ϑ, ϕ) und r−n Yn (ϑ, ϕ) als Grundlösungen und damit als Grundlage für entsprechende Reihenansätze. Fall C: U (r, ϕ, ϑ) = R(r)Θ(ϑ) · Φ(ϕ). Dieser Separationsansatz führt auf die gleiche DGL für R(r), wie im Fall B und damit auch zur gleichen Lösung. Die separierte DGL für Φ(ϕ) ist Φ00 + λΦ = 0. Da Φ und Φ0 periodisch sind, folgt für die Eigenwerte wieder λm = m2 und die Lösungen (Eigenfunktionen) sind 1, cos m ϕ, sin m ϕ, m = 1, 2, . . . . Für Θ(ϑ) ergibt sich die DGL µ ¶ d dΘ sin ϑ sin ϑ + (n(n + 1) sin2 ϑ − λm )Θ = 0, dϑ dϑ deren Lösung die sogenannten Legendrefunktionen (Tafelwerk!) Ln,m (r) sind. Für den Spezialfall m = 0 mit einer Substitution cos ϑ =: ξ geht die DGL in · ¸ d 2 dΘ (1 − ξ ) + n(n + 1)Θ = 0 dξ dξ 19–122 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN über. Diese DGL heißt Legendredifferentialgleichung, deren Lösungen sind die Legendrepolynome Pn (ξ) (Tafelwerk!) Die Grundlösungen in diesem Spezialfall sind rn Pn (cos ϑ), 1 Pn (cos ϑ), n = 0, 1, 2, . . . . rn+1 Um die Anpassung an die Randbedingungen vorzunehmen, werden wieder Reihen von Grundlösungen angesetzt, deren unbestimmte Koeffizienten sich als Fourierkoeffizienten berechnen lassen. Dies setzt voraus, daß die im Verlauf dieses Abschnittes eingeführten Funktionensysteme Orthogonalsysteme sind und die vorgegebenen Randfunktionen h sich in Fourierreihen nach diesen Orthogonalsystemen entwickeln lassen. Bemerkungen: Abkühlung von Körpern, Studium von Schwingungen etwa bei Maschinenfundamenten, Potentialbestimmungen führen auf partielle Differentialgleichungen. Für einfache Körper (Rechtecke und Kreise, Kugel, Zylinder und Quader) lassen sich Lösungen der pDGL mit Hilfe von Separationsansätzen, Eigenwertproblemen und entsprechenden Fourierreihen nach der Eigenfunktion bestimmen. Für reale nicht elementare Gebilde sind die Verhältnisse ungleich komplizierter. Manchmal sind Approximationen dieser Gebilde stückweise durch elementare Gebilde (Kugel-, Kegel- und Quaderteile) erfolgreich. Anhang – ein Beispiel (z. B. Meyberg/Vachenauer, Höhere Mathematik Bd. 2, S. 395) Abkühlprozesse durch die äußere Erdschicht (s. Abb. 19.14) Erdoberf läche x Abbildung 19.14: spezielles Wärmeleitungsproblem Betrachte: G = {(x, t) : 0 ≤ x < ∞, −∞ < t < ∞}, u : G → R, u Temperatur. Die zuständige Wärmeleitungsgleichung ist u,t = ku,xx 2 mit kErde = 0, 002 cm s (Diffusionskonstante). Die Oberflächentemperatur über ein Jahr 7 habe die Struktur g(t) = A0 cos wt mit 2π w = 3, 15 · 10 s (s. Abb. 19.15) Dies entspricht einer Randbedingung u(0, t) = g(t). In einer Tiefe von x = x̄ soll ein Temperaturverlauf von h(t) = −Bo cos wt bestehen (B0 < A0 ). (s. Abb. 19.16) Die entsprechende Randbedingung u(x̄, t) = h(t) charakterisiert die Situation. 19.6. ELLIPTISCHE PARTIELLE DIFFERENTIALGLEICHUNG u A0 19–123 Sommer T 2 t T W inter Abbildung 19.15: Temperaturverteilung an der Erdoberfläche u W inter B0 T 2 t T Sommer Abbildung 19.16: Temperaturverteilung in der Tiefe von x̄ Metern Aufgabe: Bestimme x̄ (wie tief muß ein Keller gebaut werden), damit der Temperaturverlauf dort genau phasenverschieden zur Oberfläche ist (Winter maximale, Sommer minimale Temperatur). Es ist also für das Randwertproblem u,t = ku,xx , u(0, t) = A0 cos wt, u(x̄, t) = −B0 cos wt der Rand x = x̄ zu bestimmen. Als Lösungsmethode wird ein Ansatzverfahren gewählt, und zwar wird das reelle Problem in ein komplexes Problem eingebettet: Ansatz: ū(x, t) = X(x)eiwt , u(x, t) = Re ū(x, t). Die Randbedingungen für ū sind dann ū(0, t) = A0 eiwt , ū(x̄, t) = −B0 eiwt . Die pDGL ū,t = kū,xx liefert (iwX−kX 00 )eiwt = 0,also X 00 − i wk X = 0 mit den neuen Randbedingungen X(0) = A0 , X(x̄) = −B0 (u(0, t) = X(0)·eiwt = A0 eiwt ). Für die komplexe DGL X 00 −i wk X = 0 bietet sich ein weiterer Ansatz pw√ X(x) = eµx an, der auf die charakteristische Gleichung µ2 − iw k = 0 führt. µ1,2 = k i= ³ ´ p w 1+i pw ± k √2 , b := 2k . Damit ergibt sich für die allgemeine Lösung X(x) = c1 eb(1+i)x + c2 e−b(1+i)x . Da nur beschränkte Lösungen gesucht werden, ist c1 = 0. c2 und x̄ bestimmen sich aus −bx̄ (cos bx̄ − i sin bx̄) = −B , woraus den Randbedingungen: X(0) = A0 = c2 , X(x̄) = Aq 0e 0 bx̄ = nπ und für n := 1 (1. Keller) folgt x̄ = n = 1 um den Faktor e−π : B0 = −A0 e−π . π b =π 2k w. Die Amplitude verringert sich bei Aus der Lösung ū(x, t) = A0 e−b(1+i)x eiwt folgt 19–124 KAPITEL 19. PARTIELLE DIFFERENTIALGLEICHUNGEN −bx cos(wt − bx), eine laufende Welle die gewünschte q Lösung u(x, t) = Re (ū(x, t)) = A0 e und x̄ = π 2k w ≈ 4.44m (Kellertiefe). Kapitel 20 Wahrscheinlichkeitsrechnung 20.1 Zufällige Ereignisse Definition 20.1 (1) Ein Versuch, der unter Beibehaltung einer festen Auswahl von Bedingungen beliebig oft wiederholbar ist und dessen Ergebnis im Bereich gewisser Möglichkeiten ungewiß ist, heißt zufälliger Versuch. (2) Das Ergebnis eines zufälligen Versuches heißt zufälliges Ereignis. Ein zufälliges Ereignis ist also ein mögliches Ereignis. Spezielle zufällige Ereignisse sind das sichere Ereignis Ω (tritt bei jeder Wiederholung ein) und das unmögliche Ereignis ∅. Beispiel 20.1 In einem Stromkreis werden Frequenzen gemessen. Wird genau die Frequenz ν gemessen, soll dieses Ereignis Eν , ν ∈ R+ , heißen. Andere zufällige Ereignisse könnten sein: Ax := es wird eine Frequenz ν, ν ≤ x, gemessen (Kurzform: Ax = Eν , ν ≤ x) und Axy = Eν , x < ν ≤ y. Das sichere Ereignis wäre Ω = Eν , ν ∈ R+ und ein unmögliches Ereignis ∅ = Eν , ν = −1. Bemerkung: Der Zufall charakterisiert also Situationen, in denen man auf Grund fehlender Informationen (oder auf Grund einer ausgewählten Anzahl zu berücksichtigender Informationen) den Experimentausgang nicht vorhersehen kann. 20.1.1 Relationen zwischen zufälligen Ereignissen Die Verknüpfung zufälliger Ereignisse erfolgt nach den Regeln der Mengenlehre: Grundrelationen: (1) A ⊆ B : Das Ereignis A zieht das Ereignis B nach sich; mit A tritt notwendigerweise auch B ein. Es gilt stets E ⊆ Ω und ∅ ⊆ E für alle Ereignisse E. Die Gleichheit zweier Ereignisse gilt genau dann, wenn A ⊆ B und B ⊆ A. Beispiel 20.2 (Fortsetzung B20.1): Eν ⊂ Ax , Axy ⊂ Ay . 20–125 20–126 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG (2) C = A ∪ B : C tritt genau dann ein, wenn mindestens eines der beiden Ereignisse A oder B eintritt. A ∪ B wird auch Summe zweier Ereignisse genannt. Erweiterung: C = ∪ni=1 Ai , [C = ∪∞ i=1 Ai ]: C tritt genau dann ein, wenn es ein i ∈ {1, ..., n} gibt, so daß Ai eintritt, [∃i ∈ {1, 2, ...} : Ai tritt ein]. Eigenschaften und Regeln: A∪B =B∪A (Kommutativität) A∪A=A A∪Ω=Ω A∪∅=A (A ∪ B) ∪ C = A ∪ B ∪ C (Assoziativität) Beispiel 20.3 Bn = Eν , 1 n+1 < ν < n1 , A1 = Eν , ν ≤ 1. Dann ist A1 = ∪∞ n=1 Bn . (3) C = A ∩ B : C tritt genau dann ein, falls sowohl A als auch B eintritt (’Produkt zweier Ereignisse’). Erweiterung: C = ∩ni=1 Ai , [C = ∩∞ i=1 ]: C tritt genau dann ein, wenn für alle Ai , i = 1...n, gilt: Ai tritt ein, [ ∀ Ai gilt: Ai tritt ein ]. Falls sich A und B ausschließen, folgt A ∩ B = ∅. Eigenschaften und Regeln: A ∩ B ⊆ A, A ∩ B ⊆ B, A ∩ A = A, A ∩ ∅ = ∅, A ∩ Ω = A, A ∩ B = B ∩ A, A ∩ (B ∩ C) = A ∩ B ∩ C, (Kommutativität) (Assoziativität). Beispiel 20.4 E3 ∩ E4 = ∅, Eν ∩ Ax = Eν Folgerung: Verknüpfungsregeln von de Morgan (Distributivität) (1) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) (2) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) Beweis von (2): L = R. Es muß gezeigt werden: L ⊆ R und R ⊆ L. zu L ⊆ R: L tritt ein ⇒ A tritt ein oder (B ∩ C) tritt ein ⇒ A ∪ C tritt ein und A ∪ B tritt ein ⇒ R tritt ein. zu R ⊆ L: Beweis analog. (4) C = A \ B : C tritt genau dann ein, wenn A aber nicht (gleichzeitig) B eintritt (Differenz zweier Ereignisse). Falls A ∩ B = ∅, folgt A \ B = A. Beispiele: Ax \ Ay = Ayx = Eν , y < ν ≤ x, A2 ∩ A34 = ∅ ⇒ A2 \ A34 = A2 . (5) Ā = Ω \ A : Spezialfall der Differenz (komplementäres Ereignis) 20.1. ZUFÄLLIGE EREIGNISSE 20–127 Folgerungen: A ∪ Ā = Ω, A ∩ Ā = ∅, A \ B = A ∩ B̄ Beispiel 20.5 Ω \ Ax =: à := Eν , ν > x 20.1.2 Systeme von Ereignissen - Ereignisfelder Definition 20.2 Ein vollständiges System von Ereignissen ist eine Menge von Ereignissen {E1 , ..., En }, für die im Ergebnis eines Versuches genau ein Ei , i = 1...n eintritt, d.h. es gilt Ei ∩ Ej = ∅, i, j = 1...n, i 6= j und ∪ni=1 Ei = Ω. Der Nachweis der Vollständigkeit eines Systems ist manchmal recht schwierig. Definition 20.3 (i) Ein System E von Ereignissen, welches gegenüber den Operationen Vereinigung, Durchschnitt, Differenz und Komplement abgeschlossen ist und alle im Bezug auf den Versuch interessierenden Ereignisse enthält, heißt Ereignisfeld. (ii) Ein Ereignis E ∈ E heißt atomar , falls gilt: es gibt kein B 6= ∅, B 6= E mit B ⊂ E. Ein Ereignis E ∈ E heißt zusammengesetzt , falls E = ∪ni=1 Ei , Ei atomar. Atomare Ereignisse werden auch Elementarereignisse genannt. Jede Grundmenge Ω (sicheres Ereignis) setzt sich aus endlich oder unendlich vielen Elementarereignissen, sowie aus Verknüpfungen von Elementarereignissen zusammen. Betrachte das System aller Teilmengen Mi ⊂ Ω. Dieses System wird mit P (Ω) =: 2Ω bezeichnet und heißt Potenzmenge von Ω. Die Potenzmenge einer Grundmenge Ω ist die größte strukturierte Menge auf der sich eine Wahrscheinlichkeit erklären läßt. Häufig ist man jedoch nicht an einer Wahrscheinlichkeit für alle Teilereignisse eines sicheren Ereignisses interessiert, sondern nur für gewisse Teilsysteme von Ω. Ein solches Teilsystem muß allerdings eine bestimmte innere Struktur haben: Es wird der Begriff der σ-Algebra oder Ereignisalgebra eingeführt. Die σ-Algebra zu einer Grundmenge Ω ist immer ein Teilsystem der Potenzmenge P (Ω). Definition 20.4 Sei Ω eine gegebene Menge. Eine σ-Algebra (Ereignisalgebra) A über Ω ist ein Mengensystem A ⊂ P (Ω) mit (i) Ω ∈ A, (ii) A ∈ A ⇒ Ā ∈ A, (iii) An , n ∈ N, (An ) ⊂ A ⇒ ∪∞ i=1 Ai ∈ A. Vereinigung und Komplementbildung führen also nicht aus A hinaus. Die Operationen Durchschnitt und Differenz lassen sich auf die Operationen Vereinigung und Komplement 20–128 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG zurückführen: A∩B = A ∪ B, A\B = B∩A, d.h. Durchschnitt und Differenz führen ebenso nicht aus A hinaus: A ist ’stabil’ gegenüber Durchschnitt, Vereinigung, Differenz und Komplement, wobei Durchschnitt und Vereinigung von abzählbar vielen Mengen möglich ist. Auf einer σ-Algebra wird später ein Maß (hier := Wahrscheinlichkeit) definiert. Beispiel 20.6 Vorgelegt ist eine Urne mit s weißen und t schwarzen Kugeln. Versuch heißt hier: Ziehen einer Kugel. Die Kugeln sind numeriert. Die beiden Elementarereignisse sollen sein: A ∈ {An , n ∈ {1, ..., s}} (Ziehen einer weißen Kugel) und B ∈ {Bn , n ∈ {s + 1, ..., s + t}} (Ziehen einer schwarzen Kugel), Ω = A ∪ B ist das sichere Ereignis. Die kleinste, A und B umfassende σ-Algebra, ist A = {∅, A, B, A ∪ B = Ω}, sie besteht aus 4 = 22 Elementen. 20.2 Wahrscheinlichkeit Der Begriff der Wahrscheinlichkeit kann auf verschiedene Weise eingeführt werden. Klassische Definitionen sind u.a.: die relative Häufigkeit und daraus resultierend die statistische Wahrscheinlichkeit, diverse Abzählregeln, sowie die geometrische Wahrscheinlichkeit. Diese Begriffe entstanden jeweils bei der Behandlung spezieller Aufgabenklassen und sind dort ein nützliches Werkzeug zur Einsicht in die Struktur der entsprechenden Probleme. Für die klassische Definition der Wahrscheinlichkeit ist die ’Gleichwahrscheinlichkeit’ der Elementarereignisse (Laplaceannahme) erforderlich. Eine Behandlung allgemeinerer Ereignisfelder ist mit einer axiomatischen Einführung der Wahrscheinlichkeit (Kolmogorov 1933) möglich. Hier wird die Wahrscheinlichkeit als Maß auf einer Ereignisalgebra erklärt. Dadurch kann dann zur Problemlösung der ganze Kalkül der mathematischen Disziplin ’Maßtheorie’ eingesetzt werden. 20.2.1 Relative Häufigkeit Definition 20.5 Betrachte ein gegebenes Mengensystem (Ereignisfeld) mit möglichen Ereignissen A. Ein Versuch soll n-mal durchgeführt werden. Dabei tritt das Ereignis A hn (A)-mal auf. Dann heißt (i) hn (A) die absolute Häufigkeit und (ii) Hn (A) := hn (A) n die relative Häufigkeit der Ereignisses A bei n Versuchen. Die relative Häufigkeit ist also eine erste Möglichkeit der Quantifizierung von Ereignissen. Beispiel 20.7 Betrachte einen Würfel. Ein Elementarereignis Eν , ν = 1...6 besteht darin, daß genau eine Zahl ν gewürfelt wird. Alle anderen Ereignisse sind durch Standardoperationen aus Eν abzuleiten. Die Ereignisalgebra E wird also durch Eν erzeugt: E = {E1 , ..., E6 }. Bei 100 Versuchen wird 10-mal eine 6, 25-mal eine 4 und 15-mal eine 2 gewürfelt. Dann 1 ist h100 (E6 ) = 10, H100 (E6 ) = 10 , H100 (E4 ) = 14 . Sei G := E2 ∪ E4 ∪ E6 das Ereignis: Es wird eine gerade Zahl gewürfelt. Dann ist h100 (G) = 50 und H100 (G) = 12 . 20.2. WAHRSCHEINLICHKEIT 20–129 Beobachtung: Am vorliegenden Beispiel mit E = {E1 , ..., E6 } sollen einige Eigenschaften von Hn untersucht werden: (i) Hn ist eine Abbildung mit: Hn : E → {0, n1 , ..., n−1 n , 1}; der Wertebereich von Hn = Hn (E) liegt also in [0, 1]. (2) Hn (∅) = 0, Hn (Ω) = 1 = n n mit Ω = E1 ∪ ... ∪ E6 . (3) A ∩ B = ∅ ⇒ Hn (A ∪ B) = Hn (A) + Hn (B) (Additivität) Beispiel: Hn (G) = Hn (E2 ∪ E4 ∪ E6 ) = Hn (E2 ) + Hn (E4 ) + Hn (E6 ) Folgerung: Hn (A) = 1 − Hn (A) Beweis: A ∩ A = ∅ ⇒ 1 = Hn (Ω) = Hn (A ∪ A) = Hn (A) + Hn (A) (4) Hn (A ∪ B) = Hn (A) + Hn (B) − Hn (A ∩ B) Beweis: Betrachte zwei disjunkte Zerlegungen von A und B: A = (A ∩ B) ∪ (A \ B) und B = (A ∪ B) ∪ (A \ B). Hieraus folgt nach (3) Hn (A) = Hn (A ∩ B) + Hn (A \ B) und Hn (B) = 1 − Hn (B) = Hn ((A ∪ B) ∪ (A \ B)) = Hn (A ∪ B) + Hn (A \ B) = 1 − Hn (A ∪ B) + Hn (A \ B). Unter Verwendung von Hn (A \ B) = Hn (A) − Hn (A ∩ B) ergibt sich hieraus: −Hn (B) = −Hn (A ∪ B) + Hn (A) − Hn (A ∩ B), also die Behauptung. Für diskunkte A und B (A ∩ B = ∅) folgt (3) natürlich aus (4). Hn ist eine sogenannte Mengenfunktion, die jeder Menge A ∈ E eine Zahl in [0, 1] zuordnet. Diese Bewertung von Ereignissen ist natürlich noch keine Wahrscheinlichkeit, da sie von n abhängt. Insbesondere gilt: Falls Hn (E) = 1 ist, folgt nicht E = Ω und für Hn (E) = 0 folgt nicht E = ∅. In der Praxis zeigt sich jedoch, daß sich die Bewertung Hn für große n häufig ’stabilisiert’. Dies führt auf: Definition 20.6 H(E) = lim Hn (E) n→∞ heißt statistische Wahrscheinlichkeit des Ereignisses E. Offen bleibt hier die Frage nach der Existenz der Grenzwertes, da man hinreichend viele Versuche braucht und etwas über die Stetigkeit der Bewertung wissen müßte. Falls jedoch H(E) existiert, kann Hn (E) als Näherung für H(E) aufgefaßt werden. Beispiel 20.8 Zur Geschichte des Münzwurfes (Wahrscheinlichkeit von Wappen oder Zahl) In der Literatur werden die folgenden Zahlen für die relative Häufigkeit der Ereignisses Wappen angegeben: Buffon Pearson Pearson (1707-1788), (1857-1936), n=4040, n=12000, n=24000, Hn (W ) = 0.5069 Hn (W ) = 0.50619 Hn (W ) = 0.5005. Die Anwendungsfelder für die statistische Wahrscheinlichkeit liegen hauptsächlich in der Biologie, Medizin, Soziologie und bei Untersuchungen von Produktionsprozessen. 20–130 20.2.2 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG Axiomatische Einführung der Wahrscheinlichkeit (nach Kolmogorov 1933) Definition 20.7 Gegeben sei ein Ereignisfeld E (Ereignisalgebra). Eine Abbildung P : E → R+ heißt Wahrscheinlichkeit (=Wahrscheinlichkeitsmaß) auf E, falls gilt: (i) ∀A ∈ E : 0 ≤ P (A) ≤ 1, d.h. P : E → [0, 1], (ii) P (Ω) = 1 (iii) A ∩ B = ∅ ⇒ P (A ∪ B) = P (A) + P (B), (Additivität) P∞ (iv) Ai ∈ E, i = 1, 2..., Ai ∩Aj = ∅, i 6= j ⇒ P (∪∞ i=1 Ai ) = i=1 P (Ai ) (σ− Additivität) Aufgabe: Vergleiche die Axiome (i)-(iii) mit den Eigenschaften der relativen Häufigkeit Hn (A). Bemerkungen: (1) Aus (iii) folgt mit vollständiger Induktion: Pn n A )= Für Ai ∩ Aj = ∅, i 6= j, i, j = 1...n gilt P i=1 i i=1 PP∞(Ai ) ∀n. (iv) verlangt mehr: P(∪ ∞ Die Konvergenz der numerischen Reihe i=1 P (Ai ) und i=1 P (Ai ) ∈ [0, 1]. Pn (2) Falls man zeigen kann: i=1 P (Ai ) ≤ 1 ∀n, folgt aus (iii) (iv), da wegen P (Ai ) ≥ 0 die Reihe nach dem Monotoniekriterium konvergiert. (3) Die Axiome (i)...(iv) legen die Wahrscheinlichkeit nicht eindeutig fest. Folgerungen: Satz 20.1 P (∅) = 0 Beweis: ∅ ∈ E ⇒ ∃ P (∅). Betrachte A ∈ E, A 6= ∅. Dann gilt auch A∪∅ ∈ E und A∩∅ = ∅. Nach (iii) folgt P (A) = P (A ∪ ∅) = P (A) + P (∅), also P (∅) = 0. Satz 20.2 P (A) = 1 − P (A) ∀A ∈ E Beweis: A ∪ A = Ω, A ∩ A = ∅. Es folgt P (A ∪ A) = P (Ω) = 1 = P (A) + P (A). Satz 20.3 A, B ∈ E ⇒ P (A ∪ B) = P (A) + P (B) − P (A ∩ B). Beweis: siehe entsprechende Aussage für die relative Häufigkeit Hn (A). Satz P 20.4 Falls die Ai , i = 1...n, Ai ∈ E ein vollständiges System von Ereignissen bilden, folgt ni=1 P (Ai ) = 1. Beweis: Nutze (iii) und vollständige Induktion. Bemerkung: Erweitert man den Vollständigkeitsbegriff auf Systeme von Ai , i = 1, 2... , P folgt ∞ P (A i ) = 1. i=1 Satz 20.5 A, B ∈ E, A ⊆ B ⇒ P (A) ≤ P (B) Beweis: Nutze eine disjunkte Zerlegung von B, B = A ∪ (B ∩ A). Dann folgt P (B) = P (A) + P (B ∩ A) ≥ P (A), da P (B ∩ A) ≥ 0. 20.2. WAHRSCHEINLICHKEIT 20–131 Beispiel 20.9 Würfel (1) Betrachte einen idealen Würfel mit Elementarereignissen E1 , ..., E6 . Alle Ei sind gleichmöglich mit P (Ei ) = p. Da Ei ∩ Ej = ∅, i 6= j und ∪6i=1 Ei = Ω ist, folgt P (Ω) = 1 = P6 1 i=1 P (Ei ) = 6p, also p = 6 . (2) Liegt der Schwerpunkt des Würfels nicht im geometrischen Schwerpunkt, liegt ein präparierter Würfel vor. Es wurden die folgenden Werte für die Wahrscheinlichkeit der Elementarereignisse (Ei ) = 2p, i = 2, 3, 4, 5. P6 Ei bestimmt: P (E1 ) = p, P (E6 ) = 3p, P 1 Dann folgt 1 = i=1 P (Ei ) = (4 · 2 + 1 + 3)p = 12p, p = 12 . Die Wahrscheinlichkeit eine gerade Zahl zu würfeln (Ereignis G) läßt sich nun berechnen: P (G) = 16 + 61 + 14 = 7 5 12 , P (U ) = 12 . Bemerkung: Im Fall (2) ist die Gleichmöglichkeit der Elementarereignisse nicht gewährleistet. Der Fall ist mit klassischer Wahrscheinlichkeitsdefinition nicht zu behandeln. 20.2.3 Klassischer Wahrscheinlichkeitsbegriff Definition 20.8 Ein Ereignisfeld E heißt Laplace-Ereignisfeld, falls es endlich viele Elementarereignisse Ei , i = 1...n enthält, die alle gleichmöglich sind. Definition 20.9 Gegeben sei ein Laplace-Feld E und A ∈ E ein Ereignis. Falls m Elementarereignisse E1 , ..., Em das Feld E erzeugen und für k Elementarereignisse Ei , i = 1...k, gilt: Ei ⊂ A, dann ist die Wahrscheinlichkeit, daß A eintritt durch P (A) = k m erklärt. Bemerkung: P (A) ist also der Quotient der Anzahl der für A günstigen Elementarereignisse durch die Anzahl der möglichen Elementarereignisse. Diskussion: (1) In einem Laplace-Ereignisfeld E gilt also: ∀A ∈ E ∃Ei ∈ E, i = 1...k, so daß A = ∪ki=1 Ei . (2) Der im vorherigen Beispiel eingeführte präparierte Würfel und sein Ereignisfeld sind nicht vom Lapacetyp. Das Ereignisfeld eines normalen Würfels dagegen ist ein LaplaceEreignisfeld. (3) Ein wesentliches Hilfsmittel beim Umgang mit dem klassischen Wahrscheinlichkeitsbegriff ist die Kombinatorik. Aufgabe: Wiederhole mit Hilfe einer Formelsammlung elementare Begriffe der Kombina¡n¢ torik (z.B. Permutation, Binomialkoeffizient m u.a.). Beispiel 20.10 Betrachtet wird eine Urne mit N Kugeln, davon sind r Kugeln rot und w = N − r Kugeln weiß. n Kugeln sollen entnommen werden. Das Ereignis Ex bestehe darin, daß sich unter den ¡ ¢n entnommenen Kugeln x rote Kugeln, x ≤ r, befinden. Gesucht ist P (Ex ). Es gibt xr Möglichkeiten aus r roten Kugeln x rote zu ziehen. Bei einer 20–132 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG ¡ w ¢ Entnahme von n Kugeln sind dann n − x weiße dabei; es gibt n−x Möglichkeiten aus w weißen Kugeln n − x weiße zu¡ entnehmen. Damit ist die Anzahl der Elementarereignisse, ¢¡ w ¢ ¡ ¢ die günstig für Ex ist gleich xr n−x . Die Anzahl der möglichen Ereignisse ist N n und r w ( )( ) die gesuchte Wahrscheinlichkeit also P (Ex ) = x Nn−x . (n) Beispiel 20.11 Eine Lieferung von 30 Teilen enthält 6 fehlerhafte. Willkürlich sollen aus der Lieferung 4 Teile (ohne Zurücklegen) gezogen werden. Gesucht ist die Wahrscheinlichkeit für das Ereignis E2 : Es sind unter den 4 Teilen genau 2 fehlerhafte. ¡6¢¡ 24 ¢ P (E2 ) = 2 ¡304−2 ¢ ∼ 0.1511 4 Geometrische Wahrscheinlichkeit Betrachtet wird ein Gebiet S des Rn mit einem Inhalt FS und ein Teilgebiet T ⊆ S mit dem Inhalt FT . Die Wahrscheinlichkeit dafür, daß ein willkürlicher Punkt aus S in T liegt (Ereignis E) wird durch P (E) = FFTS definiert. Die Wahrscheinlichkeit, die Inhalte (Volumen, Flächen,...) geometrischer Gebilde verwendet, heißt geometrische Wahrscheinlichkeit . Bemerkung: Der Inhalt von T darf nicht Null sein, also kann z.B. für ein R2 -Problem T keine Gerade sein. 20.2.4 Bedingte Wahrscheinlichkeit Bezeichnung: Ein bedingtes Ereignis A|B (’A unter B’) ist ein Ereignis A, welches eintritt unter der Voraussetzung, daß B eingetreten ist. Die Wahrscheinlichkeit eines bedingten Ereignisses heißt bedingte Wahrscheinlichkeit. Beispiel 20.12 (zum Würfel) Gesucht ist die relative Häufigkeit Hn des bedingten Ereignisses E2 |G. Dabei soll E2 |G dasjenige Ereignis sein, welches darin besteht, daß eine 2 gewürfelt wird unter der Voraussetzung, daß eine gerade Zahl gewürfelt wurde. Bei n Versuchen sei G a-mal aufgetreten. Zerlege G in disjunkte Teilmengen: G = (G \ E2 ) ∪ (G ∩ E2 ). Dann gilt für die absoluten Häufigkeiten hn (G \ E2 ) =: a1 , hn (G ∩ E2 ) =: a2 und a1 + a2 = hn (G). Die relative Häufigkeit gewinnt man: Hn (E2 |G) = a2 = a a2 n a n = Hn (G ∩ E2 ) . Hn (G) Diese Formel für die relative Häufigkeit motiviert die folgende Definition: Definition 20.10 Für A, B ∈ E, P (B) > 0 wird die bedingte Wahrscheinlichkeit durch P (A|B) := erklärt. P (A ∩ B) P (A) 20.2. WAHRSCHEINLICHKEIT 20–133 Beispiel 20.13 Die Wahrscheinlichkeit für E2 |G (siehe letztes Beispiel) ist P (E2 |G) = p(E2 ∩ G) = P (G) 1 6 1 2 1 = . 3 Diskussion: Die bedingte Wahrscheinlichkeit liefert eine Multiplikationsformel für die Wahrscheinlichkeit: P (A ∩ B) = P (B) · P (A|B). Entsprechend gilt: P (A∩B ∩C) = P (A∩(B ∩C)) = P (A|(B ∩C))·P (B ∩C) = P (A|(B ∩C))·P (B|C)·P (C). Beispiel 20.14 Betrachte eine Urne mit 4 weißen und 6 roten Kugeln und zwei Ereignisse B und A (Ereignis B: im ersten Versuch wird eine rote Kugel gezogen, Ereignis A: im zweiten Versuch wird eine weiße Kugel gezogen). Gesucht ist P (A|B) und P (A ∩ B). Da nach dem ersten Versuch noch 9 Kugeln in der Urne sind, davon 4 weiße, ergibt sich direkt: P (A|B) = 49 . P (A ∩ B) läßt sich nach der Multiplikationsformel berechnen: P (A ∩ B) = P (B) · P (A|B) = 6 4 · . 10 9 Totale Wahrscheinlichkeit Betrachte ein vollständiges System von Ereignissen, also ein System {E1 , ..., En } mit P (Ei ) > 0, i = 1...n, Ei ∩ Ej = ∅, i 6= j, und Ω = ∪ni=1 Ei . Für ein beliebiges A ∈ E gilt nun A = A ∩ Ω = A ∩ (∪ni=1 Ei ) = ∪ni=1 (A ∩ Ei ). P P Da die A ∩ Ei disjunkt sind, folgt P (A) = ni=1 (A ∩ Ei ) = ni=1 P (A|Ei ) · P (Ei ). Also gilt: Satz 20.6 (Satz über die totale Wahrscheinlichkeit ) Für ein vollständiges System von Ereignissen {E1 , ..., En } mit P (Ei ) > 0, i = 1...n gilt für beliebige A ∈ E: P (A) = n X P (A|Ei ) · P (Ei ). i=1 Folgerung: (Formel von Bayes ) P (Ei |B) = P (Ei ∩ B) P (B|Ei ) · P (Ei ) P (B|Ei ) · P (Ei ) = = Pn P (B) P (B) i=1 (P (B|Ei ) · P (Ei )) oder P (Ei |B) · P (B) = P (B|Ei ) · P (Ei ) 20–134 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG Definition 20.11 A, B ∈ E Das Ereignis A ist vom Ereignis B unabhängig , falls P (A|B) = P (A) ist. Zum Beispiel Münzwurf: Ereignis A: beim ersten Versuch eine Zahl sehen; Ereignis B: beim zweiten Versuch ein Wappen sehen. A ist von B unabhängig. Für unabhängige Ereignisse gilt: Satz 20.7 (Produktformel für unabhängige Ereignisse) A, B ∈ E, A von B unabhängig. Dann folgt: P (A ∩ B) = P (A) · P (B). Beweis: Multiplikationsregel mit P (A|B) = P (A) Beispiel 20.15 (zur Formel von Bayes) Ein Erzeugnis wird auf Maschinen hergestellt, wobei die Maschine 1 einen Produktionsanteil von 40% hat; ihr Produkt ist zu 2% fehlerhaft. Für Maschine 2 liegen die Werte bei 60% bzw. 1%. Betrachtet werden 3 Ereignisse: Ereignis A: Das dem Lager entnommene Erzeugnis ist fehlerhaft. Ereignis Ei : Das Erzeugnis wurde auf Maschine i, i = 1, 2, hergestellt. E1 und E2 sind ein vollständigs System mit den Wahrscheinlichkeiten P (E1 ) = 0.4, P (E2 ) = 0.6. Die bedingte Wahrscheinlichkeit dafür, daß das Erzeugnis fehlerhaft ist unter der Voraussetzung, daß es von der Maschine 2 stammt, ist p(A|E2 ) = 0.01 (P (A|E1 ) = 0.02). Damit wird P (A) = 2 X P (A|Ei ) · P (Ei ) = 0.02 · 0.4 + 0.01 · 0.6 = 0.014. i=1 P (E1 |A) ist die Wahrscheinlichkeit dafür, daß das Erzeugnis von Maschine 1 kommt und fehlerhaft ist. P (E1 |A) = 0.02 · 0.4 P (A|E1 ) · P (E1 ) = ∼ 0.57 P (A) 0.014 20.3 Zufallsvariable und Verteilungsfunktionen 20.3.1 Zufallsvariable Bezeichnungen: (1) Ein Ereignisfeld (σ-Algebra) E, eine darauf erklärte Wahrscheinlichkeit und die Grundmenge Ω (sicheres Ereignis) werden zu einem Wahrscheinlichkeitsraum W := (Ω, E, P ) zusammengefaßt. (2) Eine numerische Kodierung ist eine Abbildung X, die jeder Menge A ∈ E eine Teilmenge B der reellen Zahlen b.z.w. eine reelle Zahl zuordnet. Die Teilmengen B, die als Bildmengen in Frage kommen, müssen sogenannte Borelmengen sein. Das Mengensystem der Borelmengen wird in der nachfolgenden Definition erklärt. 20.3. ZUFALLSVARIABLE UND VERTEILUNGSFUNKTIONEN 20–135 Definition 20.12 Alle Teilmengen B des R1 , die sich durch (möglicherweise unendliche) Durchschnittsbildungen, Vereinigungen und Komplementbildungen aus den Intervallen (−∞, t1 ], t1 ∈ R, erzeugen lassen, heißen Borelmengen. Die Gesamtheit aller Borelmengen des R1 ist das Mengensystem B. Beispiel 20.16 Mit (−∞, t1 ] und (−∞, t2 ], t1 < t2 , gehören also auch (−∞, t2 ]\(−∞, t2 ] = (t2 , t1 ] zu B, desgleichen ¸ ¸ ∞ µ ∞ µ \ [ 1 1 = (t1 , t2 ) , t1 − , t2 = [t1 , t2 ] . (−∞, t1 ] = (t1 , ∞), t1 , t2 − n n n=1 n=1 Für t1 = t2 folgt hieraus: Auch alle t ∈ R1 liegen in B. Es liegen also alle offenen, abgeschlossenen und halboffenen Intervalle in B. Beispiel 20.17 Eine simple numerische Kodierung ist die Zuweisung der Zahlen 0 und 1 zu den Ereignissen des Versuches Münzwurf: Ereignis A (Wappen liegt oben) erhält die Bewertung 1, Ergebnis B (Zahl liegt oben) erhält die Bewertung 0. Definition 20.13 Eine (numerische) Zufallsvariable ist eine Abbildung X : Ω → R1 , ω ⊂ Ω 7→ X(ω) mit folgenden Eigenschaften: (i) X(ω) = B ⊂ R, B ∈ B (Borelmenge) (ii) ∀ (−∞, t] ∈ B ∃A ∈ E : X(A) = (−∞, t] b.z.w. X −1 ((−∞, t]) = A ∈ E. (Jedes Intervall (−∞, t], t ∈ R hat ein Urbild in E). Die numerische Zufallsvariable bildet also ein Mengensystem E in das Mengensystem B der Borelmengen im R1 ab. Bemerkungen: (1) Die allgemeine Zufallsvariable ist eine Abbildung zwischen zwei Wahrscheinlichkeitsräumen. (2) Falls der Wertebereich der Abbildung X diskret oder abzählbar ist, nennt man die Zufallsvariable diskret, sonst stetig. Beispiel 20.18 (Qualitätskontrolle) Ein Produkt sei brauchbar, falls ein bestimmter Meßwert y in einem wohlbestimmten Intervall liegt. Es gibt zwei Elementarereignisse: ω1 (Produkt ist brauchbar) und ω2 (Produkt ist nicht brauchbar). Die numerische Kodierung für ω1 und ω2 sei X(ω1 ) = 1, X(ω2 ) = 0. Die Wahrscheinlichkeiten (b.z.w. die relativen Häufigkeiten) von ω1 und ω2 werden mit P (ω1 ) =: p und P (ω2 ) = 1 − p angesetzt. Es ergibt sich also der Wahrscheinlichkeitsraum W = (Ω, E, P ) mit: Ω = ω1 ∪ ω2 , (Ω ist das sichere Ereignis: es wird gemessen) E = {∅, ω1 , ω2 , ω1 ∪ ω2 = Ω} und der Wahrscheinlichkeit P . 20–136 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG X vermittelt nun eine Abbildung des Wahrscheinlichkeitsraumes W auf einen Wahrscheinlichkeitsraum W 0 = (Ω0 , E0 , P 0 ). Dabei ist 0 Ω0 = {0, 1}, E0 = 2Ω = {∅, {1}, {0}, {0, 1}} und einer durch die Abbildung X induzierten Wahrscheinlichkeit P 0 . P 0 ist für die Elemente von E0 definiert: P 0 ({1}) = p, P 0 ({0}) = 1 − p, P 0 (Ω0 ) = 1, P 0 (∅) = 0. Es sind natürlich auch andere Bewertungen und damit andere Abbildungen X möglich. 20.3.2 Verteilungsfunktion einer Zufallsvariable Gesucht ist die Wahrscheinlichkeit dafür, daß die Zufallsgröße X(ω) eines Ereignisses ω ⊂ Ω in der Teilmenge (−∞, t] des R1 liegt, also P (X(ω) ∈ (−∞, t]). Die Gesamtheit aller dieser Wahrscheinlichkeiten definiert in Abhängigkeit vom Parameter t eine Funktion. Definition 20.14 Die Abbildung FX : (−∞, ∞) → R+ mit FX (t) = P (X ≤ t), t ∈ R heißt Verteilungsfunktion (der Wahrscheinlichkeiten) der Zufallsvariablen X. Die Verteilungsfunktion gibt also in t = t̄ die Wahrscheinlichkeit dafür an, daß X = X(ω) in (−∞, t̄ ] liegt. Beispiel 20.19 (Münzwurf ) Für die Ereignisse A (Wappen) und B (Zahl) mit den Zufallsvariablen X(A) = 1 und X(B) = 0 gilt: 1 1 FX (0) = P (X ≤ 0) = P (B) = , FX (0.5) = P (X ≤ 0.5) = P (B) = , 2 2 1 t ∈ (0, 1) : P (X ≤ t) = P (B) = , FX (1) = P (X ≤ 1) = P (A ∪ B) = 1, 2 FX (2) = P (A ∪ B) = 1 Nach weiteren Rechnungen ergibt sich Abb. 20.1. FX 1 1 2 1 2 t Abbildung 20.1: Verteilungsfunktion für den Münzwurf 20.3. ZUFALLSVARIABLE UND VERTEILUNGSFUNKTIONEN 20–137 Diskussion: Falls die Verteilungsfunktion einer Zufallsvariablen gegeben ist, läßt sich aus ihr die Wahrscheinlichkeit dafür berechnen, daß die Zufallsvariable X in einem bestimmten Intervall liegt: Betrachte zwei Intervalle I1 := (−∞, t1 ] und I2 := (−∞, t2 ], t2 > t1 . Dann gilt: I2 = I1 ∪ I3 = (−∞, t1 ] ∪ (t1 , t2 ], wobei I1 ∩ I3 = ∅. Da I1 und I2 Borelmengen sind, ist es -auf Grund dieser Zerlegung- auch I3 . Für die entsprechenden Wahrscheinlichkeiten gilt deshalb: P (X ∈ I3 ) = P (X ∈ I2 ) − P (X ∈ I1 ) = P (X ≤ t2 ) − P (X ≤ t1 ) = FX (t2 ) − FX (t1 ). Diese Differenz der Funktionswerte liefert also die Wahrscheinlichkeit für X ∈ I3 . 20.3.3 Diskrete Zufallsvariable und ihre Verteilungsfunktion Eine Zufallsvariable heißt diskret, falls ihr Wertebereich endlich oder abzählbar unendlich ist, d.h. falls die Menge X(Ω) ⊂ R1 endlich oder abzählbar unendlich ist. Definition 20.15 (1) Falls es für eine diskrete Zufallsvariable X mit Werten WX = {x1 , x2 , ...} und einer Verteilungsfunktion FX (t) eine Funktion fX gibt mit ½ + fX : R → R , t 7→ pi , t = xi , 0, t 6∈ WX sowie FX (t) = X fX (t) = P (X ≤ t) = i :xi ≤t X P (X = xi ), i: xi ≤t dann heißt fX eine Dichtefunktion und (2) P (X = xi ) Einzelwahrscheinlichkeit an den Sprungstellen der Verteilungsfunktion FX (t). Beispiel 20.20 Die ’Wahrscheinlichkeitsfunktion’ für den Münzwurf mit den Einzelwahrscheinlichkeiten P (X = 0) = 21 , P (X = 1) = 12 ist in Abb. 20.2 dargestellt. Die Dichte fX ist über die Einzelwahrscheinlichkeiten definiert: pi = P (X = xi ), also ½ fX = 1 2 , t ∈ {0, 1} . 0 , sonst Dann ergibt sich die Verteilungsfunktion 0 , t < 0 = x1 1 , 0 ≤ t < 1 = x2 . FX (t) = 2 1, t ≥ 1 20–138 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG P 1 2 1 t Abbildung 20.2: Einzelwahrscheinlichkeiten beim Münzwurf Eigenschaften von Verteilungsfunktion und Dichte (1) FX : R → [0, 1] oder 0 ≤ FX (t) ≤ 1 (2) limt→−∞ FX (t) = 0, limt→+∞ FX (t) = 1 (3) FX (t) ist eine nicht fallende (monoton wachsende) Treppenfunktion. Die Stufenhöhen werden durch die Einzelwahrscheinlichkeiten bestimmt. (4) FX (t) ist in den Sprungstellen rechtsseitig stetig (FX (t + 0) = FX (t) ∀t). P (5) Nach FX (t) = i: xi ≤t P (X = xi ) läßt sich die Verteilungsfunktion rekursiv berechnen: FX (x1 ) = p1 , FX (xi ) = FX (xi−1 ) + pi . (6) Es gilt: pi = P (X = xi ) = Fx (xi ) − FX (xi − 0) (Stufenhöhe=Einzelwahrscheinlichkeit). Pn (7) i=1 pi = 1 b.z.w. P∞Für die Einzelwahrscheinlichkeiten p1 ...pn b.z.w. p1 , p2 ... folgt: p = 1. i i=1 (E1)...(E7) sind relativ leicht beweisbar. 20.3.4 Stetige Zufallsvariable und ihre Verteilungsfunktion Eine Zufallsvariable heißt stetig, falls ihr Wertebereich X(Ω) ⊂ R1 überabzählbar unendlich ist. X(Ω) könnte ein Intervall des R1 oder der ganze R sein. Definition 20.16 Falls es für eine stetige Zufallsvariable X und für die zugehörige Verteilungsfunktion FX (t) = P (X ≤ t) eine uneigentlich integrierbare Funktion fX : R → R gibt mit den Eigenschaften (i) fX (x) ≥ 0 ∀x ∈ R, R∞ (ii) −∞ f (x) dx = 1, Rt (iii) FX (t) = −∞ f (x) dx, so heißt fX (x) Dichtefunktion der stetigen Zufallsvariablen X. Beispiel 20.21 Sei X : Ω → (0, 1), wobei jedes x ∈ (0, 1) mit gleicher Wahrscheinlichkeit bedacht wird. Gesucht ist die Verteilungsfunktion FX (t). Untersucht werden 3 Fälle: t ≤ 0 : FX (t) = P (X ≤ t) = p(∅) = 0, 0<t<1: 20.3. ZUFALLSVARIABLE UND VERTEILUNGSFUNKTIONEN 20–139 FX (t) = P (X ≤ t) = P (0 < X ≤ t) = 1t = t (geometrische Wahrscheinlichkeit), t ≥ 1 : FX (t) = P (Ω) = 1. Für FX (t) ergibt sich hieraus Abb. 20.3. Die Dichtefunktion läßt sich leicht bestimmen: FX 1 1 t Abbildung 20.3: Verteilungsfunktion einer stetigen Zufallsvariaben Für ½ fX (t) = 1, 0 < t < 1 0 , sonst Rt R∞ folgt: FX (t) = −∞ fX (x) dx und −∞ fX (x) dx = 1. Es gilt sogar auf R \ {0, 1} : FX0 (t) = fX (t). Diskussion und Eigenschaften (1) Geometrie: FX (t) ist als Flächeninhalt unter fX (t) von −∞ bis t deutbar, Abb. 20.4. (2) FX (t) ist monoton wachsend (∼ nicht fallend), da der Integrand fX (x) ≥ 0 ist. FX (t) fX FX (t) t Abbildung 20.4: FX (t) = x Rt −∞ fX (x) dx ist stetig für alle t. In den Stetigkeitspunkten der Dichte fX ist FX differenzierbar. Dort gilt: fX (t) = FX0 (t) = lim ∆t→0 P (t < X ≤ t + ∆t) . ∆t (3) Ist die Verteilungsfunktion b.z.w. die Dichtefunktion für eine bestimmte Klasse von Experimenten bekannt, läßt sich die Wahrscheinlichkeit als Integral berechnen: Z t2 P (t1 < X ≤ t2 ) = FX (t2 ) − FX (t1 ) = fX (x) dx. t1 20–140 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG Dabei ist P (t1 < X ≤ t2 ) die Wahrscheinlichkeit dafür, daß sich die Zufallsgröße X im Intervall (t1 , t2 ] befindet. (4) Bei stetigen Zufallsvariablen ergibt sich nach (3) die Besonderheit, daß etwa für t1 = t2 Rt gilt: P (X = t1 ) = t11 fX (x) dx = 0. Die Wahrscheinlichkeit P (X = t1 ) ist also Null, obwohl das Ereignis ω mit X = X(ω) nicht das unmögliche Ereignis sein muß. Beispiel 20.22 Für die Dichtefunktion ½ 0, x≤0 fX (x) = . λ e−λx , x > 0, λ ∈ R, λ > 0 soll die Verteilungsfunktion und die Wahrscheinlichkeit P (1 < X ≤ 2) bestimmt werden Abb. 20.5. Zunächst soll überprüft werden, ob fX (x) eine Dichte ist. Da für alle λ ∈ R fX (x) ≥ 0 fX λ FX 1 x t Abbildung 20.5: Dichte und Verteilungsfunktion ist und Z Z ∞ −∞ fX (x) dx = 0 ∞ ¯T ¯ λe−λx dx = lim (−e−λx )¯ = 1 T →∞ 0 folgt: fX (x) ist eine Dichte. Der Parameter λ > 0 kann später noch zur Anpassung an die Verhältnisse bei konkreten Experimenten benutzt werden. Die sich hieraus ergebende Verteilungsfunktion ½ Z t 0, t≤0 FX (t) = fX (x) dx = −λt , t > 0 1 − e −∞ wird zur Berechnung der Wahrscheinlichkeit benutzt: P (1 < X ≤ 2) = FX (2) − FX (1) = −e−2λ + e−λ . Bemerkung: (zum Stellenwert der Verteilungsfunktion) Bestimmten in der Praxis häufig vorkommenden Situationen b.z.w. Experimentklassen kann man bestimmte Verteilungsfunktionen und Dichten zuordnen. Falls diese in Formelsammlungen tabelliert sind, lassen sich die interessierenden Wahrscheinlichkeiten leicht berechnen, siehe Kap. 20.4. 20.3. ZUFALLSVARIABLE UND VERTEILUNGSFUNKTIONEN 20.3.5 20–141 Momente einer Zufallsgröße Bei n Messungen sollen s verschiedene Meßwerte xi , 1 = 1...s, mit einer absoluten HäufigP (n) (n) keit hi auftreten. Dabei muß natürlich si=1 hi = n sein. Das gewichtete Mittel der Meßwerte wird durch x̄ = 1 h1 hs (n) (x1 h1 + ... + xs hs ) = x1 + ... + xs = x1 H1 + ... + xs Hs(n) n n n erklärt. Ein analoger Begriff für diskrete und stetige Zufallsvariable ist der Erwartungswert, Definition 20.17 (1) X sei eine diskrete Zufallsvariable mit Werten xi , i = 1, 2... und mit Wahrscheinlichkeiten pi = P (X = xi ). Dann heißt E(X) := ∞ X xi pi i=1 Erwartungswert von X, falls P∞ i=1 |xi | pi konvergiert, (2) Sei X eine stetige Zufallsvariable mit einer Dichte fX (x). Dann heißt Z ∞ E(X) = x fX (x) dx −∞ Erwartungswert von X, falls R∞ −∞ |x| fX (x) dx konvergiert. Der Erwartungswert E(X) ist also der gewichtete Mittelwert der Zufallsvariable X. Beispiel 20.23 Sei X die zufällige Lebensdauer einer Glühbirne. Sie unterliege einer Verteilungsfunktion ½ 0, t≤0 FX (t) = , λ ∈ R, λ > 0, 1 − e−λt , t > 0. mit einer entsprechenden Dichte ½ 0, t≤0 fX (t) = . λe−λt , t > 0 Der Erwartungswert von X (mittlere Lebensdauer der Glühbirne) sei E(X) = 1000 h. Bestimme λ und damit FX (t) (Modellpräzisierung), so daß E(X)=1000 h wird. Z ∞ Z ∞ 1 E(X) = x fX dx = λ xe−λx dx = = 1000 h λ −∞ 0 Der gesuchte Modellparameter ist λ = 10−3 h−1 (Ausfallrate). 20–142 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG Beispiel 20.24 Eine diskrete Zufallsvariable X nehme die beiden Werte x1 = −1 und x2 = 1 mit den Wahrscheinlichkeiten p1 = 0.3 und p2 = 0.7 an. Der Mittelwert von X (Erwartungswert) ist E(X) = (−1)0.3 + (+1)0.7 = 0.4. Eine weitere Information über die Zufallsvariablen X kann man erhalten, wenn man sich für die mittlere quadratische Abweichung der Zufallsvariablen X vom erwarteten Wert E(X) interessiert. Diese Abweichung kann als Maß für die Streuung der Zufallsvariablen aufgefaßt werden: Definition 20.18 Für eine Zufallsvariable X mit einem Erwartungswert E(X) heißt E((X − E(X))2 ) =: D2 (X) die Varianz oder die Dispersion von X. p D2 (X) heißt Standardabweichung von X. Diskussion: (Berechnung der Varianz für den diskreten und den stetigen Fall) P (1) Für diskrete X mit E(X) = ∞ i=1 xi pi ist D2 (X) = ∞ X (xi − E(X))2 pi . i=1 (2) Für stetige X mit E(X) = Z 2 ∞ D (X) = −∞ R∞ −∞ x fX (x) dx ist (x − E(X))2 fX (x) dx. Beispiel 20.25 (Fortsetzung des Glühlampenbeispiels) Wegen E(X) = λ1 folgt: D2 (X) = = ¯∞ R ∞ (x − λ1 )2 λe−λx dx = −(x − λ1 )2 e−λx ¯0 + 0 2(x − λ1 )e−λx dx ¯∞ R ∞ − 2(x − λ1 ) λ1 e−λx ¯0 + 0 λ2 e−λx dx = λ12 R∞ 0 1 λ2 Dies ist die mittlere quadratische Abweichung vom Erwartungswert 1 λ. Beispiel 20.26 (Erwartungswert und Varianz für eine diskrete Zufallsvariable X) Eine Anlage produziert Teile, die mit der Wahrscheinlichkeit p brauchbar sind und mit der Wahrscheinlichkeit q = 1 − p Ausschuß. Die Produktion werde nach dem ersten unbrauchbaren Teil unterbrochen. Fall das k-te Teil Ausschuß ist, soll das Ereignis Ak heißen. Die zugeordnete Zufallsvariable X ist die zufällige Anzahl der bis zur Unterbrechung produzierten Teile. Für die Ak b.z.w. Āk gilt: P (Ak ) = q = 1 − p, P (Āk ) = p für alle k. Die Wahrscheinlichkeiten für X ergeben sich nach: 20.3. ZUFALLSVARIABLE UND VERTEILUNGSFUNKTIONEN 20–143 P (X = 1) = P (A1 ) = q =: p1 P (X = 2) = P (Ā1 ∩ A2 ) = P (Ā1 ) · P (A2 ) = pq =: p2 (da Ā1 und A2 unabhängig sind) · · · P (X = k) = P (Ā1 ∩ Ā2 ∩ ... ∩ Āk−1 ∩ Ak ) = pk−1 q =: pk . Für diese pk folgt: ∞ X pk = k=1 ∞ X qpk−1 = q k=1 ∞ X pl = l=0 q = 1. 1−p Das heißt mit Hilfe der Einzelwahrscheinlichkeiten läßt sich die FX (t) = P PVerteilungsfunktion ∞ k≤t P (X = k) feststellen und für die gilt: limt→∞ FX (t) = k=1 pk = 1. Gesucht ist P (X ≥ 3), die Wahrscheinlichkeit dafür, daß mehr als 3 Teile fehlerfrei produziert werden: P (X ≥ 3) = 1−P (X < 3) = 1−P (X = 1)−P (X = 2) = 1−q−pq = 1−(1−p)−(1−p)p = p2 . P 1 i Zur Berechnung des Erwartungswertes wird die geometrische Reihe ∞ i=0 p = 1−p , p < 1, P∞ 1 und die gliedweise differenzierte Reihe i=1 ipi−1 = (1−p) 2 benutzt: E(X) = ∞ X k=1 xk pk = ∞ X kqpk−1 = q k=1 1 1 = . (1 − p)2 q So ist z.B. für q = 10−2 E(X) = 100; im Mittel wird also die Produktion nach Herstellung von 100 Teilen gestoppt. Für die Streuung um den Erwartungswert (Varianz) ergibt sich: P∞ P P 1 2 i−1 2i 1 2 2 i−1 D2 (X) = ∞ = ∞ i=1 (i − q ) qp i=1 (xi − E(X)) pi = i=1 (i − q + q 2 )qp P P P∞ ∞ i−1 + 1 i−1 = qp i=1 i(i − 1)pi−2 + (1 − p2 )q ∞ i=1 ip i=1 p q = qp2(1 − p)−3 + (1 − 2q )q(1 − p)−2 + 1q (1 − p)−1 = p q2 (1. und 2.Ableitungen der geometrischen Reihe). 20.3.6 Funktionen von Zufallsgrößen Problem: Eine Zufallsvariable X wird in eine neue Zufallsvariable Y = g(X) := aX + b, a, b ∈ R transformiert. Wie verändern sich FX , E(X) und D2 (X)? Hintergrundproblem: Viele stetige Verteilungsfunktionen sind nur in Standardform tabelliert. Reale Fälle müssen erst in diese Standardform transformiert werden. 20–144 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG stetiger Fall: (1) Transformation der Verteilungsfunktion: a < 0 : FY (y) = P (Y ≤ y) = P (aX + b ≤ y) = P (X ≥ y−b a ) y−b y−b = 1 − P (X ≤ a ) + P (X = a ) = 1 − P (X ≤ = 1 − FX ( y−b a ), y−b a ) a > 0 analog. (2) Transformationsformel für die Dichte: d FY (y) = − a1 fX ( y−b a < 0 : fY (y) = dy a ) a > 0 : analog 1 a ∈ R : fY (y) = |a| fX ( y−b a ) (3) Transformationsformel für den Erwartungswert: a > 0 R∞ R∞ E(Y ) = −∞ yfY (y) dy = −∞ (ax + b)fY (ax + b)a dx R∞ R∞ R∞ = −∞ (ax + b) a1 fX (x)a dx = a −∞ xfX (x) dx + b −∞ fX (x) dx = aE(X) + b a < 0 analog Bemerkung: Für lineare Tranformationen g(X) = aX + b folgt also E(g(X)) = g(E(X)). Dies ist für beliebige Transformationen Y = h(X) nicht wahr, z.B. ist für Y = X1 1 E( X1 ) 6= E(X) . (4) Transformation der Varianz: D2 (Y ) = E((Y − E(Y ))2 ). Betrachte Ỹ := (aX + b − E(aX + b))2 . Dann folgt E(Ỹ ) = D2 (aX + b). Andererseits ist Ỹ = (aX + b − (aE(X) + b))2 = a2 (X − E(X))2 und E(Ỹ ) = a2 E((X − E(X))2 ) = a2 D2 (X), also D2 (aX + b) = a2 D2 (X). Folgerungen: (1) a = 0 : E(b) = b, a = 1 : D2 (X + b) = D2 (X) (2) Gesucht sind solche a und b, für die mit Y = aX + b gilt: E(Y ) = 0 D2 (Y ) = 1. Für solche Zufallsvariable sind die Tabellen in den Formelsammlungen eingerichtet. Wähle 1 D2 (X) a := √ und b = − √E(X) . Dann ist 2 D (X) X − E(X) Y = aX + b = p D2 (X) 20.4. EINIGE SPEZIELLE VERTEILUNGSFUNKTIONEN 20–145 und deshalb 1 E(Y ) = p (E(X) − E(X)) = 0, D2 (X) sowie D2 (Y ) = 1 D2 (X) · D2 (X) = 1. (3) Eine nützliche Berechnungsmöglichkeit für D2 (X) : Mit E(ak X k ) = ak E(X k ) folgt: D2 (X) = E((X −E(X))2 ) = E(X 2 −2XE(X)+E 2 (X)) = E(X 2 )−2E(X)E(X)+E 2 (X), also D2 (X) = E(X 2 ) − E 2 (X). 20.4 Einige spezielle Verteilungsfunktionen 20.4.1 Diskreter Fall (1) Null-Eins-Verteilung (Bernoulli-Verteilung) Die Bernoulli-Verteilung eignet sich zur Beschreibung der Wahrscheinlichkeit von Ereignissen bei Experimenten, bei denen nur 2 Versuchsergebnisse von Interesse sind (BernoulliExperiment). Dies ist z.B. der Fall beim Münzwurf, bei Ergebnisbeurteilungen, die nur das Kriterium ’brauchbar’ bzw. ’unbrauchbar’ kennen. Einem Ereignis A mit der Wahrscheinlichkeit P (A) = p und mit A ∪ A = Ω wird eine Zufallsgröße X durch ½ 1, f alls A eintritt X := 0, f alls A eintritt zugeordnet. Die Verteilungsfunktion FX (t) läßt sich durch P (X = 1) = p und P (X = 0) = q = 1 − p aufbauen, Abb. 20.6. Mit einer Dichte FX 1 q = 1−p 1 t Abbildung 20.6: Verteilungsfunktion der Bernoulli-Verteilung 20–146 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG ½ fX (t) = pt (1 − p)1−t , t ∈ {0, 1} 0, sonst ergibt sich also eine Verteilungsfunktion t<0 0, X 1 − p, 0 ≤ t < 1 . FX (t) = fX (t) = i:xi ≤t 1, 1≤t Für den Erwartungswert E(X) folgt E(X) = ∞ X xi pi = 0(1 − p) + 1p = p i=1 und für die Varianz D2 (X) = ∞ X (xi − E(X))2 pi = (0 − p)2 (1 − p) + (1 − p)2 p = p(1 − p) = pq. i=1 Definition 20.19 Eine Zufallsgröße unterliegt einer Bernoulli-Verteilung, mit dem Parameter p, falls sie die Wahrscheinlichkeiten P (X = 1) = p, P (X = 0) = q = 1 − p hat. (2) Binomialverteilung Definition 20.20 Eine Binomialverteilung ist eine Verteilung einer Zufallsvariablen X mit Werten {0, 1, ..., n} und einer Dichte ½ ¡n¢ t n−t , x ∈ {0, 1, ..., n} t p q fX (t) = . 0, sonst Die Binomialverteilung kann vorliegen, falls n unabhängige Versuche (n Bernoulliexperimente) jeweils genau 2 Versuchsausgänge A und A haben können. Dabei soll immer P (A) = p und P (A) = q = 1 − p gelten. Die Zuordnung der Zufallsvariablen X erfolgt über ½ 1, das i − te Experiment war erf olgreich (V ersuchsausgang A), Xi :== 0, sonst und die Ereignisse Ai über A1i : Xi = 1 . 1 0 Ai := Ai : Xi = 0 Setzt man abkürzend ti = 0 für Xi = 0 und ti = 1 für Xi = 1, so läßt sich ein Elementarereignis ω durch ω = At11 ∩ At22 ∩ ... ∩ Atnn 20.4. EINIGE SPEZIELLE VERTEILUNGSFUNKTIONEN 20–147 darstellen, wobei die Atii unabhängig sind. Mit t := t1 +t2 +...+tn (Summe der erfolgreichen Experimente) folgt nach der Produktformel für die Wahrscheinlichkeit P ({ω}) = pt q n−t . ¡ ¢ Jeden Wert von t kann man auf nt verschiedene Arten erhalten. Für die Zufallsvariable X := X1 + X2 + ... + Xn gilt deshalb µ ¶ n t n−t P (X = t) = p q , t ∈ {0, 1, ..., n} t Pn mit t=0 P (X = t) = 1. P (X = t) gibt die Wahrscheinlichkeit dafür an, daß bei n Versuchen t Versuche erfolgreich sind. Man spricht von einer Binomialverteilung. Beispiel 20.27 ¡4¢ n 4= 4, p ¡=4¢P (A) = 30.5, q = 1 − p = P (A) = 0.5. Mit pt := P (X = t) folgt: p0 = 0 (0.5) , p1 = 1 0.5 (0.5) ... Abb. 20.7. Für den Erwartungswert E(X) ergibt sich pt 0, 5 0 1 2 3 4 t Abbildung 20.7: Zur Binomialverteilung (n=4) E(X) = Pn =p i=0 xi pi Pn t=0 ¡n¢ = Pn ¡ ¢ ¡ ¢ t n−t P pq = p nt=0 t nt pt−1 q n−t n t=0 t t d t n−t ) t dp (p q d = p dp (p + q)n = pn(p + q)n−1 = pn und für die Varianz D2 (X) ¡ ¢ P P 2 D2 (X) = nt=0 (t − np)2 nt pt q n−t (= ∞ i=1 (xi − E(X)) pi ) . ¡ ¢ P = nt=0 (t − 2tnp + p2 n2 ) nt pt q n−t Unter Benutzung von µ ¶ n n µ ¶ X d n t n−t X n t−1 n−t d n n−1 t p q (p + q) = n(p + q) = pq = t dp dp t t=0 und t=0 n µ ¶ X d2 n n n−2 (p + q) = n(n − 1)(p + q) = t(t − 1)pt−2 q n−t , 2 dp t t=0 sowie p + q = 1 folgt D2 (X) = p2 (n2 − n) + np − 2nppn + p2 n2 = np(1 − p) = npq. 20–148 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG (3) Poissonverteilung Definition 20.21 Eine Poisson-Verteilung ist eine Verteilung einer diskreten Zufallsvariablen X mit Werten WX = {0, 1, 2, ....} und einer Dichte fX (t) = λt −λ e = P (X = t), λ ∈ R, λ > 0. t! fX (t) heißt Poisson-Dichte . Die Poisson-Verteilung wird zu Charakterisierung von Experimenten benutzt, bei denen es eine große Zahl von unabhängigen Versuchen gibt und die Wahrscheinlichkeit für ein Ereignis in einem Versuch sehr klein ist (’Gesetz der seltenen Ereignisse’). Beispiel 20.28 (1) Betrachte die zufällige Anzahl nichtkeimender Saatkörner in einer großen Grundmenge, falls durchschnittlich 1% nicht keimt. (2) Betrachte die zufällige Anzahl von α-Teilchen, die von einer radioaktiven Substanz in einem bestimmten Zeitraum emittiert werden. Eine Skizze, Abb. 20.8 und eine Tabelle charakterisieren das qualitative Verhalten der fX 0 1 2 3 4 t Abbildung 20.8: Dichte der Poisson-Verteilung Dichte fX (ti ) = P (X = ti ) = pi : ti 0 1 2 λ2 −λ −λ −λ fX (ti ) e λe 2 e Der Erwartungswert E(X) und die Varianz D2 (X) ergeben sich nach: E(X) = ∞ X i=1 ∞ ∞ X X e−λ λt tλt−1 −λ t xi pi = = λe = λe−λ eλ = λ t! t! t=0 t=0 und D2 (X) = ∞ X i=1 (xi − E(X))2 pi = ∞ X λt (t − λ)2 e−λ = ... = λ. t! t=0 Beispiel 20.29 P (X ≥ 10) = 1 − P (X ≤ 9) = 1 − P9 λt −λ t=0 t! e Bemerkung: Zur hypergeometrischen und weiteren Verteilungen für diskrete Zufallsvariable siehe weiterführende Literatur. 20.4. EINIGE SPEZIELLE VERTEILUNGSFUNKTIONEN 20.4.2 20–149 Stetiger Fall (1) Gleichverteilung über einem Intervall [a, b] Definition 20.22 Eine Verteilungsfunktion einer stetigen Zufallsvariablen X mit einer Dichte ½ 1 b−a , t ∈ [a, b] fX (t) = 0, sonst heißt Gleichverteilung von X (auch: Rechteckverteilung). Für die Verteilungsfunktion Fx (t), Abb. 20.9 folgt sofort: fX FX 1 1 b−a a b t a b t Abbildung 20.9: Dichte und Verteilungsfunktion der Recheckverteilung Z FX (t) = 0, t −∞ fX (x) dx = t−a b−a , 1, t<a a≤t<b b≤t Beispiel 20.30 Betrachte einen Prozeß mit unbekanntem Einflußvektor X ∈ [a, b] unter der Hypothese, daß kein X ∈ [a, b] bevorzugt angenommen wird. Benutze die geometrische Wahrscheinlichkeit, um FX (t) = P (X ≤ t) zu bestimmen: P (X ≤ t) = P (a ≤ X ≤ t) = t−a . b−a Es folgt ½ 1 b−a , fX (t) = 0, t ∈ [a, b] . sonst Hieraus lassen sich Erwartungswert E(X) und Varianz D2 (X) leicht berechnen: Z Z ∞ E(X) = −∞ Z D2 (X) = tfX (t) dt = b (t − a a b t a+b dt = b−a 2 a+b 2 1 (b − a)2 ) dt = . 2 b−a 12 (Intervallmittelpunkt) 20–150 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG (2) Exponentialverteilung Definition 20.23 Eine stetige Zufallsvariable X unterliegt einer Exponentialverteilung mit einem Parameter λ > 0, falls sie eine Dichte ½ 0, t≤0 fX (t) = −λt λe , t > 0 hat. Hieraus läßt sich berechnen: ½ 0, t<0 FX (t) = , −λt 1−e , t≥0 E(X) = 1 , λ D2 (X) = 1 . λ2 Anwendung: Modelle für Lebensdauer von Geräten, für den zufälligen Ausfall eines Geräteteils ohne Berücksichtigung des Alters und des Verschleißes, für die zufällige Dauer von Telefongesprächen,... Beispiel 20.31 X sei die zufällige Reparaturzeit eines Gerätes und unterliege einer Exponentialverteilung. Die mittlere Reparaturzeit (Erwartungswert) betrage 2h. Dann muß λ = 0.5 sein und man kann mit Hilfe der Verteilungsfunktion ½ 0, t<0 FX (t) = − 2t (1 − e , t ≥ 0 diverse Wahrscheinlichkeiten berechnen. Gesucht ist z.B. die Wahrscheinlichkeit dafür, daß eine Reparatur mindestens 3 Stunden dauert: P (X ≥ 3) = 1 − P (X < 3) = 1 − P (X ≤ 3) 3 = 1 − FX (3) = 1 − (1 − e− 2 ) ∼ 0.2231. (3) Normalverteilung Definition 20.24 Eine stetige Zufallsvariable unterliegt einer Normalverteilung, auch Gaußverteilung mit Parametern µ, σ ∈ R, σ > 0, falls sie eine Dichte (t−µ)2 1 e− 2σ2 =: ϕ(t; µ, σ), fX (t) = √ 2πσ t ∈ (−∞, ∞) hat. Die Normalverteilung ist die mit Abstand wichtigste Verteilung. Die Verteilungsfunktion Z t FX (t) = fX (x) dx =: φ(t; µ, σ) −∞ ist nicht geschlossen integrierbar und (in einer Normalform) tabelliert, Abb. 20.10. 20.4. EINIGE SPEZIELLE VERTEILUNGSFUNKTIONEN fX 20–151 FX 1 0011 11 0011 00 0011 00 00 11 µ−σ µ 11 µ+σ t µ t Abbildung 20.10: Normalverteilung und ihre Dichte Anwendung: Modelle für zufällige Beobachtungen und Meßergebnisse, Ungenauigkeit von Meßergebnissen (Abweichung vom Nennmaß), Notenspiegel der Studenten einer Matrikel unter der Annahme, daß alle Studenten ihr Leistungspotential ausschöpfen wollen. Diskussion: (1) fX (t) ist eine Dichte. R∞ Beweis: Nach Substitution v := t−µ σ geht I = −∞ fX (t) dt über in Z ∞ I= −∞ v2 1 √ e− 2 dv. 2π Die Berechnung von I erfolgt nun mit Hilfe uneigentlicher Bereichsintegrale: 1 I = 2π 2 Z ∞ Z ∞ e −∞ − (v 2 +u2 ) 2 −∞ 1 dv du = 2π ∞ Z 2π Z re 2 − r2 dϕ dr = lim −e 0 0 T →∞ 2 − r2 ¯T ¯ ¯ = 1. ¯ 0 Also gilt: I=1. (2) Es läßt sich zeigen: E(X) = µ, D2 (X) = σ 2 , d.h. die Normalverteilung ist durch ihren Erwartungswert und durch ihre Varianz parametrisiert. Damit kann - durch spezielle Wahl von µ und σ - die allgemeine Dichte fX (t; µ, σ) an konkrete Problemstellungen angepaßt werden. (3) Eine klassische Kurvendiskussion für fX (t; µ, σ) liefert: fX hat in t = µ ein Maximum und in t = + − σ + µ jeweils einen Wendepunkt, fx ist bez. t = µ symmetrisch. Aufgabe: Diskutiere die Veränderung der Dichte fX (t; µ, σ) bei Änderung des Erwartungswertes µ und der Streuung σ 2 am Bild graph(fx ). (4) Umgang mit dem Tafelwerk: In Formelsammlungen sind fast immer Standardnormalverteilungen tabelliert. Dies sind Verteilungen für eine Zufallsvariable Y mit E(Y ) = µ = 0 und D2 (Y ) = σ 2 = 1, also mit einer Dichte fY (t) = ϕ(t; 0, 1) und einer Verteilungsfunktion FY (t) = Φ(t; 0, 1). 1 Φ(t; 0, 1) = FY (t) = √ 2π Z t −∞ e− x2 2 Z t dx = ϕ(x; 0, 1) dx. −∞ Wie muß nun der Fall einer Zufallsvariablen X mit beliebiger Dichte ϕ(t; µ, σ) und einer Verteilungsfunktion Φ(t; µ, σ) behandelt werden, damit die Information des Tafelwerks zur 20–152 KAPITEL 20. WAHRSCHEINLICHKEITSRECHNUNG Standardnormalverteilung genutzt werden kann? Betrachte eine lineare Transformation von X mit den (bekannten) Größen µ, σ, σ 6= 0 : X = σY + µ, Y = X−µ σ . Dann ist X genau dann normalverteilt, falls Y normalverteilt ist. Die Berechnung von Erwartungswert und Varianz richtet sich nach den oben abgeleiteten Regeln bei linearen Transformationen von Zufallsgrößen: E(X) = σE(Y ) + µ, D2 (X) = σ 2 D2 (Y ). Für die tabellierte Zufallsgröße Y gilt E(Y ) = 0 und D2 (Y ) = 1. Deshalb folgt: E(X) = µ und D2 (X) = σ 2 , E(X) und D2 (X) müssen also bekannt sein. Beispiel 20.32 (1) Berechne ¶ µ ¶ µ ¶ µ t−µ t−µ t−µ X −µ ≤ =P Y ≤ =Φ , 0, 1 . FX (t) = P (X ≤ t) = P σ σ σ σ ¡ ¢ Φ t−µ σ ; 0, 1 ist der Tabelle zu entnehmen. (2) Berechne die Wahrscheinlichkeit, daß X zwischen a und b liegt. ³ ´ ³ ´ X−µ b−µ a−µ b−µ P (a ≤ X ≤ b) = P a−µ ≤ ≤ = P ≤ Y ≤ σ σ σ σ σ ³ ´ ¢ ¡ = P Y ≤ b−µ − P Y ≤ a−µ . σ σ ³ ´ ¡ a−µ ¢ = Φ b−µ σ ; 0, 1 − Φ σ ; 0, 1 Zusammenfassung: Die Berechnung der Wahrscheinlichkeit bei Standardsituationen in Physik und Technik erfolgt also in der Regel in 3 Schritten: (1) Finde eine Verteilungsfunktion, die der Versuchs- und Ergebnissituation entspricht. (2) Überführe diese Verteilungsfunktion gegebenenfalls in eine tabellierte Normalform. (3) Berechne die Wahrscheinlichkeiten mit Hilfe der Tabellenwerte dieser Normalform.