Mathematik für Chemiker III Skriptum zur Lehrveranstaltung von Ao. Univ. Prof. Dr. Helmut Länger Technische Universität Wien Institut für Diskrete Mathematik und Geometrie Wintersemester 2013/2014 2 Inhaltsverzeichnis 1 Algebra 5 1.1 Symmetriegruppen ebener Moleküle . . . . . . . . . . . . . . . 5 1.2 Symmetriegruppen räumlicher Moleküle . . . . . . . . . . . . 8 1.3 Bestimmung der Anzahl chemischer Verbindungen . . . . . . . 10 2 Wahrscheinlichkeitsrechnung und Statistik 13 2.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.2 Diskrete Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . 17 2.3 Stetige Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . 19 2.4 Approximation von diskreten Wahrscheinlichkeitsverteilungen durch stetige . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.5 Additionssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.6 Multiplikationssatz . . . . . . . . . . . . . . . . . . . . . . . . 22 2.7 Verteilungsprobleme in der statistischen Physik . . . . . . . . 24 2.8 Zufallsvariable, Mittel und Varianz . . . . . . . . . . . . . . . 25 2.9 Zentraler Grenzverteilungssatz . . . . . . . . . . . . . . . . . . 32 2.10 Schätzfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.11 Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.12 Überprüfung auf Normalverteilung . . . . . . . . . . . . . . . 38 2.13 Simulation von Zufallsvariablen . . . . . . . . . . . . . . . . . 39 3 3 Gewöhnliche Differentialgleichungen 41 3.1 Homogene und inhomogene Differentialgleichungen . . . . . . 41 3.2 Differentialgleichungen erster Ordnung, die sich auf lineare Differentialgleichungen zurückführen lassen . . . . . . . . . . . 44 3.3 Clairotsche Differentialgleichungen 3.4 Differentialgleichungen zweiter Ordnung, die sich auf Differentialgleichungen erster Ordnung zurückführen lassen . . . . . . 46 4 Fourieranalyse . . . . . . . . . . . . . . . 45 49 4.1 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.2 Diskrete Fouriertransformation 4.3 Fouriertransformation . . . . . . . . . . . . . . . . . . . . . . . 54 5 Partielle Differentialgleichungen . . . . . . . . . . . . . . . . . 52 59 5.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 5.2 Quasilineare partielle Differentialgleichungen erster Ordnung . 61 5.3 Potential- oder Laplace-Gleichung . . . . . . . . . . . . . . . . 63 5.4 Wellen- oder Schwingungsgleichung . . . . . . . . . . . . . . . 65 5.5 Diffusions- oder Wärmeleitungsgleichung . . . . . . . . . . . . 70 6 Vektoranalysis 77 6.1 Bereichsintegrale . . . . . . . . . . . . . . . . . . . . . . . . . 77 6.2 Skalarfelder, Vektorfelder, Gradient . . . . . . . . . . . . . . . 87 6.3 Krummlinige Koordinaten . . . . . . . . . . . . . . . . . . . . 89 6.4 Kurvenintegrale, Greenscher Integralsatz . . . . . . . . . . . . 91 6.5 Oberflächenintegrale . . . . . . . . . . . . . . . . . . . . . . . 98 6.6 Divergenz, Gaußscher Integralsatz . . . . . . . . . . . . . . . . 102 6.7 Rotation, Stokesscher Integralsatz . . . . . . . . . . . . . . . . 106 6.8 Differentialformen . . . . . . . . . . . . . . . . . . . . . . . . . 110 7 Übungsaufgaben 115 4 Kapitel 1 Algebra Motivation Jene Abbildungen, die sich aus Drehungen und Spiegelungen zusammensetzen und ein gegebenes Molekül in sich überführen, bilden eine Gruppe, die sogenannte Symmetriegruppe des Moleküls. Die Struktur dieser Gruppe spiegelt gewisse Eigenschaften des Moleküls wider. Anwendungen gibt es in der Theorie der Gruppendarstellungen, die hier aber nicht behandelt wird. Im Folgenden wird nur gezeigt, wie mit Hilfe von Symmetriegruppen von Molekülen die Anzahl paarweise nichtäquivalenter Belegungen der den Atomen entsprechenden Raumpunkte mit Atomen oder Atomgruppen bestimmt werden kann kann. Dazu werden Regeln zur Aufstellung von Symmetriegruppen benötigt. Diese Regeln werden im Folgenden besprochen. 1.1 Symmetriegruppen ebener Moleküle Unter einer Symmetrieoperation in der Ebene verstehen wir eine längenund winkeltreue bijektive Abbildung von R2 nach R2 . (R bezeichnet die Menge der reellen Zahlen.) Abgesehen von Parallelverschiebungen (Translationen) gibt es folgende Typen von Symmetrieoperationen in der Ebene: • die identische Abbildung • Drehungen um Punkte • Spiegelungen an Geraden 5 Wir betrachten nun ein ebenes Molekül und fassen es als eine Menge von Punkten der Ebene auf. Diese Punkte entsprechen den Atomen, und wir denken uns diese Punkte mit den entsprechenden Elementbezeichnungen versehen. Unter einer zulässigen Symmertrieoperation verstehen wir eine Symmetrieoperation, die das Molekül mit sich zur Deckung bringt. Die Symmetriegruppe des Moleküls besteht aus allen zulässigen Symmetrieoperationen, zusammen mit der Komposition von Abbildungen als Verknüpfung. Wir nennen einen Punkt zulässig, wenn es einen Winkel α mit 0 < α < 2π gibt, sodass die Drehung um diesen Punkt um den Winkel α zulässig ist. Wir nennen eine Gerade zulässig, wenn die Spiegelung an dieser Geraden zulässig ist. Um bei einem vorgegebenen Molekül alle Symmetrieoperationen zu ermitteln, ist es günstig, folgende Tatsachen zu beachten: • Gleichartige Atome sind um einen zulässigen Punkt in Form von regelmäßigen Vielecken angeordnet. • Die Punkte außerhalb einer zulässigen Geraden treten in Paaren zueinander bzgl. der Geraden symmetrisch liegender gleichartiger Atome auf. Durch jedes einzelne dieser Paare ist die Gerade als Symmetriegerade eindeutig bestimmt. Werden daher alle Atome einer bestimmten Art betrachtet, so geht eine zulässige Gerade entweder durch alle diese Atome, oder sie ist die Symmetriegerade zweier verschiedener dieser Atome. • Einzeln vorkommende Atome stimmen mit jedem zulässigen Punkt überein und liegen auf jeder zulässigen Geraden. Beispiel Wir betrachten Benzol. Geometrisch handelt es sich um ein regelmäßiges Sechseck. Es gibt dann genau folgende zulässige Symmetrieoperationen: • die identische Abbildung • die Drehung um π/3, 2π/3, π, 4π/3 bzw. 5π/3 • die Spiegelung an der Verbindungsgeraden gegenüberliegender Eckpunkte und 6 • die Spiegelung an der Verbindungsgeraden der Halbierungspunkte gegenüberliegender Kanten Wir bezeichnen die Ecken des regelmäßigen Sechsecks im Uhrzeigersinn der Reihe nach mit 1, . . . , 6. Bezeichne ρ die Drehung um den Mittelpunkt des Sechsecks um π/3 im Uhrzeigersinn und σ die Spiegelung an der Geraden durch 1 und 4. Dann sind ρ2 , ρ3 , ρ4 bzw. ρ5 die Drehungen um den Mittelpunkt des Sechsecks um 2π/3, π, 4π/3 bzw. 5π/3 im Uhrzeigersinn, ρ2 σ bzw. ρ4 σ die Spiegelungen an den Verbindungsgeraden durch 2 und 5 bzw. 3 und 6 und ρσ, ρ3 σ bzw. ρ5 σ die Spiegelungen an der Verbindungsgeraden der Halbierungspunkte von 12 und 45, 23 und 56 bzw. 34 und 61. Die Symmetriegruppe des Benzols lautet also ({ε, ρ, ρ2 , ρ3 , ρ4 , ρ5 , σ, ρσ, ρ2 σ, ρ3 σ, ρ4 σ, ρ5 σ}, ◦). Es gilt ρ6 = σ 2 = ε und σρ = ρ−1 σ. Diese Gruppe heißt die Diedergruppe D6 . Bezeichnet also σ eine Spiegelung an der Verbindungsgerade gegenüberliegender Eckpunkte, so sind ρ2 σ und ρ4 σ die beiden anderen Spiegelungen dieser Art und ρσ, ρ3 σ und ρ5 σ die Spiegelungen an Geraden durch Halbierungspunkte gegenüberliegender Kanten. Bezeichnet hingegen σ eine Spiegelung an der Verbindungsgeraden der Halbierungspunkte gegenüberliegender Kanten, so sind die anderen Spiegelungen dieser Art durch ρ2 σ und ρ4 σ gegeben. Die Spiegelungen an Geraden durch gegenüberliegende Eckpunkte sind dann ρσ, ρ3 σ und ρ5 σ. Die zulässigen Symmetrieoperationen des Benzols sind schon durch ihre Einschränkungen auf die 6-elementige Teilmenge {1, . . . , 6} von R2 eindeutig bestimmt. Für die entsprechend eingeschränkten Abbildungen gilt nämlich ρ = (123456), ρ2 = (135)(246), ρ3 = (14)(25)(36), ρ4 = (153)(264), ρ5 = (165432), σ = (26)(35), ρσ = (12)(36)(45), ρ2 σ = (13)(46), ρ3 σ = (14)(23)(56), ρ4 σ = (15)(24) und ρ5 σ = (16)(25)(34). Die Gruppe aller Permutationen von {1, . . . , n} heißt die Symmetrische Gruppe Sn vom Grad n. Die Symmetriegruppe des Benzols ist also eine Untergruppe der S6 . 2 7 1.2 Symmetriegruppen räumlicher Moleküle Unter einer Symmetrieoperation im Raum verstehen wir eine längenund winkeltreue bijektive Abbildung von R3 nach R3 . Abgesehen von Parallelverschiebungen (Translationen) gibt es folgende Typen von Symmetrieoperationen im Raum: • die identische Abbildung • Drehungen um Geraden • Spiegelungen an Ebenen • sogenannte ”Drehspiegelungen” Eine Drehspiegelung ist eine Abbildung, die sich aus einer Drehung um eine Gerade und der Spiegelung an einer Ebene, die auf die Gerade senkrecht steht, zusammensetzt. Steht eine Gerade auf eine Ebene senkrecht, so sind eine feste Drehung um die Gerade und die Spiegelung an der Ebene miteinander vertauschbar. Wir betrachten nun ein räumliches Molekül und fassen es als eine Menge von Punkten des Raumes auf. Diese Punkte entsprechen wieder den Atomen, und wir denken uns diese Punkte mit den entsprechenden Elementbezeichnungen versehen. Zulässige Symmertrieoperationen und die Symmetriegruppe sind analog wie vorhin definiert. Wir nennen eine Gerade zulässig, wenn es einen Winkel α mit 0 < α < 2π gibt, sodass die Drehung um diese Gerade um den Winkel α zulässig ist. Wir nennen eine Ebene zulässig, wenn die Spiegelung an dieser Ebene zulässig ist. Um bei einem vorgegebenen Molekül alle zulässigen Symmetrieoperationen zu ermitteln, ist es günstig, folgende Tatsachen zu beachten: • Gleichartige Atome sind um eine zulässige Gerade jeweils in Form regelmäßiger Vielecke, die sich in auf die Gerade senkrecht stehenden Ebenen befinden, angeordnet. • Die Punkte außerhalb einer zulässigen Ebene treten in Paaren zueinander bzgl. der Ebene symmetrisch liegender gleichartiger Atome auf. 8 Durch jedes einzelne dieser Paare ist die Ebene als Symmetrieebene eindeutig bestimmt. Werden daher alle Atome einer bestimmten Art betrachtet, so geht eine zulässige Ebene entweder durch alle diese Atome, oder sie ist die Symmetrieebene zweier verschiedener dieser Atome. • Einzeln vorkommende Atome liegen auf jeder zulässigen Geraden und in jeder zulässigen Ebene. Unter einer Drehung der Ordnung n verstehen wir eine Drehung um 2π/n. Unter einer Drehspiegelung der Ordnung n verstehen wir eine Drehspiegelung, die sich aus einer Drehung der Ordnung n und der Spiegelung an einer auf die Drehachse senkrecht stehenden Ebene zusammensetzt. Eine Drehspiegelung der Ordnung 2 heißt auch Inversion. Sie ist nichts anderes als die Spiegelung am Schnittpunkt von Drehachse und Spiegelungsebene. • Ist n eine ungerade ganze Zahl > 1 und lässt eine Gerade eine Drehspiegelung ρσ der Ordnung n zu, so lässt diese Gerade auch eine Drehung der Ordnung n zu, nämlich ρ, da (ρσ)n+1 = ρn+1 = ρ ist, und die entsprechende Ebene ist zulässig, da (ρσ)n = ρn σ = σ ist. • Ist n eine gerade ganze Zahl > 2 und lässt eine Gerade eine Drehspiegelung ρσ der Ordnung n zu, so lässt diese Gerade auch eine Drehung der Ordnung n/2 zu, nämlich ρ2 , da (ρσ)2 = ρ2 ist. • Einzeln vorkommende Atome stimmen mit dem Spiegelungszentrum jeder Inversion überein. Werden zulässige räumliche Symmetrieoperationen eines ebenen Moleküls betrachtet, so ist die Spiegelung an der Molekülebene eine von der identischen Abbildung verschiedene zulässige räumliche Symmetrieoperation, obwohl die Einschränkungen beider Symmetrieoperationen auf die Molekülebene übereinstimmen. Beispiel Wir betrachten Ammoniak. Geometrisch handelt es sich um eine gerade, regelmäßige dreiseitige Pyramide, an deren Spitze sich das N-Atom und bei der sich in den Eckpunkten des Basisdreiecks die H-Atome befinden. Es gibt dann genau folgende zulässige Symmetrieoperationen: • die identische Abbildung 9 • die Drehung um die Achse der Pyramide um 2π/3 bzw. 4π/3 • die Spiegelung an jenen Ebenen, die durch die Achse der Pyramide und einen Eckpunkt des Basisdreiecks gehen. Wir bezeichnen die Eckpunkte des Basisdreiecks im Uhrzeigersinn (von der Spitze aus gesehen) der Reihe nach mit 1, 2 und 3. Weiters bezeichne ρ die Drehung um die Achse der Pyramide um 2π/3 im Uhrzeigersinn (von der Spitze aus gesehen) und σ die Spiegelung an der Ebene durch die Achse und 1. Dann ist ρ2 die Drehung um die Achse der Pyramide um 4π/3 im Uhrzeigersinn (von der Spitze aus gesehen), und ρσ bzw. ρ2 σ sind die Spiegelungen an der Ebene durch die Achse und 3 bzw. die Achse und 2. Die Symmetriegruppe des Ammoniaks lautet also ({ε, ρ, ρ2 , σ, ρσ, ρ2 σ}, ◦). Es gilt ρ3 = σ 2 = ε und σρ = ρ−1 σ. Diese Gruppe heißt die Diedergruppe D3 . Die zulässigen Symmetrieoperationen des Ammoniaks sind schon durch ihre Einschränkungen auf die 3-elementige Teilmenge {1, 2, 3} von R3 eindeutig bestimmt. Für die entsprechend eingeschränkten Abbildungen gilt nämlich: ρ = (123), ρ2 = (132), σ = (23), ρσ = (12) und ρ2 σ = (13). Die Symmetriegruppe des Ammoniaks ist also die S3 . 2 1.3 Bestimmung der Anzahl chemischer Verbindungen Wir betrachten ein Molekül. Eine Belegung der den Atomen entsprechenden Raumpunkte mit Atomen oder Atomgruppen nennen wir eine Anordnung. Wir nennen zwei Anordnungen zueinander äquivalent, wenn sie dasselbe Molekül darstellen, d. h., wenn sie mittels einer Symmetrieoperation ineinander übergeführt werden können. Bzgl. der Anzahl der paarweise nichtäquivalenten Anordnungen gilt das folgende Lemma von Burnside Die Anzahl der paarweise nichtäquivalenten Anordnungen beträgt 1 X |Fixg|, |G| g∈G wobei (G, ◦) die Symmetriegruppe des Moleküls und für jedes g ∈ G Fixg die Menge jener Anordnungen bezeichnet, die bei Anwendung von g fest bleiben. 10 Beispiel Gesucht ist die Anzahl der chemischen Verbindungen, die aus Benzol dadurch entstehen, dass jedes H-Atom durch ein CH3 - oder H-Radikal ersetzt wird. Es ist G = {ε, ρ, ρ2 , ρ3 , ρ4 , ρ5 , σ, ρσ, ρ2 σ, ρ3 σ, ρ4 σ, ρ5 σ}, |Fixε| = 64, |Fixρ| = |Fixρ5 | = 2, |Fixρ2 | = |Fixρ4 | = 4, |Fixρ3 | = 8, |Fixσ| = |Fixρ2 σ| = |Fixρ4 σ| = 16 und |Fixρσ| = |Fixρ3 σ| = |Fixρ5 σ| = 8. Daher beträgt die gesuchte Anzahl 156 1 (64 + 2 · 2 + 2 · 4 + 8 + 3 · 16 + 3 · 8) = = 13. 12 12 2 Kontrollfragen 1. Welche Symmetrieoperationen in der Ebene gibt es? 2. Wie können alle zulässigen Symmetrieoperationen eines ebenen Moleküls ermittelt werden? 3. Was ist die Diedergruppe Dn ? 4. Was ist die Symmetrischen Gruppe Sn vom Grad n? 5. Welche Symmetrieoperationen im Raum gibt es? 6. Was ist eine Drehspiegelung? 7. Wie können alle zulässigen Symmetrieoperationen eines räumlichen Moleküls ermittelt werden? 8. Was besagt das Lemma von Burnside? 11 12 Kapitel 2 Wahrscheinlichkeitsrechnung und Statistik Motivation In diesem Kapitel geht es um das Rechnen mit Wahrscheinlichkeiten, Anwendungen in der statistischen Physik sowie um Kenngrößen von Daten wie Mittel und Varianz. Außerdem wird gezeigt, wie überprüft werden kann, ob zwischen zwei Zufallsgrößen eine lineare Korrelation besteht. Die besondere Rolle der Normalverteilung wird durch den Zentralen Grenzverteilungssatz unterstrichen. Weiters geht es um das Schätzen von Parametern und das Testen von Hypothesen und schließlich um die Überprüfung, ob normalverteilte Daten vorliegen sowie um die Simulation von Zufallsgrößen mit Hilfe von in Computern eingebauten Zufallszahlengeneratoren. In diesem und in den folgenden Kapiteln sei – falls nichts anderes erwähnt ist – n ∈ N. (N bezeichnet die Menge der natürlichen Zahlen. Darunter verstehen wir die positiven ganzen Zahlen.) 2.1 Grundlagen Zunächst werden einige Grundformeln aus der Kombinatorik angegeben. Die Anzahl der Permutationen von n Elementen beträgt n! = 1·2·3·. . .·n. Dabei wird 0! als 1 definiert. Die Anzahl der Abbildungen einer k-elementigen Menge in eine n-elementige Menge beträgt nk . Dabei wird 00 als 1 definiert. 13 Die Anzahl der k-elementigen Teilmengen einer n-elementigen Menge beträgt n n! (k ∈ {0, . . . , n}) bzw. = k!(n − k)! k n n(n − 1)(n − 2) · . . . · (n − k + 1) = (k ∈ {1, . . . , n}). k k(k − 1)(k − 2) · . . . · 1 Es gilt n n = für k = 0, . . . , n. k n−k Die Anzahl aller Teilmengen einer n-elementigen Menge beträgt also n n + ... + = 2n . 0 n Die Anzahl der Möglichkeiten, k nichtunterscheidbare Dinge auf n unterscheidbare Fächer aufzuteilen, beträgt n+k−1 n+k−1 = . k n−1 Jede solche Aufteilung kann nämlich in eindeutiger Weise durch eine Folge der Länge n + k − 1, bestehend aus genau k Nullen und genau n − 1 Einsern, beschrieben werden. Dabei gibt die Anzahl jener Nullen, die sich vor dem ersten Einser befinden, die Anzahl jener Dinge an, die im ersten Fach liegen. Die Anzahl jener Nullen, die sich zwischen dem ersten und dem zweiten Einser befinden, gibt sodann die Anzahl jener Dinge an, die im zweiten Fach liegen usw. Auf diese Weise kann jede Folge, bestehend aus genau k Nullen und genau n − 1 Einsern, entstehen. Ist z. B. k = 3 und n = 4, so beschreibt die Folge 011001 jene Aufteilung von drei nichtunterscheidbaren Dingen auf vier unterscheidbare Fächer, bei der im ersten Fach ein Ding, im zweiten keines, im dritten zwei Dinge und im vierten Fach kein Ding liegt. Jede solche Folge ist aber wiederum durch jene n − 1 der insgesamt n + k − 1 Plätze festgelegt, an denen die Einser stehen. Es gibt nun aber genau n+k−1 n+k−1 = n−1 k Möglichkeiten, n−1 Plätze aus den insgesamt n+k −1 Plätzen auszuwählen. Wir betrachten nun einen (wiederholbaren) Versuch, z. B. das Würfeln mit einem roten und einem schwarzen Würfel. Es gibt dann genau 36 verschiedene Versuchsausgänge. Diese können wir in der Form ”(Augenzahl 14 des roten Würfels, Augenzahl des schwarzen Würfels)” angeben. Bezeichne M die Menge der möglichen Versuchsausgänge. In unserem Beispiel ist M = {(1, 1), (1, 2), . . . , (6, 6)}. Ein Elementarereignis ist ein Element von M bzw. eine einelementige Teilmenge von M . Jedes Ereignis ist eine Teilmenge von M . So ist z. B. die Teilmenge {(1, 3), (2, 2), (3, 1)} von M das Ereignis ”Die Summe der Augenzahlen der beiden Würfel beträgt 4”. Das Ereignis A tritt bei einer gewissen Versuchsdurchführung ein, falls der entsprechende Versuchsausgang ein Element von A ist. Die Ereignisse A und B schließen einander aus, falls A und B zueinander disjunkte Teilmengen von M sind. Die Ereignisse A und B heißen zueinander komplementär, falls A und B zueinander komplementäre Teilmengen von M sind. Bezeichne E die Menge aller Ereignisse. Es wird gefordert: • • • ∅, M ∈ E Ist A ∈ E, so gilt M \ A ∈ E. Sind A, B ∈ E, so gilt A ∪ B, A ∩ B ∈ E. (Aus mathematischen Gründen wird sogar die Abgeschlossenheit von E bzgl. der Bildung abzählbarer Vereinigungen bzw. Durchschnitte gefordert.) ∅ heißt unmögliches Ereignis und M sicheres Ereignis. A ∪ B bezeichnet das Ereignis, dass mindestens eines der beiden Ereignisse A bzw. B eintritt, und A ∩ B jenes Ereignis, dass sowohl A als auch B eintritt. Das Paar (M, E) heißt ein Ereignisfeld. Beispiel (M, 2M ), wobei M irgendeine Menge ist und 2M die Potenzmenge von M bezeichnet, ist ein Ereignisfeld. 2 Beispiel (R2 , B(R2 )) ist ein Ereignisfeld. Hier und im Folgenden bezeichnet B(R2 ) die Menge aller Borelmengen von R2 , das ist die kleinste Menge von Teilmengen von R2 , die alle Rechtecke der Ebene enthält und gegenüber Komplementen, abzählbaren Vereinigungen und abzählbaren Durchschnitten abgeschlossen ist. Analog werden allgemein n-dimensionale Borelmengen für beliebiges n ∈ N definiert. 2 Sei nun k eine positive ganze Zahl. Für jedes A ∈ E bezeichne ak (A) bzw. rk (A) die absolute bzw. relative Häufigkeit des Eintritts von A im Verauf von k Versuchsdurchführungen. Seien A, B, C ∈ E. Dann gilt: • 0 ≤ ak (A) ≤ k • ak (∅) = 0, ak (M ) = k 15 • ak (B ∪ C) = ak (B) + ak (C), falls B ∩ C = ∅ Daraus folgt: • 0 ≤ rk (A) ≤ 1 • rk (∅) = 0, rk (M ) = 1 • rk (B ∪ C) = rk (B) + rk (C), falls B ∩ C = ∅ Mit wachsendem k scheint rk (A) einem Grenzwert zuzustreben. Dieser heißt die Wahrscheinlichkeit P (A) von A. In der Mathematik wird nun der Begriff der Wahrscheinlichkeitsverteilung axiomatisch folgendermaßen festgelegt: P heißt eine Wahrscheinlichkeitsverteilung auf (M, E) und (M, E, P ) ein Wahrscheinlichkeitsraum, falls P eine reellwertige Funktion auf E ist, die folgende Axiome erfüllt: • 0 ≤ P (A) ≤ 1 für alle A ∈ E • P (∅) = 0, P (M ) = 1 • P (B ∪ C) = P (B) + P (C) für je zwei zueinander disjunkte Elemente B, C von E. (Aus mathematischen Gründen wird sogar P (A1 ∪ A2 ∪ A3 ∪ . . .) = P (A1 ) + P (A2 ) + P (A3 ) + . . . für jede Folge A1 , A2 , A3 , . . . paarweise disjunkter Elemente von E gefordert.) Die Axiome (i) P (A) ≥ 0 (ii) P (M ) = 1 (iii) Aus A ∩ B = ∅ folgt P (A ∪ B) = P (A) + P (B). für eine Funktion f : E → R sind unabhängig. Das geht aus folgender Tabelle hervor: P (∅) P ({1}) P ({2}) P ({1, 2}) 0 0 1 2 0 1 −1 0 1 1 0 1 16 (i) (ii) (iii) nein ja ja ja nein ja ja ja nein Ist M ⊆ Rn , so heißt n die Dimension von P bzw. von (M, E, P ). Im Folgenden bezeichne (M, E, P ) einen Wahrscheinlichkeitsraum. Seien A, B, A1 , . . . , An ∈ E und A1 , . . . , An paarweise disjunkt. Dann gilt: • P (A1 ∪ . . . ∪ An ) = P (A1 ) + . . . + P (An ) • P (M \ A) = 1 − P (A) • Aus A ⊆ B folgt P (A) ≤ P (B). Mit den vorhin definierten Axiomen gilt: (i) (iii) (ii) P (A) ≤ P (A) + P (M \ A) = P (A ∪ (M \ A)) = P (M ) = 1, (iii) P (∅) = P (∅) + P (∅) − P (∅) = P (∅ ∪ ∅) − P (∅) = P (∅) − P (∅) = = 0, (iii) P (M \ A) = P (M \ A) + P (A) − P (A) = P ((M \ A) ∪ A) − P (A) = (ii) = P (M ) − P (A) = 1 − P (A) und (i) (iii) A ⊆ B ⇒ P (A) ≤ P (A) + P (B \ A) = P (A ∪ (B \ A)) = P (B) für alle A, B ∈ E. Sei X eine Größe, die bei jeder Versuchsdurchführung einen Wert aus M annimmt. So eine Größe heißt eine Zufallsvariable. X besitzt die Wahrscheinlichkeitsverteilung P bzw. P ist die Wahrscheinlichkeitsverteilung von X bzw. X ist nach P verteilt, i. Z. X ∼ P , falls für jedes A ∈ E die Wahrscheinlichkeit dafür, dass X einen Wert aus A annimmt, P (A) beträgt. Die Dimension von X ist die Dimension der zugehörigen Wahrscheinlichkeitsverteilung. 2.2 Diskrete Wahrscheinlichkeitsverteilungen Seien ai , i ∈ I, endlich oder abzählbar viele paarweise verschiedene reelle P Zahlen und pi , i ∈ I, nichtnegative reelle Zahlen mit pi = 1. Für jedes J ⊆ i∈I P I sei P ({ai | i ∈ J}) := pi . Dann ist P eine Wahrscheinlichkeitsverteilung i∈J {ai | i∈I} auf ({ai | i ∈ I}, 2 ). So eine Wahrscheinlichkeitsverteilung bzw. 17 der zugehörige Wahrscheinlichkeitsraum heißen diskret. Die Funktion ai 7→ pi (i ∈ I) von {ai | i ∈ I} nach [0, 1] heißt eine Dichtefunktion von P . Gibt es nur endlich viele Elementarereignisse und sind diese alle gleich wahrscheinlich, so kann zur Berechnung der Wahrscheinlichkeit eines Ereignisses die Formel günstige Fälle mögliche Fälle verwendet werden. In der folgenden Tabelle sind einige diskrete Wahrscheinlichkeitsverteilungen angegeben (f bezeichne eine entsprechende Dichtefunktion und M deren Definitionsbereich): Name diskrete Gleichverteilung Alternativverteilung Binomialverteilung Poissonverteilung hypergeometrische Verteilung Bez. M f (x) Bemerkungen DM M 1/|M | M endlich, M 6= ∅ Ap {0, 1} Bn,p {0, . . . , n} Pξ N0 HN,A,n 1−p x=0 p x=1 n x p (1 − p)n−x x ξ x exp(−ξ)/x! A x {0, . . . , n} N −A n−x / N n 0≤p≤1 n∈N 0 ≤ p ≤ 1, 00 := 1 ξ ∈ R+ N ∈N A, n ∈ {0, . . . , N } A := 0 für x > A x N −A := 0 für n−x n−x>N −A (N0 bezeichnet die Menge der nichtnegativen ganzen und R+ die Menge der positiven reellen Zahlen.) Wir betrachten eine Prüfung. Es sei p die Wahrscheinlichkeit, bei der Prüfung durchzukommen. Bezeichne Xn für n ∈ N die Anzahl jener von insgesamt n Kandidaten, die bei der Prüfung durchkommen. Dann gilt X1 ∼ Ap und Xn ∼ Bn,p (”Ziehungen mit Zurücklegen”). Wird einem Los vom Umfang N , welches A Ausschussstücke enthält, eine Stichprobe vom Umfang n entnommen, so ist die Anzahl der in der 18 Stichprobe enthaltenen Ausschussstücke nach HN,A,n verteilt (”Ziehungen ohne Zurücklegen”). Es gibt nämlich genau Nn Möglichkeiten, aus dem Los vom Umfang N eine Stichprobe vom Umfang n zu entnehmen, genau Ax Möglichkeiten, aus den insgesamt A Ausschussstücken x zu entnehmen, und −A – davon unabhängig – genau Nn−x Möglichkeiten, aus den N − A guten −A Stücken n − x auszuwählen. Daher ist Ax bzw. Nn−x als Null zu verstehen, falls x > A bzw. n − x > N − A ist. 2 Es gelten folgende Näherungen: • Bn,p ≈ Pnp , falls p < 0.1 • Ist n/N < 0.1, so gilt HN,A,n ≈ Bn,A/N . • Sind A/N, n/N < 0.1, so gilt HN,A,n ≈ PnA/N . Beispiel In einem Kolben mögen sich a Liter Flüssigkeit und in dieser b Bakterien befinden. c Liter der Flüssigkeit (wobei c im Vergleich zu a sehr klein sein soll) werden in ein Reagenzglas gefüllt. Bezeichnet V bzw. v das Volumen der Flüssigkeit im Kolben bzw. im Reagenzglas, wobei als Maßeinheit für das Volumen das Volumen einer Bakterie gewählt wird, so gilt v/V = c/a, und die Anzahl der Bakterien im Reagenzglas ist dann nach HV,b,v ≈ Pvb/V = Pbc/a verteilt. Also ist die Wahrscheinlichkeit, dass sich im Reagenzglas genau d Bakterien befinden, näherungsweise gleich bc 1 bc d ( ) exp(− ). d! a a 2 2.3 Stetige Wahrscheinlichkeitsverteilungen Sei f : R → R+ 0 ”stückweise” stetig, und gelte Z∞ f (x)dx = 1. −∞ (R+ 0 bezeichnet die Menge der nichtnegativen reellen Zahlen.) Wird dann P : B(R) → [0, 1] durch Z P (B) := f (x)dx B 19 für alle B ∈ B(R) definiert, so ist P eine Wahrscheinlichkeitsverteilung auf (R, B(R)). Eine auf diese Weise entstehende Wahrscheinlichkeitsverteilung P bzw. der entsprechende Wahrscheinlichkeitsraum heißen stetig, und f heißt dann eine Dichtefunktion von P . Für jede endliche Teilmenge B von R gilt B ∈ B(R) und P (B) = 0. In der folgenden Tabelle sind einige stetige Wahrscheinlichkeitsverteilungen auf (R, B(R)) angegeben (f bezeichne eine entsprechende Dichtefunktion): Name stetige Gleichverteilung Exponentialverteilung Normalverteilung Standardnormalverteilung Chiquadratverteilung mit n Freiheitsgraden t-Verteilung (Studentverteilung) mit n Freiheitsgraden Bez. N (0, 1) f (x) Bemerkungen 1/(b − a) x ∈ [a, b] a, b ∈ R 0 sonst a<b + λ exp(−λx) x ∈ R λ ∈ R+ 0 sonst √ m∈R (1/( 2πσ)) exp(−(x − m)2 /(2σ 2 )) σ ∈ R+ √ (1/ 2π) exp(−x2 /2) χ2n verschwindet auf R− 0 := (−∞, 0] n∈N tn ist symmetrisch bzgl. x = 0 n∈N S[a,b] Exλ N (m, σ 2 ) Sei X eine Zufallsvariable. Dann gilt: Sind a, b ∈ R und ist a 6= 0, so ist X genau dann nach N (m, σ 2 ) verteilt, falls aX + b nach N (am + b, a2 σ 2 ) verteilt ist. Die Normalverteilung ist sozusagen invariant gegenüber linearen Transformationen. Insbesondere ist X genau dann nach N (m, σ 2 ) verteilt, falls (X − m)/σ nach N (0, 1) verteilt ist. Sei 1 Φ(x) := √ 2π Zx t2 exp(− )dt 2 −∞ für alle x ∈ R. (Φ heißt die Verteilungsfunktion der Standardnormalverteilung.) 20 2.4 Approximation von diskreten Wahrscheinlichkeitsverteilungen durch stetige Seien a, b ∈ Z mit a ≤ b. (Z bezeichnet die Menge der ganzen Zahlen.) Sei P1 eine diskrete Wahrscheinlichkeitsverteilung auf ({a, a + 1, a + 2, . . . , b}, 2{a,a+1,a+2,...,b} ) mit der Dichtefunktion f1 und P2 eine stetige Wahrscheinlichkeitsverteilung auf (R, B(R)) mit der Dichtefunktion f2 , und gelte P1 ≈ P2 . Dann gilt d+1/2 Z d+1/2 Z t(x)dx ≈ P1 ({c, . . . , d}) = f1 (c) + . . . + f1 (d) = c−1/2 f2 (x)dx = c−1/2 1 1 = P2 ([c − , d + ]) 2 2 für alle c, d ∈ {a, a + 1, a + 2, . . . , b} mit c ≤ d, wobei t die durch t(x) := f1 (s) für alle s ∈ {a, a + 1, a + 2, . . . , b} und für alle x ∈ [s − 1/2, s + 1/2) definierte der Funktion f1 entsprechende Treppenfunktion auf [a − 1/2, b + 1/2) bezeichnet. Es gelten folgende Näherungen: • Ist np(1 − p) > 9, so gilt Bn,p ≈ N (np, np(1 − p)). • Ist n/N < 0.1 und n(A/N )(1 − A/N ) > 9, so gilt HN,A,n ≈ N (nA/N, n(A/N )(1 − A/N )). Beispiel Die Wahrscheinlichkeit dafür, bei der Durchführung eines gewissen physikalischen Experiments ein qualitativ einwandfreies Ergebnis zu erhalten, sei 1/2. Das Experiment werde 200-mal durchgeführt. Bezeichne X die Anzahl jener dieser 200 Experimente, die ein qualitativ einwandfreies Ergebnis liefern. Dann gilt X ∼ B200,1/2 . Da 200(1/2)(1/2) = 50 > 9 gilt, √ ist B200,1/2 ≈ N (100, 50). Daher ist (X − 100)/(5 2) ungefähr nach N (0, 1) verteilt. Da 109.5 ≤ X ≤ 120.5 mit X − 100 20.5 9.5 √ ≤ √ ≤ √ 5 2 5 2 5 2 gleichbedeutend ist, beträgt die Wahrscheinlichkeit, dass X im Intervall [110, 120] liegt, näherungsweise 20.5 9.5 Φ( √ ) − Φ( √ ) ≈ Φ(2.90) − Φ(1.34) ≈ 0.9981 − 0.9099 ≈ 0.09. 5 2 5 2 21 Mittels einer analogen Überlegung ergibt sich für die Wahrscheinlichkeit, dass X im Intervall [90, 120] liegt, der Näherungswert 20.5 10.5 20.5 10.5 Φ( √ ) − Φ(− √ ) = Φ( √ ) − (1 − Φ( √ )) ≈ 5 2 5 2 5 2 5 2 ≈ Φ(2.90) − (1 − Φ(1.48)) ≈ ≈ 0.9981 − (1 − 0.9306) ≈ 0.93. Dabei wurde die Beziehung Φ(−a) = 1 − Φ(a) für a ∈ R verwendet, die aus Z−a Z∞ f (x)dx = 1 − f (x)dx = Φ(−a) = −∞ Za f (x)dx = 1 − Φ(a) −∞ a folgt, wobei f die Dichtefunktion von N (0, 1) bezeichnet. 2.5 2 Additionssatz Ist (M, E, P ) ein Wahrscheinlichkeitsraum und sind A1 , . . . , An ∈ E, so gilt P (A1 ∪ . . . ∪ An ) = = P (A1 ) + . . . + P (An ) − −P (A1 ∩ A2 ) − P (A1 ∩ A3 ) − . . . − P (An−1 ∩ An ) + +P (A1 ∩ A2 ∩ A3 ) + P (A1 ∩ A2 ∩ A4 ) + . . . + P (An−2 ∩ An−1 ∩ An ) − . . . ... +(−1)n+1 P (A1 ∩ . . . ∩ An ). Schließen A1 , . . . , An einander paarweise aus, so folgt P (A1 ∪ . . . ∪ An ) = P (A1 ) + . . . + P (An ). 2.6 Multiplikationssatz Im Folgenden sei (M, E, P ) ein Wahrscheinlichkeitsraum. Sei k eine positive ganze Zahl, seien A, B ∈ E, bezeichne ak (A) bzw. rk (A) wieder die absolute bzw. relative Häufigkeit des Eintritts von A im Verlauf von k Versuchsdurchführungen, und sei ak (B) > 0. Dann ist ak (A ∩ B) ak (B) 22 die durch den Eintritt von B bedingte relative Häufigkeit des Eintritts von A im Verlauf der k Versuchsdurchführungen. Nun gilt ak (A ∩ B) rk (A ∩ B) = ak (B) rk (B) und, falls k ”sehr groß” ist, rk (A ∩ B) P (A ∩ B) ≈ . rk (B) P (B) Im Fall P (B) > 0 heißt daher die Zahl P (A|B) := P (A ∩ B) P (B) die durch den Eintritt von B bedingte Wahrscheinlichkeit von A. Zwei Ereignisse A, B heißen unabhängig, falls P (A ∩ B) = P (A)P (B) gilt. Im Fall P (B) > 0 ist das gleichbedeutend mit P (A|B) = P (A), und im Fall P (A) > 0 mit P (B|A) = P (B). Allgemein heißen die Ereignisse Ai , i ∈ I, unabhängig, falls für jede Auswahl Ai1 , . . . , Aik von endlich vielen paarweise verschiedenen Ai die Gleichheit P (Ai1 ∩ . . . ∩ Aik ) = P (Ai1 ) · . . . · P (Aik ) gilt. Die Ereignisse Ai , i ∈ I, heißen paarweise unabhängig, falls für je zwei verschiedene i, j ∈ I P (Ai ∩ Aj ) = P (Ai )P (Aj ) gilt. Beispiel Wir betrachten das Würfeln mit zwei unterscheidbaren Würfeln. Bezeichne A das Ereignis, mit dem ersten Würfel 3 zu würfeln, B das Ereignis, mit dem zweiten Würfel 4 zu würfeln, und C das Ereignis, dass die Summe der Augenzahlen beider Würfel 7 beträgt. Dann gilt P (A) = P (B) = P (C) = 1 und 6 P (A ∩ B) = P (B ∩ C) = P (C ∩ A) = P (A ∩ B ∩ C) = Daher sind A, B, C nicht unabhängig, aber paarweise unabhängig. 1 . 36 2 Multiplikationssatz der Wahrscheinlichkeitsrechnung: Sind A1 , . . . , An ∈ E, so gilt P (A1 ∩ . . . ∩ An ) = P (A1 )P (A2 |A1 )P (A3 |A1 ∩ A2 ) · . . . · P (An |A1 ∩ . . . ∩ An−1 ). Bemerkung Aus P (A1 ∩ . . . ∩ An−1 ) > 0 folgt wegen der Monotonie von P , dass P (A1 ), . . . , P (A1 ∩ . . . ∩ An−2 ) > 0 gilt. 23 2.7 Verteilungsprobleme in der statistischen Physik Wir betrachten n Teilchen. Jedes Teilchen werde durch ein Element des in N > 1 ”Zellen” zerlegten ”Phasenraumes”, welcher wiederum eine gewisse Teilmenge des Rm (m ∈ N) ist, beschrieben. Wir betrachten folgende drei ”Statistiken”: (i) Maxwell-Boltzmannsche Statistik Bei dieser Statistik wird angenommen, dass die Teilchen unterscheidbar sind. Sie wird z. B. bei Gasmolekülen verwendet. (ii) Bose-Einsteinsche Statistik Bei dieser Statistik wird angenommen, dass die Teilchen nicht unterscheidbar sind. Sie wird z. B. bei Photonen verwendet. (iii) Fermi-Diracsche Statistik Bei dieser Statistik wird angenommen, dass die Teilchen nicht unterscheidbar sind und dass sich in jeder Zelle höchstens ein Teilchen befindet. Daraus folgt insbesondere, dass n ≤ N gelten muss. Diese Statistik wird z. B. bei Elektronen, Protonen und Neutronen verwendet. Unter der Voraussetzung, dass alle möglichen Aufteilungen der Teilchen auf die Zellen gleichwahrscheinlich sind, ergibt sich für eine vorgegebene Zelle Z und eine vorgegebene Zahl k ∈ {0, . . . , n} die Wahrscheinlichkeit, dass bei einer solchen Aufteilung der Teilchen auf die Zellen in Z genau k Teilchen liegen, in den vorher erwähnten drei Fällen wie folgt: (N − 1)n−k /N n = nk (1/N )k (1 − 1/N )n−k N +n−1 (ii) N +n−k−2 / n−k n (iii) Nn−1 / Nn = (N − n)/N = 1 − n/N , falls k = 0 N N −1 / n = n/N , falls k = 1 n−1 (i) n k Im Fall (i) gibt es nämlich genau N n Möglichkeiten, die n Teilchen auf die N Zellen zu verteilen, genau nk Möglichkeiten, jene k Teilchen auszuwählen, die in Z liegen, und für jede solche Auswahl genau (N − 1)n−k Möglichkeiten, die übrigen n − k Teilchen auf die restlichen N − 1 Zellen zu verteilen. Das 24 Ergebnis im Fall (i) kann auch durch folgende Überlegung gewonnen werden: Die Anzahl der Teilchen, welche sich in Z befinden, ist nach Bn,1/N verteilt. Im Fall (ii) gibt es genau N +n−1 Möglichkeiten, die n Teilchen auf die n N +n−k−2 N Zellen zu verteilen, und genau Möglichkeiten, die n − k nicht in n−k Z liegenden Teilchen auf die N − 1 von Z verschiedenen Zellen zu verteilen. Im Fall (iii) gibt es schließlich genau Nn Möglichkeiten, aus sämtlichen N Zellen jene n Zellen auszuwählen, in denen sich ein Teilchen befindet. Falls sich in Z kein Teilchen befindet, so beträgt die Anzahl der Möglichkeiten, die n Teilchen auf die verbleibenden N − 1 Zellen zu verteilen, genau Nn−1 . Andernfalls beträgt die Anzahl der Möglichkeiten, die n − 1 sich außerhalb von Z befindenden Teilchen auf die verbleibenden N − 1 Zellen aufzuteilen, −1 genau Nn−1 . Das Ergebnis im Fall (iii) ergibt sich auch dadurch, dass in diesem Fall aus den insgesamt N Zellen zufällig jene n Zellen ausgewählt werden, in denen sich ein Teilchen befindet. Die Wahrscheinlichkeit dafür, dass sich die Zelle Z unter den n ausgewählten Zellen befindet, beträgt dann offensichtlich n/N . 2.8 Zufallsvariable, Mittel und Varianz Sind X1 , . . . , Xn eindimensionale Zufallsvariable und ist f eine stückweise stetige Funktion von Rn nach R, so ist f (X1 , . . . , Xn ) eine Zufallsvariable. Sei X eine eindimensionale diskrete Zufallsvariable, welche die paarweise verschiedenen Werte a1 , . . . , an ∈ R jeweils mit den Wahrscheinlichkeiten p1 , . . . , pn annimmt und die keine anderen Werte annehmen kann. Der entsprechende Versuch werde k-mal durchgeführt. Dann gilt für jedes i ∈ {1, . . . , n}, dass X im Verlauf der k Versuchsdurchführungen ungefähr kpi mal den Wert ai annimmt. Das arithmetische Mittel der von X im Verlauf der k Versuchsdurchführungen angenommenen Werte ist also ungefähr gleich n n X 1X kpi ai = ai p i . k i=1 i=1 Dieser Sachverhalt legt folgende Definition nahe: Ist P eine eindimensionale diskrete Wahrscheinlichkeitsverteilung auf (M, 2M ) (M ⊆ R) mit der Dichtefunktion f , so heißt im Fall X |x|f (x) < ∞ x∈M 25 die Zahl X m := xf (x) x∈M das Mittel von P und im Fall X (x − m)2 f (x) < ∞ x∈M die Zahl σ 2 := X (x − m)2 f (x) x∈M die Varianz von P und die nichtnegative Quadratwurzel σ aus σ 2 die Standardabweichung von P . Analog dazu wird definiert: Ist P eine eindimensionale stetige Wahrscheinlichkeitsverteilung auf (R, B(R)) mit der Dichtefunktion f , so heißt im Fall Z∞ |x|f (x)dx < ∞ −∞ die Zahl Z∞ m := xf (x)dx −∞ das Mittel von P und im Fall Z∞ (x − m)2 f (x)dx < ∞ −∞ die Zahl 2 Z∞ σ := (x − m)2 f (x)dx −∞ die Varianz von P und die nichtnegative Quadratwurzel σ aus σ 2 die Standardabweichung von P . Wenn im Folgenden Mittel, Varianz bzw. Standardabweichung von Wahrscheinlichkeitsverteilungen erwähnt werden, so wird stets vorausgesetzt, dass diese Größen existieren. Das Mittel, der Erwartungswert oder√die Erwartung EX, die Varianz V X bzw. die Standardabweichung V X einer eindimensionalen Zufallsvariablen X ist das Mittel, die Varianz bzw. die 26 Standardabweichung der der Zufallsvariablen X entsprechenden Wahrscheinlichkeitsverteilung. Ist X eine eindimensionale diskrete bzw. stetige Zufallsvariable, f : M → [0, 1] bzw. f : R → R+ 0 die Dichtefunktion ihrer Wahrscheinlichkeitsverteilung und g eine stückweise stetige Funktion von R nach R, so ist auch g(X) eine eindimensionale diskrete bzw. stetige Zufallsvariable, und es gilt Eg(X) = X Z∞ g(x)f (x) bzw. Eg(X) = x∈M g(x)f (x)dx. −∞ In der folgenden Tabelle sind für einige Wahrscheinlichkeitsverteilungen Mittel und Varianz angegeben: Wahrscheinlichkeitsverteilung DM Mittel (1/|M |) P x (1/|M |) x∈M Ap Bn,p Pξ HN,A,n S[a,b] Exλ N (m, σ 2 ) N (0, 1) χ2n tn Bemerkungen Varianz p np ξ nA/N (a + b)/2 1/λ m 0 n 0 P P (x − (1/|M |) x∈M y)2 y∈M p(1 − p) np(1 − p) ξ n(A/N )(1 − A/N )(1 − (n − 1)/(N − 1)) N > 1 (b − a)2 /12 1/λ2 σ2 1 2n n/(n − 2) n>2 2 Im Folgenden seien X, Y eindimensionale Zufallsvariable und a, b, c reelle Zahlen. Die Kovarianz K(X, Y ) von X und Y ist definiert durch K(X, Y ) := E((X − EX)(Y − EY )). Im Fall V X, V Y > 0 ist der Korrelationskoeffizient ρ(X, Y ) von X und Y definiert durch K(X, Y ) √ ρ(X, Y ) := √ . VX VY 27 X und Y heißen unkorreliert, falls K(X, Y ) = 0. Im Fall V X, V Y > 0 ist das mit ρ(X, Y ) = 0 gleichbedeutend. Nun gilt: • • • • • • • • • • • • • • Ec = c E(aX + bY ) = aEX + bEY (Linearität des Erwartungswertoperators) E(X − EX) = 0 V X = E(X − EX)2 V X = EX 2 − (EX)2 (Verschiebungssatz für die Varianz) Vc=0 √ E((X − EX)/ V X) = 0, falls V X > 0 K(X, Y ) = E(XY ) − (EX)(EY ) (Verschiebungssatz für die Kovarianz) V X = K(X, X) V (aX + bY ) = a2 V X + 2abK(X, Y ) + b2 V Y V (aX + bY ) = a2 V X + b2 V Y, falls K(X, Y ) = 0 V (X + c) = V X √ falls V X > 0 V ((X − EX)/ V X) = 1, √ √ ρ(X, Y ) = E(((X − EX)/ V X)((Y − EY )/ V Y )), falls V X, V Y > 0. X heißt zentriert, falls EX = 0 gilt, und normiert, falls EX = 0 und V X = 1 gilt. X − EX ist also zentriert, und im Fall V X > 0 ist X − EX √ VX also normiert. X − EX heißt die zu X gehörende zentrierte Zufallsvariable, und im Fall V X > 0 heißt X − EX √ VX die zu X gehörende normierte Zufallsvariable. Es gilt: • |ρ(X, Y )| ≤ 1. • ρ(X, Y ) = 1 genau dann, falls es ein a ∈ R+ und ein b ∈ R mit Y = aX + b gibt. • ρ(X, Y ) = −1 genau dann, falls es ein a ∈ R− und ein b ∈ R mit Y = aX + b gibt. 28 • |ρ(X, Y )| kann als Maß für die lineare Abhängigkeit zwischen X und Y angesehen werden. (R− bezeichnet die Menge der negativen reellen Zahlen.) Das bedeutet: Seien (x1 , y1 ), . . . , (xn , yn ) beobachtete Werte einer zweidimensionalen Zu 1 fallsvariablen (X, Y ). Ist ρ(X, Y ) ≈ , so liegen die Punkte mit den −1 positiver Koordinaten (xi , yi ) annähernd auf einer Geraden mit Steinegativer gung. Ist ρ(X, Y ) ≈ 0, so liegt kein linearer Zusammenhang zwischen X und Y vor. Es kann sein, dass zwischen X und Y keine lineare Abhängigkeit, aber trotzdem eine Abhängigkeit besteht. X und Y heißen unabhängig, falls für je zwei Intervalle I, J in R die Ereignisse [X ∈ I], [Y ∈ J] unabhängig sind. Allgemein heißen die eindimensionalen Zufallsvariablen Xi , i ∈ I, unabhängig, falls für jede Familie Ji , i ∈ I, von Intervallen in R die Ereignisse [Xi ∈ Ji ], i ∈ I, unabhängig sind. Für eindimensionale Zufallsvariable X1 , . . . , Xn , Y1 , . . . , Yn wird definiert: • X̄n = (1/n) n P Xi (Probenmittel von X1 , . . . , Xn ) i=1 • Sn2 = (1/(n − 1)) n P (Xi − X̄n )2 (Probenvarianz von X1 , . . . , Xn ) i=1 • Sn = nichtnegative Quadratwurzel aus Sn2 (Probenstandardabweichung von X1 , . . . , Xn ) • Kn = (1/(n − 1)) n P (Xi − X̄n )(Yi − Ȳn ) (Probenkovarianz von i=1 (X1 , Y1 ), . . . , (Xn , Yn )). Es gilt: Sind x1 , . . . , xn , a ∈ R und ist x̄ = (1/n) folgt n P i=1 |xi − x̄|2 < n P n P xi und a 6= x̄, so i=1 |xi − a|2 . Die Zahl x̄ minimiert also die Summe der i=1 Quadrate der Abstände zu x1 , . . . , xn . Für unabhängige eindimensionaleZufallsvariable X, Y bzw. X1 , . . . , Xn und a, b ∈ R gilt: 29 • E(XY ) = (EX)(EY ) • Ist k eine positive ganze Zahl mit k < n und sind f bzw. g stückweise stetige Abbildungen von Rk bzw. Rn−k nach R, so sind f (X1 , . . . , Xk ), g(Xk+1 , . . . , Xn ) unabhängig. • Aus X1 , . . . , Xn ∼ Ap folgt n P Xi ∼ Bn,p . i=1 • Aus X1 , . . . , Xn ∼ N (0, 1) folgt n P Xi2 ∼ χ2n . i=1 • Aus X ∼ N (m1 , σ12 ), Y ∼ N (m2 , σ22 ) und (a, b) 6= (0, 0) folgt aX +bY + c ∼ N (am1 + bm2 + c, a2 σ12 + b2 σ22 ) (Invarianz der Normalverteilung gegenüber linearen Transformationen). Sind X, Y unabhängig, so folgt also K(X, Y ) = E((X −EX)(Y −EY )) = (E(X −EX))·(E(Y −EY )) = 0·0 = 0. Aus der Unabhängigkeit zweier Zufallsvariablen folgt somit deren Unkorreliertheit. (Die Umkehrung gilt im allgemeinen nicht (siehe Übungen)!) Sind daher X, Y unabhängig und a, b ∈ R, so gilt V (aX + bY ) = a2 V X + b2 V Y. Ist P eine Wahrscheinlichkeitsverteilung auf (M, E) mit (−∞, x] ∩ M ∈ E für alle x ∈ R, so heißt die Funktion F : R → [0, 1], definiert durch F (x) := P ((−∞, x] ∩ M ) für alle x ∈ M , die Verteilungsfunktion von P . Die Verteilungsfunktion von X ist die Verteilungsfunktion der zugehörigen Wahrscheinlichkeitsverteilung. Für die Verteilungsfunktion F einer Wahrscheinlichkeitsverteilung auf einem Intervall I mit (a, b) ⊆ I ⊆ [a, b] (a ∈ {−∞} ∪ R, b ∈ R ∪ {∞}) gilt: • lim F (x) = 0 x→a • F ist monoton nichtfallend. • lim F (x) = 1 x→b • F ist stetig ”von rechts”, d. h., F stimmt in jedem Punkt des Definitionsbereiches mit seinem rechtsseitigen Grenzwert überein. 30 • Ist P stetig und besitzt P eine stetige Dichtefunktion f , so gilt F 0 = f . Eine reellwertige Funktion f (x) einer reellen Variablen x heißt ein Klein-O von x für x → 0, i. Z. f (x) = o(x) für x → 0, falls f (x) =0 x→0 x lim gilt. Dafür hat sich die Sprechweise ”f (x) strebt für x → 0 mit höherer als erster Ordnung gegen 0” eingebürgert. Beispiel x2 = o(x) für x → 0, da lim (x2 /x) = lim x = 0. x→0 x→0 2 Beispiel 1 − cos x = o(x) für x → 0, da lim ((1 − cos x)/x) = x→0 = lim (sin x/1) = 0. x→0 2 Beispiel Bezeichne X die Lebensdauer eines Atoms A eines radioaktiven Elements R und F die Verteilungsfunktion von X. Dann ist 1 − F (x) = 1 − P [X ≤ x] = P [X > x] die Wahrscheinlichkeit dafür, dass A in einem Zeitintervall der Länge x nicht zerfällt. Seien nun x0 , h ∈ R+ . Wir nehmen an, dass F (h) = λh + o(h) gilt. (λ heißt Zerfallskonstante.) Nun ist 1 − F (x0 + h) 1 − F (x0 ) die Wahrscheinlichkeit, dass A in [0, x0 + h] nicht zerfällt unter der Bedingung, dass A in [0, x0 ] nicht zerfällt. Wir nehmen an, dass diese bedingte Wahrscheinlichkeit gleich der Wahrscheinlichkeit 1 − F (h), dass A in [0, h] nicht zerfällt, ist. Somit gilt 1 − F (x0 + h) = (1 − F (x0 ))(1 − F (h)) und daher F (x0 + h) − F (x0 ) o(h) = (λ + )(1 − F (x0 )). h h Der Grenzübergang h → 0 liefert F 0 (x0 ) = λ(1 − F (x0 )) und daher F 0 (x) = λ(1 − F (x)) für alle x ∈ R+ . Somit folgt (1 − F (x))0 = −λ(1 − F (x)), also 31 1 − F (x) = (1 − F (0)) exp(−λx) = exp(−λx) für alle x ∈ R+ . Es ist daher F (x) = 1 − exp(−λx) und F 0 (x) = λ exp(−λx) für alle x ∈ R+ . Also gilt X ∼ Exλ . Für die Halbwertszeit b von R ergibt sich wegen F (b) = 1/2 der Wert b = (ln 2)/λ. Sei a ∈ R+ . Bezeichne Y die Anzahl jener der insgesamt n Atome von R, die in einem Zeitintervall der Länge a zerfallen. Dann gilt Y ∼ Bn,1−exp(−λa) . Falls λa ”sehr klein” ist, gilt Bn,1−exp(−λa) ≈ Bn,λa ≈ Pnλa . Daher ist die Wahrscheinlichkeit, dass Y = k ist, für ”sehr kleines” λa näherungsweise gleich (nλa)k exp(−nλa) . k! 2 2.9 Zentraler Grenzverteilungssatz Identisch verteilte Zufallsvariable sind Zufallsvariable, welche dieselbe Verteilung besitzen. Zentraler Grenzverteilungssatz Seien X1 , X2 , X3 , . . . unabhängige, identisch verteilte Zufallsvariable mit dem Mittel m und der Varianz σ 2 > 0. Dann ist X̄n für ”großes” n ungefähr normalverteilt; genauer gilt √ n(X̄n − m) 1 lim P [ ≤ a] = √ n→∞ σ 2π Za exp(− x2 )dx 2 −∞ für alle a ∈ R. Bemerkung Wegen E X̄n = m und V X̄n = σ 2 /n ist √ n(X̄n − m) σ die zu X̄n gehörende normierte Zufallsvariable. Im Fall, dass die Zufallsvariablen X1 , X2 , X3 , . . . nach Ap verteilt sind, ergibt sich folgender Satz von Moivre Für jedes n ∈ N sei Yn eine nach Bn,p (0 < p < 1) verteilte Zufallsvariable. Dann ist Yn für ”großes” n ungefähr normalverteilt; 32 genauer gilt 1 Yn − np ≤ a] = √ lim P [ p n→∞ 2π np(1 − p) Za exp(− x2 )dx 2 −∞ für alle a ∈ R. Bemerkung Wegen EYn = np und V Yn = np(1 − p) ist Y − np p n np(1 − p) die zu Yn gehörende normierte Zufallsvariable. 2.10 Schätzfunktionen Sei X eine eindimensionale, nach Pθ1 ,θ2 mit unbekannten Parametern θ1 , θ2 verteilte Zufallsvariable. Der entsprechende Versuch werde n-mal durchgeführt. Seien X1 , . . . , Xn die n Realisierungen von X im Verlauf dieser Versuchsdurchführungen. X1 , . . . , Xn seien also unabhängig und nach Pθ1 ,θ2 verteilt. Allgemein verstehen wir im Folgenden unter (unabhängigen) Realisierungen einer Zufallsvariablen X (unabhängige) Zufallsvariable, welche dieselbe Verteilung wie X besitzen. Sei weiters f eine stückweise stetige Funktion von Rn nach R. Dann heißt f (X1 , . . . , Xn ) eine Schätzfunktion für den Parameter θ1 , falls die Werte von f (X1 , . . . , Xn ) ”Näherungswerte” für θ1 sind. f (X1 , . . . , Xn ) heißt eine erwartungstreue Schätzfunktion für θ1 , falls E(f (X1 , . . . , Xn )) = θ1 gilt. Es gilt: Ist X eine eindimensionale Zufallsvariable und n > 1 und sind X1 , . . . , Xn unabhängige Realisierungen von X, so sind X̄n bzw. Sn2 erwartungstreue Schätzfunktionen für das Mittel bzw. die Varianz von X. Bemerkung Zunächst mag es vielleicht verwundern, warum Sn2 und nicht n 1X (Xi − X̄n )2 n i=1 33 eine erwartungstreue Schätzfunktion für V X ist. Wie eine leichte Rechnung ergibt, ist n 1X (Xi − EX)2 n i=1 eine erwartungstreue Schätzfunktion Xi den Wert fürV X. Falls nun alle n P überschätzen > EX , so ist X̄n EX und daher (Xi − X̄n )2 < unterschätzen < i=1 n P (Xi − EX)2 . Das macht (zumindest in den genannten Fällen) plausibel, i=1 warum n 1X E( (Xi − X̄n )2 ) < V X. n i=1 Weiters gilt: Ist (X, Y ) eine zweidimensionale Zufallsvariable, und sind (X1 , Y1 ), . . . , (Xn , Yn ) n > 1 unabhängige Realisierungen von (X, Y ), so ist Kn eine erwartungstreue Schätzfunktion für die Kovarianz von X und Y . Bemerkung Es gilt n 1X E( (Xi − EX)(Yi − EY )) = K(X, Y ). n i=1 Ist (X, Y ) eine zweidimensionale Zufallsvariable und n > 1, und sind (x1 , y1 ), . . . , (xn , yn ) Werte von (X, Y ), die aus n unabhängigen Beobachtungen von (X, Y ) stammen, so heißen n 1X xi x̄ := n i=1 n bzw. 1X ȳ := yi n i=1 das empirische Mittel von X bzw. Y , n s2x := 1 X (xi − x̄)2 n − 1 i=1 n bzw. s2y := 1 X (yi − ȳ)2 n − 1 i=1 die von X bzw. Y , die nichtnegativen Quadratwurzeln empirische 2Varianz sx sx X aus die empirische Standardabweichung von , sy s2y Y n sxy := 1 X (xi − x̄)(yi − ȳ) n − 1 i=1 34 die empirische Kovarianz von X und Y und im Fall sx , sy > 0 sxy sx sy rxy := der empirische Korrelationskoeffizient von X und Y . Die eben definierten Größen lassen sich durch die Summen n X xi , i=1 n X yi , i=1 n X x2i , i=1 n X yi2 und i=1 n X xi y i i=1 wie folgt ausdrücken: • x̄ = (1/n) n P xi i=1 • ȳ = (1/n) n P yi i=1 • s2x = (1/(n(n − 1)))(n n P x2i − ( n P yi2 − ( n P n P xi yi − ( i=1 • rxy = (n n P xi yi −( i=1 n P i=1 yi )2 ) i=1 i=1 • sxy = (1/(n(n − 1)))(n xi )2 ) i=1 i=1 • s2y = (1/(n(n − 1)))(n n P xi )( n P n P xi )( i=1 n P yi )) i=1 r n n n n P P P P yi ))/ (n x2i − ( xi )2 )(n yi2 − ( yi )2 ) i=1 i=1 i=1 i=1 i=1 Diese Formeln sind u. a. dann vorteilhaft, wenn die Anzahl der Beobachtungen von (X, Y ) nachträglich vergrößert wird, da in einem solchen Fall auf die bereits berechneten Summen aufgebaut werden kann. 2.11 Tests Sei X eine eindimensionale, nach Pθ1 ,θ2 mit unbekannten Parametern θ1 ∈ Θ1 und θ2 ∈ Θ2 verteilte Zufallsvariable, seien X1 , . . . , Xn n > 1 unabhängige Realisierungen von X, und sei Θ10 eine feste Teilmenge von Θ1 . Ein Test für die ”Nullhypothese” H0 : θ1 ∈ Θ10 ist eine Vorschrift, die auf Grund der 35 Werte, die X1 , . . . , Xn annehmen, entscheidet, ob H0 angenommen oder verworfen wird. Die Verwerfung einer richtigen Nullhypothese wird als Fehler erster Art bezeichnet, die Annahme einer falschen Nullhypothese als Fehler zweiter Art. Die Wahrscheinlichkeit der Annahme einer richtigen Nullhypothese heißt die Sicherheit und die Wahrscheinlichkeit der Verwerfung einer falschen Nullhypothese die Schärfe des Tests. Im Folgenden bezeichne für 0 < p < 1 Np , tn−1,p bzw. χ2n−1,p das p-Fraktile von N (0, 1), tn−1 bzw. χ2n−1 , d. h. jene reelle Zahl a, sodass die Wahrscheinlichkeit, dass eine entsprechend verteilte Zufallsvariable einen Wert ≤ a annimmt, gleich p ist. Einseitiger bzw. zweiseitiger Gaußtest Sind X1 , . . . , Xn n > 1 unabhängige Realisierungen einer nach N (m, σ 2 ) verteilten Zufallsvariable und ist m0 ∈ R, 0 < α < 1, m unbekannt und σ 2 bekannt, so ist das Verfahren, bei dem die Nullhypothese H0 : m ≤ m0 bzw. H0 : m = m0 bzw. H0 : m ≥ m0 genau dann angenommen wird, wenn σ X̄n ≤ m0 + √ N1−α bzw. n σ X̄n ≥ m0 − √ N1−α n σ |X̄n − m0 | ≤ √ N1−α/2 n bzw. gilt, ein Test für H0 , dessen Sicherheit mindestens bzw. genau bzw. mindestens 1 − α beträgt. Dieser Test beruht auf der Tatsache, dass (X̄n − √ m) n/σ ∼ N (0, 1). Einseitiger bzw. zweiseitiger t-Test Sind X1 , . . . , Xn n > 1 unabhängige Realisierungen einer nach N (m, σ 2 ) verteilten Zufallsvariable, ist m0 ∈ R und 0 < α < 1 und sind m und σ 2 unbekannt, so ist das Verfahren, bei dem die Nullhypothese H0 : m ≤ m0 bzw. H0 : m = m0 bzw. H0 : m ≥ m0 genau dann angenommen wird, wenn Sn X̄n ≤ m0 + √ tn−1,1−α bzw. n Sn X̄n ≥ m0 − √ tn−1,1−α n Sn |X̄n − m0 | ≤ √ tn−1,1−α/2 n bzw. gilt, ein Test für H0 , dessen Sicherheit mindestens bzw. genau bzw. mindestens 1 − α beträgt. Dieser Test beruht auf der Tatsache, dass (X̄n − √ m) n/Sn ∼ tn−1 . Test für die Varianz von N (m, σ 2 ) Sind X1 , . . . , Xn n > 1 unabhängige Realisierungen einer nach N (m, σ 2 ) verteilten Zufallsvariable, ist 0 < α < 1 36 und sind m und σ 2 unbekannt, so ist das Verfahren, bei dem die Nullhypothese H0 : σ ≤ σ0 bzw. H0 : σ = σ0 bzw. H0 : σ ≥ σ0 genau dann angenommen wird, wenn σ02 2 σ02 2 σ02 2 2 ≤ χ bzw. χ ≤ Sn ≤ χ bzw. n − 1 n−1,1−α n − 1 n−1,α/2 n − 1 n−1,1−α/2 σ02 2 Sn2 ≥ χ n − 1 n−1,α Sn2 gilt, ein Test für H0 , dessen Sicherheit mindestens bzw. genau bzw. mindestens 1−α beträgt. Dieser Test beruht auf der Tatsache, dass (n−1)Sn2 /σ 2 ∼ χ2n−1 . Chiquadrattest Sei (M, E, P ) ein Wahrscheinlichkeitsraum und A1 , . . . . . . , An eine Zerlegung von M in n paarweise disjunkte Elemente von E, wobei P (A1 ), . . . , P (An ) > 0 gelten möge. Der dem Wahrscheinlichkeitsraum (M, E, P ) entsprechende Versuch werde k-mal durchgeführt. Für jedes i = 1, . . . , n bezeichne ak (Ai ) die absolute Häufigkeit des Eintritts von Ai im Verlauf der k Versuchsdurchführungen. Dann ist das Verfahren, bei dem die Nullhypothese H0 : ”Die Wahrscheinlichkeitsverteilung P liegt vor” genau dann angenommen wird, wenn n X (ak (Ai ) − kP (Ai ))2 i=1 kP (Ai ) ≤ χ2n−1,1−α gilt, ein Test für H0 , dessen Sicherheit ungefähr 1 − α beträgt. Bemerkungen • Falls die zu testende Wahrscheinlichkeitsverteilung von m unbekannten (eindimensionalen) Parametern abhängt, so muss χ2n−1 durch χ2n−m−1 , und es müssen die m Parameter durch geeignete Schätzwerte ersetzt werden. (Als Schätzwerte für die Parameter einer Normalverteilung wird dabei üblicherweise das empirische Mittel und die empirische Varianz und als Schätzwert für den Parameter einer Poissonverteilung das empirische Mittel genommen.) • Um eine entsprechende Genauigkeit zu gewährleisten, sollte kP (Ai ) ≥ 5 für i = 1, . . . , n gelten. Beispiel 30-maliges Werfen eines Würfels ergab der Reihe nach folgende absolute Häufigkeiten für die einzelnen Augenzahlen 1,. . . ,6: 5, 7, 3, 6, 5 bzw. 37 4. Wir betrachten den Wahrscheinlichkeitsraum (M, E, P ) = ({1, . . . , 6}, 2{1,...,6} , D{1,...,6} ) und definieren Ai = {i} für i = 1, . . . , 6. Dann gilt kP (Ai ) = 5 für i = 1, . . . , 6. Da 6 X (a30 (Ai ) − 30 · (1/6))2 i=1 30 · (1/6) = 2 < 15.09 ≈ χ25,0.99 gilt, ist mit einer Sicherheit von ungefähr 99% anzunehmen, dass der Würfel in Ordnung ist. 2 2.12 Überprüfung auf Normalverteilung Ist n > 1 und sind X1 , . . . , Xn unabhängig ∼ N (m, σ 2 ), so ist r n X π |Xi − X̄n | 2n(n − 1) i=1 eine erwartungstreue Schätzfunktion für σ. Da n 1 X (Xi − X̄n )2 n − 1 i=1 eine erwartungstreue Schätzfunktion für σ 2 ist, folgt, dass für die Werte x1 , . . . , xn von X1 , . . . , Xn n n X X π( |xi − x̄n |)2 ≈ 2n (xi − x̄n )2 i=1 i=1 gilt. Beispiel Fünfmalige Messung des Gewichts eines Natriumfluoridkristalls ergab folgende Werte in g: 0.73829, 0.73821, 0.73827, 0.73828 und 0.73825. Wir bezeichnen die fünf Messwerte der Reihe nach mit x1 , . . . , x5 . Da π( 5 X |xi − x̄5 |)2 = 144π · 10−10 ≈ 4 · 10−9 = 10 i=1 5 X (xi − x̄5 )2 i=1 ist, ergibt sich kein Widerspruch zu der Annahme, dass die Messwerte normalverteilt sind. 2 38 2.13 Simulation von Zufallsvariablen In diesem Abschnitt soll die Frage behandelt werden, wie mit Hilfe von (in Computern meist eingebauten) Zufallszahlengeneratoren (Zufallszahlen sind in (0, 1) stetig gleichverteilte Zufallsvariable) eindimensionale Zufallsvariable mit vorgegebener Wahrscheinlichkeitsverteilung simuliert werden können. Ist n ∈ N, sind a1 , . . . , an ∈ R paarweise verschieden, p1 , . . . , pn ∈ R+ , gilt p1 + . . . + pn = 1 und ist X eine Zufallszahl und Z eine Zufallsvariable, welche für i = 1, . . . , n den Wert ai genau dann annimmt, wenn der Wert von X im Intervall [p1 + . . . + pi−1 , p1 + . . . + pi ) liegt, so nimmt die Zufallsvariable Z für i = 1, . . . , n den Wert ai mit der Wahrscheinlichkeit pi an. Ist P eine stetige Wahrscheinlichkeitsverteilung auf (R, B(R)) mit der Dichtefunktion f , wobei f außerhalb des in R enthaltenen Intervalls I verschwinden möge und die zugehörige Verteilungsfunktion F streng monoton steigend auf I sei, und ist X eine Zufallszahl, so besitzt die Zufallsvariable F −1 (X) die Wahrscheinlichkeitsverteilung P . Bei der Simulation standardnormalverteilter Zufallsvariabler tritt allerdings die Schwierigkeit auf, dass der Funktionsterm der Umkehrfunktion der entsprechenden Verteilungsfunktion nicht explizit angebbar ist. In diesem Fall kann die sogenannte Box-Müller-Methode angewendet werden: Sind √ X und Y unabhängige Zufallszahlen, so gilt −2 ln X sin(2πY ) ∼ N (0, 1). Kontrollfragen 1. Wann gilt für zwei Ereignisse A und B P (A ∪ B) = P (A) + P (B)? 2. Wie lauten die wichtigsten diskreten Wahrscheinlichkeitsverteilungen? 3. Wie lauten die wichtigsten stetigen Wahrscheinlichkeitsverteilungen? 4. Wann gilt für zwei Ereignisse A und B P (A ∩ B) = P (A)P (B)? 5. Wie lauten Mittel und Varianz der wichtigsten Wahrscheinlichkeitsverteilungen? 6. Wie lautet der Verschiebungssatz für die Varianz bzw. Kovarianz? 7. Folgt aus der Unabhängigkeit zweier Zufallsvariabler deren Unkorreliertheit oder umgekehrt? 8. Was besagt der Zentrale Grenzverteilungssatz? 9. Wie lautet eine erwartungstreue Schätzfunktion für die Varianz? 10. Wie lautet der Chiquadrattest? 11. Wie können Daten auf Normalverteilung überprüft werden? 39 12. Wie lautet die Box-Müller-Methode zur Simulation normalverteilter Zufallsvariabler? 40 Kapitel 3 Gewöhnliche Differentialgleichungen Motivation Für gewisse Typen gewöhnlicher Differentialgleichungen werden Lösungsverfahren angegeben. Oft werden diese Differentialgleichungen auf lineare Differentialgleichungen oder solche Differentialgleichungen, die sich durch Trennung der Variablen lösen lassen, zurückgeführt. 3.1 Homogene und inhomogene Differentialgleichungen Eine homogene Differentialgleichung ist eine Differentialgleichung von der Form dy y = f ( ). dx x Sie wird durch die Substitution y u := , x die mit y = xu gleichbedeutend ist (u wird als Funktion von x aufgefasst), in die Differentialgleichung du = f (u) dx übergeführt, welche mit Hilfe der Methode der Trennung der Variablen gelöst werden kann. u+x 41 Insbesondere sind Differentialgleichungen von der Form dy Ax + By = f( ) dx Cx + Dy homogen, da Ax + By A + B(y/x) = Cx + Dy C + D(y/x) gilt. Eine inhomogene Differentialgleichung ist eine Differentialgleichung von der Form dy Ax + By + C = f( ). dx Dx + Ey + F Fall 1: AE − BD 6= 0. Bezeichnet (x̄, ȳ) die eindeutig bestimmte Lösung von Ax + By = −C Dx + Ey = −F und wird t := x − x̄ und z := y − ȳ gesetzt, so gilt dz dz dy dx dy Ax + By + C = · · = = f( )= dt dy dx dt dx Dx + Ey + F At + Bz A(t + x̄) + B(z + ȳ) + C ) = f( ), = f( D(t + x̄) + E(z + ȳ) + F Dt + Ez also At + Bz dz = f( ). dt Dt + Ez Das ist aber eine homogene Differentialgleichung. Fall 2: AE − BD = 0. In diesem Fall kann die Differentialgleichung dy Ax + By + C = f( ) dx Dx + Ey + F mit Hilfe der Methode der Trennung der Variablen gelöst werden. Fall 2a: A 6= 0. In diesem Fall ist E = BD/A. Wird daher Ax + By =: z gesetzt, so gilt Dx + Ey = 42 Dz A und somit dz z+C = A + Bf ( ). dx Dz/A + F Fall 2b: D 6= 0. In diesem Fall ist B = AE/D. Wird daher Dx + Ey =: z gesetzt, so gilt Ax + By = Az D und somit dz Az/D + C = D + Ef ( ). dx z+F Fall 2c: A = D = 0. In diesem Fall gilt By + C dy = f( ). dx Ey + F Beispiel Um die Differentialgleichung dy x+y+1 = . dx x zu lösen, wird das lineare Gleichungssystem x + y = −1 x = 0 gelöst, was (x̄, ȳ) = (0, −1) ergibt, und t := x und z := y + 1 gesetzt, was auf die homogene Differentialgleichung t+z z dz = =1+ dt t t führt. Diese wird durch die Substitution u := z/t in die Differentialgleichung u+t du =1+u dt übergeführt, welche die Lösung u = ln |t| + a mit a ∈ R besitzt. Die Lösung der ursprünglichen Differentialgleichung lautet somit y = x ln |x| + ax − 1 mit a ∈ R. 2 43 3.2 Differentialgleichungen erster Ordnung, die sich auf lineare Differentialgleichungen zurückführen lassen Die Bernoullische Differentialgleichung y 0 + a(x)y + b(x)y n = 0 mit n ∈ R \ {1} wird durch die Transformation y = z 1/(1−n) in eine lineare Differentialgleichung übergeführt, da 1 z n/(1−n) z 0 + a(x)z 1/(1−n) + b(x)z n/(1−n) = 1−n 1 = z n/(1−n) (z 0 + (1 − n)a(x)z + (1 − n)b(x)). 1−n y 0 + a(x)y + b(x)y n = Eine Bernoullische Differentialgleichung besitzt die konstante Funktion mit dem Wert 0 als Lösung. Beispiel Um die Differentialgleichung y 0 + y − y 2 = 0 zu lösen, wird y = 1/z substituiert, was − z0 1 1 + − 2 =0 2 z z z ergibt, also die lineare Differentialgleichung z 0 = z − 1. Diese hat die Lösung z = aex + 1 mit a ∈ R. Also ergibt sich als Lösung der ursprünglichen Differentialgleichung 1 y= x ae + 1 mit a ∈ R. 2 Die Riccatische Differentialgleichung y 0 + a(x)y + b(x)y 2 = c(x) wird, falls eine partikuläre Lösung y1 bekannt ist, durch die Transformation y = z + y1 in eine Bernoullische Differentialgleichung übergeführt, da y 0 + a(x)y + b(x)y 2 − c(x) = = z 0 + y10 + a(x)z + a(x)y1 + b(x)z 2 + 2b(x)zy1 + b(x)y12 − c(x) = = z 0 + (a(x) + 2b(x)y1 )z + b(x)z 2 . 44 3.3 Clairotsche Differentialgleichungen Einer Clairotschen Differentialgleichung ist eine Differentialgleichung der Form y = xy 0 + f (y 0 ). Differenzieren ergibt y 0 = y 0 + xy 00 + f 0 (y 0 )y 00 , also y 00 (x + f 0 (y 0 )) = 0. • Aus y 00 = 0 folgt y 0 = a mit a ∈ R und somit y = xy 0 +f (y 0 ) = ax+f (a) mit a ∈ R. Das ist eine Schar von Lösungen, deren Graphen Gerade sind. • Aus x + f 0 (y 0 ) = 0 folgt x = −f 0 (y 0 ) und damit y = xy 0 + f (y 0 ) = −y 0 f 0 (y 0 ) + f (y 0 ). Durch x = −f 0 (y 0 ), y = −y 0 f 0 (y 0 ) + f (y 0 ) bzw. x = −f 0 (p), y = −pf 0 (p) + f (p), wenn y 0 = p gesetzt wird, ist also ein funktionaler Zusammenhang zwischen x und y in Form einer sogenannten ”Parameterdarstellung” gegeben (y 0 bzw. p ist der Parameter). Wird der Parameter aus einer der beiden Gleichungen ausgedrückt und dieser Ausdruck in die andere eingesetzt, so ergibt sich ein direkter funktionaler Zusammenhang zwischen x und y. Die sich dabei ergebende Funktion ist die sogenannte ”Einhüllende” oder ”Envelope” der vorher genannten Geradenschar, d. h., die vorher genannten Geraden sind genau die Tangenten an die zuletzt genannte Funktion. Beispiel Differenzieren von y = xy 0 + (y 0 )2 ergibt y 0 = y 0 + xy 00 + 2y 0 y 00 bzw. y 00 (x + 2y 0 ) = 0. y 00 = 0 impliziert y 0 = a mit a ∈ R und somit y = xy 0 + (y 0 )2 = ax + a2 mit a ∈ R. x + 2y 0 = 0 impliziert x = −2y 0 und y = xy 0 + (y 0 )2 = −(y 0 )2 , also x = −2p und y = −p2 . Elimination des Parameters aus der ersten Gleichung und Einsetzen desselben in die zweite Gleichung ergibt y = −x2 /4. Die Lösungen lauten also y=− x2 und y = ax + a2 mit a ∈ R. 4 45 2 3.4 Differentialgleichungen zweiter Ordnung, die sich auf Differentialgleichungen erster Ordnung zurückführen lassen Differentialgleichungen der Form y 00 = f (x) R können durch zweimaliges Integrieren gelöst werden: y 0 = f (x)dx + a = g(x) + a mit a ∈ R und daher Z Z y = (g(x) + a)dx + b = g(x)dx + ax + b = h(x) + ax + b mit a, b ∈ R. Beispiel Aus y 00 = 6x folgt durch Integration y 0 = 3x2 + a mit a ∈ R und durch nochmalige Integration schließlich y = x3 + ax + b mit a, b ∈ R. 2 Die Differentialgleichung f (x, y 0 , y 00 ) = 0 wird durch die Substitution y 0 = z in die Differentialgleichung erster Ordnung f (x, z, z 0 ) = 0 übergeführt. Bei einer Differentialgleichung der Form f (y, y 0 , y 00 ) = 0 führt der Ansatz y 0 = p(y) auf y 00 = dy 0 dy 0 dy dp = · = p dx dy dx dy und somit auf die Differentialgleichung erster Ordnung f (y, p, p dp ) = 0. dy Beispiel Um die Differentialgleichung yy 00 = (y 0 )2 zu lösen, wird y 0 = p(y) gesetzt, was dp yp = p2 dy 46 ergibt. Die Methode der Trennung der Variablen liefert p = ay mit a ∈ R. Die ursprüngliche Differentialgleichung besitzt daher die Lösungen y = b exp(ax) mit a, b ∈ R. 2 Kontrollfragen 1. Was ist eine homogene Differentialgleichung und wie kann sie gelöst werden? 2. Was ist eine inhomogene Differentialgleichung und wie kann sie gelöst werden? 3. Was ist eine Bernoullische Differentialgleichung und wie kann sie gelöst werden? 4. Was ist eine Riccatische Differentialgleichung und wie kann sie gelöst werden? 5. Was ist eine Clairotsche Differentialgleichung und wie kann sie gelöst werden? 6. Wie können Differentialgleichungen der Form f (y, y 0 , y 00 ) = 0 gelöst werden? 47 48 Kapitel 4 Fourieranalyse Motivation Unter gewissen Voraussetzungen können periodische Funktionen als ”unendliche Linearkombinationen” von Sinus- und Cosinustermen in Form sogenannter Fourierreihen geschrieben werden. Die diskrete Fouriertransformation (DFT) transformiert endliche komplexe Zahlenfolgen in endliche komplexe Zahlenfolgen. Unter Benützung der Eigenschaften der DFT wurden schnelle Algorithmen zur Multiplikation von Polynomen hohen Grades entwickelt (Fast Fourier Transform (FFT)). Diese Anwendung wird hier nicht besprochen. Hingegen wird gezeigt, wie das trigonometrische Interpolationsproblem mit Hilfe der DFT gelöst werden kann. Abschließend werden die Fouriertransformation, einige ihrer Eigenschaften sowie die inverse Fouriertransformation besprochen. 4.1 Fourierreihen • Eine Funktion f : R → R heißt T -periodisch (T ∈ R+ ), falls f (t + T ) = f (t) für alle t ∈ R gilt. • Eine Funktion f : [a, b] → R heißt stückweise stetig, falls es ein n ∈ N und a0 , . . . , an ∈ [a, b] mit a = a0 < . . . < an = b gibt, sodass f |(ai−1 , ai ) für jedes i = 1, . . . , n stetig ist. In diesem Abschnitt sei f : R → R eine T -periodische Funktion (T ∈ R+ ), deren Einschränkung auf [−T /2, T /2] stückweise stetig sei, und sei ω := 49 2π/T . Dann heißen die Zahlen ZT /2 2 an := T f (t) cos(nωt)dt für n ∈ N0 , −T /2 ZT /2 2 bn := T f (t) sin(nωt)dt für n ∈ N und −T /2 ZT /2 1 ck := T f (t) exp(−ikωt)dt für k ∈ Z −T /2 die Fourierkoeffizienten von f und die unendlichen Reihen ∞ a0 X f˜(t) := + (an cos(nωt) + bn sin(nωt)) bzw. 2 n=1 f˜(t) := ∞ X n X ck exp(ikωt) := lim n→∞ k=−∞ ck exp(ikωt) k=−n die Fourierreihen von f . Wegen der Eulerschen Formeln exp(it) = cos t + i sin t, exp(−it) = cos t − i sin t, exp(it) + exp(−it) = 2 cos t und exp(it) − exp(−it) = 2i sin t gilt a0 = 2c0 , an = cn + c−n für n ∈ N, bn = (cn − c−n )i für n ∈ N, a0 c0 = , 2 1 (ak − bk i) für k ∈ N und ck = 2 1 (ak + bk i) für k ∈ N. c−k = 2 Eine Funktion f : [a, b] → R heißt stückweise stetig differenzierbar, falls es ein n ∈ N und a0 , . . . , an ∈ [a, b] mit a = a0 < . . . < an = b 50 gibt, sodass f |(ai−1 , ai ) für jedes i = 1, . . . , n differenzierbar und die erste Ableitung dieser Funktion stetig ist. Es gilt: Ist f |[−T /2, T /2] stückweise stetig differenzierbar, existieren in jedem Punkt t ∈ R die einseitigen Grenzwerte f (t− ) und f (t+ ) von f und existiert in jedem Punkt t ∈ R der linksseitige Grenzwert f (x) − f (t− ) x→t x−t lim und der rechtsseitige Grenzwert lim x→t f (x) − f (t+ ) , x−t so konvergiert die Fourierreihe von f in jedem Punkt t ∈ R, und zwar gegen f (t), wenn f in t stetig ist, bzw. gegen 1 (f (t− ) + f (t+ )) 2 sonst. Bei der Berechnung der bei der Ermittlung der Fourierkoeffizienten auftretenden Integrale sind die folgenden Überlegungen oft nützlich: Sei g : [a, b] → R, c := (a + b)/2 und d := (b − a)/2. Die Funktion g heißt • gerade bzgl. c, falls g(c − t) = g(c + t) für alle t ∈ (0, d] gilt. • ungerade bzgl. c, falls g(c − t) = −g(c + t) für alle t ∈ [0, d] gilt. • gerade, falls g gerade bzgl. 0 ist. • ungerade, falls g ungerade bzgl. 0 ist. Ist g stückweise stetig und gerade bzgl. c, so gilt Zb Zc g(t)dt = 2 a Zb g(t)dt = 2 a g(t)dt. c Ist g stückweise stetig und ungerade bzgl. c, so gilt Zb g(t)dt = 0. a 51 Das Produkt zweier bzgl. c gerader bzw. zweier bzgl. c ungerader Funktionen ist gerade bzgl. c. Das Produkt einer bzgl. c geraden und einer bzgl. c ungeraden Funktion ist ungerade bzgl. c. Analoges gilt für Funktionen g : R → R. Weiters gilt ZT /2 TZ /2+a f (t)dt = −T /2 f (t)dt −T /2+a für alle a ∈ R. Ist f gerade, so ist bn = 0 für alle n ∈ N, da die Sinusfunktion ungerade ist, f˜(t) also eine reine Cosinusreihe. Ist f ungerade, so ist an = 0 für alle n ∈ N0 , da die Cosinusfunktion gerade ist, f˜(t) also eine reine Sinusreihe. Beispiel Bezeichnet f die 2π-periodische Funktion mit f (t) = −1 für t ∈ (−π, 0) und f (t) = 1 für t ∈ (0, π) (Rechteckschwingung) und wird f (−π) = f (0) = f (π) := 0 definiert, so ist f ungerade, daher verschwinden alle an , für n ∈ N gilt Zπ Zπ 2 2 1 cos(nt)|π0 = f (t) sin(nt)dt = sin(nt)dt = − bn = π π nπ −π 0 2 0, falls n gerade = − ((−1)n − 1) = 4/(nπ), sonst nπ und somit folgt 4 1 1 f˜(t) = (sin t + sin(3t) + sin(5t) + . . .). π 3 5 2 4.2 Diskrete Fouriertransformation Sei N ∈ N und w := exp(2πi/N ). Dann ist die Fouriermatrix FN definiert durch FN := (wjk )j,k=0,...,N −1 . Satz FN FN = N E, wobei E die N -dimensionale Einheitsmatrix bezeichnet. Beweis Für alle j, l ∈ {0, . . . , N − 1} gilt: N −1 N −1 X X N, falls j = l jk −kl (j−l)k w w = w = (j−l)N j−l )/(1 − w ) = 0 sonst (1 − w k=0 k=0 52 2 Die Abbildung 1 FN ~y N von CN auf CN heißt diskrete Fouriertransformation DFT und ihre Umkehrabbildung ~c 7→ FN ~c ~y 7→ von CN auf CN inverse diskrete Fouriertransformation IDFT. Beispiel Wegen N −1 X w −jk = k=0 N für j = 0 −jN −j (1 − w )/(1 − w ) = 0 für j = 1, . . . , N − 1 gilt DFT((1, . . . , 1)T ) = (1, 0, 0, 0, . . . , 0)T , und wegen N −1 X wjk δk0 = 1 für j = 0, . . . , N − 1 k=0 gilt IDFT((1, 0, 0, 0, . . . , 0)T ) = (1, . . . , 1)T . (δjk := 1, falls j = k, und δjk := 0 sonst.) 2 Beispiel Sei n ∈ N, N = 2n + 1, tj := 2jπ/N für j = 0, . . . , 2n und y0 , . . . , y2n ∈ C. Gesucht sind c−n , . . . , cn ∈ C, sodass n X ck exp(iktj ) = yj k=−n für j = 0, . . . , 2n. Es handelt sich hier um das sogenannte trigonometrische Interpolationsproblem. Nun ist wjn yj = wjn n X k=−n wjk ck = wjn 2n X k=0 wj(k−n) ck−n = 2n X wjk ck−n k=0 für j = 0, . . . , 2n, also (w0·n y0 , . . . , w2n·n y2n )T = IDFT((c−n , . . . , cn )T ). Daher ist (c−n , . . . , cn )T = DFT((w0·n y0 , . . . , w2n·n y2n )T ), 53 also cj−n 2n 2n 1 X −jk kn 1 X −(j−n)k = w w yk = w yk N k=0 N k=0 für j = 0, . . . , 2n. Somit gilt 2n 1 X −jk w yk cj = N k=0 für j = −n, . . . , n. Also ist 2n 1 X −jk w yk cj = N k=0 für j = 0, . . . , n und cj−2n−1 2n 2n 1 X −jk 1 X −(j−2n−1)k w yk = w yk = N k=0 N k=0 für j = n + 1, . . . , 2n. Daher ist (c0 , . . . , cn , c−n , . . . , c−1 )T = DFT((y0 , . . . , y2n )T ). 2 4.3 Fouriertransformation Sei f : R → C. f heißt absolut integrierbar, falls f auf jedem endlichen Intervall stückweise stetig ist und Z∞ |f (t)|dt −∞ endlich ist. Der Cauchy-Hauptwert Z∞ f (t)dt −∞ 54 von f ist der Grenzwert Za lim f (t)dt, a→∞ −a falls dieser existiert und endlich ist. In diesem Abschnitt wollen wir unter einem Integral über (−∞, ∞) stets den Cauchy-Hauptwert der entsprechenden Funktion verstehen. Die Fouriertransformierte F (ω) = F{f (t)} von f ist die durch Z∞ F (ω) := exp(−iωt)f (t)dt −∞ für alle ω ∈ R definierte Funktion, falls diese existiert. Die inverse Fouriertransformierte f (t) = F −1 {F (ω)} einer Funktion F : R → C ist die durch Z∞ 1 f (t) := exp(iωt)F (ω)dω 2π −∞ für alle t ∈ R definierte Funktion, falls diese existiert. Es gilt: Ist f absolut integrierbar und in jedem endlichen Intervall stückweise stetig differenzierbar und existieren in jedem Punkt die rechts- und linksseitigen Grenzwerte von f und f 0 , so existiert die Fouriertransformierte F (ω) von f (t) und die inverse Fouriertransformierte g(t) von F (ω), und es gilt g(t) = (1/2)(f (t− ) + f (t+ )) für alle t ∈ R. Beispiel Wegen Z∞ ( 2 2 exp(−x )dx) Z∞ = ( −∞ 2 Z∞ exp(−x )dx)( −∞ exp(−y 2 )dy) = −∞ ZZ exp(−x2 − y 2 )dxdy = = R2 Z∞ = ( Z2π r exp(−r )dr)( dϕ) = −π exp(−r2 )|r=∞ r=0 = π 2 0 0 (siehe die späteren Ausführungen über Bereichsintegrale) gilt Z∞ exp(−x2 )dx = −∞ 55 √ π. Sei nun f (t) := exp(−t2 ) für alle t ∈ R, F (ω) := F{f (t)} und g(t) := F −1 {F (ω)}. Es ist leicht zu sehen, dass f absolut integrierbar ist, und es gilt Z∞ F (ω) = exp(−iωt) exp(−t2 )dt −∞ für alle ω ∈ R. Da, wie leicht zu sehen ist, der Integrand und die Ableitung des Integranden nach ω stetig sind, kann die Differentiation nach ω mit der Integration nach t vertauscht werden, und es folgt Z∞ i F 0 (ω) = 2 exp(−iωt)(−2t) exp(−t2 )dt = −∞ i = (exp(−iωt) exp(−t2 )|t=∞ t=−∞ + iω 2 Z∞ exp(−iωt) exp(−t2 )dt) = −∞ ω = − F (ω), 2 woraus F (ω) = F (0) exp(−ω 2 /4) = Eine analoge Rechnung ergibt für 1 g(t) = √ 2 π Z∞ √ π exp(−ω 2 /4) für alle ω ∈ R folgt. exp(iωt) exp(−ω 2 /4)dω −∞ i g (t) = − √ π 0 Z∞ ω exp(iωt)(− ) exp(−ω 2 /4)dω = 2 −∞ i = − √ (exp(iωt) exp(−ω 2 /4)|ω=∞ ω=−∞ − it π Z∞ exp(iωt) exp(−ω 2 /4)dω) = −∞ = −2tg(t) und somit g(t) = g(0) exp(−t2 ) für alle t ∈ R. Wegen 1 g(0) = √ 2 π Z∞ 1 exp(−ω /4)dω = √ π 2 −∞ Z∞ exp(−u2 )du = 1 −∞ 2 gilt g(t) = exp(−t2 ) für alle t ∈ R. 56 Abschließend sollen noch einige Eigenschaften der Fouriertransformation angegeben werden. Unter der Faltung f ∗ g zweier Funktionen f, g : R → C verstehen wir die durch Z∞ (f ∗ g)(t) := f (t − τ )g(τ )dτ −∞ für alle t ∈ R definierte Funktion von R nach C, falls das genannte Integral existiert. Ist F{f (t)} = F (ω) und F{g(t)} = G(ω), sind a, b, c ∈ C und ist c 6= 0, so gilt F{af (t) + bg(t)} = aF (ω) + bG(ω), 1 ω F{f (ct)} = F ( ) und |c| c F{(f ∗ g)(t)} = F (ω)G(ω). Kontrollfragen 1. Wann heißt eine Funktion periodisch? 2. Wie lauten die Formeln für Fourierreihen? 3. Wann heißt eine Funktion gerade bzw. ungerade und welche Auswirkungen hat das auf die entsprechenden Fourierreihen? 4. Wie lautet die diskrete Fouriertransformation? 5. Wie lautet die inverse diskrete Fouriertransformation? 6. Wie lautet die Fouriertransformation? 7. Wie lautet die inverse Fouriertransformation? 8. Welche Eigenschaften besitzt die Fouriertransformation? 57 58 Kapitel 5 Partielle Differentialgleichungen Motivation Es werden quasilineare partielle Differentialgleichungen erster Ordnung sowie die wichtigsten in der Physik auftretenden partiellen Differentialgleichungen behandelt, nämlich die Laplacegleichung, die Wellen- oder Schwingungsgleichung und die Diffusions- oder Wärmeleitungsgleichung. Dabei werden folgende Lösungsmethoden besprochen: Charakteristikenmethode, Produktansatz, D’Alembertscher Lösungsansatz sowie Lösung mittels Fouriertransformation. 5.1 Einführung Im Folgenden bezeichne für einen Buchstaben a ~a das n-Tupel (a1 , . . . , an ). Der Wert der partiellen Ableitung fxi (~a) einer n-stelligen reellwertigen Funktion f nach der i-ten Variablen xi (wobei i ∈ {1, . . . , n}) an der Stelle ~a ist der Wert der gewöhnlichen Ableitung der einstelligen reellwertigen Funktion x 7→ f (a1 , . . . , ai−1 , x, ai+1 , . . . , an ) an der Stelle ai (falls diese Ableitung existiert). Jene Funktion, die jedem Punkt des Definitionsbereiches von f , an dem der Wert der partiellen Ableitung von f nach der i-ten Variablen existiert, diesen Wert zuordnet, heißt die partielle Ableitung(sfunktion) von f nach der i-ten Variablen. Ei59 ne n-stellige Funktion f (x1 , . . . , xn ) wird also partiell nach der i-ten Variablen abgeleitet, indem die Variablen x1 , . . . , xi−1 , xi+1 , . . . , xn während des gewöhnlichen Ableitens nach xi als Konstante und danach wieder als Variable aufgefasst werden. Iteration des partiellen Ableitens ergibt partielle Ableitungen höherer Ordnung. Eine partielle Ableitung k-ter Ordnung (k ∈ N) entsteht durch k-maliges partielles Ableiten. Die Kettenregel für mehrstellige Funktionen (welche eine Verallgemeinerung jener für einstellige Funktionen darstellt) lautet wie folgt: Ist h(~x) = f (g1 (~x), . . . , gk (~x)), so folgt hxi (~a) = k X fxj (g1 (~a), . . . , gk (~a)) · (gj )xi (~a). j=1 Eine partielle Differentialgleichung ist eine Gleichung von der Form F (x1 , . . . , xn , u, ux1 , . . . , uxn , ux1 x1 , ux1 x2 , . . . , uxn xn , . . .) = 0 (5.1) (wobei n > 1 ist). (5.1) hat die Ordnung k ∈ N, falls in (5.1) eine partielle Ableitung k-ter Ordnung, aber keine partielle Ableitung höherer Ordnung tatsächlich auftritt. Im Folgenden bezeichne ∆ den sogenannten ”Laplace-Operator”, d. i. der partielle Differentialoperator n X ∂2 . ∂x2i i=1 Die folgende Tabelle enthält einige Typen von partiellen Differentialgleichungen, die von grundlegender Bedeutung in der Physik sind: Differentialgleichung Bezeichnung Bemerkungen ∆u = 0 utt = c2 ∆u ut = c2 ∆u n>1 c ∈ R+ c ∈ R+ Potential- oder Laplace-Gleichung Wellen- oder Schwingungsgleichung Diffusions- oder Wärmeleitungsgleichung 2 Eine Lösung von (5.1) ist eine auf einem geeigneten Bereich B (⊆ Rn ) definierte Funktion u, sodass für alle ~a ∈ B F (a1 , . . . , an , u(~a), ux1 (~a), . . . , uxn (~a), ux1 x1 (~a), ux1 x2 (~a), . . . , uxn xn (~a), . . .) = 0 60 gilt (wobei angenommen wird, dass alle auftretenden partiellen Ableitungen von u auf B existieren). Beispiel Die partielle Differentialgleichung ux = uy für die Funktion u(x, y) besitzt die Lösungen u = f (x + y), wobei f eine willkürliche differenzierbare Funktion von R nach R ist. 2 Die allgemeine Lösung von (5.1) ist eine Lösung von (5.1), welche mindestens eine willkürliche (hinreichend oft (partiell) differenzierbare) Funktion enthält. Eine singuläre Lösung von (5.1) ist eine Lösung von (5.1), welche nicht durch Spezialisierung willkürlicher Funktionen aus einer allgemeinen Lösung von (5.1) erhalten werden kann. 5.2 Quasilineare partielle Differentialgleichungen erster Ordnung Eine quasilineare partielle Differentialgleichung erster Ordnung ist eine Differentialgleichung von der Form n X ai (x1 , . . . , xn , y)yxi = a(x1 , . . . , xn , y). (5.2) i=1 Eine partiell differenzierbare Funktion f (x1 , . . . , xn , y) heißt eine Charakteristik von (5.2), falls f (x1 (t), . . . , xn (t), y(t)) für jede Lösung (x1 (t), . . . , . . . , xn (t), y(t)) des Systems dx1 = a1 (x1 (t), . . . , xn (t), y(t)) dt .. . dxn = an (x1 (t), . . . , xn (t), y(t)) dt dy = a(x1 (t), . . . , xn (t), y(t)) dt gewöhnlicher Differentialgleichungen konstant ist, d. h., falls aus diesem System d f (x1 (t), . . . , xn (t), y(t)) = 0 dt folgt. Wenn f1 (x1 , . . . , xn , y), . . . , fk (x1 , . . . , xn , y) 61 Charakteristiken von (5.2) sind, ist durch F (f1 (x1 , . . . , xn , y(~x)), . . . , fk (x1 , . . . , xn , y(~x))) = 0 bzw. f1 (x1 , . . . , xn , y(~x)) = G(f2 (x1 , . . . , xn , y(~x)), . . . , fk (x1 , . . . , xn , y(~x))) mit willkürlichen partiell differenzierbaren Funktionen F, G eine Lösung von (5.2) gegeben. Ist k = n und keine der Funktionen f1 , . . . , fn eine Funktion der übrigen, so ergibt sich auf diese Weise die allgemeine Lösung von (5.2). Oft können n ”wesentlich verschiedene” Charakteristiken von (5.2) auf folgende Weise gefunden werden: Zuerst wird das System dx1 a1 (x1 (xn ), . . . , xn−1 (xn ), xn , y(xn )) = dxn an (x1 (xn ), . . . , xn−1 (xn ), xn , y(xn )) .. . an−1 (x1 (xn ), . . . , xn−1 (xn ), xn , y(xn )) dxn−1 = dxn an (x1 (xn ), . . . , xn−1 (xn ), xn , y(xn )) dy a(x1 (xn ), . . . , xn−1 (xn ), xn , y(xn )) = dxn an (x1 (xn ), . . . , xn−1 (xn ), xn , y(xn )) gewöhnlicher Differentialgleichungen gelöst. Das ergibt x1 = g1 (xn , C1 , . . . , Cn ) .. . xn−1 = gn−1 (xn , C1 , . . . , Cn ) y = g(xn , C1 , . . . , Cn ) mit beliebigen Konstanten C1 , . . . , Cn . Werden C1 , . . . , Cn durch x1 , . . . , xn , y ausgedrückt: C1 = f1 (x1 , . . . , xn , y) .. . Cn = fn (x1 , . . . , xn , y), so sind f1 , . . . , fn Charakteristiken von (5.2). Die Rolle von xn kann natürlich auch von einer der Variablen x1 , . . . , xn−1 , y eingenommen werden. 62 Beispiel Um die Differentialgleichung (x2 − y 2 − u2 )ux + 2xyuy = 2xu (5.3) zu lösen, betrachten wir zunächst das System x2 − y 2 − u 2 dx = dy 2xy du u = dy y gewöhnlicher Differentialgleichungen. Die zweite Gleichung besitzt die allgemeine Lösung u = C1 y. (5.4) Einsetzen dieses Ausdrucks in die erste Differentialgleichuntg ergibt die homogene Differentialgleichung dx x2 − (1 + C12 )y 2 = , dy 2xy deren Lösung q x = ± C2 y − (1 + C12 )y 2 (5.5) lautet. Werden nun C1 und C2 mit Hilfe von (5.4) und (5.5) durch x, y und u ausgedrückt, so folgt u C1 = y x2 + y 2 + u 2 . C2 = y Somit ist durch u x2 + y 2 + u2 f( , )=0 y y mit einer willkürlichen partiell differenzierbaren zweistelligen Funktion f die allgemeine Lösung von (5.3) gegeben. 2 5.3 Potential- oder Laplace-Gleichung Die partielle Differentialgleichung ∆u = 0 63 (wobei n > 1 ist) heißt Potential- oder Laplace-Gleichung. Ihre Lösungen heißen harmonische Funktionen. Die zweidimensionale Potentialgleichung uxx + uyy = 0 beschreibt die Verteilung eines ebenen elektrostatischen Potentials. Beispiel Um das Problem uxx + uyy = 0 (5.6) u(x, 0) = u(0, y) = u(a, y) = 0 für alle x ∈ [0, a] und y ∈ [0, b] (5.7) u(x, b) = f (x) für alle x ∈ [0, a], (5.8) wobei a, b ∈ R+ sind und f eine nicht identisch verschwindende stetige Funktion von [0, a] nach R mit f (0) = f (a) = 0 ist, zu lösen, machen wir den Ansatz u = F (x)G(y), gehen mit diesem in die Differentialgleichung (5.6), dividieren beide Seiten durch u und trennen die Variablen. Das ergibt G00 (y) F 00 (x) =− . F (x) G(y) Offensichtlich müssen beide Seiten dieser Gleichung gleich einer Konstanten, etwa k, sein. Auf diese Weise ergeben sich die gewöhnlichen Differentialgleichungen F 00 (x) − kF (x) = 0 G00 (y) + kG(y) = 0. Wegen (5.8) und f 6≡ 0 gilt u 6≡ 0 und daher F 6≡ 0 und G 6≡ 0. Also ist wegen (5.7) F (0) = F (a) =√G(0) = 0. Wäre√ nun k ∈ R+ , so wäre F (x) von der Form F (x) = A exp( kx) + B exp(− kx) mit A, B ∈ R und somit wegen F (0) = F (a) = 0 A = B = 0 im Widerspruch zu F 6≡ 0. k = 0 hingegen würde F (x) = Ax + B mit A, B ∈ R und somit wegen F (0) = F (a) = 0 ebenfalls A = B = 0 implizieren im Widerspruch zu F 6≡ 0. Daher gilt k ∈ R− , etwa k = −p2 mit p ∈ R+ und somit F (x) = A sin(px) + B cos(px) G(y) = C exp(py) + D exp(−py), wobei A, B, C, D ∈ R sind. Aus F (0) = 0 folgt B = 0 und somit F (x) = A sin(px). Wegen F ≡ 6 0 gilt A 6= 0. Da F (a) = 0 ist, gibt es ein m ∈ N mit 64 pa = mπ. Wird also ω := π/a gesetzt, so gilt p = mω. Wegen G(0) = 0 ist D = −C und somit F (x) = A sin(mωx) G(y) = 2C sinh(mωy). Also ist sin(mωx) sinh(mωy) eine Lösung von (5.6), welche (5.7) erfüllt. Um eine Lösung von (5.6) zu erhalten, welche außerdem (5.8) erfüllt, machen wir den Ansatz ∞ X u= an sin(nωx) sinh(nωy) n=1 mit an ∈ R für n ∈ N. Diese Funktion erfüllt die Bedingung (5.8) genau dann, wenn ∞ X an sinh(nωb) sin(nωx) = f (x) n=1 für alle x ∈ [0, a] gilt. Also sind die Zahlen an sinh(nωb) die Fourierkoeffizienten Za 2 f (t) sin(nωt)dt a 0 der auf das Intervall [−a, a] ungerade fortgesetzten Funktion f . Das ergibt schließlich ∞ 2X 1 u= sin(nωx) sinh(nωy) a n=1 sinh(nωb) Za f (t) sin(nωt)dt. 0 2 5.4 Wellen- oder Schwingungsgleichung Die partielle Differentialgleichung utt = c2 ∆u (wobei c ∈ R+ ist) heißt n-dimensionale Wellen- oder Schwingungsgleichung, wobei u = u(x1 , . . . , xn , t) eine (n + 1)-stellige Funktion ist 65 (n ∈ N). Der Laplace-Operator bezieht sich hier nur auf die ”Ortskoordinaten” x1 , . . . , xn . c heißt Wellenausbreitungsgeschwindigkeit. Die eindimensionale Wellengleichung utt = c2 uxx beschreibt eindimensionale Schwingungsvorgänge (Ausbreitung von Schwingungen in homogenen elastischen Medien). Beispiel Zur Lösung des Problems utt = c2 uxx (5.9) u(x, 0) = f (x) für alle x ∈ R (5.10) ut (x, 0) = g(x) für alle x ∈ R (5.11) machen wir den D’Alembertschen Lösungsansatz y = x + ct z = x − ct. Anwendung der Kettenregel ergibt ut = uy yt + uz zt = uy c + uz (−c) = c(uy − uz ), utt = c(uyy yt + uyz zt − uzy yt − uzz zt ) = c2 (uyy − 2uyz + uzz ), ux = uy yx + uz zx = uy + uz und uxx = uyy yx + uyz zx + uzy yx + uzz zx = uyy + 2uyz + uzz . Die Gleichung (5.9) wird dann zu c2 (uyy − 2uyz + uzz ) = c2 (uyy + 2uyz + uzz ) bzw. uyz = 0. Wird zunächst y an einer Stelle y0 festgehalten, so ergibt sich uy (y0 , z) = A mit einer Konstanten A, wird y an einer anderen Stelle y1 festgehalten, so ergibt sich uy (y1 , z) = B mit einer möglicherweise anderen Konstanten B. Allgemein folgt also uy (y, z) = H(y). Wird nun z an einer Stelle z0 festgehalten, so ergibt sich Z u(y, z0 ) = H(y)dy + C mit einer Konstanten C, wird z an einer anderen Stelle z1 festgehalten, so ergibt sich Z u(y, z1 ) = H(y)dy + D 66 mit einer möglicherweise anderen Konstanten D. Allgemein ergibt sich also Z u(y, z) = H(y)dy + G(z). Die allgemeine Lösung von uyz = 0 lautet also u(y, z) = F (y) + G(z) mit willkürlichen differenzierbaren Funktionen F, G : R → R. Daher hat die Gleichung (5.9) die allgemeine Lösung u(x, t) = F (x + ct) + G(x − ct) mit willkürlichen zweimal differenzierbaren Funktionen F, G : R → R. Diese Formel heißt D’Alembertsche Lösungsformel. Wegen (5.10) und (5.11) gilt F (x) + G(x) = f (x) cF 0 (x) − cG0 (x) = g(x) und somit woraus cF 0 (x) + cG0 (x) = cf 0 (x) cF 0 (x) − cG0 (x) = g(x), 2cF 0 (x) = cf 0 (x) + g(x) 2cG0 (x) = cf 0 (x) − g(x) folgt. Integration nach x ergibt 2cF (x) = cf (x) + 2cG(x) = cf (x) − Rx 0 Rx g(s)ds + 2cF (0) − cf (0) g(s)ds + 2cG(0) − cf (0). 0 Also ist x+ct Z g(s)ds + 2c(F (0) + G(0) − f (0)). 2cu = c(f (x + ct) + f (x − ct)) + x−ct Wegen (5.10) ist F (0) + G(0) − f (0) = 0 und 1 1 u = (f (x + ct) + f (x − ct)) + 2 2c x+ct Z g(s)ds. x−ct Diese Formel heißt ebenfalls D’Alembertsche Lösungsformel. 67 2 Beispiel Wir betrachten das Problem utt = c2 uxx (5.12) u(0, t) = u(a, t) = 0 für alle t ∈ R+ 0 (5.13) u(x, 0) = f (x) für alle x ∈ [0, a] (5.14) ut (x, 0) = g(x) für alle x ∈ [0, a] (5.15) (wobei a ∈ R+ ), d. h. wir betrachten eine fest zwischen den Punkten (0, 0) und (a, 0) eingespannte Saite, deren Auslenkung zum Zeitpunkt t = 0 durch die nicht identisch verschwindende Funktion f und deren Auslenkungsgeschwindigkeit zum Zeitpunkt t = 0 durch die Funktion g gegeben ist. Wir machen zunächst einen Produktansatz u = F (x)G(t), gehen mit diesem in die Differentialgleichung (5.12) und dividieren beide Seiten durch c2 u. Das ergibt F 00 (x) G00 (t) = 2 . F (x) c G(t) Also müssen beide Seiten gleich einer Konstanten, etwa k sein, d. h., F 00 (x) − kF (x) = 0 G00 (t) − kc2 G(t) = 0. Wegen f 6≡ 0 gilt u 6≡ 0 und somit F 6≡ 0 und G 6≡ 0. Also ist√wegen (5.13) F √ (0) = F (a) = 0. Wäre k ∈ R+ , so würde F (x) = A exp( kx) + B exp(− kx) mit A, B ∈ R folgen, was wegen F (0) = F (a) = 0 A = B = 0 implizieren würde im Widerspruch zu F 6≡ 0. Wäre k = 0, so würde F (x) = Ax + B mit A, B ∈ R folgen, was zusammen mit F (0) = F (a) = 0 ebenfalls A = B = 0 implizieren würde im Widerspruch zu F 6≡ 0. Also ist k ∈ R− , etwa k = −p2 mit p ∈ R+ und somit F (x) = A sin(px) + B cos(px) G(t) = C sin(cpt) + D cos(cpt) mit A, B, C, D ∈ R. Wegen F (0) = 0 ist B = 0 und daher F (x) = A sin(px). Aus F (a) = 0 folgt A sin(pa) = 0. Wegen F 6≡ 0 gilt A 6= 0. Daher gibt es ein m ∈ N mit pa = mπ, also p = mω, wobei ω := π/a. Also ist F (x) = A sin(mωx) G(t) = C sin(cmωt) + D cos(cmωt). 68 Die Funktionen sin(mωx)(A sin(cmωt) + B cos(cmωt)) mit m ∈ N und A, B ∈ R sind also Lösungen von (5.12) und (5.13). Um nun eine Lösung von (5.12) zu erhalten, die auch (5.14) und (5.15) erfüllt, machen wir den Ansatz ∞ X u= sin(nωx)(an sin(cnωt) + bn cos(cnωt)) n=1 mit an , bn ∈ R für n ∈ N. Wegen (5.14) folgt ∞ X bn sin(nωx) = f (x) n=1 für alle x ∈ [0, a]. Also sind die Zahlen bn gerade die Fourierkoeffizienten Za 2 f (s) sin(nωs)ds a 0 der auf das Intervall [−a, a] ungerade fortgesetzten Funktion f . Nun ist ut = ∞ X sin(nωx)(an cnω cos(cnωt) − bn cnω sin(cnωt)) n=1 und daher wegen (5.15) ∞ X an cnω sin(nωx) = g(x) n=1 für alle x ∈ [0, a]. Also sind die Zahlen an cnω gerade die Fourierkoeffizienten Za 2 g(s) sin(nωs)ds a 0 der auf das Intervall [−a, a] ungerade fortgesetzten Funktion g. Somit folgt schließlich Za ∞ 2 X1 u = sin(nωx)(sin(cnωt) g(s) sin(nωs)ds + cωa n=1 n 0 Za +cnω cos(cnωt) f (s) sin(nωs)ds). 0 2 69 5.5 Diffusions- oder Wärmeleitungsgleichung Die partielle Differentialgleichung ut = c2 ∆u (wobei c ∈ R+ ist) heißt Diffusions- oder Wärmeleitungsgleichung. Der Laplace-Operator bezieht sich hier wieder nur auf die ”Ortskoordinaten” x1 , . . . , xn . Im Fall der Wärmeleitungsgleichung heißt c2 die Temperaturleitfähigkeit. Die eindimensionale Wärmeleitungsgleichung ut = c2 uxx gibt die Temperaturverteilung in einem dünnen langen Stab an. Beispiel Um das Problem ut = c2 uxx u(x, 0) = f (x) für alle x ∈ R zu lösen, wenden wir die Fouriertransformation bzgl. der Variablen x an, was wir durch den Index x bei F andeuten. Sei Z∞ U (ω, t) := Fx {u(x, t)} = exp(−iωx)u(x, t)dx. −∞ Dann gilt unter den Voraussetzungen, dass exp(−iωx)u(x, t) bzgl. x gleichmäßig stetig in t ist und u(±∞, t) = ux (±∞, t) = 0 für alle t ∈ R+ 0 gilt, Z∞ Ut (ω, t) = exp(−iωx)ut (x, t)dx = c2 −∞ = c 2 Z∞ exp(−iωx)uxx (x, t)dx = −∞ (exp(−iωx)ux (x, t)|x=∞ x=−∞ Z∞ + iω exp(−iωx)ux (x, t)dx) = −∞ Z∞ = ic2 ω(exp(−iωx)u(x, t)|x=∞ x=−∞ + iω −∞ 2 2 = −c ω U (ω, t). 70 exp(−iωx)u(x, t)dx) = Für festes ω genügt U (ω, t) also der gewöhnlichen Differentialgleichung Ut (ω, t) = −c2 ω 2 U (ω, t), welche die Lösung U (ω, t) = C(ω) exp(−c2 ω 2 t) besitzt. Für t = 0 ergibt sich C(ω) = U (ω, 0) = Fx {u(x, 0)} = Fx {f (x)}. Das bedeutet Fx {u(x, t)} = Fx {f (x)} exp(−c2 ω 2 t). Da, wie wir früher gesehen haben, F{exp(−t2 )} = √ π exp(−ω 2 /4) gilt, folgt nach den Rechenregeln für die Fouriertransformation Fx { x2 1 √ exp(− 2 )} = exp(−c2 ω 2 t) 4c t 2c πt und somit Fx {u(x, t)} = Fx {f (x)}Fx { 1 √ exp(− x2 )} = 4c2 t 2c πt 1 x2 √ = Fx {f (x) ∗ exp(− 2 )}, 4c t 2c πt woraus x2 1 u = f (x) ∗ exp(− 2 ) = √ 4c t 2c πt 2c πt 1 √ 1 = √ π Z∞ Z∞ f (x − v) exp(− v2 )dv = 4c2 t −∞ √ f (x + 2cs t) exp(−s2 )ds −∞ 2 folgt. Beispiel Für den Spezialfall ut = c2 uxx u(x, 0) = exp(−x2 ) für alle x ∈ R 71 des vorhergehenden Beispiels ergibt sich 1 u = √ π 1 = √ π Z∞ −∞ Z∞ √ exp(−(x + 2cs t)2 ) exp(−s2 )ds = √ exp(−(x + 2cs t)2 − s2 )ds. −∞ Wird das quadratische Polynom in s im Exponenten der e-Potenz auf ein vollständiges Quadrat ergänzt, sodann eine lineare Transformation durchgeführt und schließlich die früher bewiesene Formel Z∞ exp(−x2 )dx = √ π −∞ verwendet, so folgt 1 x2 ). u= √ exp(− 2 4c t + 1 4c2 t + 1 2 Beispiel Um das Problem ut = c2 uxx (5.16) u(0, t) = u(a, t) = 0 für alle t ∈ R+ 0 (5.17) u(x, 0) = f (x) für alle x ∈ [0, a] (5.18) wobei a ∈ R+ und f eine nicht identisch verschwindende stetige Funktion von [0, a] nach R mit f (0) = f (a) = 0 ist, zu lösen, machen wir wie früher einen Produktansatz u = F (x)G(t), gehen mit diesem in die Differentialgleichung (5.16) und dividieren beide Seiten durch c2 u. Das ergibt F 00 (x) G0 (t) = 2 . F (x) c G(t) Nun müssen beide Seiten wieder gleich einer Konstanten, etwa k, sein. Es gilt also F 00 (x) − kF (x) = 0 G0 (t) − kc2 G(t) = 0. 72 Wegen f 6≡ 0 gilt u 6≡ 0 und somit F 6≡ 0 und G 6≡ 0. Also ist wegen + (5.17) √ und G 6≡ 0 F (0) √ = F (a) = 0. Wäre k ∈ R , so würde F (x) = A exp( kx) + B exp(− kx) mit A, B ∈ R folgen, was wegen F (0) = F (a) = 0 A = B = 0 implizieren würde im Widerspruch zu F 6≡ 0. Wäre k = 0, so würde F (x) = Ax + B mit A, B ∈ R folgen, was wegen F (0) = F (a) = 0 wieder A = B = 0 implizieren würde im Widerspruch zu F 6≡ 0. Daher gilt k ∈ R− , etwa k = −p2 mit p ∈ R+ . Also ist F (x) = A sin(px) + B cos(px) G(t) = C exp(−p2 c2 t) mit A, B, C ∈ R. Wegen F (0) = 0 ist B = 0 und damit F (x) = A sin(px). Wegen F 6≡ 0 ist A 6= 0. Da F (a) = 0 ist, gibt es ein m ∈ N mit pa = mπ. Es gilt also p = mω, wobei ω := π/a, und somit F (x) = A sin(mωx) G(t) = C exp(−(cmω)2 t). Die Funktionen sin(mωx) exp(−(cmω)2 t) mit m ∈ N sind also Lösungen von (5.16), welche (5.17) erfüllen. Um eine Lösung von (5.16) zu erhalten, welche außerdem (5.18) erfüllt, machen wir den Ansatz ∞ X u= an sin(nωx) exp(−(cnω)2 t) n=1 mit an ∈ R für n ∈ N. Damit diese Funktion die Bedingung (5.18) erfüllt, muss ∞ X an sin(nωx) = f (x) n=1 für alle x ∈ [0, a] gelten. Also sind die Zahlen an gerade die Fourierkoeffizienten Za 2 f (s) sin(nωs)ds a 0 der auf das Intervall [−a, a] ungerade fortgesetzten Funktion f . Das ergibt schließlich Za ∞ 2X 2 u= sin(nωx) exp(−(cnω) t) f (s) sin(nωs)ds. a n=1 0 73 2 Beispiel In einem zylinderförmigen Gefäß werde auf eine Lösungsschicht der Höhe a (∈ R+ ) und Konzentration u0 (∈ R+ ) reines Lösungsmittel geschichtet, sodass die Höhe der gesamten sich im Zylinder befindenden Flüssigkeit gleich b (> a) ist. Es ist die Konzentrationsverteilung in Abhängigkeit von Zeit und Ort zu ermitteln. Da die Konzentration der Flüssigkeit in einem Punkt nur vom Abstand x dieses Punktes vom Boden des Gefäßes abhängt, gilt ut = c2 uxx mit einem geeigneten c ∈ R+ , wobei u(x, t) die Konzentration der Flüssigkeit zum Zeitpunkt t in der Höhe x über dem Boden des Gefäßes bezeichnet. Wir betrachten also das Problem ut = c2 uxx u0 [0, a) u(x, 0) = für alle x ∈ 0 (a, b] (5.19) ux (0, t) = ux (b, t) = 0 für alle t ∈ R+ 0 (5.21) (5.20) Wir machen wieder einen Produktansatz u = F (x)G(t), gehen mit diesem in die Differentialgleichung (5.19), dividieren beide Seiten durch c2 u und erhalten F 00 (x) G0 (t) = 2 . F (x) c G(t) Nun müssen beide Seiten wieder gleich einer Konstanten, etwa k, sein. Das ergibt F 00 (x) − kF (x) = 0 G0 (t) − kc2 G(t) = 0. Wegen u 6≡ 0 gilt F 6≡ 0 und G 6≡ 0. Wegen (5.21) √folgt daraus F 0 (0) √ = 0 + F (b) = 0. Wäre nun k ∈ R , so würde √ F (x)√= A exp(√ kx) + B√exp(− kx) 0 mit A, B ∈ R und daher F (x) = A k exp( kx) − B k exp(− kx) gelten, was zusammen mit F 0 (0) = F 0 (b) = 0 A = B = 0 und somit F ≡ 0 implizieren würde. Wäre k = 0, so hätten wir F (x) = Ax + B mit A, B ∈ R und somit F 0 (x) = A, was wegen F 0 (0) = 0 A = 0 und daher F (x) = B 74 implizieren würde. Außerdem wäre auch G(t) und somit auch u konstant. Daher ist k ∈ R− , etwa k = −p2 mit p ∈ R+ . Es ergibt sich F (x) = A sin(px) + B cos(px) G(t) = C exp(−(pc)2 t). mit A, B, C ∈ R. Wegen F 0 (0) = 0 folgt A = 0 und somit F (x) = B cos(px). Wegen F 6≡ 0 ist B 6= 0. F 0 (b) = 0 impliziert, dass es ein m ∈ N mit pb = mπ gibt. Wird also ω := π/b gesetzt, so folgt p = mω und daher F (x) = B cos(mωx) G(t) = C exp(−(mcω)2 t). Also sind die Funktionen cos(mωx) exp(−(mcω)2 t), wobei m ∈ N0 ist, Lösungen von (5.19), welche (5.21) erfüllen. (Für m = 0 ist das trivial.) Um nun eine Lösung von (5.19) zu erhalten, welche außerdem (5.20) erfüllt, machen wir den Ansatz u= ∞ X an cos(nωx) exp(−(ncω)2 t) n=0 mit an ∈ R. Wegen (5.20) muss ∞ 2a0 X + an cos(nωx) = 2 n=1 u0 0 für alle x ∈ [0, a) (a, b] gelten. Also sind 2a0 und an , n ∈ N, gerade die Fourierkoeffizienten der auf das Intervall [−b, b] gerade fortgesetzten Funktion von [0, b] nach R, welche auf [0, a) den Wert u0 und im Punkt a den Wert u0 /2 annimmt und auf (a, b] verschwindet. Es ergibt sich a0 = au0 b und an = 2u0 sin(nωa) nπ für alle n ∈ N. Also lautet die gesuchte Lösung u= ∞ au0 2u0 X 1 + sin(nωa) cos(nωx) exp(−(ncω)2 t). b π n=1 n 75 2 Kontrollfragen 1. Was ist eine partiellen Differentialgleichung bzw. eine Lösung einer solchen? 2. Was ist eine quasilineare partielle Differentialgleichung erster Ordnung und wie kann sie gelöst werden? 3. Wie funktioniert der Produktansatz? 4. Wie lautet der D’Alembertsche Lösungsansatz zur Lösung der Wellenoder Schwingungsgleichung? 76 Kapitel 6 Vektoranalysis Motivation In der Vektoranalysis werden Vektorrechnung und Analysis verbunden. Es wird erklärt, wie reellwertige Funktionen über höherdimensionale Bereiche, entlang von Kurven und über Flächen im Raum sowie vektorwertige Funktionen entlang von Kurven oder über Flächen im Raum integriert werden. Physikalische Interpretationen der dabei auftretenden Kurven- bzw. Oberflächenintegrale werden gegeben. Die Begriffe Gradient, Divergenz und Rotation werden eingeführt und ihre Bedeutung erklärt. Die Integralsätze von Green, Gauß bzw. Stokes zeigen, dass die Integration über einen Bereich manchmal auf die Integration über den Rand dieses Bereiches zurückgeführt werden kann. Mittels allgemeiner Differentialformen gelingt es schließlich, den allgemeinen Integralsatz von Stokes zu formulieren, der die erwähnten Integralsätze als Spezialfälle enthält. 6.1 Bereichsintegrale In diesem und in den folgenden Abschnitten werden oft gewisse Teilmengen des Rn betrachtet, von denen, ohne dass dies immer explizit erwähnt wird, vorausgesetzt wird, dass sie gewisse ”schöne” Eigenschaften haben (z. B. dass sie zusammenhängend sind (d. h. je zwei Elemente durch eine innerhalb der Menge verlaufende Kurve verbindbar sind) oder ihnen auf sinnvolle Weise ein ”Inhalt” zugeordnet werden kann). Auch von den auftretenden Funktionen wird, ohne dass dies immer explizit erwähnt wird, angenommen, dass sie gewisse ”schöne” Eigenschaften haben (z. B. dass sie auf einer geeigneten 77 Menge hinreichend oft (stetig) differenzierbar sind). Außerdem treffen wir folgende Vereinbarung: Falls ~a ∈ Rn und i ∈ {1, . . . , n} ist, so bezeichne ai die i-te Komponente von ~a. Falls f~ : Rn → Rm und j ∈ {1, . . . , m} ist, so bezeichne fj die j-te Koordinatenfunktion von f~. Das Integral über eine auf einem endlichen abgeschlossenen Intervall [a, b] definierte reellwertige Funktion f kann folgendermaßen erklärt werden: Sei Z eine Zerlegung des Intervalls [a, b] in endlich viele Teilintervalle [x0 , x1 ], . . . . . . , [xm−1 , xm ] der Länge ∆x1 = x1 − x0 bzw. ... bzw. ∆xm = xm − xm−1 . Aus jedem Teilintervall [xi−1 , xi ] (1 ≤ i ≤ m) wird ein ”Zwischenpunkt” ξi ausgewählt. Sodann wird die Riemann-Summe S(f, Z, ξi ) := m X f (ξi ) · ∆xi i=1 gebildet. f heißt integrierbar über [a, b], falls es ein I ∈ R gibt, sodass für jedes ε ∈ R+ gilt |S(f, Z, ξi ) − I| < ε für alle ”hinreichend feinen” Zerlegungen Z von [a, b], und zwar unabhängig von der Wahl der ξi . I heißt dann der Wert des Integrals Zb f (x)dx a von f über [a, b]. Sei nun B eine Teilmenge von R2 bzw. R3 und f : B → R. Wir wollen f ”über B integrieren”. Dabei gehen wir analog wie zuerst vor: Wir betrachten eine Zerlegung Z von B in endlich viele Teilmengen B1 , . . . , Bm mit dem Flächeninhalt bzw. dem Volumen ∆B1 , . . . , ∆Bm und mit der Eigenschaft, dass je zwei verschiedene Bi höchstens Randpunkte gemeinsam haben. (Hier und im Folgenden bezeichne ∆M stets den Flächeninhalt bzw. das Volumen von M in der entsprechenden Dimension.) Aus jedem Bi , 1 ≤ i ≤ m, wählen wir ein ξi aus und bilden die Riemann-Summe S(f, Z, ξi ) := m X f (ξi ) · ∆Bi . i=1 f heißt integrierbar über B, falls es ein I ∈ R gibt, sodass für jedes ε ∈ R+ gilt |S(f, Z, ξi ) − I| < ε 78 für alle ”hinreichend feinen” Zerlegungen Z von B, und zwar unabhängig von der Wahl der ξi . I heißt dann der Wert des Bereichsintegrals ZZZ ZZ f (x, y)dxdy bzw. f (x, y, z)dxdydz B B von f über B. Viele der im Folgenden für Integrale über zweidimensionalen Bereichen formulierten Aussagen gelten in analoger Form auch für Integrale über höherdimensionale Bereiche. Funktionen, die ”fast überall” stetig sind, sind stets integrierbar. (Dabei bedeutet ”fast überall” hier und im Folgenden ”überall, mit Ausnahme einer Menge vom ”Inhalt” 0”.) Ist f ≥ 0 auf B, so ist ZZ f (x, y)dxdy = ∆{(x, y, z) ∈ R3 | (x, y) ∈ B, z ∈ [0, f (x, y)]}. B Insbesondere ist ZZ dxdy. ∆B = B In den meisten Fällen kann die Berechnung von Bereichsintegralen auf die Berechnung gewöhnlicher Integrale zurückgeführt werden. Es gilt nämlich: Sind g und h stückweise stetige Funktionen auf [a, b] und ist g ≤ h auf [a, b] und B = {(x, y) ∈ R2 | x ∈ [a, b], y ∈ [g(x), h(x)]}, so ist h(x) Zb Z f (x, y)dxdy = ( f (x, y)dy)dx. ZZ B a g(x) Eine analoge Aussage gilt mit vertauschten Variablen. Insbesondere gilt Zb Zd g(x)h(y)dxdy = ( g(x)h(y)dy)dx = ZZ [a,b]×[c,d] a c Zb = (g(x) a 79 Zd h(y)dy)dx = c Zd = ( Zb h(y)dy) c Zb = ( g(x)dx = a Zd g(x)dx)( h(y)dy). a c Im Folgenden sollen einige Eigenschaften von Bereichsintegralen angegeben werden: • Linearität: Sind die Funktionen f, g über B integrierbar und a, b ∈ R, so ist auch af + bg über B integrierbar, und es gilt ZZ ZZ ZZ (af (x, y) + bg(x, y))dxdy = a f (x, y)dxdy + b g(x, y)dxdy. B B B • Additivität: Haben die Mengen B, C höchstens Randpunkte gemeinsam und ist f sowohl über B als auch über C integrierbar, so ist f auch über B ∪ C integrierbar, und es gilt ZZ ZZ ZZ f (x, y)dxdy. f (x, y)dxdy + f (x, y)dxdy = C B B∪C • Monotonie: Sind f und g über B integrierbar und gilt f ≤ g auf B, so ist ZZ ZZ f (x, y)dxdy ≤ g(x, y)dxdy. B B • Abschätzung des Absolutbetrages: Ist f über B integrierbar, so auch |f |, und es gilt ZZ ZZ | f (x, y)dxdy| ≤ |f (x, y)|dxdy. B B • Mittelwertsatz: Ist f stetig auf B, so gibt es ein (a, b) ∈ B mit ZZ f (x, y)dxdy = f (a, b) · ∆B. B Weiters gilt: ZZ ZZ 1 ( xdxdy, ydxdy) ∆B B B 80 sind die Koordinaten des Schwerpunkts von B. Beispiel Der Schwerpunkt der oberen Hälfte B des Einheitskreises lautet wegen 1 ∆B ZZ 2 ydxdy = π B Z1 √ Z1−x2 Z1 1 4 ydy)dx = ( (1 − x2 )dx = π 3π −1 −1 0 2 (0, 4/(3π)). Beispiel Der Schwerpunkt des von den Kurven mit den Gleichungen √ y = 0, x = 9 und y = 2 x begrenzten Flächenstücks B der (x, y)-Ebene lautet wegen √ 2 x √ Z9 Z Z9 √ 4x x 9 | = 36, ∆B = ( xdx = dy)dx = 2 3 0 0 0 Z9 ZZ xdxdy = B 0 √ 2 x Z x( Z9 dy)dx = 2 0 0 √ 2 x Z9 Z ZZ ydxdy = B ( 0 √ √ 4x2 x 9 972 x xdx = |0 = und 5 5 0 Z9 ydy)dx = 2 0 xdx = 81 0 2 (27/5, 9/4) = (5.4, 2.25). Beispiel Der Schwerpunkt des Kugeloktanten B = {(x, y, z) ∈ R3 | x, y, z ≥ 0, x2 + y 2 + z 2 ≤ 1} lautet wegen 1 ∆B ZZZ 6 xdxdydz = π B 6 = π Z1 √ Z1−x2 x( ( 0 Z1 0 √ 1−x2 −y 2 Z dz)dy)dx = 0 3 x · ∆Bx dx = 2 0 Z1 x(1 − x2 )dx = 0 (3/8, 3/8, 3/8) = (0.375, 0.375, 0.375), wobei Bx den Viertelkreis {(y, z) ∈ R2 | y, z ≥ 0, y 2 + z 2 ≤ 1 − x2 } 81 3 8 mit dem Radius √ 2 1 − x2 bezeichnet. Sei f : [a, b] → R stetig differenzierbar und bezeichne K die durch diese Funktion gegebene Kurve. Dann ist Zb p 1 + (f 0 (x))2 dx L(K) = a die Länge von K (auch im Folgenden wollen wir die Länge einer Kurve K stets mit L(K) bezeichnen), und 1 ( L(K) Zb p Zb p x 1 + (f 0 (x))2 dx, f (x) 1 + (f 0 (x))2 dx) a a sind die Koordinaten des Schwerpunkts von K. Beispiel Der Schwerpunkt des Kreisbogens der oberen Hälfte des Einheitskreises besitzt wegen 1 L(K) Z1 √ Z1 r x 1 2 1 − x2 1 + (− √ )2 dx = dx = 2 π π 1−x −1 −1 2 die Koordinaten (0, 2/π). Sei B ⊆ R2 und f : B → R stetig partiell differenzierbar, und bezeichne G die durch diese Funktion gegebene Fläche. Sei q W (x, y) := 1 + (fx (x, y))2 + (fy (x, y))2 für alle (x, y) ∈ B. Dann gilt ZZ ∆G = W (x, y)dxdy, B und 1 ( ∆G ZZ ZZ ZZ xW (x, y)dxdy, B yW (x, y)dxdy, B f (x, y)W (x, y)dxdy) B sind die Koordinaten des Schwerpunkts von G. 82 Beispiel Der Schwerpunkt der Kugelkappe G der oberen Hälfte der Einheitskugel lautet wegen s ZZ p −x −y 1 − x2 − y 2 1 + ( p )2 + ( p )2 dxdy = 2 2 1−x −y 1 − x2 − y 2 B ZZ ∆B 1 1 dxdy = = = 2π 2π 2 B 1 ∆G (0, 0, 1/2) = (0, 0, 0.5), wobei B den Bereich {(x, y) ∈ R2 | x2 + y 2 ≤ 1} bezeichnet. 2 Weiters gilt: Zb π (f (x))2 dx a ist das Volumen und Zb 2π p f (x) 1 + (f 0 (x))2 dx a die Mantelfläche des durch Drehung des Graphen der stetig differenzierbaren Funktion f : [a, b] → R+ 0 um die x-Achse entstehenden Drehkörpers. Guldinsche Regeln: (i) Das Volumen des durch Drehung der Teilmenge B von R × R+ 0 um die x-Achse entstehenden Drehkörpers beträgt 2rπ∆B, wobei r die y-Koordinate des Schwerpunkts von B bezeichnet. (ii) Die Mantelfläche des durch Drehung des Graphen der stetigen Funktion f : [a, b] → R+ 0 um die x-Achse entstehenden Drehkörpers beträgt 2rπL(K), wobei K den Graphen von f und r die y-Koordinate des Schwerpunkts von K bezeichnet. Beispiel Mit Hilfe der Guldinschen Regeln ergeben sich für das Volumen bzw. die Oberfläche der Einheitskugel die Werte 2· 4 π 4π 2 ·π· = bzw. 2 · · ππ = 4π. 3π 2 3 π 2 83 Prinzip von Cavalieri Es gilt Zb Z Z dxdydz = ( ZZZ B a dxdy)dz, Bz falls B = {(x, y, z) ∈ R3 | z ∈ [a, b], (x, y) ∈ Bz }. Beispiel Mit Hilfe des Prinzips von Cavalieri ergibt sich für das Volumen der Einheitskugel der Wert Z1 (1 − x2 )πdx = 4π . 3 −1 2 Ein wichtiges Hilfsmittel zur Berechnung von Bereichsintegralen liefert die folgende Substitutionsregel für Bereichsintegrale Sind B1 , B2 ⊆ R2 , ist f : B1 → R stetig, (g, h) : B2 → B1 surjektiv und stetig partiell differenzierbar und gilt gx gy hx hy 6= 0 ”fast überall” auf B2 , so ist ZZ ZZ f (x, y)dxdy = B1 g (u, v) gy (u, v) f (g(u, v), h(u, v))| x hx (u, v) hy (u, v) B2 |dudv. Diese Regel wird häufig bei Koordinatentransformationen verwendet. Wir geben im Folgenden die wichtigsten solchen Transformationen an. Polarkoordinaten r, ϕ eines Punktes P der (x, y)-Ebene r bezeichnet den Abstand des Punktes P vom Ursprung und ϕ den Winkel, welchen der Ortsvektor von P mit der positiven x-Achse einschließt (und zwar von der positiven x-Achse aus im Gegenuhrzeigersinn gemessen). Die Transformation lautet: x = r cos ϕ y = r sin ϕ 84 Wegen xr xϕ cos ϕ −r sin ϕ yr yϕ = sin ϕ r cos ϕ =r gilt ZZ ZZ f (x, y)dxdy = B1 f (r cos ϕ, r sin ϕ)rdrdϕ. B2 2 Zylinderkoordinaten r, ϕ, z eines Raumpunktes P r und ϕ bezeichnen die Polarkoordinaten des durch Orthogonalprojektion von P auf die (x, y)-Ebene entstehenden Punktes, und z bezeichnet die dritte kartesische Koordinate von P . Die Transformation lautet: x = r cos ϕ y = r sin ϕ z = z Wegen xr xϕ xz cos ϕ −r sin ϕ 0 yr yϕ yz = sin ϕ r cos ϕ 0 = r z z z 0 0 1 r ϕ z gilt ZZZ ZZZ f (r cos ϕ, r sin ϕ, z)rdrdϕdz. f (x, y, z)dxdydz = B1 B2 2 Kugelkoordinaten r, ϑ, ϕ eines Raumpunktes P r bezeichnet den Abstand des Punktes P vom Ursprung, ϕ die zweite Polarkoordinate des durch Orthogonalprojektion von P auf die (x, y)-Ebene entstehenden Punktes und ϑ den Winkel, welchen der Ortsvektor von P mit der positiven z-Achse einschließt. Die Transformation lautet: x = r sin ϑ cos ϕ y = r sin ϑ sin ϕ z = r cos ϑ 85 Wegen xr xϑ xϕ sin ϑ cos ϕ r cos ϑ cos ϕ −r sin ϑ sin ϕ yr yϑ yϕ = sin ϑ sin ϕ r cos ϑ sin ϕ r sin ϑ cos ϕ z z z cos ϑ −r sin ϑ 0 r ϑ ϕ = r2 sin ϑ gilt ZZZ f (x, y, z)dxdydz = ZZZ = f (r sin ϑ cos ϕ, r sin ϑ sin ϕ, r cos ϑ)r2 sin ϑdrdϑdϕ. B1 B2 2 Beispiel Um den Normierungsfaktor A in der 2pz -Wellenfunktion p x2 + y 2 + z 2 Az exp(− ) ψ(x, y, z) = r0 2r0 des Wasserstoffatoms aus der Beziehung ZZZ (ψ(x, y, z))2 dxdydz = 1 R3 (r0 bezeichnet den Bohrschen Radius) zu berechnen, wird zunächst in Kugelkoordinaten transformiert A2 1= 2 r0 Z∞ r r exp(− )dr r0 4 0 Zπ 2 Z2π sin ϑ cos ϑdϑ 0 dϕ. 0 Sodann wird der Ansatz Z r r r4 exp(− )dr = (Br4 + Cr3 + Dr2 + Er + F ) exp(− ) r0 r0 mit unbestimmten Koeffizienten B, . . . , F gemacht. Durch Koeffizientenvergleich ergibt sich Z r r r4 exp(− )dr = −r0 (r4 + 4r0 r3 + 12r02 r2 + 24r03 r + 24r04 ) exp(− ), r0 r0 woraus Z∞ r4 exp(− r )dr = 24r05 r0 0 86 und wegen Zπ sin ϑ cos2 ϑdϑ = − cos3 ϑ π 2 | = 3 0 3 0 1 = 32A2 r03 π und somit A= 1 √ 4r0 2r0 π 2 folgt. 6.2 Skalarfelder, Vektorfelder, Gradient Eine Teilmenge B der Ebene heißt offen, falls es zu jedem ~a ∈ B ein ε ∈ R+ gibt, sodass {~x ∈ R2 | |~x − ~a| < ε} ⊆ B gilt. Ein Gebiet der Ebene ist eine offene zusammenhängende Teilmenge derselben. Im Folgenden bezeichne G ein Gebiet der Ebene. Ein Skalarfeld auf G ist eine reellwertige, auf G definierte Abbildung (z. B. Temperaturfeld) und ein Vektorfeld auf G eine Abbildung von G in die Ebene (z. B. Geschwindigkeitsfeld, Kraftfeld). Ist f ein partiell differenzierbares Skalarfeld auf G, so heißt das Vektorfeld (fx , fy ) −−−→ auf G das Gradientenfeld (oder der Gradient) gradf von f . Im Fall ~a ∈ G −−−→ −−−→ und (gradf )(~a) 6= ~0 zeigt der Vektor (gradf )(~a) in die Richtung des stärksten Anstiegs von f (ausgehend von ~a). Der Nablaoperator ist formal der Vektor ∇=( ∂ ∂ , ). ∂x ∂y Beim formalen ”Rechnen” mit diesem Vektor muss berücksichtigt werden, dass die ”Multiplikation” eines Ableitungsoperators mit einer Funktion als Anwendung dieses Operators auf die entsprechende Funktion zu verstehen ist. So kann z. B. der Gradient von f als Produkt ∇f des Nablavektors mit dem ”Skalar” f gedeutet werden: ∇f = ( ∂ ∂ ∂ ∂ −−−→ , )f = ( f, f ) = gradf . ∂x ∂y ∂x ∂y 87 Ein partiell differenzierbares Skalarfeld F auf G heißt eine Stammfunktion des Vektorfeldes f~ auf G, falls ∇F = f~ gilt. Die Stammfunktion eines Vektorfeldes ist im Fall ihrer Existenz bis auf eine additive Konstante eindeutig bestimmt. Ein Vektorfeld heißt ein Gradientenfeld, falls es eine Stammfunktion besitzt. Analoges gilt im Fall von n Dimensionen. Ein auf einem einfach zusammenhängenden Gebiet G des n-dimensionalen Raumes definiertes stetig partiell differenzierbares Vektorfeld f~ ist genau dann ein Gradientenfeld, wenn die sogenannten ”Integrabilitätsbedingungen” (fi )xj = (fj )xi für alle i, j = 1, . . . , n auf G erfüllt sind. (Dabei heißt ein Gebiet des Rn einfach zusammenhängend, wenn es keine ”Löcher” besitzt.) Beispiel Um eine Stammfunktion F des elektrostatischen Feldes f~ = (f1 , f2 , f3 ) = ( (x21 cQx1 cQx2 cQx3 , 2 , 2 ) 2 2 3/2 2 2 3/2 + x 2 + x3 ) (x1 + x2 + x3 ) (x1 + x22 + x23 )3/2 einer sich im Ursprung befindenden Punktladung (Q bezeichnet die Ladung des punktförmigen Ladungsträgers, und c eine positive Konstante) zu berechnen, wird f1 zunächst nach x1 integriert, was F (x1 , x2 , x3 ) = (x21 −cQ + g(x2 , x3 ) + x22 + x23 )1/2 mit einer geeigneten Funktion g(x2 , x3 ) ergibt. Wegen Fx2 = f2 gilt gx2 (x2 , x3 ) = 0 und daher g(x2 , x3 ) = h(x3 ) mit einer geeigneten Funktion h(x3 ). Wegen Fx3 = f3 gilt schließlich h0 (x3 ) = 0. Daher ist h(x3 ) konstant. Also ist −cQ 2 (x1 + x22 + x23 )1/2 eine Stammfunktion von f~. 2 Beispiel Wegen (f1 )z = √ yz y 6= √ = (f3 )x 1 + z2 1 + z2 ist √ √ xy (f1 , f2 , f3 ) = (y 1 + z 2 , x 1 + z 2 , √ ) 1 + z2 kein Gradientenfeld. 88 2 6.3 Krummlinige Koordinaten Sei f~ ein zweidimensionales Vektorfeld, bezeichne ~x die der Polarkoordinatentransformation entsprechende durch ~x(r, ϕ) := (r cos ϕ, r sin ϕ) für alle + 2 (r, ϕ) ∈ R+ 0 × [0, 2π] definierte Funktion von R0 × [0, 2π] nach R , und sei (r0 , ϕ0 ) ∈ R+ × (0, 2π) und ~x0 := ~x(r0 , ϕ0 ). Wir betrachten die Kurven K1 = {~x(r, ϕ0 ) | r ∈ R+ 0 } bzw. K2 = {~x(r0 , ϕ) | ϕ ∈ [0, 2π]} mit den Parameterdarstellungen r 7→ ~x(r, ϕ0 ), r ∈ R+ 0 bzw. ϕ 7→ ~x(r0 , ϕ), ϕ ∈ [0, 2π]. K1 ist also die vom Ursprung ausgehende Halbgerade, die mit der positiven x-Achse den Winkel ϕ0 (von der positiven x-Achse im Gegenuhrzeigersinn gemessen) einschließt, während K2 der Rand des Kreises um den Ursprung mit Radius r0 ist. Die normierten Tangentenvektoren ~ti an Ki in ~x0 lauten ~t1 = ~xr (r0 , ϕ0 ) = (cos ϕ0 , sin ϕ0 ) bzw. ~t2 = 1 ~xϕ (r0 , ϕ0 ) = (− sin ϕ0 , cos ϕ0 ). r0 Offensichtlich sind ~t1 und ~t2 zueinander orthogonal, und es gibt eindeutig bestimmte reelle Zahlen a1 , a2 mit f~(~x0 ) = a1~t1 + a2~t2 . (a1 , a2 ) sind also die Koordinaten des Vektors f~(~x0 ) bzgl. des vom Punkt ~x0 abhängenden, durch ~t1 und ~t2 aufgespannten Koordinatensystems. (a1 , a2 ) heißt die Darstellung von f~(~x0 ) in Polarkoordinaten. Da ~t1 und ~t2 normiert und zueinander orthogonal sind, gilt a1 = a1~t21 + a2~t1~t2 = (a1~t1 + a2~t2 )~t1 = f~(~x0 ) · ~t1 und a2 = a1~t1~t2 + a2~t22 = (a1~t1 + a2~t2 )~t2 = f~(~x0 ) · ~t2 . 89 Im Fall, dass f~ der Gradient eines Skalarfeldes F ist, gilt auf Grund der Kettenregel für mehrstellige Funktionen a1 = (∇F )(~x0 ) · ~xr (r0 , ϕ0 ) = = Fx1 (~x0 ) · (x1 )r (r0 , ϕ0 ) + Fx2 (~x0 ) · (x2 )r (r0 , ϕ0 ) = Fr (r0 , ϕ0 ). Analog folgt 1 Fϕ (r0 , ϕ0 ). r0 Die Darstellung von ∇F in Polarkoordinaten wird auch in der Form a2 = 1 ((∇F )r , (∇F )ϕ ) = (Fr , Fϕ ) r geschrieben. Im Fall von Zylinder- bzw. Kugelkoordinaten ergibt sich für die Darstellung von ∇F auf analoge Weise 1 ((∇F )r , (∇F )ϕ ), (∇F )z ) = (Fr , Fϕ , Fz ) r bzw. 1 1 ((∇F )r , (∇F )ϑ ), (∇F )ϕ ) = (Fr , Fϑ , Fϕ ). r r sin ϑ Dabei ist zu beachten, dass der Index bei (∇F ) keine partielle Ableitung, sondern die entsprechende Komponente bei der Darstellung von ∇F in den entsprechenden krummlinigen Koordinaten bedeutet. Beispiel Um die radiale Temperaturverteilung T (r) auf einer Platte, in deren Mittelpunkt die Temperatur 1000 K herrscht und für die (∇T )r = −30r gilt, zu berechnen, wird (∇T )r = Tr verwendet, woraus T (r) = −15r2 + C und wegen T (0) = 1000 schließlich T (r) = 1000 − 15r2 folgt. 2 ~ = −∇U eines elektrischen PoBeispiel Um die elektrische Feldstärke E tentials U= (x21 µ ~ ~x . + x22 + x23 )3/2 für einen (punktförmigen) Dipol mit dem Dipolmoment µ ~ , welcher sich im Koordinatenursprung befindet, in Kugelkoordinaten zu berechnen, wählen wir das kartesische Koordinatensystem o. B. d. A. so, dass µ ~ in der (positiven) z-Achse liegt, d. h., dass µ ~ = (0, 0, µ3 ) gilt. Dann ist U (r, ϑ, ϕ) = 90 µ3 cos ϑ , r2 und die gesuchte Darstellung lautet daher 1 1 µ3 −((∇U )r , (∇U )ϑ , (∇U )ϕ ) = −(Ur , Uϑ , Uϕ ) = 3 (2 cos ϑ, sin ϑ, 0). r r sin ϑ r 2 6.4 Kurvenintegrale, Greenscher Integralsatz Unter einer (”fast überall” glatten) Kurve K in der Ebene verstehen wir das Bild eines endlichen abgeschlossenen Intervalls [a, b] unter einer ”fast überall” stetig differenzierbaren Abbildung von [a, b] nach R2 . So eine Abbildung heißt dann eine ”Parameterdarstellung” von K. Analog werden Kurven im Rn definiert. Beispiel Die Abbildungen u 7→ (cos u, sin u) von [0, π] nach R2 bzw. √ u 7→ (−u, 1 − u2 ) von [−1, 1] nach R2 sind Parameterdarstellungen des Kreisbogens der oberen Hälfte des Einheitskreises. 2 Im Folgenden sei K eine Kurve in der Ebene mit der Parameterdarstellung ϕ ~ : [a, b] → K und f eine reellwertige Funktion auf K. Wir wollen f ”über K integrieren”. Zu diesem Zweck betrachten wir eine Zerlegung Z : a = u0 < . . . < um = b von [a, b] in m Teilintervalle [u0 , u1 ], . . . , [um−1 , um ]. Aus jedem Teilintervall [ui−1 , ui ], 1 ≤ i ≤ m, wählen wir ein ξi aus und bilden die Summe m X S(f, Z, ξi ) := f (~ ϕ(ξi ))|~ ϕ(ui ) − ϕ ~ (ui−1 )|. i=1 f heißt integrierbar über K, falls es ein I ∈ R gibt, sodass für jedes ε ∈ R+ gilt |S(f, Z, ξi ) − I| < ε für alle hinreichend feinen Zerlegungen Z von [a, b], und zwar unabhängig von der Wahl der Zwischenpunkte ξi . I heißt dann der Wert des Kurvenintegrals (zweiter Art) Z f (~x)ds K 91 von f über K. Offensichtlich gilt Z ds. L(K) = K Beispiel Im Fall einer Kurve K im Raum gibt die Zahl Z ds c(~x) K jene Zeit an, welche ein Lichtstrahl in einem (inhomogenen) Medium entlang von K benötigt, falls c(~x) die Ausbreitungsgeschwindigkeit des Lichts im Raumpunkt ~x bezeichnet. 2 Der Wert des Kurvenintegrals (zweiter Art) hängt nur von der Kurve K und der Funktion f , nicht aber von der speziell gewählten Parameterdarstellung von K ab. Ist f stückweise stetig, so existiert Z f (~x)ds, K und es gilt Zb Z f (~x)ds = f (~ ϕ(u))|~ ϕ0 (u)|du. a K 0 Der Ausdruck ds = |~ ϕ (u)|du heißt Bogenelement von K. Also gilt Zb Z L(K) = ds = |~ ϕ0 (u)|du. a K (Vergleiche die früher bereits erwähnte Formel Zb p L(K) = 1 + (f 0 (x))2 dx a für die Länge der Kurve K = {(x, f (x)) | x ∈ [a, b]}.) Kurvenintegrale (zweiter Art) haben weitgehend analoge Eigenschaften wie Bereichsintegrale. Wir erwähnen noch die Formel Z Z f (~x)ds = − f (~x)ds, −K K 92 wobei −K jene Kurve bezeichnet, die aus K durch Änderung der Orientierung, d. h. des Durchlaufungssinns, hervorgeht. Beispiel Die Länge der Zykloide {(u−sin u, 1−cos u) | u ∈ [0, 2π]} beträgt Z2π q Z2π Z2π r √ u 2 (1 − cos u)2 + sin udu = 2 − 2 cos udu = 4 sin2 du = 2 0 0 0 Z2π = 2 u u = 8. sin du = −4 cos |2π 2 2 0 0 Hier wurde die Formel 2 sin2 u = 1 − cos(2u) verwendet, die aus cos2 u + sin2 u = 1 cos2 u − sin2 u = cos(2u) 2 folgt. Ist u ∈ [a, b] und gilt ϕ ~ 0 (u) 6= ~0, so ist {~ ϕ(u)+a~ ϕ0 (u) | a ∈ R} die Tangente an K in ϕ ~ (u) und ϕ ~ 0 (u) ein Tangentenvektor bzgl. K in ϕ ~ (u). Denn ϕ ~ (u + h) − ϕ ~ (u) , h→0 h ϕ ~ 0 (u) := lim und ϕ ~ (u + h) − ϕ ~ (u) h ist ein Vektor, dessen Richtung für h → 0 gegen die Richtung der Tangente an K im Punkt ϕ ~ (u) strebt. Der Vektor ϕ ~ 0 (u) ~t(~ ϕ(u)) := 0 |~ ϕ (u)| heißt dann der Tangentenvektor bzgl. K im Punkt ϕ ~ (u). Sei f~ : K → R2 und ~x ∈ K. Dann bezeichnen wir mit f~t (~x) die Länge der Projektion von f~(~x) auf ~t(~x) (mit Vorzeichen). Es gilt f~t (~x) = f~(~x)~t(~x). f~t heißt die Tangentialkomponente von f~ bzgl. K. Sei f~ stückweise stetig. Wir möchten nun f~ ”über K integrieren”. Zu diesem Zweck definieren wir Z Z f~(~x)d~x := f~t (~x)ds. K K 93 Dann gilt Z f~(~x)d~x = Z f~(~x)~t(~x)ds = Zb = f~(~ ϕ(u))~t(~ ϕ(u))|~ ϕ0 (u)|du = a K K Zb ϕ ~ 0 (u) 0 f~(~ ϕ(u)) 0 |~ ϕ (u)|du = |~ ϕ (u)| a Zb f~(~ ϕ(u))~ ϕ0 (u)du. a Z f~(~x)d~x K heißt das Kurvenintegral (erster Art) von f~ über K. Wieder hängt der Wert dieses Integrals nur vom Vektorfeld f~ und der Kurve K, nicht aber von der speziell gewählten Parameterdarstellung von K ab. Z f~(~x)d~x K kann auch in der Form Z (f1 (~x)dx1 + f2 (~x)dx2 ). K geschrieben werden. Ist f~ ein stückweise stetiges zweidimensionales Vektorfeld auf K, so existiert Z f~(~x)d~x, K und es gilt Z K f~(~x)d~x = Zb (f1 (~ ϕ(u))ϕ01 (u) + f2 (~ ϕ(u))ϕ02 (u))du. a Kurvenintegrale erster Art besitzen weitgehend analoge Eigenschaften wie Kurvenintegrale zweiter Art. Das Kurvenintegral erster Art kann folgendermaßen physikalisch interpretiert werden: Sei f~ ein Kraftfeld in der Ebene. Weiters sei wieder a = u0 < . . . < um = b eine Zerlegung von [a, b] in m Teilintervalle [u0 , u1 ], . . . , [um−1 , um ]. Dann ist 94 die Arbeit, welche geleistet werden muss, um eine Einheitsmasse vom Punkt ϕ ~ (a) entlang der Kurve K zum Punkt ϕ ~ (b) zu verschieben, näherungsweise gleich m X f~t (~ ϕ(ui−1 ))|~ ϕ(ui ) − ϕ ~ (ui−1 )|. i=1 Dieser Ausdruck strebt aber bei zunehmender Feinheit der Zerlegung von [a, b] gegen Z Z f~t (~x)ds = f~(~x)d~x. K K Ist F ein stückweise stetig partiell differenzierbares Skalarfeld im n-dimensionalen Raum, so gilt Zb Z (∇F )(~x)d~x = 0 (∇F )(~ ϕ(u))~ ϕ (u)du = a K = Zb X n a F (~ ϕ(u))|ba Fxi (~ ϕ(u))ϕ0i (u)du = i=1 = F (~ ϕ(b)) − F (~ ϕ(a)). Beispiel Die Arbeit, die geleistet werden muss, um eine Einheitsladung (1 Coulomb) im elektrischen Feld ( y x , ) x+1 y+1 vom Punkt (0, 0) entlang der Kurve K1 = {(u, u) | u ∈ [0, 1]} bzw. K2 = {(u2 , u) | u ∈ [0, 1]} zum Punkt (1, 1) zu verschieben, beträgt Z Z1 f~(~x)d~x = 0 K1 2u du = 2 u+1 Z1 (1 − 1 )du = 2(u − ln |u + 1|)|10 = u+1 0 = 2(1 − ln 2) ≈ 0.61J bzw. Z K2 f~(~x)d~x = Z1 2u2 u2 ( 2 + )du = u +1 u+1 0 Z1 (u + 1 + 1 2 − 2 )du = u+1 u +1 0 2 = ( u 3 π + u + ln |u + 1| − 2 arctan u)|10 = + ln 2 − ≈ 0.62J. 2 2 2 2 95 Dieses Beispiel zeigt, dass der Wert eines Kurvenintegrals im Allgemeinen nicht nur vom Anfangs- und Endpunkt der Kurve, sondern darüber hinaus auch noch von deren Verlauf abhängt. Ein Kurvenintegral, bei dem das nicht R der Fall ist, heißt wegunabhängig. Das Kurvenintegral f~(~x)d~x heißt also K wegunabhängig, falls Z Z f~(~x)d~x = f~(~x)d~x K2 K1 für alle Kurven K1 , K2 mit demselben Anfangs- und Endpunkt ist. Es gilt: Ist G eine offene konvexe Teilmenge der Ebene und f~ ein zweidimensionales stetiges Vektorfeld auf G, so sind folgende Aussagen äquivalent: • R f~(~x)d~x ist wegunabhängig für jede in G enthaltene Kurve K. K • R f~(~x)d~x = 0 für jede geschlossene in G enthaltene Kurve K. K • f~ ist ein Gradientenfeld. (Dabei heißt eine Teilmenge der Ebene konvex, wenn sie mit je zwei Punkten auch deren Verbindungsstrecke enthält.) Klarerweise ist für ein auf einer offenen konvexen Menge definiertes stetig partiell differenzierbares Vektorfeld f~ das Erfülltsein der Integrabilitätsbedingungen notwendig dafür, dass f~ ein Gradientenfeld ist, d. h. dafür, dass das entsprechende Kurvenintegral wegunabhängig ist. Dass die Integrabilitätsbedingungen auf einem nicht einfach zusammenhängenden Gebiet im Allgemeinen nicht hinreichend für die Wegunabhängigkeit des entsprechenden Kurvenintegrals sind, zeigt das folgende Beispiel Integration des auf dem nicht einfach zusammenhängenden Gebiet G := R2 \ {~0} definierten Vektorfeldes ( −y x , 2 ) 2 + y x + y2 x2 über den Rand {(cos u, sin u) | u ∈ [0, 2π]} des Einheitskreises ergibt Z2π sin2 u + cos2 u du = cos2 u + sin2 u 0 Z2π du = 2π 6= 0, 0 96 was zeigt, dass das Kurvenintegral nicht wegunabhängig ist, obwohl die Integrabilitätsbedingung ( −y y 2 − x2 x ) = =( 2 )x y 2 2 2 2 2 x +y (x + y ) x + y2 2 erfüllt ist. Auf einfach zusammenhängenden Gebieten sind die Integrabilitätsbedingungen jedoch hinreichend für die Wegunabhängigkeit des entsprechenden Kurvenintegrals. Abschließend soll nun gezeigt werden, wie gewisse Bereichsintegrale auf Kurvenintegrale zurückgeführt werden können. Bekanntlich gilt nach dem Hauptsatz der Differential- und Integralrechnung für eine auf einem Intervall [a, b] definierte differenzierbare Funktion f Zb f 0 (x)dx = f (b) − f (a), a d. h., der Wert des Integrals Rb f 0 (x)dx hängt nur von den Werten von f am a Rand des Integrationsintervalls [a, b] ab. Auch in höheren Dimensionen liegt manchmal die analoge Situation vor, dass die Integration über einen gewissen Bereich auf die Integration über den Rand des Bereiches zurückgeführt werden kann, falls der ursprüngliche Integrand eine spezielle Form hat. Das ist der Inhalt der sogenannten ”Integralsätze”. Der einfachste dieser Sätze ist der folgende: Greenscher Integralsatz Sei G eine zusammenhängende Teilmenge der Ebene, deren Rand ∂G so orientiert sei, dass G beim Durchlaufen von ∂G links liegt, und (f, g) ein zweidimensionales stetig partiell differenzierbares Vektorfeld auf G. Dann gilt ZZ Z (gx (x, y) − fy (x, y))dxdy = (f (x, y)dx + g(x, y)dy). G ∂G Insbesondere gilt ZZ ∆G = 1 dxdy = 2 G 97 Z (−ydx + xdy). ∂G Beispiel Für das auf dem Einheitskreis G definierte Vektorfeld (f, g) = (x + y, xy) gilt unter Verwendung von Polarkoordinaten 2 Z1 Z2π (gx (x, y) − fy (x, y))dxdy = ( (r sin ϕ − 1)rdϕ)dr = ZZ G 0 Z1 = 0 (−r2 cos ϕ − rϕ)|ϕ=2π ϕ=0 dr = 0 Z1 = −2π rdr = −π, 0 und für das entsprechende Kurvenintegral über den Rand ∂G = {(cos u, sin u) | u ∈ [0, 2π]} ergibt sich Z2π Z (f (x, y)dx + g(x, y)dy) = − 1 sin udu = 2 2 0 ∂G Z2π (cos(2u) − 1)du = 0 1 (sin(2u) − 2u)|2π = 0 = −π. 4 2 6.5 Oberflächenintegrale Unter einer (”fast überall” glatten) Fläche G im Raum verstehen wir das Bild einer Teilmenge B der Ebene unter einer ”fast überall” stetig partiell differenzierbaren Abbildung von B nach R3 . So eine Abbildung heißt dann eine ”Parameterdarstellung” von G. Beispiel Die Abbildungen π (v, w) 7→ (sin v cos w, sin v sin w, cos v) von [0, ] × [0, 2π] nach R3 bzw. 2 √ 2 2 (v, w) 7→ (v, w, 1 − v − w ) von {(x, y) ∈ R2 | x2 + y 2 ≤ 1} nach R3 sind Parameterdarstellungen der Kugelkappe der oberen Hälfte der Einheitskugel. 2 Im Folgenden sei nun G eine Fläche im Raum mit der Parameterdarstellung ϕ ~ : B → G und f eine reellwertige Funktion auf G. Wir wollen f ”über 98 G integrieren”. Zu diesem Zweck betrachten wir wieder eine Zerlegung Z von B in m Teilmengen B1 ,. . . ,Bm mit der Eigenschaft, dass je zwei verschiedene Bi höchstens Randpunkte gemeinsam haben. Aus jedem Bi (1 ≤ i ≤ m) wählen wir ein ξi aus und bilden die Summe S(f, Z, ξi ) := m X f (~ ϕ(ξi )) · ∆(~ ϕ(Bi )). i=1 f heißt integrierbar über G, falls es ein I ∈ R gibt, sodass für jedes ε ∈ R+ gilt |S(f, Z, ξi ) − I| < ε für alle hinreichend feinen Zerlegungen Z von B, und zwar unabhängig von der Wahl der Zwischenpunkte ξi . I heißt dann der Wert des Oberflächenintegrals (zweiter Art) ZZ f (~x)dF G von f über G. Offensichtlich gilt ZZ ∆G = dF. G Der Wert des Oberflächenintegrals (zweiter Art) hängt nur von der Fläche G und der Funktion f , nicht aber von der speziell gewählten ParameterdarRR stellung von G ab. Ist f stückweise stetig, so existiert G f (~x)dF , und es gilt ZZ ZZ f (~ ϕ(v, w))|~ ϕv (v, w) × ϕ ~ w (v, w)|dvdw. f (~x)dF = G B Der Ausdruck dF = |~ ϕv (v, w) × ϕ ~ w (v, w)|dvdw heißt Flächenelement von G. Also gilt ZZ ZZ ∆G = dF = |~ ϕv (v, w) × ϕ ~ w (v, w)|dvdw. G B (Vergleiche die früher bereits erwähnte Formel ZZ q 1 + (fx (x, y))2 + (fy (x, y))2 dxdy ∆G = B für den Flächeninhalt der Fläche G = {(x, y, f (x, y)) | (x, y) ∈ B}.) 99 Oberflächenintegrale (zweiter Art) besitzen weitgehend analoge Eigenschaften wie Kurvenintegrale (zweiter Art). Beispiel Um den Flächeninhalt der Oberfläche G der Einheitskugel zu berechnen, betrachten wir die Parameterdarstellung ϕ ~ : (v, w) 7→ (sin v cos w, sin v sin w, cos v), (v, w) ∈ B := [0, π] × [0, 2π], für die (wie eine leichte Rechnung zeigt) ϕ ~ v (v, w) × ϕ ~ w (v, w) = (sin v)~ ϕ(v, w) für alle (v, w) ∈ B gilt. Nun ist ZZ Zπ ZZ ∆G = dF = B sin vdvdw = B Z2π sin vdv 0 dw = −2π cos v|π0 = 4π. 0 2 Ist (v0 , w0 ) ∈ B und gilt ϕ ~ v (v0 , w0 ) × ϕ ~ w (v0 , w0 ) 6= ~0, so ist {~ ϕ(v0 , w0 ) + a~ ϕv (v0 , w0 ) + b~ ϕw (v0 , w0 ) | a, b ∈ R} die Tangentialebene an G in ϕ ~ (v0 , w0 ) und ϕ ~ v (v0 , w0 )× ϕ ~ w (v0 , w0 ) ein Normalenvektor bzgl. G in ϕ ~ (v0 , w0 ). Denn ϕ ~ v (v0 , w0 ) bzw. ϕ ~ w (v0 , w0 ) sind Tangentenvektoren an die durch den Punkt ϕ ~ (v0 , w0 ) verlaufenden, ganz in G liegenden Kurven mit den Parameterdarstellungen v 7→ ϕ ~ (v, w0 ), v ∈ [v0 −ε, v0 +ε], bzw. w 7→ ϕ ~ (v0 , w), w ∈ [w0 −ε, w0 +ε], (für ein gewisses ε ∈ R+ ), falls (v0 , w0 ) im Inneren von B liegt. Im Fall ϕ ~ v (v0 , w0 ) × ϕ ~ w (v0 , w0 ) 6= ~0 heißt der Vektor ~n(~ ϕ(v0 , w0 )) := ϕ ~ v (v0 , w0 ) × ϕ ~ w (v0 , w0 ) |~ ϕv (v0 , w0 ) × ϕ ~ w (v0 , w0 )| der Normalenvektor bzgl. G im Punkt ϕ ~ (v0 , w0 ). Sei f~ eine Abbildung von G in den Raum und ~x ∈ G. Dann bezeichnen wir mit f~n (~x) die Länge der Projektion von f~(~x) auf ~n(~x) (mit Vorzeichen). Es gilt f~n (~x) = f~(~x)~n(~x). f~n heißt die Normalkomponente von f~ bzgl. G. Wir möchten nun f~ ”über G integrieren”. Zu diesem Zweck definieren wir ZZ ZZ f~(~x)d~x := f~n (~x)dF. G G 100 Dann gilt ZZ f~(~x)d~x = G ZZ = f~(~x)~n(~x)dF = G ZZ = f~(~ ϕ(v, w))~n(~ ϕ(v, w))|~ ϕv (v, w) × ϕ ~ w (v, w)|dvdw = B ZZ ϕ ~ v (v, w) × ϕ ~ w (v, w) = f~(~ ϕ(v, w)) |~ ϕv (v, w) × ϕ ~ w (v, w)|dvdw = |~ ϕv (v, w) × ϕ ~ w (v, w)| B ZZ f~(~ ϕ(v, w))(~ ϕv (v, w) × ϕ ~ w (v, w))dvdw. = B ZZ f~(~x)d~x G heißt das Oberflächenintegral (erster Art) von f~ über G. Offensichtlich hängt der Wert dieses Integrals nicht von der speziell gewählten Parameterdarstellung von G ab. Ist f~ = (f, g, h) und ~x = (x, y, z), so ist statt ZZ f~(~x)d~x G auch die Schreibweise ZZ (f (~x)dydz + g(~x)dzdx + h(~x)dxdy) G gebräuchlich, denn im Fall, dass f~ stückweise stetig ist, gilt mit ϕ ~ = (ϕ, ψ, χ) ZZ ZZ ψv (v, w) ψw (v, w) + f~(~x)d~x = (f (ϕ(v, w), ψ(v, w), χ(v, w)) χ (v, w) χ (v, w) v w G B χ (v, w) χw (v, w) + + g(ϕ(v, w), ψ(v, w), χ(v, w)) v ϕv (v, w) ϕw (v, w) ϕv (v, w) ϕw (v, w) )dvdw, + h(ϕ(v, w), ψ(v, w), χ(v, w)) ψv (v, w) ψw (v, w) da a d b × e = c f 101 b c c a a b e f f d d e für alle a, b, c, d, e, f ∈ R. Formal kann also z. B. dydz, wobei y = ψ(v, w) und z = χ(v, w) ist, durch yv yw dvdw = ψv ψw dvdw χv χw zv zw ersetzt werden. Oberflächenintegrale erster Art besitzen weitgehend analoge Eigenschaften wie Oberflächenintegrale zweiter Art. Physikalisch kann das Integral ZZ f~(~x)d~x G folgendermaßen interpretiert werden: Sei f~ das Geschwindigkeitsfeld einer stationären inkompressiblen Flüssigkeit im Raum. Weiters betrachten wir wieder eine Zerlegung von B in m Teilmengen B1 , . . . , Bm mit der Eigenschaft, dass je zwei verschiedene Bi höchstens Randpunkte gemeinsam haben. Dann ist die pro Zeiteinheit durch die Fläche G in Richtung des entsprechenden Normalenvektors strömende Flüssigkeitsmenge näherungsweise gleich m X f~n (~ ϕ(ξi )) · ∆(~ ϕ(Bi )) i=1 mit ξi ∈ Bi , 1 ≤ i ≤ m. Dieser Ausdruck strebt aber bei zunehmender Feinheit der Zerlegung von B gegen ZZ ZZ ~ fn (~x)dF = f~(~x)d~x. G 6.6 G Divergenz, Gaußscher Integralsatz Sei f~ = (F, G, H) ein dreidimensionales stetig partiell differenzierbares Vektorfeld und ~a = (b, c, d) ∈ R3 . Die Quellendichte Q(f~, ~a) von f~ in ~a ist die Zahl ZZ 1 ~ Q(f , ~a) := lim 3 f~(~x)d~x, h→0 8h ∂Wh (~a) 102 wobei ∂Wh (~a) den Rand des Würfels Wh (~a) := [b − h, b + h] × [c − h, c + h] × [d − h, d + h] bezeichnet und die Seitenflächen von Wh (~a) so orientiert sind, dass der entsprechende Normalenvektor jeweils nach außen zeigt. Ist f~ das Geschwindigkeitsfeld einer stationären inkompressiblen Flüssigkeit, so gibt also Q(f~, ~a) ungefähr die Flüssigkeitsmenge an, die aus einem kleinen Würfel mit dem Mittelpunkt ~a und achsenparallelen Kanten pro Zeiteinheit und pro Volumseinheit herausströmt. Es gilt Q(f~, ~a) = Fx (~a) + Gy (~a) + Hz (~a). Die Divergenz eines n-dimensionalen partiell differenzierbaren Vektorfeldes f~ ist das Skalarfeld n X ~ ∇f := (fi )x . i i=1 Ist n = 3 und f~ stetig partiell differenzierbar, so gilt also Q(f~, .) = ∇f~. Formal kann ∇f~ als skalares Produkt der beiden Vektoren ∇ und f~ gedeutet werden: n X ∂ ∂ ~ ∇f = ( ,..., )(f1 , . . . , fn ) = (fi )xi . ∂x1 ∂xn i=1 f~ heißt quellenfrei, falls ∇f~ = 0 ist. Beispiel Da ∇( y z 1 x , , ) = 6= 0 x 2 + y 2 + z 2 x2 + y 2 + z 2 x2 + y 2 + z 2 x2 + y 2 + z 2 für alle (x, y, z) ∈ R3 \ {~0} gilt, ist dieses Vektorfeld nicht quellenfrei. 2 Beispiel Gegeben sei ein Körper, in dem sich ein Fremdstoff befindet, dessen Konzentrationsverteilung c zu einem bestimmten Zeitpunkt durch c(x, y, z) := 30 x2 + y 2 + z 2 + 2 für alle (x, y, z) ∈ R3 gegeben sei. Die Divergenz des Diffusionsstroms −∇c beträgt dann ∇(−∇c) = 60x 60y 60z , 2 , 2 )= 2 2 2 2 2 2 + + z + 2) (x + y + z + 2) (x + y + z 2 + 2)2 60(6 − x2 − y 2 − z 2 ) = (x2 + y 2 + z 2 + 2)3 = ∇( (x2 y2 103 2 für alle (x, y, z) ∈ R3 . Beispiel Für eine Flüssigkeits- bzw. Gasbewegung gilt im Fall eines kontinuierlichen Stromes die sogenannte ”Kontinuitätsgleichung” ρt + ∇(ρw) ~ = 0, wobei w(x, ~ y, z, t) bzw. ρ(x, y, z, t) die Geschwindigkeit bzw. Dichte der Flüssigkeit bzw. des Gases im Punkt (x, y, z) zum Zeitpunkt t bezeichnet und die Divergenz nur bzgl. der Raumvariablen x, y, z gebildet wird. Es soll gezeigt werden: • Im Fall einer tropfbaren Flüssigkeit ist w ~ quellenfrei. • Im Fall eines homogenen Gases gilt ρt + ρ∇w ~ = 0. • Im Fall einer stationären Bewegung gilt ∇(ρw) ~ = 0. Im ersten Fall ist ρ in Bezug auf x, y, z, t konstant, im zweiten in Bezug auf x, y, z und im dritten in Bezug auf t. 2 Der folgende Integralsatz zeigt, dass die Berechnung eines Integrals einer Funktion über eine zusammenhängende Teilmenge des R3 manchmal auf die Berechnung eines Integrals über den Rand dieser Teilmenge zurückgeführt werden kann. Gaußscher Integralsatz: Sei G eine zusammenhängende Teilmenge des R3 , deren Rand ∂G so orientiert sei, dass der Normalenvektor von ∂G stets nach außen zeigt, und f~ ein dreidimensionales stetig partiell differenzierbares Vektorfeld auf G. Dann gilt: ZZZ ZZ ~ (∇f )(~x)dxdydz = f~(~x)d~x. G ∂G Insbesondere gilt ZZZ ZZ 1 ∆G = dxdydz = (xdydz + ydzdx + zdxdy). 3 ∂G G Bemerkung: Der Gaußsche Integralsatz erscheint plausibel, wenn bedacht wird, dass die pro Zeiteinheit aus einem kleinen Würfel W mit dem Mittelpunkt a ∈ R3 und achsenparallelen Kanten ausströmende Flüssigkeitsmenge einer stationären inkompressiblen Flüssigkeit mit dem Geschwindigkeitsfeld f~ näherungsweise gleich (∇f~)(~a) · ∆W ist. 104 Beispiel Bezeichne G die Einheitskugel, und sei f~ = (xy, x2 + y 2 , x − z). Dann ergibt sich unter Verwendung von Kugelkoordinaten ZZZ (∇f~)(~x)dxdydz = G ZZZ (3r sin ϑ sin ϕ − 1)r2 sin ϑdrdϑdϕ = = [0,1]×[0,π]×[0,2π] Z1 = 3 Zπ 3 r dr 0 Z2π 2 Z1 sin ϕdϕ − sin ϑdϑ 0 0 Zπ 2 r dr 0 Z2π sin ϑdϑ 0 dϕ = 0 1 4π = − · 2 · 2π = − , 3 3 da Z2π sin ϕdϕ = 0 0 ist. Die Parameterdarstellung ϕ ~ : (v, w) 7→ (sin v cos w, sin v sin w, cos v), (v, w) ∈ [0, π] × [0, 2π], von ∂G erfüllt wegen ϕ ~ v (v, w) × ϕ ~ w (v, w) = (sin v)~ ϕ(v, w) für alle (v, w) ∈ [0, π] × [0, 2π] die im Satz genannten Bedingungen, und es gilt ZZ f~(~x)d~x = ∂G Z Z = (sin4 v sin w cos2 w + sin4 v sin w + sin2 v cos v cos w − [0,π]×[0,2π] − sin v cos2 v)dvdw = Zπ Z2π Zπ Z2π 4 2 4 sin vdv sin w cos wdw + sin vdv sin wdw + = 0 0 Zπ + 2 0 Z2π cos wdw − sin v cos vdv 0 0 Zπ 0 105 Z2π sin v cos vdv 0 2π 4π = cos3 v|π0 = − , 3 3 2 dw = 0 da Z2π Z2π 2 sin w cos wdw = 0 Z2π sin wdw = 0 cos wdw = 0. 0 2 Beispiel Mit Hilfe des Gaußschen Integralsatzes ergibt sich für diejenige Stoffmenge, welche bei einem durch das Vektorfeld f~(x, y, z) := (x3 , y 3 , z 3 ) beschriebenen Diffusionsprozess pro Zeiteinheit aus dem Quader [−a, a] × [−b, b] × [−c, c] strömt, der Wert ZZZ (∇f~)(~x)dxdydz = [−a,a]×[−b,b]×[−c,c] Za Zb 2 x dx = 3 −a Zc dy −b 2 2 Za dz + 3 −c 2 −a Zb dx 2 Zc y dy −b Za dz + 3 −c −a Zb dx Zc dy −b z 2 dz = −c = 8abc(a + b + c ). 2 Abschließend sei auf einen Zusammenhang zwischen Divergenz, Gradient und dem bereits früher definierten Laplace-Operator hingewiesen. Für ein zweimal partiell differenzierbares Skalarfeld f gilt nämlich offensichtlich ∂ ∂ ∂ ∂ ,..., )(( ,..., )f ) = ∂x1 ∂xn ∂x1 ∂xn ∂ ∂ ,..., )(fx1 , . . . , fxn ) = fx1 x1 + . . . + fxn xn = ∆f. = ( ∂x1 ∂xn ∇(∇f ) = ( 6.7 Rotation, Stokesscher Integralsatz Sei f~ = (F, G, H) ein dreidimensionales stetig partiell differenzierbares Vektorfeld und ~a = (b, c, d) ∈ R3 . Die Wirbeldichte W1 (f~, ~a) von f~ in ~a in Richtung der x-Achse ist die Zahl Z 1 ~ W1 (f , ~a) := lim 2 f~(~x)d~x, h→0 4h ∂Q1h (~a) wobei ∂Q1h (~a) den Rand des Quadrats Q1h (~a) := {b} × [c − h, c + h] × [d − h, d + h] 106 bezeichnet und ∂Q1h (~a) so orientiert ist, dass Q1h (~a) beim Durchlaufen von ∂Q1h (~a), von der positiven x-Achse her gesehen, links liegt. |W1 (f~, ~a)| kann dann ungefähr als ein Maß dafür angesehen werden, wie stark ein Wirbel von f~ in der Umgebung von ~a innerhalb der Ebene mit der Gleichung x = b vorliegt. Es gilt W1 (f~, ~a) = Hy (~a) − Gz (~a). Analog werden W2 (f~, ~a) und W3 (f~, ~a) definiert. Schließlich wird W (f~, ~a) := (W1 (f~, ~a), W2 (f~, ~a), W3 (f~, ~a)) gesetzt. Es gilt dann W (f~, ~a) = (Hy (~a) − Gz (~a), Fz (~a) − Hx (~a), Gx (~a) − Fy (~a)). Allgemein ist die Rotation eines dreidimensionalen partiell differenzierbaren Vektorfeldes f~ = (F, G, H) das dreidimensionale Vektorfeld ∇ × f~ := (Hy − Gz , Fz − Hx , Gx − Fy ). Ist f~ stetig partiell differenzierbar, so gilt also W (f~, .) = ∇ × f~. Formal kann ∇ × f~ als Vektorprodukt gedeutet werden (es sei wieder f~ = (F, G, H)): ∇ × f~ = ( ∂ ∂ ∂ , , ) × (F, G, H) = (Hy − Gz , Fz − Hx , Gx − Fy ). ∂x ∂y ∂z f~ heißt wirbelfrei, falls ∇ × f~ = ~0 ist. Offensichtlich erfüllt ein dreidimensionales partiell differenzierbares Vektorfeld genau dann die Integrabilitätsbedingungen, wenn es wirbelfrei ist. Daher gilt für jedes dreidimensionale zweimal stetig partiell differenzierbare Skalarfeld f ∂ ∂ ∂ ∂ ∂ ∂ , , ) × (( , , )f ) = ∂x ∂y ∂z ∂x ∂y ∂z ∂ ∂ ∂ = ( , , ) × (fx , fy , fz ) = ∂x ∂y ∂z = (fzy − fyz , fxz − fzx , fyx − fxy ) = ~0. ∇ × (∇f ) = ( Für ein dreidimensionales zweimal stetig partiell differenzierbares Vektorfeld f~ = (F, G, H) gilt ∂ ∂ ∂ ∂ ∂ ∂ ∇(∇ × f~) = ( , , )(( , , ) × (F, G, H)) = ∂x ∂y ∂z ∂x ∂y ∂z ∂ ∂ ∂ = ( , , )(Hy − Gz , Fz − Hx , Gx − Fy ) = ∂x ∂y ∂z = Hyx − Gzx + Fzy − Hxy + Gxz − Fyz = 0. 107 Beispiel Für den Geschwindigkeitsvektor w ~ ×~x eines sich mit konstanter Winkelgeschwindigkeit w ~ = (w1 , w2 , w3 ) um eine durch den Koordinatenursprung gehende Achse drehenden Körpers gilt ∇ × (w ~ × ~x) = ∇ × (w2 z − w3 y, w3 x − w1 z, w1 y − w2 x) = = (w1 + w1 , w2 + w2 , w3 + w3 ) = 2w ~ 2 für alle ~x ∈ R3 . Beispiel Wegen x y z ∇×( 2 , , )= x + y 2 + z 2 x2 + y 2 + z 2 x2 + y 2 + z 2 −2yz + 2yz 2xz − 2xz 2xy − 2xy =( 2 , 2 , 2 ) = ~0 2 2 2 2 2 2 (x + y + z ) (x + y + z ) (x + y 2 + z 2 )2 für alle (x, y, z) ∈ R3 \ {~0} ist das betrachtete Vektorfeld wirbelfrei. 2 Der folgende Integralsatz zeigt, dass die Berechnung eines Integrals eines Vektorfeldes über eine Fläche im Raum manchmal auf die Berechnung eines Integrals über den Rand dieser Fläche zurückgeführt werden kann. Stokesscher Integralsatz: Sei G eine Fläche im Raum, deren Rand ∂G so orientiert sei, dass G beim Durchlaufen von ∂G, von jener Seite, auf welche der Normalenvektor von G zeigt, aus gesehen, links liegt, und f~ ein dreidimensionales, zweimal stetig partiell differenzierbares Vektorfeld auf G. Dann gilt Z ZZ (∇ × f~)(~x)d~x = f~(~x)d~x. G ∂G Beispiel Bezeichne G die Kugelkappe der oberen Hälfte der Einheitskugel, und sei f~(x, y, z) := (x + y, x − z, xy). Wir verwenden wieder die Parameterdarstellung π (v, w) 7→ (sin v cos w, sin v sin w, cos v), (v, w) ∈ [0, ] × [0, 2π], 2 von G. Eine leichte Rechnung zeigt, dass ∇ × f~ = (x + 1, −y, 0) gilt. Daher ist ZZ (∇ × f~)(~x)d~x = G ZZ = (sin3 v cos2 w + sin2 v cos w − sin3 v sin2 w)dvdw = [0,π/2]×[0,2π] 108 Zπ/2 Z2π Zπ/2 Z2π = sin3 vdv cos(2w)dw + sin2 vdv cos wdw = 0, 0 0 0 0 da Z2π Z2π cos(2w)dw = 0 cos wdw = 0 0 gilt. Für ∂G verwenden wir die Parameterdarstellung u 7→ (cos u, sin u, 0), u ∈ [0, 2π]. Dann gilt: Z ∂G Z2π f~(~x)d~x = (− sin u cos u − sin2 u + cos2 u)du = 0 1 = − 2 Z2π (sin(2u) − 2 cos(2u))du = 0. 0 2 Bemerkung: Der Greensche Integralsatz für zweimal stetig partiell differenzierbare Vektorfelder kann als Spezialfall des Stokesschen Integralsatzes aufgefasst werden: Sei G eine zusammenhängende Teilmenge der Ebene, u 7→ (ϕ(u), ψ(u)), u ∈ [a, b], eine Parameterdarstellung von ∂G, ∂G so orientiert, dass G beim Durchlaufen von ∂G links liegt, und (f, g) ein zweidimensionales, zweimal stetig partiell differenzierbares Vektorfeld auf G. Dann ist G × {0} eine Fläche im Raum mit der Parameterdarstellung (v, w) 7→ (v, w, 0), (v, w) ∈ G, und dem Normalenvektor (1, 0, 0) × (0, 1, 0) = (0, 0, 1), u 7→ (ϕ(u), ψ(u), 0), u ∈ [a, b], eine Parameterdarstelllung von ∂(G×{0}) = ∂G×{0} und f~, definiert durch f~(x, y, 0) := (f (x, y), g(x, y), 0) für alle (x, y) ∈ G, 109 ein dreidimensionales stetig partiell differenzierbares Vektorfeld auf G × {0}, und es gilt ZZ ZZ (∇ × f~)(~x)d~x = (0, 0, gx (v, w) − fy (v, w))(0, 0, 1)dvdw = G×{0} G ZZ (gx (x, y) − fy (x, y))dxdy = G und Z f~(~x)d~x = Zb (f (ϕ(u), ψ(u)), g(ϕ(u), ψ(u)), 0)(ϕ0 (u), ψ 0 (u), 0)du = a ∂G Zb = (f (ϕ(u), ψ(u)), g(ϕ(u), ψ(u)))(ϕ0 (u), ψ 0 (u))du = Za = (f (x, y)dx + g(x, y)dy). ∂G 6.8 Differentialformen In diesem Abschnitt wollen wir abschließend die drei bisher besprochenen Integralsätze unter einem einheitlichen Gesichtspunkt zusammenfassen. Unter einer (differenzierbaren alternierenden) Differentialform (vom Grad m ∈ N) verstehen wir einen Ausdruck von der Form ω1 = n X fi1 ...im (~x)dxi1 . . . dxim , i1 ,...,im =1 wobei fi1 ...im n-stellige partiell differenzierbare Funktionen sind. Dabei gelten folgende Rechenregeln: • dxiπ(1) . . . dxiπ(m) = (sgnπ)dxi1 . . . dxim für alle Permutationen π von {1, . . . , m}. • dxi1 . . . dxim = 0, falls es zwei verschiedene Indizes r, s ∈ {1, . . . , m} mit ir = is gibt. 110 (Die zweite Rechenregel folgt aus der ersten.) Ist ω2 eine weitere Differentialform, etwa n X ω2 = gj1 ...jk (~x)dxj1 . . . dxjk , j1 ,...,jk =1 so wird das Produkt ω1 ω2 wie folgt definiert: n X ω1 ω2 := fi1 ...im (~x)gj1 ...jk (~x)dxi1 . . . dxim dxj1 . . . dxjk . i1 ,...,im ,j1 ,...,jk =1 Nun wird eine Differentialform d formal durch d := n X ∂ dxi ∂x i i=1 erklärt. Bei der Bildung des ”Produktes” dω1 ist nun zu beachten, dass die ”Multiplikation” eines Ableitungsoperators mit einer Funktion als Anwendung dieses Operators auf die entsprechende Funktion zu verstehen ist. Die Kurzform des allgemeinen Stokesschen Integralsatzes lautet dann: Allgemeiner Stokesscher Integralsatz: Unter gewissen Voraussetzungen gilt Z Z dω = G ω, ∂G wobei ∂G den Rand von G bezeichnet. Spezialfälle: • d(f dx + gdy) = gx dxdy − fy dxdy (Greenscher Integralsatz) • d(f dydz + gdzdx + hdxdy) = (fx + gy + hz )dxdydz (Gaußscher Integralsatz) • d(f dx + gdy + hdz) = (hy − gz )dydz + (fz − hx )dzdx + (gx − fy )dxdy (Stokesscher Integralsatz) Kontrollfragen 1. Was ist ein Bereichsintegral und wie geht seine Berechnung vor sich? 2. Wie lautet die Substitutionsregel für Bereichsintegrale? 3. Wie sind die Polarkoordinaten, Zylinderkoordinaten bzw. Kugelkoordinaten definiert? 111 4. Was ist eine Kurve? 5. Wie wird ein Skalarfeld bzw. ein Vektorfeld entlang einer Kurve integriert? 6. Wie kann das Integral eines zwei- bzw. dreidimensionalen Vektorfeldes entlang einer Kurve in der Ebene bzw. im Raum interpretiert werden? 7. Was ist eine Fläche im Raum? 8. Wie wird ein Skalarfeld bzw. ein Vektorfeld über eine Fläche im Raum integriert? 9. Wie kann das Integral eines dreidimensionalen Vektorfeldes über eine Fläche im Raum interpretiert werden? 10. Was ist der Gradient, die Divergenz bzw. die Rotation und wie können diese Begriffe interpretiert werden? 11. Wie lauten die Integralsätze von Green, Gauß bzw. Stokes? 12. Wie lautet der Allgemeine Stokessche Integralsatz? 112 Zusammenfassung der verschiedenen Integralbegriffe: ZZ f (~x)d~x B B ⊆ R2 , f : B → R Z Zb f (~x)ds = f (~ ϕ(u))|~ ϕ0 (u)|du a K Z f~(~x)d~x = Zb f~(~ ϕ(u))~ ϕ0 (u)du a K K=ϕ ~ ([a, b]), ϕ ~ : [a, b] → Rn , f : K → R, f~ : K → Rn ZZ ZZ f (~x)dF = f (~ ϕ(v, w))|~ ϕv (v, w) × ϕ ~ w (v, w)|dvdw ZZ B Z ZG f~(~ ϕ(v, w))(~ ϕv (v, w) × ϕ ~ w (v, w))dvdw f~(~x)d~x = G B G=ϕ ~ (B), ϕ ~ : B(⊆ R2 ) → R3 , f : G → R, f~ : G → R3 113 114 Kapitel 7 Übungsaufgaben 1. Bestimmen Sie die Elemente der Symmetriegruppe von Methan. Dabei handelt es sich geometrisch um ein regelmäßiges Tetraeder, in dessen Ecken sich die H-Atome und in dessen Mittelpunkt sich das C-Atom befindet. 2. Bestimmen Sie mittels des Lemmas von Burnside die Anzahl der dichlorsubstituierten Benzole. 3. Bestimmen Sie mittels des Lemmas von Burnside die Anzahl der trichlorsubstituierten Benzole. 4. Bestimmen Sie mittels des Lemmas von Burnside die Anzahl jener Verbindungen, die sich ergeben, wenn in n-Hexan zwei H-Atome durch je ein Br-Atom ersetzt werden. 5. Wie groß muss die Zahl n gewählt werden, damit die Wahrscheinlichkeit dafür, dass bei n-maligem Würfeln mindestens einmal eine Sechs gewürfelt wird, größer als 0.99 ist? (Hinweis: Betrachten Sie das komplementäre Ereignis.) 6. In einer Urne befinden sich n weiße und n schwarze Kugeln. Es werden Teilmengen der 2n-elementigen Kugelmenge K so gezogen, dass jede Teilmenge von K jeweils dieselbe Entnahmewahrscheinlichkeit besitzt. Wie groß ist die Wahrscheinlichkeit dafür, dass bei einem solchen Zug genau n Kugeln gezogen werden bzw. dass bei einem solchen Zug genauso viele weiße wie schwarze Kugeln gezogen werden? Welche der beiden Wahrscheinlichkeiten ist größer? (Hinweis: Die Anzahl jener n-elementigen Teilmengen der 2nelementigen Kugelmenge, die genau i weiße Kugeln (und somit genau n − i 115 schwarze Kugeln) enthalten (0 ≤ i ≤ n) beträgt 2 n n n = .) i n−i i 7. N Körnchen eines Pulvers seien regellos über eine Fläche von A Flächeneinheiten verstreut. Zeigen Sie, dass im Fall, dass a im Vergleich zu A ”sehr klein” ist, die Wahrscheinlichkeit dafür, dass sich auf einem vorgegebenen Flächenteil von a Flächeneinheiten genau n (0 ≤ n ≤ N ) Körnchen befinden, näherungsweise aN (aN/A)n exp(− ) n! A beträgt. 8. Einem Los vom Umfang 10, welches 4 Ausschussstücke enthält, wird eine Stichprobe vom Umfang 3 entnommen. Wie groß ist die Wahrscheinlichkeit dafür, dass die Stichprobe genau 2 Ausschussstücke enthält? Wie groß ist die entsprechende Wahrscheinlichkeit bei Ziehungen ”mit Zurücklegen”? 9. Wie lautet die Wahrscheinlichkeitsverteilung der Anzahl der erratenen Zahlen beim Spiel ”6 aus 45”? Zeigen Sie ohne Zuhilfenahme eines Rechners, dass es wahrscheinlicher ist, genau eine Zahl zu erraten als überhaupt keine Zahl zu erraten. 10. Einem Gemenge, welches aus 600 Körnchen eines Katalysators und 400 Körnchen Quarz besteht, wird eine Stichprobe vom Umfang 50 zufällig entnommen. Wie groß ist näherungsweise die Wahrscheinlichkeit dafür, dass der Anteil der Katalysatorkörnchen in der Stichprobe zwischen 50 % und 70 % liegt? (Für die Verteilungsfunktion Φ der Standardnormalverteilung gilt Φ(1.59) ≈ 0.94.) 11. Wie groß ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte ganze Zahl durch mindestens eine der Zahlen 2, 3 bzw. 5 teilbar ist? 12. In einer Urne befinden sich zwei rote, drei schwarze und eine weiße Kugel. Es werden nacheinander drei Kugeln ohne Zurücklegen gezogen. Berechnen Sie mit Hilfe des Multiplikationssatzes der Wahrscheinlichkeitsrechnung die Wahrscheinlichkeit dafür, dass zuerst eine rote, dann eine schwarze und schließlich eine weiße Kugel gezogen wird. 116 13. Zeigen Sie, dass für eine eindimensionale Zufallsvariable X, für die EX und EX 2 existieren, und für a ∈ R \ {EX} gilt E|X − EX|2 < E|X − a|2 . (Hinweis: |X − a|2 = (X − a)2 und X − a = (X − EX) + (EX − a)) 14. Beweisen Sie unter Benützung von • • • • • Ec = c E(aX + bY ) = aEX + bEY (Linearität des Erwartungswertoperators) V X = E(X − EX)2 K(X, Y ) = E((X − EX)(Y √ √− EY )) ρ(X, Y ) = K(X, Y )/( V X V Y ), falls V X, V Y > 0 folgende Tatsachen: • • • • • • • • • • • E(X − EX) = 0 V X = EX 2 − (EX)2 (Verschiebungssatz für die Varianz) Vc=0 √ E((X − EX)/ V X) = 0, falls V X > 0 K(X, Y ) = E(XY ) − (EX)(EY ) (Verschiebungssatz für die Kovarianz) V X = K(X, X) V (aX + bY ) = a2 V X + 2abK(X, Y ) + b2 V Y V (aX + bY ) = a2 V X + b2 V Y , falls K(X, Y ) = 0 V (X + c) = V X √ V ((X − EX)/ V X) = 1, √ falls V X > 0 √ ρ(X, Y ) = E(((X − EX)/ V X)((Y − EY )/ V Y )), falls V X, V Y > 0. 15. Zeigen Sie, dass für eine nach D{−1,0,1} verteilte Zufallsvariable X gilt, dass die Zufallsvariablen X und X 2 zwar unkorreliert, aber nicht unabhängig sind. 16. Berechnen Sie näherungsweise die Wahrscheinlichkeit dafür, dass die Summe von 100 unabhängigen, nach Ex1 verteilten Zufallsvariablen zwischen 99 und 101 liegt. (Für die Verteilungsfunktion Φ der Standardnormalverteilung gilt Φ(0.1) ≈ 0.54.) 17. Die Zerbrechlichkeit von Nylon-Teststreifen wurde mit Hilfe eines Biegetests untersucht. Jeder der 280 untersuchten Teststreifen wurde an fünf verschiedenen Stellen auf seine Sprödigkeit überprüft; dabei ergaben sich für die Anzahl jener Teststreifen, bei denen kein Bruch bzw. genau ein Bruch 117 bzw. ... bzw. fünf Brüche auftraten, der Reihe nach folgende Zahlen: 157, 69, 35, 17, 1, 1. Es soll mit Hilfe des Chiquadrattests mit der ungefähren Sicherheit 99.9% herausgefunden werden, ob die Brüche völlig zufällig auftraten. (Betrachten Sie vier Klassen von Teststreifen, nämlich Streifen mit keinem Bruch, genau einem Bruch, genau zwei Brüchen bzw. mehr als zwei Brüchen. Nehmen Sie als Schätzwert für den Parameter p der B5,p ein Fünftel des empirischen Mittels. Es gilt χ22,0.999 ≈ 13.82.) 18. Zeigen Sie unter Verwendung der in der Vorlesung erwähnten Schätzfunktion für die Standardabweichung einer normalverteilten Zufallsvariablen, dass für jede ”hinreichend große” positive ganze Zahl n gilt, dass eine Zufallsvariable, die bei 2n unabhängigen Versuchsdurchführungen n-mal den Wert n und n-mal den Wert −n annimmt, höchstwahrscheinlich nicht normalverteilt ist. 19. Lösen Sie y0 = − 4x + 3y + 1 . 3x + 2y + 1 20. Lösen Sie y 0 + y + y 2 = 0. 21. Lösen Sie y 0 + y + y 2 = 2. (Es gibt eine konstante partikuläre Lösung.) 22. Lösen Sie y = xy 0 − (y 0 )2 . 23. Lösen Sie yy 00 = 2(y 0 )2 . 24. Welche der folgenden Funktionen f : R → R ist periodisch, und wie lautet gegebenenfalls die kleinste positive Periode? • f (x) := sin x cos x • f (x) := cos(x2 ) √ • f (x) := 1 + sin2 x 25. Bestimmen Sie die Fourierreihe jener 2π-periodischen Funktion f , für die f (x) = x für alle x ∈ (−π, π) gilt. 26. Bestimmen Sie die Fourierreihe jener 2π-periodischen Funktion f , für die f (x) = x2 für alle x ∈ [−π, π] gilt. Was ergibt sich für x = π? 27. Berechnen Sie DFT((1, 0, 0, 0, . . . , 0, 1)T ) und IDFT(DFT((1, 0, 0, 0, . . . , 0, 1)T )). 118 28. Sei f : R → R definiert durch f (t) := 1 t ∈ [−1, 1] 0 sonst. Berechnen Sie F{f (t)}. 29. Berechnen Sie F −1 {exp(−|ω|)}. 30. Lösen Sie y 2 uux − x2 uuy = x2 y. n P 31. Lösen Sie xi uxi = u (n > 1). i=1 32. Lösen Sie xux − yuy = xy. n P 33. Zeigen Sie ∆( (xi + ai )2 )−n/2+1 = 0, wobei n ∈ N, (a1 , . . . , an ) ∈ Rn i=1 und (x1 , . . . , xn ) ∈ Rn \ {(−a1 , . . . , −an )} ist. 34. Lösen Sie uxx + uyy = 0 u(x, 0) = u(0, y) = u(π, y) = 0 für alle x ∈ [0, π] und alle y ∈ [0, 1] π π u(x, 1) = − | − x| für alle x ∈ [0, π]. 2 2 35. Lösen Sie utt = c2 uxx u(x, 0) = sin x für alle x ∈ R ut (x, 0) = sin x für alle x ∈ R mit Hilfe der D’Alembertschen Lösungsformel. 36. Lösen Sie utt = c2 uxx u(0, t) = u(π, t) = 0 für alle t ∈ R+ 0 u(x, 0) = sin x für alle x ∈ [0, π] ut (x, 0) = sin x für alle x ∈ [0, π] ohne Verwendung der D’Alembertschen Lösungsformel. 119 37. Lösen Sie ut = c2 uxx u(0, t) = u(π, t) = 0 für alle t ∈ R+ 0 u(x, 0) = x(π − x) für alle x ∈ [0, π]. 38. Berechnen Sie für n ∈ N den Wert des Bereichsintegrals ZZZ (xn + y n + z n )dxdydz. [0,1]3 39. Berechnen Sie den Wert des Bereichsintegrals ZZ (x + sin y)dxdy, B wobei B das Innere des Dreiecks mit den Eckpunkten (0,0), (1,0) und (1,1) bezeichnet. 40. Berechnen Sie ohne Verwendung der Substitutionsregel für Bereichsintegrale den Flächeninhalt der Ellipse {(x, y) ∈ R2 | x2 y 2 + 2 ≤ 1} a2 b (a, b ∈ R+ ). 41. Der Verlauf einer frei hängenden Kette wird durch die Gleichung y= 1 cosh(ax + b) + c a (a ∈ R+ ; b, c ∈ R) beschrieben. Berechnen Sie die Länge der Kette zwischen den Punkten (x1 , y1 ) und (x2 , y2 ) (x1 , x2 , y1 , y2 ∈ R, x1 < x2 ). 42. Berechnen Sie den Schwerpunkt der Kurve {(x, cosh x) | x ∈ [0, 1]}. 43. Berechnen Sie den Flächeninhalt der Oberfläche der Paraboloidkappe {(x, y, 1 − x2 − y 2 ) | x, y ∈ R, x2 + y 2 ≤ 1}. 44. Berechnen Sie mittels der Transformation auf Kugelkoordinaten für a > 1 den Wert des Bereichsintegrals ZZZ dxdydz p , 2 x + y 2 + (a − z)2 B 120 wobei B das Innere der dreidimensionalen Einheitskugel (mit Mittelpunkt im Ursprung) bezeichnet. 45. Beweisen Sie, dass unter gewissen Regularitätsvoraussetzungen über f , g, f~ bzw. ~g gilt: • • • • • • ∇(f + g) = ∇f + ∇g ∇(f~ + ~g ) = ∇f~ + ∇~g ∇ × (f~ + ~g ) = (∇ × f~) + (∇ × ~g ) ∇(f g) = (∇f )g + f (∇g) ∇(f~g ) = (∇f )~g + f (∇~g ) ∇ × (f~g ) = (∇f ) × ~g + f (∇ × ~g ) 46. Beweisen Sie, dass unter gewissen Regularitätsvoraussetzungen über ~ f , f bzw. ~g gilt: • ∇(f~ × ~g ) = (∇ × f~)~g − f~(∇ × ~g ) • ∇(∇f ) = ∆f • ∇ × (∇f ) = ~0 • ∇(∇ × f~) = 0 47. Berechnen Sie sämtliche Stammfunktionen des Vektorfeldes (y + z cos(xz), x + 2y 2z , x cos(xz) + + ez ). 2 2 1+y +z 1 + y2 + z2 48. Berechnen Sie die Darstellung des Gradienten des Skalarfeldes z x2 + y 2 + z 2 + 1 in Kugelkoordinaten. 49. Berechnen Sie eine Stammfunktion des Vektorfeldes (− x2 y x , 2 ) 2 + y x + y2 auf R × (R \ {0}). 50. Berechnen Sie den Wert des Kurvenintegrals Z xyzds, K wobei K die Kurve {(cos u, sin u, au) | u ∈ [0, π/2]} (a ∈ R+ ) bezeichnet. 121 51. Beweisen Sie, dass für eine Kurve K mit der Parameterdarstellung ϕ ~ (u) = (r(u) cos u, r(u) sin u), u ∈ [a, b], L(K) = Zb p (r(u))2 + (r0 (u))2 du a gilt. 52. Berechnen Sie die Länge der Kurve {(cos3 x, sin3 x) | x ∈ R}. 53. Berechnen Sie die Zeit, welche ein Lichtstrahl in einem inhomogenen Medium entlang der Kurve {(x, cosh x) | x ∈ [0, 1]} benötigt, wenn die Ausbreitungsgeschwindigkeit c(x, y) der Lichts im Punkt (x, y) den Wert a exp(−x) hat (a ∈ R+ ). 54. Berechnen Sie für i = 1, 2 den Wert des Kurvenintegrals Z ((x2 − y)dx + (y 2 + x)dy), Ki wobei K1 die gerade Linie vom Punkt (0, 1) zum Punkt (1, 2) und K2 die Kurve {(x, x2 + 1) | x ∈ [0, 1]} mit dem Anfangspunkt (0, 1) und dem Endpunkt (1, 2) bezeichnet. 55. Berechnen Sie mit Hilfe des Greenschen Integralsatzes den Wert des Kurvenintegrals Z ((x4 − y 3 )dx + (x3 − y 4 )dy), ∂G wobei G das Innere des Einheitskreises bezeichnet und ∂G im Gegenuhrzeigersinn durchlaufen wird. 56. Berechnen Sie den Wert des Oberflächenintegrals ZZ p x2 + y 2 dF, G wobei G die durch die Parameterdarstellung (v, w) 7→ (v cos w, v sin w, w), (v, w) ∈ [1, 2] × [0, 4π], gegebene Fläche bezeichnet. 57. Sei K eine in der oberen Hälfte der (x, y)-Ebene gelegene Kurve und (ϕ, ψ) : [a, b] → R2 eine stetig differenzierbare Parameterdarstellung von 122 K. Zeigen Sie, dass der Inhalt der durch Rotation von K um die x-Achse entstehenden Fläche Zb 2π p ψ(u) (ϕ0 (u))2 + (ψ 0 (u))2 du a beträgt. 58. Berechnen Sie auf direktem Weg den Wert des Oberflächenintegrals ZZ (xdydz + ydzdx + (z − 1)dxdy), G wobei G die Randfläche der Einheitskugel bezeichnet und ∂G so orientiert sei, dass der entsprechende Normalenvektor stets ”nach außen” zeigt. 123 Index Ap , 18 Bn,p , 18 DM , 18 EX, 26 Exλ , 20 HN,A,n , 18 K(X, Y ), 27 Kn , 29 L(K), 82 N (0, 1), 20 N (m, σ 2 ), 20 Pξ , 18 Sn , 7, 29 Sn2 , 29 S[a,b] , 20 V X, 26 ∗, 57 X̄n , 29 R f~(~x)d~x, 93, 94 K R f (~x)ds, 91 K N, 13 N0 , 18 R, 5 R+ , 18 R− , 29 R+ 0 , 19 Z, 21 −−−→ gradf , 87 ∼, 17 o(x), 31 t-Test, 36 t-Verteilung mit n Freiheitsgraden, 20 tn , 20 DFT, 53 IDFT, 53 n , 14 k Abbildung identische, 5, 8 Ableitung, partielle, 59 höherer Ordnung, 60 Ableitungsfunktion partielle, 59 Alternativverteilung, 18 alternierende Differentialform, 110 Anordnung, 10 Anordnungen zueinander äquivalente, 10 Bereichsintegral, 79 Binomialverteilung, 18 Bogenelement, 92 Borelmengen, 15 n-dimensionale, 15 zweidimensionale, 15 Box-Müller-Methode, 39 Cauchy-Hauptwert, 54 Charakteristik, 61 Chiquadrattest, 37 124 Chiquadratverteilung mit n Freiheitsgraden, 20 einen Punkt, 5 Ebene zulässige, 8 D’Alembertsche Lösungseinfach zusammenhängend, 88 formel, 67 Einhüllende, 45 D’Alembertsche Lösungsformel, 67 D’Alembertscher Lösungsansatz, 66 Eintritt eines Ereignisses, 15 Elementarereignis, 15 Darstellung in Envelope, 45 Kugelkoordinaten, 90 Ereignis, 15 Polarkoordinaten, 89, 90 sicheres, 15 Zylinderkoordinaten, 90 unmögliches, 15 Dichtefunktion einer Ereignisfeld, 15 diskreten WahrscheinlichkeitsverEreignisse teilung, 18 einander ausschließende, 15 stetigen Wahrscheinlichkeitsverpaarweise unabhängige, 23 teilung, 20 unabhängige, 23 Diedergruppe, 7 zueinander komplementäre, 15 Differentialgleichung Erwartung, 26 Bernoullische, 44 Erwartungswert, 26 Clairotsche, 45 Eulersche Formeln, 50 homogene, 41 Exponentialverteilung, 20 inhomogene, 42 partielle, 60 Faltung, 57 quasilineare partielle erster Ord- fast überall, 79 nung, 61 Fast Fourier Transform, 49 Riccatische, 44 Fehler Diffusionsgleichung, 70 erster Art, 36 Dimension zweiter Art, 36 einer Wahrscheinlichkeitsvertei- FFT, 49 lung, 17 Fläche, 82, 98 einer Zufallsvariablen, 17 Flächenelement, 99 eines Wahrscheinlichkeitsraumes, Fourierkoeffizienten, 50 17 Fourierreihe, 50 Divergenz, 103 Fouriertransformation Drehspiegelung, 8 diskrete, 53 Drehung um inverse diskrete, 53 eine Gerade, 8 Fouriertransformierte, 55 125 inverse, 55 Fraktile, 36 Funktion absolut integrierbare, 54 gerade, 51 gerade bzgl. c, 51 harmonische, 64 periodische, 49 stückweise stetig differenzierbare, 50 stückweise stetige, 49 ungerade, 51 ungerade bzgl. c, 51 Gaußtest, 36 Gebiet, 87 Gerade zulässige, 6, 8 glatt, 91 Gleichverteilung diskrete, 18 stetige, 20 Gradient, 87 Gradientenfeld, 87, 88 Guldinsche Regeln, 83 Gaußscher, 104 Greenscher, 97 Stokesscher, 108 integrierbar, 78, 91, 99 Invarianz gegenüber linearen Transformationen, 20 Inversion, 9 Kettenregel für mehrstellige Funktionen, 60 Klein-O, 31 konvexe Menge, 96 Korrelationskoeffizient, 27 empirischer, 35 Kovarianz, 27 empirische, 35 Kugelkoordinaten, 85 Kurve, 82, 91 Kurvenintegral erster Art, 94 wegunabhängiges, 96 zweiter Art, 91 Länge einer Kurve, 82 Lösung, 60 allgemeine, 61 singuläre, 61 Häufigkeit Laplace-Gleichung, 64 absolute, 15 Laplace-Operator, 60 bedingte relative, 23 Lemma von Burnside, 10 relative, 15 Linearität des ErwartungswertoperaHauptsatz der Differential- und Intetors, 28 gralrechnung, 97 Mantelfläche eines Drehkörpers, 83 Integrabilitätsbedingungen, 88 Mittel Integral, 78 einer diskreten WahrscheinlichIntegralsätze, 97 keitsverteilung, 26 Integralsatz einer stetigen Wahrscheinlichkeitsverteilung, 26 Allgemeiner Stokesscher, 111 126 einer Zufallsvariablen, 26 empirisches, 34 Mittelwertsatz für Bereichsintegrale, 80 Multiplikationssatz der Wahrscheinlichkeitsrechnung, 23 Nablaoperator, 87 Normalkomponente, 100 Normalverteilung, 20 Nullhypothese, 35 Oberflächenintegral erster Art, 101 zweiter Art, 99 offen, 87 Parameterdarstellung einer Fläche, 98 Kurve, 91 partielle Ableitung, 59 Permutation, 7 Phasenraum, 24 Poissonverteilung, 18 Polarkoordinaten, 84 Potentialgleichung, 64 Prinzip von Cavalieri, 84 Probenkovarianz, 29 Probenmittel, 29 Probenstandardabweichung, 29 Probenvarianz, 29 Punkt zulässiger, 6 Quellendichte, 102 Realisierung, 33 Riemann-Summe, 78 Rotation, 107 Satz von Moivre, 32 Schärfe eines Tests, 36 Schätzfunktion, 33 erwartungstreue, 33 Schwerpunkt einer Fläche, 82 einer Kurve, 82 eines Bereiches, 81 Schwingungsgleichung, 65 Sicherheit eines Tests, 36 Skalarfeld, 87 Spiegelung an einer Ebene, 8 Geraden, 5 Stammfunktion eines Vektorfeldes, 88 Standardabweichung einer diskreten Wahrscheinlichkeitsverteilung, 26 einer stetigen Wahrscheinlichkeitsverteilung, 26 einer Zufallsvariablen, 26 empirische, 34 Standardnormalverteilung, 20 Statistik Bose-Einsteinsche, 24 Fermi-Diracsche, 24 Maxwell-Boltzmannsche, 24 Studentverteilung mit n Freiheitsgraden, 20 Substitutionsregel für Bereichsintegrale, 84 Symmetriegruppe, 6 Symmetrieoperation im Raum, 8 in der Ebene, 5 zulässige, 6 Symmetrische Gruppe vom Grad n, 7 127 Tangentialkomponente, 93 stetige, 20 WellenausbreitungsgeschwindigTest, 35 2 keit, 66 für die Varianz von N (m, σ ), 36 trigonometrisches Interpolationspro- Wellengleichung, 65 Wirbeldichte, 106 blem, 53 Varianz einer diskreten Wahrscheinlichkeitsverteilung, 26 einer stetigen Wahrscheinlichkeitsverteilung, 26 einer Zufallsvariablen, 26 empirische, 34 Vektorfeld quellenfreies, 103 wirbelfreies, 107 Verschiebungssatz für die Kovarianz, 28 Varianz, 28 Versuch, 14 Versuchsausgang, 14 Verteilung hypergeometrische, 18 Verteilungsfunktion, 20 einer Wahrscheinlichkeitsverteilung, 30 einer Zufallsvariablen, 30 Volumen eines Drehkörpers, 83 Zahl ganze, 21 natürliche, 13 negative reelle, 29 nichtnegative ganze, 18 nichtnegative reelle, 19 positive ganze, 13 positive reelle, 18 reelle, 5 Zelle, 24 Zentraler Grenzverteilungssatz, 32 Ziehungen mit Zurücklegen, 18 ohne Zurücklegen, 19 Zufallsvariable, 17 identisch verteilte, 32 normierte, 28 unabhängige, 29 unkorrelierte, 28 zentrierte, 28 Zufallszahl, 39 Zylinderkoordinaten, 85 Wärmeleitungsgleichung, 70 Wahrscheinlichkeit, 16 bedingte, 23 Wahrscheinlichkeitsraum, 16 diskreter, 18 stetiger, 20 Wahrscheinlichkeitsverteilung, 16 diskrete, 18 einer Zufallsvariablen, 17 128