Integraltransformationen und Distributionentheorie: vorlesungsbegleitende Notizen 8. August 2014 Inhaltsverzeichnis 1 Distributionen 1.1 Der Schwartzraum S(Rd ) . . . . . . . . 1.2 Temperierte Distributionen S 0 (Rd ) . . . 1.3 Differentiation von Distributionen . . . 1.4 Multiplikation und Faltung . . . . . . . 1.4.1 Multiplikation . . . . . . . . . . 1.4.2 Faltung von zwei Funktionen . . 1.4.3 Faltung einer Funktion und einer 1.5 Schwache Topologie auf S 0 (Rd ) . . . . . 1.6 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 4 8 8 8 10 12 16 2 Fouriertransformation 2.1 Fouriertransformation von Funktionen . . . . . . . . . . . . 2.2 Fouriertransformation von Distributionen . . . . . . . . . . 2.3 Charakteristische Funktionen von Wahrscheinlichkeitsmaßen 2.4 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 16 18 21 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Distribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Zufällige Distributionen und verallgemeinerte stochastische Prozesse 1 28 1 Distributionen 1.1 Der Schwartzraum S(Rd ) Notation. Wir verwenden übliche Multiindex-Notation, die Sie aus der Analysis (Taylorreihen für Funktionen mehrerer Variable) vielleicht schon kennen. Sei d ∈ N, α = (α1 , . . . , αd ) ∈ Nd0 , x = (x1 , . . . , xd ) ∈ Rd . Wir schreiben |α| := |α1 | + · · · + |αd | αd 1 xα := xα 1 · · · xd α! := α1 ! · · · αd ! Dα := 1 ∂xα 1 ∂ |α| d · · · ∂xα d Alle unsere Funktionen dürfen komplexe Werte annehmen, z.B. unendlich oft differenzierbare Funktionen: C ∞ (Rd ) = {f : Rd → C | f ist unendlich oft differenzierbar}. Definition 1.1. Zu α, β ∈ Nd0 und f ∈ C ∞ (Rd ) definieren wir ||f ||α,β := sup |xα Dβ f (x)|. x∈Rd Definition 1.2. Der Schwartzraum S(Rd ) ist S(Rd ) := {f ∈ C ∞ (Rd ) | ∀α, β ∈ Nd0 : ||f ||α,β < ∞}. Beispiel. d = 1, f (x) = exp(−x2 ), g(x) = 1/(x2 + 1). Es gilt f ∈ S(R), g ∈ / S(R). Definition 1.3. Eine Menge O ⊂ S(Rd ) heißt offen, falls gilt: für alle f ∈ O existieren ε > 0, m ∈ N und Multiindizes α1 , β1 , . . . , αm , βm ∈ Nd0 , so dass gilt: m \ {g ∈ S(Rd ) | ||g − f ||αj ,βj < ε} ⊂ O. j=1 Notation. Zu f ∈ S(Rd ), α, β ∈ Nd0 und ε > 0 ist Bα,β (f ; ε) := {g ∈ S(Rd ) | ||g − f ||α,β < ε}. Jede solche Menge ist offen (Übungsaufgabe). Lemma 1.4. 1. ∅ und S(Rd ) sind offen. 2. Sei I eine beliebige Indexmenge und (Oi )i∈I eine Familie offener Teilmengen von S(Rd ). Dann ist ∪i∈I Oi ebenfalls offen. 3. Seien O1 , O2 ⊂ S(Rd ) offen. Dann ist O1 ∩ O2 ebenfalls offen. Lemma 1.4 besagt, dass das System T = {O ⊂ S(Rd ) | O ist offen} eine Topologie im Sinne der mengentheoretischen Topologie definiert. Dadurch stehen allgemeine Definitionen wie Konvergenz und Stetigkeit zur Verfügung: • Sei (fn )n∈N eine Folge von Funktionen in S(Rd ) und f ∈ S(Rd ). Dann ist (fn )n∈N konvergent mit Grenzwert f , falls gilt: für jede offene Menge O ⊂ S(Rd ) mit f ∈ O existiert ein n ∈ N0 , so dass für alle n ≥ n0 gilt fn ∈ O. • Eine Abbildung T : S(Rd ) → S(Rd ) heißt stetig, falls Urbilder offener Mengen offen sind, d.h.: für jede offene Menge O ⊂ S(Rd ) ist T −1 (O) auch wieder offen. Ganz ähnlich definiert man Stetigkeit von Abbildungen von S(Rd ) in andere Räume wie z.B. R oder C. 2 Die Definitionen mit offenen Mengen sind oft ein wenig unhandlich. Daher versucht man, so viel wie möglich mit Folgen zu arbeiten. Diese sind einfacher zu handhaben, weil Konvergenz von Folgen äquivalent zu Konvergenz bezüglich der Halbnormen || · ||α,β ist. Lemma 1.5. Sei (fn )n∈N eine Folge von Funktionen in S)(Rd ) und f ∈ S(Rd ). Dann gilt lim fn = f ⇔ ∀α, β ∈ Nd0 : lim ||fn − f ||α,β = 0. n→∞ n→∞ Satz 1.6. Sei (α1 , β1 ), (α2 , β2 ), . . . eine Aufzählung der Elemente von Nd0 × Nd0 . Definiere für f, g ∈ S(Rd ) ∞ X 1 ||f − g||αj ,βj . ρ(f, g) := 2j 1 + ||f − g||αj ,βj j=1 Es gilt: • ρ ist eine Metrik. • O ⊂ S(Rd ) ist offen im Sinne von Definition 1.3 genau dann, wenn O bzgl. der Metrik ρ offen ist, d.h. genau dann, wenn zu jedem f ∈ O ein ε > 0 existiert, so dass {g ∈ S(Rd ) | ρ(f, g) < ε} ⊂ O. Man sagt, die Metrik ρ erzeugt die Topologie auf S(Rd ), und die Topologie auf S(Rd ) ist metrisierbar. Aus Satz 1.6 folgt, dass Sie die Sätze für metrische Räume, die Sie aus der Analysis kennen, auf den Schwartzraum übertragen dürfen. Z.B. ist Stetigkeit äquivalent zu Folgenstetigkeit: Korollar 1.7. Sei T : S(Rd ) → S(Rd ) oder T : S(Rd ) → C. Dann gilt: T ist stetig genau dann, wenn für jede Folge (fn )n∈N mit limn→∞ fn = f gilt: limn→∞ T fn = T f . Für lineare Abbildungen gibt es eine Charakterisierung von Stetigkeit, die der von linearen Abbildungen in normierten Vektorräumen ähnelt: Satz 1.8. Sei T : S(Rd ) → S(Rd ) linear. Dann ist T genau dann stetig, wenn gilt: für alle α, β ∈ Nd0 existieren C > 0 und Multiindizes α1 , β1 , . . . , αm , βm ∈ Nd0 , so dass ∀f ∈ S(Rd ) : ||T f ||α,β ≤ C ||f ||α1 ,β1 + · · · + ||f ||αm ,βm . Satz 1.9. Sei T : S(Rd ) → C linear. Dann ist T genau dann stetig, wenn gilt: es existieren C > 0 und Multiindizes α1 , β1 , . . . , αm , βm ∈ Nd0 , so dass ∀f ∈ S(Rd ) : |T f | ≤ C ||f ||α1 ,β1 + · · · + ||f ||αm ,βm . 1.2 Temperierte Distributionen S 0 (Rd ) Definition 1.10. Eine temperierte Distribution auf Rd ist eine stetige lineare Abbildung von S(Rd ) nach C. Die Menge der temperierten Distributionen wird mit S 0 (Rd ) bezeichnet: S 0 (Rd ) = {T : S(Rd ) → C | T ist stetig und linear}. Im folgenden werden wir oft das Adjektiv “temperiert” weglassen. Distributionen werden auch verallgemeinerte Funktionen genannt; der Grund hierfür wird später ersichtlich. Beispiele. 1. Gutartige Funktionen “sind” Distributionen I : Sei u : R → C messbar und polynomiell beschränkt, d.h. es existieren C > 0 und n ∈ N, soR dass für alle n ∈ N gilt: |u(x)| ≤ ∞ C(1 + |x|n ). Dann ist für alle f ∈ S(R) das Integral −∞ u(x)f (x)dx absolut konvergent, und Z ∞ Tu : S(R) → C, f 7→ Tu f = u(x)f (x)dx −∞ 0 ist eine temperierte Distribution: Tu ∈ S (R). 3 2. Gutartige Funktionen “sind” Distributionen II : Sei p ≥ 1 und u ∈ Lp (R), d.h. u : R → C R p messbar mit R |u(x)| dx < ∞. Definiere Tu wie in Bsp. 1. Es gilt wieder Tu ∈ S 0 (R). 3. Gutartige Maße “sind” Distributionen: Sei µ ein polynomiell beschränktes Maß auf R (Borelσ-Algebra), d.h. es ex. C > 0, n ∈ N mit µ([−D, D]) ≤ C(1 + Dn ) für alle D > 0. Sei Z Sµ : S(R) → C, f 7→ Sµ f = f dµ. R Das Integral R R f dµ ist absolut konvergent, und Sµ ∈ S 0 (R). 4. Dirac-Distribution: Sei a ∈ R und δa : S(R) → C, f 7→ δa (f ) = f (a). Es gilt δa ∈ S 0 (R). Die Dirac-Distributionen kommen von keiner Funktion (es gibt kein u mit δa = Tu ), aber von Maßen (δa = Sµa mit µa = Dirac-Maß in a). 5. Nicht jede Distribution kommt von einer Funktion oder einem Maß : sei δ00 : S(R) → C, f 7→ δ00 (f ) = −f 0 (0). Es gilt δ00 ∈ S 0 (R). 6. Cauchy’scher Hauptwert: die Abbildung 1 P ) : S(R) → C, x 1 f 7→ P )f = lim ε&0 x Z R\[−ε,ε] f (x) dx = x Z 0 ∞ f (x) − f (−x) dx x ist eine temperierte Distribution. Beachte: R x−1 f (x)dx ist im Allgemeinen nicht absolut R∞ konvergent, 0 x−1 (f (x) − f (−x))dx aber schon! R Man lässt oft die Unterscheidung zwischen u und Tu sowie zwischen µ und Sµ fallen. Man schreibt dann direkt u ∈ S 0 (R) (anstatt Tu ∈ S 0 (R)), Lp (R) ⊂ S 0 (R), µ ∈ S 0 (R). 1.3 Differentiation von Distributionen Lemma 1.11. Sei T ∈ S 0 (Rd ) und α ∈ Nd0 . Dann ist die lineare Abbildung S(Rd ) 3 f 7→ (−1)|α| T (Dα f ) ebenfalls in S 0 (Rd ). Definition 1.12. Sei T ∈ S 0 (Rd ) und α ∈ Nd0 . Dann ist Dα T ∈ S 0 (Rd ) definiert durch Dα T f := (−1)|α| T Dα f (f ∈ S(Rd )). Um die verschiedenen Definitionen von Ableitungen zu betonen, spricht man gelegentlich von von distributiver oder schwacher Ableitung; die übliche Ableitung von Funktionen wird dann klassische Ableitung genannt. Bemerkung. Jede Distribution ist unendlich oft differenzierbar. Beispiele. 1. Sei u ∈ C 1 (R) mit polynomiell beschränkter Ableitung u0 . Dann ist u selbst auch polynomiell beschränkt. Es gilt d Tu f = T du f. dx dx Für differenzierbare Funktionen stimmen klassische und distributive Ableitung überein. 4 2. Heaviside-Funktion: Sei ( 1, H(x) := 0, Es gilt im distributiven Sinne dH dx = δ0 , d.h. x ≥ 0, x < 0. d dx TH (1) = δ0 . 3. Stückweise stetig differenzierbare Funktionen mit Sprungstellen: Sei u : R → C stückweise stetig differenzierbar und mit kompaktem Träger, d.h.: es existieren −∞ < a0 < a1 < · · · < an < ∞, so dass (i) u(x) = 0 für x < a0 und x > an . (ii) u ist auf jedem der offenen Intervalle (ak−1 , ak ) stetig differenzierbar. (iii) u besitzt in jedem der Punkte ak Grenzwerte von links und von rechts u(ak −) := lim u(x) u(ak +) := lim u(x), x&ak x%ak Dann gilt im distributiven Sinne: n n X du X 0 = 1(ak−1 ,ak ) (x)u (x) + u(ak +) − u(ak −) δak , dx k=1 d.h.: k=1 n n X X d Tu = T1(ak−1 ,ak ) u0 + u(ak +) − u(ak −) δak . dx k=1 k=1 0 Hierbei steht auf der rechten Seite u für die klassische Ableitung von u. 4. Sei µ ein Wahrscheinlichkeitsmaß auf R und F (x) := µ((−∞, x]). Es gilt im distributiven d Sinne F 0 = µ, d.h.: dx TF = Sµ . 5. Die Ableitung von δ0 ist δ00 (f ) = −δ0 (f 0 ) = −f 0 (0). In all den vorhergehenden Beispielen in d = 1 spielt partielle Integration eine wichtige Rolle. In d ≥ 2 gilt ebenfalls eine Form von partieller Integration. Notation. Für a, b ∈ Cd sei a · b := d X aj bj . j=1 Achtung: das ist nicht das Standardskalarproduct auf Cd !! Das Standardskalarprodukt ist ha, bi = Pd d j=1 aj bj . Wir schreiben ausserdem ej für den j-ten Einheitsvektor in C (Einträge alle gleich Pd 0 ausser dem j-ten Eintrag, dieser gleich 1), und ||a|| = ( j=1 |aj |2 )1/2 für die euklidische Norm von a ∈ Cd . Wir erinnern an den Gaußschen Integralsatz: Sei E : Rd → Rd ein stetig differenzierbares Vektorfeld, und Ω ⊂ Rd ein beschränktes, offenes Gebiet mit Rglattem Rand ∂Ω. Für x ∈ ∂Ω sei n(x) der nach außen zeigende Normalenvektor, und schreibe ∂Ω · · · dS für Oberflächenintegrale. Es gilt Z Z E(x) · n(x)dS. div E(x)dx = Ω ∂Ω Lemma 1.13 (Partielle Integration im Rd ). (a) Seien u, v ∈ C 1 (Rd ) und Ω ⊂ Rd ein beschränktes Gebiet mit glattem Rand. Dann gilt für alle j ∈ {1, . . . , d} Z Z Z ∂v ∂u u(x) (x) dx = − (x)v(x)dx + u(x)v(x)ej · n(x)dS. ∂xj Ω Ω ∂xj ∂Ω 5 (b) Seien u, v ∈ S(Rd ). Es gilt für alle j ∈ {1, . . . , d} Z Z ∂u ∂v (x) dx = − (x)v(x) dx. u(x) ∂xj Rd ∂xj Rd Bemerkung. Der zweite Teil des Lemmas gilt auch für andere Funktionentypen, z.B. v ∈ S(Rd ) und v mit polynomiell beschränkten Ableitungen, oder u stetig differenzierbar (ohne Wachstumsbedingungen) und v stetig differenzierbar mit kompaktem Träger. Übungsaufgabe (Green’sche Identitäten). Sei Ω ⊂ Rd ein beschränktes Gebiet mit glattem Rand und u, v ∈ C 2 (Rd ). Zeigen Sie: Z Z Z u∆v dx = − ∇u · ∇v dx + u∇v · ndS Ω ∂Ω Z Ω Z = (∆u)v dx + (u∇v − v∇u) · ndS. Ω ∂Ω Mit Hilfe der Green’schen Identitäten und partieller Integration im Rd kann man Beispiele für temperierte Distributionen und distributive Ableitungen im Rd , d ≥ 2, behandeln. Beispiele. 1. Sei u ∈ C 1 (Rd ) mit polynomiell beschränkten partiellen Ableitungen. Dann ist auch u polynomiell beschränkt, und es gilt für alle j ∈ {1, . . . , d} ∂ Tu = T ∂u . ∂xj ∂xj Für stetig differenzierbare Funktionen stimmen klassische und distributive Ableitung überein. 2. Coulomb-Potential : Sei d = 3 und V (x) := 1/||x||. Es gilt V ∈ S 0 (R3 ), −∆V = 4πδ0 , R genauer: die Abbildung TV : f 7→ R3 \{0} V (x)f (x)dx definiert eine temperierte Distribution, und −∆TV = 4πδ0 . Übungsaufgabe. Zeigen Sie, dass die folgenden Funktionen temperierte Distributionen definieren, und bestimmen Sie −∆V (im distributiven Sinne): • d = 1, V (x) = −|x|, • d = 2, V (x) = − log ||x||, • d ≥ 3, V (x) = 1/||x||d−2 . Als nächstes verallgemeinern wir den Fundamentalsatz der Differential- und Integralrechnung über den Zusammenhang zwischen Differentiation und Integration auf Distributionen. Ausgangspunkt ist die Gleichung Z 1 ∇u(x + y) − u(x) = y · ∇u(x + ty)dt, 0 die für alle u ∈ C 1 (Rd ) und x, y ∈ Rd gilt. Notation. Sei f : Rd → C und y ∈ Rd . Wir schreiben fy (x) := f (x − y) (x ∈ Rd ) für die translatierte Funktion. Wenn f ∈ S(Rd ), dann ist auch fy ∈ S(Rd ). 6 Satz 1.14 (Hauptsatz der Differential- und Integralrechnung für temperierte Distributionen). Seien T ∈ S 0 (Rd ), f ∈ S(Rd ), und y ∈ Rd . Es gilt Z T (fy ) − T (f ) = 1 d X yj 0 j=1 ∂ T (fty )dt. ∂xj Lemma 1.15. Seien T ∈ S 0 (Rd ) und f, ϕ ∈ S(Rd ). Es gilt: (a) Die Abbildung Rd → C, y 7→ T (fy ) ist unendlich oft differenzierbar und polynomiell beschränkt. Die partiellen Ableitungen sind ∂ ∂ T fy = T (fy ) ∂yj ∂xj (j = 1, . . . , d). R R ϕ(y)T (fy )dy = Rd f (y)T (ϕy )dy. R R Bemerkung. Es gilt Rd ϕ(y)T (fy )dy = T (ϕ∗f ), wobei f ∗ϕ (x) = Rd f (y)ϕ(x−y)dy die Faltung von f und ϕ ist. Dass man die Rollen von ϕ und f vertauschen kann, liegt an der Kommutativität der Faltung (f ∗ ϕ = ϕ ∗ f ). (b) Rd Übungsaufgabe. Vervollständigen Sie den in der Vorlesung skizzierten Beweis von Teil (b), unter Verwendung von (a). Zeigen Sie hierzu: 1. Es gilt Z ϕ(y)T (fy ) = lim h&0 Rd X hd ϕ(hk)T (fhk ). k∈Zd (Tipp: Spalten Sie Rd in einen großen Würfel [−R, R]d und den Rest Rd \[R, R]d auf, approximieren Sie das Integral über den Würfel durch Riemannsummen, schätzen Sie Beiträge über den Rest mit Hilfe des polynomiellen Abfalls der Funktionen ab, und verwenden Sie ein ε/3-Argument.) R P 2. Betrachten Sie die Funktionen g(x) := Rd ϕ(y)fy (x), g h (x) := k∈Zd hd ϕ(hk)fhk (x). Zeigen Sie: g, g h ∈ S(Rd ) und für jede Nullfolge (hn ) gilt g hn → g in S(Rd ). R R 3. Folgern Sie aus 1. und 2., dass Rd ϕ(y)T (fy )dy = T Rd ϕ(y)fy dy = T g. 4. Zeigen Sie, dass für alle x ∈ Rd gilt 5. Folgern Sie Z ϕ(y)T (fy ) = T Rd Z R Rd ϕ(y)fy (x)dy = Z ϕ(y)fy dy = T Rd R Rd f (y)ϕy (x)dy. Z f (y)ϕy dy = Rd f (y)T (ϕy )dy. Rd Satz 1.16 (Äquivalenz von klassischer und distributiver Ableitung). (a) Sei u ∈ C 1 (Rd ) mit polynomiell beschränkten partiellen Ableitungen auch u polynomiell beschränkt, und es gilt: ∂ Tu = T ∂u ∂xj ∂xj ∂u ∂u ∂x1 , . . . , ∂xd . Dann ist (j = 1, . . . , d). (b) Sei T ∈ S 0 (Rd ). Angenommen, es gibt polynomiell beschränkte, stetige Funktionen v1 , . . . , vd , ∂ sodass für alle j ∈ {1, . . . , d} gilt ∂x T = Tvj . Dann existiert eine polynomiell beschränkte, j stetig differenzierbare Funktion u ∈ C 1 (Rd ), so dass • ∂u ∂xj (x) = vj (x) für alle x ∈ Rd und alle j ∈ {1, . . . , d}. 7 • T = Tu . Teil (a) ist uns schon in der Beispielliste begegnet, Teil (b) besagt insbesondere, dass: wenn die partiellen Ableitungen erster Ordung einer Distribution T Funktionen (v1 , . . . , vd ) sind, dann ist auch T eine Funktion (u). Der Beweis stützt sich auf das folgende Lemma: R Lemma 1.17. Seien u, v : Rd → C polynomiell beschränkt und stetig. Angenommen, Rd uf = R vf für alle f ∈ S(Rd ). Dann gilt u(x) = v(x) für alle x ∈ Rd . Rd Ein wichtiger Spezialfall von Satz 1.16(b) ist v1 (x) = v2 (x) = · · · = vd (x) = 0 (x ∈ Rd ): Satz 1.18. Sei T ∈ S 0 (Rd ). Es gelte Konstante C ∈ C, so dass ∂ ∂xj T d ∀f ∈ S(R ) : = 0 für alle j ∈ {1, . . . , d}. Dann existiert eine Z Tf = C f (x)dx. Rd 1.4 1.4.1 Multiplikation und Faltung Multiplikation Definition 1.19. OM (Rd ) ist die Menge der Funktionen f ∈ C ∞ (Rd ), für die gilt: die Funktion f selbst und sämtliche partiellen Ableitungen ∂ α f (α ∈ Nd0 ) sind polynomiell beschränkt. Bemerkung. OM (Rd ) ist die Klasse der Funktionen, die man mit temperierten Distributionen multiplizieren kann; die Buchstaben stehen für “opérateurs de multiplication”. Lemma 1.20. Sei T ∈ S 0 (Rd ) und v ∈ OM (Rd ). (a) Sei f ∈ S(Rd ). Dann ist auch vf ∈ S(Rd ). (b) Die Abbildung S(Rd ) → C, f 7→ T (vf ) ist eine temperierte Distribution. Definition 1.21. Sei T ∈ S 0 (Rd ) und v ∈ OM (Rd ). Das Produkt vT von v und T ist die Distribution vT : S(Rd ) → C, f 7→ vT (f ) := T (vf ). Beispiele. Sei v ∈ OM (Rd ). 1. Sei u : Rd → C messbar und polynomiell beschränkt. Es gilt vTu = Tuv . 2. vδ0 = v(0)δ0 . 3. Sei d = 1. Es gilt vδ00 = −v 0 (0)δ0 + v(0)δ00 . Lemma 1.22 (Produktregel). Sei T ∈ S 0 (Rd ) und v ∈ OM (Rd ), j ∈ {1, . . . , d}. Es gilt OM (Rd ) und ∂ ∂ ∂v (vT ) = T +v T. ∂xj ∂xj ∂xj 1.4.2 ∂ ∂xj v Faltung von zwei Funktionen Definition 1.23. Seien f, g : Rd → C messbare Funktionen. Zu x ∈ Rd sei Z f ∗ g(x) := f (y)g(x − y)dy, Rd sofern das Integral absolut konvergent ist. f ∗ g(x) ist die Faltung von f und g an der Stelle x. Bemerkung. • Die Faltung f ∗ g ist nicht für alle Funktionen wohldefiniert. 8 ∈ • Die Faltung ist kommutativ: Wenn das Integral für f ∗ g(x) absolut konvergent ist, dann ist auch das Integral für g ∗ f (x) absolut konvergent, und es gilt f ∗ g(x) = g ∗ f (x). Beispiele. 1. Seien X, Y reellwertige, unabhängige Zufallsvariable mit Wahrscheinlichkeitsdichten ρX , ρY . Dann hat X + Y die Wahrscheinlichkeitsdichte ρX+Y = ρX ∗ ρY . (Genau genommen weiss man nur: das Integral für ρX ∗ρY (x) ist für Lebesgue-fast alle x ∈ Rd absolut konvergent, und es gilt ρX+Y (x) = ρX ∗ ρY (x) für Lebesgue-fast alle x ∈ Rd .) 2. Zu σ > 0 sei fσ2 (x) := √ x2 exp − 2 . 2σ 2πσ 2 1 Es gilt für alle σ1 , σ2 > 0: fσ12 ∗ fσ22 = fσ12 +σ22 . (Hier kann man zeigen, dass das Integral für fσ12 ∗ fσ22 (x) tatsächlich für alle x ∈ R absolut konvergent ist. ) Technische Bemerkung zur Definition der Faltung. In vielen Situationen weiss man, dass das InteR gral Rd f (y)g(x − y)dy vielleicht nicht für alle x ∈ Rd , aber doch für Lebesgue-fast alle x ∈ Rd existiert. Man kann dann eine messbare Nullmenge N ⊂ Rd und eine messbare Funktion h : Rd → C finden, so dass Z Z ∀x ∈ Rd \N : |f (y)g(x − y)|dy < ∞ und h(x) = f (y)g(x − y)dy. Rd Rd Die Nullmenge N und die Funktion h sind nicht eindeutig. Es gilt aber: wenn Ñ , h̃ eine weitere mögliche Wahl ist, dann ist h(x) = h̃(x) für Lebesgue-fast alle xR∈ Rd . Wir bezeichnen dann jede mögliche Wahl h mit f ∗ g. Wenn Rd f (y)g(x − y)dy nicht für alle, sondern nur für Lebesgue-fast alle x ∈ Rd absolut konvergent ist, dann ist f ∗ g als Funktion nicht ganz eindeutig, sondern nur bis auf Nullmengen definiert. Lemma 1.24 (Hinreichende Bedingungen für die Existenz von f ∗g). Seien f, g : Rd → C messbar. R R R (a) Es gelte Rd |f | < ∞ und Rd |g| < ∞. Dann ist Rd |f (y)g(x − y)|dy < ∞ für Lebesgue-fast alle x ∈ Rd , und Z Z Z |f ∗ g| ≤ |f | |g| . Rd Rd (b) Seien p, q ∈ [1, ∞) mit p1 + 1q = 1. Es gelte R |f (y)g(x − y)|dy < ∞ für alle x ∈ Rd und Rd sup |f ∗ g| ≤ Rd Z Rd R Rd |f |p |f |p < ∞ und 1/p Z Rd |g|q 1/q R Rd |g|q < ∞. Dann gilt . Rd R R (c) Es gelte Rd |f | < ∞ und supRd |g| < ∞. Dann ist Rd |f (y)g(x − y)|dy < ∞ für alle x ∈ Rd , und es gilt Z sup |f ∗ g| ≤ |f | sup |g|. Rd Rd 9 Rd Bemerkung (Young-Ungleichung). Es gilt sogar etwas allgemeiner: seien p, q, r ∈ [1, ∞) ∪ {∞} mit 1 1 1 p + q = 1 + r , wobei 1/∞ = 0. Dann gilt: f ∈ Lp (Rd ), g ∈ Lq (Rd ) ⇒ f ∗ g ∈ Lr (Rd ) und ||f ∗ g||r ≤ ||f ||p ||g||q , wobei ||f ||p := R Rd sup |f |p Rd 1/p p < ∞, , |f |, p = ∞. und f ∈ Lp (Rd ) :⇔ ||f ||p < ∞. Lemma 1.24 entspricht den Spezialfällen (a) p = q = r = 1, (b) p, q ∈ [1, ∞), r = ∞ und (c) p = 1, q = r = ∞. Satz 1.25 (Die Faltung ist assoziativ). Seien f, g, h : Rd → C absolut integrierbare Funktionen. Es gilt (f ∗ g) ∗ h = f ∗ (g ∗ h). Satz 1.26 (Faltung und Differentiation). Sei f : Rd → C absolut integrierbar und g ∈ C 1 (Rd ) mit ∂ g, j = 1, . . . , d. Dann ist auch f ∗ g stetig differenzierbar, beschränkten partiellen Ableitungen ∂x j und es gilt: ∂ ∂g f ∗g =f ∗ (j = 1, . . . , d). ∂xj ∂xj Lemma 1.27 (Approximation von absolut integrierbaren Funktionen durch Treppenfunktionen). Sei Q := {[a1 , b1 ) × · · · [ad , bd ) | a1 , b1 , . . . , bd ∈ R} die Menge der halboffenen Quader. Sei f : Rd → C messbar und absolut integrierbar. Dann gibt es zu jedem δ > 0 Quader Q1 , . . . , Qm ∈ Q und Zahlen λ1 , . . . , λm ∈ C, so dass Z m X λj 1Qj < δ. f − Rd j=1 Für den Beweis siehe Theorem 1.18 im Buch “Analysis” von Lieb und Loss. Satz 1.28 (Approximation von absolut integrierbaren Funktionen durch C ∞ -Funktionen). Sei R d d f : R → C messbar, absolut integrierbar. Sei ϕ ∈ S(R ) mit Rd ϕ = 1. Setze ϕε (x) := ε−d ϕ(x/ε). Es gilt: (a) ϕε ∗ f ∈ C ∞ (Rd ) R (b) limε→0 Rd |ϕε ∗ f − f | → 0. Übungsaufgabe. Sei d = 1, ϕ(x) = 1[−1,1] (x)/2, ϕε (x) = ε−1 ϕ(x/ε) und H(x) = 1[0,∞) (x) die Heaviside-Funktion. Zeigen Sie: (a) Das Integral für ϕε ∗ H ist absolut konvergent. R x+ε 1 (b) Es gilt ϕε ∗ H(x) = 2ε H(x0 )dx0 . x−ε (c) ϕε ∗ H ist im Gegensatz zu H stetig, und es gilt 1.4.3 R R |ϕε ∗ H − H| → 0. Faltung einer Funktion und einer Distribution Definition 1.29. OC (Rd ) ist die Menge der messbaren Funktionen v : Rd → C, für die gilt: Z α d x u(x)dx < ∞. ∀α ∈ N0 : Rd Beispiele. 10 1. Jede Schwartzfunktion f ∈ S(Rd ) ist in OC (Rd ). p 2. Sei d = 1, f (x) = exp(−x2 )/ |x| für x 6= 0, f (0) := 0. Es gilt f ∈ OC (R). Lemma 1.30. Sei v ∈ OC (Rd ), T ∈ S 0 (Rd ). Es gilt: (a) Wenn f ∈ S(Rd ), dann ist auch v ∗ f ∈ S(Rd ). (b) Die Abbildung S(Rd ) → S(Rd ), f 7→ v ∗ f ist stetig, und die Abbildung S(Rd ) → C, f 7→ T (v ∗ f ) ist eine temperierte Distribution. Da für v ∈ OC (Rd ) auch die reflektiere Funktion v R (x) := v(−x) in OC (Rd ) ist, gelten die Aussagen des Lemmas auch, wenn wir in (a) und (b) v durch v R ersetzen. Definition 1.31. Sei v ∈ OC (Rd ), T ∈ S 0 (Rd ). Die Faltung v ∗ T von v und T ist die temperierte Distribution v ∗ T : S(Rd ) → C, f 7→ v ∗ T (f ) := T v R ∗ f . Beispiele. 1. Sei v ∈ OC (Rd ), u ∈ OM (Rd ). Dann ist polynomiell beschränkt, und v ∗ Tu = Tv∗u . R Rd v(y)u(x − y)dy für alle x ∈ Rd , v ∗ u ist 2. Sei v ∈ OC (Rd ). Es gilt v ∗ δ0 = Tv . 3. Sei v ∈ OC (Rd ) ∩ C 1 (R). Es gilt v ∗ δ00 = T dv . dx Lässt man die Unterscheidung zwischen v und Tv fallen, werden Beispiel 2 und 3 zu v ∗ δ0 = v, v ∗ δ00 = v 0 . Übungsaufgabe (Faltung einer Funktion und eines Maßes). Sie v : Rd → C messbar und beschränkt, R d µ ein Wahrscheinlichkeitsmaß auf R und Sµ f = Rd f dµ. Zeigen Sie: R (a) Das Integral Rd v(x − y)µ(dy) ist für alle x ∈ Rd absolut konvergent. R (b) Setze (v ∗ µ)(x) := Rd v(x − y)µ(dy). Es gilt v ∗ Sµ = Tv∗µ . Satz 1.32 (Faltung und Differentiation). Sei v ∈ OC (Rd ) und T ∈ S 0 (Rd ). Es gilt für alle α ∈ Nd0 Dα (v ∗ T ) = v ∗ Dα T. Die Faltung einer Schwartz-Funktion mit einer temperierten Distribution ist eine OM -Funktion: Satz 1.33. Sei v ∈ S(Rd ) und T ∈ S 0 (Rd ). Dann existiert eine Funktion u ∈ OM (Rd ) mit v ∗ T = Tu . R Satz 1.34. Sei T ∈ S 0 (Rd ) und ϕ ∈ S(Rd ) mit Rd ϕ = 1. Setze ϕε (x) := ε−d ϕ(x/ε). Dann gilt: ∀f ∈ S(Rd ) : lim ϕε ∗ T f = T f. ε→0 Da nach Satz 1.33 ϕε ∗ T durch eine OM -Funktion darstellbar ist, kann man also jede Distribution in einem geeigneten Sinne durch eine OM -Funktion approximieren. Beweis. Wir führen den Beweis für d = 1; der Fall d ≥ 2 ist analog. Wir zeigen zunächst ϕε ∗f → f in S(Rd ), zuerst im Fall d = 1. Seien also f ∈ S(R) und α, β ∈ N0 . Es gilt i h i dβ h dβ f dβ f xα β ϕε ∗ f (x) − f (x) = xα ϕε ∗ β (x) − β (x) dx dx dx Z df β dβ f = xα ϕ(y) (x − εy) − (x) dy dxβ dxβ R Z Z 1 dβ+1 f = −εxα ϕ(y) y β+1 (x − εty)dt dy dx R 0 α Z 1 Z X α dβ+1 f (εty)k yϕ(y)(x − εty)α−k β+1 (x − εty)dy dt = −ε k dx 0 R k=0 11 Für ε ∈ (0, 1) folgt mit Hilfe der Dreiecksungleichung und |εt| ≤ 1, dass ||ϕε ∗ f − f ||α,β ≤ ε α Z X α k=0 k |y k+1 ϕ(y)|dy ||f ||α−k,β+1 R und es folgt |||ϕε ∗ f − f ||α,β → 0 bei ε → 0. Da das für alle α, β ∈ N0 gilt, folgt ϕε ∗ f → f R in S(R). Das gleiche Argument angewendet auf die reflektierte Funktion ϕR ε zeigt ϕε ∗ f → f in S(R), für alle f ∈ S(R). Da T stetig ist, folgt ∀f ∈ S(R) : ϕε ∗ T (f ) = T (ϕR ε ∗ f ) → T f. 1.5 Schwache Topologie auf S 0 (Rd ) Es gibt mehrere mögliche Definitionen von offenen Mengen im S 0 (Rd ), die zu verschiedenen Topologien führen. Hier soll nur die schwache Topologie, auch schwach-∗ Topologie (gelesen “schwach Stern”) und σ(S 0 , S)-schwache Topologie genannt, angeführt werden. Definition 1.35 (Offene Mengen). Eine Menge O ⊂ S 0 (Rd ) ist offen, falls entweder (i) O = ∅ oder (ii) O = 6 ∅ und für alle T ∈ O existieren f1 , . . . , fm ∈ S(Rd ), so dass gilt: m \ S ∈ S 0 (Rd ) | |Sfj − T fj | < ε ⊂ O. j=1 Lemma 1.36 (Topologie-Eigenschaften). Sei T := {O ⊂ S 0 (Rd ) | O ist offen}. Es gilt: (a) ∅ ∈ T und S 0 (Rd ) ∈ T . (b) Sei I eine beliebige Indexmenge und (Oi )i∈I eine Familie von Mengen Oi ∈ T . Dann ist ∪i∈I Oi ebenfalls in T . (c) Seien O1 , O2 ∈ T offen. Dann ist O1 ∩ O2 ebenfalls in T . Das System T der offenen Mengen definiert also eine Topologie im Sinne der mengentheoretischen Topologie und wir können auf die Definitionen von Stetigkeit und Konvergenz zurückgreifen, an die nach Lemma 1.4 erinnert wurde. Übungsaufgabe. Zu f ∈ S(Rd ) sei pf (T ) := |T f |. Es gilt: (a) pf ist eine Halbnorm auf S 0 (Rd ), d.h.: (i) Nichtnegativität: Für alle T ∈ S 0 (Rd ) ist pf (T ) ≥ 0. (ii) Homogenität: für alle λ ∈ C und alle T ∈ S 0 (Rd ) gilt pf (λT ) = |λ|pf (T ). (iii) Dreiecksungleichung: für alle S, T ∈ S 0 (Rd ) gilt pf (S + T ) ≤ pf (S) + pf (T ). (b) Sei ε > 0 und T ∈ S 0 (Rd ). Dann ist Bf (T ; ε) := {S ∈ S 0 (Rd ) | pf (S − T ) < ε} offen. (c) Es gilt für alle f ∈ S(Rd ): die Abbildung pf : S 0 (Rd ) → R ist stetig. (d) Sei T̃ eine Topologie auf S 0 (Rd ), d.h. eine Menge von Teilmengen von S 0 (Rd ), die die Eigenschaften (a),(b) und (c) von Lemma 1.36 erfüllt. (i) Angenommen, jeder Ball Bf (T ; ε) (f ∈ S(Rd ), T ∈ S 0 (Rd ), ε > 0) ist in T̃ . Dann gilt T ⊂ T̃ . 12 (ii) Angenommen, jede der Halbnormen pf , f ∈ S(Rd ), ist stetig bzgl. T̃ (d.h. p−1 f (U ) ∈ T̃ für alle offenen U ⊂ R). Dann gilt T ⊂ T̃ . Teil (d) wird meist wie folgt zusammengefasst: T ist die gröbste Topologie, bzgl. der alle Halbnormen pf stetig sind. Alternativ: T ist die von den Halbnormen pf erzeugte Topologie. Satz 1.37 (Konvergenz von Folgen). Sei (Tn )n∈N eine Folge von temperierten Distributionen und T ∈ S 0 (Rd ). Dann gilt lim Tn = T ⇔ ∀f ∈ S(Rd ) : lim Tn f = T f. n→∞ n→∞ Bemerkung (Konvergenz einer Distributionenschar). Es gilt ebenfalls: sei (Tε )ε>0 eine Familie von temperierten Distributionen und T ∈ S 0 (Rd ). Dann gilt lim Tε = T ⇔ ∀f ∈ S(Rd ) : lim Tε f = T f. ε→0 ε&0 Beweis von Satz 1.37. “⇒”: Angenommen, Tn → T . Sei f ∈ S(Rd ) und ε > 0. Da Oε := {S ∈ S 0 (Rd ) | |T f − Sf | < ε} offen ist und T ∈ Oε , existiert wegen Tn → T ein n0 ∈ N, so dass für alle n ≥ n0 gilt Tn ∈ Oε , also |Tn f − T f | < ε für alle n ≥ n0 . Daraus folgt die Konvergenz Tn f → T f . “⇐”: Es gelte Tn f → T f für alle f ∈ S(Rd ). Sei O ⊂ S 0 (Rd ) offen mit T ∈ O. Es existieren also ε > 0 und f1 , . . . , fm ∈ S(Rd ), so dass gilt: für alle S ∈ S 0 (Rd ) mit maxj=1,...,m |Sfj − T fj | < ε ist S ∈ O. Da Tn fj → T fj für alle j = 1, . . . , m, ist für hinreichend großes n auch maxj=1,...,m |Tn fj − Tj | < ε und damit Tn ∈ O. Die Topologie auf S 0 (Rd ) ist im Gegensatz zur Topologie auf S(Rd ) nicht metrisierbar. Für beliebige Abbildungen Φ : S 0 (Rd ) → S 0 (Rd ) ist Folgenstetigkeit nicht äquivalent zu Stetigkeit. Es gilt dennoch: Satz 1.38 (Stetigkeit von linearen Abbildungen). Sei Φ : S 0 (Rd ) → S 0 (Rd ) eine lineare Abbildung. Die folgenden Aussagen sind äquivalent: (a) Φ ist stetig. (b) Φ ist folgenstetig, d.h. für jede Folge (Tn )n∈N mit Tn → T in S 0 (Rd ) gilt Φ(Tn ) → Φ(T ). Der Beweis des Satzes ist schwierig und soll hier nicht geführt werden. Er greift auf die Theorie der topologischen Vektorräume zurück. Beispiele. 1. Zusammenhang mit schwacher Konvergenz von Wahrscheinlichkeitsmaßen: Seien µn (n ∈ N) und µ Wahrscheinlichkeitsmaße auf Rd . Die schwache Konvergenz von Wahrscheinlichkeitsmaßen ist wie folgt definiert: (µn )Rkonvergiert Rschwach gegen µ, wenn für jede beschränkte, stetige Funktion f : Rd → R gilt: Rd f dµn → Rd f dµ. Man schreibt dann µn * µ. Es gilt µn * µ ⇒ Sµn → Sµ . wobei Sµ f = R Rd f dµ. 2. Masse wandert ins Unendliche ab: Sei d = 1, und u : Rd → C eine beschränkte Funktion mit lim|x|→∞ u(x) = 0. Setze un (x) := u(x − n). Es gilt Tun → 0. 3. Starke Oszillationen: Sei d = 1, un (x) = exp(inx). Es gilt Tun → 0. 4. Dipol : Sei d = 1. Es gilt 1 lim (δ0 − δε ) = δ00 . ε Die physikalische Interpretation ist die folgende: die linke Seite stellt eine Ladungsverteilung dar, bei der im Punkt x = 0 ein Teilchen mit positiver Ladung q(ε) = 1/ε und in x = ε ein Teilchen mit negativer Ladung −q(ε) = −1/ε sitzt. Der Grenzwert δ00 stellt einen Dipol dar. ε&0 13 5. Sokhotskii’s Formel : d = 1. Es gilt lim ε&0 1 1 =P − iπδ0 . x + iε x Auf der linken Seite ist wie üblich die Distribution T1/(x+iε) gemeint. 6. Poissonsche Summenformel : d = 1. PN (a) Die Folge DN (x) = n=−N exp(inx), N ∈ N, ist im distributiven SinnePkonvergent, d.h. ∞ es existiert eine Distribution T mit limN →∞ TDN = T . Wir schreiben n=−∞ exp(inx) für die Grenzdistribution T . (b) Die Grenzdistribution erfüllt die Gleichung ∞ X exp(inx) = 2π n=−∞ Die Distribution P n∈Z δ2πn X δ2πn . n∈Z wird Dirac-Kamm genannt. Bemerkung. Die Funktion DN wird oft Dirichlet-Kern genannt und tritt in der Theorie der Fourier-Reihen auf. Für x ∈ / 2πZ ist DN (x) = sin[(N + 12 )x]/ sin[x/2]. Beweis zur Poissonschen Summenformel ohne Fourierreihen. (a) Mit Hilfe von zweifacher partieller Integration sieht man, dass für n 6= 0 Z ∞ Z ∞ 1 exp(inx)f (x)dx = − 2 exp(inx)f 00 (x)dx n −∞ −∞ Daraus folgt, dass f´’ur jede Schwartzfunktion f der Grenzwert T f := lim N →∞ Z N X ∞ exp(inx)f (x)dx = −∞ n=−N ∞ Z X n=−∞ ∞ exp(inx)f (x)dx −∞ existiert. T ist offensichtlich linear. Ferner gilt Z ∞ |T f | ≤ |f (x)|dx + 2 −∞ Z ∞ ∞ X 1 |f 00 (x)|dx. 2 n −∞ n=1 Es gilt außerdem Z ∞ Z |f (x)|dx ≤ sup |(1 + x2 )f (x)| −∞ sowie R R x∈R ∞ −∞ 1 dx = π(||f ||0,0 + ||f ||2,0 ) 1 + x2 |f 00 | ≤ π(||f ||0,2 + ||f ||2,2 ), also |T f | ≤ π(||f ||0,0 + ||f ||2,0 ) + 2π ∞ X 1 (||f ||0,2 + ||f ||2,2 ). 2 n n=1 Also ist T stetig und damit T ∈ S 0 (Rd ). (b) Mit Hilfe von geometrischen Summen kann man DN (x) explizit ausrechnen: es gilt DN (x) = sin(N + 21 )x sin(x/2) 14 falls x ∈ / 2πZ, und DN (x) = 2N +1 für x ∈ 2πZ. Außerdem ist DN 2π-periodisch und 2π. Also ist für f ∈ S(R) Z ∞ X Z π−2πn DN (x)f (x)dx DN (x)f (x)dx = −∞ n∈Z = und Z ∞ DN (x)f (x)dx − 2π −∞ X f (2πn) = n∈Z −π DN (x)dx = −π−2πn π XZ n∈Z Rπ DN (y)f (y + 2πn)dy −π XZ n∈Z π DN (y) f (y + 2πn) − f (2πn) dy. −π Definiere für y ∈ [−π, π] ( gn (y) := f (y + 2πn) − f (2πn) / sin(y/2), 2f 0 (2πn), y= 6 0, y = 0. Man kann zeigen, dass gn in [−π, π] stetig differenzierbar ist. Also können wir partiell integrieren: Z π Z π 1 DN (y) f (y + 2πn) − f (2πn) dy = sin (N + )y gn (y)dy 2 −π −π Z π y=π cos(N + 1/2)y 1 1 =− gn (y) + cos (N + )y gn0 (y)dy. N + 1/2 N + 1/2 −π 2 y=−π Die Randterme verschwinden, weil cos(π/2 + kπ) = 0 für alle k ∈ Z. Es folgt Z X X 1 2π sup |gn0 (y)| f (2πn) ≤ DN f − 2π N + 1/2 y∈[−π,π] R n∈Z n∈Z Es bleibt zu zeigen, dass die Summe auf der rechten Seite konvergent ist; denn wenn das der Fall ist, geht die rechte Seite bei N → ∞ gegen 0. Betrachte zunächst den Fall n = 0. Es gilt für y 6= 0 h 1 f (y) − f (0) yi g00 (y) = f 0 (y) − cos sin(y/2) 2 sin(y/2) 2 Aus der Theorie der Taylorreihen wissen wir, dass y-abhängige Skalare s, t ∈ [0, 1] existieren, so dass f 0 (y) = f 0 (0) + yf 00 (ty) und f (y) = f (0) + yf 0 (0) + y 2 f 00 (sy)/2. Es folgt g00 (y) = f 0 (0) y cos(y/2) y y2 1− + f 0 (ty) + cos(y/2)f 00 (sy). sin(y/2) sin(y/2) 2 sin(y/2) 4 sin2 (y/2) Die Funktionen (1 − y cos(y/2)/ sin(y/2)) und y/(sin(y/2)) sind auf [−π, π]\{0} beschränkt und besitzen in y = 0 stetige Fortsetzungen. Sei C/2π eine Schranke für die Supremumsnormen der Fortsetzungen. Es folgt sup |g00 (y)| ≤ C |f 0 (0)| + sup |f 0 (y)| + |f 00 (y)| . y∈[−π,π] y∈[−π,π] Ganz ähnlich zeigt man sup y∈[−π,π] |gn0 (y)| ≤ C |f 0 (2πn)| + sup |f 0 (y + 2πn)| + |f 00 (y + 2πn)| . y∈[−π,π] Weil f und seine Ableitungen schneller als jedes Polynom fallen, folgt die Existenz einer Konstanten P c > 0, so dass sup[−π,π] |gn0 | ≤ c/(n2 + 1), und die Reihe n sup[−π,π] |gn0 | konvergiert. Satz 1.39 (S(Rd ) liegt dicht in S 0 (Rd )). Für alle T ∈ S 0 (Rd ) existiert eine Folge von SchwartzFunktionen (un )n∈N , so dass T = limn→∞ Tun . 15 1.6 Zusammenfassung • Wir haben eine neue Klasse von Objekten eingeführt, die Funktionen und Maße verallgemeinern: jede gutartige (z.B. absolut integrierbare oder polynomiell beschränkte) Funktion u kann als Distribution Tu aufgefasst werden, jedes polynomiell beschränkte Maß µ kann als Distribution Sµ aufgefasst werden, aber es gibt Distributionen, die weder von Funktionen noch Maßen herkommen, z.B. δ00 in d = 1. • Die Klasse der Distributionen ist also echt größer als die der (gutartigen) Funktionen — aber auch nicht so viel größer: S(Rd ) liegt dicht in S 0 (Rd ). • Wir haben Operationen, die zunächst für Funktionen definiert sind, auf Distributionen verallgemeinert, insbesondere: – Differentiation – Multiplikation – Faltung • Wir haben Konvergenzbegriffe eingeführt: – Konvergenz im Schwartzraum fn → f erinnert an gleichmäßige Konvergenz von Funktionen. – Konvergenz von Distributionen Tn → T erinnert an schwache Konvergenz von Wahrscheinlichkeitsmaßen. • Viele Eigenschaften übertragen sich von Funktionen auf Distributionen, z.B. die Produktregel. • Aber es gibt wichtige Unterschiede: – Jede Distribution ist unendlich oft differenzierbar. Das gilt insbesondere auch dann, wenn eine Distribution von einer nicht differenzierbaren Funktion herkommt. – Das Produkt uT von einer Funktion und einer Distribution ist i.a. nur für u ∈ OM (Rd ) definiert, das Produkt ST von zwei Distributionen ist i.a. nicht definiert. – Es kann passieren, dass eine Funktionenfolge (un ) als Funktionenfolge P nicht konvergent n ist, als Distributionsfolge aber schon. Bsp. un (x) = exp(inx), un (x) = k=−n exp(ikx). – Es kann passieren, dass eine Funktionenschar uε punktweise gegen eine Grenzfunktion u konvergiert, aber die zugehörige Distribution Tuε nicht gegen Tu konvergiert. 2 2.1 Fouriertransformation Fouriertransformation von Funktionen Definition 2.1. Sei f : Rd → C messbar und absolut integrierbar. Definiere für k ∈ Rd Z Z 1 1 ˇ(k) := f (x) exp(−ik · x)dx, f f (x) exp(ik · x)dx, fˆ(k) := (2π)d/2 Rd (2π)d/2 Rd Pd wobei k · x = j=1 kj xj . Die Funktion fˆ : Rd → C ist die Fourier-Transformierte von f , die Funktion fˇ die inverse Fourier-Transformierte. Bemerkung. Die Integrale für fˆ(k) und fˇ(k) sind absolut integrierbar, und die Funktionen fˆ und fˇ sind beschränkt: es gilt Z Z 1 1 ˇ(k)| ≤ sup |fˆ(k)| ≤ |f (x)|dx, sup | f |f (x)|dx. (2π)d/2 Rd (2π)d/2 Rd k∈Rd k∈Rd 16 Statt fˆ und fˇ werden wir gelegentlich auch Ff und F −1 f schreiben. Beispiel. Sei d = 1, λ > 0 und f (x) = exp(−λ2 x2 /2). Es gilt k2 1 fˆ(k) = exp − 2 . λ 2λ Insbesondere gilt für λ = 1, dass f (x) = exp(−x2 /2) und fˆ(k) = exp(−k 2 /2), also fˆ = f : f ist ein Fixpunkt der Fouriertransformation. Das gleiche gilt in d ≥ 2: die Funktion f (x) = P (2π)−d/2 exp(−( j x2j )/2) erfüllt fˆ = f . Satz 2.2 (Rechenregeln). Seien f, g ∈ S(Rd ). Es gilt: (a) Dilatation: Sei λ > 0 und dλ f )((x) := f (λx) die dilatierte Funktion. Es gilt 1 ˆ 1 1 dd k = d d1/λ fˆ (k). λ f (k) = d f λ λ λ (b) Translation: Sei a ∈ Rd und (τa f )(x) := f (x − a) die translatierte Funktion. Es gilt ˆ τd a f (k) = exp(−ia · k)f (k). (c) Faltung: f[ ∗ g = (2π)d/2 fˆĝ. (d) Fouriertransformierte der Ableitung: Es gilt für alle α ∈ Nd0 : α f (k) = (ik)α fˆ(k) = (ik )α1 · · · (ik )αd fˆ(k). d D 1 d (e) Ableitung der Fouriertransformierten: fˆ ist unendlich oft differenzierbar, und es gilt für alle α ∈ Nd0 und g(x) := xα f (x), dass ĝ(k) = iD)α fˆ(k) = i|α| ∂k1α1 ∂ |α| fˆ(k). · · · ∂kdαd Übungsaufgabe. Zeigen Sie, dass die Voraussetzungen von Satz 2.2 abgeschwächt werden können: • (a), (b) und (c) gelten auch, wenn f und g lediglich absolut integrierbar sind (statt Schwartzfunktionen). • (e) gilt auch, wenn f ∈ OC (Rd ). Übungsaufgabe. Sei f ∈ S(Rd ). Zeigen Sie: (a) wenn f reellwertig ist, dann ist fˆ(−k) = fˆ(k). (b) Wenn f gerade ist (f (x) = f (−x)), dann ist auch fˆ gerade. Übungsaufgabe. Formulieren und beweisen Sie einen analogen Satz für die inverse Fouriertransformation f 7→ fˇ. Lemma 2.3. Sei f ∈ S(Rd ) eine Schwartzfunktion. Dann sind auch die Fouriertransformierte und die inverse Fouriertransformierte Schwartzfunktionen: es gilt fˆ ∈ S(Rd ) und fˇ ∈ S(Rd ). Außerdem sind die Abbildungen f 7→ fˆ und f 7→ fˇ als Abbildungen von S(Rd ) nach S(Rd ) stetig. Satz 2.4 (Plancherel-Identität). Sei f ∈ S(Rd ). Es gilt Z Z 2 ˆ |f (k)| dk = |f (x)|2 dx. Rd Rd 17 Die Fouriertransformation erhält also die L2 -Norm. Sie erhält ebenfalls das L2 -Skalarprodukt R hf, gi := Rd f g: Satz 2.5 (Parseval-Identität). Seien f, g ∈ S(Rd ). Es gilt Z Z hfˆ, ĝi = fˆ(k)ĝ(k)dk = f (x)g(x)dx = hf, gi. Rd Rd Die Parseval-Identität folgt aus der Plancherel-Identität und der Polarisationsformel. Satz 2.6 (Stetige Bijektion). Die Abbildung f 7→ Ff = fˆ. F : S(Rd ) → S(Rd ), ist stetig und bijektiv. Die Umkehrabbildung ist F −1 f = fˇ und ist ebenfalls stetig. Es gilt also insbesondere f (x) = (fˆ)v (x) = 1 (2π)d/2 Z fˆ(k) exp(ik · x)dk. Rd Poissonsche Summenformel Die Poissonsche Summenformel kann mit Hilfe der Fouriertransformation in die folgende Aussage umformuliert werden: es gilt für alle f ∈ S(R) X 1 X ˆ √ f (n) = f (2πn). 2π n∈Z n∈Z Übungsaufgabe. Sei θ : (0, ∞) → (0, ∞), t 7→ θ(t) = P n∈Z exp(−πn2 t). Zeigen Sie, dass 1 1 θ t) = √ θ( ). t t 2.2 Fouriertransformation von Distributionen Definition 2.7. Sei T ∈ S(Rd ). Die Fouriertransformierte von T ist die temperierte Distribution T̂ : S(Rd ) → C, T 7→ T̂ f := T fˆ. Die Fouriertransformierte von T ist die temperierte Distribution Ť : S(Rd ) → C, T 7→ Ť f := T fˇ. Bemerkung. T̂ = T ◦ F ist als Verkettung von zwei stetigen linearen Abbildungen ebenfalls linear und stetig; daraus folgt, dass T̂ tatsächlich in S 0 (Rd ) liegt. Ähnliches gilt für Ť . Beispiele. 1. Sei u : Rd → C absolut integrierbar. Dann ist cu = Tû . T 2. Sei a ∈ Rd . Es gilt im distributiven Sinne 1 δba = √ d exp(−ia · k), 2π (d.h. δba (f ) = (2π)−d/2 R Rd exp(−ia · k)f (k)dk). Für a = 0 erhält man insbesondere 1 δb0 = √ d . 2π 18 3. Sei d = 1 und T = δ300 , also T f = f 00 (3). Es gilt im distributiven Sinne 1 δb300 = √ d (−ix)2 exp(−i3x). 2π Satz 2.8 (Rechenregeln). Sei T ∈ S 0 (Rd ). (a) Sei u ∈ S(Rd ). Es gilt u[ ∗T = √ 2π d/2 ûT̂ . (b) Sei α ∈ Nd0 . Es gilt α T = (ik)α T. [ D (c) Sei α ∈ Nd0 . Es gilt αT . \ Dα T̂ = (−ix) Bemerkung. Es gibt ebenfalls Rechenregeln bzgl. Dilatation und Translation. Auf eine allgemeine Aussagen sei hier verzichtet und lediglich darauf hingewiesen, dass wir bereits ein Beispiel für die Translation kennen: es gilt δba = exp(−ia · k)δb0 . √ d/2 Übungsaufgabe. Sei u ∈ OC (Rd ). Zeigen Sie: es gilt û ∈ OM (Rd ) und u[ ∗ T = 2π ûT̂ . Bemerkung (Herleitung von Vorzeichen und Vorfaktoren). (a) Man sollte sich merken, dass u[ ∗ T = cûT̂ für eine geeignete Konstante c > 0 gilt. Die Konstante lässt sich dann mit Hilfe des Spezialfalls T = δ0 schnell wiederherleiten: \ • Es gilt u ∗ δ0 = u, also u ∗ δ0 = û. 1 • Es gilt δ̂0 = √ d , also cûδb0 = cû √ 1 d . 2π 2π √ d √ d • Also muss c/ 2π = 1 sein und damit c = 2π . α T = (±ik)α T̂ und D α f = (±ik)α fˆ, und die Vorzeichen d [ (b) Man sollte sich merken, dass D sind für Funktionen und Distributionen die gleichen. Das korrekte Vorzeichen gewinnt man schnell wieder, in dem man den Spezialfall d = 1, α = 1 betrachtet und im Integral für fb0 eine partielle Integration durchführt. (c) Ähnlich wie (b), statt partieller Integration merkt man sich, dass man Differentiation bzgl. k und Integration vertauschen darf. Satz 2.9 (Stetige Bijektion). Die Abbildung F : S 0 (Rd ) → S 0 (Rd ), T 7→ T̂ ist stetig und bijektiv. Die Umkehrabbildung ist F −1 : S 0 (Rd ) → S 0 (Rd ), T 7→ Ť und ist ebenfalls stetig. Es gilt also insbesondere (T̂ )v = (Ť )∧ = T . Die Stetigkeit der Fouriertransformation hat die folgende wichtige Anwendung: angenommen, wir wollen die (distributive) Fouriertransformierte einer Funktion u(x) berechnen, die nicht absolut integrierbar ist. Dann geht man oft wie folgt vor: 1. Regularisierung: finde eine FunktionenscharRuε (x), soRdass für alle ε > 0 die Funktion uε absolut integrierbar ist, und Tuε → Tu , d.h. R uε f → R uf für alle f ∈ S(Rd ). 19 2. Berechne die Fouriertransformierte u cε der regularisierten Funktionen. 3. Bestimme den Grenzwert von Tucε wenn der Regularisierungsparameter ε gegen 0 geht. 4. Schließe mit cu = lim T d T . uε = lim Tu c ε ε&0 ε&0 Beispiele. 1. Sei d = 1 und a ∈ R. Es gilt \ = exp(iax) √ 2π δa . (Regularisierung uε (x) = exp(iax) exp(− 12 εx2 ).) Konsistenz mit δ̌a = √1 2π exp(iak)? 2. Sei d = 1 und H die Heaviside-Funktion, also H(x) = 1 für x ≥ 0 und H(x) = 0 für x < 0. Es gilt im distributiven Sinne −i 1 Ĥ = √ + iπδ0 P k 2π d.h. −i Tc H (f ) = √ 2π Z ∞ 0 f (k) − f (−k) dk + iπf (0) . k (Regularisierung Hε (x) = H(x) exp(−ε|x|). ) Konsistenz mit H 0 = δ0 ? 3. Sei d = 3 und V (x) = 1/(4π||x||). Es gilt im distributiven Sinne V̂ (k) = √ (Trick 1/||k||2 = 1 2 R∞ 0 1 1 . 2 2π ||k|| 3 exp(−λ||k||2 /2)dλ.) Konsistenz mit −∆V = δ0 ? Bemerkung (Fundamentallösung / Greensche Funktion, Poissongleichung in d = 3). Sei d = 3. Mit Hilfe der Lösung V (x) = 1/(4π||x||) von −∆V = δ0 kann man für jedes ρ ∈ S(R3 ) eine Lösung f der zugehörigen Poisson-Gleichung −∆f = ρ. wie folgt bestimmen. Setze Z f (x) = ρ ∗ V (x) = R3 1 ρ(y)dy, 4π||x − y|| so ist −∆f = ρ ∗ (−∆V ) = ρ ∗ δ0 = ρ, also ist f eine (distributive) Lösung. Die Funktion V ist eine sogenannte Fundamentallösung der Poisson-Gleichung, manchmal auch Greensche Funktion genannt. Die Poisson-Gleichung und die Funktion 1/||x − y|| tauchen an vielen Stellen auf, z.B. in der Physik im Bereich Elektrostatik und in der Wahrscheinlichkeitstheorie im Zusammenhang mit Brownscher Bewegung und probabilistischer Potentialtheorie (die Greensche Funktion hat mit Lokalzeiten der dreidimensionalen Brownschen Bewegung zu tun). Ziel der nächsten Aufgabe ist es, die Fouriertransformierte der eindimensionalen Greenschen Funktion zu berechnen. Sei d = 1 und V (x) = −|x|/2. Es gilt im distributiven Sinne −V 00 = δ0 , 1 also muss k 2 V̂ = √12π sein. Eine naheliegende Vermutung wäre deshalb V̂ = √2πk . Leider definiert 2 1/k 2 in d = 1 keine Distribution, deshalb muss man — ähnlich wie beim Cauchyschen Hauptwert — zuerst regularisieren; hier kommt die Hadamard-Regularisierung zum Einsatz. Übungsaufgabe. 20 1. (a) Sei f ∈ S(R). Zeigen Sie, dass die Funktion k 7→ (f (k) + f (−k) − 2f (0))/k 2 ist auf (0, ∞) absolut integrierbar ist. (b) Sei f ∈ S(R). Zeigen Sie: Z ∞ Z 2f (0) f (k) + f (−k) − 2f (0) f (k) dk − = dk lim 2 ε&0 ε k2 0 R\[−ε,ε] k (c) Sei H Z ∞ 1 Z f (k) + f (−k) − 2f (0) 2f (0) f (k) f = lim dk − = dk. 2 ε&0 k2 k ε k2 0 R\[−ε,ε] Zeigen Sie, dass H( k12 ) : S(R) → C eine temperierte Distribution ist. 2. Zu ε > 0 sei Vε (x) := −|x| exp(−ε|x|)/2. Zeigen Sie, dass 1 1 1 1 k 2 − ε2 √ V̂ε (k) = − √ + = . (ε − ik)2 2 2π (ε + ik)2 2π (k 2 + ε2 )2 3. Zeigen Sie, dass R∞ −∞ V̂ε (k)dk = 2 R∞ 0 V̂ε (k)dk = 0. 4. Zeigen Sie, dass für alle f ∈ S(R) gilt Z ∞ Z ∞ 1 f (k) + f (−k) − 2f (0) dk. lim V̂ε (k)f (k)dk = √ ε&0 −∞ k2 2π 0 5. Folgern Sie, dass im distributiven Sinne gilt: 1 1 V̂ = √ H 2 . k 2π 2.3 Charakteristische Funktionen von Wahrscheinlichkeitsmaßen Definition 2.10. Sei µ ein Wahrscheinlichkeitsmaß auf Rd . Die charakteristische Funktion von µ ist die Funktion Z d χµ : R → C, t = (t1 , . . . , td ) 7→ χµ (t) = eit·x µ(dx). Rd Eigenschaften. • Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → Rd eine Zufallsvariable. Sei µ die Verteilung von X (also µ(A) = P(X ∈ A), für A ⊂ Rd messbar). Es gilt χµ (t) = E exp(it·X). • Sei µ ein W-Maß auf Rd . Wenn µ absolutstetig bzgl. des Lebesguemaßes mit Dichte ρ(x) ist, dann ist Z √ d χµ (t) = eit·x ρ(x)dx = 2π ρ̌(t). Rd • Sei µ ein W-Maß auf Rd . Es gilt im distributiven Sinne χµ = √ d 2π µ̌ d.h. Tχµ = √ d 2π Šµ . √ d/2 Die charakteristische Funktion eines Maßes also, bis auf den Faktor 2π , nichts anderes als die inverse Fouriertransformierte des Maßes. Viele Aussagen zu Fouriertransformationen von Funktionen und Distributionen haben daher natürliche Gegenstücke bei charakteristischen Funktionen. Beispiele. 1. Sei a ∈ Rd und µ = δa . Es gilt ist χµ (t) = exp(ia · t). 21 2. Sei d = 1, σ > 0 und µ die Normalverteilung auf R mit Varianz σ 2 . Dann ist 1 χµ (t) = exp − σ 2 t2 . 2 3. Sei d ≥ 1 und C eine d × d Matrix mit reellen Einträgen, positiv definit. Sei µ die Normalverteilung auf Rd mit Kovarianzmatrix C (Dichte proportional zu exp(− 21 hx, C −1 xi), h·, ·i Standardskalarprodukt auf Rd ). Dann ist 1 χµ (t) = exp − ht, Cti . 2 4. Sei d = 1, λ > 0 und µ die Poisson-Verteilung mit Parameter λ (also insbesondere µ({n}) = exp(−λ)λn /n! für n ∈ N0 ). Dann ist χµ (t) = exp λ(eit − 1) . Definition 2.11. Seien µ und ν zwei Wahrscheinlichkeitsmaße auf Rd . Die Faltung µ ∗ ν ist das Bild des Produktmaßes µ ⊗ ν auf Rd × Rd unter der Summenabbildung s : Rd × Rd → Rd , (x, y) 7→ x + y. Eigenschaften. • Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X, Y : Ω → Rd zwei unabhängige Zufallsvariable mit jeweiligen Verteilungen µ und ν, also µ(A) = P(X ∈ A), ν(B) = P(Y ∈ B). Dann ist µ ∗ ν die Verteilung von X + Y . • Sei µ ein Wahrscheinlichkeitsmaß und A ⊂ Rd messbar. Es gilt Z µ ∗ ν(A) = µ {x ∈ Rd | x + y ∈ A} ν(dy). Rd • Wenn µ absolutstetig ist Rmit Dichte ρ(x), dann ist auch µ∗ν absolutstetig und hat als Dichte die Funktion ρ ∗ ν(x) = Rd ρ(x − y)ν(dy). • Wenn µ und ν absolutstetig bzgl. des Lebesgue-Maßes mit Dichten ρ1 und ρ2 sind, dann ist auch µ ∗ ν absolutstetig und ρ1 ∗ ρ2 ist eine Dichte von µ ∗ ν. • Seien µ1 , µ2 und µ3 Wahrscheinlichkeitsmaße. Es gilt µ1 ∗ µ2 = µ2 ∗ µ1 , (µ1 ∗ µ2 ) ∗ µ3 = µ1 ∗ (µ2 ∗ µ3 ). (Die Faltung ist kommutativ und assoziativ.) Satz 2.12 (Rechenregeln: Faltung und Ableitung). (a) Seien µ, ν Wahrscheinlichkeitsmaße auf Rd . Es gilt für alle t ∈ Rd : χµ∗ν (t) = χµ (t)χν (t) R (b) Sei µ ein Wahrscheinlichkeitsmaß auf R und n ∈ N. Angenommen, Rd ||x||n µ(dx) < ∞. Dann existieren sämtliche partiellen Ableitungen der Ordnung kleiner gleich n, und es gilt für alle t ∈ Rd und alle α ∈ Nd0 mit |α| ≤ n: Z ∂ |α| χµ (t) = (ix1 )α1 · · · (ixd )αd eit·x µ(dx), αd 1 ∂tα · · · ∂t d R 1 d wobei das Integral auf der rechten Seite absolut konvergent ist. 22 Teil (b) stellt insbesondere einen Zusammenhang zwischen Ableitungen der charakteristischen Funktion an der Stelle 0 und Momenten des Wahrscheinlichkeitsmaßes her: es gilt Z ∂ |α| χµ αd |α| 1 (0) = i xα αd 1 · · · xd µ(dx). 1 · · · ∂t ∂tα d R 1 d Übungsaufgabe (Rechenregeln: Dilatation und Translation). Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und X : Ω → Rd eine Zufallsvariable. Die charakteristische Funktion von X ist χX (t) := E exp(it · X). Seien a ∈ Rd und λ > 0. Wie hängen χa+X und χX miteinander zusammen? Gleiche Frage für χλX und χX . Die Injektivität der Fouriertransformation führt zu: Satz 2.13 (Eindeutigkeitssatz). Seien µ und ν zwei Wahrscheinlichkeitsmaße. Angenommen, die charakteristischen Funktionen sind identisch: χµ = χν . Dann gilt auch µ = ν. Als Gegenstück zur Stetigkeit der Fouriertransformation und der inversen Fouriertransformation gilt der folgende Zusammenhang zwischen schwacher Konvergenz von Wahrscheinlichkeitsmaßen und punktweise Konvergenz von charakteristischen Funktionen. Satz 2.14 (Lévys Kontinuitätstheorem). Sei (µn )n∈N eine Folge von Wahrscheinlichkeitsmaßen auf Rd . (a) Angenommen, (µn ) konvergiert schwach gegen ein Wahrscheinlichkeitsmaß µ auf R. Dann konvergieren die charakteristischen Funktionen punktweise1 : χµn (t) → χµ (t) für alle t ∈ Rd . (b) Angenommen, die charakteristischen Funktionen χµn konvergieren punktweise gegen eine in 0 stetige Funktion χ : Rd → C. Dann ist χ die charakteristische Funktion eines Wahrscheinlichkeitsmaßes µ auf Rd und es gilt µn * µ. Es gilt also insbesondere µn * µ ⇔ ∀t ∈ Rd : χµn (t) → χµ (t). Bemerkung. In Teil (b) kann auf die Forderung der Stetigkeit von χ in 0 nicht verzichtet werden, wie das folgende Beispiel zeigt: Sei d = 1 und µn die Gleichverteilung auf [−n, n]. Dann ist ( 1, t = 0, χµn (t) = sin(nt) t 6= 0. nt , Die Folge der charakteristischen Funktionen χµn (t) konvergiert punktweise gegen die Funktion ( 1, t = 0, χ(t) := 0, t 6= 0, aber die Folge (µn )n∈N ist nicht schwach konvergent. Der Beweis von Satz 2.14(b) beruht auf einem Lemma und einem Satz: Satz 2.15. Sei M eine Menge von Wahrscheinlichkeitsmaßen auf Rd . Es gelte ∀ε > 0 ∃A > 0 ∀µ ∈ M : µ([−A, A]d ) ≥ 1 − ε. Dann besitzt jede Folge (µn )n∈N von Maßen in M eine schwach konvergente Teilfolge. 1 Es gilt sogar: die Konvergenz ist lokal gleichmäßig, d.h. für jede kompakte Teilmenge K ⊂ Rd gilt supt∈K |χµn (t) − χµ (t)| → 0. 23 Satz 2.15 ist Teil des Satzes von Prohorov. Eine Menge M von Wahrscheinlichkeitsmaßen , die die Bedingung des Satzes erfüllt, heißt straff. Grob gesprochen besagt Straffheit, dass die Maße im wesentlichen auf einer gemeinsamen kompakten Menge leben; für eine Folge solcher Maße kann bei n → ∞ daher keine Masse ins Unendliche Abwandern. Typische Beispiele nicht straffer Mengen in d = 1 sind M = {δa | a ∈ R} und M = {µn | n ∈ N} mit µn die Gleichverteilung auf [−n, n]. Lemma 2.16. Sei µ ein W-Maß auf R und χµ seine charakteristische Funktion. Dann gilt für alle τ > 0 1 Z τ 2 2 χµ (t)dt − 1. µ [− , ] ≥ 2 τ τ 2τ −τ Ziel der nächsten Aufgabe ist es, eine abgeschwächte Version von Satz 2.14(b) in d = 1 ohne Rückgriff auf den Satz von Prohorov zu beweisen. Übungsaufgabe. Seien µn (n ∈ N) und µ Wahrscheinlichkeitsmaße auf R. Es gelte χµn → χµ punktweise auf R. 1. Zeigen Sie, dass zu jedem ε > 0 ein A > 0 existiert, so dass µ([−A, A]) ≥ 1 − ε und für alle n ∈ N µn ([−A, A]) ≥ 1 − ε. 2. Zeigen Sie, dass Tχµn → Tχµ und folgern Sie aus der Stetigkeit der distributiven Fouriertransformation, dass Z Z ∀f ∈ S(R) : Sµn f = f dµn → Sµ f = f dµ. R R 1 3. Sei ϕε (x) = √2πε exp(− 2ε12 x2 ) und f eine stetige Funktion mit kompaktem Träger (d.h. 2 es existiert ein beschränktes Intervall I sodass f auf R\I verschwindet). Zeigen Sie, dass supx∈Rd |ϕε ∗f (x)−f (x)| ≤ C(f )ε mit f -abhängiger Konstante C(f ) > 0, und ϕε ∗f ∈ S(R). 4. Folgern Sie Raus 2. und R3., dass für jede beschränkte stetige Funktion f mit kompaktem Träger gilt: R f dµn → R f dµ. R R 5. Folgern Sie aus 1. und 4., dass für jede beschränkte stetige Funktion R f dµn → R f dµ. Zuletzt bleibt die Frage, welche Funktionen χ charakteristische Funktionen von Wahrscheinlichkeitsmaßen ist – anders gesagt, die Frage nach dem Bildbereich der Abbildung µ 7→ χµ . Definition 2.17. Sei χ : Rd → C. Die Funktion χ heißt positiv definit, falls für alle n ∈ N, t1 , . . . , tn ∈ R, λ1 , . . . , λn ∈ C gilt n X λj χ(tj − tk )λk ≥ 0. j,k=1 Beispiel. Sei d = 1, a ∈ R, und χ(t) = exp(iat). Die Funktion χ ist positiv definit, denn n X λj eia(tj −tk ) λk = j,k=1 n X j=1 λj e−iatj n X k=1 n 2 X λk e−iatk = λk e−iatk ≥ 0. k=1 Satz 2.18 (Bochners Theorem). Sei χ : Rd → C eine Funktion. Dann ist χ genau dann die charakteristische Funktion eines Wahrscheinlichkeitsmaßes µ, wenn gilt: (i) χ(0) = 1. (ii) χ ist stetig. (iii) χ ist positiv definit. 24 Lemma 2.19 (Eigenschaften positiv definiter Funktionen). Sei χ : Rd → C positiv definit. Dann gilt: (a) χ(−t) = χ(t) für alle t ∈ Rd . (b) χ(0) ≥ 0. (c) |χ(t)| ≤ χ(0) für alle t ∈ Rd . Bemerkung. Der Beweis verwendet folgende Beobachtung: wenn für eine n × n -Matrix A gilt hλ, Aλi ≥ 0 für alle λ ∈ C2 , dann ist A hermitesch und positiv semi-definit. Die analoge Aussage im R2 falsch, wie das folgende Gegenbeispiel zeigt: Sei 1 2 A= . 0 1 Es gilt für alle λ ∈ R2 : hλ, Aλi = λ21 + 2λ1 λ2 + λ22 = (λ1 + λ)2 ≥ 0, aber A ist nicht symmetrisch. Beweis von “(i), (ii), (ii) ⇒ χ ist charakteristische Funktion” in d = 1. Zuerst behandelt man den Spezialfall, dass χ absolut integrierbar ist. Sei Z 1 1 ρ(x) := χ(t) exp(−itx)dt = √ χ̂(t). 2π R 2π Aus den Umkehrformeln für die Fouriertransformation folgt, dass √ 2π ρ̌ = χ. √ Diese Gleichung zunächst im distributiven Sinne zu interpretieren, d.h. 2π Tˇρ = Tχ . (Die Funktionen ρ und χ sind auf R beschränkt, definieren also temperierte Distributionen.) Wir zeigen zuerst, dass ρ(x) ≥ 0 für alle x ∈ R. Aus der Stetigkeit und positiven Definitheit von χ folgt mit Hilfe der Konvergenz Riemannscher Summen Z TZ T ∀T > 0 ∀x ∈ R : e−itx eisx χ(t − s)dtds ≥ 0. 0 0 Es folgt mit Hilfe der Substitution (u, v) = (t − s, s) und majorisierter Konvergenz 0≤ 1 2πT Z 0 T Z T e−itx eisx χ(t − s)dtds 0 Z T Z T 1 e−iux χ(u) 1{u+v∈[0,T ]} dv du 2πT −T 0 Z T |u| 1 e−iux χ(u) 1 − du = 2π −T T = → ρ(x). Also ist ρ(x) ≥ 0. R Als nächstes zeigen wir, dass R ρ(x)dx = χ(0) = 1; insbesondere ist ρ absolut integrierbar. √ Wegen 2π Ťρ = Tχ gilt für alle f ∈ S(R) Z Z 1 ˇ ρ(x)f (x)dx = √ χ(t)f (t)dt. 2π R R √ −1/2 Angewendet auf die Funktion fε (t) = 2πε2 exp(−t2 /(2ε2 )) mit ε > 0 führt das zu Z Z exp(−ε2 x2 /2) 1 exp(−t2 /(2ε2 )) √ √ √ ρ(x) dx = χ(t) dt, 2π 2π R 2πε2 R 25 also exp(−s2 /2) √ ds. 2π R R Bei ε & 0 konvergiert die rechte Seite gegen χ(0) R (Stetigkeit und Beschränktheit von χ + majorisierte Konvergenz) und die linke Seite gegen R ρ(x)dx (ρ ≥ 0 + monotone Konvergenz). Es folgt Z ρ(x)dx = χ(0) = 1. Z ρ(x) exp(−ε2 x2 /2)dx = Z χ(εs) R √ Also ist ρ die Dichte eines Wahrscheinlichkeitsmaßes µ; außerdem ist 2π ρ̌ = χ im Funktionensinne interpretierbar und es gilt Z √ χµ (t) = exp(−itx)ρ(x)dx = 2π ρ̌(t) = χ(t), R insbesondere ist χ = χµ die charakteristische Funktion des Wahrscheinlichkeitsmaßes µ. Sei nun χ nicht notwendigerweise absolut integrierbar. Zu ε > 0 sei Z 2 2 1 1 χ(t)eity e−y /(2ε ) dy. fε (t) := χ(t) exp(− ε2 t2 ) = √ 2 2 2πε R fε ist stetig, es gilt f (0) = 0, und fε ist positiv definit, da Z X n n X 2 2 1 λj χ(tj − tk )λk = √ λj eitj y χ(tj − tk )λk eitk y e−y /(2ε ) dy ≥ 0. 2 2πε R j,k=1 j,k=1 Außerdem absolut integrierbar, weil χ beschränkt. Also existiert ein Wahrscheinlichkeitsmaß µε auf R, so dass fε = χµε . Aus Lévys Kontinuitätstheorem und der Konvergenz fε → χ (ε & 0) folgt die Existenz eines Wahrscheinlichkeitsmaßes µ mit µε * µ und χ = χµ . Bemerkung. Aus dem Beweis des Satzes folgt: sei µ ein Wahrscheinlichkeitsmaß mit absolut integrierbarer charakteristischer Funktion χµ . Dann ist µ absolutstetig mit stetiger beschränkter Dichte Z 1 ρ(x) = eitx χµ (t)dt. 2π R Beispiel (Spektralmaß stationärer stochastischer Prozesse). Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und Xt : Ω → C (t ∈ R) eine Familie komplexwertiger Zufallsvariable. Es gelte • Stationarität: Für alle n ∈ N, t1 , . . . , tn ∈ R und s ∈ R haben (Xt1 , . . . , Xtn ) und (Xt1 +s , . . . , Xtn +s ) haben die gleiche Verteilung. • Endliche Varianz: σ 2 = E[|X0 |2 ] < ∞. Dann ist die Funktion f : R → C f (t − s) := E Xt Xs ] = E Xt−s X0 ] wohldefiniert. f ist positiv definit, denn n X n i 2 h X λj f (tj − tk )λk = E λk Xtk ≥ 0. j,k=1 k=1 Falls der Prozess gewissen Stetigkeitsbedingungen genügt, so dass f (t) eine stetige Funktion ist, so folgt aus Bochners Theorem die Existenz eines endlichen Maßes µ auf R, so das Z f (t − s) = ei(t−s)λ µ(dλ), µ(R) = σ 2 . R µ ist das Spektralmaß des stochastischen Prozesses (Xt )t∈R . Spektralmaße spielen eine wichtige Rolle in der Zeitreihenanalyse, einem Teilgebiet der Statistik. Sie treten ebenfalls in Anwendungen aus den Telekommunikation (akustische oder elektrische Signale mit Rauschen) auf. 26 Übungsaufgabe. Seien Zj ∼ N (0, σj2 ), j = 1, . . . , n, unabhängige normalverteilte Zufallsvariable mit Varianzen σ1 , . . . , σn > 0. Seien λ1 , . . . , λn ∈ R. Definiere zu t ∈ R Xt := n X Zj eitλj . j=1 Der stochastische Prozess (Xt ) ist also eine Überlagerung einfacher exp(iλt)-Schwingungen mit zufälligen normalverteilten Amplituden Zj . Zeigen Sie: • Die Funktion f (t − s) := E Xt Xs ] ist wohldefiniert und stetig. • Das Spektralmaß des Prozesses ist gleich µ= n X σj2 δλj . j=1 2.4 Zusammenfassung • Wir haben die Fouriertransformation von Funktionen und Distributionen und charakteristische Funktionen von Wahrscheinlichkeitsmaßen eingeführt. • In jedem Abschnitt gab es Sätze zum Zusammenspiel von Fouriertransformation und Transformationen: – Faltung / Produkt, – partielle Ableitung Dα / Multiplikation mit Monomen (±ix1 )α1 , . . . , (±ixd )αd (bei Maßen: partielle Ableitungen / Momente), – Translation / Multiplikation mit exp(±ia · x) – Dilatation. • In jedem Abschnitt gab es Sätze zu Eigenschaften wie Injektivität, Surjektivität, Stetigkeit: – Funktionen: F : S(Rd ) → S(Rd ) ist stetig und bijektiv mit stetiger Umkehrabbildung. Es gibt eine Umkehrformel / F −1 ist die inverse Fouriertransformation. – Distributionen: F : S(Rd ) → S(Rd ) ist stetig und bijektiv mit stetiger Umkehrabbildung. – Wahrscheinlichkeitsmaße: die Abbildung µ 7→ χµ ist injektiv (Eindeutigkeitssatz); das Bild besteht aus den stetigen, positiv definiten Funktionen mit χ(0) = 1 (Bochners Theorem); und es gibt Stetigkeitsaussagen (Lévys Kontinuitätstheorem). • Die distributive Fouriertransformation von nicht integrierbaren Funktionen kann mit Hilfe von Regularisierungsverfahren berechnet werden. Bsp. exp(iax), Heaviside-Funktion H(x). • Die Fouriertransformation von Funktionen erhält die L2 -Norm und das L2 -Skalarprodukt (Plancherel- und Parseval-Identität). • Wir haben wichtige Fouriertransformierte ausgerechnet, insbesondere die der Gausschen Funktionen / Normalverteilung und die der Green’schen Funktion V (x) = 1/(4π||x||) in d = 3. Für letztere haben wir die Konsistenz mit der distributiven Gleichung −∆V = δ0 überprüft. 27 3 Zufällige Distributionen und verallgemeinerte stochastische Prozesse Ausblick, nicht prüfungsrelevant. Die Beweise der angeführten Aussagen, insbesondere des BochnerMinlos-Theorems, sind mitunter recht aufwändig. Ganz so, wie wir Funktionen auf Distributionen verallgemeinert haben, kann man den Begriff des stochastischen Prozesses verallgemeinern. Dies kann man auf zwei eng mit einander zusammenhängende Arten machen: • Über verallgemeinerte stochastische Prozesse (Yf (ω))f ∈S(Rd ;R) . Hier und im folgenden steht S(Rd ; R) für reellwertige Schwartzfunktionen. • Über zufällige Distributionen oder die Konstruktion von Wahrscheinlichkeitsmaßen auf S 0 (Rd ; R). Hierbei besteht S 0 (Rd ; R) aus denjenigen Distributionen ϕ, für die gilt: ϕ bildet reellwertige Schwartzfunktionen nach R ab, also S 0 (Rd : R) = {ϕ ∈ S 0 (Rd ) | ∀f ∈ S(Rd ; R) : ϕ(f ) ∈ R}. Definition 3.1 (Verallgemeinerter stochastischer Prozess). Ein verallgemeinerter stochastischer Prozess auf Rd ist eine Familie von reellwertigen Zufallsvariablen (Yf (ω))f ∈S(Rd ;R) , die auf einem gemeinsamen Wahrscheinlichkeitsraum (Ω, F, P) definiert sind, und für die gilt: ∀λ, µ ∈ R ∀f, g ∈ S(Rd ; R) : Yλf +µg (ω) = λYf (ω) + µYg (ω) P-f.s.. Ein verallgemeinerter stochastischer Prozess ordnet also jeder Schwartzfunktion f ∈ S(Rd ; R) eine Zufallsvariable Xf zu, und die Vorschrift f 7→ Yf (ω) ist linear. Bemerkung. Meist wird in der Definition von verallgemeinerten stochastischen Prozessen die Rolle von S(Rd ; R) durch unendlich oft differenzierbare Funktionen mit kompaktem Träger C0∞ (Rd ; R) ersetzt. Beispiele. 1. Stochastische Prozesse: Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und Xt : (Ω, F, P) → R, t ≥ 0, ein stochastischer Prozess. Angenommen, der Prozess hat fast sicher stetige und polynomiell beschränkte Pfade. Dann definiert Z ∞ Yf (ω) := Xt (ω)f (t)dt (ω ∈ Ω, f ∈ S(R; R)). 0 einen verallgemeinerten stochastischen Prozess. 2. Punktprozesse: Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und η : Ω → {A | A ⊂ Rd }2 ein Punktprozess. Unter gewissen Regularitätsvoraussetzungen, die insbesondere vom Poissonschen Punktprozess erfüllt sind, definiert X Yf (ω) := f (x) (ω ∈ Ω, f ∈ S(Rd ; R)) x∈η(ω) einen verallgemeinerten stochastischen Prozess. 3. Zufällige Maße: Sei (Ω, F, P) ein Wahrscheinlichkeitsraum und ξ : Ω → M(Rd ), ω 7→ ξω ein zufälliges Maß3 Unter gewissen Regularitätsvoraussetzungen definiert Z Yf (ω) := f (x)ξω (dx) (ω ∈ Ω, f ∈ S(Rd ; R)) Rd einen verallgemeinerten stochastischen Prozess. 2 Die Potenzmenge P(Rd ) = {A | A ⊂ Rd } wird mit der folgenden σ-Algebra versehen: Für B ⊂ Rd Borelmessbar sei NB (A) := #(A ∩ B) die Anzahl der Punkte in A ∩ B. Dann ist G die kleinste σ-Algebra auf P(Rd ), bzgl. der alle Zählvariablen NB : P(Rd ) → N0 messbar sind. 3 Auf die Definition der σ-Algebra sei hier verzichtet. 28 Definition 3.2 (Zylindermengen auf S 0 (Rd ; R)). Eine Menge A ⊂ S 0 (Rd ; R) heißt Zylindermenge, falls gilt: es existieren n ∈ N, f1 , . . . , fn ∈ S(Rd ; R) und B ⊂ Rn Borel-messbar, so dass A = {ϕ ∈ S 0 (Rd ; R) | (ϕ(f1 ), . . . , ϕ(fn )) ∈ B}. Sei F die kleinste σ-Algebra auf S 0 (Rd ; R), die alle Zylindermengen enthält. Man kann zeigen, dass F auch von Mengen der Form O ∩ S 0 (Rd ; R) erzeugt wird, wobei O die offenen Mengen der schwachen Topologie auf S 0 (Rd ) aus Definition 1.35 durchläuft; F ist also eine Borel σ-Algebra. Aber Achtung: der Raum S 0 (Rd ; R), versehen mit der schwachen Topologie, ist nicht polnisch! (Topologie nicht metrisierbar!). Satz 3.3 (Satz von Bochner-Minlos). Sei S : S(Rd ; R) → C eine Abbildung. Es gelte: • S(0) = 1. • S ist stetig. • für alle n ∈ N, λ1 , . . . , λn ∈ C, f1 , . . . , fn ∈ S(Rd ; R): n X λj S(fj − fk )λk ≥ 0. j,k=1 Dann existiert genau ein Wahrscheinlichkeitsmaß µ auf (S 0 (Rd ; R), F), so dass für alle f ∈ S(Rd ; R) gilt Z S(f ) = eiϕ(f ) µ(dϕ). S 0 (Rd ;R) Der Zusammenhang mit den verallgemeinerten stochastischen Prozessen ist wie folgt. Sei P ein Wahrscheinlichkeitsmaß auf (S 0 (Rd ; R), F). Setze Ω := S 0 (Rd ; R). Zu f ∈ S(Rd ; R) sei Yf : Ω → C, Yf (ϕ) := ϕ(f ). Dann definiert (Yf )f ∈S(Rd ;R) einen verallgemeinerten stochastischen Prozess, und es gilt h i S(f ) = E eiYf . S ist das charakteristische Funktional des verallgemeinerten stochastischen Prozesses (Yf )f ∈S(Rd ;R) . Beispiele. 1. Poissonscher Punktprozess: Sei λ > 0 fest. Es existiert genau ein Wahrscheinlichkeitsmaß µ auf S 0 (Rd ; R) mit Z Z eiϕ(f ) µ(dϕ) = exp λ (eif (x) − 1)dx . S 0 (Rd ;R) Rd In der statistischen Mechanik entspricht der Poissonsche Punktprozess dem idealen Gas, der Intensitätsparameter λ wird meist eher z geschrieben und Aktivität oder Fugazität genannt.4 2. Weißes Rauschen (white noise): Sei σ > 0 und Z Z C(f, f ) = σ 2 |f (t)|2 dt = σ 2 |fˆ(k)|2 dk. R R Es existiert genau ein Wahrscheinlichkeitsmaß µ auf S 0 (R; R) mit Z 1 Z ∞ 1 iϕ(f ) |f (t)|2 dt . e µ(dϕ) = exp − C(f, f ) = exp − σ 2 2 2 −∞ S 0 (R;R) 4 Achtung: Aktivität und Fugazität werden in der Literatur nicht überall gleich verwendet. Insbesondere stimmen die gebräuchlichen Definitionen aus Statistischer Mechanik und Thermodynamik in der Regel nicht überein. 29 3. Farbiges Rauschen. Ähnlich wie weißes Rauschen, aber das σ 2 wird k-abhängig gewählt: R 2 C(f, f ) = R σ (k)|fˆ(k)|2 dk. Je nach Wahl der Funktion σ 2 (k) spricht man von verschiedenen Farben des Rauschens. Ein wichtiger Spezialfall ist das sogenannte 1/f -Rauschen, auch Rosa Rauschen (pink noise) genannt. 4. Masseloses Gaußsches freies Feld : Sei d ≥ 3 und Z C(f, f ) := R3 ×R3 f (x)f (y) dxdy = 4π||x − y|| Z R3 |fˆ(k)|2 dk. ||k||2 Es existiert genau ein Wahrscheinlichkeitsmaß µ auf S 0 (R3 ; R), so dass Z 1 eiϕ(f ) µ(dϕ) = exp − C(f, f ) 2 S 0 (R3 ;R) In Physiker-Anschauung ist ϕ ein zufälliges Feld (ϕ(x))x∈Rd , das bezüglich einer Art unendlichdimensionalen Lebesgue-Maßes DϕRauf S 0 (Rd ; R) (welches aus mathematischer Perspektive nicht existiert!) die Dichte exp(− 21 Rd |∇ϕ(x)|2 dx) (existiert ebenfalls nicht, da ϕ eine Distribution ist und ϕ(x) kein wohldefiniertes Objekt...) hat. 5. Sei C : S(Rd ; R) × S(Rd ; R) → R eine stetige bilineare Abbildung mit der Eigenschaft, dass C(f, f ) ≥ 0 für alle f ∈ S(Rd ; R). Dann existiert genau ein Wahrscheinlichkeitsmaß µ auf S 0 (Rd ), so dass Z 1 eiϕ(f ) µ(dϕ) = exp − C(f, f ) . 2 S 0 (Rd ;R) µ wird Gaußsches Wahrscheinlichkeitsmaß mit Kovarianzoperator C genannt. Weißes Rauschen und das Gaußsche freie Feld sind Beispiele für zufällige Distributionen bzw. verallgemeinerte stochastische Prozesse, die nicht als zufällige Maße oder stochastische Prozesse konstruiert werden können. Das Gaußsche freie Feld spielt eine wichtige Rolle in der Quantenfeldtheorie (Physik), das weiße Rauschen in den stochastischen partiellen Differentialgleichungen (SPDEs) und der Modellierung vieler Probleme in Anwendungen aus Biologie, Ingenieurwissenschaften, Statistik und Physik. 30