Humboldt-Universität zu Berlin Institut für Mathematik Sommersemester 2010 Stochastik I Prof. Becherer Bodo Graumann 19. Mai 2014 cb a XETEX Diese Dokument wurde auf http://bodograumann.de veröï¬entlicht. Es steht unter der Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0) Lizenz. Der Code wurde mit gvim sowie vim-latex erstellt und mit xelatex kompiliert – all das auf Gentoo Linux. Meinen Dank an die Freie Software Community und die TEX-Kollegen auf TEX.SX für ihre Hinweise und Unterstützung. Bitte schreibt mir eure Kommentare und Verbesserungsvorschläge zu diesem Dokument! Ihr könnt mir entweder direkt mailen oder das Kontaktformular auf meiner Internetseite benutzen. 1 Stochastik I Inhaltsverzeichnis Seite 2 Inhaltsverzeichnis Literaturempfehlungen 3 1 Wahrscheinlichkeitsräume 5 2 bedingte Wahrscheinlichkeit und Unabhängigkeit 13 3 Asymptotische Ereignisse 18 4 Erwartungswert und Varianz 4.1 Die Gesetze der großen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . 19 23 5 Charakteristische Funktionen 5.1 Summe von unabhängigen Zufallsvariablen . . . . . . . . . . . . . . . . . . . 5.2 Normalverteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 30 33 6 Konvergenz in Verteilung / schwache Konvergenz 6.1 Beziehungen zu anderen Konvergenzarten . . . . . . . . . . . . . . . . . . . . 35 36 Prof. Becherer Bodo Graumann Stochastik I Literatur Seite 3 Literatur [Bau08] Baum, Prof. H.: Maßtheorie Skript. http://www-irm.mathematik.hu-berlin. de/%7Ebaum/Skript/MIT-SS08.pdf, 2008 [Els07] Elstrodt, J.: Maß- und Integrationstheorie. Springer, 2007 [Geo07] Georgii, H.-O.: Stochastik. De Gruyter Verlag, 2007 [Kle08] Klenke, A.: Wahrscheinlichkeitstheorie. Springer, 2008 [Kre05] Krengel, U.: Einführung in die Wahrscheinlichkeitstheorie & Statistik. 8. Vieweg, 2005 [Shi95] Shiryaev, Albert N.: Probability. Springer, 1995 [Sim82] Simmons, George F.: Introduction to Topology and Modern Analysis. Krieger Pub Co, 1982 [Sti03] Stirzaker, D.: Elementary Probability. 2. Cambridge University Press, 2003 [Str85] Strasser, H.: Mathematical Theory of Statistics. De Gruyter Verlag, 1985 Prof. Becherer Bodo Graumann Stochastik I Literatur Seite 4 Die Stochastik besteht im wesentlichen aus zwei Teile, die jedoch stark in einander greifen. Zum einen die Wahrscheinlichkeitstheorie, welche sich mit Wahrscheinlichkeitsmodellen beschäftigt und zum anderen die Statistik, die Häuï¬gkeiten in der Praxis betrachtet. Zuersteinmal wollen wir erklären, was ein Wahrscheinlichkeitsraum ist. Sei also ein Wahrscheinlichkeitsraum gegeben: (ðº, , â) Dabei sind die ðº die möglichen Ausgänge bzw. Ergebnisse eines Experiments, ⊂ (ðº) bezeichnet die Ereignisse die wir unterscheiden und â ist ein Wahrscheinlichkeitsmaß über . Beispiel einfaches Würfeln Beim einfachen Würfeln haben wir ðº = {1, 2, 3, 4, 5, 6} wobei ð ∈ ðº bedeutet, dass der Würfel die Augenzahl ð zeigt. Beispiel n-maliges Würfeln Würfeln wir nun n-mal, so ist ðº = {1, ⯠, 6}ð und ð ∈ ðº zählt die Einzelergebnisse der n Würfe auf. Ein Ereignis wäre dann ðŽ = ð ∈ ðº ∀ð, ð: ðð = ðð : „Alle Würfe ergeben die selbe Zahl“. Da wir die Gleichverteilung auf ðº erwarten, erhalten wir das Laplace’sche Wahrscheinlichkeitsmaß, dass jedem der endlich vielen Ausgänge ð ∈ ðº die Wahrscheinlichkeit 1 zuordnet und in diesem Fall ergibt: â({ð}) = |ðº| â(ðŽ) = |ðŽ| 6 = = 6−(ð−1) |ðº| 6ð Beispiel Münzwurf Der einfache Münzwurf lässt sich wiefolgt modellieren: ðº = {0, 1} wobei 0 Zahl bedeutet und 1 Kopf. Dies lässt sich auch auf n-fachen Münzwurf erweitern: ðº = {0, 1}ð . Probleme entstehen aber, wenn man beliebig oft spielen will. Die Gleichverteilung auf ({0, 1}â ) lässt sich nicht mehr intuitiv beschreiben. Beispiel Aktienkurse Wir betrachten die stetigen Funktionen ðº = ð¶([0, ð ] , â) und das Ereignis ðŽ = { ð ∈ ðº | ∀0 ≤ ð¡ ≤ ð: ð(ð¡) ≥ 5000 } Ziel Wir wollen jedem Ereignis ðŽ eine Wahrscheinlichkeit â(ðŽ) ∈ [0, 1] zuordnen, sodass â als Abbildung von ⊆ (ðº) → [0, 1] gewisse vorteilhafte Eigenschaften hat. Prof. Becherer Bodo Graumann Stochastik I 1 Wahrscheinlichkeitsräume Seite 5 1 Satz: Vitali Sei ðº = {0, 1}â . Dann gibt es keine Abbildung â: (ðº) → [0, 1] mit den folgenden Eigenschaften: 1. â(ðº) = 1 2. ðŽð ⊆ ðº, ð ∈ â, ð ≠ ð ⇒ ðŽð ∩ ðŽð = ∅, so gilt ∞ â( ∞ ðŽð ) = â(ðŽð ) ð=1 ð=1 1 − ðð für ð = ð ðð sonst und ðŽ ∈ (ðº) gilt ∀ð ∈ â: â(ðŽ) = â(ðð (ðŽ)) 3. Mit ðð : ðº → ðº, ðð (ð)ð = ,ð∈â Beweis (1) Auf ðº deï¬nieren wir eine Äquivalenzrelation: ð ∼ ð : ⇔ ∃ð0 ∈ â: ∀ð ≥ ð0 : ðð = ðð Glaubt man an das Auswahlaxiom, kann man ein Repräsentantensystem ðŽ ⊂ ðº auswählen. Für ð = ð1 , ð2 , ⯠, ðð ⊂ â endlich deï¬nieren wir ðð : = ðð1 â ðð2 â ⯠â ððð dann gilt ðº= ðð (ðŽ) ð= ð1 ,â¯,ðð da ð ∼ ð ⇔ ∃ð: ð = ðð (ð ) und ðŽ Repräsentantensystem von (ðº, ∼) ist. Jetzt gibt es folgende Fälle: 1. â(ðŽ) = 0 ⇒ â(ðð (ðŽ)) = 0 ⇒ â(ðº) = 0 ⯠2. â(ðŽ) > 0 ⇒ â(ðð (ðŽ)) > 0 ⇒ â(ðº) = ∞ ⯠⡠1 Wahrscheinlichkeitsräume • Axiomatische Grundlagen für (ðº, , â) und erste Eigenschaften. 2 Bemerkung: Folgenräume und reelle Zahlen {0, 1}|â| ist mit [0, 1] gleichmächtig mittels der dualen Zahlendarstellung als Bijektion: ∞ 2−ð ðð (ð)ð∈â ↔ ð=1 wenn wir die abzählbarvielen Folgen der Form ð1 , ð2 , ⯠, 0, 1, 1, ⯠und ð1 , ð2 , ⯠, 1, 0, 0, ⯠paarweise identiï¬zieren. Prof. Becherer Bodo Graumann Stochastik I 1 Wahrscheinlichkeitsräume Seite 6 3 Satz: Nichtexistenz der Gleichverteilung Es sei ðº: = [0, 1) = â mod 1. Dann existiert kein â: (ðº) → [0, 1] so dass 1. â(ðº) = 1 ∞ 2. â(âš∞ ð=1 ðŽð ) = ∑ð=1 â(ðŽð ) 3. ∀ð¥ ∈ â, ðŽ ⊂ ðº: â(ðŽ) = â(ðŽ + ð¥) Beweis (3) Wir betrachten die Äquivalenzrelation ð¥ ∼ ðŠ: ⇔ ð¥ − ðŠ ∈ â ⊂ â Dazu sei ðŽ ⊂ [0, 1) eine Menge von Repräsentanten. (Dabei ist |ðŽ| > |â|). Dann ist (ðŽ + ð) = [0, 1) ð∈[0,1)∩â und somit mit den geforderten Eigenschaften: 1 = â(ðº) = â(ðŽ) ⯠ð¥∈[0,1)∩â â¡ Folgerung Da es nicht möglich ist, die obigen „vernünftig“ erscheinenden Forderungen auf der gesamten Potenzmenge zu erfüllen, müssen wir uns auf Teilmengen beschränken. 4 Deï¬nition: „σ-Algebra, Ereignis“ Sei ðº ≠ ∅. Ein Mengensystem ⊆ (ðº) heißt σ-Algebra, falls 1. ðº ∈ 2. ðŽ ∈ ⇒ ðŽÌ ∈ 3. ðŽð ∈ , ð ∈ â ⇒ â∞ ð=1 ðŽð ∈ Das Paar (ðº, ) heißt messbarer Raum oder Ereignisraum. Ein Element ðŽ ∈ oder auch Ereignis. heißt messbar 5 Deï¬nition: „Wahrscheinlichkeitsmaß (ÐПлЌПгПÑПв Axiome)“ Sei (ðº, ) ein Ereignisraum. Eine Funktion â: → [0, 1] heißt Wahrscheinlichkeitsmaß, falls 1. â(ðº) = 1 ∞ 2. ðŽð ∈ , ð ∈ â ⇒ â(âš∞ ð=1 ðŽð ) = ∑ð=1 â(ðŽð ) Wir bezeichnen (ðº, , â) dann als Wahrscheinlichkeitsraum. Prof. Becherer Bodo Graumann Stochastik I 1 Wahrscheinlichkeitsräume Seite 7 6 Bemerkung: Eigenschaften von σ-Algebren Ist eine σ-Algebra auf ðº, dann gilt 1. ∅ ∈ 2. ðŽ, ðµ ∈ ⇒ðŽ∪ðµ∈ 3. ðŽ, ðµ ∈ ⇒ðŽ∩ðµ∈ 4. ðŽð ∈ , ð ∈ â ⇒ â∞ ð=1 ðŽð ∈ 7 Lemma: erzeugte σ-Algebren Sei ðº ≠ ∅ und ðº ⊆ ð (ðº). (ðº). Dann existiert eine kleinste σ-Algebra ð (ðº) auf ðº sodass ðº ⊆ 8 Deï¬nition: „Borel-σ-Algebra“ (ðº): = ð ({ ð ⊆ ðº, oï¬en }) nenen wir die Borel-σ-Algebra und speziell ð := (âð ). Bemerkung Die Borel-σ-Algebra kann von verschiedenen Erzeugersystem erzeugt werden. Zum Beispiel von der Menge aller oï¬enen Mengen , der Menge aller abgeschlossenen Mengen oder der Menge aller Hyperquader mit rationalen Koordinaten . 9 Lemma: Erzeugung der Borel-σ-Algebra ð( )= ð( )= ð( ) Beweis (9) ð( ) = ð ( ) folgt sofort aus der Abgeschlossenheit von σ-Algebren unter Komplement. ð( ) = ð ( ) gilt, da jede oï¬ene Menge eine abzählbare Vereinigung von solchen Hyperquadern ist und jeder Hyperquader sich als abzählbarer Schnitt oï¬ener Mengen darstellen lässt. 10 Deï¬nition: „Spur-σ-Algebra“ Sei (ðº, ) ein messbarer Raum, ðº ⊆ ðº, dann ist Spur-σ-Algebra. := ∩ðº ⊆ eine σ-Algebra und heißt 11 Deï¬nition: „Produkt-σ-Algebra“ Sei ðº = âšð∈ðŒ ðžð für eine beliebige Indexmenge ðŒ ≠ ∅ und ðð die kanonischen Projektionen, sowie (ðžð , ð ) messbare Räume. Dann ist die Produkt-σ-Algebra von ((ðžð , ð ))ð∈ðŒ deï¬niert als ð: = ð ðð−1 (ðŽð ) ðŽð ∈ ð ð∈ðŒ Bei gleichen (ðžð , Prof. Becherer ð) mit = ð schreibt man auch ðŒ bzw. Bodo Graumann ð für endliche Fälle. Stochastik I Bemerkung Es gilt 1 Wahrscheinlichkeitsräume ð = 1 ð Seite 8 . 12 Satz: elementare Eigenschaften von Wahrscheinlichkeitsmaßen â 1. â(∅) = 0 2. â(ðŽ ∪ ðµ) + â(ðŽ ∩ ðµ) = â(ðŽ) + â(ðµ) 3. ðŽ, ðµ ∈ , ðŽ ⊆ ðµ ⇒ â(ðŽ) ≤ â(ðµ). ∞ 4. ðŽð ∈ , ð ∈ â: â â∞ ð=1 ðŽð ≤ ∑ð=1 â(ðŽð ) 5. ðŽð ∈ , ð ∈ â, ðŽ1 ⊃ ðŽ2 ⊃ ⯠⇒ â â∞ ð=1 ðŽð = limð→∞ â(ðŽð ). 6. ðŽð ∈ , ð ∈ â, ðŽ1 ⊂ ðŽ2 ⊂ ⯠⇒ â â∞ ð=1 ðŽð = limð→∞ â(ðŽð ). 7. ðŽð ∈ , ð ∈ â, ∀ð: limð→∞ ððŽð (ð) = ððŽ (ð) ⇒ lim∞ ð=1 â(ðŽð ) = â(ðŽ) 13 Deï¬nition: „diskrete Wahrscheinlichkeitsräume“ Ist in (ðº, , â) die Menge ðº abzählbar, dann nennen wir diesen Wahrscheinlichkeitsraum diskret. 14 Satz: Zähldichte Sei ðº abzählbar und ð: ð → ðº eine Folge in â+ mit ∑ð∈ðº ð(ð) = 1. Dann existiert genau ein Wahrscheinlichkeitsmaß â auf (ðº, (ðº)) mit â(ðŽ) = ∑ð∈ðŽ ð(ð) für alle ðŽ ∈ â(ðº). Wir nennen ð die Zähldichte und die einzelnen ð(ð) Wahrscheinlichkeitsgewichte. 15 Deï¬nition: „diskretes Produktmaß“ Für ð diskrete Wahrscheinlichkeitsräume mit Zählmaßen ðð erhalten wir ein Wahrscheinlichkeitsmaß â auf âšðð=1 ðºð , âšðð=1 ð , ∏ðð=1 ðð . Dieses nennen wir diskretes Produktmaß. Für das Produkt ð gleicher Zählmaße ð, schreiben wir â = ð⊗ð . einige Wahrscheinlichkeitsmaße Binomialverteilung ðº = {0, 1, ⯠, ð}, ð ∈ [0, 1]. Geometrische Verteilung ðº = â, = (ðº), ð(ð) = (ðð)ðð (1 − ð)ð−ð =: Binð,ð (ð) mit = (ðº), ð ∈ (0, 1]. ð(ð) = ð(1 − ð)ð . ð Poisson Verteilung ðº = â, ð > 0 „Intensität“, ð(ð) = ð−ð ðð! =: Poissonð (ð). 16 Lemma: Zusammenhang zwischen Poisson- und Binomialverteilung Sei ðð ∈ (0, 1] mit limð→∞ ððð = ð > 0, dann gilt für alle ð ∈ â: lim Binð,ð (ð) = Poissonð (ð) ð→∞ Prof. Becherer Bodo Graumann Stochastik I 1 Wahrscheinlichkeitsräume Seite 9 17 Deï¬nition: „Zufallsvariable“ Seien (ðº, ) und (ðº , falls ∀ðŽ ∈ ) messbare Räume. Eine Abbildung ð: ðº → ðº heißt Zufallsvariable : ð −1 (ðŽ ) ∈ Diese Forderung erwächst aus dem Bedürfnis â( ð ∈ ðŽ ) = â( ð ∈ ðº ð(ð) ∈ ðŽ ) = â(ð −1 (ðŽ )) = â â ð −1 (ðŽ ) berechnen zu wollen. Hinreichend ist zum Beispiel = (ðº). 18 Deï¬nition: „Wahrscheinlichkeitsverteilung“ Sei ð: (ðº, , â) → (ðº , ) eine Zufallsvariable auf dem Wahrscheinlichkeitsraum (ðº, , â). Dann heißt âð : = ââð −1 das Bildmaß von ð bzw. die Verteilung von ð und ist ein Wahrscheinlichkeitsmaß auf dem messbaren Raum (ðº , ). 19 Deï¬nition: „Algebra, (Prä)maß, σ-endlich“ Sei ðº ≠ ∅. • ⊆ (ðº) heißt Algebra falls 1. ðº ∈ 2. ðŽ ∈ ⇒ ðŽÌ ∈ 3. ðŽ, ðµ ∈ ⇒ðŽ∪ðµ∈ • Eine Abbildung ð: → [0, ∞] heißt Prämaß auf einer Algebra ðŽ ∈ ⇒ ð(ðŽ) = ∑∞ ðŽ = âš∞ ð=1 ð(ðŽð ). ð=1 ð • Eine solches ð heißt Maß falls falls ðŽð ∈ mit eine σ-Algebra ist. • Ein Maß ð heißt σ-endlich falls ∃(ðŽð )ð∈â , ðŽð ∈ : ðŽð ↑ ðº ∧ ð(ðŽð ) < ∞. • Ein Maß ð heißt Wahrscheinlichkeitsmaß falls ð(ðº) = 1. Beispiel Auf ðº = â ist = âš∞ ð=1 ðð , ðð ∩ â ð ∈ â, −∞ ≤ ð1 < ð1 < ⯠< ðð < ðð ≤ ∞ eine Algebra. Dann deï¬nieren wir das folgende Prämaß: ð ð ð ðð , ðð ð=1 := (ðð − ðð ) ð=1 Dafür gilt dann sofort endliche Additivität. 20 Satz: Monotone Klassentheorem für Mengen Sei ⊆ (ðº) ein Mengensystem, welches abgeschlossen bezüglich endlichen Durchschnitten ist und ðº enthält. Sei weiterhin das kleinste umschließende Mengensystem, welches abgeschlossen bezüglich wachsenden Grenzwerten und Mengendiï¬erenzen (genauer: ðŽ, ðµ ∈ , ðµ ⊂ ðŽ ⇒ ðŽ ⧵ ðµ ∈ ) ist, dann ist bereits = ð( ). Prof. Becherer Bodo Graumann Stochastik I 1 Wahrscheinlichkeitsräume Seite 10 Beweis (20) Für ðµ ⊆ ðº sei ðµ : = { ðŽ ∈ | ðŽ ∩ ðµ ∈ }. Dann ist ðµ abgeschlossen bezüglich wachsenden Grenzwerten und Mengendiï¬erenzen. Für ðµ ∈ gilt für alle ð¶ ∈ : ðµ∩ð¶∈ ⊆ ⇒ð¶∈ ðµ ⇒ ⊆ ðµ ⊆ ⇒ ðµ = Für ðµ ∈ und ð¶ ∈ gilt ðµ ∈ ð¶ = und ðµ ∩ ð¶ ∈ ⇒ ð¶ ∈ ðµ . Damit gilt . ist also abgeschlossen bezüglich endlicher Durchschnitte. Auch gilt ðº ∈ ⊆ und damit ist auch abgeschlossen gegenüber Komplementbildung. Nach der Abgeschlossenheit unter aufsteigenden Grenzwerten ist dann auch jede abzählbare Vereinigung aus Mengen in selber in . Mit ⊆ folgt dann die Behauptung. 21 Korollar: Seien â, ð Wahrscheinlichkeitsmaße auf dem messbaren Raum (ðº, ), die auf einem unter Durchschnitt stabilen System von = ð ( ) übereinstimmen, dann gilt â = ð auf . 22 Satz: Fortsetzungssatz von Carathéodory (1917) Für jedes σ-endliche Prämaß ð auf einer Algebra ⊆ (ðº) existiert ein eindeutiges Maß ðÌ auf der σ-Algebra = ð ( ), welche mit diesem auf übereinstimmt. Zudem ist dann ðÌ selber σ-endlich. 23 Lemma: Eindeutigkeitssatz Seien ð und ð σ-endliche Maße auf dem Maßraum (ðº, ) wobei = Durchschnittbildung stabilen Erzeuger mit ð = ð auf und (ðŽð )ð∈â ∈ ð(ðŽð ) = ð(ðŽð ). Dann gilt auf ganz : ð = ð. ð( ) für einen unter mit ðŽð ↑ ðº sowie 24 Lemma: Sei ð ein Maß auf (â, (â)) und endlich auf Kompakta. Dann ist ⧠ð((0, ð¥]) ð¥ > 0 ⪠0 ð¥=0 ðº(ð¥): = ⚠⪠−ð((ð¥, 0]) ð¥ < 0 â© monoton wachsend und rechtsstetig. 25 Deï¬nition: „Verteilungsfunktion“ Für ein Wahrscheinlichkeitsmaß â auf (â, (â)) ist seine (kumulative) Verteilungsfunktion ð¹ gegeben durch ð¹(ð¥): = â((−∞, ð¥]) 26 Korollar: Jede Verteilungsfunktion ð¹ eines Wahrscheinlichkeitsmaßes ist rechtsstetig, monoton wachsend und es ist limð¥→∞ ð¹(ð¥) = 1 sowie limð¥→−∞ ð¹(ð¥) = 0. Prof. Becherer Bodo Graumann Stochastik I 1 Wahrscheinlichkeitsräume Seite 11 27 Satz: Sei ð¹: â → â eine monoton wachsende, rechtsstetige Funktion. Dann existiert ein eindeutiges σ-endliches Maß ð auf (â, ) mit ∀ð, ð ∈ â, ð < ð: ð((ð, ð]) = ð¹(ð) − ð¹(ð). Beispiel 1. Für ð¹(ð¥) = ð¥ erhalten wir damit das Lebesguemaß ð auf (â, ). 2. Für ð¹(ð¥) = min(1, max(ð¥, 1)) liefert der Satz uns die Gleichverteilung ð auf ([0, 1] , ([0, 1])). Beweis (27) Eindeutigkeit { (ð, ð] | ð, ð ∈ â, ð < ð } ist ein unter Durchschnitt stabiler Erzeuger von , wodurch die Eindeutigkeit bereits gilt. Existenz Wir wählen ðŸ := ðð , ðð ∩ â ðŸ ∈ â, −∞ ≤ ð1 < ð1 < ð2 < ⯠< ðð ≤ +∞ ð=1 ist eine Algebra. Für ðŽ: = âšðŸ ð=1 ðð , ðð ∈ Dieses deï¬nieren wir ðŸ ð(ðŽ): = ð¹(ðð ) − ð¹(ðð ) ð=1 Damit ist ð additiv auf . ðŸ ð Seien nun ðŽð : = âšð=1 ðð,ð , ðð,ð disjunkt. Mit ðŽ∞ : = âš∞ ð=1 ðŽð ∈ ∞ ðŽ = ðŸ∞ âð=1 gilt dann ðð,∞ , ðð,∞ wobei ðŸ∞ < ∞. Dann müssen wir zeigen ∞ ðŸð ðŸ∞ ð¹(ðð,∞ ) − ð¹(ðð,∞ ) = ð=1 ðŸ∞ ∞ ðŸð ð¹(ðð,ð ) − ð¹(ðð,ð ) = ð=1 ð=1 ð¹(ðð,ð ) ð=1 ð=1 ð=1 ðð,ð ,ðð,ð ⊆ ðð,∞ ,ðð,∞ − ð¹(ðð,ð ) Nun zeigen wir die Gleichheit summandenweise. Für jedes ð gilt also wegen Monotonie und ð∞ , ð∞ ⊇ âšð ð=1 ðð , ðð die Richtung „≥“. Betrachten wir ðð : = ðð , ðð + ð¿ð ⊇ ðð , ðð oï¬en mit ð¿ð : = ð¿(ð) sodass ð( ðð , ðð + ð¿ð ) ≤ ð( ðð , ðð )+ð2−ð für ein beliebiges ð > 0. ðð ist eine oï¬ene Überdeckung von ð∞ + ð¿∞ , ð∞ ⊆ ð∞ , ð∞ mit ð¿∞ = ð¿∞ (ð) sodass ð( ð∞ , ð∞ + ð¿∞ ) wegen Rechtsstetigkeit. Dieses Intervall ist kompakt, also können wir eine endliche Teilüberdeckung ï¬nden: ∃ð ∈ â: âð ð=1 ðð , ðð + ð¿ð ⊇ ð∞ + ð¿∞ , ð∞ ⊇ ð∞ + ð¿∞ , ð∞ . Damit gilt weiter ð( ð∞ , ð∞ ) = ð( ð∞ , ð∞ + ð¿∞ ) + ð( ð∞ + ð¿∞ , ð∞ ) ∞ ð ð( ðð , ðð + ð¿ð ) ≤ 2ð + ≤ð+ ð( ðð , ðð ) ð=1 ð=1 ð( ðð ,ðð )+ð2−ð Prof. Becherer Bodo Graumann Stochastik I 1 Wahrscheinlichkeitsräume Seite 12 Also ist auch „≤“ da ð beliebig gewählt war. Somit ist ð ein Prämaß auf und nach Fortsetzungssatz ein Maß auf = ð( ). Beispiele für Verteilungsfunktionen von Wahrscheinlichkeitsmaßen auf (â, ): 1. Sei ð¹(ð¥): = ð[ð,∞) mit ð ∈ â. Dann erhalten wir das Dirac-Punktmaß ð¿ð auf ð ∈ â. 2. Führt man noch mehrere endliche Zwischenstufen ein auf ðð mit den Werten ðð , dann erhält man ð = ∑ðð=1 (ðð − ðð−1 )ð¿ðð . 28 Deï¬nition: „absolute Stetigkeit, Dichte“ Existiert für ein Wahrscheinlichkeitsmaß â auf (â, ) eine messbare Funktion ð: (â, ) → (â, ), ∀ð¡ ∈ â: ð(ð¡) ≥ 0 sodass sich die Verteilungsfunktion von â darstellen lässt als ð¹(ð¥) = ð¥ ð(ð¡)dð¡ so heißt ð die Dichte von â und ð¹ ist absolutstetig. ∫−∞ 29 Lemma: ∞ Ist ð¹ absolutstetig und es gilt ∫−∞ ð(ð¡)dð¡ = 1 für die Dichte ð, dann ist ð¹ die Verteilungsfunktion eines Wahrscheinlichkeitsmaßes â auf (â, ). Beispiel für Wahrscheinlichkeitsmaße mit Dichten 2 1. Die Normalverteilung hat die Dichte ðð,ð (ð¥) = (ð¥−ð) 1 ð− 2ð 2 √2ðð mit den Parametern ð und ð. 2. Die Gammverteilung besitzt ebenfalls eine Dichte. Diese können wir wiefolgt herleiten: Betrachten wir ein Modell für die Anzahl von Versicherungsschäden über einem Zeitinterð vall (0, ð¡]. Dies können wir durch PoissonðŒð¡ (ð) = ð−ðŒð¡ (ðŒð¡) modellieren. (Es wurde ð = ðŒð¡ ð! gewählt.) ðŒ beschreibt die Proportionalität zwischen der Länge des Zeitintervalls und der erwarteten Anzahl an Schäden. Für das Ereignis, dass mindestens ð Schäden auftreten erhalten wir: ð−1 â(ðŽ) = 1 − Poissonð ({0, 1, ⯠, ð}) = 1 − Poissonð (ð) ð=0 ð−1 ð−ðŒð¡ =1− ð=0 (ðŒð¡)ð = ð! ð¡ 0 ðŒð ð¥ð−1 ð−ðŒð¥ dð¥ (ð − 1)! Dann ist die Verteilung der Zeit bis zum ð-ten Schaden die Gammaverteilung mit der Dichte ðŸðŒ,ð (ð¥) = ð[0,∞) (ð¥) ⋅ ðŒ ð ð¥ð−1 ⋅ ð−ðŒð¥ (ð − 1)! Die Gammafunktion ist ∞ ð€(ð): = ðŠð−1 ð−ðŠ dðŠ , ð>0 0 Prof. Becherer Bodo Graumann Stochastik I 2 bedingte Wahrscheinlichkeit und Unabhängigkeit Seite 13 Allgemein kann dies nicht analytisch ausgeschrieben werden. Jedoch erhält man für ð ∈ â: ð€(ð) = (ð − 1)!. 3. Die Exponentialverteilung mit Parameter ðŒ > 0 hat die Dichte ððŒ = ðŸðŒ,1 . Erinnerung an die Hauptresultate zum Maßintegral Ist (ðº, ) ein messbarer Raum mit einem Maß ð: → [0, ∞]. Dann wollen wir ein Integralbegriï¬ deï¬nieren. Wir bezeichnen dieses dann mit ∫ðº ðdð bzw. ∫ðº ð(ð)dð(ð) . Dabei werden erst die Integrale über elementare Funktionen (Treppenfunktionen) deï¬niert: ð = ∑ð ð=1 ðŒð ððŽð ð wobei ðð ∈ â+ ⇒ ∫ ðdð : = ∑ð=1 ðŒð ð(ðŽð ). Ist ð ≥ 0 messbar, so deï¬nieren wir ∫ ðdð : = supð elementar ∫ ðdð . Für alle anderen messbaren Funktionen ð mit ∫ |ð |dð endlich setzen wir 0≤ð≤ð dann ∫ ðdð : = ∫ max(0, ð)dð − ∫ max 0, −ð dð . Diese Funktionen heißen dann Lebesgueintegrierbar (ð ∈ ð¿1 (ð) bzw. ð¿1 (ðº, , ð)). Bemerkung 1. Für eine Folge messbarer Funktionen (ðð )ð∈â gelten die folgenden Konvergenzsätze a) „Lemma von Fatou“: für ðð ≥ 0 gilt lim inf ðð dð ≤ lim inf ð→∞ ð→∞ ðð dð b) „monotone Konvergenz“: für 0 ≤ ð1 ≤ ð2 ≤ ⯠gilt lim ð→∞ ðð dð = lim ð dð ð→∞ ð c) „majorisierte Konvergenz“: ∃ð ∈ ð¿1 (ð): ð( ð ∈ ðº ∃ð ∈ â: |ðð (ð)| > ð(ð) ) und ðð → ð∞ ð-fast überall gilt, dann ist limð→∞ ∫ ðð dð = ∫ ð∞ dð . 2. für ð: â → [0, ∞) Riemann integrierbar auf â, gilt dass ð Lebesgue integrierbar ist und dass die Integrale übereinstimmen, wenn für ð das Lebesguemaß gewählt wird. 30 Korollar: Sei (ðº, , ð) mit ð: → [0, ∞] ein Maßraum und ð: ðº → â eine ( , )-messbare Funktion. Außerdem sei ð ≥ 0 und ∫ ðdð = 1. Dann ist â(ðŽ): = ∫ ððŽ ðdð = ∫ðŽ ðdð für ðŽ ∈ ein Wahrscheinlichkeitsmaß. Man nennt ð = ðâ die Radon-Nikodym Dichte von â bezüglich ð und ðð nennt â absolutstetig bezüglich ð mit Dichte ð. 2 bedingte Wahrscheinlichkeit und Unabhängigkeit Motivation Wir betrachten eine Studie eines neuen Tests auf eine Krankheit. Es werden 1000 Versuchspatienten getestet. Daraus entsteht die Kontingenztafel: Prof. Becherer Bodo Graumann Stochastik I 2 bedingte Wahrscheinlichkeit und Unabhängigkeit gesund krank negativ 970 1 97 positiv 20 9 29 Seite 14 990 10 1000 Fragen: Welche Diagnose muss bei positivem Testergebnis gestellt werden? Der Anteil der Gesunden inter den positiv getesteten ist 20 ≈ 69%. Der Anteil der Kranken un29 9 ter den positiv Getesteten ist 29 ≈ 31%. Andererseits gilt unter der Bedingung, dass ein negatives ≈ 99, 9% und der Anteil der Kranken Testergebnis vorliegt, dass der Anteil der Gesunden 970 971 1 ≈ 0, 1% ist. 971 31 Deï¬nition: „bedingte Wahrscheinlichkeit“ Gegeben sei (ðº, , â) und ðŽ, ðµ ∈ â(ðŽ|ðµ): = mit â(ðµ) > 0. Dann heißt â(ðŽ ∩ ðµ) â(ðµ) die bedingte Wahrscheinlichkeit von ðŽ unter ðµ. 32 Satz: Eigenschaften der bedingten Wahrscheinlichkeit Sei ein Wahrscheinlichkeitsraum (ðº, , â) gegeben mit ðµ ∈ und â(ðµ) > 0. 1. ð(ðŽ): = â(ðŽ|ðµ) ist ein Wahrscheinlichkeitsmaß auf . 2. Formel von der totalen Wahrscheinlichkeit: Sei ðµ = âšð∈ðŒ ðµð mit â(ðµð ) > 0 und abzählbarem ðŒ, dan gilt â(ðŽ ∩ ðµ) = â(ðµð )â(ðŽ|ðµð ) ð∈ðŒ 3. Seien ðŽ, ðµð ∈ mit strikt positiven Wahrscheinlichkeiten, ðŒ abzählbar, ðµð paarweise disjunkt und ðº = âšð∈ðŒ ðµð , dann gilt â(ðµð |ðŽ) = â(ðµð )â(ðŽ|ðµð ) ∑ð∈ðŒ â(ðµð )â(ðŽ|ðµð ) 33 Lemma: Multiplikationsformel Seien ðŽð ∈ mit â(âð−1 ð=1 ðŽð ) > 0, dann ist ð â( ð−1 ð ðŽð ) = â(ðŽ1 ) ð=1 Prof. Becherer â(ðŽð | ð=2 ðŽð ) ð=1 Bodo Graumann Stochastik I 2 bedingte Wahrscheinlichkeit und Unabhängigkeit Seite 15 34 Deï¬nition: „Unabhängigkeit“ 1. Zwei Ereigniss ðŽ, ðµ ∈ heißen unabhängig, falls â(ðŽ ∩ ðµ) = â(ðŽ)â(ðµ). 2. Eine beliebige Familie von Ereignissen (ðŽð ) heißt unabhängig falls für jede endliche Teilmenge (ðŽð )ð∈ðœ gilt â( ðŽð ) = ð∈ðœ â(ðŽð ) ð∈ðœ 3. eine Familie von Mengensystemen ( ð )ð∈ðŒ , ð ⊆ heißt unabhängig falls jede Auswahl (ðŽð )ð∈ðŒ , ðŽð ∈ ð eine unabhängige Familie von Ereignissen liefert. 4. Eine Familie von Zufallsvariablen ðð : (ðº, ) → (ðºð , ð ) heißt unabhängig, falls die σAlgebren ð(ðð ): = ðð−1 ( ð ) unabhängig sind. (Dabei ist ð(ðð ) die kleinste σ-Algebra auf ðº, bezüglicher welcher ðð messbar ist.) Bemerkungen 1. Sind (ðŽð )ð∈ðŒ unabhängig, dann sind die ðŽð paarweise unabhängig. Die umgekehrte Implikation gilt jedoch nicht. 2. (ðŽð )ð∈ðŒ sind genau dann unabhängig, wenn die ( ∅, ðŽð , ðŽðÌ , ðº )ð∈ðŒ unabhängige σ-Algebren sind. 35 Satz: Unabhängigkeitskriterium für Zufallsvariablen Gegeben sei eine Familie von Zufallsvariablen ðð : (ðº, ) → (ðºð , ð ), ð ∈ ðŒ und ein unter Durchschnitt stabiler Erzeuger ð ( ð = ð( ð )). Für endliche ðœ ⊂ ðŒ und ðµð ∈ ð , ð ∈ ðœ gelte ðð−1 (ðµð )) = â( â(ðð ∈ ðµð ) ð∈ðœ ð∈ðœ (das heißt die ( ðð−1 (ðžð ) ðžð ∈ ð )ð∈ðŒ sind unabhängig) Dann sind die (ðð )ð∈ðŒ unabhängig. 36 Korollar: Speziellere Unabhängigkeitskriterien Sei (ðð )ð∈{1,â¯,ð} eine endliche Familie von Zufallsvariablen auf (ðº, , â), dann gilt: 1. (diskreter Fall) falls die ðð die Form ðð : (ðº, ) → (ðºð , ð ) haben mit ðºð abzählbar und ð = (ðºð ), so sind die (ðð )ð=1,â¯,ð genau dann unabhängig, wenn ð ∀ðð ∈ ðºð : â(ðð = ðð , ð = 1, ⯠, ð) = â(ðð = ð€ð ) ð=1 2. (reellwertiger Fall) falls die ðð die Form ðð : (ðº, ) → (â, ) haben, so sind die (ðð )ð=1,â¯,ð unabhängig genau dann, wenn ð ∀ðð ∈ â: â(ðð ≤ ðð , ð = 1, ⯠, ð) = â(ðð ≤ ðð ) ð=1 Prof. Becherer Bodo Graumann Stochastik I 2 bedingte Wahrscheinlichkeit und Unabhängigkeit Seite 16 3. (reellwertiger, absolutstetiger Fall) sind die ðð wie zuvor und die âðð = â â ðð−1 absolutstetige Verteilungen auf (â, ) mit Dichtefunktionen ðð : (â, ) → (â+ , (â+ )), so sind die (ðð )ð=1,â¯,ð ) genau dann unabhängig, wenn ð: = (ð1 , ⯠, ðð ): (ðº, ) → (âð , ð ) eine absolutstetige Verteilung â â ð −1 mit der Dichte ðð (ðŠ): = ðð (ðŠ1 , ⯠, ðŠð ) = ∏ðð=1 ðð (ðŠð ) ist (bis auf eine Lebesgue-Nullmenge). Beispiel ð1 , ð2 sind unabhängig und jeweis ð(0, 1)-verteilt genau dann, wenn ð = (ð1 , ð2 ) eine absolutstetige Verteilung mit Dichte ðð (ðŠ) = ð1 (ðŠ)ð2 (ðŠ) = 1 ð− 2ð gerade die Standerdnormalverteilung mit Mittelwertparameter meter ðŒ2 = 1 0 0 1 ðŠ2 +ðŠ2 1 2 2 0 0 . Diese Verteilung von ð ist und Kovarianzmatrixpara- â ðŒ2 ). = ð(0, Bemerkungen 1. Die gemeinsame Verteilung einer Familie von Zufallsvariablen ðð : (ðº, ) → (ðºð , ð ) ist die Verteilung â â ð −1 der Zufallsvariable ð: = (ðð )ð∈ðŒ : (ðº, ) → (âšð∈ðŒ ðºð , âšð∈ðŒ ð ). 2. Umgekehrt induziert eine mehrdimensionale Zufallsvariable ð· eine Verteilung â â ð −1 auf dem Produktraum (âšð∈ðŒ ðºð , âšð∈ðŒ ð ). 3. Die gemeinsame Verteilung induziert die Randverteilungen (Einschränkungen der ðð ) als âðð (ðµð ) = â(ðð ∈ ðµð ) = â(ð1 ∈ ðº1 , ⯠, ðð ∈ ðµð , ⯠ðð ∈ ðºð ) = â â ð −1 (ðº1 × â¯ × ðµð × â¯ × ðºð ). 37 Satz: Existenz des Produktmaßes Sei (ðºð , ð , âð )ð∈ðŒ eine Familie von Wahrscheinlichkeitsräumen, dann existiert genau ein Wahrscheinlichkeitsmaß â auf ðº: = âšð∈ðŒ ðºð , : = âšð∈ðŒ ð = ð(ðð , ð ∈ ðŒ) (Die kleinste σ-Algebra bezüglich welcher alle Koordinatenprojektionen messbar sind.), so dass für alle endlichen Teilmengen ð ⊆ ðŒ gilt ∀ðŽð ∈ ðð−1 (ðŽð ) ð: â ð∈ðœ = âð (ðŽð ) ð∈ðœ â heißt das Produktmaß und wir schreiben â = âšð∈ðŒ âð . Bemerkung Insbesondere gilt für die Randverteilung der ð-ten Koordinate unter â, dass mit ðŽð ∈ ð : â(ðð−1 (ðŽð )) = âð (ðŽð ) ist, das heißt die âð sind die Randverteilungen der Koordinatenprojektionen ðð welche Zufallsvariablen auf dem Raum (ðº, , â) sind. 38 Korollar: Existenz von Projektionen Zu gegebenen Wahrscheinlichkeitsmaßen âð auf (ðºð , ð )ð∈ðŒ existiert ein Wahrscheinlichkeitsraum (ðº, , â) mit unabhängigen Zufallsvariablen (ðð )ð∈ðŒ so dass â â ðð−1 = âð für ð ∈ ðŒ gilt. Prof. Becherer Bodo Graumann Stochastik I 2 bedingte Wahrscheinlichkeit und Unabhängigkeit Seite 17 39 Bemerkung: 1. Wegen dem obigen Korrolar sind Zufallsvariablen genau dann unabhängig, wenn ihre gemeinsame Verteilung durch das Produktmaß der Einzelverteilungen gegeben ist. Das heißt die Randverteilungen gerade die Verteilungen der einzelnen Zufallsvariablen sind. 2. Grundidee der bedingten Verteilungen: Fall ðº = ðº1 × ðº2 , = 1 ⊗ 2 a) diskreter Fall: Zähldichte ð(ðŠ1 , ðŠ2 ), bedingte Verteilung von ð1 gegenüber ð2 ist beschrieben durch die bedingte Zähldichte ð(ðŠ1 |ðŠ2 ) = ð(ðŠ1 , ðŠ2 ) ð(ðŠ1 , ðŠ2 ) = ðð2 (ðŠ2 ) ∑ðŠð ∈ðº ð(ðŠð , ðŠ2 ) b) absolutstetiger Fall: sei ð = (ð1 , ð2 ) absolutstetig mit Dichte ð(ðŠ1 , ðŠ2 ) die bedingte Dichte ist ðð2 |ð1 (ðŠ2 |ðŠ1 ): = ð(ðŠ1 , ðŠ2 ) ∫ðº ð(ðŠ1 , ðŠ2 )dðŠ2 = 2 ð(ðŠ1 , ðŠ2 ) , ðð1 (ðŠ1 ) ðŠ2 ∈ ðº2 , ðŠ1 ∈ ðº1 , ðð1 (ðŠ1 ) > 0(: = 0sonst) dann gilt z.B. â(ð1 , ð2 ∈ ðŽ×ðµ) = ðº1 ×ðº2 ððŽ×ðµ ð(ðŠ1 , ðŠ2 )dðŠ1 dðŠ2 = ðº1 ððŽ ðð1 (ðŠ1 ) ðº2 ððµ ðð2 |ð1 (ðŠ2 |ðŠ1 )dðŠ2 dðŠ1 c) allgemeiner Fall (Ausblick auf Stochastik 2 / Maßtheorie) Sei ð2 eine Zuï¬alsvariable die Werte in einem „polnischen Raum“ (separabler, vollständiger matrischer Raum mit Borelscher σ-Algebra) annimmt. (z.B. (âð , ð )), dann existiert ein stochastischer Kern (oder Markov-Übergangskern) ðŸ. (Das heißt ðŸ: ðº1 × 2 → [0, 1] mit i. ðŠ1 ⊠ðŸ(ðŠ1 , ðŽ2 ) ist 1 -messbar für alle ðŽ2 ∈ 2 ii. ðŽ2 ⊠ðŸ(ðŠ1 , ðŽ2 ) ist ein Wahrscheinlichkeitsmaß für alle ðŠ1 ∈ ðº1 ) Für diesen Kern gilt âð1 ,ð2 = âð1 ⊗ ðŸ, das heißt ∀ðŽ ∈ 1 ⊗ 2 : â((ð1 , ð2 ) ∈ ðŽ) = ðº1 ×ðº2 ððŽ âð1 ,ð2 (dðŠ1 , dðŠ2 ) = ðº1 ðº2 ððŽðŠ (ðŠ2 )ðŸ(ðŠ1 , dðŠ2 ) âð1 (dðŠ1 ) 1 mit der Sektion ðŽðŠ1 : = falls ðŽ ∈ 1 ðŠ2 ∈ ðº2 (ðŠ1 , ðŠ2 ) ∈ ðŽ ⊗ 2 2. Z.B. für ðŽ = ðŽ1 × ðŽ2 gilt ðŽðŠ1 = â(ð1 ∈ ðŽ1 , ð2 ∈ ðŽ2 ) = Prof. Becherer ∈ ðº1 ðŽ2 , ðŠ1 ∈ ðŽ1 ∅, sonst ððŽ1 (ðŠ1 ) Bodo Graumann ðº2 ist ððŽ2 (ðŠ2 )ðŸ(ðŠ1 , dðŠ2 ) âð1 (dðŠ1 ) Stochastik I 3 Asymptotische Ereignisse Seite 18 Bemerkung Analoge Aussagen gelten für die Dimensionen ð ≥ 2. 40 Satz: Unabhängigkeit nach Abbildung Sei (ðð )ð∈ðŒ eine Familie von unabhängigen Zufallsvariablen auf (ðº, , â), ðð : (ðº, ) → (ðºð , ð ), ðŒ = âšð∈ðŸ ðŒð und sind ðð (âšð∈ðŒð ðºð , âšð∈ðŒð ð ) → (ðºÌð , Ì ð ), ð ∈ ðŸ messbare Abbildungen, dann sind die Zufallsvariablen ððÌ : = ðð ((ðð )ð∈ðŒð ), ð ∈ ðŸ unabhängig. 3 Asymptotische Ereignisse Es sei (ðº, , â) ein Wahrscheinlichkeitsraum und (ðð )ð∈â , ðð : (ðº, ) → (ðºð , Zufallsvariablen. ð ) eine Folge von 41 Deï¬nition: „asymptotische Ereignisse“ Ein Ereignis ðŽ ∈ heißt asymptotisch bezüglich (ðð )ð∈â falls für alle ð ∈ â ein ðµð ∈ âšð≥ð ð existiert mit ðŽ = (ðð )ð≥ð −1 (ðµð ). Wir schreiben ((ðð )â ) für das System der asymptotischen Ereignisse bezüglich (ðð )â . Bemerkung ((ðð )â ) ist eine σ-Algebra. Beispiele 1. ðŽ = â∞ ð=1 âð≥ð 2. ðŽ = ð ðð (ð) ∈ ðŽð ∈ ð ð limð→∞ ( ð1 ∑ð ð=1 ðð (ð)) existiert und nimmt Werte im Intervall [ð, ð] an 42 Satz: 0-1 Gesetz von ÐПлЌПгПÑПв Sei (ðð )ð∈â eine Folge von unabhängigen Zufallsvariablen auf (ðº, , â). Dann hat jedes asymptotische Ereignis ðŽ ∈ ((ðð )â ) die Wahrscheinlichkeit 0 oder 1. Beweis (42) Wir betrachten die Projektionen ðð : âšð∈â ðºð → ðºð , (ðð )â ⊠ðð und ð ðð−1 (ðŽð ) ðŽð ∈ := ð, ð = 1, ⯠, ð, ð ∈ â ð=1 dabei ist stabil unter Durchschnittbildung und erzeugt âšð∈â ð = ð(ðð |ð ∈ â). Dann existiert für jedes ð ∈ â ein ðµð ∈ âšð≥ð ð , sodass ðŽ = ((ðð )ð≥ð )−1 (ðµð ) = (ðð )ð≥ð ∈ ðµð . A ist unabhängig von ðð −1 (ðž), ðž ∈ , also auch für jedes ðž ∈ âšð∈â ð . Somit ist ðŽ auch ð∈â unabhängig von sich selbst, also â(ðŽ) = â(ðŽ ∩ ðŽ) = â(ðŽ)â(ðŽ). â¡ 43 Satz: Borel-Cantelli-Lemma Es ist (ðº, , â) gegeben und ðŽð , ð ∈ â eine Folge von Ereignissen sowie ðŽ: = lim supð ðŽð = âð∈â âð≥ð ðŽð , dann gilt: Prof. Becherer Bodo Graumann Stochastik I 4 Erwartungswert und Varianz Seite 19 1. ∑∞ ð=0 â(ðŽð ) < ∞ ⇒ â(ðŽ) = 0 2. sind die ðŽð , ð ∈ â unabhängige Ereignisse mit ∑∞ ð=0 â(ðŽð ) = +∞ ⇒ â(ðŽ) = 1 Beweis (43) ð→∞ 1. ∀ð: ðŽ ⊆ âð≥ð ðŽð ⇒ â(ðŽ) ≤ â(âð≥ð ðŽð ) ≤ ∑∞ ð=ð â(ðŽð ) −−−→ 0 Ì 2. ðŽÌ = â∞ ð=0 âð≥ð ðŽð , dann gilt ∞ ∞ â(ðŽ)Ì = â( ð=0 ð=ð ð ∞ ðŽðÌ ) = lim â( ð=0 ð→∞ ð ∞ ðŽðÌ ) = ð=ð lim ð=0 ð→∞ ∞ â(ðŽðÌ ) ≤ ð=ð=1−â(ðŽ ) ð ≤ð−â(ðŽð ) ð lim ð− ∑ð=ð â(ðŽð ) = 0 ð=0 ð→∞ Beispiel „Monkey typing typewriter“: Seien ð1 , ð2 , … unabhängige Laplace-Zufallsvariablen auf {ð, ⯠, ð§, ðŽ, ⯠, ð} ∪ ðð¢ððð¡ðð¡ððð. Dann ist die Wahrscheinlichkeit, dass irgendwann ein beliebiges Wort, Ihr Name oder Goethes „Faust“ vorkommt gleich 1. 4 Erwartungswert und Varianz 44 Deï¬nition: „Erwartungswert“ Sei ð eine Zufallsvariable auf (ðº, , â) mit Werten in (â, ). Ist ð ≥ 0 oder ð ∈ ð¿1 (â) (das heißt ∫ðº |ð|1 dâ < ∞), so heißt ðŒ(ð): = ∫ðº ðdâ der Erwartungswert von ð. Bemerkung • ð¿ð (â): = ð¿ð (ðº, , â) = ð: (ðº, ) → (â, ) ∫ |ð|ð dâ < ∞ ð für ð ∈ [1, ∞) ist ein 1 ð Banachraum mit der Norm âðâð = (∫ |ð| dâ ) und für ð = 2 ein Hilbertraum mit âšð1 , ð2 â© = ∫ ð1 ð2 dâ . • Man sagt oft auch „Mittelwert“ von ð bezüglich â zu ðŒ(ð). • Wichtige Eigenschaften des Erwartungswerts folgen aus Eigenschaften des Maßintegrals; etwa Linearität, Monotonie und die Konvergenzaussagen. Beispiel Liegt ein diskreter Wahrscheinlichkeitsraum mit dem Zählmaß vor, so ist der Erwartungswert ðŒ(ð) = ∑ð∈ðº ð(ð)â({ð}). 45 Lemma: Sei âð = â â ð −1 die Verteilung von ð: (ðº, ) → (ðº , 1 ) und ð eine messbare Funktion ! ð: (ðº , ) → (â, ) mit ð ≥ 0 oder ð â ð ∈ ð¿ (â). Dann gilt ðŒ(ð(ð)) = ∫ðº ð(ð(ð))dâ(ð) = ∫ðº ð(ð¥)dâð (ð¥) Prof. Becherer Bodo Graumann Stochastik I 4 Erwartungswert und Varianz Seite 20 Beweis (45) für ð = ððŽ , ðŽ ∈ gilt ∫ðº ððŽ (ð)dâ = â(ð ∈ ðŽ) = âð (ðŽ) â Damit gilt die Behauptung für alle elementaren Funktionon ð = ∑ðð=1 ðŒð ððŽð , ðŽð ∈ , ðð ∈ â. Weil jede messbare Funktion ð ≥ 0 monoton durch elementare Funktionen ðð approximierbar ist mit 0 ≤ ðð ≤ ð , folgt die Behauptung für ð ≥ 0 mittels messbarer Konvergenz. Für ð ∈ ð¿1 (âð ) folgt die Behauptung dann über ð = ð + − ð − . 46 Korollar: Sei ð eine Zufallsvariable mit absolutstetiger Verteilung und Dichte ð sowie ð eine messbare reelle Funktion für die ð: = ð â ð ≥ 0 oder ð ∈ ð¿1 (â) ist, so gilt ðŒ(ð(ð¥)) = ∫ðº ð(ð¥)ð(ð¥)dð¥ . 47 Satz: wichtige Ungleichungen 1. Markovsche Ungleichung ðŒ(|ð|ð ) ðð ∀ð ∈ [1, ∞) : ∀ð > 0: â(|ð| ≥ ð) ≤ 2. den Spezialfall von 1 mit ð = 2 nennt man auch Äebyšëv Ungleichung 3. exponentielle Markov Ungleichung â(ðŒð ≥ ð) ≤ ðŒ(ððŒð ) ðð 4. Cauchy-Schwarz Ungleichung: für ð, ð ∈ ð¿2 (â) gilt ðð ∈ ð¿1 (â) und ðŒ(ðð) ≤ √ðŒ(ð 2 )ðŒ(ð 2 ) 5. Höldersche Ungleichung: ð ∈ ð¿ð (â), ð ∈ ð¿ð (â) mit ð ∈ (1, ∞), ð > 1 sodass ð 1 ð ð 1 ð + 1 ð = 1, 1 ð dann gilt ðŒ(|ðð |) ≤ (ðŒ(|ð|) ) (ðŒ(|ð | )) . 6. Minkowski Ungleichung: ð, ð ∈ ð¿ð (â), ð ∈ [1, ∞), dann ist âð+ð âð¿ð ≤ âðâð¿ð +âð âð¿ð Beweis (47) 1. ðŒ(|ð|ð ) ≥ ðŒ(ðð ð{|ð|≥ð} ) = ðð â(|ð| ≥ ð) Die anderen Beweise werden hier nicht geführt. 48 Lemma: Jensensche Ungleichung Ist ð eine reelle Zufallsvariable und ð: â → â eine konvexe Funktion, ð, ð(ð) ∈ ð¿1 (â), dann gilt ð(ðŒ(ð)) ≤ ðŒ(ð(ð)) Beweis (48) Da ð konvex ist, lässt sie sich darstellen als ð(ð¥) = supðŠ (ðŒðŠ ð¥ + ðœðŠ ), ð¥ ∈ â (supremum aï¬ner Funktionen) mit passenden ðŒðŠ , ðœðŠ ∈ â darstellen, also gilt ðŒ(ð(ð)) ≥ sup(ðŒðŠ ðŒ(ð)ðŠ + ðœðŠ) = ð(ðŒ(ð)) ðŠ Prof. Becherer Bodo Graumann Stochastik I 4 Erwartungswert und Varianz Seite 21 49 Lemma: Erwartungswert unabhängiger Zufallsvariablen Sind ð, ð ∈ ð¿2 (â) unabhängig, dann ist ðŒ(ðð) = ðŒ(ð) ⋅ ðŒ(ð). Bemerkung Für eine âð -wertige Zufallsvariable ð ist ðŒ(ð) = (ðŒ(ðð ))ð=1,â¯,ð koordinatenweise deï¬niert. 50 Deï¬nition: „Varianz, Kovarianz“ Für ð, ð ∈ ð¿2 (â) gilt: 1. Var(ð): = ðŒ((ð − ðŒ(ð))2 ) = ðŒ(ð 2 ) − ðŒ(ð)2 ist die Varianz von ð. √Var(ð) ist die Standardabweichung (oder Streuung) von ð. 2. Cov(ð, ð): = ðŒ((ð − ðŒ(ð))(ð − ðŒ(ð))) = ðŒ(ðð) − ðŒ(ð)ðŒ(ð) die Kovarianz von ð und ð . 3. Falls Cov(ð, ð) = 0 ist, heißen ð und ð unkorreliert. 51 Lemma: Seien ð, ð, ð1 , ð2 , ⯠∈ ð¿2 (â), ð, ð, ð, ð ∈ â. Dann gilt 1. Cov(ðð + ð, ðð + ð) = ð ⋅ ð Cov(ð, ð), insbesondere ist Var(ðð + ð) = ð2 Var(ð). 2. Cov(ð, ð) ≤ √Var(ð) Var(ð) 3. ∑ðð=1 ðð ∈ ð¿2 und Var(∑ðð=1 ðð ) = ∑ðð=1 (Var(ðð ) + ∑ð≠ð Cov(ðð , ðð )) 4. Sind ð und ð unabhängig, dann sind sie auch unkorreliert. Bemerkung 1. Ist ð eine â-wertige Zufallsvariable, ð ∈ ð¿2 (â) mit Var(ð) > 0, dann heißt ð − ðŒ(ð) ð:Ì = √Var(ð) standardisiert. (ðŒ(ð)Ì = 0, Var(ð)Ì = 1) 2. Für ð âð -wertig, ð ∈ ð¿2 (â), das heißt ∀ð: ðð ∈ ð¿2 heißt (Cov(ðð , ðð ))ð,ð=1,â¯,ð die Varianz / Covarianzmatrix von ð. Beispiele Prof. Becherer Bodo Graumann Stochastik I 4 Erwartungswert und Varianz Seite 22 1. für Varianzberechnung: Seien ð1 , ⯠, ðð iid (independent identically distributed) Bernoulli(p) Zufallsvariablen. Dann ist ð ð= ðð ∼ Binð,ð ð=1 ð ðŒ(ð) = ðŒ(ðð ) = ðð ð=1 ð Var(ð) = Var(ðð ) + â 0 = ð Var(ð1 ) = ðð(1 − ð) ð=1 ∑ ð¶ðð£ 2. für ð ∼ ð(ð, ð 2 ), ð ∈ â, ð 2 > 0 ist ðŒ(ð) = ð Bemerkung Im allgemeinen impliziert Unkorreliertheit von ð, ð nicht deren Unabhängigkeit. Gegenbeispiele 1. ð ∼ ((0, 2ð)) also gleichverteilt auf (0, 2ð). Dann wählen wir ð: = sin ð , ð: = cos ð dann ist ðŒ(ð) = ðŒ(ð) = 0 und Cov(ð, ð) = 0 aber sicher gilt keine Unabhängigkeit wegen ð 2 + ð 2 = 1. 2. Sei ð ∼ ð) = 0. (0, 1) und ð: = ð 2 − 1. Dann ist ðŒ(ð) = 0 also Cov(ð, ð) = ðŒ(ðð) = ðŒ(ð 3 − Bemerkung Falls ð âð -wertig, ð ∈ ð¿2 (â), ðŽ: = Cov(ð, ð), ð: = ðŽð + ð wobei ðŽ ∈ âð×ð , ð ∈ âð so gilt Cov(ð, ð) = ðŽðŽðŽð , denn Cov(ðð , ðð ) = ð¶ðð£((ðŽð)ð , (ðŽð)ð ) (sehe Übung) 52 Deï¬nition: „Korrelationskoeï¬zient“ Seien ð, ð ∈ ð¿2 (â) mit Var(ð), Var(ð) > 0, dann heißt Cov(ð, ð) Corr(ð, ð): = √Var(ð) Var(ð) Korrelation von ð und ð . (Dies wird oft mit ð(ð, ð) bezeichnet.) 53 Lemma: Seien ð, ð wiederum wie eben. Dann gilt 1. Corr(ð, ð) ∈ [−1, +1] 2. Ist ðŒ(ð) = 0 so folgt min ðŒ(|ð − (ðð + ð)|2 ) = ðŒ(|ð − (ð∗ ð + ð∗ )|2 ) ð,ð∈â für ð∗ = Cov(ð, ð)/ Var(ð) = Corr(ð, ð)√Var(ð)/ Var(ð) und ð∗ = ðŒ(ð) sowie min ðŒ(|ð − (ðð + ð)|2 ) = Var(ð)(1 − (Corr(ð, ð))2 ) ð,ð Prof. Becherer Bodo Graumann Stochastik I 4 Erwartungswert und Varianz Seite 23 4.1 Die Gesetze der großen Zahlen Vorbemerkung klassische Formelierung der Äebyšëv-Ungleichung: ð ∈ ð¿2 (â), ð > 0 ⇒ â(|ð− ðŒ(ð)| ≥ ð) ≤ Var(ð) . ð2 54 Deï¬nition: „stochastische Konvergenz“ Gegeben ist ein Wahrscheinlichkeitsraum (ðº, , â) und â-wertige Zufallsvariablen ð, (ðð )ð∈â . Dann sagen wir (ðð )ð∈â konvergiert stochastisch (bzw. „in Wahrscheinlichkeit“ oder „in â“), falls ∀ð > 0: lim â(|ðð − ð | ≤ ð) = 1 ð→∞ â Man schreibt auch ðð −→ ð . 55 Satz: schwaches Gesetz der großen Zahl Seien (ðð )ð∈â paarweise unkorrelierte Zufallsvariablen aus ð¿2 (â) mit supð Var(ðð ) ≤ ð für ein ð ∈ â. Dann gilt für ð > 0: 1 â(| ð ð (ðð − ðŒ(ðð ))| ≥ ð) ≤ supð Var(ðð ) ðð2 ð=1 →0 Bemerkung 1. Dies ist eine Form der stochastischen Konvergenz mit 2. Falls ∀ð: ðŒ(ðð ) = ðŒ(ð1 ), so gilt 1 ð 1 ð â ∑ðð=1 (ðð − ðŒ(ðð )) −→ 0. â ∑ðð=1 ðð −→ ðŒ(ð1 ) Beweis (55) ðð : = 1ð ∑ðð=1 (ðð − ðŒ(ðð )) ∈ ð¿2 nach der Minkowski-Ungleichung und es gilt ðŒ(ðð ) = 0. Dann gilt mit der Äebyšëv-Ungleichung: 1 Var(ðð ) = 2 ð ð Var(ðð ) ≤ ð=1 1 ðð → 0 ð2 â ⇒ ðð −→ 0 â¡ 56 Deï¬nition: „fast-sichere Konvergenz“ Seien ð , (ðð )ð∈â reellwertige Zufallsvariablen auf dem selben (ðº, , â). Dann konvergiert ðð â-fast-sicher gegen ð falls sie nur auf einer Nullmenge nicht konvergiert. Das heißt â( lim ðð = ð) = 1 ð→∞ Man sagt auch ðð konvergiert â-fast-überall. Prof. Becherer Bodo Graumann Stochastik I 4 Erwartungswert und Varianz Seite 24 Beispiele 1. Monte Carlo Integration Wir betrachten eine messbare Funktion ð: [0, 1] → [0, ð] mit ð ∈ â+ (z.B. stetig und positiv) und suchen eine numerische Approximation von ∫[0,1]ð ð(ð¥)dð¥ wobei die Dimension ð groß ist. Dazu simulieren wir unabhängige Zufallsvariablen ðð welche gleichverteilt auf [0, 1]ð sind. Dann gilt ð â(| 1 ð(ðð )− ð ð=1 ð ðdð¥ | ≥ ð) = â(| [0,1]ð Var(ð1 ) ð→∞ 1 −−−→ 0 ð(ðð )−ðŒ(ð(ð1 ))| ≥ ð) ≤ ð ð=1 ðð2 Das heißt für genügend großes ð können wir ∫ ðdð¥ durch Monte Carlo Simulation approximativ berechnen. 2. Wir untersuchen gleichmäßige Approximation einer stetigen Funktion ð: [0, 1] → â durch Polynome. Seien ð1 , ð2 , ⯠unabhängige Bernoulli(p) verteilte Zufallsvariablen. Dann gilt ð ð ð ð 1 ð ð ð ðŒ(ð( ðð )) = ð( ) Binð,ð (ð) = ð( ) ð (1 − ð)ð−ð =: ðð (ð) ð ð=1 ð ð ð ð=0 ð=0 Bernstein Polynom ð-ten Grades Dann behaupten wir ð→∞ âðð − ð â∞ = sup |ðð (ð) − ð(ð)| −−−→ 0 ð∈[0,1] ð ist stetig also gleichmäßig stetig auf dem Kompaktum [0, 1]: ∀ð > 0: ∃ð¿ > 0: ∀ð¥, ðŠ: |ð¥ − ðŠ| < ð¿ ⇒ |ð(ð¥) − ð(ðŠ) ≤ ð|. Dann folgt weiter für beliebiges ð > 0. ð |ðð (ð) − ð(ð)| = |ðŒ(ð( 1 ð ) − ð(ð))| ð ð=1 ð ð ≤ ðŒ(|ð( 1 ð ) − ð(ð)|(ð ð ð=1 ð | 1ð ∑ðð=1 ðð −ð|<ð¿ +ð | 1ð ∑ðð=1 ðð −ð|≥ð¿ )) 1 ð(1 − ð) âð→∞ ð ðð¿ 2 ⇒ lim âðð − ð â∞ = 0 ≤ ð + 2âð â∞ ð→∞ â¡ Bemerkung Der Begriï¬ der â-fast-überallen Konvergenz ist wohldeï¬niert, denn ð ∈ ðº limð→∞ ðð (ð) = ð(ð) ist messbar: ð∈ðº lim ð ð→∞ ð =ð = |ðð − ð | ≤ 1 ð ∞ = ð∈â ð∈â ð=ð Prof. Becherer ð ∈ ðº ∀ð ∈ â: ∃ð ∈ â: ∀ð ≥ ð: |ðð (ð) − ð(ð)| ≤ ∈ Bodo Graumann 1 ð Stochastik I 4 Erwartungswert und Varianz Seite 25 57 Lemma: â Konvergieren ðð , ð ∈ â â-fast-sicher gegen die ð , dann gilt auch ðð −→ ð Beweis (57) ∞ ∞ ∞ 1 = â(ðð → ð) = â( |ðð − ð | ≤ ð=1 ð=1 ð=ð ∞ ∞ ⇒ 1 = â( |ðð − ð | ≤ ð=1 ð=ð 1 ð ð→∞ |ðð − ð | ≤ ð=1 ð=ð ∞ 1 ð = lim â( ð→∞ |ðð − ð | ≤ ð=ð ∞ ⇒ â( |ðð − ð | > ∞ ∞ = lim â( 1 ) ð 1 ) ð ∞ ð→∞ 1 1 1 |ðð − ð | > ) ≤ â( ) = 1 − â( |ðð − ð | ≤ ) −−−→ 0 ð ð ð ð=ð ð=ð â Das heißt gerade ðð −→ ð . Bemerkung Im Allgemeinen gilt die Umkehrung nicht — stochastische Konvergenz impliziert nicht die â-fast-sichere Konvergenz. Gegenbeispiel: Wir wählen ðº = [0, 1], = ([0, 1]) und â als Gleichverteilung. Dann sei ð = 2ð + ð, ðð : = ð[ð2−ð ,(ð+1)2−ð ] , 0 ≤ ð ≤ 2ð , ð∈â Dann gilt â(|ðð − 0| > ð) ≤ 21ð für 2ð ≤ ð ≤ 2ð+1 . Also konvergiert ðð â-stochastisch gegen 0 jedoch nicht â-fast-überall. Es gilt sogar lim supð ðð (ð) = 1 und lim inf ð ðð (ð) = 0. Das heißt ðð konvergiert nirgends. 58 Satz: starkes Gesetz der großen Zahl Seien unkorrelierte (ðð )ð∈â reellwertige Zufallsvariablen mit supð Var(ðð ) < ∞, dann gilt ð 1 (ð − ðŒ(ðð )) → 0 â-fast-sicher ð ð=1 ð Beweis (58) O.B.d.A. gelte ðŒ(ð)ð = 0 (sonst betrachte ðð = ðð − ðŒ(ðð )). Zuerst werden wir die Konvergenzaussage für ðð2 zeigen. Für ein beliebiges ð > 0 gilt nach Äebyšëv: â( |ðð2 | > ð ) ≤ ð ð2 ð2 =:ðŽð (ð) ∞ ⇒ â(ðŽð (ð)) < ∞ ð=1 Prof. Becherer Bodo Graumann Stochastik I 4 Erwartungswert und Varianz Seite 26 Wir können nun also Satz 43 (Borel-Cantelli-Lemma) anwenden und erhalten dass die Wahrscheinlichkeit, dass nur endlich viele ðŽð (ð) eintreten 1 ist: ∞ ∞ Ì ðŽð (ð)) =1 â( ð=1 ð=ð ⇒ ∃ð ∈ , â(ð) = 0: ∀ð ∈ ð:Ì ∃ð ∈ â: ∀ð ≥ ð: |ðð2 (ð)| ≤ ð ⇒ lim sup |ðð2 (ð)| ≤ ð ð→∞ ∞ ∞ ∞ ⇒ â( ðŽð ð=1 ð=1 ð=ð Ì1 ð fast überall )=1 und für jedes ð aus der letzteren Menge gilt limð→∞ ðð2 (ð) = 0. Also gilt diese Aussage â-fastsicher. Nun zeigen wir dass sogar ðð → 0 â-fast-sicher gilt. Für jedes ð ∈ â gibt es ein ð(ð) ∈ â sodass ð2 ≤ ð < (ð + 1)2 dann ð â(|ððð − ð2 ðð2 | ≥ ð2 ð) ≤ ð(ð − ð2 ) 1 Var ð ≤ ≤∞ ð 2 ð4 ð2 ð4 ð 2 ð=ð +1 ∞ ∞ â(|ððð − ð(ð)2 ðð(ð)2 | ≥ ð(ð)2 ð) ≤ ⇒ ð=1 ð=1 2 = ð ð2 ∞ (ð+1) −1 ð=1 ð=ð2 ð − ð2 ð = 2 ð4 ð ∞ 2ð ð ð = 2 4 ð ð ð=1 ð=1 ð(ð − ð(ð)2 ) ð2 ð(ð)4 ∞ ð=1 2ð(2ð + 1) 1 ⋅ 4 <∞ 2 ð mit Satz 43 (Borel-Cantelli-Lemma) Folgt, analog zum vorigen Schritt dass ð â( lim | ð − ðð(ð)2 | = 0) = 1 ð→∞ ð(ð)2 ð Das heißt die Konvergenz gilt â-fast-sicher. Zusammen mit der im ersten Teil des Beweises gezeigten Konvergenzaussage von ðð2 folgt dann ð ð lim ð = 0 â-fast-sicher ∧ lim =1 ð→∞ ð(ð)2 ð→∞ ð(ð)2 ð und somit gilt die Behauptung. Bemerkung Das starke Gesetz der großen Zahl gilt auch unter schwächeren Voraussetzungen als oben angegeben. 1981 hat Etemadi die Konvergenz für ðð ∈ ð¿1 (ð) unkorreliert und identisch verteilt gezeigt. 59 S eien ð1 , ð2 , ⯠iid Zufallsvariablen in ð¿2 (ð), â-wertig. Für jede Realisierung ð ∈ ðº heißt ð ð¹ð (ð¥)(ð): = Prof. Becherer 1 ð (ð (ð)) ð ð=1 (−∞,ð¥] ð Bodo Graumann Stochastik I 4 Erwartungswert und Varianz Seite 27 die empirische Verteilungsfunktion von ð1 , ⯠, ðð , ð ∈ â. ð¹ð ist die Verteilungsfunktion des empirischen Wahrscheinlichkeitsmaßes ð âð : = 1 ð¿ ð ð=1 ðð (ð) auf (â, ). Dann sind ðð : = ð(−∞,ð¥] (ðð ) iid Zufallsvariablen, ðµððððð¢ððð(ð¹(ð¥))-verteilt, wobei ð¹ die Verteilungsfunktion der einzelnen ðð ist. Nach dem Gesetz der großen Zahlen gilt dann ð 1 lim ð¹ (ð¥) = ð = ð¹(ð¥) ð→∞ ð ð ð=1 ð Das heißt die empirischen Verteilungsfunktionen konvergieren Punktweise gegen die Verteilungsfunktion ð¹ aus der die iid Ziehungen stammen. 60 Satz: Gliwenko-Cantelli Seien (ðð )ð∈â reellwertige Zufallsvariablen iid auf (ðº, , â) mit Verteilungsfunktion ð¹(ð¥) und ð¹ð die empirische Verteilungsfunktion der ð1 , ⯠, ðð . Dann gilt lim sup sup |ð¹ð (ð¥) − ð¹(ð¥)| = lim sup âð¹ð − ð¹ â∞ = 0 ð→∞ â − fast überall ð→∞ ð¥∈â Beweis (60) ðð (ð¥): = ð(−∞,ð¥] (ðð ), ðð (ð¥): = ð(−∞,ð¥) (ðð ) Dann sind (ðð )â und (ðð )â jeweils iid Folgen von Zufallsvariablen und sind jeweils BernoulliFolgen mit Erfolgswahrscheinlichkeit ð¹(ð¥) bzw. ð¹(â ð¥): = limð¥âð¥ ð¹(ð¥)Ì (ð¹ð (â ð¥) analog) Ì ðŒðð (ð¥) = ð¹(ð¥), ðŒðð (ð¥) = ð¹(â ð¥) nach Satz 58 (starkes Gesetz der großen Zahl) gilt dann ð ð ð→∞ ð→∞ 1 1 ð¹ð (ð¥) = ð (ð¥) −−−→ ð¹(ð¥)ð¹ð (â ð¥) = ð (ð¥) −−−→ ð¹(â ð¥) ð ð=1 ð ð ð=1 ð Sei ð¹(−∞): = 0, ð¹(+∞): = 1. Fixiere nun ð ∈ â und deï¬niere ð¥ð : = inf ð ð¥ ∈ âÌ ð¹(ð¥) ≥ ð ð ð : = max ð=0,â¯,ð ⇒ lim ð ð = 0 ð→∞ Prof. Becherer |ð¹ð (ð¥ð ) − ð¹(ð¥ð )| + |ð¹ð (â ð¥ð | − ð¹(â ð¥ð ) â − fast überall Bodo Graumann Stochastik I 5 Charakteristische Funktionen Seite 28 Für jedes ð¥ ∈ â mit ð¥ ∈ (ð¥ð−1 , ð¥ð ) gilt dass 1 ð 1 ð¹ð (ð¥) ≥ ð¹ð (ð¥ð−1 ) ≥ ð¹ð (ð¥ð−1 ) − ð ð ≥ ð¹(ð¥) − ð ð − ð 1 1 ⇒ lim sup sup |ð¹ð (ð¥) − ð¹(ð¥)| ≤ + lim sup ð ð ≤ ð ð ð→∞ ð¥∈â ð→∞ ð¹ð (ð¥) ≤ ð¹ð (â ð¥ð ) ≤ ð¹ð (â ð¥ð ) + ð ð ≤ ð¹(ð¥) + ð ð + Da das ð beliebig gewählt war wurde die Behauptung bewiesen. 5 Charakteristische Funktionen Grundidee Wir wollen Wahrscheinlichkeitsmaße auf (âð , ð ) durch (komplexwertige) Funktionen eindeutig charakterisieren und damit nützliche Aussagen über Maße mit funktionentheoretischen Mitteln erhalten. Notation Im folgenden verwenden wir das euklidische Skalarprodukt âšð¥, ðŠâ©: = ∑ðð=1 ð¥ð ðŠð . 61 Deï¬nition: „charakteristische Funktion eines Maßes“ Sei ð ein Wahrscheinlichkeitsmaß auf (âð , ð:Ì âð ⇒ â, ð ). Dann heißt ð:Ì ððâšð¢,ð¥â© dð(ð¥) ð¢âŠ âð die charakteristische Transformation (oder „Fourier Transformation“) von ð. Für eine Zufallsvariable ð mit Werten in âð heißt ðð (ð¢): = ððÌ (ð¢) = âð ððâšð¢,ð¥â© dðð (ð¥) = ðŒ(ððâšð¢,ðâ© ) die charakteristische Funktion von ð. Bemerkung ððâšð¢,ð¥â© dð(ð¥) = ð(ð¢) Ì = âð cos(âšð¢, ð¥â©)dð(ð¥) + ð âð sin(âšð¢, ð¥â©)dð(ð¥) âð ðð (ð¢) = ðŒ(cos(âšð¢, ðâ©)) + ððŒ(sin(âšð¢, ðâ©)) 62 Lemma: Eigenschaften der charakteristischen Transformation Sei ð ein Wahrscheinlichkeitsmaß auf (âð , mit ð(0) Ì = 1. Prof. Becherer ð ). Dann ist ðÌ eine beschränkte Funktion auf âð Bodo Graumann Stochastik I 5 Charakteristische Funktionen Seite 29 Beweis (62) ð(0) Ì = 1 ist klar. ðÌ ist beschränkt da |ððâšð¢,ð¥â© dð(ð¥) | = 1 |ð(ð¢)| Ì ≤ âð =1 Stetigkeit gilt wegen der Beschränktheit des Integranden nach beschränkter Konvergenz (Lebesgue). 63 Deï¬nition: „Momente einer Zufallsvariablen“ Ist ð eine Zufallsvariable mit werten in âð , dann heißt ðŒ(|ð|ð ), ð ∈ â das ð-te Moment von ð. 64 Satz: Beziehung zwischen Momenten und charakteristischer Funktion Sei ð eine âð -wertige Zufallsvariable mit einem endlichen ð-ten Moment. Dann ist die charakteristische Funktion ðð von ð ð mal stetig partiell diï¬erenzierbar und ðð ð (ð¢) = ðð ðŒ(ðð1 ðð2 ⯠ððð ððâšð¢,ðâ© ) ðð¥ð1 ðð¥ð2 ⯠ðð¥ðð ð Beweis (64) Sei ð: = ðð die Verteilung auf ð und ∫âð |ð¥|ð dð(ð¥) < ∞, das heißt |ð¥|ð ∈ ð¿1 (ð). Wir betrachten den Fall ð = 1. Wir betrachten also den Diï¬erenzenquotienten der Richtungsableitung. Für limð→∞ ð¡ð = 0: ð(ð¢ Ì + ð¡ð ðð ) − ð(ð¢) Ì 1 ðâšð¢,ð¥â© ðâšð¡ð ðð ,ð¥â© ð (ð − 1)dð(ð¥) ð¡ð âð ð¡ð cos(ð¡ð ð¥ð ) − 1 ð sin(ð¡ð ð¥ð ) 1 lim (ððâšð¡ð ðð ,ð¥â© − 1) = lim + = −ð¥ð sin(0) + ðð¥ð cos(0) = ðð¥ð ð→∞ ð¡ð ð→∞ ð¡ð ð¡ð 1 | (ððâšð¡ð ðð ,ð¥â© − 1)| ≤ 2|ð¥| ∈ ð¿1 (ð) ð¡ð ð(ð¢ Ì + ð¡ð ðð ) − ð(ð¢) Ì ð ⇒ lim = ððâšð¢,ð¥â© (ðð¥ð )dð(ð¥) = ððŒ(ðð ððâšð¢,ðâ© ) = ð (ð¢) ð→∞ ð¡ð ðð¥ð ð âð = nach majorisierter Konvergenz. Die Stetigkeit folgt analog zu obigem Lemma. Weiter folgt die Behauptung für andere ð mit vollständiger Induktion über ð. Beispiel 1. ð ∼ ðµððððð¢ððð(ð): ðð (ð¢) = ðŒ(ððð¢ð ) = (1 − ð)ð0 + ðððð¢ = ðððð¢ + 1 − ð 2. ð ∼ Bin(ð, ð): ð ð ðð (ð¢) = ðŒ(ððð¢ð ) = ðŒ(ððð¢ ∑ð=1 ðð ) = ðŒ(ððð¢ðð ) = (ðððð¢ + 1 − ð)ð ð=1 Prof. Becherer Bodo Graumann Stochastik I 5 Charakteristische Funktionen Seite 30 3. ð ∼ Poisson(ð): ∞ ððð¢ð ðð (ð¢) = ð=0 ðð¢ ðð −ð ð = ðð(ð −1) ð! 4. ð ∼ ([−ð, ð]): ðð (ð¢) = 5. ð ∼ (0, 1): 1 ðð¢ ðð (ð¢) = ðŒ(ððð¢ð ) = sin(ðð¢) 1 cos(ð¢ð¥) ð¥2 ð− 2 dð¥ + ð √2ð â 1 sin(ð¢ð¥) ð¥2 ð− 2 dð¥ √2ð â =0 ðð (ð¢) = ⇒ ðð (ð¢) ðð (ð¢) ∞ 1 √2ð − sin(ð¢ð¥)ð¥ð 2 − ð¥2 dð¥ = − 1 √2ð −∞ = −ð¢ ⇒ ln(ðð (ð¢)) = − ∞ −∞ ð¥2 ð¢ cos(ð¢ð¥)ð− 2 dð¥ = −ð¢ðð (ð¢) ð¢2 ð¢2 ð¢2 + ð ⇒ ðð (ð¢) = ð− 2 +ð = ð− 2 2 65 Lemma: charakteristische Funktion von aï¬nen Transformationen Sei ð eine âð -wertige Zufallsvariable und ð: = ðŽð + ð mit ðŽ ∈ âð×ð und ð ∈ âð . Dann gilt ðð (ð¢) = ððâšð¢,ðâ© ðð (ðŽð ð¢) Beispiel Sei ð ∼ (ð, ð 2 ), ð ∈ â, ð ≠ 0 und ist ð = ð + ðð für ð ∼ 2 ðð (ð¢) = exp(ðð¢ð − ð 2 ð¢2 ). Beispiel Seien ð1 , ⯠, ðð iid ðð ∼ 2 verteilt in âð und ðð (ð¢) = exp(− |ð¢|2 ). (0, 1), dann gilt (0, 1). Dann heißt ð = (ð1 , ⯠, ðð ) standardnormal- 5.1 Summe von unabhängigen Zufallsvariablen Wir werden sehen, dass wir für Summen von unabhängigen Zufallsvariablen die charakteristische Funktion sehr einfach berechnen lassen und zudem den Begriï¬ der Faltung einführen. 66 S eien ð, ð: ðº → â unabhängige Zufallsvariablen auf (ðº, , â) mit Verteilungen âð = â â ð , âð = â â ð −1 auf 1 . Dann heißt die Verteilung von ð: = ð + ð die Faltung (bzw. Faltungsprodukt) von âð und âð und man schreibt âð = âð ∗ âð . Sie ist gegeben durch −1 âð (ðŽ) = (âð ∗ âð )(ðŽ): = Prof. Becherer â â ððŽ (ð¥ + ðŠ)dâð¥ (ð¥) dâðŠ (ðŠ) Bodo Graumann Stochastik I 5 Charakteristische Funktionen Seite 31 Beweis (66) Da ð und ð unabhängig sind ist â(ð,ð) = âð ⊗ âð damit gilt für ð: â2 → â integrierbar (d.h. ð ∈ ð¿1 (âð ⊗ âð ) oder ð ≥ 0) ðŒ(ð(ð, ð)) = â â ð(ð¥, ðŠ)dâð (ð¥) dâð (ðŠ) ð(ð¥,ðŠ)=ððŽ (ð¥+ðŠ) ==========⇒ ðŒ(ð + ð) = â â ððŽ (ð¥ + ðŠ)dâð dâð = â(ð + ð ∈ ðŽ) = â(ð ∈ ðŽ) = ðð (ðŽ) 67 Korollar: Seien ð, ð unabhängige Zufallsvariablen auf (ðº, , â) mit Werten in â, ð: = ð + ð . Dann ist ðð (ð¢) = ðð (ð¢)ðð (ð¢), ð¢ ∈ â Beweis (67) Wie im obigen Satz erhalten wir ðŒ(ððâšð¢,ð+ðâ© ) = ðŒ(ððâšð¢,ðâ© ⋅ ððâšð¢,ðâ© ) = ðŒ(ððâšð¢,ðâ© )ðŒ(ððâšð¢,ðâ© ) 68 Bemerkung: Unabhängigkeit Es reicht aber nicht ðð+ð (ð¢) = ðð (ð¢)ðð (ð¢) um zu schließen, dass ð und ð unabhängig sind. 69 Satz: Existenz von Dichten Seien ð, ð unabhängige Zufallsvariablen und ð: = ð + ð . 1. Hat zudem ð eine Dichte ðð , so hat ð eine Dichte auf (â, ) und ðð (ð§) = â ðð (ð§ − ðŠ)dâð (ðŠ) 2. Haben sowohl ð als auch ð eine Dichte ðð bzw. ðð , dann hat ð die Dichte ðð (ð§) = â ðð (ð§ − ðŠ)ðð (ðŠ)dð(ðŠ) = â ðð (ð§ − ð¥)ðð (ð¥)dð(ð¥) Beweis (69) 1. â â ð§=ð¥+ðŠ ððŽ (ð¥ + ðŠ)dâð (ð¥) dâð (ðŠ) = = â â ⇒ ðð (ð§) = â â ððŽ (ð§)ðð (ð§ − ðŠ)dð§ dâð (ðŠ) = â ððŽ (ð¥ + ðŠ)ðð (ð¥)dð¥ dâð (ðŠ) â ððŽ (ð§) â ðð (ð§ − ðŠ)dâð (ðŠ) dð§ ðð (ð§ − ðŠ)dâð (ðŠ) Die andere Form folgt mittels Vertauschung von ð und ð nach Symmetrie. Prof. Becherer Bodo Graumann Stochastik I 5 Charakteristische Funktionen Seite 32 2. ðð (ð§) = â ðð (ð§ − ðŠ)dâ (ðŠ) = â ðð (ð§ − ðŠ)ðð (ðŠ)dðŠ 70 Satz: Charakteristik-Eigenschaft Ist ð eine Zufallsvariable in (âð , ð ). Dann charakterisiert ðð bzw. âÌ ð die Verteilung âð von ð auf ð das heißt sind ð1 , ð2 Wahrscheinlichkeitsmaße auf ð , dann gilt ð1Ì = ð2Ì nur wenn ð1 = ð 2 . Beweis (70) (Siehe zum Beispiel Sim82, Seite 160). Dieser Beweis benutzt die lokal kompakte Version des Stone-Weierstraß-Theorems. Wir betrachten die Funktion ð(ð, ð¥): = 1 exp(− (√2ðð 2 )ð Ì ð¢): = exp(− ð (ð, |ð¥|2 ) 2ð 2 |ð¢|2 ) 2ð 2 Also ist ð(ð, ⋅) die gemeinsame Dichte von ð = (ð1 , ⯠, ðð ) für ð1 , ⯠, ðð iid mit ðð ∼ (0, ð 2 ). ð ðð (ð¢) = ðŒ(ð ðâšð¢,ðâ© ð )= ððð (ð¢ð ) = ð=1 ⇒ ð(ð, ð¢ − ð£) = 1 (2ðð 2 ) ð 2 exp(− ð=1 Ì ð (ð, âð 1 âð 2 Ì ð¢) ) = ð (ð, 1 ð¢−ð£ ðâš ð¢−ð£ ,ðâ© ð2 ) = ðŒ(ð ) ð ð2 2 (2ðð ) 2 Seien ð1 , ð2 Wahrscheinlichkeitsmaße auf (âð , ð(ð, ð¢ − ð£)dð1 = ð¢2ð ð 2 (√2ðð)ð ( âð ð ) mit ð1Ì = ð2Ì =: ð.Ì ð(ð, ð¥)ððâšð¢,ð¥â© dð¥ ) dð1 (ð¥) = âð ð(ð, ð¢ − ð£)dð1 (ð¢) Ì ð¢−ð£ =ð (ð, 2 ð 1 = âð (√2ðð)ð ð(ð, ð¥)ð1Ì (ð¥)dð¥ Analog ergibt sich diese Formel mit ð2 , ð2Ì . ⇒ ∀ð > 0, ð£ ∈ âð : âð ⇒ âð ðdð1 = âð ð(ð, ð¢ − ð£)dð1 (ð¢) = âð ð(ð, ð¢ − ð£)dð2 (ð¢) ðdð2 gilt für alle Funktionn ð aus dem Vektorraum der durch ð(ð, ⋅ − ð£) ð > 0, ð£ ∈ âð aufgespannt wird. teilt einzelne Punkte in âð . Somit zeigt Stone-Weierstraß, dass dicht bezüglich Prof. Becherer Bodo Graumann Stochastik I 5 Charakteristische Funktionen Seite 33 gleichmaßiger Konvergenz in der Banachalgebra ð¶0 (âð ) liegt, wobei ð¶0 (âð ) der Banachraum der stetigen Funktionen âð → â mit Konvergenz bezüglich der Supremumsnorm ist, welche „gegen ∞ verschwinden“. (d.h. ∀ð > 0∃ Kompaktum ðŸ ⊆ âð , ð ∈ ð¶0 (âð ): |ð| ≤ ð auf âð ⧵ ðŸ). Jede Indikatorfunktion auf Rechtecken kann monoton approximiert werden durch Funktion aus und dort die Maße übereinstimmen, müssen sie auch auf der gesammten Borell-σ-Algebra übereinstimmen. Bemerkung Will man etwas Konstruktives zur Berechnung des Maßes aus seiner charakteristischen Funktion, so braucht man Ergebnise aus der Fourieranalysis zur Fouriertransformierteninversion. Es ergibt sich zum Beispiel im Eindimensionalen für eine Zufallsvariable ð: ðº → â: 1 1 âð ((ð, ð)) + âð ({ð, ð}) = lim ð â ∞ 2ð 2 [−ð,ð] ð−ðð¢ð − ð−ðð¢ð ðð (ð¢)dð¢ ðð¢ für beliebige ð, ð ∈ â, ð < ð. Die Funktion 1 1 ðº(ð): = lim âð ((ð, ð)) + âð ({ð, ð}) = âð ((−∞, ð)) + âð ({ð}) ð â −∞ 2 2 bestimmt die Verteilung von ð bereits eindeutig: ð(ð ≤ ð) = ð¹ð (ð) = ðº(ð)+ 12 (ðº(ð)−ðº(â ð)). (Siehe auch Shi95, Paragraph 12, Theorem 3) 71 Satz: Unabhängigkeit anhand charakteristischer Funktionen Zufallsvariablen ð = (ð1 , ⯠, ðð ) auf (ðº, , â) und Werten in âð sind genau dann unabhängig, wenn ð ∀ð¢ ∈ âð : ðð (ð¢) = ððð (ð¢ð ) ð=1 5.2 Normalverteilungen 72 Deï¬nition: „multidimensionale Normalverteilung“ Eine âð -wertige Zufallsvariable ð = (ð1 , ⯠, ðð ) auf (ðº, , â) heißt Gaußsche Zufallsvariable oder multidimensional normalverteilt falls für jedes ð ∈ âð die Linearkombination âšð, ðâ© = ∑ðð=1 ðð ðð eindimensional normalverteilt sind. Bemerkung Unter Umständen sind die Linearkombinationen degeneriert normalverteilt mit Varianz 0, das heißt die Punktmaße auf ð in â1 . 73 Satz: charakteristische Funktion der Normalverteilung Ist ð eine âð -wertige Zufallsvariable auf (ðº, , â), dann ist ð genau dann multidimensional normalverteilt, wenn ihre charakteristische Funktion die Form 1 ∀ð¢ ∈ âð : ðð (ð¢) = exp(ðâšð¢, ðâ© − âšð¢, ðð¢â©) 2 hat, mit ð ∈ âð und ð eine symmetrische nichtnegative semi-deï¬nit ð × ð-Matrix. Außerdem ist dann ð die Koverianzmatrix und ð der Erwartungswertvektor. Prof. Becherer Bodo Graumann Stochastik I 5 Charakteristische Funktionen Seite 34 Beweis (73) Hat die charakteristische Funktion von ð die gegebene Form so betrachten wir ð: = âšð, ðâ© und erhalten für die ð£ ∈ â1 : ð 1 ðð (ð£) = ðŒ(ððð£ ∑ð=1 ðð ðð ) = ðð (ð£ð) = exp(ðð£âšð, ðâ© − ð£2 âšð, ððâ©) 2 Wegen der Eindeutigkeit muss dann ð ∼ (âšð, ðâ©, âšð, ððâ©) sein. Die Momente erhalt wir aus Satz 64 (Beziehung zwischen Momenten und charakteristischer Funktion): ðŒ(ðð ðð ) = 1 ð ⋅ ð (ð¢)|ð¢=0 = (−1)(−ðð ðð − ððð ) = ðð ðð + ððð ð2 ðð¥ð ðð¥ð ð ⇒ Cov(ðð , ðð ) = ðŒ(ðð ðð ) − ðŒðð ðŒðð = ððð Ist auf der anderen Seite ð bereits als normalverteilt gegeben, so ergibt mit ð: = âšð, ðâ© = ∑ðð=1 ðð ðð und ð: = Cov(ð): ðŒ(ð) = ðŒ(âšð, ðâ©) = âšð, ðŒ(ð)â© = âšð, ðâ© ∧ ð = ðŒ(ð) ∧ Var(ð) = ðð ðð = âšð, ððâ© 1 ⇒ ð ∼ (âšð, ðâ©, âšð, ððâ©) ⇒ ðð (ð£) = exp(ðð£âšð, ðâ© − ð£2 âšð, ððâ©) 2 ⇒ ðð (1) = ðâšð,ðâ© (1) = ðŒ(exp(ðâšð, ðâ©)) = ðð (ð) Also hat ðð die behauptete Form. Beispiel Seien ð1 , ⯠, ðð unabhängige Zufallsvariablen ðð ∼ multivariat normalverteilt, denn ð ðð (ð¢) = ð ððð (ð¢ð ) = ð=1 (ðð , ðð2 ). Dann ist ð = (ð1 , ⯠, ðð ) 1 1 exp(ðð¢ð ðð − ðð2 ð¢2ð ) = exp(ðâšð¢, ðâ© − âšð¢, ðð¢â©) 2 2 ð=1 mit ð = (ð1 , ⯠, ðð ) und ð = diag(ð12 , ⯠, ðð2 ). 74 Satz: Unabhängigkeit einer Normalverteilung Ist ð: ðº → âð (multidimensional normalverteilt), dann sind die Komponenten ðð genau dann unabhängig, wenn sie unkorreliert sind, das heißt wenn Cov(ð) eine Diagonalmatrix ist. Beweis (74) Die Hinrichtung ist gerade das obige Beispiel. Die Rückrichtung gilt, da die charakteristischen Funktionen bereits gleich sind, wenn die Kovarianzmatrix Diagonalform hat. 75 Bemerkung: Fortsetzbarkeit der charakteristischen Funktion Setzt man die charakteristische Funktion ðð (ð§) = ðŒ(ðâšð§,ð¥â© ) auf ganz â fortsetzt, so kann man zeigen, dass sie beispielsweise in â1 auf einem Streifen { ð§ ∈ â | |Re ð§| < ð } holomorph ist. (vergleiche Str85, I, Paragraph 5) 76 Lemma: Simulation von multidimensionalen Normalverteilungen Sei ð ∼ (ð, ð). Dann existieren unabhängige univariate ð1 , ⯠, ðð , ðð ∼ ð = ðŠ + ðŽð für ð = ðŒ(ð) und eine orthogonale Matrix ðŽ gilt. Prof. Becherer Bodo Graumann (0, ð2ð ) sodass Stochastik I 6 Konvergenz in Verteilung / schwache Konvergenz Seite 35 Beweis (76) Sei ð = Cov(ð) symmetrisch, nichtnegativ semideï¬nit. Dann ist ð = ðŽð¬ðŽð mit einer orthogonalen Matrix ðŽ und einer Diagonalmatrix ð¬ = diag(ð21 , ⯠, ð2ð ) sowie ðð ≥ 0. Setzen wir dann ð: = ðŽð (ð − ð), so erfüllt ð die Forderungen. Hat ð nicht vollen Rang, so reicht sogar ð¬ = diag(ð21 , ⯠, ð2rk ð , 0, ⯠, 0). Bemerkung Eine normalverteilte Zufallsvariable ð ∼ (ð, ð) hat genau dann eine Dichte Ì , ð ∼ (0, ðŒð ), ðŽÌ = ðŽ diag(ð1 , ⯠, ðð ). Dann hat ð wenn det ð ≠ 0. Dies gilt mit ð = ðŠ + ðŽð die Dichte 1 ð− ð |ðŠ|2 2 (2ð) 2 =: ðð (ðŠ) Ì |ðð (ðŽ−1 Ì (ð¥ − ð)) = ⇒ ðð (ð¥) = |det ðŽ−1 1 exp(− âšð¥ − ð, ð−1 (ð¥ − ð)â©) 2 (2ð) √det ð 1 ð 2 6 Konvergenz in Verteilung / schwache Konvergenz 77 Deï¬nition: „schwache Konvergenz“ Sei (ðž, ð) ein metrischer Raum mit der Borelschen σ-Algebra (ðž). 1. Seien ð, (ðð )ð∈â Wahrscheinlichkeitsmaße auf (ðž, ). Dann konvergiert ðð schwach gegen ð falls für alle stetigen, beschränkten Funktionen ð: ðž → ðž gilt: lim ð→∞ ðž ðdðð = ðdð ðž ð€ Wir schreiben ðð → ð oder ðð −→ ð. 2. Seien ð, (ðð )ð∈â Zufallsvariablen auf (ðº, , â) bzw. (ðºð , ð , âð ), dann sagt man ðð konvergiert in Verteilung gegen ð falls âðð = âð â ðð−1 schwach gegen âð konvergiert. Wir schreiben ðð −→ ð. 78 Satz: schwache Konvergenz im Reellen Seien ð, (ðð )ð∈â reellwertige Zufallsvariablen mit Verteilungsfunktionn ð¹ð und ð¹ðð . Dann sind die folgenden Aussagen äquivalent: 1. ðð −→ ð 2. ð¹ðð (ð) → ð¹ð (ð) an allen Stellen ð an denen ð¹ð stetig ist. Prof. Becherer Bodo Graumann Stochastik I 6 Konvergenz in Verteilung / schwache Konvergenz Seite 36 Beweis (78) ð) ⇒ ð) Sei ð eine Stetigkeitsstellen von ð¹ð . Wähle dann Folgen stetiger und beschränkter Funktionen (ðð )ð∈â , (âð )ð∈â sodass ð(−∞,ð− 1 ] ≤ ðð ≤ ð(−∞,ð] ≤ âð ≤ ð(−∞,ð+ 1 ] ð ð Dann gilt diese Ungleichung auch für die Erwartungswerte von ðð und für die von ðð und âð ist die Konvergenz wegen schwacher Konvergenz von ðð bekannt: ð¹ð (ð − 1 1 ) ≤ ðŒ(ðð (ð)) ≤ ð¹ðð (ð) ≤ ðŒ(âð (ð)) ≤ ð¹ð (ð + ) ð ð Da ð¹ð bei ð stetig ist, gilt dann ð¹ðð (ð) → ð¹ð (ð). ð) ⇒ ð) Wir wählen ð ∈ ð¶ð (â, â) (stetig und beschränkt) und ð > 0 beliebig. ð¹ð hat höchstens abzählbar viele Sprungstellen. Also können wir eine Zerlegung der reellen Achse in −∞ < ð1 < ð2 < ⯠< ðð < ∞ so ï¬nden, dass ð¹ð bei den ðð stetig ist, ð¹ð (ð1 ) < ð und ð¹(ðð ) > 1 − ð sowie sup |ð(ð¥) − ð(ðð )| ≤ ð ð¥∈ ðð ,ðð+1 Dies ist möglich, da ð auf [ð1 , ðð ] gleichmäßig stetig ist. Dann können wir abschätzen: ð ðŒ(ð(ðð )) = ðŒ(ð(ðð )ð ð∈ð ðð (ð)≤ðð ∨ðð (ð)>ðð )+ ðŒ(ð(ðð )ð ð∈ðº ðð (ð)∈(ðð−1 ,ðð ] ) ð=2 ð ≤ âð â∞ 2ð + (ð(ðð ) + ð)(ð¹ðð (ðð )) − ð¹ðð (ðð−1 ) ð=2 ⇒ lim ðŒ(ð(ðð )) ≤ 2ðâð â∞ + ðŒ(ð(ð)) + 2ð + âð â∞ 2ð = ðŒ(ð(ð)) + 2ð(2âð â∞ + 1) ð→∞ ≥ðŒ(∑ð ð=2 ð(ðð )ð ð∈(ðð−1 ,ðð ] ) ⇒ lim sup ðŒ(ð(ðð )) ≤ ðŒ(ð(ð)) ð→∞ Analog mit −ð statt ð liefert lim inf ð→∞ ðŒ(ð(ðð )) ≥ ðŒ(ð(ð)) und damit die Behauptung. 6.1 Beziehungen zu anderen Konvergenzarten 79 Satz: fast-sichere Konvergenz und Konvergenz in Verteilung Seien ðð , ð: ðº → âð Zufallsvariablen auf (ðº, , â) und ðð → ð â-fast-sicher. Dann gilt auch ðð −→ ð . Beweis (79) Sei ð ∈ ð¶ð (âð , â). Dann gilt wegen der Stetigkeit ð(ðð ) → ð(ð) â-fast-sicher und |ð(ðð )|âð â∞ ∈ ð¿1 (â). Mit dem Satz der majorisierten Konvergenz folgt dann limð→∞ ðŒ(ð(ðð )) = ðŒ(ð(ð)). Prof. Becherer Bodo Graumann Stochastik I 6 Konvergenz in Verteilung / schwache Konvergenz Seite 37 80 Satz: Konvergenz von Unterteilfolgen Sind ðð , ð: ðº → âð Zufallsvariablen auf (ðº, , â) so sind die folgenden Aussagen äquivalent: â 1. ðð −→ ð 2. Jede Teilfolge (ððð )ð∈â hat eine Unterteilfolge (ððð )ð∈â so, dass limð→∞ ððð = ð â-fastð ð sicher. Beweis (80) â ð) ⇒ ð) Wir nehmen an ðð −→ ð gilt nicht. Dann gilt ∃ð > 0, ð¿ > 0, ðð : ðŒ(|ððð − ð | ≥ ð) ≥ ð¿ â ððð konvergiert jedoch fast-sicher gegen ð und damit ððð −→ ð ⯠ð) ⇒ ð) Sei (ððð ) eine Teilfolge von ðð so gilt für alle ð > 0: limð→∞ â(|ððð − ð | ≥ ð) = 0 also 1 1 ∃ðŸ1 ∈ â: ∀ð ≥ ðŸ1 : â(|ððð | ≥ ) ≤ 2 2 1 1 ∃ðŸ2 ∈ â: ∀ð ≥ ðŸ2 : â(|ððð | ≥ 2 ) ≤ 2 2 2 ⯠Dann deï¬nieren wir für eine Unterteilfolge ðð = ððð die ðŽð : = |ðð+1 − ðð | ≥ ∼∞ ð=1 ð 1 â(ðŽð ) = ∑∞ ð=1 2ð . Mit Satz 43 (Borel-Cantelli-Lemma) wissen viele der ðŽð eintreten, das heißt die Wahrscheinlichkeit dass ðð ist endlich ist, ist 1 und somit gilt die Behauptung. 1 2ð . Damit wir nun, dass nur eine Cauchyfolge 81 Satz: Majorisierte Konvergenz mit stochastischer Konvergenz Seien ðð , ð: ðº → âð Zufallsvariablen auf (ðº, , â) mit ðð → ð â-fast-sicher und es gelte ð¿1 |ðð | ≤ ð für ein ð ∈ ð¿1 (â). Dann gilt ðð −→ ð , das heißt âðð − ð âð¿1 = ðŒ(|ðð − ð |) → 0 und ð ∈ ð¿1 (â). Insbesondere also ðŒ(ðð ) → ðŒ(ð). ð¿1 Beweis (81) Angenommen ðð −→ ð gilt nicht, das heißt ∃ð > 0, ððð : ∀ð: ðŒ(|ððð − ð |) ≥ ð. Nach Satz 80 (Konvergenz von Unterteilfolgen) können wir annehmen dass ððð → ð â-fastð¿1 sicher, daher gilt nach dem klassischen Theorem der majorisierten Konvergenz dass ððð −→ ð â¯. 82 Satz: Stochastische Konvergenz und Konvergenz in Verteilung â Seien ð, ðð : ðº → âð Zufallsvariablen mit ðð −→ ð so gilt ðð −→ ð . Prof. Becherer Bodo Graumann Stochastik I 6 Konvergenz in Verteilung / schwache Konvergenz Seite 38 ð¿1 Beweis (82) Sei ð ∈ ð¶ð (âð , â), dann gilt ð(ðð ) −→ ð(ð). Wegen Satz 80 (Konvergenz von Unterteilfolgen) und Satz 81 (Majorisierte Konvergenz mit stochastischer Konvergenz) folgt dann ð¿1 âð(ðð )â ≤ âð â∞ ∈ ð¿1 (â) ⇒ ð(ðð ) −→ ð(ð) also ðŒ(ð(ðð )) → ðŒ(ð(ð)). Bemerkung Die Umkehrung gilt nicht, betrachten wir beispielsweise das folgende Gegenbeispiel: ð∼ (0, 1), ðð : = (−1)ð ð. Dann ist ðð −→ ðð aber ðð konvergiert nicht stochastisch. 83 Lemma: Sei (ðð )ð∈â eine Folge von Wahrscheinlichkeitsmaßen auf (â, ) mit Verteilungsfunktionen ð¹ð (ð¥) = ðð ((−∞, ð¥]).Dann existiert eine Teilfolge ðºð = ð¹ðð , ð ∈ â und eine rechtsstetige monoton wachsende Funktion ð¹: â → [0, 1] mit ðºð (ð) → ð¹(ð) für alle ð ∈ â an denen ð¹ stetig ist. Bemerkung: ð¹ induziert über ð((ð, ð]) = ð¹(ð) − ð¹(ð) ein Maß auf , welches im Allgemeinen jedoch kein Wahrscheinlichkeitsmaß zu sein braucht. Beweis (83) Wir zeigen zuerst, dass es eine Teilfolge (ðð )ð∈â gibt, sodass ∀ð: ð»(ð): = limð→∞ ð¹ðð existiert. Dazu wählen wir eine Nummerierung der rationalen Zahlen â = ðð ð ∈ â . Da für jedes ð: ð¹ð (ð) ∈ [0, 1] ist, können wir nach Bolzano-Weierstraß konvergente Teilfolgen wählen sodass ð¹ð1 (ð1 ) konvergiert, ð¹ð2 (ð1 ), ð¹ð2 (ð2 ) konvergieren, also ð¹ðð bei ð1 , ⯠, ðð konvergiert. Wir wählen ð ð ð ð dann die Diagonalfolge ðºð : = ð¹ðð und wissen somit, dass ðºð auf ganz â konvergiert. Dann ð deï¬nieren wir ð»(ð): = limð→∞ ðºð (ð) für ð ∈ â und ð» ist wachsend auf ð sowie ð»(ð) ∈ [0, 1]. Dann setzen wir ð» auf ganz â zu ð¹ fort: ð¹(ðŠ): = inf ð»(ð), ðŠ ∈ â, ð¹: â → [0, 1] ð≥ðŠ ð∈â Damit ist ð¹ wachsend und rechtsstetig. Es bleibt zu zeigen, dass auch limð→∞ ðºð (ð) = ð¹(ð) für alle Stetigkeitsstellen ð von ð¹ . Sei ð also eine beliebige Stetigkeitsstelle von ð¹ und ð > 0, dann existieren ð, ð ∈ â mit ð < ð < ð und ð¹(ð) − ð ≤ ð¹(ð) ≤ ð¹(ð) ≤ ð¹(ð ) ≤ ð¹(ð) + ð ð ∈â ⇒ lim sup ðºð (ð) ≤ lim sup ðºð (ð ) = ð»(ð ) ≤ ð¹(ð ) ≤ ð¹(ð) + ð ð→∞ ð→∞ lim inf ðºð (ð) ≥ lim inf ðºð (ð) = ð»(ð) = ð¹(ð) ≥ ð¹(ð) − ð ð→∞ ð→∞ Da ð > 0 beliebig gewählt war, gilt somit limð→∞ ðºð (ð) = ð¹(ð). Prof. Becherer Bodo Graumann Stochastik I 6 Konvergenz in Verteilung / schwache Konvergenz Seite 39 84 Deï¬nition: „gleichgradige Straï¬heit“ Eine Familie von Wahrscheinlichkeitsmaßen (ðð )ð∈ðŒ heiß gleichgradig straï¬ falls Ì ∀ð > 0: ∃ð > 0: ∀ð ∈ ðŒ: ðð (−ð, +ð] <ð Beispiel für eine nicht gleichgradig straï¬e Folge: ðð : = der Grenzwert das Nullmaß. Beispiel ([0, ð]) (Gleichverteilung). Dann ist für gleichgradig straï¬e Mengen Familien: 1. Ist ðŒ endlich, so ist (ðð )ð∈ðŒ gleichgradig straï¬ 2. Oft ist ðŒ = â. Dan ist die Folge (ðð )ð∈â genau dann gleichgradig straï¬, wenn für jedes ð ∈ â die Folge (ðð )ð≥ð gleichgradig straï¬ ist. 3. Sind (ðð )ð∈ðŒ1 und (ðð )ð∈ðŒ2 gleichgradig straï¬e Familien, dann ist auch (ðð )ð∈ðŒ1 ∪ðŒ2 gleichgradig straï¬. ð€ 4. Falls ðð −→ ð gilt, so ist (ðð )ð∈â gleichgradig straï¬. 85 Satz: Hellysches Selektionsprinzip Sei (ðð )ð∈â eine gleichgradig stetige Folge von Wahrscheinlichkeitsmaßen auf 1 . Dann gibt ð€ es eine Teilfolge (ððð )ð∈â und ein Wahrscheinlichkeitsmaß ð sodass ððð −−−→ ð. ð→∞ Beweis (85) Seien 1. ð¹ð die Verteilungsfunktionen der ðð , 2. ðºð und ð¹ wie aus Lemma 83 3. ðð seien die durch ðºð über ðð ((ð, ð]): = ðºð (ð) − ðºð (ð) deï¬nierten Maße Dann müssen wir zeigen, dass ð¹ die Verteilungsfunktion eines Wahrscheinlichkeitsmaßes ist. Ì Sei ð > 0, dann existiert ein ð > 0 sodass für jedes ð gilt: ðð ((−ð, +ð)) < ð. Wähle nun ðŠ > 1 so, dass ð¹ stetig bei ðŠ und −ðŠ ist. Dann gilt Ì ≤ð (1 − ð¹(ðŠ)) + ð¹(−ðŠ) = lim (1 − ðºð (ðŠ)) + ðºð (−ðŠ) ≤ lim sup ðð ((−ð, +ð]) ð→∞ ð→∞ Ì ðð ((−ðŠ,ðŠ]) Als ð wählen wir also das zu ð¹ gehörige Wahrscheinlichkeitsmaß. Prof. Becherer Bodo Graumann Stochastik I 6 Konvergenz in Verteilung / schwache Konvergenz Seite 40 86 Satz: Stetigkeitssatz von Paul Lévy Seien ð, ðð , ð ∈ â Wahrscheinlichkeitsmaße auf (âð , ð = ð,Ì ðð = ððÌ . Dann gilt ð€ 1. ðð −→ ð ð ) mit charakteristischen Funktionen ∀ð¢ ∈ âð : ðð (ð¢) → ð(ð¢) ⇒ 2. Falls ∀ð¢ ∈ âð : limð→∞ ðð (ð¢) = ð(ð¢) für eine Funktion ð: âð → â, die in 0 stetig ist, dann ist ð die charakteristische Funktion eines Wahrscheinlichkeitsmaßes ð auf ð und ð€ ðð −→ ð. Bemerkung In der Tat kann man in ð) sogar die stärkere Aussage zeigen, dass ðð auf Kompakta gleichmäßig gegen ð konvergiert. Beweis (86) 1. Sei ð ∼ ð, ðð ∼ ðð , dann ist ðð (ð¢) = ðŒ(exp(ðð¢ðð )) = ðŒ(cos(ð¢ðð )) + ððŒ(sin(ð¢ðð )) ð→∞ −−−→ ðŒ(cos(ð¢ð)) + ððŒ(sin(ð¢ð)) = ðŒ(exp(ðð¢ð)) = ð(ð¢) Beispiel 1. Seien ðð ∼ Dann gilt (ðð , ðð2 ) Zufallsvariablen für beliebige ðð ∈ â, ðð > 0 mit ðð → ð ∈ â. ð→∞ 1 1 ðð (ð¢) = exp(ðð¢ðð − ð¢2 ðð2 ) −−−→ exp(ðð¢ð − ð 2 ð¢2 ) 2 2 ⇒ ðð −→ 2. Seien ðð ∼ (ð, ð 2 ) (ðð , ðð2 ) und ðð −→ ð, dann wisen wir: ∀ð¢ ∈ â: lim ððð (ð¢) = ðð ð→∞ ⇒ ð = lim ðð ∧ ð = lim ðð ∧ ð ∼ ð→∞ ð→∞ (ð, ð 2 ) 3. Zusammen bedeutet das: ðð −→ ð genau dann wenn ð = lim→∞ ðð , ð = limð→∞ ðð existieren und ð ∼ (ð, ð 2 ). Die Normalverteilungsfamilie ist also abgeschlossen bezüglich Verteilungskonvergenz. Übung Zeigen Sie analoge Aussagen für Poisson- oder Exponentialverteilte Zufallsvariablen. Prof. Becherer Bodo Graumann Stochastik I 6 Konvergenz in Verteilung / schwache Konvergenz Seite 41 Beispiel für die Anwendung von Satz 86 (Stetigkeitssatz von Paul Lévy): Betrachte die Zufallsvariablen ðð ∼ Poisson(ðð ), ðð : = ð, ðð : = ðð −ðŒ(ðð ) = √ð(ðð ) ðð −→ ðð −ð . √ð Dann gilt (0, 1) denn: ððð (ð¢) = ðŒ exp(ðð¢ ðð − ð √ð = ð−ðð¢√ð ððð ( ) Taylor = exp −ðð¢√ð + ðð¢√ð + ð − ð¢ √ð )=ð (0,1) (ð¢) ð¢2 ð¢4 ð¢3 + +⯠−ð 2ð 3! ð1.5 4! ð2 = ð−ðð¢√ð exp(ð(ððð¢/√ð − 1)) = exp − ð¢2 1 + ðo 2 ð ð¢2 → ð− 2 weil ∞ ∞ ∞ |ð¢|ð (ðð¢)ð ð 1 2| ≤ |ð | ≤ | ð →0 ð √ð ð=3 ð! √ð ð=3 ð! ð=3 ð! ð 2 (ðð¢)ð 1 <∞ Motivation zum Zentralen Grenzwertsatz Man kann die ðð ∼ Poisson(ð) aus obigem Beispiel auch als ðð = ∑ðð=1 ðð mit unabhängigen ðð ∼ Poisson(1) erzeugen. Oder betrachtet man zum Beispiel eine Folge iid Zufallsvariablen ðð mit â(ðð = 1) = 1−â(ðð = −1) = 21 . Dann hat ðð : = ðð (ð¢) = ðð1 ∑ðð=1 ðð −0 ð¢ √ð die charakteristische Funktion ð = √ð ð¢ 1 ð √ð(+1) 1 ð ð¢ (−1) = cosð ð + ð √ð 2 2 − sin l’Hôpital ======⇒ lim ðð (ð¢) = lim exp( ð→∞ für ð ∼ (0, 1). ð→∞ ð¢ √ð − ð12 cos ( 2ð−ð¢1.5 ) ð¢ √ð ) = exp(− ð¢ √ð = exp(ð ln(cos ð¢ √ð ð¢2 ) = ðð (ð¢) 2 (0, 1). Und somit gilt wieder nach Satz 86 (Stetigkeitssatz von Paul Lévy): ðð −→ Bemerkung Der Zentrale Grenzwertsatz zeigt nun, dass eine entsprechende Aussage wie in den vorigen Beispielen allgemeiner für beliebige zugrundeliegende Verteilungen der unabhängigen Summanden ðð gilt. Etwas genauer gilt, dass Summen „vieler“ unabhängiger gleichgroßer Zufallsgrößen approximativ Gauß-verteilt sind und nach Standardisierung standard-Gauß-verteilt. Prof. Becherer Bodo Graumann )) Stochastik I 6 Konvergenz in Verteilung / schwache Konvergenz Seite 42 87 Satz: Zentraler Grenzwertsatz Seien (ðð )ð∈â iid und reellwertig mit ð: = ðŒ(ðð ) sowie ð 2 : = Var(ðð ) ∈ (0, ∞). ð ðð : = ðð∗ : = ðð ð=1 Dann gilt: ðð∗ −→ ðð − ðð √ðð 2 (0, 1). 88 Lemma: Hilfsaussage Sei (ð¶ð )ð∈â , ðð ∈ â mit ð: = limð→∞ ðð ∈ (0, ∞) ⊆ â, dann gilt lim 1 − ð→∞ ðð ð ð = ð−ð Beweis (Satz 87 (Zentraler Grenzwertsatz)) ðð hat endliche erste und zweite Momente, also ist die charakteristische Funktion ð: = ððð −ð zweimal stetig diï¬erenzierbar. Dann ergibt die Taylorentwicklung: ð(ð¢) = ð(0) + ð (0) ð¢ + ð (0) =0 ⇒ ððð∗ (ð¢) = ðð1 −ð ð¢2 + 2 ð¢→0 (ð¢ ð ð¢ ) ð¢2 ð(0) + ð (0) 2 ð + 2ð = ð √ð 3 ð¢→0 (( ð¢ ð √ð ð 3 ) ) 3 1 ð¢2 − ( ð¢ ) â â ð¿ðððð 88 (ð»ðððð ðð¢ð ð ððð) 2 2 ð 3 √ð â −−−−−−−−−−−−−−→ ð− ð¢2 = â1 − ð â â â â Beweis (Lemma 88 (Hilfsaussage)) • Wir zeigen zuerst induktiv, dass ð§1 , ⯠, ð§ð , ð€1 , ⯠, ð€ð ∈ â mit |ð§ð | ≤ 1, |ð€ð | ≤ 1 gilt ð | ð ð§ð − ð=1 ð ð€ð | ≤ ð=1 |ð§ð − ð€ð | ð=1 Der Induktionsanfang für ð = 1 ist oï¬ensichtlich erfüllt. Der Induktionsschritt ergibt sich als: ð+1 | ð+1 ð§ð − ð=1 ð+1 ð€ð | ≤ | ð=1 ð=1 ð = |ð§ð+1 | | ≤1 ð=1 ð+1 ð€ð − ð=1 ð ð€ð | ð=1 ð ð€ð | + | ≤∑ðð=1 |ð§ð −ð€ð | Prof. Becherer ð ð€ð | + |ð§ð+1 ð=1 ð ð§ð − ð=1 ð ð§ð − ð§ð+1 ð€ð ||ð§ð+1 − ð€ð+1 | ≤ ð=1 ≤1 Bodo Graumann |ð§ð − ð€ð | + |ð§ð+1 − ð€ð+1 | ð=1 Stochastik I 6 Konvergenz in Verteilung / schwache Konvergenz Seite 43 • Weiter gilt für ð ∈ â mit |ð| ≤ 1: ∞ |ð−ð − (1 − ð)| = | ∞ ∞ (−ð)ð (−ð)ð 1 |≤ | | ≤ |ð|2 ≤ |ð|2 ð ð! ð! 2 ð=2 ð=2 ð=1 • Sei nun (ðð )ð∈â wie vorausgesetzt, dann gilt für hinreichend große ð sodass |1 − ð |(1 − ð )ð − ð−ðð | ≤ ð ð |1 − ð=1 ðð ð| ≤ 1: ðð ðð ð ðð − ð− ð | = ð|1 − ð − ð− ð | ð ð ðð2 ð→∞ ðð 2 | = | | −−−→ 0 ð ð ðð ð ) = ð−ð ⇒ lim (1 − ð→∞ ð ≤ ð| Bemerkung Seien ðð iid und reellwertig. Aus dem starken Gesetz der Großen Zahlen wissen wir 1 ðð : = ð ð ð→∞ ðð −−−→ ð: = ðŒ(ð1 ) â-fast-sicher ð=1 Frage Wie schnell konvergiert dies? Vorüberlegung Für die Konvergenz einer Folge (ðð )ð∈â in â sagt man dass (ðð ) mit einer Rate ðŒ > 0 gegen 0 konvergiert, falls lim supð→∞ ððŒ |ðð | =: ð < ∞ ist. Ein solches ðŒ, sodass ððŒ |ðð −ð| â-fast-sicher gegen ein ð ∈ â konvergiert gibt es nicht! Allerdings zeigt Satz 87 (Zentraler Grenzwertsatz), dass Konvergenz in Verteilung gegen eine endliche Zufallsvariable vorliegt: √ð(ðð − ð) −→ (0, ð 2 ) In diesem Sinne kann man sagen die Konvergenzordnung ist √ð. Bemerkung Es gibt Verallgemeinerungen von Satz 87 (Zentraler Grenzwertsatz). • Die Annahme der identischen Verteilung kann abgeschwächt werden. Dies ist gerade für Anwendungen wichtig. • Sehr scharfe Bedingungen für Satz 87 (Zentraler Grenzwertsatz) sind beispielsweise die Lindenberg-Bedingungen. (Kle08) • Es gibt auch eine mehrdimensionale Version. (Kle08) • Beispiel für die Anwendung von Satz 87 (Zentraler Grenzwertsatz): Bestimmung von „Vertrauensbereichen“ (Konï¬denzbereichen) für unbekannte Verteilungsparameter die aus Daten geschätzt werden. Prof. Becherer Bodo Graumann