Grundstudium Mathematik Wahrscheinlichkeitsrechnung Bearbeitet von Dominique Foata, Aime Fuchs 1. Auflage 1999. Taschenbuch. xv, 383 S. Paperback ISBN 978 3 7643 6169 3 Format (B x L): 17 x 24,4 cm Gewicht: 783 g Wirtschaft > Betriebswirtschaft: Theorie & Allgemeines > Wirtschaftsmathematik und statistik Zu Inhaltsverzeichnis schnell und portofrei erhältlich bei Die Online-Fachbuchhandlung beck-shop.de ist spezialisiert auf Fachbücher, insbesondere Recht, Steuern und Wirtschaft. Im Sortiment finden Sie alle Medien (Bücher, Zeitschriften, CDs, eBooks, etc.) aller Verlage. Ergänzt wird das Programm durch Services wie Neuerscheinungsdienst oder Zusammenstellungen von Büchern zu Sonderpreisen. Der Shop führt mehr als 8 Millionen Produkte. KAPITEL 5 ZUFALLSVARIABLE Das in den vorangegangenen Kapiteln beschriebene Modell reicht nicht mehr aus, wenn es darum geht, solche vom Zufall abhängige Grössen oder Zustände zufälliger Systeme zu beschreiben, die sich mit der Zeit ändern. Hierfür muss man auf dem Wahrscheinlichkeitsraum definierte Funktionen betrachten. In der traditionellen Terminologie, die wir auch hier verwenden werden, heissen solche Funktionen Zufallsvariable. Dabei handelt es sich um Funktionen im üblichen Sinne, die reelle Werte oder Werte in Rn annehmen. Dieses Kapitel ist der formalen Definition von Zufallsvariablen gewidmet, nachdem zuvor einige technische Details über inverse Abbildungen und Eigenschaften von messbaren Funktionen geklärt worden sind. 1. Inverse Abbildungen. — Die inverse Abbildung X −1 zu einer Abbildung X : E → F ist eine Abbildung von der Potenzmenge P(F ) in die Menge P(E), die jeder Teilmenge B von F die mit X −1 (B) bezeichnete Teilmenge von E zuordnet, die gerade aus denjenigen Elementen e von E besteht, für die X(e) zu B gehört. Die Menge X −1 (B) = {e ∈ E : X(e) ∈ B} heisst inverses Bild von B. Grundlegend ist die (hier nicht nochmals bewiesene) Tatsache, dass die inverse Abbildung X −1 mit allen elementaren Mengenoperationen verträglich ist. Anders formuliert: falls Bn (mit oder ohne Index) eine Teilmenge von F bezeichnet, so gelten die folgenden Aussagen: c X −1 (F ) = E, X −1 (B c ) = X −1 (B) , X −1 (∅) = ∅, −1 −1 −1 Bn = X (Bn ), X Bn = X −1 (Bn ). X n n n n Speziell ist das inverse Bild einer Vereinigung von paarweise disjunkten Mengen wiederum eine Vereinigung von paarweise disjunkten Mengen. Mit der Notation für disjunkte Vereinigungen gilt also X −1 Bn = X −1 (Bn ). n n Erwartungsgemäss sind inverse Abbildungen auch mit algebraischen Strukturen auf den zugrunde liegenden Mengen verträglich, so etwa speziell mit 54 KAPITEL 5: ZUFALLSVARIABLE der Eigenschaft, eine σ-Algebra zu sein, was im folgenden Satz zum Ausdruck kommt. Satz 1.1. — Es sei (F, F) ein messbarer Raum und X : E → F eine Abbildung. Dann bildet die Mengenfamilie X −1 (F) = {X −1 (B) : B ∈ F} eine σ-Algebra auf E. Beweis. — In der Tat: da E gleich X −1 (F ) und da F zu F gehört, hat jeder Menge B aus F gehört auch man zunächst einmalE ∈ X −1 c(F). Mit c −1 −1 (Bn ) B zu F. Folglich gilt X (B) = X (B c ) ∈ X −1 (F). Ist schliesslich −1 eine Familie von Mengen, die alle zu F gehören, so hat man n X (Bn ) = X −1 ( n Bn ) ∈ X −1 (F). Der folgende Satz sagt aus, dass die inverse Abbildung auch mit der Erzeugung von σ-Algebren verträglich ist. Satz 1.2. — Es sei X : E → F eine Abbildung und C eine Familie von Teilmengen von F . Dann gilt σ(X −1 C) = X −1 σ(C) , wobei σ(C) die von C erzeugte σ-Algebra bezeichnet. Beweis. — Zunächst gilt C ⊂ σ(C), und daher auch X −1 (C) ⊂ X −1 σ(C) . Die rechts stehende Mengenfamilie ist aber Satz eine vorangehendem −1gemäss −1 σ(C) . σ-Algebra, deshalb gilt die Inklusion σ X (C) ⊂ X Bezeichne nun F die Familie derjenigen Teilmengen B von F, deren inverse −1 −1 −1 Bilder X (B) zu σ X (C) gehören. Dann gilt X (F) ⊂ σ X −1 (C) . Wir zeigen nun, dass F tatsächlich in F ist: eine σ-Algebra (i) Es ist X −1 (F ) = E ∈ σ X −1 (C) , daher gilt F ∈ F. (ii) Ist (B n ) eine Folge F, so gilt von Mengen aus X −1 ( n Bn ) = n X −1 (Bn ) ∈ σ X −1 (C) , und daher n Bn ∈ F. c (iii) Gehört B zu F, so gehört X −1 (B c ) = X −1 (B) zu σ X −1 (C) und daher gilt B c ∈ F. Nun ist noch festzustellen, dass F insbesondere C umfasst, also auch σ(C). Folglich ist σ X −1 (C) ⊃ X −1 (F) ⊃ X −1 σ(C). Damit ist gezeigt, dass die beiden σ-Algebren σ X −1 (C) und X −1 (σ C) identisch sind. 2. Messbare Funktionen Definition. — Es seien (E, E) und (F, F) zwei messbare Räume. Eine Abbildung X : E → F wird als messbare Funktion von (E, E) in (F, F) bezeichnet, wenn X −1 (F) eine Unter-σ-Algebra von E ist. Ist speziell (F, F) = (R, B1 ), so spricht man einfacher von einer messbaren Funktion auf (E, E). 2. MESSBARE FUNKTIONEN 55 Im folgenden Satz wird gezeigt, dass man zum Nachweis der Messbarkeit einer Funktion nicht alle Elemente der σ-Algebra F überprüfen muss, sondern dass man sich dabei auf eine Familie beschränken kann, die F erzeugt. Satz 2.1. — Es seien (E, E) und (F, F) zwei messbare Räume. Eine Abbildung X : E → F ist bereits dann eine messbare Funktion von (E, E) in (F, F), wenn es eine Klasse C von Teilmengen von F gibt, die F erzeugt und für die X −1 (C) ⊂ E gilt. −1 Beweis. — In der Tat, wenn der E enthalten ist, σ-Algebra −1X (C) in −1 σ(C) (nach Satz 1.2) in F so ist auch die σ-Algebra σ X (C) = X −1 enthalten. Damit gilt X (F) ⊂ F und X ist messbar. Wie früher gezeigt, wird die Borel-σ-Algebra B1 von R von der Familie der offenen Intervalle (bzw. der Halbgeraden, etc.) erzeugt. Aus vorangehendem Satz folgt also: will man die Messbarkeit einer auf einem messbaren Raum (E, E) definierten reellwertigen Funktion nachweisen, so genügt es zu zeigen, dass für jedes Paar (a, b) reeller Zahlen mit a < b die Menge X −1 ( ]a, b[ ) zu E gehört. Analog würde es auch genügen, für jede reelle Zahl a nachzuweisen, dass das inverse Bild X −1 ( ] − ∞, a] ) zu E gehört, etc. Die Aussagen des folgenden Satzes ergeben sich aus Satz 1.2. Auf einen Beweis wird hier verzichtet Satz 2.2. — Ist (E, E) ein messbarer Raum und λ eine reelle Zahl, sind X, Y (mit oder ohne Index) messbare Funktionen auf (E, E), so sind auch |X|, X + Y , λX, X · Y , lim supn Xn , lim inf n Xn , supn Xn , inf n Xn messbare Funktionen (vorausgesetzt, diese Operationen liefern wieder Funktionen mit endlichen numerischen Werten). Ist ausserdem X = 0, so ist auch 1/X messbar. Ist schliesslich Xn eine Folge, die für jeden Punkt von E gegen einen endlichen Wert konvergiert, so ist auch X = limn Xn eine messbare Funktion. Man kann diese Aussagen auch dahingehend zusammenfassen, dass man feststellt: die Messbarkeit bleibt unter den üblichen Operationen der Analysis erhalten. Konstante Funktionen sind offensichtlich messbar. In Bezug auf stetige Funktionen gilt die folgende Aussage. Satz 2.3. — Es sei E ein topologischer Raum und E die von den offenen Mengen von E erzeugte σ-Algebra. Dann ist jede stetige Funktion X : (E, E) → (R, B1 ) auch messbar. Beweis. — Es bezeichne O dieFamilie der Mengen von R. Dann offenen −1 −1 −1 σ(O) ⊂ E. Wegen gilt X (O) ⊂ E und somit σ X (O) = X σ(O) = B1 ist also X −1 (B1 ) in E enthalten, d.h. X ist messbar. Im nächsten Satz werden wir die Messbarkeit einer Funktion mit Werten in Rn zur Messbarkeit ihrer Koordinatenfunktionen in Bezug setzen. 56 KAPITEL 5: ZUFALLSVARIABLE Satz 2.4. — Es seien (E, E) ein messbarer Raum und X = (X1 , . . . , Xn ) eine Abbildung von E in Rn . X ist eine messbare Funktion von (E, E) in (Rn , Bn ) genau dann, wenn für alle i = 1, . . . , n die Koordinatenfunktion Xi : E → R eine messbare Funktion von (E, E) in (R, B) ist. Beweis. — Es sei (B1 , . . . , Bn ) eine Folge von n Borel-Mengen der reellen Geraden. Dann ist deren cartesisches Produkt B = i Bi eine Borel-Menge von Rn . Ausserdem ist X −1 (B) = i Xi−1 (Bi ). Falls X messbar ist, so können wir irgendeine ganze Zahl i im Intervall [1, n] auswählen und Bi = [ai , bi [ sowie Bj = R für alle j = i setzen. Dann ist X −1 (B) = Xi−1 ( [ai, bi [ ) und damit gehört Xi−1 ( [ai , bi [ ) zu E. Folglich ist Xi (gemäss Satz 2.1) messbar. Sind umgekehrt alle Koordinatenfunktionen Xi messbar, so kann man Bi = [ai , bi [ (i = 1, . . . , n) wählen. Die Menge B ist dann ein Rechteck in Rn und X −1 (B) gehört zu E. Damit hat man X −1 (Bn ) ⊂ E. Somit ist die Funktion X, wiederum gemäss Satz 2.1, ebenfalls messbar. Der folgende Satz wird ohne Beweis zitiert. Satz 2.5. — Es seien (E, E) ein messbarer Raum, X : (E, E) → (Rn , Bn ) und f : (Rn , Bn ) → (R, B1 ) zwei messbare Funktionen. Dann ist auch f ◦ X eine messbare Funktion. Der Begriff der Indikatorfunktion eines Ereignisses ist im Abschnitt 3.3 von Kapitel 1 eingeführt worden. Man achte darauf, die Indikatorfunktion IA eines Ereignisses A, das zu einer σ-Algebra A auf einer Menge Ω gehört, nicht mit dem singulären Mass ω zu verwechseln, welches eine auf A definierte Funktion von Mengen ist. Gleichwohl hat man folgende Beziehung IA (ω) = ω (A), für alle ω ∈ Ω und A ∈ A. Die folgende Aussage ist offensichtlich und wird daher ohne Beweis angegeben. Satz 2.6. — Es sei (Ω, A) ein messbarer Raum. Die Indikatorfunktion IA einer Teilmenge A von Ω ist genau dann messbar, wenn A zu A gehört. 3. Zufallsvariable Definition. — Ist ein Wahrscheinlichkeitsraum (Ω, A, P) gegeben, so bezeichnet man jede messbare Funktion von (Ω, A) in (R, B1 ) (bzw. in (Rn , Bn )) als reelle Zufallsvariable (bzw. als Zufallsvariable mit Werten in Rn oder ndimensionale Zufallsvariable). Aus dem eben Gesagten ergibt sich, dass eine reelle (bzw. n-dimensionale) Zufallsvariable eine Abbildung von Ω in R (bzw. in Rn ) ist, bei der für jedes reelle a (bzw. jede Folge (a1 , . . . , an ) von reellen Zahlen) das inverse Bild X −1 ( ] − ∞, a] ) (bzw. X −1 ( ] − ∞, a1 ] × · · · ×] − ∞, an] )) zu der σ-Algebra A gehört. 4. DIE VERTEILUNG EINER ZUFALLSVARIABLEN 57 Bemerkung. — Bei der Definition der Zufallsvariablen spielt die Wahrscheinlichkeitsverteilung P als Element des Tripels (Ω, A, P) eigentlich gar keine Rolle; nur die σ-Algebra A tritt in Erscheinung. Somit ist die Terminologie Zufallsvariable streng genommen nicht angebracht. Allerdings wird, wie gleich anschliessend beschrieben wird, die Zufalls variable X dazu verwendet, den Wertebereich (R, B1 ) mit einer Wahrscheinlichkeitsverteilung zu versehen. Wahrscheinlichkeitstheoretische Terminologie. — Es sei (Ω, A, P) ein Wahrscheinlichkeitsraum und A ein zur σ-Algebra A gehörendes Ereignis. Mit P(A) bezeichnet man die Wahrscheinlichkeit des Ereignisses A oder auch die Wahrscheinlichkeit dafür, dass das Ereigniss A eintritt. Ist X eine auf diesem Raum definierte Zufallsvariable und B eine BorelMenge der Geraden, so gehört das Ereignis X −1 (B) = {ω ∈ Ω : X(ω) ∈ B} zu A. Man bezeichnet dieses Ereignis auch mit {X ∈ B} und seine Wahrscheinlichkeit P{X ∈ B} ist dementsprechend die Wahrscheinlichkeit dafür, dass X in B liegt. Je nach Gestalt der Menge B sind verschiedene Schreibweisen gebräuchlich. So schreibt man P{X = b} an Stelle von P{X ∈ {b}}, sowie P{X ≤ b} an Stelle von P{X ∈] − ∞, b]}. Gelesen wird dies als die Wahrscheinlichkeit dafür, dass X gleich b ist, beziehungsweise die Wahrscheinlichkeit dafür, dass X kleiner oder gleich b ist. Ist entsprechend (An ) eine Folge von Ereignissen aus A, so schreibt man oft P(A1 , A2 , . . . , An ) statt P(A1 ∩ A2 ∩ · · · ∩ An ) und liest dies als die Wahrscheinlichkeit, dass die Ereignisse A1 , A2 , . . . , An gleichzeitig eintreten. Sind schliesslich X1 und X2 zwei auf demselben Wahrscheinlichkeitsraum (Ω, A, P) definierte Zufallsvariable, so schreibt man P{X1 ≤ b1 , X2 ≤ b2 } an Stelle von P(X1−1 ( ] − ∞, b1 ] ∩ X2−1 ( ] − ∞, b2 ] ) und liest dies als die Wahrscheinlichkeit dafür, dass X1 kleiner oder gleich b1 und X2 kleiner oder gleich b2 ist. 4. Die Verteilung einer Zufallsvariablen. — Der Begriff der Zufallsvariablen erlaubt es, den messbaren Raum (Rn , Bn ) mit einer Wahrscheinlichkeitsverteilung auszustatten, wie das im folgenden Satz zum Ausdruck kommt. Satz 4.1. — Es sei X : (Ω, A, P) → (Rn , Bn ) eine n-dimensionale Zufallsvariable. Dann ist die Abbildung PX : Bn → [0, 1], die jeder BorelMenge B des Bn den Wert PX (B) = P X −1 (B) zuordnet, eine Wahrscheinlichkeitsverteilung auf (Rn , Bn ). 58 KAPITEL 5: ZUFALLSVARIABLE Die so definierte Wahrscheinlichkeitsverteilung PX heisst Verteilung der Zufallsvariablen X. Sie wird gelegentlich auch als L(X), d.h. “lex” oder “loi” von X bezeichnet. Man sagt auch: X hat die Verteilung PX . Beweis. — Da für jede Borel-Menge B das inverse Bild X −1 (B) zu A n gehört, obige Definition von PX sinnvoll. Ausserdem ist PX (R ) = −1 istn die P X (R ) = P(Ω) = 1. Ist schliesslich (Bn) eine Folge von paar −1 = P X = B B weise disjunkten Borel-Mengen, so gilt P X n n n n −1 −1 P X (B ) = P X (B ) = P (B ). n n n n n n X Mit den gleichen Bezeichnungen wie eben hat man also P{X ∈ B} = P X −1 (B) = PX (B). Andererseits ist der Raum (Rn , Bn , PX ) nun ein neuer Wahrscheinlichkeitsraum. Es ist daher angebracht, die zugrunde liegende Verteilung zu präzisieren, wenn man von der Wahrscheinlichkeit eines Ereignisses spricht. Bemerkung 1. — Der Begriff der Verteilung ist aus folgendem Grund von fundamentaler Bedeutung: jeder Wahrscheinlichkeitsverteilung P auf dem Raum (Rn , Bn ) kann man einen Wahrscheinlichkeitsraum (Ω, A, P) und eine Zufallsvariable X : (Ω, A, P) → (Rn , Bn ) derart zuordnen, dass die Verteilung PX von X genau P ist. In der Tat, man nehme Ω = Rn , A = Bn , P = P und als X die identische Abbildung von Ω. Man kann also davon sprechen, dass eine Zufallsvariable X eine Verteilung PX hat, ohne den Wahrscheinlichkeitsraum (Ω, A, P) genau zu spezifizieren, auf dem X definiert ist. Das läuft darauf hinaus, den Wahrscheinlichkeitsraum (Rn , Bn , PX ) quasi autonom zu untersuchen, wobei man von dem Mechanismus abstrahiert, der zu X geführt hat. Man befindet sich also in dem Bereich der Phänomenologie, da Rn der Bereich der beobachteten Werte von X ist, wobei sich die ganze Information über das Zufallsverhalten von X in der Verteilung PX auf (Rn , Bn ) konzentriert. Diese Sichtweise, bei der die Verteilungen im Vordergrund stehen, wird oft eingenommen, insbesondere in elementaren Darstellungen der Wahrscheinlichkeitstheorie. Das ist umso mehr gerechtfertigt, als es für die Berechnung der typischen Kennzahlen einer Zufallsvariablen (Erwartungswert, Varianz, Median,. . . ) genügt, den Wahrscheinlichkeitsraum (Rn , Bn , PX ) zu kennen. Bemerkung 2. — Die Verteilung PX ist das Bild des Masses P unter der Abbildung X. Man schreibt dies auch als X(P), was folgenden Vorteil hat: wenn man die Verteilung von f ◦ X betrachtet, so kann man wegen der Transitivität der Bildmasse einfach (f ◦ X)(P) = f (X(P)) schreiben. 5. DIE VERTEILUNGSFUNKTION EINER REELLEN ZUFALLSVARIABLEN 59 5. Die Verteilungsfunktion einer reellen Zufallsvariablen. — Es sei (Ω, A, P) ein Wahrscheinlichkeitsraum und X : (Ω, A, P) → (R, B1 ) eine reelle Zufallsvariable. Als Verteilungsfunktion von X bezeichnet man diejenige Funktion, die jeder reellen Zahl x die folgendermassen definierte Zahl F(x) zuordnet: F(x) = P{X ≤ x} = PX ( ] − ∞, x] ). Satz 5.1. — Die Verteilungsfunktion F einer reellen Zufallsvariablen X hat folgende Eigenschaften: (i) 0 ≤ F(x) ≤ 1; (ii) F ist eine (im schwachen Sinne) monoton wachsende Funktion, die in jedem Punkt x von R rechtsseitig stetig ist; (iii) lim F(x) = 0 und lim F(x) = 1. x→−∞ x→+∞ Beweis. — Die Eigenschaft (i) ist offensichtlich. Seien nun x und x zwei reelle Zahlen mit x ≤ x . Dann gilt ] − ∞, x] ⊂] − ∞, x ] und somit PX ( ] − ∞, x] ) ≤ PX ( ] − ∞, x ] ), das heisst aber F(x) ≤ F(x ). Sei nun (n ) eine absteigende Folge von reellen Zahlen, die gegen 0 konvergiert. (Das wird abgekürzt mit: n ↓ 0.) Für jedes reelle x gilt dann PX ( ]x, x + n ] ) = PX ( ] − ∞, x + n ] ) − PX ( ] − ∞, x] ) = F(x + n ) − F(x). Wegen ]x, x + n ] ↓ ∅ ist aber limn PX ( ]x, x + n ] ) = 0 und somit F(x + 0) = F(x). Entsprechend ist ] − ∞, −n] ↓ ∅ und folglich limx→−∞ F(x) = limn PX ( ] − ∞, −n] ) = PX (limn ( ] − ∞, −n] ) = 0. Schliesslich gilt ] − ∞, n] ↑ R und somit limx→+∞ F(x) = limn PX ( ] − ∞, n] ) = PX (limn ( ] − ∞, n] ) = PX (R) = 1. Bemerkung. — Es ist oft bequem, jede reelle Funktion F, welche die in (i), (ii) und (iii) von Satz 5.1 beschriebenen Eigenschaften hat, als Verteilungsfunktion (auf der reellen Geraden) zu bezeichen. Satz 5.1 hat eine Umkehrung, die in Kapitel 10 (Theorem 3.1) bewiesen wird und die wir hier in der folgenden Form festhalten. Satz 5.2. — Zu jeder Verteilungsfunktion F gehört genau eine Wahrscheinlichkeitsverteilung auf P auf (R, B1 ), so dass P( ] − ∞, x] ) = F(x) für alle reellen x gilt. Bemerkung. — Man kann auch jedem n-dimensionalen Vektor X = (X1 , X2 , . . . , Xn ) von Zufallsvariablen eine Verteilungsfunktion F zuordnen. Man definiert F(x1 , x2 , . . . , xn ) = P{X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn }, und erhält auf diese Weise eine von n Variablen abhängige reelle Funktion mit Werten in [0, 1]. Die Eigenschaften einer solchen (gemeinsamen) Verteilungsfunktion werden in Aufgabe 11 behandelt. 60 KAPITEL 5: ZUFALLSVARIABLE 6. Die Punktgewichte und die Unstetigkeiten der Verteilungsfunktion. — Es sei X : (Ω, A, P) → (R, B1 ) eine reelle Zufallsvariable und F deren Verteilungsfunktion. Da für jedes x ∈ R die Menge {x} zu B1 gehört, ist P{X = x} für jedes x definiert. Definition. — Als Punktgewicht von X bezeichnet man die durch π(x) = P{X = x} definierte Abbildung π(.) : R → R+ Satz 6.1. — Das Punktgewicht π(.) ist vollständig durch die Verteilung (und damit auch durch die Verteilungsfunktion F ) bestimmt. Für jedes x ∈ R gilt π(x) = F(x) − F(x − 0) = F(x + 0) − F(x − 0). Die Zahl π(x) ist die Sprunghöhe von F in x. Beweis. — Es sei x ∈ R und (xn )n≥1 eine wachsende Folge von reellen Zahlen derart, dass xn < x (n ≥ 1) gilt, sowie xn ↑ x. Für alle n ≥ 1 hat man dann die Beziehung ]−∞, x] = ]−∞, xn ] ∪ ]xn , x] , aus der für die Wahrscheinlichkeiten PX beider Seiten F(x) = F(xn ) + PX ( ]xn , x] ) folgt. Beim Grenzübergang n → ∞ sieht man, (i) dass die Folge (F(xn ))n≥1 monoton wachsend und beschränkt ist, also gegen einen Grenzwert konvergiert, der mit F(x − 0) bezeichnet wird; (ii) dass die Folge der Mengen ( ]xn , x] )n≥1 monoton absteigend ist, mit Limes n≥1 ]xn , x] = {x}; daher hat man limn PX ( ]xn , x] ) = PX ({x}) = PX {X = x} = π(x). Zusammen genommen ergibt sich also F(x) = F(x − 0) + π(x). Satz 6.2. — Es sei X eine Zufallsvariable und F ihre Verteilungsfunktion, sowie π(.) das zugehörige Punktgewicht. Es sei DX = {x ∈ R : π(x) > 0}. Dann gilt: a) Die Funktion F ist im Punkt x ∈ R genau dann stetig, wenn π(x) = 0 ist. b) Die Funktion F ist stetig in ganz R genau dann, wenn DX = ∅; man sagt dann auch, die Verteilung von X sei diffus . c) Die Menge DX ist endlich oder abzählbar; anders formuliert: die Menge der Unstetigkeitsstellen von F ist endlich oder abzählbar. Beweis. — Die Eigenschaften a) und b) sind klar; zum Beweis von c) setzen wir An = {x ∈ R : π(x) ≥ 1/n}. Da π(x) die Sprunghöhe von F im Punkt x ist und da F wachsend ist, mit Totalvariation gleich 1, kann die 7. ERZEUGTE σ-ALGEBRA EINER ZUFALLSVARIABLEN 61 Menge An höchstens n Elemente enthalten. Nun ist aber DX = n≥1 An . Da endliche oder abzählbare Vereinigung von endlichen oder abzählbaren Mengen wiederum endlich oder abzählbar ist, ist auch diese Eigenschaft gezeigt. Definition. — Es sei X eine reelle Zufallsvariable und π(.) ihr Punktgewicht. Da DX endlich oder abzählbar ist, ist es sinnvoll, die Summe x∈DX π(x) zu betrachten. Falls diese Summe gleich 1 ist, bezeichnet man X als diskrete Zufallsvariable und die Menge DX als deren Träger, in der Folge mit SX bezeichnet. Bemerkung. — Der Träger einer diskreten Zufallsvariablen kann sogar überall dicht sein, zum Beispiel SX = Q. In diesem Fall kann die Verteilungsfunktion nicht mehr als eine einfache Treppenfunktion dargestellt werden (cf. Aufgabe 7). Satz 6.3. — Es sei X eine Zufallsvariable und PX deren Verteilung, F die Verteilungsfunktion und π(.) das Punktgewicht. Dann gelten für −∞ < a < b < +∞ folgende Beziehungen: PX ( ] − ∞, a] ) = F(a) ; PX ( ] − ∞, a[ ) = F(a − 0) = F(a) − π(a) ; PX ( ]a, +∞[ ) = 1 − F(a) ; PX ( [a, +∞[ ) = 1 − F(a − 0) = 1 − F(a) + π(a) ; PX ( ]a, b] ) = F(b) − F(a) ; PX ( [a, b] ) = F(b) − F(a − 0) = F(b) − F(a) + π(a) ; PX ( ]a, b[ ) = F(b − 0) − F(a) = F(b) − F(a) − π(a) ; PX ( [a, b[ ) = F(b − 0) − F(a − 0) = F(b) − F(a) − π(b) − π(a) . Es sollte keine Schwierigkeiten bereiten, dies nachzuvollziehen. 7. Von einer Zufallsvariablen erzeugte σ-Algebra. — Es sei X eine n-dimensionale Zufallsvariable, definiert auf einem Raum (Ω, A, P). Man bezeichnet dann als die von X erzeugte σ-Algebra, notiert mit σ(X), die kleinste in A enthaltene σ-Algebra, bezüglich der X noch messbar ist. SATZ 7.1. — Es ist σ(X) = X −1 (Bn ). Beweis. — Aus der Definition der Messbarkeit alleine folgt schon, dass X bezüglich einer Unter-σ-Algebra T von A genau dann messbar ist, wenn X −1 (Bn ) ⊂ σ gilt. Speziell ist X −1 (Bn ) ⊂ σ(X), aber die umgekehrte Inklusion gilt auch, denn bezüglich X −1 (Bn ) ist X offensichtlich messbar. 62 KAPITEL 5: ZUFALLSVARIABLE ERGÄNZUNGEN UND ÜBUNGEN 1. — Man drücke die Indikatorfunktionen von A1 ∪ A2 , A1 ∩ A2 , A1 \ A2 , A1 ∆ A2 (symmetrische Differenz), lim supn An , lim inf n An mit Hilfe der Indikatorfunktionen von A1 , A2 , An , (n ≥ 1) aus. 2. — Man zeige, dass eine auf einem messbaren Raum (Ω, A) definierte reellwertige Funktion X genau dann messbar ist, wenn für jedes rationale r die Menge {ω ∈ Ω : X(ω) ≤ r} zu A gehört. 3. — Es sei (Xn ) eine Folge von messbaren Funktionen, definiert auf einem messbaren Raum (Ω, A). Man zeige, dass die Menge der Elemente ω von Ω, für welche die Folge (Xn (ω)) konvergiert, eine messbare Menge ist. 4. — Es sei Ha die Verteilungsfunktion einer in einem Punkt konzentrierten Wahrscheinlichkeitsverteilung a auf der Geraden R. Man beschreibe Ha explizit ( H wie Heaviside). 5. — Es seien a und b zwei reelle Zahlen. Man bestimme die Verteilungsfunktion von Y = aX + b. 6. — Es sei F eine stetige Verteilungsfunktion und h eine positive Zahl. Man zeige, dass dann auch 1 x+h F(t) dt Φh (x) = h x eine Verteilungsfunktion ist. 7. — Es sei (an )n≥1 eine Abzählung der Menge Q der rationalen Zahlen. Man betrachte eine diskrete Zufallsvariable X, deren Träger SX gerade Q ist und deren Punktgewicht gegeben ist durch: π(x) = 0, falls x ∈ R \ Q und π(an ) = 1/2n für an ∈ Q (n ≥ 1). Die Verteilungsfunktion F von X ist durch 1 1 = Ha (x) F(x) = P{X ≤ x} = 2n 2n n an ≤x n≥1 gegeben. Dann hat F alle geforderten Eigenschaften einer Verteilungsfunktion und ihre Unstetigkeitsstellen sind genau die rationalen Zahlen. 8. a) Es sei X eine Zufallsvariable mit einer stetigen und streng monoton wachsenden Verteilungsfunktion F. Man zeige, dass dann die Zufallsvariable U = F ◦ X als Verteilungsfunktion die Funktion G hat, die durch 0, falls u < 0; (E) G(u) = u, falls 0 ≤ u ≤ 1; 1, falls1 < u gegeben ist. ERGÄNZUNGEN UND ÜBUNGEN 63 b) Es bezeichne nun U eine Zufallsvariable, deren Verteilungsfunktion G durch (E) gegeben ist. Sei anderereits F eine Verteilungsfunktion, für die man mit F−1 die verallgemeinerte Inverse (im Sinne von Paul Lévy) bezeichnet: F−1 (x) = sup{y : F(y) ≤ x}. Man zeige, dass die Zufallsvariable X = F−1 ◦ U gerade F als Verteilungsfunktion hat. 9. — Es sei X eine reelle Zufallsvariable derart, dass X und 2X die gleiche Verteilungsfunktion F haben. Man bestimme F; was kann man über X sagen? 10. — Es sei X = (X1 , X2 ) ein zweidimensionaler Zufallsvektor, dessen Werte sämtlich auf der ersten Winkelhalbierenden liegen. Man zeige, dass die gemeinsame Verteilungsfunktion F(x1 , x2 ) von folgender Gestalt ist: F(x1 , x2 ) = h[min(x1 , x2 )], wobei h(.) eine reellwertige Funktion ist. Gilt auch eine Umkehrung dieser Aussage? 11. — Es sei X = (X1 , . . . , Xn ) ein n-dimensionaler Zufallsvektor, der auf einem Wahrscheinlichkeitsraum (Ω, A, P) definiert ist. Man definiert dessen Verteilungsfunktion als diejenige Abbildung F, die jeder Folge reeller Zahlen (x1 , . . . , xn ) den Wert P{X1 ≤ x1 , . . . , Xn ≤ xn } zuordnet. Man beweise folgende Aussagen: (i) F ist eine monoton wachsende und in jedem ihrer Argumente x1 , . . . , xn rechtsseitig stetige Funktion. (ii) Der Grenzwert lim F(x1 , . . . , xn ) ist gleich 0, wenn mindestens eine der Variablen xi gegen −∞ strebt, und er ist gleich 1, wenn alle Variablen xi gegen +∞ streben. (iii) Es sei G(x1 , . . . , xn ) eine reelle Funktion von n reellen Variablen. Für reelles h wird das Inkrement der Funktion G, das durch das Inkrement h der Variablen xi verursacht wird, definiert durch: (i) ∆h G(x1 , . . . , xn ) = G(x1 , . . . , xi + h, . . . , xn ) − G(x1 , . . . , xi , . . . , xn ). Man zeige, dass für jede Folge (h1 , . . . , hn ) von reellen positiven Zahlen und für jede Folge (x1 , . . . , xn ) von reellen Zahlen folgende Ungleichung gilt (1) (n) ∆h1 · · · ∆hn F(x1 , . . . , xn ) ≥ 0. 64 KAPITEL 5: ZUFALLSVARIABLE