Wahrscheinlichkeitsrechnung - Beck-Shop

Grundstudium Mathematik
Wahrscheinlichkeitsrechnung
Bearbeitet von
Dominique Foata, Aime Fuchs
1. Auflage 1999. Taschenbuch. xv, 383 S. Paperback
ISBN 978 3 7643 6169 3
Format (B x L): 17 x 24,4 cm
Gewicht: 783 g
Wirtschaft > Betriebswirtschaft: Theorie & Allgemeines > Wirtschaftsmathematik und statistik
Zu Inhaltsverzeichnis
schnell und portofrei erhältlich bei
Die Online-Fachbuchhandlung beck-shop.de ist spezialisiert auf Fachbücher, insbesondere Recht, Steuern und Wirtschaft.
Im Sortiment finden Sie alle Medien (Bücher, Zeitschriften, CDs, eBooks, etc.) aller Verlage. Ergänzt wird das Programm
durch Services wie Neuerscheinungsdienst oder Zusammenstellungen von Büchern zu Sonderpreisen. Der Shop führt mehr
als 8 Millionen Produkte.
KAPITEL
5
ZUFALLSVARIABLE
Das in den vorangegangenen Kapiteln beschriebene Modell reicht nicht mehr
aus, wenn es darum geht, solche vom Zufall abhängige Grössen oder Zustände
zufälliger Systeme zu beschreiben, die sich mit der Zeit ändern. Hierfür muss
man auf dem Wahrscheinlichkeitsraum deﬁnierte Funktionen betrachten. In
der traditionellen Terminologie, die wir auch hier verwenden werden, heissen
solche Funktionen Zufallsvariable. Dabei handelt es sich um Funktionen im
üblichen Sinne, die reelle Werte oder Werte in Rn annehmen. Dieses Kapitel
ist der formalen Deﬁnition von Zufallsvariablen gewidmet, nachdem zuvor
einige technische Details über inverse Abbildungen und Eigenschaften von
messbaren Funktionen geklärt worden sind.
1. Inverse Abbildungen. — Die inverse Abbildung X −1 zu einer
Abbildung X : E → F ist eine Abbildung von der Potenzmenge P(F ) in
die Menge P(E), die jeder Teilmenge B von F die mit X −1 (B) bezeichnete
Teilmenge von E zuordnet, die gerade aus denjenigen Elementen e von E
besteht, für die X(e) zu B gehört. Die Menge X −1 (B) = {e ∈ E : X(e) ∈ B}
heisst inverses Bild von B.
Grundlegend ist die (hier nicht nochmals bewiesene) Tatsache, dass die
inverse Abbildung X −1 mit allen elementaren Mengenoperationen verträglich
ist. Anders formuliert: falls Bn (mit oder ohne Index) eine Teilmenge von F
bezeichnet, so gelten die folgenden Aussagen:
c
X −1 (F ) = E,
X −1 (B c ) = X −1 (B) ,
X −1 (∅) = ∅,
−1
−1
−1
Bn =
X (Bn ),
X
Bn =
X −1 (Bn ).
X
n
n
n
n
Speziell ist das inverse Bild einer Vereinigung von paarweise disjunkten
Mengen wiederum
eine Vereinigung von paarweise disjunkten Mengen. Mit
der Notation
für disjunkte Vereinigungen gilt also
X −1
Bn =
X −1 (Bn ).
n
n
Erwartungsgemäss sind inverse Abbildungen auch mit algebraischen Strukturen auf den zugrunde liegenden Mengen verträglich, so etwa speziell mit
54
KAPITEL 5: ZUFALLSVARIABLE
der Eigenschaft, eine σ-Algebra zu sein, was im folgenden Satz zum Ausdruck
kommt.
Satz 1.1. — Es sei (F, F) ein messbarer Raum und X : E → F eine
Abbildung. Dann bildet die Mengenfamilie X −1 (F) = {X −1 (B) : B ∈ F} eine
σ-Algebra auf E.
Beweis. — In der Tat: da E gleich X −1 (F ) und da F zu F gehört, hat
jeder Menge B aus F gehört auch
man zunächst einmalE ∈ X −1
c(F). Mit
c
−1
−1
(Bn )
B zu F. Folglich gilt X (B) = X (B c ) ∈ X −1 (F). Ist schliesslich
−1
eine Familie
von Mengen, die alle zu F gehören, so hat man n X (Bn ) =
X −1 ( n Bn ) ∈ X −1 (F).
Der folgende Satz sagt aus, dass die inverse Abbildung auch mit der
Erzeugung von σ-Algebren verträglich ist.
Satz 1.2. — Es sei X : E → F eine Abbildung
und
C eine Familie von
Teilmengen von F . Dann gilt σ(X −1 C) = X −1 σ(C) , wobei σ(C) die von
C erzeugte σ-Algebra bezeichnet.
Beweis. — Zunächst gilt C ⊂ σ(C), und daher auch X −1 (C) ⊂ X −1 σ(C) .
Die rechts stehende Mengenfamilie ist aber
Satz eine
vorangehendem
−1gemäss
−1
σ(C) .
σ-Algebra, deshalb gilt die Inklusion σ X (C) ⊂ X
Bezeichne nun F die
Familie
derjenigen
Teilmengen
B
von
F, deren inverse
−1 −1
−1
Bilder X (B) zu σ X (C) gehören. Dann gilt X (F) ⊂ σ X −1 (C) . Wir
zeigen nun, dass F tatsächlich
in F ist:
eine σ-Algebra
(i) Es ist X −1 (F ) = E ∈ σ X −1 (C) , daher gilt F ∈ F.
(ii) Ist (B
n ) eine Folge
F, so gilt
von Mengen aus
X −1 ( n Bn ) = n X −1 (Bn ) ∈ σ X −1 (C) , und daher n Bn ∈ F.
c
(iii) Gehört B zu F, so gehört X −1 (B c ) = X −1 (B) zu σ X −1 (C) und
daher gilt B c ∈ F.
Nun ist noch festzustellen, dass F insbesondere C umfasst, also auch σ(C).
Folglich ist
σ X −1 (C) ⊃ X −1 (F) ⊃ X −1 σ(C).
Damit ist gezeigt, dass die beiden σ-Algebren σ X −1 (C) und X −1 (σ C)
identisch sind.
2. Messbare Funktionen
Deﬁnition. — Es seien (E, E) und (F, F) zwei messbare Räume. Eine
Abbildung X : E → F wird als messbare Funktion von (E, E) in (F, F)
bezeichnet, wenn X −1 (F) eine Unter-σ-Algebra von E ist. Ist speziell
(F, F) = (R, B1 ), so spricht man einfacher von einer messbaren Funktion
auf (E, E).
2. MESSBARE FUNKTIONEN
55
Im folgenden Satz wird gezeigt, dass man zum Nachweis der Messbarkeit
einer Funktion nicht alle Elemente der σ-Algebra F überprüfen muss, sondern
dass man sich dabei auf eine Familie beschränken kann, die F erzeugt.
Satz 2.1. — Es seien (E, E) und (F, F) zwei messbare Räume. Eine
Abbildung X : E → F ist bereits dann eine messbare Funktion von (E, E) in
(F, F), wenn es eine Klasse C von Teilmengen von F gibt, die F erzeugt und
für die X −1 (C) ⊂ E gilt.
−1
Beweis. — In der Tat, wenn
der
E enthalten ist,
σ-Algebra
−1X (C) in −1
σ(C) (nach Satz 1.2) in F
so ist auch die σ-Algebra σ X (C) = X
−1
enthalten. Damit gilt X (F) ⊂ F und X ist messbar.
Wie früher gezeigt, wird die Borel-σ-Algebra B1 von R von der Familie der
oﬀenen Intervalle (bzw. der Halbgeraden, etc.) erzeugt. Aus vorangehendem
Satz folgt also: will man die Messbarkeit einer auf einem messbaren Raum
(E, E) deﬁnierten reellwertigen Funktion nachweisen, so genügt es zu zeigen,
dass für jedes Paar (a, b) reeller Zahlen mit a < b die Menge X −1 ( ]a, b[ ) zu E
gehört. Analog würde es auch genügen, für jede reelle Zahl a nachzuweisen,
dass das inverse Bild X −1 ( ] − ∞, a] ) zu E gehört, etc.
Die Aussagen des folgenden Satzes ergeben sich aus Satz 1.2. Auf einen
Beweis wird hier verzichtet
Satz 2.2. — Ist (E, E) ein messbarer Raum und λ eine reelle Zahl, sind
X, Y (mit oder ohne Index) messbare Funktionen auf (E, E), so sind auch
|X|, X + Y , λX, X · Y , lim supn Xn , lim inf n Xn , supn Xn , inf n Xn messbare
Funktionen (vorausgesetzt, diese Operationen liefern wieder Funktionen mit
endlichen numerischen Werten).
Ist ausserdem X = 0, so ist auch 1/X messbar. Ist schliesslich Xn eine
Folge, die für jeden Punkt von E gegen einen endlichen Wert konvergiert, so
ist auch X = limn Xn eine messbare Funktion.
Man kann diese Aussagen auch dahingehend zusammenfassen, dass man
feststellt: die Messbarkeit bleibt unter den üblichen Operationen der Analysis
erhalten. Konstante Funktionen sind oﬀensichtlich messbar. In Bezug auf
stetige Funktionen gilt die folgende Aussage.
Satz 2.3. — Es sei E ein topologischer Raum und E die von den
oﬀenen Mengen von E erzeugte σ-Algebra. Dann ist jede stetige Funktion
X : (E, E) → (R, B1 ) auch messbar.
Beweis. — Es bezeichne O dieFamilie der
Mengen
von R. Dann
oﬀenen
−1
−1
−1
σ(O) ⊂ E. Wegen
gilt X (O) ⊂ E und somit σ X (O) = X
σ(O) = B1 ist also X −1 (B1 ) in E enthalten, d.h. X ist messbar.
Im nächsten Satz werden wir die Messbarkeit einer Funktion mit Werten
in Rn zur Messbarkeit ihrer Koordinatenfunktionen in Bezug setzen.
56
KAPITEL 5: ZUFALLSVARIABLE
Satz 2.4. — Es seien (E, E) ein messbarer Raum und X = (X1 , . . . , Xn )
eine Abbildung von E in Rn . X ist eine messbare Funktion von (E, E) in
(Rn , Bn ) genau dann, wenn für alle i = 1, . . . , n die Koordinatenfunktion
Xi : E → R eine messbare Funktion von (E, E) in (R, B) ist.
Beweis. — Es sei (B1 , . . . , Bn ) eine Folge von n Borel-Mengen
der reellen
Geraden. Dann ist deren cartesisches Produkt B = i Bi eine Borel-Menge
von Rn . Ausserdem ist X −1 (B) = i Xi−1 (Bi ). Falls X messbar ist, so
können wir irgendeine ganze Zahl i im Intervall [1, n] auswählen und Bi =
[ai , bi [ sowie Bj = R für alle j = i setzen. Dann ist X −1 (B) = Xi−1 ( [ai, bi [ )
und damit gehört Xi−1 ( [ai , bi [ ) zu E. Folglich ist Xi (gemäss Satz 2.1)
messbar.
Sind umgekehrt alle Koordinatenfunktionen Xi messbar, so kann man
Bi = [ai , bi [ (i = 1, . . . , n) wählen. Die Menge B ist dann ein Rechteck in
Rn und X −1 (B) gehört zu E. Damit hat man X −1 (Bn ) ⊂ E. Somit ist die
Funktion X, wiederum gemäss Satz 2.1, ebenfalls messbar.
Der folgende Satz wird ohne Beweis zitiert.
Satz 2.5. — Es seien (E, E) ein messbarer Raum, X : (E, E) → (Rn , Bn )
und f : (Rn , Bn ) → (R, B1 ) zwei messbare Funktionen. Dann ist auch f ◦ X
eine messbare Funktion.
Der Begriﬀ der Indikatorfunktion eines Ereignisses ist im Abschnitt 3.3
von Kapitel 1 eingeführt worden. Man achte darauf, die Indikatorfunktion IA
eines Ereignisses A, das zu einer σ-Algebra A auf einer Menge Ω gehört, nicht
mit dem singulären Mass ω zu verwechseln, welches eine auf A deﬁnierte
Funktion von Mengen ist. Gleichwohl hat man folgende Beziehung
IA (ω) = ω (A),
für alle ω ∈ Ω und A ∈ A.
Die folgende Aussage ist oﬀensichtlich und wird daher ohne Beweis angegeben.
Satz 2.6. — Es sei (Ω, A) ein messbarer Raum. Die Indikatorfunktion IA
einer Teilmenge A von Ω ist genau dann messbar, wenn A zu A gehört.
3. Zufallsvariable
Deﬁnition. — Ist ein Wahrscheinlichkeitsraum (Ω, A, P) gegeben, so bezeichnet man jede messbare Funktion von (Ω, A) in (R, B1 ) (bzw. in (Rn , Bn ))
als reelle Zufallsvariable (bzw. als Zufallsvariable mit Werten in Rn oder ndimensionale Zufallsvariable).
Aus dem eben Gesagten ergibt sich, dass eine reelle (bzw. n-dimensionale)
Zufallsvariable eine Abbildung von Ω in R (bzw. in Rn ) ist, bei der für jedes
reelle a (bzw. jede Folge (a1 , . . . , an ) von reellen Zahlen) das inverse Bild
X −1 ( ] − ∞, a] ) (bzw. X −1 ( ] − ∞, a1 ] × · · · ×] − ∞, an] )) zu der σ-Algebra
A gehört.
4. DIE VERTEILUNG EINER ZUFALLSVARIABLEN
57
Bemerkung. — Bei der Deﬁnition der Zufallsvariablen spielt die Wahrscheinlichkeitsverteilung P als Element des Tripels (Ω, A, P) eigentlich gar
keine Rolle; nur die σ-Algebra A tritt in Erscheinung. Somit ist die Terminologie Zufallsvariable streng genommen nicht angebracht. Allerdings wird,
wie gleich anschliessend beschrieben wird, die Zufalls variable X dazu verwendet, den Wertebereich (R, B1 ) mit einer Wahrscheinlichkeitsverteilung zu
versehen.
Wahrscheinlichkeitstheoretische Terminologie. — Es sei (Ω, A, P) ein
Wahrscheinlichkeitsraum und A ein zur σ-Algebra A gehörendes Ereignis.
Mit P(A) bezeichnet man die Wahrscheinlichkeit des Ereignisses A oder auch
die Wahrscheinlichkeit dafür, dass das Ereigniss A eintritt.
Ist X eine auf diesem Raum deﬁnierte Zufallsvariable und B eine BorelMenge der Geraden, so gehört das Ereignis X −1 (B) = {ω ∈ Ω : X(ω) ∈
B} zu A. Man bezeichnet dieses Ereignis auch mit {X ∈ B} und seine
Wahrscheinlichkeit P{X ∈ B} ist dementsprechend die Wahrscheinlichkeit
dafür, dass X in B liegt.
Je nach Gestalt der Menge B sind verschiedene Schreibweisen gebräuchlich. So schreibt man P{X = b} an Stelle von P{X ∈ {b}}, sowie P{X ≤ b}
an Stelle von P{X ∈] − ∞, b]}. Gelesen wird dies als die Wahrscheinlichkeit
dafür, dass X gleich b ist, beziehungsweise die Wahrscheinlichkeit dafür, dass
X kleiner oder gleich b ist.
Ist entsprechend (An ) eine Folge von Ereignissen aus A, so schreibt man
oft P(A1 , A2 , . . . , An ) statt P(A1 ∩ A2 ∩ · · · ∩ An ) und liest dies als die
Wahrscheinlichkeit, dass die Ereignisse A1 , A2 , . . . , An gleichzeitig eintreten.
Sind schliesslich X1 und X2 zwei auf demselben Wahrscheinlichkeitsraum
(Ω, A, P) deﬁnierte Zufallsvariable, so schreibt man P{X1 ≤ b1 , X2 ≤ b2 }
an Stelle von P(X1−1 ( ] − ∞, b1 ] ∩ X2−1 ( ] − ∞, b2 ] ) und liest dies als die
Wahrscheinlichkeit dafür, dass X1 kleiner oder gleich b1 und X2 kleiner oder
gleich b2 ist.
4. Die Verteilung einer Zufallsvariablen. — Der Begriﬀ der Zufallsvariablen erlaubt es, den messbaren Raum (Rn , Bn ) mit einer Wahrscheinlichkeitsverteilung auszustatten, wie das im folgenden Satz zum Ausdruck kommt.
Satz 4.1. — Es sei X : (Ω, A, P) → (Rn , Bn ) eine n-dimensionale
Zufallsvariable. Dann ist die Abbildung PX : Bn → [0, 1], die jeder BorelMenge B des Bn den Wert
PX (B) = P X −1 (B)
zuordnet, eine Wahrscheinlichkeitsverteilung auf (Rn , Bn ).
58
KAPITEL 5: ZUFALLSVARIABLE
Die so deﬁnierte Wahrscheinlichkeitsverteilung PX heisst Verteilung der
Zufallsvariablen X. Sie wird gelegentlich auch als L(X), d.h. “lex” oder “loi”
von X bezeichnet. Man sagt auch: X hat die Verteilung PX .
Beweis. — Da für jede Borel-Menge B das inverse Bild X −1 (B) zu A
n
gehört,
obige Deﬁnition von PX sinnvoll. Ausserdem ist PX (R ) =
−1 istn die
P X (R ) = P(Ω) = 1. Ist schliesslich
(Bn) eine Folge
von paar
−1
=
P
X
=
B
B
weise
disjunkten
Borel-Mengen,
so
gilt
P
X
n
n
n
n
−1
−1
P
X
(B
)
=
P
X
(B
)
=
P
(B
).
n
n
n
n
n
n X
Mit den gleichen Bezeichnungen wie eben hat man also
P{X ∈ B} = P X −1 (B) = PX (B).
Andererseits ist der Raum (Rn , Bn , PX ) nun ein neuer Wahrscheinlichkeitsraum. Es ist daher angebracht, die zugrunde liegende Verteilung zu präzisieren, wenn man von der Wahrscheinlichkeit eines Ereignisses spricht.
Bemerkung 1. — Der Begriﬀ der Verteilung ist aus folgendem Grund von
fundamentaler Bedeutung: jeder Wahrscheinlichkeitsverteilung P auf dem
Raum (Rn , Bn ) kann man einen Wahrscheinlichkeitsraum (Ω, A, P) und eine
Zufallsvariable X : (Ω, A, P) → (Rn , Bn ) derart zuordnen, dass die Verteilung
PX von X genau P ist. In der Tat, man nehme Ω = Rn , A = Bn , P = P
und als X die identische Abbildung von Ω.
Man kann also davon sprechen, dass eine Zufallsvariable X eine Verteilung
PX hat, ohne den Wahrscheinlichkeitsraum (Ω, A, P) genau zu speziﬁzieren,
auf dem X deﬁniert ist. Das läuft darauf hinaus, den Wahrscheinlichkeitsraum (Rn , Bn , PX ) quasi autonom zu untersuchen, wobei man von dem
Mechanismus abstrahiert, der zu X geführt hat. Man beﬁndet sich also in
dem Bereich der Phänomenologie, da Rn der Bereich der beobachteten Werte
von X ist, wobei sich die ganze Information über das Zufallsverhalten von X
in der Verteilung PX auf (Rn , Bn ) konzentriert.
Diese Sichtweise, bei der die Verteilungen im Vordergrund stehen, wird oft
eingenommen, insbesondere in elementaren Darstellungen der Wahrscheinlichkeitstheorie. Das ist umso mehr gerechtfertigt, als es für die Berechnung
der typischen Kennzahlen einer Zufallsvariablen (Erwartungswert, Varianz,
Median,. . . ) genügt, den Wahrscheinlichkeitsraum (Rn , Bn , PX ) zu kennen.
Bemerkung 2. — Die Verteilung PX ist das Bild des Masses P unter der
Abbildung X. Man schreibt dies auch als X(P), was folgenden Vorteil hat:
wenn man die Verteilung von f ◦ X betrachtet, so kann man wegen der
Transitivität der Bildmasse einfach (f ◦ X)(P) = f (X(P)) schreiben.
5. DIE VERTEILUNGSFUNKTION EINER REELLEN ZUFALLSVARIABLEN
59
5. Die Verteilungsfunktion einer reellen Zufallsvariablen. — Es
sei (Ω, A, P) ein Wahrscheinlichkeitsraum und X : (Ω, A, P) → (R, B1 )
eine reelle Zufallsvariable. Als Verteilungsfunktion von X bezeichnet man
diejenige Funktion, die jeder reellen Zahl x die folgendermassen deﬁnierte
Zahl F(x) zuordnet:
F(x) = P{X ≤ x} = PX ( ] − ∞, x] ).
Satz 5.1. — Die Verteilungsfunktion F einer reellen Zufallsvariablen X
hat folgende Eigenschaften:
(i) 0 ≤ F(x) ≤ 1;
(ii) F ist eine (im schwachen Sinne) monoton wachsende Funktion, die in
jedem Punkt x von R rechtsseitig stetig ist;
(iii) lim F(x) = 0 und lim F(x) = 1.
x→−∞
x→+∞
Beweis. — Die Eigenschaft (i) ist oﬀensichtlich. Seien nun x und x
zwei reelle Zahlen mit x ≤ x . Dann gilt ] − ∞, x] ⊂] − ∞, x ] und somit
PX ( ] − ∞, x] ) ≤ PX ( ] − ∞, x ] ), das heisst aber F(x) ≤ F(x ).
Sei nun (n ) eine absteigende Folge von reellen Zahlen, die gegen 0
konvergiert. (Das wird abgekürzt mit: n ↓ 0.) Für jedes reelle x gilt dann
PX ( ]x, x + n ] ) = PX ( ] − ∞, x + n ] ) − PX ( ] − ∞, x] ) = F(x + n ) − F(x).
Wegen ]x, x + n ] ↓ ∅ ist aber limn PX ( ]x, x + n ] ) = 0 und somit F(x + 0) =
F(x).
Entsprechend ist ] − ∞, −n] ↓ ∅ und folglich
limx→−∞ F(x) = limn PX ( ] − ∞, −n] ) = PX (limn ( ] − ∞, −n] ) = 0.
Schliesslich gilt ] − ∞, n] ↑ R und somit
limx→+∞ F(x) = limn PX ( ] − ∞, n] ) = PX (limn ( ] − ∞, n] ) = PX (R) = 1.
Bemerkung. — Es ist oft bequem, jede reelle Funktion F, welche die
in (i), (ii) und (iii) von Satz 5.1 beschriebenen Eigenschaften hat, als
Verteilungsfunktion (auf der reellen Geraden) zu bezeichen.
Satz 5.1 hat eine Umkehrung, die in Kapitel 10 (Theorem 3.1) bewiesen
wird und die wir hier in der folgenden Form festhalten.
Satz 5.2. — Zu jeder Verteilungsfunktion F gehört genau eine Wahrscheinlichkeitsverteilung auf P auf (R, B1 ), so dass P( ] − ∞, x] ) = F(x) für
alle reellen x gilt.
Bemerkung. — Man kann auch jedem n-dimensionalen Vektor X =
(X1 , X2 , . . . , Xn ) von Zufallsvariablen eine Verteilungsfunktion F zuordnen.
Man deﬁniert
F(x1 , x2 , . . . , xn ) = P{X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn },
und erhält auf diese Weise eine von n Variablen abhängige reelle Funktion mit
Werten in [0, 1]. Die Eigenschaften einer solchen (gemeinsamen) Verteilungsfunktion werden in Aufgabe 11 behandelt.
60
KAPITEL 5: ZUFALLSVARIABLE
6. Die Punktgewichte und die Unstetigkeiten der Verteilungsfunktion. — Es sei X : (Ω, A, P) → (R, B1 ) eine reelle Zufallsvariable und
F deren Verteilungsfunktion. Da für jedes x ∈ R die Menge {x} zu B1 gehört,
ist P{X = x} für jedes x deﬁniert.
Deﬁnition. — Als Punktgewicht von X bezeichnet man die durch π(x) =
P{X = x} deﬁnierte Abbildung π(.) : R → R+
Satz 6.1. — Das Punktgewicht π(.) ist vollständig durch die Verteilung
(und damit auch durch die Verteilungsfunktion F ) bestimmt. Für jedes x ∈ R
gilt π(x) = F(x) − F(x − 0) = F(x + 0) − F(x − 0). Die Zahl π(x) ist die
Sprunghöhe von F in x.
Beweis. — Es sei x ∈ R und (xn )n≥1 eine wachsende Folge von reellen
Zahlen derart, dass xn < x (n ≥ 1) gilt, sowie xn ↑ x. Für alle n ≥ 1 hat
man dann die Beziehung
]−∞, x] = ]−∞, xn ] ∪ ]xn , x] ,
aus der für die Wahrscheinlichkeiten PX beider Seiten
F(x) = F(xn ) + PX ( ]xn , x] )
folgt. Beim Grenzübergang n → ∞ sieht man,
(i) dass die Folge (F(xn ))n≥1 monoton wachsend und beschränkt ist, also
gegen einen Grenzwert konvergiert, der mit F(x − 0) bezeichnet wird;
(ii) dass die Folge der Mengen ( ]xn , x] )n≥1 monoton absteigend ist, mit
Limes n≥1 ]xn , x] = {x}; daher hat man limn PX ( ]xn , x] ) = PX ({x}) =
PX {X = x} = π(x).
Zusammen genommen ergibt sich also F(x) = F(x − 0) + π(x).
Satz 6.2. — Es sei X eine Zufallsvariable und F ihre Verteilungsfunktion, sowie π(.) das zugehörige Punktgewicht. Es sei
DX = {x ∈ R : π(x) > 0}.
Dann gilt:
a) Die Funktion F ist im Punkt x ∈ R genau dann stetig, wenn π(x) = 0
ist.
b) Die Funktion F ist stetig in ganz R genau dann, wenn DX = ∅; man
sagt dann auch, die Verteilung von X sei diﬀus .
c) Die Menge DX ist endlich oder abzählbar; anders formuliert: die Menge
der Unstetigkeitsstellen von F ist endlich oder abzählbar.
Beweis. — Die Eigenschaften a) und b) sind klar; zum Beweis von c)
setzen wir An = {x ∈ R : π(x) ≥ 1/n}. Da π(x) die Sprunghöhe von F im
Punkt x ist und da F wachsend ist, mit Totalvariation gleich 1, kann die
7. ERZEUGTE σ-ALGEBRA EINER ZUFALLSVARIABLEN
61
Menge An höchstens n Elemente enthalten. Nun ist aber DX = n≥1 An .
Da endliche oder abzählbare Vereinigung von endlichen oder abzählbaren
Mengen wiederum endlich oder abzählbar ist, ist auch diese Eigenschaft
gezeigt.
Deﬁnition. — Es sei X eine reelle Zufallsvariable und π(.) ihr Punktgewicht. Da DX endlich oder abzählbar ist, ist es sinnvoll, die Summe
x∈DX π(x) zu betrachten. Falls diese Summe gleich 1 ist, bezeichnet man
X als diskrete Zufallsvariable und die Menge DX als deren Träger, in der
Folge mit SX bezeichnet.
Bemerkung. — Der Träger einer diskreten Zufallsvariablen kann sogar
überall dicht sein, zum Beispiel SX = Q. In diesem Fall kann die Verteilungsfunktion nicht mehr als eine einfache Treppenfunktion dargestellt werden (cf.
Aufgabe 7).
Satz 6.3. — Es sei X eine Zufallsvariable und PX deren Verteilung, F
die Verteilungsfunktion und π(.) das Punktgewicht. Dann gelten für −∞ <
a < b < +∞ folgende Beziehungen:
PX ( ] − ∞, a] ) = F(a) ;
PX ( ] − ∞, a[ ) = F(a − 0) = F(a) − π(a) ;
PX ( ]a, +∞[ ) = 1 − F(a) ;
PX ( [a, +∞[ ) = 1 − F(a − 0) = 1 − F(a) + π(a) ;
PX ( ]a, b] ) = F(b) − F(a) ;
PX ( [a, b] ) = F(b) − F(a − 0) = F(b) − F(a) + π(a) ;
PX ( ]a, b[ ) = F(b − 0) − F(a) = F(b) − F(a) − π(a) ;
PX ( [a, b[ ) = F(b − 0) − F(a − 0) = F(b) − F(a) − π(b) − π(a) .
Es sollte keine Schwierigkeiten bereiten, dies nachzuvollziehen.
7. Von einer Zufallsvariablen erzeugte σ-Algebra. — Es sei X
eine n-dimensionale Zufallsvariable, deﬁniert auf einem Raum (Ω, A, P). Man
bezeichnet dann als die von X erzeugte σ-Algebra, notiert mit σ(X), die
kleinste in A enthaltene σ-Algebra, bezüglich der X noch messbar ist.
SATZ 7.1. — Es ist σ(X) = X −1 (Bn ).
Beweis. — Aus der Deﬁnition der Messbarkeit alleine folgt schon, dass
X bezüglich einer Unter-σ-Algebra T von A genau dann messbar ist, wenn
X −1 (Bn ) ⊂ σ gilt. Speziell ist X −1 (Bn ) ⊂ σ(X), aber die umgekehrte Inklusion gilt auch, denn bezüglich X −1 (Bn ) ist X oﬀensichtlich messbar.
62
KAPITEL 5: ZUFALLSVARIABLE
ERGÄNZUNGEN UND ÜBUNGEN
1. — Man drücke die Indikatorfunktionen von A1 ∪ A2 , A1 ∩ A2 , A1 \ A2 ,
A1 ∆ A2 (symmetrische Diﬀerenz), lim supn An , lim inf n An mit Hilfe der
Indikatorfunktionen von A1 , A2 , An , (n ≥ 1) aus.
2. — Man zeige, dass eine auf einem messbaren Raum (Ω, A) deﬁnierte
reellwertige Funktion X genau dann messbar ist, wenn für jedes rationale r
die Menge {ω ∈ Ω : X(ω) ≤ r} zu A gehört.
3. — Es sei (Xn ) eine Folge von messbaren Funktionen, deﬁniert auf einem
messbaren Raum (Ω, A). Man zeige, dass die Menge der Elemente ω von Ω,
für welche die Folge (Xn (ω)) konvergiert, eine messbare Menge ist.
4. — Es sei Ha die Verteilungsfunktion einer in einem Punkt konzentrierten Wahrscheinlichkeitsverteilung a auf der Geraden R. Man beschreibe Ha
explizit ( H wie Heaviside).
5. — Es seien a und b zwei reelle Zahlen. Man bestimme die Verteilungsfunktion von Y = aX + b.
6. — Es sei F eine stetige Verteilungsfunktion und h eine positive Zahl.
Man zeige, dass dann auch
1 x+h
F(t) dt
Φh (x) =
h x
eine Verteilungsfunktion ist.
7. — Es sei (an )n≥1 eine Abzählung der Menge Q der rationalen Zahlen.
Man betrachte eine diskrete Zufallsvariable X, deren Träger SX gerade Q ist
und deren Punktgewicht gegeben ist durch: π(x) = 0, falls x ∈ R \ Q und
π(an ) = 1/2n für an ∈ Q (n ≥ 1). Die Verteilungsfunktion F von X ist durch
1
1
=
Ha (x)
F(x) = P{X ≤ x} =
2n
2n n
an ≤x
n≥1
gegeben. Dann hat F alle geforderten Eigenschaften einer Verteilungsfunktion
und ihre Unstetigkeitsstellen sind genau die rationalen Zahlen.
8. a) Es sei X eine Zufallsvariable mit einer stetigen und streng monoton
wachsenden Verteilungsfunktion F. Man zeige, dass dann die Zufallsvariable
U = F ◦ X als Verteilungsfunktion die Funktion G hat, die durch
0, falls u < 0;
(E)
G(u) = u, falls 0 ≤ u ≤ 1;
1, falls1 < u
gegeben ist.
ERGÄNZUNGEN UND ÜBUNGEN
63
b) Es bezeichne nun U eine Zufallsvariable, deren Verteilungsfunktion G
durch (E) gegeben ist. Sei anderereits F eine Verteilungsfunktion, für die man
mit F−1 die verallgemeinerte Inverse (im Sinne von Paul Lévy) bezeichnet:
F−1 (x) = sup{y : F(y) ≤ x}.
Man zeige, dass die Zufallsvariable X = F−1 ◦ U gerade F als Verteilungsfunktion hat.
9. — Es sei X eine reelle Zufallsvariable derart, dass X und 2X die gleiche
Verteilungsfunktion F haben. Man bestimme F; was kann man über X sagen?
10. — Es sei X = (X1 , X2 ) ein zweidimensionaler Zufallsvektor, dessen
Werte sämtlich auf der ersten Winkelhalbierenden liegen. Man zeige, dass die
gemeinsame Verteilungsfunktion F(x1 , x2 ) von folgender Gestalt ist:
F(x1 , x2 ) = h[min(x1 , x2 )],
wobei h(.) eine reellwertige Funktion ist. Gilt auch eine Umkehrung dieser
Aussage?
11. — Es sei X = (X1 , . . . , Xn ) ein n-dimensionaler Zufallsvektor, der auf
einem Wahrscheinlichkeitsraum (Ω, A, P) deﬁniert ist. Man deﬁniert dessen
Verteilungsfunktion als diejenige Abbildung F, die jeder Folge reeller Zahlen
(x1 , . . . , xn ) den Wert P{X1 ≤ x1 , . . . , Xn ≤ xn } zuordnet. Man beweise
folgende Aussagen:
(i) F ist eine monoton wachsende und in jedem ihrer Argumente x1 , . . . , xn
rechtsseitig stetige Funktion.
(ii) Der Grenzwert lim F(x1 , . . . , xn ) ist gleich 0, wenn mindestens eine der
Variablen xi gegen −∞ strebt, und er ist gleich 1, wenn alle Variablen
xi gegen +∞ streben.
(iii) Es sei G(x1 , . . . , xn ) eine reelle Funktion von n reellen Variablen. Für
reelles h wird das Inkrement der Funktion G, das durch das Inkrement
h der Variablen xi verursacht wird, deﬁniert durch:
(i)
∆h G(x1 , . . . , xn ) = G(x1 , . . . , xi + h, . . . , xn ) − G(x1 , . . . , xi , . . . , xn ).
Man zeige, dass für jede Folge (h1 , . . . , hn ) von reellen positiven Zahlen
und für jede Folge (x1 , . . . , xn ) von reellen Zahlen folgende Ungleichung
gilt
(1)
(n)
∆h1 · · · ∆hn F(x1 , . . . , xn ) ≥ 0.
64
KAPITEL 5: ZUFALLSVARIABLE