Wahrscheinlichkeitsrechnung - Beck-Shop

Werbung
Grundstudium Mathematik
Wahrscheinlichkeitsrechnung
Bearbeitet von
Dominique Foata, Aime Fuchs
1. Auflage 1999. Taschenbuch. xv, 383 S. Paperback
ISBN 978 3 7643 6169 3
Format (B x L): 17 x 24,4 cm
Gewicht: 783 g
Wirtschaft > Betriebswirtschaft: Theorie & Allgemeines > Wirtschaftsmathematik und statistik
Zu Inhaltsverzeichnis
schnell und portofrei erhältlich bei
Die Online-Fachbuchhandlung beck-shop.de ist spezialisiert auf Fachbücher, insbesondere Recht, Steuern und Wirtschaft.
Im Sortiment finden Sie alle Medien (Bücher, Zeitschriften, CDs, eBooks, etc.) aller Verlage. Ergänzt wird das Programm
durch Services wie Neuerscheinungsdienst oder Zusammenstellungen von Büchern zu Sonderpreisen. Der Shop führt mehr
als 8 Millionen Produkte.
KAPITEL
5
ZUFALLSVARIABLE
Das in den vorangegangenen Kapiteln beschriebene Modell reicht nicht mehr
aus, wenn es darum geht, solche vom Zufall abhängige Grössen oder Zustände
zufälliger Systeme zu beschreiben, die sich mit der Zeit ändern. Hierfür muss
man auf dem Wahrscheinlichkeitsraum definierte Funktionen betrachten. In
der traditionellen Terminologie, die wir auch hier verwenden werden, heissen
solche Funktionen Zufallsvariable. Dabei handelt es sich um Funktionen im
üblichen Sinne, die reelle Werte oder Werte in Rn annehmen. Dieses Kapitel
ist der formalen Definition von Zufallsvariablen gewidmet, nachdem zuvor
einige technische Details über inverse Abbildungen und Eigenschaften von
messbaren Funktionen geklärt worden sind.
1. Inverse Abbildungen. — Die inverse Abbildung X −1 zu einer
Abbildung X : E → F ist eine Abbildung von der Potenzmenge P(F ) in
die Menge P(E), die jeder Teilmenge B von F die mit X −1 (B) bezeichnete
Teilmenge von E zuordnet, die gerade aus denjenigen Elementen e von E
besteht, für die X(e) zu B gehört. Die Menge X −1 (B) = {e ∈ E : X(e) ∈ B}
heisst inverses Bild von B.
Grundlegend ist die (hier nicht nochmals bewiesene) Tatsache, dass die
inverse Abbildung X −1 mit allen elementaren Mengenoperationen verträglich
ist. Anders formuliert: falls Bn (mit oder ohne Index) eine Teilmenge von F
bezeichnet, so gelten die folgenden Aussagen:
c
X −1 (F ) = E,
X −1 (B c ) = X −1 (B) ,
X −1 (∅) = ∅,
−1
−1
−1
Bn =
X (Bn ),
X
Bn =
X −1 (Bn ).
X
n
n
n
n
Speziell ist das inverse Bild einer Vereinigung von paarweise disjunkten
Mengen wiederum
eine Vereinigung von paarweise disjunkten Mengen. Mit
der Notation
für disjunkte Vereinigungen gilt also
X −1
Bn =
X −1 (Bn ).
n
n
Erwartungsgemäss sind inverse Abbildungen auch mit algebraischen Strukturen auf den zugrunde liegenden Mengen verträglich, so etwa speziell mit
54
KAPITEL 5: ZUFALLSVARIABLE
der Eigenschaft, eine σ-Algebra zu sein, was im folgenden Satz zum Ausdruck
kommt.
Satz 1.1. — Es sei (F, F) ein messbarer Raum und X : E → F eine
Abbildung. Dann bildet die Mengenfamilie X −1 (F) = {X −1 (B) : B ∈ F} eine
σ-Algebra auf E.
Beweis. — In der Tat: da E gleich X −1 (F ) und da F zu F gehört, hat
jeder Menge B aus F gehört auch
man zunächst einmalE ∈ X −1
c(F). Mit
c
−1
−1
(Bn )
B zu F. Folglich gilt X (B) = X (B c ) ∈ X −1 (F). Ist schliesslich
−1
eine Familie
von Mengen, die alle zu F gehören, so hat man n X (Bn ) =
X −1 ( n Bn ) ∈ X −1 (F).
Der folgende Satz sagt aus, dass die inverse Abbildung auch mit der
Erzeugung von σ-Algebren verträglich ist.
Satz 1.2. — Es sei X : E → F eine Abbildung
und
C eine Familie von
Teilmengen von F . Dann gilt σ(X −1 C) = X −1 σ(C) , wobei σ(C) die von
C erzeugte σ-Algebra bezeichnet.
Beweis. — Zunächst gilt C ⊂ σ(C), und daher auch X −1 (C) ⊂ X −1 σ(C) .
Die rechts stehende Mengenfamilie ist aber
Satz eine
vorangehendem
−1gemäss
−1
σ(C) .
σ-Algebra, deshalb gilt die Inklusion σ X (C) ⊂ X
Bezeichne nun F die
Familie
derjenigen
Teilmengen
B
von
F, deren inverse
−1 −1
−1
Bilder X (B) zu σ X (C) gehören. Dann gilt X (F) ⊂ σ X −1 (C) . Wir
zeigen nun, dass F tatsächlich
in F ist:
eine σ-Algebra
(i) Es ist X −1 (F ) = E ∈ σ X −1 (C) , daher gilt F ∈ F.
(ii) Ist (B
n ) eine Folge
F, so gilt
von Mengen aus
X −1 ( n Bn ) = n X −1 (Bn ) ∈ σ X −1 (C) , und daher n Bn ∈ F.
c
(iii) Gehört B zu F, so gehört X −1 (B c ) = X −1 (B) zu σ X −1 (C) und
daher gilt B c ∈ F.
Nun ist noch festzustellen, dass F insbesondere C umfasst, also auch σ(C).
Folglich ist
σ X −1 (C) ⊃ X −1 (F) ⊃ X −1 σ(C).
Damit ist gezeigt, dass die beiden σ-Algebren σ X −1 (C) und X −1 (σ C)
identisch sind.
2. Messbare Funktionen
Definition. — Es seien (E, E) und (F, F) zwei messbare Räume. Eine
Abbildung X : E → F wird als messbare Funktion von (E, E) in (F, F)
bezeichnet, wenn X −1 (F) eine Unter-σ-Algebra von E ist. Ist speziell
(F, F) = (R, B1 ), so spricht man einfacher von einer messbaren Funktion
auf (E, E).
2. MESSBARE FUNKTIONEN
55
Im folgenden Satz wird gezeigt, dass man zum Nachweis der Messbarkeit
einer Funktion nicht alle Elemente der σ-Algebra F überprüfen muss, sondern
dass man sich dabei auf eine Familie beschränken kann, die F erzeugt.
Satz 2.1. — Es seien (E, E) und (F, F) zwei messbare Räume. Eine
Abbildung X : E → F ist bereits dann eine messbare Funktion von (E, E) in
(F, F), wenn es eine Klasse C von Teilmengen von F gibt, die F erzeugt und
für die X −1 (C) ⊂ E gilt.
−1
Beweis. — In der Tat, wenn
der
E enthalten ist,
σ-Algebra
−1X (C) in −1
σ(C) (nach Satz 1.2) in F
so ist auch die σ-Algebra σ X (C) = X
−1
enthalten. Damit gilt X (F) ⊂ F und X ist messbar.
Wie früher gezeigt, wird die Borel-σ-Algebra B1 von R von der Familie der
offenen Intervalle (bzw. der Halbgeraden, etc.) erzeugt. Aus vorangehendem
Satz folgt also: will man die Messbarkeit einer auf einem messbaren Raum
(E, E) definierten reellwertigen Funktion nachweisen, so genügt es zu zeigen,
dass für jedes Paar (a, b) reeller Zahlen mit a < b die Menge X −1 ( ]a, b[ ) zu E
gehört. Analog würde es auch genügen, für jede reelle Zahl a nachzuweisen,
dass das inverse Bild X −1 ( ] − ∞, a] ) zu E gehört, etc.
Die Aussagen des folgenden Satzes ergeben sich aus Satz 1.2. Auf einen
Beweis wird hier verzichtet
Satz 2.2. — Ist (E, E) ein messbarer Raum und λ eine reelle Zahl, sind
X, Y (mit oder ohne Index) messbare Funktionen auf (E, E), so sind auch
|X|, X + Y , λX, X · Y , lim supn Xn , lim inf n Xn , supn Xn , inf n Xn messbare
Funktionen (vorausgesetzt, diese Operationen liefern wieder Funktionen mit
endlichen numerischen Werten).
Ist ausserdem X = 0, so ist auch 1/X messbar. Ist schliesslich Xn eine
Folge, die für jeden Punkt von E gegen einen endlichen Wert konvergiert, so
ist auch X = limn Xn eine messbare Funktion.
Man kann diese Aussagen auch dahingehend zusammenfassen, dass man
feststellt: die Messbarkeit bleibt unter den üblichen Operationen der Analysis
erhalten. Konstante Funktionen sind offensichtlich messbar. In Bezug auf
stetige Funktionen gilt die folgende Aussage.
Satz 2.3. — Es sei E ein topologischer Raum und E die von den
offenen Mengen von E erzeugte σ-Algebra. Dann ist jede stetige Funktion
X : (E, E) → (R, B1 ) auch messbar.
Beweis. — Es bezeichne O dieFamilie der
Mengen
von R. Dann
offenen
−1
−1
−1
σ(O) ⊂ E. Wegen
gilt X (O) ⊂ E und somit σ X (O) = X
σ(O) = B1 ist also X −1 (B1 ) in E enthalten, d.h. X ist messbar.
Im nächsten Satz werden wir die Messbarkeit einer Funktion mit Werten
in Rn zur Messbarkeit ihrer Koordinatenfunktionen in Bezug setzen.
56
KAPITEL 5: ZUFALLSVARIABLE
Satz 2.4. — Es seien (E, E) ein messbarer Raum und X = (X1 , . . . , Xn )
eine Abbildung von E in Rn . X ist eine messbare Funktion von (E, E) in
(Rn , Bn ) genau dann, wenn für alle i = 1, . . . , n die Koordinatenfunktion
Xi : E → R eine messbare Funktion von (E, E) in (R, B) ist.
Beweis. — Es sei (B1 , . . . , Bn ) eine Folge von n Borel-Mengen
der reellen
Geraden. Dann ist deren cartesisches Produkt B = i Bi eine Borel-Menge
von Rn . Ausserdem ist X −1 (B) = i Xi−1 (Bi ). Falls X messbar ist, so
können wir irgendeine ganze Zahl i im Intervall [1, n] auswählen und Bi =
[ai , bi [ sowie Bj = R für alle j = i setzen. Dann ist X −1 (B) = Xi−1 ( [ai, bi [ )
und damit gehört Xi−1 ( [ai , bi [ ) zu E. Folglich ist Xi (gemäss Satz 2.1)
messbar.
Sind umgekehrt alle Koordinatenfunktionen Xi messbar, so kann man
Bi = [ai , bi [ (i = 1, . . . , n) wählen. Die Menge B ist dann ein Rechteck in
Rn und X −1 (B) gehört zu E. Damit hat man X −1 (Bn ) ⊂ E. Somit ist die
Funktion X, wiederum gemäss Satz 2.1, ebenfalls messbar.
Der folgende Satz wird ohne Beweis zitiert.
Satz 2.5. — Es seien (E, E) ein messbarer Raum, X : (E, E) → (Rn , Bn )
und f : (Rn , Bn ) → (R, B1 ) zwei messbare Funktionen. Dann ist auch f ◦ X
eine messbare Funktion.
Der Begriff der Indikatorfunktion eines Ereignisses ist im Abschnitt 3.3
von Kapitel 1 eingeführt worden. Man achte darauf, die Indikatorfunktion IA
eines Ereignisses A, das zu einer σ-Algebra A auf einer Menge Ω gehört, nicht
mit dem singulären Mass ω zu verwechseln, welches eine auf A definierte
Funktion von Mengen ist. Gleichwohl hat man folgende Beziehung
IA (ω) = ω (A),
für alle ω ∈ Ω und A ∈ A.
Die folgende Aussage ist offensichtlich und wird daher ohne Beweis angegeben.
Satz 2.6. — Es sei (Ω, A) ein messbarer Raum. Die Indikatorfunktion IA
einer Teilmenge A von Ω ist genau dann messbar, wenn A zu A gehört.
3. Zufallsvariable
Definition. — Ist ein Wahrscheinlichkeitsraum (Ω, A, P) gegeben, so bezeichnet man jede messbare Funktion von (Ω, A) in (R, B1 ) (bzw. in (Rn , Bn ))
als reelle Zufallsvariable (bzw. als Zufallsvariable mit Werten in Rn oder ndimensionale Zufallsvariable).
Aus dem eben Gesagten ergibt sich, dass eine reelle (bzw. n-dimensionale)
Zufallsvariable eine Abbildung von Ω in R (bzw. in Rn ) ist, bei der für jedes
reelle a (bzw. jede Folge (a1 , . . . , an ) von reellen Zahlen) das inverse Bild
X −1 ( ] − ∞, a] ) (bzw. X −1 ( ] − ∞, a1 ] × · · · ×] − ∞, an] )) zu der σ-Algebra
A gehört.
4. DIE VERTEILUNG EINER ZUFALLSVARIABLEN
57
Bemerkung. — Bei der Definition der Zufallsvariablen spielt die Wahrscheinlichkeitsverteilung P als Element des Tripels (Ω, A, P) eigentlich gar
keine Rolle; nur die σ-Algebra A tritt in Erscheinung. Somit ist die Terminologie Zufallsvariable streng genommen nicht angebracht. Allerdings wird,
wie gleich anschliessend beschrieben wird, die Zufalls variable X dazu verwendet, den Wertebereich (R, B1 ) mit einer Wahrscheinlichkeitsverteilung zu
versehen.
Wahrscheinlichkeitstheoretische Terminologie. — Es sei (Ω, A, P) ein
Wahrscheinlichkeitsraum und A ein zur σ-Algebra A gehörendes Ereignis.
Mit P(A) bezeichnet man die Wahrscheinlichkeit des Ereignisses A oder auch
die Wahrscheinlichkeit dafür, dass das Ereigniss A eintritt.
Ist X eine auf diesem Raum definierte Zufallsvariable und B eine BorelMenge der Geraden, so gehört das Ereignis X −1 (B) = {ω ∈ Ω : X(ω) ∈
B} zu A. Man bezeichnet dieses Ereignis auch mit {X ∈ B} und seine
Wahrscheinlichkeit P{X ∈ B} ist dementsprechend die Wahrscheinlichkeit
dafür, dass X in B liegt.
Je nach Gestalt der Menge B sind verschiedene Schreibweisen gebräuchlich. So schreibt man P{X = b} an Stelle von P{X ∈ {b}}, sowie P{X ≤ b}
an Stelle von P{X ∈] − ∞, b]}. Gelesen wird dies als die Wahrscheinlichkeit
dafür, dass X gleich b ist, beziehungsweise die Wahrscheinlichkeit dafür, dass
X kleiner oder gleich b ist.
Ist entsprechend (An ) eine Folge von Ereignissen aus A, so schreibt man
oft P(A1 , A2 , . . . , An ) statt P(A1 ∩ A2 ∩ · · · ∩ An ) und liest dies als die
Wahrscheinlichkeit, dass die Ereignisse A1 , A2 , . . . , An gleichzeitig eintreten.
Sind schliesslich X1 und X2 zwei auf demselben Wahrscheinlichkeitsraum
(Ω, A, P) definierte Zufallsvariable, so schreibt man P{X1 ≤ b1 , X2 ≤ b2 }
an Stelle von P(X1−1 ( ] − ∞, b1 ] ∩ X2−1 ( ] − ∞, b2 ] ) und liest dies als die
Wahrscheinlichkeit dafür, dass X1 kleiner oder gleich b1 und X2 kleiner oder
gleich b2 ist.
4. Die Verteilung einer Zufallsvariablen. — Der Begriff der Zufallsvariablen erlaubt es, den messbaren Raum (Rn , Bn ) mit einer Wahrscheinlichkeitsverteilung auszustatten, wie das im folgenden Satz zum Ausdruck kommt.
Satz 4.1. — Es sei X : (Ω, A, P) → (Rn , Bn ) eine n-dimensionale
Zufallsvariable. Dann ist die Abbildung PX : Bn → [0, 1], die jeder BorelMenge B des Bn den Wert
PX (B) = P X −1 (B)
zuordnet, eine Wahrscheinlichkeitsverteilung auf (Rn , Bn ).
58
KAPITEL 5: ZUFALLSVARIABLE
Die so definierte Wahrscheinlichkeitsverteilung PX heisst Verteilung der
Zufallsvariablen X. Sie wird gelegentlich auch als L(X), d.h. “lex” oder “loi”
von X bezeichnet. Man sagt auch: X hat die Verteilung PX .
Beweis. — Da für jede Borel-Menge B das inverse Bild X −1 (B) zu A
n
gehört,
obige Definition von PX sinnvoll. Ausserdem ist PX (R ) =
−1 istn die
P X (R ) = P(Ω) = 1. Ist schliesslich
(Bn) eine Folge
von paar
−1
=
P
X
=
B
B
weise
disjunkten
Borel-Mengen,
so
gilt
P
X
n
n
n
n
−1
−1
P
X
(B
)
=
P
X
(B
)
=
P
(B
).
n
n
n
n
n
n X
Mit den gleichen Bezeichnungen wie eben hat man also
P{X ∈ B} = P X −1 (B) = PX (B).
Andererseits ist der Raum (Rn , Bn , PX ) nun ein neuer Wahrscheinlichkeitsraum. Es ist daher angebracht, die zugrunde liegende Verteilung zu präzisieren, wenn man von der Wahrscheinlichkeit eines Ereignisses spricht.
Bemerkung 1. — Der Begriff der Verteilung ist aus folgendem Grund von
fundamentaler Bedeutung: jeder Wahrscheinlichkeitsverteilung P auf dem
Raum (Rn , Bn ) kann man einen Wahrscheinlichkeitsraum (Ω, A, P) und eine
Zufallsvariable X : (Ω, A, P) → (Rn , Bn ) derart zuordnen, dass die Verteilung
PX von X genau P ist. In der Tat, man nehme Ω = Rn , A = Bn , P = P
und als X die identische Abbildung von Ω.
Man kann also davon sprechen, dass eine Zufallsvariable X eine Verteilung
PX hat, ohne den Wahrscheinlichkeitsraum (Ω, A, P) genau zu spezifizieren,
auf dem X definiert ist. Das läuft darauf hinaus, den Wahrscheinlichkeitsraum (Rn , Bn , PX ) quasi autonom zu untersuchen, wobei man von dem
Mechanismus abstrahiert, der zu X geführt hat. Man befindet sich also in
dem Bereich der Phänomenologie, da Rn der Bereich der beobachteten Werte
von X ist, wobei sich die ganze Information über das Zufallsverhalten von X
in der Verteilung PX auf (Rn , Bn ) konzentriert.
Diese Sichtweise, bei der die Verteilungen im Vordergrund stehen, wird oft
eingenommen, insbesondere in elementaren Darstellungen der Wahrscheinlichkeitstheorie. Das ist umso mehr gerechtfertigt, als es für die Berechnung
der typischen Kennzahlen einer Zufallsvariablen (Erwartungswert, Varianz,
Median,. . . ) genügt, den Wahrscheinlichkeitsraum (Rn , Bn , PX ) zu kennen.
Bemerkung 2. — Die Verteilung PX ist das Bild des Masses P unter der
Abbildung X. Man schreibt dies auch als X(P), was folgenden Vorteil hat:
wenn man die Verteilung von f ◦ X betrachtet, so kann man wegen der
Transitivität der Bildmasse einfach (f ◦ X)(P) = f (X(P)) schreiben.
5. DIE VERTEILUNGSFUNKTION EINER REELLEN ZUFALLSVARIABLEN
59
5. Die Verteilungsfunktion einer reellen Zufallsvariablen. — Es
sei (Ω, A, P) ein Wahrscheinlichkeitsraum und X : (Ω, A, P) → (R, B1 )
eine reelle Zufallsvariable. Als Verteilungsfunktion von X bezeichnet man
diejenige Funktion, die jeder reellen Zahl x die folgendermassen definierte
Zahl F(x) zuordnet:
F(x) = P{X ≤ x} = PX ( ] − ∞, x] ).
Satz 5.1. — Die Verteilungsfunktion F einer reellen Zufallsvariablen X
hat folgende Eigenschaften:
(i) 0 ≤ F(x) ≤ 1;
(ii) F ist eine (im schwachen Sinne) monoton wachsende Funktion, die in
jedem Punkt x von R rechtsseitig stetig ist;
(iii) lim F(x) = 0 und lim F(x) = 1.
x→−∞
x→+∞
Beweis. — Die Eigenschaft (i) ist offensichtlich. Seien nun x und x
zwei reelle Zahlen mit x ≤ x . Dann gilt ] − ∞, x] ⊂] − ∞, x ] und somit
PX ( ] − ∞, x] ) ≤ PX ( ] − ∞, x ] ), das heisst aber F(x) ≤ F(x ).
Sei nun (n ) eine absteigende Folge von reellen Zahlen, die gegen 0
konvergiert. (Das wird abgekürzt mit: n ↓ 0.) Für jedes reelle x gilt dann
PX ( ]x, x + n ] ) = PX ( ] − ∞, x + n ] ) − PX ( ] − ∞, x] ) = F(x + n ) − F(x).
Wegen ]x, x + n ] ↓ ∅ ist aber limn PX ( ]x, x + n ] ) = 0 und somit F(x + 0) =
F(x).
Entsprechend ist ] − ∞, −n] ↓ ∅ und folglich
limx→−∞ F(x) = limn PX ( ] − ∞, −n] ) = PX (limn ( ] − ∞, −n] ) = 0.
Schliesslich gilt ] − ∞, n] ↑ R und somit
limx→+∞ F(x) = limn PX ( ] − ∞, n] ) = PX (limn ( ] − ∞, n] ) = PX (R) = 1.
Bemerkung. — Es ist oft bequem, jede reelle Funktion F, welche die
in (i), (ii) und (iii) von Satz 5.1 beschriebenen Eigenschaften hat, als
Verteilungsfunktion (auf der reellen Geraden) zu bezeichen.
Satz 5.1 hat eine Umkehrung, die in Kapitel 10 (Theorem 3.1) bewiesen
wird und die wir hier in der folgenden Form festhalten.
Satz 5.2. — Zu jeder Verteilungsfunktion F gehört genau eine Wahrscheinlichkeitsverteilung auf P auf (R, B1 ), so dass P( ] − ∞, x] ) = F(x) für
alle reellen x gilt.
Bemerkung. — Man kann auch jedem n-dimensionalen Vektor X =
(X1 , X2 , . . . , Xn ) von Zufallsvariablen eine Verteilungsfunktion F zuordnen.
Man definiert
F(x1 , x2 , . . . , xn ) = P{X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn },
und erhält auf diese Weise eine von n Variablen abhängige reelle Funktion mit
Werten in [0, 1]. Die Eigenschaften einer solchen (gemeinsamen) Verteilungsfunktion werden in Aufgabe 11 behandelt.
60
KAPITEL 5: ZUFALLSVARIABLE
6. Die Punktgewichte und die Unstetigkeiten der Verteilungsfunktion. — Es sei X : (Ω, A, P) → (R, B1 ) eine reelle Zufallsvariable und
F deren Verteilungsfunktion. Da für jedes x ∈ R die Menge {x} zu B1 gehört,
ist P{X = x} für jedes x definiert.
Definition. — Als Punktgewicht von X bezeichnet man die durch π(x) =
P{X = x} definierte Abbildung π(.) : R → R+
Satz 6.1. — Das Punktgewicht π(.) ist vollständig durch die Verteilung
(und damit auch durch die Verteilungsfunktion F ) bestimmt. Für jedes x ∈ R
gilt π(x) = F(x) − F(x − 0) = F(x + 0) − F(x − 0). Die Zahl π(x) ist die
Sprunghöhe von F in x.
Beweis. — Es sei x ∈ R und (xn )n≥1 eine wachsende Folge von reellen
Zahlen derart, dass xn < x (n ≥ 1) gilt, sowie xn ↑ x. Für alle n ≥ 1 hat
man dann die Beziehung
]−∞, x] = ]−∞, xn ] ∪ ]xn , x] ,
aus der für die Wahrscheinlichkeiten PX beider Seiten
F(x) = F(xn ) + PX ( ]xn , x] )
folgt. Beim Grenzübergang n → ∞ sieht man,
(i) dass die Folge (F(xn ))n≥1 monoton wachsend und beschränkt ist, also
gegen einen Grenzwert konvergiert, der mit F(x − 0) bezeichnet wird;
(ii) dass die Folge der Mengen ( ]xn , x] )n≥1 monoton absteigend ist, mit
Limes n≥1 ]xn , x] = {x}; daher hat man limn PX ( ]xn , x] ) = PX ({x}) =
PX {X = x} = π(x).
Zusammen genommen ergibt sich also F(x) = F(x − 0) + π(x).
Satz 6.2. — Es sei X eine Zufallsvariable und F ihre Verteilungsfunktion, sowie π(.) das zugehörige Punktgewicht. Es sei
DX = {x ∈ R : π(x) > 0}.
Dann gilt:
a) Die Funktion F ist im Punkt x ∈ R genau dann stetig, wenn π(x) = 0
ist.
b) Die Funktion F ist stetig in ganz R genau dann, wenn DX = ∅; man
sagt dann auch, die Verteilung von X sei diffus .
c) Die Menge DX ist endlich oder abzählbar; anders formuliert: die Menge
der Unstetigkeitsstellen von F ist endlich oder abzählbar.
Beweis. — Die Eigenschaften a) und b) sind klar; zum Beweis von c)
setzen wir An = {x ∈ R : π(x) ≥ 1/n}. Da π(x) die Sprunghöhe von F im
Punkt x ist und da F wachsend ist, mit Totalvariation gleich 1, kann die
7. ERZEUGTE σ-ALGEBRA EINER ZUFALLSVARIABLEN
61
Menge An höchstens n Elemente enthalten. Nun ist aber DX = n≥1 An .
Da endliche oder abzählbare Vereinigung von endlichen oder abzählbaren
Mengen wiederum endlich oder abzählbar ist, ist auch diese Eigenschaft
gezeigt.
Definition. — Es sei X eine reelle Zufallsvariable und π(.) ihr Punktgewicht. Da DX endlich oder abzählbar ist, ist es sinnvoll, die Summe
x∈DX π(x) zu betrachten. Falls diese Summe gleich 1 ist, bezeichnet man
X als diskrete Zufallsvariable und die Menge DX als deren Träger, in der
Folge mit SX bezeichnet.
Bemerkung. — Der Träger einer diskreten Zufallsvariablen kann sogar
überall dicht sein, zum Beispiel SX = Q. In diesem Fall kann die Verteilungsfunktion nicht mehr als eine einfache Treppenfunktion dargestellt werden (cf.
Aufgabe 7).
Satz 6.3. — Es sei X eine Zufallsvariable und PX deren Verteilung, F
die Verteilungsfunktion und π(.) das Punktgewicht. Dann gelten für −∞ <
a < b < +∞ folgende Beziehungen:
PX ( ] − ∞, a] ) = F(a) ;
PX ( ] − ∞, a[ ) = F(a − 0) = F(a) − π(a) ;
PX ( ]a, +∞[ ) = 1 − F(a) ;
PX ( [a, +∞[ ) = 1 − F(a − 0) = 1 − F(a) + π(a) ;
PX ( ]a, b] ) = F(b) − F(a) ;
PX ( [a, b] ) = F(b) − F(a − 0) = F(b) − F(a) + π(a) ;
PX ( ]a, b[ ) = F(b − 0) − F(a) = F(b) − F(a) − π(a) ;
PX ( [a, b[ ) = F(b − 0) − F(a − 0) = F(b) − F(a) − π(b) − π(a) .
Es sollte keine Schwierigkeiten bereiten, dies nachzuvollziehen.
7. Von einer Zufallsvariablen erzeugte σ-Algebra. — Es sei X
eine n-dimensionale Zufallsvariable, definiert auf einem Raum (Ω, A, P). Man
bezeichnet dann als die von X erzeugte σ-Algebra, notiert mit σ(X), die
kleinste in A enthaltene σ-Algebra, bezüglich der X noch messbar ist.
SATZ 7.1. — Es ist σ(X) = X −1 (Bn ).
Beweis. — Aus der Definition der Messbarkeit alleine folgt schon, dass
X bezüglich einer Unter-σ-Algebra T von A genau dann messbar ist, wenn
X −1 (Bn ) ⊂ σ gilt. Speziell ist X −1 (Bn ) ⊂ σ(X), aber die umgekehrte Inklusion gilt auch, denn bezüglich X −1 (Bn ) ist X offensichtlich messbar.
62
KAPITEL 5: ZUFALLSVARIABLE
ERGÄNZUNGEN UND ÜBUNGEN
1. — Man drücke die Indikatorfunktionen von A1 ∪ A2 , A1 ∩ A2 , A1 \ A2 ,
A1 ∆ A2 (symmetrische Differenz), lim supn An , lim inf n An mit Hilfe der
Indikatorfunktionen von A1 , A2 , An , (n ≥ 1) aus.
2. — Man zeige, dass eine auf einem messbaren Raum (Ω, A) definierte
reellwertige Funktion X genau dann messbar ist, wenn für jedes rationale r
die Menge {ω ∈ Ω : X(ω) ≤ r} zu A gehört.
3. — Es sei (Xn ) eine Folge von messbaren Funktionen, definiert auf einem
messbaren Raum (Ω, A). Man zeige, dass die Menge der Elemente ω von Ω,
für welche die Folge (Xn (ω)) konvergiert, eine messbare Menge ist.
4. — Es sei Ha die Verteilungsfunktion einer in einem Punkt konzentrierten Wahrscheinlichkeitsverteilung a auf der Geraden R. Man beschreibe Ha
explizit ( H wie Heaviside).
5. — Es seien a und b zwei reelle Zahlen. Man bestimme die Verteilungsfunktion von Y = aX + b.
6. — Es sei F eine stetige Verteilungsfunktion und h eine positive Zahl.
Man zeige, dass dann auch
1 x+h
F(t) dt
Φh (x) =
h x
eine Verteilungsfunktion ist.
7. — Es sei (an )n≥1 eine Abzählung der Menge Q der rationalen Zahlen.
Man betrachte eine diskrete Zufallsvariable X, deren Träger SX gerade Q ist
und deren Punktgewicht gegeben ist durch: π(x) = 0, falls x ∈ R \ Q und
π(an ) = 1/2n für an ∈ Q (n ≥ 1). Die Verteilungsfunktion F von X ist durch
1
1
=
Ha (x)
F(x) = P{X ≤ x} =
2n
2n n
an ≤x
n≥1
gegeben. Dann hat F alle geforderten Eigenschaften einer Verteilungsfunktion
und ihre Unstetigkeitsstellen sind genau die rationalen Zahlen.
8. a) Es sei X eine Zufallsvariable mit einer stetigen und streng monoton
wachsenden Verteilungsfunktion F. Man zeige, dass dann die Zufallsvariable
U = F ◦ X als Verteilungsfunktion die Funktion G hat, die durch
0, falls u < 0;
(E)
G(u) = u, falls 0 ≤ u ≤ 1;
1, falls1 < u
gegeben ist.
ERGÄNZUNGEN UND ÜBUNGEN
63
b) Es bezeichne nun U eine Zufallsvariable, deren Verteilungsfunktion G
durch (E) gegeben ist. Sei anderereits F eine Verteilungsfunktion, für die man
mit F−1 die verallgemeinerte Inverse (im Sinne von Paul Lévy) bezeichnet:
F−1 (x) = sup{y : F(y) ≤ x}.
Man zeige, dass die Zufallsvariable X = F−1 ◦ U gerade F als Verteilungsfunktion hat.
9. — Es sei X eine reelle Zufallsvariable derart, dass X und 2X die gleiche
Verteilungsfunktion F haben. Man bestimme F; was kann man über X sagen?
10. — Es sei X = (X1 , X2 ) ein zweidimensionaler Zufallsvektor, dessen
Werte sämtlich auf der ersten Winkelhalbierenden liegen. Man zeige, dass die
gemeinsame Verteilungsfunktion F(x1 , x2 ) von folgender Gestalt ist:
F(x1 , x2 ) = h[min(x1 , x2 )],
wobei h(.) eine reellwertige Funktion ist. Gilt auch eine Umkehrung dieser
Aussage?
11. — Es sei X = (X1 , . . . , Xn ) ein n-dimensionaler Zufallsvektor, der auf
einem Wahrscheinlichkeitsraum (Ω, A, P) definiert ist. Man definiert dessen
Verteilungsfunktion als diejenige Abbildung F, die jeder Folge reeller Zahlen
(x1 , . . . , xn ) den Wert P{X1 ≤ x1 , . . . , Xn ≤ xn } zuordnet. Man beweise
folgende Aussagen:
(i) F ist eine monoton wachsende und in jedem ihrer Argumente x1 , . . . , xn
rechtsseitig stetige Funktion.
(ii) Der Grenzwert lim F(x1 , . . . , xn ) ist gleich 0, wenn mindestens eine der
Variablen xi gegen −∞ strebt, und er ist gleich 1, wenn alle Variablen
xi gegen +∞ streben.
(iii) Es sei G(x1 , . . . , xn ) eine reelle Funktion von n reellen Variablen. Für
reelles h wird das Inkrement der Funktion G, das durch das Inkrement
h der Variablen xi verursacht wird, definiert durch:
(i)
∆h G(x1 , . . . , xn ) = G(x1 , . . . , xi + h, . . . , xn ) − G(x1 , . . . , xi , . . . , xn ).
Man zeige, dass für jede Folge (h1 , . . . , hn ) von reellen positiven Zahlen
und für jede Folge (x1 , . . . , xn ) von reellen Zahlen folgende Ungleichung
gilt
(1)
(n)
∆h1 · · · ∆hn F(x1 , . . . , xn ) ≥ 0.
64
KAPITEL 5: ZUFALLSVARIABLE
Herunterladen