Wahrscheinlichkeitsräume und Zufallsvariablen

Werbung
Kapitel 1
Wahrscheinlichkeitsräume und
Zufallsvariablen
1.1
Modellierung von Zufallsexperimenten
Der Begriff Zufallsexperiment steht hier für jeden realen Vorgang, der vom Zufall beeinflusst wird.
Typischerweise liefert ein Zufallsexperiment ein Ergebnis, das “zufällig” (zumindest teilweise) ist.
Beispiele für Zufallsexperimente:
• Glücksspiele (z.B. Münzwurf, Würfeln, Lotto)
• 0-1-Experimente (Bernoulli-Experimente), wobei z.B. “1” für Erfolg und “0” für Misserfolg steht
(z.B. Therapie, Platzierung, Schießen). Das betrachtete Zufallsexperiment kann die einmalige
Durchführung eines 0-1-Experimentes sein oder auch eine mehrmalige (z.B. die 10-malige) “unabhängige” Durchführung eines 0-1-Experimentes.
• Zufällige Anzahlen (z.B. Anzahl von Kunden oder Aufträgen, Anzahl von Verkehrsunfällen,
Anzahl radioaktiver Zerfälle)
• Lebensdauern / Ausfallzeitpunkte (z.B. von technischen Bauteilen, von Lebewesen)
• Industrielle Fertigung: Quantitative Charakteristika gefertigter Produkte (z.B. elektr. Widerstände, Festigkeit von Materialien, geometrische Abmessungen von techn. Bauteilen)
Mathematisches Modell eines Zufallsexperiments: Ein W-Raum (M, A, P ) ,
wobei die Bestandteile diese Tripels folgende Bedeutung haben.
• M ist die Menge aller möglichen Ergebnisse des Zufallsexperiments.
Die Festlegung der Ergebnismenge M kann ruhig auch ‘Redundanzen’ beinhalten, d.h. Elemente x als
‘mögliche Ergebnisse’ einbeziehen, die praktisch gar nicht möglich sind.
• A ist ein System von “Ereignissen”, denen jeweils eine Wahrscheinlichkeit zugeordnet werden
kann; ein “Ereignis” A ist eine Teilmenge von M und steht für das Ereignis, dass das Ergebnis
x des Zufallsexperiments in A liegt (x ∈ A).
• P ist eine W-Verteilung, die jedem Ereignis A ∈ A eine W’keit P (A) ∈ [ 0 , 1 ] zuordnet.
Die W-Verteilung P ist geeignet festzulegen (“Verteilungsannahme”) entsprechend dem konkret
zu beschreibenden Zufallsexperiment.
Im diskreten Fall, d.h. wenn die Ergebnismenge M abzählbar ist (z.B. endlich ist), definiert man eine
W-Verteilung P einfach durch Festlegung der W’keiten P (x) für jedes mögliche Ergebnis x ∈ M (Elementarereignis); das Ereignissystem A ist die gesamte Potenzmenge von M und die W’keiten für beliebige
Ereignisse ergeben sich dann durch
X
P (A) =
P (x)
∀A⊆M.
x∈A
1
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
2
In nicht-diskreten Fällen (z.B. M = R) ist das komplizierter; hier können wir uns i.A. nicht auf Elementarereignisse zurückziehen; auch kann i,A. das Ereignissystem A nicht als die gesamte Potenzmenge P(M )
gewählt werden.
Beispiele: Modelle für einige einfache Zufallsexperimente
(1) Würfeln (einmal).
M = {1, 2, 3, 4, 5, 6} ,
. P (x) = 1/6 ∀ x = 1, 2, . . . , 6 .
(2) Würfeln (zweimal, unabhängig voneinander). Ein Würfel wird zweimal geworfen (erster
Wurf und zweiter Wurf), oder es werden zwei ‘unterscheidbare’ Würfel (Würfel Nr. 1 und Würfel
Nr. 2) gleichzeitig geworfen.
©
ª
M = x = (x1 , x2 ) : x1 , x2 ∈ {1, 2, 3, 4, 5, 6} ,
P (x) = 1/36 ∀ x = (x1 , x2 ) ∈ M .
(3) Lotto-Ziehung ‘6 aus 49’ ohne Zusatzzahl.
©
ª
M = x = (x1 , x2 , . . . , x6 ) : 1 ≤ x1 < x2 < . . . < x6 ≤ 49 , xi ∈ N (1 ≤ i ≤ 6) ,
±¡ ¢
P (x) = 1 49
∀x∈M.
6
(4) 0-1-Experiment (einmalige Durchführung).
½
M = {0, 1} ,
P (x) =
p
, falls x = 1
1 − p , falls x = 0
,
wobei p ∈ [ 0 , 1 ] gegeben ist (die ‘Erfolgswahrscheinlichkeit’). Interessanter sind mehrmalige
unabhängige Durchführungen des 0-1-Experiments:
(5) 0-1-Experiment (n-malige unabhängige Durchführung).
©
ª
M = {0, 1}n = x = (x1 , x2 , . . . , xn ) : xi ∈ {0, 1} ∀ i = 1, . . . , n ,
P (x) = pS(x) (1 − p)n−S(x)
∀ x = (x1 , . . . , xn ) ∈ M ,
wobei S(x) =
n
P
i=1
xi .
(6) Eine zufällige Anzahl: Binomial-Modell.
Zufallsexperiment: Ein 0-1-Experiment (mit Erfolgswahrscheinlichkeit p ∈ [ 0 , 1 ] ) wird n-mal
unabhängig durchgeführt, und als Ergebnis wird lediglich die Anzahl der erzielten Erfolge festgehalten. Modell:
µ ¶
n x
M = { 0, 1, 2, . . . , n } ,
P (x) =
p (1 − p)n−x ∀ x = 0, 1, . . . , n .
x
(6) Eine zufällige Anzahl: Poisson-Modell.
Z.B.: Die Anzahl der Ankünfte von Kunden oder Aufträgen in einer Service-Station in einem
definierten Zeitraum; die Anzahl von Verkehrsunfällen in einer definierten Region in einem definierten Zeitraum; die Anzahl verkaufter Produkte in einem definierten Zeitraum; die Anzahl
registrierter Impulse in der Umgebung einer radioaktiven Substanz in einem definierten Zeitraum.
Ein oft verwendetes Modell:
M = N0 ,
mit einem geeigneten λ ∈ ( 0 , ∞).
P (x) = e−λ
λx
x!
∀ x ∈ N0 ,
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
1.2
Sigma-Algebra, W-Verteilung und W-Raum
Definition 1.1 (Sigma-Algebra)
Seien M eine nicht-leere Menge und A ⊆ P(M ) (Potenzmenge von M ). Das Mengensystem A heißt
eine Sigma-Algebra in M , wenn es die folgenden drei Bedingungen erfüllt.
(i) M ∈ A .
(ii) Wenn A ∈ A, dann Ac ∈ A (wobei Ac = M \ A).
(iii) Wenn An ∈ A für alle n ∈ N, dann
∞
S
n=1
An ∈ A .
Wenn A eine Sigma-Algebra in M ist, dann heißt das Paar (M, A) ein Messraum oder ein messbarer
Raum.
Folgerung:
Man zeigt leicht, dass eine Sigma-Algebra A in M auch folgende Eigenschaften hat:
Wenn A, B ∈ A, dann A ∪ B ∈ T
A , A ∩ B ∈ A und A \ B ∈ A ;
wenn An ∈ A ∀ n ∈ N , dann ∞
n=1 An ∈ A .
Insbesondere für überabzählbare Mengen M (wie M = R oder M = Rk ) wird die folgende implizite
Definition von interessanten Sigma-Algebren wichtig.
Lemma 1.2 (Erzeugte Sigma-Algebra)
Seien M eine nicht-leere Menge und E ⊆ P(M ) . Dann:
Es existiert genau eine Sigma-Algebra A0 in M , die die beiden folgenden Bedingungen (1) und (2)
erfüllt.
(1) E ⊆ A0 .
(2) Für jede Sigma-Algebra A in M mit E ⊆ A gilt A0 ⊆ A .
Die Sigma-Algebra A0 heißt die von E erzeugte Sigma-Algebra in M ;
abkürzende Schreibweise: A0 = σ(E)
Definition 1.3 (W-Verteilung)
Seien (M, A) ein Messraum und P : A −→ [ 0 , 1 ] . Die Funktion P heißt eine W-Verteilung auf
(M, A), wenn P die folgenden beiden Bedingungen erfüllt.
(i) P (∅) = 0 und P (M ) = 1 .
(ii) Wenn An ∈ A (n ∈ N) eine Folge paarweise disjunkter Mengen ist, dann
P
³S
∞
n=1
´
An
=
∞
X
¡ ¢
P An .
n=1
(Diese Bedingung nennt man die Sigma-Additivität von P ).
Wenn P eine W-Verteilung auf (M, A) ist, dann heißt das Tripel (M, A, P ) ein W-Raum.
3
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
4
Bemerkung Eine W-Verteilung P hat insbesondere die Eigenschaft der Additivität :
Wenn A, B ∈ A und A ∩ B = ∅, dann P (A ∪ B) = P (A) + P (B) .
Desweiteren implizieren Bedingungen (i), (ii) von Definition 1.3 weitere Eigenschaften:
Lemma 1.4 (Weitere Eigenschaften einer W-Verteilung)
Sei (M, A, P ) ein W-Raum. Dann gilt:
(1) Wenn A, B ∈ A und A ⊆ B, dann P (A) ≤ P (B) und P (B \ A) = P (B) − P (A) .
¡ ¢
Insbesondere:
P Ac = 1 − P (A) ∀ A ∈ A .
(2) Wenn An ∈ A für alle n ∈ N , dann P
³S
∞
n=1
´
∞
¡ ¢
P
P An .
An ≤
n=1
(3) Wenn An ∈ A (n ∈ N) eine isotone Mengenfolge ist (d.h. An ⊆ An+1 ∀ n ∈ N) ,
³S
´
∞
dann: P
An = lim P (An ) . (Stetigkeit von unten)
n→∞
n=1
Wenn Bn ∈ A (n ∈ N) eine antitone Mengenfolge ist (d.h. Bn+1 ⊆ Bn ∀ n ∈ N) ,
³T
´
∞
dann: P
Bn = lim P (Bn ) . (Stetigkeit von oben)
n→∞
n=1
Für Situationen, in denen eine Sigma-Algebra nur “implizit” durch einen Erzeuger definiert ist, ist
das folgende “Eindeutigkeitsresultat” für W-Verteilungen bisweilen nützlich.
Lemma 1.5 (Durchschnitt-stabiler Erzeuger / Eindeutigkeitsresultat)
Sei E ⊆ P(M ) ein durchschnitt-stabiles Mengensystem, d.h.:
Wenn E, F ∈ E, dann E ∩ F ∈ E .
Sei A = σ(E) , und seien P1 und P2 zwei W-Verteilungen auf (M, A) , die auf E übereinstimmen:
P1 (E) = P2 (E) ∀ E ∈ E . Dann folgt: P1 = P2 , d.h. P1 (A) = P2 (A) ∀ A ∈ A .
1.3
Diskrete W-Räume
Kleiner Exkurs: Abzählbare Summation nicht-negativer erweitert-reeller Zahlen
Seien I eine abzählbare Menge und ai ∈ [ 0 , ∞] = [ 0 , ∞) ∪{∞} ∀ i ∈ I . Dann wird
X
i∈I
wie folgt (in Schritten (0) - (3)) definiert. Zunächst sei vorausgesetzt: ai < ∞ ∀ i ∈ I .
X
(0) Im Fall I = ∅ :
ai := 0 .
i∈∅
(1) Wenn I 6= ∅ und I endlich ist, |I| = r und I = {i1 , . . . , ir } , dann
r
X
X
ai :=
ain .
i∈I
n=1
ai ∈ [ 0 , ∞]
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
5
(2) Wenn I unendlich ist, dann sei eine bijektive Abbildung σ : N −→ I gewählt, und
∞
∞
X
X
X
ai :=
aσ(n) , wobei im Fall der (bestimmten) Divergenz der Reihe:
aσ(n) := ∞ .
n=1
i∈I
n=1
Anmerkung: Nach dem Umordnungssatz für absolut konvergente Reihen ist damit
X
ai wohldefiniert,
i∈I
d.h. unabhängig von der speziellen Wahl der Abzählung σ.
(3) Im
X Fall, dass nicht alle ai endlich sind, also ein i0 ∈ I mit ai0 = ∞ existiert, wird definiert:
ai ; = ∞ .
i∈I
Zwei Folgerungen:
X
nX
o
ai = sup
ai : E ⊆ I , E endlich .
i∈I
i∈E
(Das Supremum einer nicht-leeren Teilmenge S ⊆ [ 0 , ∞] ist das kleinste c ∈ [ 0 , ∞] mit s ≤ c ∀ s ∈ S ;
außerdem wird hier definiert: sup ∅ := 0).
Sei eine disjunkte Zerlegung von I in abzählbar viele Teilmengen gegeben:
S
I = k∈K Ik , wobei K abzählbar und Ik ⊆ I , (k ∈ K) , paarweise disjunkt .
X
X ³X ´
ai .
ai =
i∈I
Dann:
k∈K i∈Ik
Lemma 1.6 (Diskrete W-Verteilung und Zähldichte)
Sei M eine nicht-leere abzählbare Menge, und A = P(M ) (die Potenzmenge von M ).
¡
¢
(a) Sei P eine W-Verteilung auf M, P(M ) ; betrachte die reelle Funktion auf M :
¡
¢
M 3 x 7−→ P (x) := P {x}
(die Zähldichte von P ).
Diese Funktion erfüllt die Bedingung
P (x) ≥ 0 ∀ x ∈ M
und
X
P (x) = 1 ,
(∗)
x∈M
und es gilt
P (A) =
X
P (x) ∀ A ⊆ M .
x∈A
(b) Sei umgekehrt eine reelle Funktion M 3 x 7−→ P (x) gegeben, die die Bedingung (∗) erfüllt;
dann ist durch
X
P (A) :=
P (x) ∀ A ⊆ M
x∈A
¡
¢
eine W-Verteilung auf M, P(M ) definiert.
Bemerkung:
¡
¢
Wenn M abzählbar und P eine W-Verteilung auf M, P(M ) sind, dann nennen wir (M, P(M ), P ) einen
diskreten W-Raum, für den wir auch einfach (M, P ) schreiben.
Definition 1.7 (Spezielle diskrete W-Verteilungen)
In den nachfolgend genannten Fällen (1) – (6) wird jeweils eine¡ abzählbare
¢ Menge M spezifiziert und
durch Angabe einer Zähldichte P (x) eine W-Verteilung P auf M, P(M ) definiert.
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
(1) Sei M irgendeine nicht-leere endliche Menge. Die Gleichverteilung auf M , Abk.: P = U(M ) ,
ist durch die konstante Zähldichte definiert:
1
P (x) =
für alle x ∈ M .
|M |
(2) Sei M = { 0, 1, . . . , n } für ein gegebenes n ∈ N, und sei noch p ∈ [ 0 , 1 ] gegeben.
Die Binomialverteilung zu den Parameterwerten n und p, Abk.: P = Bi(n, p), ist durch die
Zähldichte definiert:
µ ¶
n x
P (x) =
p (1 − p)n−x für alle x = 0, 1, . . . , n .
x
(3) Sei M = { 0, 1, . . . , n } für ein gegebenes n ∈ N, und seien noch N ∈ N, s ∈ N0 mit N ≥ s und
N ≥ n gegeben. Die hypergeometrische Verteilung zu den Parameterwerten N , s und n,
Abk.: P = Hyp(N, s, n) , ist durch die Zähldichte definiert:
¡ s ¢ ¡N −s¢
P (x) =
x
¡Nn−x
¢
für alle x = 0, 1, . . . , n .
n
(4) Seien M = N0 und λ eine gegebene positive reelle Zahl. Die Poisson-Verteilung zum Parameterwert λ, Abk.: P = Poi(λ) , ist durch die Zähldichte definiert:
P (x) = e−λ ·
λx
x!
für alle x ∈ N0 .
©
ª
(5) Seien M = x ∈ N : x ≥ r mit einem gegebenen r ∈ N, und sei noch p ∈ ( 0 , 1) gegeben.
Die negative Binomialverteilung zu den Parameterwerten r und p, Abk.: P = NegBi(r, p) , ist
durch die Zähldichte definiert:
µ
¶
r x−1
P (x) = p
(1 − p)x−r für alle x = r, r + 1, r + 2, . . . .
r−1
Im Fall r = 1, d.h. M = N und P (x) = p (1 − p)x−1 für alle x ∈ N ,
heißt NegBi(r, p) auch die geometrische Verteilung zum Parameterwert p, Abk.: Geo(p) .
o
n
P
(6) Sei M = x = (x1 , x2 , . . . , xk ) ∈ Nk0 : kj=1 xj = n , für gegebene k ∈ N, k ≥ 2, und n ∈ N,
Pk
und seien noch p1 , p2 , . . . , pk ∈ [ 0 , 1 ] mit
j=1 pj = 1 gegeben. Die Multinomialverteilung
zu den Parameterwerten n und p1 , p2 , . . . , pk , Abk.: P = Mu(n; p1 , p2 , . . . , pk ) , ist durch die
Zähldichte definiert:
n!
P (x) =
px1 px2 · · · pxk k ∀ x = (x1 , x2 , . . . , xk ) ∈ M .
x1 ! x2 ! · · · xk ! 1 2
Diskrete Verteilungen von Definition 1.7 : Typische Zufallsexperimente
(1) Gleichverteilung
Ein Objekt wird “rein ¡zufällig” aus
¢ einer endlichen Grundgesamtheit M gezogen.
Modell: Der W-Raum M, U(M ) .
(2) Binomialverteilung
n-malige unabhängige Durchführung eines 0-1-Experiments mit Wahrscheinlichkeit p für “1”
und 1 − p für “0”, und als Ergebnis des (Gesamt-)Experiments
¡
¢wird die Anzahl der erzielten
“1”-en festgehalten. Modell: Der W-Raum {0, 1, . . . , n}, Bi(n, p) .
6
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
7
(3) Hypergeometrische Verteilung
Gegeben eine Grundgesamtheit mit N Objekten; jedes Objekt trägt einen binären (0-1-wertigen)
Merkmalswert (z.B. gut/schlecht); insgesamt haben genau s Objekte den Merkmalswert “1”.
Zufallsexperiment: Es wird eine Zufallsstichprobe vom Umfang n aus der Grundgesamtheit gezogen (Ziehen ohne Zurücklegen), und als Ergebnis wird die ¡Anzahl aller Objekte der Stichprobe
¢
mit Merkmalswert “1” festgehalten. Modell: Der W-Raum {0, 1, . . . , n} , Hyp(N, s, n) .
(4) Poisson-Verteilung
Eine zufällige Anzahl, die nicht von vorne herein nach oben beschränkt ist (im
¡ Unterschied
¢ zu
(2) und (3)), kann oft näherungsweise modelliert werden durch den W-Raum N0 , Poi(λ) (mit
einem geeigneten λ > 0). Konkretere Beispiele etwa: Anzahl von Kunden, die innerhalb eines
definierten Zeitraumes eine bestimmte Service-Station besuchen; Anzahl der zerfallenen Teilchen
einer radioaktiven Substanz in einem definierten Zeitraum.
(5) Negative Binomialverteilung, insbes. Geometrische Verteilung
Ein 0-1-Experiment mit Wahrscheinlichkeit p für “1” und 1 − p für “0” wird so oft unabhängig
durchgeführt, bis “1” r-mal aufgetreten ist (z.B. “warten auf den r-ten Erfolg”). Die Anzahl
der benötigten
Durchführungen ist das Ergebnis
des (Gesamt-)Zufallsexperiments. Modell: Der
¡
¢
W-Raum {r, r + 1, r + 2, . . .} , NegBi(r, p) .
(6) Multinomialverteilung
Das Zufallsexperiment bestehe in der n-maligen unabhängigen Durchführung eines Einzelexperiments, das k mögliche verschiedene Ergebnisse a1 , a2 , . . . , ak hervorbringen kann, und zwar
mit den jeweiligen W’keiten p1 , p2 , . . . , pk . Als Ergebnis des (Gesamt-)Experiments werde nur
festgehalten x = (x1 , x2 , . . . , xk ) mit
xj = Anzahl des Auftretens von aj
¡
¢
Modell: Der W-Raum M , Mu(n; p1 , p2 , . . . , pk ) mit
M =
(1 ≤ j ≤ k) .
n
o
k
P
x = (x1 , x2 , . . . , xk ) ∈ Nk0 :
xj = n .
j=1
1.4
W-Verteilungen auf der Zahlengeraden
Hier beschäftigen wir uns mit W-Verteilungen im Fall M = R . Zunächst ist eine geignete SigmaAlgebra zu definieren.
Definition 1.8 (Borelsche Sigma-Algebra in R)
Bezeichne I 1 das System aller links offenen und rechts abgeschlossenen Intervalle endlicher Länge:
n
o
I 1 = (a , b ] : a, b ∈ R , a ≤ b .
Die von I 1 in R erzeugte Sigma-Algebra heißt die Borelsche Sigma-Algebra in R, und wir bezeichnen
sie mit B1
Bemerkung:. Andere Erzeuger der Borelschen Sigma-Algebra
Es lassen sich viele andere Mengensysteme in R finden, die ebenfalls Erzeuger von B1 sind, z.B. die
links unbeschränkten und rechts abgeschlossenen Intervalle:
n
o
(−∞ , b ] : b ∈ R .
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
8
W-Verteilungen auf (R, B 1 ) können wir nicht elementar direkt definieren, zumindest nicht die ”stetigen” W-Verteilungen (s.unten). Elementar definierbar
sind¢ jedoch diskrete W-Verteilungen auf (R, B 1 ) :
¡
Dies sind effektiv diskrete W-Verteilungen auf M, P(M ) wie in Abschnitt 1.3 , wobei M eine abzählbare Teilmenge von R ist, z.B. M = {0, 1 . . . , n} für ein gegebenes n ∈ N , oder M = N0 . Es gilt
nämlich:
Lemma 1.9 (Diskrete W-verteilungen auf (R, B1 ))
¡
¢
Sei M eine nicht-leere, abzählbare Teilmenge von R , und sei P eine W-Verteilung auf M, P(M ) .
Dann können wir P zu einer W-Verteilung auf (R, B 1 ) machen:
P (A) := P (A ∩ M ) ∀ A ∈ B 1 .
¯
Anmerkung: Dies ist eine triviale Fortsetzung der W-Verteilung P ; es gilt offensichtlich: P ¯P(M ) = P , und
P (R \ M ) = 0 . Im Wesentlichen sind P und P dasselbe, aber formal verschieden.
Ein wichtiges Hilfsmittel zur Beschreibung beliebiger W-Verteilungen auf (R, B1 ) erweist sich der Begriff der Verteilungsfunktion.
Definition 1.10 (Verteilungsfunktion einer W-Verteilung auf (R, B 1 ))
Sei P eine W-Verteilung auf (R, B 1 ). Die Verteilungsfunktion von P ist die Funktion
¡
¢
FP : R −→ [ 0 , 1 ] ,
FP (b) := P (−∞ , b ]
∀ b ∈ R.
Lemma 1.11 (Eigenschaften einer Verteilungsfunktion)
Für die Verteilungsfunktion FP einer W-Verteilung P auf (R, B 1 ) gilt:
(i) FP ist isoton;
(ii) FP ist rechtsseitig stetig;
(iii)
lim F (b) = 0
b→−∞
und
lim F (b) = 1 .
b→∞
Weiterhin gilt:
¡
¢
P (a , b ]
= FP (b) − FP (a) ∀ a, b ∈ R , a ≤ b ;
¡ ¢
P {c} = FP (c) − FP (c -) ∀ c ∈ R,
wobei FP (c -) :=
lim
x→c, x<c
FP (x) .
Bemerkung: Stetige W-Verteilung
Wenn P eine W-Verteilung auf (R, B1 ) ist, deren Verteilungsfunktion FP stetig ist, dann nennen wir P
eine stetige W-Verteilung
¡ ¢ (im Kontrast zu einer diskreten W-Verteilung). Nach Lemma 1.11 ist P genau
dann stetig, wenn P {c} = 0 ∀ c ∈ R.
Das entscheidende Resultat über Verteilungsfunktionen ist nun, dass eine “Eins-zu Eins-Korrespondenz”
zwischen Verteilungsfunktionen und W-Verteilungen auf (R, B1 ) besteht. Dabei heiße jetzt jede Funktion F : R −→ [ 0 , 1 ] , die die Bedingungen (i), (ii) und (iii) von Lemma 1.11 (mit F statt FP ) erfüllt,
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
9
eine Verteilungsfunktion auf R, wobei nicht gesagt ist, dass F tatsächlich die Verteilungsfunktion einer
W-Verteilung auf (R, B1 ) ist. Dem ist aber so, wie das folgende Hauptresultat zeigt.
Theorem 1.12 (Korrespondenz:
W-Verteilung ←→ Verteilungsfunktion)
Bezeichne V(R) die Menge aller Verteilungsfunktionen auf R und W(R, B 1 ) die Menge aller WVerteilungen auf (R, B1 ). Dann ist durch P 7−→ FP eine bijektive Abbildung von W(R, B1 ) auf
V(R) gegeben.
Die für uns wichtigen stetigen W-Verteilungen sind sogar Lebesgue-stetig, d.h. sie besitzen eine LebesgueDichte im Sinne des nachfolgenden Lemmas.
Lemma 1.13 (W-Verteilung mit Lebesgue-Dichte)
Z
∞
Sei f : R −→ [ 0 , ∞) eine über R integrierbare Funktion mit
Z
Dann ist durch
f (x) dx = 1 .
−∞
b
F (b) :=
f (x) dx ∀ b ∈ R
−∞
eine (stetige) Verteilungsfunktion auf R gegeben und damit eine W-Verteilung P auf (R, B1 ).
Man sagt: P besitzt die Lebesgue-Dichte f .
Bemerkung: W’keiten als Integrale der Lebesgue-Dichte
Die W-Verteilung P besitze die Lebesgue-Dichte f . Dann:
Z b
Z
¡
¢
¡
¢
P [a, b] =
f (x) dx ∀ a, b ∈ R , a ≤ b ;
P [ a , ∞) =
a
∞
f (x) dx ∀ a ∈ R .
a
Darüber hinaus, wenn wir die allgemeinere Theorie des Lebesgue-Integrals einbeziehen:
Z
P (A) =
f dµ ∀ A ∈ B 1 .
A
Definition 1.14 (Spezielle Lebesgue-stetige W-Verteilungen)
In den nachfolgenden Fällen (1)–(6) wird jeweils eine W-Verteilung P auf (R, B 1 ) durch eine LebesgueDichte f definiert.
(1) Seien β ∈ R und σ ∈ ( 0 , ∞) gegeben. Die Normalverteilung zu den Parameterwerten β und σ 2 ,
Abk.: P = N(β, σ 2 ) , ist definiert durch die Lebesgue-Dichte:
µ
¶
1
1 ³ x − β ´2
√
f (x) =
exp −
∀ x ∈ R.
2
σ
σ 2π
(2) Seien c, d ∈ R mit c < d gegeben. Die Rechteck-Verteilung oder die Gleichverteilung auf dem
Intervall ( c , d ) , Abk.: P = R(c, d) , ist definiert durch die Lebesgue-Dichte:
½
1/(d − c) , falls c < x < d
f (x) =
∀ x ∈ R.
0
, sonst
(3) Sei λ ∈ ( 0 , ∞) gegeben. Die Exponentialverteilung zum Parameterwert λ, Abk.: P = Exp(λ) ,
ist definiert durch die Lebesgue-Dichte:
¡
¢
½
λ exp −λ x
, falls x > 0
f (x) =
∀ x ∈ R.
0
, sonst
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
10
(4) Seien c, λ ∈ ( 0 , ∞) gegeben. Die Weibull-Verteilung zu den Parameterwerten c und λ,
Abk.: P = Wei(c, λ) , ist definiert durch die Lebesgue-Dichte:
³
´
(
c λc xc−1 exp −(λx)c
, falls x > 0
f (x) =
∀ x ∈ R.
0
, sonst
(5) Seien c, λ ∈ ( 0 , ∞) gegeben. Die Gamma-Verteilung zu den Parameterwerten c und λ,
Abk.: P = Ga(c, λ) , ist definiert durch die Lebesgue-Dichte:
( c
¡
¢
λ
xc−1 exp −λx
, falls x > 0
Γ(c)
f (x) =
∀ x ∈ R,
0
, sonst
wobei Γ die Gamma-Funktion bezeichnet, d.h.
Z ∞
Γ(c) =
tc−1 exp( −t ) dt .
0
(6) Seien β ∈ R und σ ∈ ( 0 , ∞) gegeben. Die Log-Normalverteilung zu den Parameterwerten β und
σ 2 , Abk.: P = LogN(β, σ 2 ) , ist definiert durch die Lebesgue-Dichte:
µ
¶
1
1
1 ³ ln(x) − β ´2
f (x) = √
exp −
∀ x ∈ ( 0 , ∞) ; f (x) = 0 ∀ x ≤ 0 .
2
σ
σ 2π x
Bemerkung: Modellierung
Exponential- und Weibull-Verteilungen werden insbesondere zur Modellierung zufälliger Lebensdauern
verwendet. Beispiele zur Verwendung von Normalverteilungen und Log-Normalverteilungen: Charakteristik eines gefertigten Produkts (z.B. Dicke eines Bleches, Länge eines Stiftes, Widerstand eines
elektrischen Bauteils). Insbesondere Normalverteilungen werden in vielen weiteren Situationen zur
Modellierung verwendet.
1.5
W-Verteilungen im euklidischen Raum
Wir betrachten den k-dimensionalen euklidischen Raum Rk , (k ∈ N gegeben). In Verallgemeinerung
von Definition 1.8 definiert man die Borelsche Sigma-Algebra in Rk wie folgt.
Definition 1.15 (Borelsche Sigma-Algebra in Rk )
Bezeichne I k das System aller ”links offenen und rechts abgeschlossenen” achsen-parallelen Quader :
n
o
I k = ( a , b ] : a, b ∈ Rk , a ≤ b ,
wobei für a = (a1 , . . . , ak ) ∈ Rk und b = (b1 , . . . , bk ) ∈ Rk definiert sei:
a ≤ b : ⇐⇒ ai ≤ bi ∀ i = 1, . . . , k ;
a < b : ⇐⇒ ai < bi ∀ i = 1, . . . , k ;
©
ª
k
und für a, b ∈ Rk mit a ≤ b : ( a , b ] := x ∈ Rk : a < x ≤ b = × ( ai , bi ] .
i=1
Die von I k in Rk erzeugte Sigma-Algebra heißt die Borelsche Sigma-Algebra in Rk , und wir bezeichnen
sie mit Bk
Bemerkung: Andere Erzeuger von B k
Es ist nicht schwer zu zeigen, dass jedes der folgenden Mengensysteme ebenfalls ein Erzeuger der
Borelschen Sigma-Algebra B k ist.
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
11
(i) ©
Das System aller abgeschlossenen
nicht-degenerierten achsen-parallelen Quader:
ª
©
ª
[ a , b ] : a, b ∈ Rk , a < b , wobei [ a , b ] : x ∈ Rk : a ≤ x ≤ b ;
n k
o
(ii) das System
× (−∞ , bi ] : b = (b1 , . . . , bk ) ∈ Rk ;
i=1
n
(iii) das System
k
× Ai : Ai ∈ B 1 ∀ i = 1, . . . , k
o
i=1
;
(iv) das System aller offenen Teilmengen von Rk ;
(v) das System aller abgeschlossenen Teilmengen von Rk ;
(vi) das System aller kompakten Teilmengen von Rk .
Bemerkung:. Lebesgue-messbare Mengen (im Sinne der Analysis)
Das System der Lebesgue-messbaren Teilmengen von Rk , das in der Analysis eingeführt wurde, steht
mit der Borelschen Sigma-Algebra in folgendem Zusammenhang (was aber nicht leicht zu sehen ist).
(a) Wenn A ⊆ Rk eine Lebesgue-messbare Menge (im Sinne der Analysis) ist, dann gibt es eine
Borelsche Menge B ∈ B k und eine Lebesgue-Nullmenge N ⊆ Rk , so dass A = B ∪ N .
(b) Jede Borelsche Menge B ∈ B k mit endlichem äußeren Lebesgueschen Maß ist eine Lebesguemessbare Menge.
Analog zum Fall der Dimension k = 1 lassen sich diskrete W-Verteilungen auf (Rk , B k ) auf simple
Weise gewinnen:
Lemma 1.16 (Diskrete W-Verteilungen auf (Rk , B k ))
¡
¢
Sei M eine nicht-leere, abzählbare Teilmenge von Rk , und sei P eine W-Verteilung auf M, P(M ) .
Dann können wir P zu einer W-Verteilung P auf (Rk , B k ) fortsetzen:
P (A) := P (A ∩ M ) ∀ A ∈ B k .
Beispiel: Multinomial-Verteilung (s. Definition 1.7, Punkt (6)).
Die Korrespondenz zwischen W-Verteilungen und Verteilungsfunktionen im Fall k = 1 (Theorem 1.12)
lässt sich auf beliebige Dimension k ≥ 1 verallgemeinern, was hier aber nicht dargestellt werden soll
(weil recht aufwändig). Als “stetige” W-Verteilungen auf (Rk , B k ) seien hier nur die Lebesgue-stetigen
W-Verteilungen genannt, die also eine Lebesgue-Dichte besitzen. Hier wird der Begriff des LebesgueIntegrals der Analysis verwendet.
Lemma 1.17 (W-Verteilung auf (Rk , Bk ) mit Lebesgue-Dichte)
Z
k
Sei f : R −→ [ 0 , ∞) eine Lebesgue-integrierbare Funktion mit
f dµ = 1 .
Rk
Z
Z
Dann ist durch
P (A) :=
f dµ :=
f 1 A dµ
∀ A ∈ Bk
A
Rk
eine W-Verteilung P auf (Rk , Bk ) gegeben. Man sagt: P besitzt die Lebesgue-Dichte f .
Dabei bezeichnet 1 A die Indikatorfunkttion von A ⊆ Rk , d.h.
½
1 , falls x ∈ A
1 A (x) =
0 , falls x ∈ Ac
,
∀ x ∈ Rk .
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
12
Von besonderem Interesse sind Lebesgue-Dichten, die aus k “eindimensionalen” Lebesgue-Dichten
durch eine Produkt gewonnen werden:
Lemma 1.18 (Produkt von k Lebesgue-stetigen W-Verteilungen auf (R, B1 ))
Z ∞
Seien f1 , . . . , fk mit fi : R −→ [ 0 , ∞) und
fi (x) dx = 1 , für alle i = 1, . . . , k.
−∞
Bezeichne Pi die W-Verteilung auf (R, B 1 ) mit Lebesgue-Dichte fi (s. Lemma 1.13), i = 1, . . . , k.
Definiere:
k
Y
f : Rk −→ [ 0 , ∞) ,
f (x) =
fi (xi ) ∀ x = (x1 , . . . , xk ) ∈ Rk .
i=1
Dann erfüllt f die Bedingungen von Lemma 1.17; die W-Verteilung P auf (Rk , B k ) mit der Lebesguek
Dichte f heißt das Produkt der W-Verteilungen P1 , . . . , Pk , Abk.: P = ⊗ Pi .
i=1
Beispiel: Produkt von Normalverteilungen
Seien Pi = N(βi , σi2 ) mit βi ∈ R, σi ∈ ( 0 , ∞) , i = 1, . . . , k. Dann ist die Lebesgue-Dichte von
k
P = ⊗ N(βi , σi2 ) gemäß Lemma 1.18 gegeben durch:
i=1
f (x) =
k µ
Y
i=1
µ
¶
k
k
³ (x − β )2 ´ ¶
³Y
´−1/2
X
1
(xi − βi )2
i
i
−k/2
2
1
√ exp −
= (2π)
σi
exp − 2
.
2σi2
σi2
σi 2π
i=1
i=1
Unter Verwendung von etwas Matrix-Formalismus, wenn x als Spaltenvektor ¡geschrieben¢ ist und wir
den (Spalten-)Vektor β = (β1 , . . . , βk )t und die Diagonalmatrix D = diag σ12 , . . . , σk2 einführen,
können wir die Dichte f auch so schreiben:
´
³
¡
¢−1/2
f (x) = (2π)−k/2 det(D)
exp − 12 (x − β)t D −1 (x − β) .
Allgemeiner definiert man eine k-dimensionale Normalverteilung (die nicht Produnkt von ein-dimensionalen
Normalverteilungen sein muss) wie folgt.
Definition 1.19 (k-dimensionale Normalverteilung)
Seien β = (β1 , . . . , βk )t ∈ Rk und V eine positiv definite (reelle) k × k Matrix (also V symmetrisch und
at V a > 0 für alle (Spalten-)Vektoren a ∈ Rk \{0} ). Die Normalverteilung N(β, V ) ist die W-Verteilung
auf (Rk , B k ) mit der Lebesgue-Dichte
³
´
¡
¢−1/2
f (x) = (2π)−k/2 det(V )
exp − 12 (x − β)t V −1 (x − β) , x ∈ Rk .
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
1.6
Zufallsvariablen
In diesem Abschnitt gehen wir von einem W-Raum (Ω, C, P) und einem Messraum (M, A) aus.
Definition 1.20 (Messbare Abbildung / Zufallsvariable)
Eine Abbildung X : Ω −→ M heißt messbar (bezgl. der Sigma-Algebren C und A), wenn gilt:
X −1 (A) ∈ C
∀A∈A.
Dabei bezeichnet X −1 (A) für A ⊆ M das Urbild von A unter der Abbildung X, d.h.
©
ª
X −1 (A) = ω ∈ Ω : X(ω) ∈ A .
Statt X −1 (A) schreiben wir auch {X ∈ A} .
Eine messbare Abbildung X : Ω −→ M , (wobei (Ω, C, P) ein W-Raum und (M, A) ein Messraum sind),
heißt eine Zufallsvariable (auf Ω mit Werten in M ).
Lemma 1.21 (Verteilung einer Zufallsvariablen)
Sei X : Ω −→ M eine Zufallsvariable. Definiere PX : A −→ [ 0 , 1 ] durch:
¡
¢
PX (A) := P X −1 (A)
∀ A ∈ A.
Dann ist PX eine W-Verteilung auf (M, A) ; sie heißt die Verteilung von X .
Anmerkung: Andere gebräuchliche Bezeichnungen für PX sind X(P) und PX .
Spezialfall: Diskrete Zufallsvariable
Wenn M abzählbar ist und A = P(M ) , dann nennen wir eine Zufallsvariable X : Ω −→ M eine
diskrete Zufallsvariable. Ihre Verteilung ist durch ihre Zähldichte vollständig beschrieben:
PX (x) = P(X = x)
∀x∈M,
©
ª
¡
¢
wobei {X = x} = ω ∈ Ω : X(ω) = x und P(X = x) = P {X = x} .
Bemerkung: Zufallsexperiment: Modellformulierung mit Zufallsvariablen
Der W-Raum (M, A, P ) sei das Modell für ein Zufallsexperiment. Eine virtuell andere (aber äquivalente) Modellformulierung ist die folgende.
Gegeben sei ein W-Raum (Ω, C, P) (der meistens nicht konkretisiert wird) und eine Zufallsvariable
X : Ω −→ M (die ebenfalls meistens nicht näher spezifiziert wird, außer ihrer Verteilung, s. unten).
Ein Ergebnis x ∈ M des Zufallsexperiments wird als Wert der Zufallsvariablen X aufgefasst, (der
Zufall wählt ein Element ω ∈ Ω und das Ergebnis des Zufallsexperiments ist dann x = X(ω)). Die Verteilung
PX der Zufallsvariablen X ist geeignet festzulegen: PX = P . Effektiv ist wiederum der W-Raum
(M, A, P ) das Modell für das Zufallsexperiment.
13
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
14
Lemma 1.22 (Komposition messbarer Abbildungen)
Seien (Ω, C, P) ein W-Raum , (M, A) und (N, B) zwei Messräume und X : Ω −→ M eine Zufallsvariable und T : M −→ N eine messbare Abbildung (bezgl. der Sigma-Algebren A und B). Betrachte
die Komposition
¡
¢
T ◦ X : Ω −→ N ,
(T ◦ X)(ω) = T X(ω) ∀ ω ∈ Ω .
Dann ist T ◦ X eine Zufallsvariable (auf Ω mit Werten in N ) , und für ihre Verteilung gilt:
PT ◦X =
¡ X ¢T
P
.
Definition 1.23 (Produkt-Sigma-Algebra)
Seien n ≥ 2 Messräume (Mi , Ai ) , i = 1, . . . , n, gegeben. Betrachte das cartesische Produkt
n
n
i=1
i=1
M := × Mi . Die Produkt-Sigma-Algebra A = ⊗ Ai ist die Sigma-Algebra in M , die erzeugt
wird vom Mengensystem
n
E :=
o
n
× Ai : Ai ∈ Ai , i = 1, . . . , n .
i=1
Beispiel: Diskrete Messräume
Seien Mi abzählbare Mengen und Ai = P(Mi ) , i = 1, . . . , n. Man zeigt leicht:
n
n
i=1
i=1
⊗ P(Mi ) = P(M ) , wobei M = × Mi (ebenfalls eine abzählbare Menge).
Beispiel: Borelsche Sigma-Algebren
Seien (Mi , Ai ) = (R, B1 ) , i = 1, . . . , n. Man zeigt leicht:
n
⊗ B1 = Bn .
i=1
Lemma 1.24 (Mehrere Zufallsvariablen, gemeinsame Verteilung)
Seien (Ω, C, P) ein W-Raum , (Mi , Ai ) (i = 1, . . . , n) Messräume und Xi : Ω −→ Mi (i = 1, . . . , n)
Zufallsvariablen. Betrachte die Abbildung
n
(X1 , . . . , Xn ) : Ω −→ M := × Mi ,
i=1
¡
¢
(X1 , . . . , Xn )(ω) := X1 (ω), . . . , Xn (ω) ∀ ω ∈ Ω .
n
Dann ist (X1 , . . . , Xn ) eine Zufallsvariable, d.h. messbar bezgl. der Sigma-Algebren C und A := ⊗ Ai .
i=1
Die Verteilung P(X1 ,...,Xn ) von (X1 , . . . , Xn ) wird die gemeinsame Verteilung der Zufallsvariablen
X1 , . . . , Xn genannt.
Bemerkung: Gemeinsame Verteilung und “Randverteilungen”
Der gemeinsame Verteilung P(X1 ,...,Xn ) bestimmt die Verteilungen PXi (i = 1, . . . , n) der einzelnen
Zufallsvariablen (sog. Randverteilungen) eindeutig, denn:
Betrachte die Projektionsabbildungen
Πi : M −→ Mi ,
Πi (x1 , . . . , xn ) := xi ∀ (x1 , . . . , xn ) ∈ M , (i = 1, . . . , n).
Man sieht leicht, dass Πi messbar ist (bezgl. der Sigma-Algebren A und Ai .
Wegen Xi = Πi ◦ (X1 , . . . , Xn ) gilt nach Lemma 1.22 :
³
´Πi
PXi = PΠi ◦(X1 ,...,Xn ) = P(X1 ,...,Xn )
,
i = 1, . . . , n.
Norbert Gaffke: Vorlesung “Einführung in die Wahrscheinlichkeitstheorie und Statistik”, Wintersemester 2012/13
Kapitel 1: Wahrscheinlichkeitsräume und Zufallsvariablen
15
Das lässt sich auch einfacher sehen, z.B. für i = 1 haben wir für jedes A1 ∈ A1 :
¡
¢
¡
¢
PX1 (A1 ) = P(X1 ∈ A1 ) = P (X1 , . . . , Xn ) ∈ A1 × M2 × . . . × Mn = P(X1 ,...,Xn ) A1 × M2 × . . . × Mn .
Umgekehrt aber bestimmen die Randverteilungen P Xi (i = 1, . . . , n) i.A. nicht die gemeinsame Verteilung P (X1 ,...,Xn ) . Wichtige Ausnahme: Der Fall, dass die Zufallsvariablen X1 , . . . , Xn stochastisch
unabhängig sind, (s. Kap. 2).
Spezialfall: Diskrete Zufallsvariablen
Seien X1 , . . . , Xn diskrete Zufallsvariablen, d.h. Mi ist abzählbar und Ai = P(Mi ) für alle i = 1, . . . , n.
n
Dann ist (X1 , . . . , Xn ) ebenfalls eine diskrete Zufallsvariable (da M = × Mi abzählbar und A =
i=1
n
⊗ P(Mi ) = P(M ) ). Die gemeinsame Verteilung P(X1 ,...,Xn ) ist durch ihre Zähldichte vollständig
i=1
beschrieben:
¡
¢
P(X1 ,...,Xn ) (x1 , . . . , xn ) = P X1 = x1 , X2 = x2 , . . . , Xn = xn
∀ (x1 , . . . , xn ) ∈ M ,
©
ª
wobei {X1 = x1 , X2 = x2 , . . . , Xn = xn } = ω ∈ Ω : Xi (ω) = xi ∀ i = 1, . . . , n .
Die Zähldichten der Randverteilungen PXi erhält man durch die entsprechenden “Randsummen” der
“gemeinsamen” Zähldichte, z.B. für i = 1 :
X
PX1 (x1 ) =
P(X1 ,X2 ,...,Xn ) (x1 , x2 , . . . , xn )
∀ x1 ∈ M1 .
x2 ∈M2 , ..., xn ∈Mn
Herunterladen