Kapitel 1: Diskrete Wahrscheinlichkeitsräume

Werbung
-4(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume)
Kapitel 1: Diskrete Wahrscheinlichkeitsräume
Damit man ein mathematisches Modell entwickeln kann, müssen die möglichen Ergebnisse des zufälligen Experiments (zumindest im Prinzip) wohldefiniert und beobachtbar sein.
1.1 Definition: Ω, die Menge aller möglichen Ausgänge eines zufälligen Experiments heißt
Ereignis – oder Stichprobenraum. Die Elemente ω ∈ Ω (also die möglichen Ausgänge
des Experiments) heißen Elementarereignisse oder Stichproben.
1.2 Beispiele:
1) Einmaliger Münzenwurf:
mögliche Ausgänge:
Zahl ( = Z ) oder Wappen ( = W ) , d.h. Ω = { Z,W }.
Z = „Münze zeigt Zahl“ ist ein Elementarereignis.
2) Zweimaliger Münzenwurf:
a) Eine Münze wird zweimal geworfen oder zwei unterscheidbare Münzen werden
zugleich geworfen.
Ω = { (Z,Z); (Z,W); (W,Z); (W,W) } = { Z,W } × { Z,W }.
Hier: (Z,W) ≠ (W,Z).
b) Zwei ununterscheidbare Münzen werden zugleich geworfen.
Ω = { (Z,Z); {Z,W}; (W,W) }.
{Z,W} = {W,Z} = „die Münzen zeigen verschiedene Seiten“ ist in diesem Falle ein
Elementarereignis.
3) Eine Münze wird solange geworfen, bis W erscheint.
Beobachtet wird die Anzahl der vorausgegangenen Würfe, die das Ergebnis Z zeigen.
Ω = { 0, 1, 2, . . . , ∞ } = : NI0 ∪ { ∞ }.
-5(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume)
„3“ = „W erscheint zum ersten Mal beim 4. Wurf“ ist ein Elementarereignis.
„∞“ ist das Elementarereignis, daß die Münze nie die W-Seite zeigt.
4) Es wird das Alter beobachtet, in dem verschiedene Menschen sterben. Ω = [0, ∞) = : IR+ .
„59,73“ ist das Elementarereignis, daß die beobachtete Person im Alter von genau 59,73
Jahren gestorben ist.
5) Das Wetter während eines Tages wird beobachtet.
{ sonnig, wolkig, verregnet } kann nicht als Ereignisraum dienen, da
a) diese Menge unvollständig ist: z.B. „es schneit“ ist nicht enthalten.
b) ihre Elemente nicht wohldefiniert sind: ein Tag kann am Morgen verregnet und am
Abend sonnig sein.
1.3 Bemerkung: Die Elementarereignisse ω können Symbole, Zahlen, Vektoren oder noch
allgemeinere Begriffe sein, bestimmt durch das Zufallsexperiment, das wir beobachten.
Wir werden später sehen, daß die Mächtigkeit von Ω die Komplexität des Modells ganz
wesentlich beeinflußt.
1.4 Definition: a) Ω heißt diskret, falls es nur endlich oder abzählbar unendlich viele Elemen-
te enthält.
b) Ein Experiment heißt diskret (endlich), falls es einen diskreten (endlichen) Stichprobenraum Ω besitzt.
1.5 Bemerkung: 1.2 Beispiele
1), 2): endlich
1), 2), 3): diskret
4): nicht diskret, da [0, ∞) überabzählbar.
Bis auf weiteres werden wir uns nur mit diskreten Experimenten beschäftigen.
-6(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume)
1.6 Definition: Falls Ω diskret, verstehen wir unter einem Ereignis eine beliebige Menge A
von möglichen Ausgängen des Experiments, d.h. eine beliebige Teilmenge A von Ω .
„Das Ereignis A ist eingetreten“ heißt, daß der beobachtete Ausgang ω des Experiments in
A liegt.
Für ein diskretes Experiment ist also die Klasse der Ereignisse
P(Ω) : = { A | A ⊂ Ω } , die Potenzmenge von Ω .
1.7 Beispiele von Ereignissen: 1.2:
2a) „Die erste Münze zeigt Z“ = { (Z,Z); (Z,W) }.
2b) „Beide Münzen zeigen die gleiche Seite“ = { (Z,Z); (W,W) }.
3) „W erscheint nicht vor dem 7. Wurf“ = { 6, 7, 8, . . . , ∞ }.
1.8 Bemerkungen:
1) Insbesondere sind Ω und ∅ Ereignisse.
Ω = „sicheres Ereignis“, das immer eintritt.
∅ = „unmögliches Ereignis“, das nie eintreten kann. (Z.B. eine „7“ zu würfeln.)
2) Falls A und B Ereignisse sind, dann verstehen wir unter
A ∪ B = „A oder B treten ein“.
A ∩ B = „A und B treten ein“.
A \ B = „A, aber nicht B, tritt ein“.
A : = Ω \ A = „A tritt nicht ein“.
1.9 Definition: A und B heißen unvereinbar, falls A ∩ B = ∅ .
Wir wollen nun jedem Ereignis A eine Maßzahl zuordnen, die anzeigt, welche Chance
A hat, nach Durchführung des Experiments einzutreten. Hierzu nehmen wir an, daß unser
Experiment unter im wesentlichen konstanten Bedingungen (was nicht immer möglich ist)
-7(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume)
n-mal durchgeführt wird (= : Versuchsreihe der Länge n) und betrachten folgende nahe-
liegenden Maßzahlen von A :
1.10 Definition: Für jedes Ereignis A heißt
rh(A) : =
n(A)
n
relative Häufigkeit von A , wobei n(A) die Anzahl der Versuche ist, bei denen A
eingetreten ist.
Leider ist rh(A) für festes A kein konstanter Wert, sondern hängt von n und (was
noch viel schlimmer ist) von der jeweiligen individuellen Versuchsreihe ab. (rh(A) kann
jeden der Werte 0, 1n , n2 , ... ,1 annehmen.) Hier hilft uns eine empirische Beobachtung weiter.
1.11 Erfahrungstatsache: (Stabilität der relativen Häufigkeiten):
Wenn ein stochastisches Experiment n – mal unter im wesentlichen konstanten Bedingungen durchgeführt wird, dann stabilisiert sich die relative Häufigkeit rh(A) eines
jeden Ereignisses A um einen spezifischen Wert zwischen 0 und 1 , wenn n groß wird.
1.12 Beispiel : Das Geschlecht von neugeborenen Kindern.
A = „männlich“ ; jeweils 20 Versuchsreihen der Länge n :
rh(männlich) stabilisiert sich um 0,514 .
-8(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume)
Diese empirische Beobachtung legt nahe, im mathematischen Modell jedem Ereignis A
eine Maßzahl P(A) , die Wahrscheinlichkeit von A, für die Chance seines Eintretens zuzuordnen. Wahrscheinlichkeiten können also als Abstraktionen von relativen Häufigkeiten verstanden werden.
1.13 Konvention: Für Elementarereignisse ω schreiben wir kurz P(ω) anstelle von P({ω}).
1.14 Bemerkung: Wie P(A) im Einzelfall numerisch anzusetzen ist, damit das mathema-
tische Modell die Realität vernünftig beschreibt, ist kein w-theoretisches, sondern ein
statistisches Problem. So bieten sich manchmal gewisse Werte aus Symmetrieüberlegungen an ( P(1) = P(2) = . . . = P(6) =
1
6
ist wohl sinnvoll für einen (unverfälschten)
Würfel), in anderen Situationen nimmt man die relativen Häufigkeiten „hinreichend“
langer Versuchsreihen. Aufgabe der W-theorie ist es hingegen, Formeln zu entwickeln,
nach denen man aus bekannten Wahrscheinlichkeiten weitere Größen von Interesse
berechnen kann.
Wie die Geometrie, die Algebra, die Topologie und andere mathematische Disziplinen
baut sich auch die W-theorie auf einem axiomatischen Grundsystem auf, das wir Wahrscheinlichkeitsraum (W-raum) nennen. Dieses Begriffssystem wurde 1933 nach Vorarbeiten anderer
Mathematiker von A.N. Kolmogorov als erstem konsequent eingeführt.
Da unser Modell den Ablauf des stochastischen Experiments möglichst realistisch beschreiben soll, müssen die Wahrscheinlichkeiten P(A) gewissen Rechenregeln genügen, die
wir den Eigenschaften der relativen Häufigkeiten entnehmen. Es gilt:
a) n(A) ≥ 0 ⇒ rh(A) ≥ 0 . Wir postulieren deshalb:
I. P(A) ≥ 0 für alle A ⊂ Ω
b) n(Ω) = n ⇒ rh(Ω) = 1. Wir postulieren:
II. P(Ω) = 1
-9(Kapitel 1 : Diskrete Wahrscheinlichkeitsräume)
c) A und B seien unvereinbar ⇒ n(A ∪ B) = n(A) + n(B) ⇒
rh(A ∪ B) = rh(A) + rh(B). Wir sollten postulieren:
III´.
P(A ∪ B) = P(A) + P(B)
für A ∩ B = ∅ (Additivität).
Aus technischen Gründen postulieren wir etwas mehr:
III. A1, A2, . . . sei eine Folge von paarweise unvereinbaren Ereignissen
(d.h. Ai ∩ Aj = ∅ für i ≠ j). Dann gilt:
∞
P(U A j ) =
j=1
∞
∑ P(A )
(σ -Additivität).
j
j=1
1.15 Bemerkung: Obige Reihe ist wohldefiniert, da wegen I. alle ihre Glieder nichtnegativ
sind.
1.16 Definition: I., II. und III. heißen Kolmogorovsche Axiome.
Unter einem diskreten Wahrscheinlichkeitsraum (Ω, P) verstehen wir einen diskreten
Ereignisraum Ω ( ≠ ∅ ) und eine Abbildung P: P(Ω) → IR , die den Axiomen I., II.
und III. genügt. P heißt dann eine Wahrscheinlichkeit, ein Wahrscheinlichkeitsmaß
oder eine Wahrscheinlichkeitsverteilung auf Ω .
1.17 Aus I., II. und III. ergeben sich unmittelbar folgende weitere
Eigenschaften von P:
IV.
P( ∅ ) = 0:
1 = P(Ω) = P(Ω ∪ ∅ ∪ ∅ ∪ ... ) = P(Ω) + P( ∅ ) + P( ∅ ) + . . . ≥ 1 + P( ∅ )
⇒ 0 ≥ P( ∅ ) ≥ 0 ⇒ Beh.
III´. Additivität :
A ∩ B =∅
⇒
P(A ∪ B) = P(A ∪ B ∪ ∅ ∪ ∅ ∪ ... ) =
P(A) + P(B) + P( ∅ ) + P( ∅ ) + . . . = P(A) + P(B).
V. P( A ) = 1 – P(A),
da A ∪ A = Ω und A ∩ A = ∅ .
VI. A ⊂ B ⇒ P(A) ≤ P(B)
( ⇒ P(A) ≤ 1 für alle A ⊂ Ω) :
B = A ∪ (B \ A) ⇒ P(B) = P(A) + P(B \ A) ≥ P(A)
- 10 (Kapitel 1 : Diskrete Wahrscheinlichkeitsräume)
VII. Additionssatz : P(A ∪ B) = P(A) + P(B) – P( A ∩ B )
VIII.
(Übung !)
Stetigkeit :
∞
von unten : A1 ⊂ A2 ⊂ . . .
P( U A n ) = lim P(An)
⇒
n →∞
n =1
∞
von oben :
B1 ⊃ B2 ⊃ . . .
P( I B n ) = lim P(Bn) .
⇒
n =1
n →∞
(Übung !)
1.18 Bemerkungen:
a) Wegen dieses Stetigkeitsverhaltens wird in Axiom III. die σ -Additivität anstelle der
Additivität gefordert. (Siehe hierzu auch die Übungen!)
b) Die σ -Additivität der Wahrscheinlichkeit P ergibt sich automatisch aus der Additivität
von P, wenn man die Überzeugung zu Grunde legt, daß man beobachtbares Naturgeschehen mit Hilfe immer genauerer Beobachtungen beliebig gut approximieren kann.
Da Ω = { ω1, ω2, . . . } diskret ist, ist jedes A ⊂ Ω endlich oder abzählbar,
d.h. für A ≠ ∅ ist
A= U {ω}
ω ∈A
eine höchstens abzählbare Vereinigung von paarweise unvereinbaren Ereignissen.
Nach III. bzw. III´. gilt also:
P(A) =
∑
ω
P(ω) ,
∈A
d.h. P ist eindeutig durch seine Werte
pj : = P(ωj)
( ≥ 0) , j = 1, 2, . . .
bestimmt. Insbesondere gilt:
∑p
j
j
=
∑
ω
∈Ω
P(ω) = P(Ω) = 1 .
- 11 (Kapitel 1 : Diskrete Wahrscheinlichkeitsräume)
r
Der | Ω| - dimensionale Vektor p : = (p1, p2, . . . ) erfüllt die Bedingungen :
a) pj ≥ 0 , j = 1, 2, . . .
und
b)
∑p
j
= 1
j
r
d.h. p ist ein Wahrscheinlichkeitsvektor (W-vektor).
r
Umgekehrt sei p ein | Ω| - dimensionaler W-vektor. Wir setzen
P(A) : =
∑
pj für ∅ ≠ A ⊂ Ω und P( ∅ ) = 0 .
j:ω j ∈A
Man sieht leicht ein (Übung!), daß P eine Wahrscheinlichkeit auf Ω ist. Es ist also gezeigt:
1.19 Satz : Die Wahrscheinlichkeiten P auf Ω = { ω1, ω2, . . . } und die | Ω| - dimensior
nalen W-vektoren p : = (p1, p2, . . . ) entsprechen sich via pj = P(ωj) in eineindeu-
tiger Weise.
r
Wir werden deshalb einen diskreten W-raum auch oft als (Ω, p ) darstellen.
r
1.20 Beispiele : (unverfälschter) Münzenwurf: Ω = {Z,W } , p = ( 12 , 12 ) .
r
(unverfälschtes) Würfeln : Ω = {1, 2, 3, 4, 5, 6 } , p = ( 16 , 16 , 16 , 16 , 16 , 16 ) .
r
Geschlecht neugeborener Kinder : Ω = {♂,♀} , p = (0,514; 0,486) .
Herunterladen