Rechnen mit einfachem Mengenkalkül

Werbung
Rechnen mit einfachem Mengenkalkül
Bedingte Wahrscheinlichkeiten
Allgemeine Frage:
Wie groß ist die Wahrscheinlichkeit für ein Ereignis A, falls bereits ein Ereignis B
eingetreten ist (und der Betrachter über diese Information verfügt)?
Beispiel:
Wie groß ist die Wahrscheinlichkeit für eine gerade Zahl beim Würfelwurf, falls
bereits eine Zahl kleiner als 4 gewürfelt wurde?
Ω
A
B
B
6
2
4
1
2
3
5
„P(A | B)“ =
A∩B
1
=
3
Grundlagen - Rechnen mit einfachem Mengenkalkül
=
A∩ B
B
=
1
3
A∩ B /Ω
B /Ω
P(A ∩ B )
P (B )
366
Rechnen mit einfachem Mengenkalkül
Bedingte Wahrscheinlichkeit
Seien A und B Ereignisse mit P(B) > 0. Dann ist die bedingte Wahrscheinlichkeit
von A unter B definiert als
P( A | B ) =
P( A ∩ B )
.
P(B )
Was ist für P(B ) = 0 ?
Analogie zu bedingten relativen Häufigkeiten
Befragung unter den Studenten der Veranstaltung Statistik I (B)
Nichtraucher
Raucher
Insg.
Männer
74
15
89
Frauen
31
6
37
105
21
126
Insg.
f12X |Y =
f12 n12 / n 15 / 126
=
=
= 15 / 21 = 0.714
f •2 n•2 / n 21/ 126
Interpretation?
Grundlagen - Rechnen mit einfachem Mengenkalkül
367
Rechnen mit einfachem Mengenkalkül
Rechenregeln für bedingte Wahrscheinlichkeiten
Rechenregeln für gewöhnliche Wahrscheinlichkeiten können auf bedingte Wahrscheinlichkeiten übertragen werden. Beispielsweise gilt für P(B) > 0:
P( A1 ∪ A2 | B ) = P( A1 | B ) + P( A2 | B ) , falls A1 ∩ A2 = ∅
P(A1 | B ) = 1 − P( A1 | B ) .
und
Es lässt sich theoretisch zeigen, dass durch P( ⋅ | B ) mit P(B ) > 0 ein Wahrscheinlichkeitsmaß definiert wird. Dieses ordnet den Ereignissen einer passend zu wählenden Ereignisalgebra (vgl. Seite 350) Wahrscheinlichkeiten zu.
Produktsatz
Seien A und B Ereignisse mit P(B) > 0. Dann gilt:
P( A ∩ B) = P( A | B) P(B) .
Falls P( A) > 0, gilt ebenso P( A ∩ B) = P(B | A) P( A) .
Grundlagen - Rechnen mit einfachem Mengenkalkül
368
Rechnen mit einfachem Mengenkalkül
Multiplikationssatz
Für gegebene Ereignisse A1, A2, ..., Ak mit P( A1 ∩K∩ A k −1 ) > 0 gilt:
P( A1 ∩K∩ A k ) = P( A1 ) P( A 2 | A1 ) P( A3 | A1 ∩ A 2 ) ⋅K⋅ P( Ak | A1 ∩K∩ Ak −1 ) .
Beweis: folgt sukzessive aus dem Produktsatz
Beispiel:
Die Entwicklungsabteilung eines Produzenten von Haushaltsgeräten ist in 90% der
Fälle für die Markteinführung der von ihr entwickelten Geräte. Ein positives Votum
der Entwicklungsabteilung führt mit einer Wahrscheinlichkeit von 0.7 bei der
Marketingabteilung ebenfalls zu einem positiven Votum. Sind beide Abteilungen für
die Markteinführung des neuen Gerätes, so entscheidet die Geschäftsleitung dennoch
mit einer Wahrscheinlichkeit von 0.2 dagegen. Ist die Marketingabteilung gegen die
Markteinführung, die Entwicklungsabteilung aber dafür, so stimmt die Geschäftsleitung nur mit einer Wahrscheinlichkeit von 0.4 zu.
Grundlagen - Rechnen mit einfachem Mengenkalkül
369
Rechnen mit einfachem Mengenkalkül
a) Berechnen Sie die Wahrscheinlichkeit dafür, dass die Markteinführung eines neuen
Produktes sowohl von der Geschäftsleitung als auch von der Entwicklungs- und
der Marketingabteilung getragen wird.
b) Mit welcher Wahrscheinlichkeit entscheiden sich Geschäftsleitung und Entwicklungsabteilung für die Markteinführung eines neuen Produktes?
Ereignisse hier:
A 1 : Entwicklungsabteilung ist für die Markteinführung
A 2 : Marketingabteilung ist für die Markteinführung
A 3 : Geschäftsleitung ist für die Markteinführung
Für welche Ereignisse sind Wahrscheinlichkeiten gegeben?
Für welche Ereignisse sollen Wahrscheinlichkeiten berechnet werden?
Gegeben: P ( A1 ) = 0 . 9 , P ( A2 | A1 ) = 0.7 , P(A3 | A1 ∩ A2 ) = 0.2, P(A3 | A1 ∩ A2 ) = 0.4.
Gefragt: a) P ( A1 ∩ A2 ∩ A3 ) , b) P ( A1 ∩ A3 ) .
Grundlagen - Rechnen mit einfachem Mengenkalkül
370
Rechnen mit einfachem Mengenkalkül
0.9
Entwicklungsabteilung
Marketingabteilung
Analogie zu relativen
Häufigkeiten?
0.7
0.2
Geschäftsleitung
A1 ∩ A2 ∩ A3
0.4
A1 ∩ A2 ∩ A3
A2
A1
A2
A1
A3
Grundlagen - Rechnen mit einfachem Mengenkalkül
A3
371
Rechnen mit einfachem Mengenkalkül
a) P ( A1 ∩ A2 ∩ A3 ) = P ( A1 ) P ( A2 | A1 ) P ( A3 | A1 ∩ A2 )
= P ( A1 ) P ( A2 | A1 ) (1 − P (A3 | A1 ∩ A2 ))
= 0.9 ⋅ 0.7 ⋅ (1 − 0.2 )
= 0.504
b)
P ( A1 ∩ A3 ) = P ( A1 ∩ A2 ∩ A3 ) + P (A1 ∩ A2 ∩ A3 )
= P ( A1 ∩ A2 ∩ A3 ) + P ( A1 ) P (A2| A1 ) P (A3| A1 ∩ A2 )
= P ( A1 ∩ A2 ∩ A3 ) + P ( A1 ) (1 − P (A2| A1 )) P (A3| A1 ∩ A2 )
= 0.504 + 0.9 ⋅ (1 − 0.7 ) ⋅ 0.4
= 0.612
Wie groß wären die betreffenden Wahrscheinlichkeiten, falls in jeder Abteilung
per Münzwurf die Entscheidung für oder gegen das Produkt getroffen würde?
Wie groß wäre dann die Wahrscheinlichkeit für A1 ∩ A2 ∩ A3 ?
Grundlagen - Rechnen mit einfachem Mengenkalkül
372
Wann sind zwei
Ereignisse
„unabhängig“?
373
Rechnen mit einfachem Mengenkalkül
Unabhängigkeit von Ereignissen
Ansatz:
P ( A | B ) = P ( A)
„Wahrscheinlichkeit für A hängt nicht vom Eintreten des Ereignisses B ab.“
P( A ∩ B )
= P ( A) , P ( B ) > 0
P (B )
vorausgesetzt
P( A ∩ B )
= P (B ) ,
P ( A)
vorausgesetzt
P ( A) > 0
P ( A ∩ B ) = P ( A ) P (B )
P ( B | A) = P ( B )
Beachte:
Wegen P( A) = P( A ∩ B ) + P( A ∩ B ) und P(B ) = 1 − P(B ) gilt mit P( A | B ) = P( A) :
P( A | B ) =
P ( A ∩ B ) P ( A) − P ( A ∩ B ) P ( A) − P ( A) P ( B )
=
=
= P ( A) = P ( A | B ) .
P(B )
1 − P(B )
1 − P(B )
Grundlagen - Rechnen mit einfachem Mengenkalkül
374
Rechnen mit einfachem Mengenkalkül
Unabhängigkeit von zwei Ereignissen
Zwei Ereignisse A und B heißen stochastisch unabhängig, wenn gilt:
P ( A ∩ B ) = P ( A) P ( B )
P( A | B ) = P( A) mit P(B ) > 0
bzw.
bzw.
P(B | A) = P(B ) mit P( A) > 0.
Für P(A) = 0 und/oder P(B) = 0 definieren wir A und B ebenfalls als
stochastisch unabhängig.
Beispiel: Zweimaliger Münzwurf
Ω = { (W , W ), (Z , W ), (W , Z ), (Z , Z ) }
Betrachte Ereignissse A und B mit:
A = { „beim ersten Wurf Wappen“ } und B = { „beim zweiten Wurf Wappen“ }.
Grundlagen - Rechnen mit einfachem Mengenkalkül
375
Rechnen mit einfachem Mengenkalkül
Laplace-Experiment
Demnach:
P ( A) =
P (B ) =
A
Ω
B
Ω
=
=
P( A ∩ B ) =
{(W ,W ), (W , Z )}
4
{(W ,W ), (Z ,W )}
4
A∩ B
Ω
=
2
= 0.5,
4
=
2
= 0.5,
4
{(W ,W )}
4
P ( A ∩ B ) = P ( A) P ( B )
!
=
=
1
= 0.25.
4
A und B sind stochastisch unabhängig
Ergebnis hier nicht überraschend! In anderen Fällen mag dies anders aussehen.
Grundlagen - Rechnen mit einfachem Mengenkalkül
376
Rechnen mit einfachem Mengenkalkül
Analogie zum Zusammenhang zwischen Merkmalen
Nichtraucher
Raucher
Insg.
Männer
74
15
89
Frauen
31
6
37
105
21
126
Insg.
Wann besteht kein Zusammenhang (empirische Unabhängigkeit)?
!
Von stochastischer Unabhängigkeit generell zu unterscheiden!
Postulat der empirischen Unabhängigkeit (vgl. S. 214):
fij
= f• j
für i = 1, ..., k und j = 1, ..., l
fij = f• j fi•
für i = 1, ..., k und j = 1, ..., l
f i•
Produkt der Randverteilungen ergibt gemeinsame Verteilung
Grundlagen - Rechnen mit einfachem Mengenkalkül
377
Sind disjunkte
Ereignisse
unabhängig?
378
Rechnen mit einfachem Mengenkalkül
Übung:
Beispiel : Mehr als zwei Ereignisse
In einer Urne befinden sich 8 Kugeln, die durchnummeriert sind von 1 bis 8
und sich ansonsten nicht unterscheiden. Eine Kugel wird zufällig gezogen.
Betrachten Sie die folgenden Ereignisse:
A: Es wird eine Zahl kleiner als 5 gezogen,
B: Es wird eine gerade Zahl gezogen,
C: Es wird eine 1, 6, 7 oder 8 gezogen.
Zeigen Sie, dass die Ereignisse A und B und die Ereignisse B und C jeweils
unabhängig sind. Sind auch die Ereignisse A und C unabhängig?
Welche allgemeine Schlussfolgerung können Sie ziehen?
Grundlagen - Rechnen mit einfachem Mengenkalkül
379
Rechnen mit einfachem Mengenkalkül
Weiteres Beispiel : Mehrere Ereignisse
Angenommen, es läge in Analogie zum Beispiel auf Seite 371 eine „stochastische
Entscheidungsstruktur“ gemäß des folgenden Diagramms vor.
0.5
0.5
0.25
1/16
0.5
0.5
0.75
3/16
0.75
3/16
0.5
0.25
1/16
0.75
3/16
0.5
0.25
0.25
0.75
1/16
1/16
3/16
Man möge nachvollziehen, dass die Entscheidungen der einzelnen Entscheidungsstufen paarweise unabhängig sind und dennoch z.B. nicht gilt:
P( A1 | A2 ∩ A3 ) = P( A1 ) bzw. P( A1 ∩ A2 ∩ A3 ) = P( A1 ) P( A2 ) P( A3 ) .
Grundlagen - Rechnen mit einfachem Mengenkalkül
380
Rechnen mit einfachem Mengenkalkül
Unabhängigkeit von mehreren Ereignissen
Die Ereignisse A1, A2, ..., Ak heißen stochastisch unabhängig, wenn gilt:
(
) ( ) ( )
( )
P A i1 ∩ A i2 ∩ K ∩ A il = P A i1 ⋅ P A i2 ⋅K⋅ P A il
Interpretation?
für alle möglichen 1 ≤ i1 < i2 < K < il ≤ k und alle l .
!
Aus der paarweisen Unabhängigkeit folgt i. A. nicht die Unabhängigkeit
der Ereignisse A1, A2, ..., Ak. Ebenso gilt keine „Transitivitätseigenschaft“.
Beispiel : Urnenmodell
Beim Ziehen mit Zurücklegen sind die Ergebnisse der einzelnen Ziehungen
unabhängig.
Beim Ziehen ohne Zurücklegen sind die Ergebnisse der einzelnen Ziehungen
abhängig.
Grundlagen - Rechnen mit einfachem Mengenkalkül
381
Rechnen mit einfachem Mengenkalkül
Aufgabe 43
In einer Filiale eines Mannheimer Kreditinstituts besitzen 80% der Kunden ein
Girokonto und 50% der Kunden ein Sparkonto. Alle Kunden der Filiale verfügen
über mindestens eine der beiden Anlageformen. Dann ist die Wahrscheinlichkeit,
dass ein zufällig ausgewählter Kunde dieser Bank
R
F
sowohl ein Giro- als auch ein Sparkonto besitzt gleich 0.3,
ein Sparkonto besitzt, wenn bereits bekannt ist, dass der Kunde
ein Girokonto hat, gleich 1,
ein Girokonto besitzt, wenn bereits bekannt ist, dass der Kunde
ein Sparkonto hat, gleich 0.4,
höchstens eines von beiden Konten besitzt gleich 0.7.
Grundlagen - Rechnen mit einfachem Mengenkalkül
382
Rechnen mit einfachem Mengenkalkül
Aufgabe 44
Bei der Montage eines Autos wird auf drei Fertigungsstraßen parallel und unabhängig voneinander gearbeitet. Statistische Untersuchungen ergaben für die drei
Fertigungsstraßen folgende Ausfallwahrscheinlichkeiten je Schicht:
Straße 1: 0.09, Straße 2: 0.16, Straße 3: 0.19.
Die Wahrscheinlichkeit, dass während einer Schicht
R
F
alle Fertigungsstraßen ausfallen ist gleich 0.44,
keine der drei Fertigungsstraßen ausfällt ist größer als 0.6,
auf wenigstens einer der drei Fertigungsstraßen ohne Störung
produziert wird ist größer als 0.99.
Grundlagen - Rechnen mit einfachem Mengenkalkül
383
Rechnen mit einfachem Mengenkalkül
Aufgabe 45
Gegeben seien drei Ereignisse A, B und C mit jeweils positiver Eintrittswahrscheinlichkeit, d.h. P(A) > 0, P(B) > 0 und P(C) > 0. Dann gilt stets:
R
F
P ( A | B ) ≤ P ( A) ,
P( A) = P( A | C ) , falls P( A) = P( A | B ) und P(B ) = P(B | C ) ,
P( A ∩ B ) = P( A) P(B ) , falls A ∩ B = ∅ ,
P( A ∪ B | C ) = P( A | C ) + P(B | C ) , falls A ∩ B = ∅,
P( A | C ) = 1, falls C ⊂ A .
Grundlagen - Rechnen mit einfachem Mengenkalkül
384
Rechnen mit einfachem Mengenkalkül
Satz von der totalen Wahrscheinlichkeit und Satz von Bayes
Beispiel: Satz von der totalen Wahrscheinlichkeit
A1
A2
A3
A4
(„Disjunkte Zerlegung“ von Ω)
B
Ω
4
Besonderheit hier:
UA
i
= Ω , wobei A i ∩ A j = ∅ für i ≠ j .
i =1
B = ( B ∩ A 1 ) ∪ (B ∩ A 2 ) ∪ (B ∩ A 3 ) ∪ ( B ∩ A 4 )
P ( B ) = P ( B ∩ A1 ) + P ( B ∩ A 2 ) + P ( B ∩ A 3 ) + P ( B ∩ A 4 )
Warum geht das?
P(B ) = P(B | A1 ) P( A1 ) + P(B | A 2 ) P( A2 ) + P(B | A 3 ) P( A3 ) + P(B | A 4 ) P( A4 )
Grundlagen - Rechnen mit einfachem Mengenkalkül
385
Rechnen mit einfachem Mengenkalkül
Satz von der totalen Wahrscheinlichkeit
Bilden die Ereignisse A1, A2, ..., Ak eine disjunkte Zerlegung von Ω, so gilt:
k
P (B ) = ∑ P (B | A i ) P ( A i ) .
Bedeutung?
i =1
Beispiel: Analogie zu relativen bedingten Häufigkeiten
Nichtraucher
Raucher
Insg.
Männer
74
15
89
Frauen
31
6
37
105
21
126
Insg.
Wie müssten Fragestellungen
im Rahmen von Wahrscheinlichkeiten formuliert werden?
„Anteil der Nichtraucher“ = „Anteil der Nichtraucher unter Männern“ × „Anteil der Männer“
+ „Anteil der Nichtraucher unter Frauen“ × „Anteil der Frauen“
In Zahlen:
f •1 = f11Y | X f1• + f 21Y | X f 2• =
f11
f
f1• + 21 f 2• = f11 + f 21 = f •1 .
f1•
f 2•
Grundlagen - Rechnen mit einfachem Mengenkalkül
386
Rechnen mit einfachem Mengenkalkül
Wegen
P (A j | B ) =
P (A j | B ) =
P (A j ∩ B )
P (B )
gilt nun:
P (B | A j ) P (A j )
k
∑ P(B | A )P( A )
i
i =1
.
i
Satz von Bayes
Bilden die Ereignisse A1, A2, ..., Ak eine disjunkte Zerlegung von Ω, wobei für
mindestens ein i = 1, ..., k, P( Ai ) > 0 und P(B | Ai ) > 0 erfüllt ist. Dann gilt:
P (A j | B ) =
P (B | A j ) P (A j )
k
∑ P(B | A )P( A )
i =1
i
,
j = 1, ..., k.
Bedeutung?
i
Grundlagen - Rechnen mit einfachem Mengenkalkül
387
Rechnen mit einfachem Mengenkalkül
1. Beispiel: Medizinische Diagnostik (aus Fahrmeir, S. 212)
Zur Erkennung von Krankheiten stehen in der Diagnostik medizinische Tests zur
Verfügung, die so angelegt sein sollen, dass sie eine Erkrankung erkennen, wenn sie
tatsächlich vorliegt, und nicht reagieren, wenn der entsprechende Patient nicht
erkrankt ist. Nehmen wir nun an, es geht um die Erkennung einer sehr seltenen
Krankheit. Mit der Bezeichnung
A = { Patient ist krank },
B = { Testergebnis ist positiv }
lassen sich aus der Erprobungsphase des Tests folgende Wahrscheinlichkeiten als bekannt annehmen:
P ( A) = 0.001,
P(B | A) = 0.98,
P (B | A ) = 0.03.
(„Sensitivität“)
(„Spezifität“)
Interpretation?
Grundlagen - Rechnen mit einfachem Mengenkalkül
388
Rechnen mit einfachem Mengenkalkül
Frage: Mit welcher Wahrscheinlichkeit ist ein Patient tatsächlich erkrankt, falls
das Testergebnis positiv ausfällt?
Formel von Bayes
P( A | B ) =
P (B | A)P ( A)
P (B | A)P ( A) + P (B | A ) P (A )
=
0.98 ⋅ 0.001
= 0.032
0.98 ⋅ 0.001 + 0.03 ⋅ 0.999
Bedeutung?
2. Beispiel: Geldanlage (aus Fahrmeir, S. 214)
In diesem Beispiel interessieren die Wahrscheinlichkeiten für bestimmte Tendenzen in
der Kursentwicklung, aufgrund dessen man über die Anlage seines Kapitals entscheidet.
Es seien drei Ereignisse möglich:
A1={Der Zins fällt um 0.5%},
A2={Der Zins bleibt unverändert} und
A3={Der Zins steigt um 0.5%}.
Grundlagen - Rechnen mit einfachem Mengenkalkül
389
Rechnen mit einfachem Mengenkalkül
Nach eigenen subjektiven (!) Einschätzungen nehmen wir folgende Wahrscheinlichkeiten für das Eintreten obiger Ereignisse an:
P ( A1 ) = 0.1, P( A 2 ) = 0.6 und P ( A 3 ) = 0.3 .
Als Ereignis B ziehen wir die Prognose eines Anlageberaters {Der Zins steigt um 0.5%}
hinzu. Aufgrund von Erfahrungswerten (!) sei zudem bekannt:
P (B | A1 ) = 0.15, P(B | A 2 ) = 0.30 und P(B | A 3 ) = 0.75 .
Interpretation?
Da sich ein potentieller Anleger insbesondere für die Wahrscheinlichkeit einer steigenden Zinsentwicklung interessiert, ist die verbesserte Wahrscheinlichkeit für das Eintreten von A3, also für einen Zinsanstieg, nach der Beratung durch einen Anlageberater
eine wichtige Information. Mit welcher Wahrscheinlichkeit tritt also nach positiver Einschätzung des Beraters tatsächlich ein Zinsanstieg ein?
Grundlagen - Rechnen mit einfachem Mengenkalkül
390
Rechnen mit einfachem Mengenkalkül
Formel von Bayes
P( A3 | B ) =
P(B | A3 ) P( A3 )
3
∑ P (B | A ) P ( A )
i =1
i
Bedeutung?
=
0.75 ⋅ 0.3
= 0.5357
0.15 ⋅ 0.1 + 0.30 ⋅ 0.6 + 0.75 ⋅ 0.3
i
Problematik vorhanden?
Bemerkung:
Im Zusammenhang mit dem Satz von Bayes werden die Wahrscheinlichkeiten
P ( A i ) auch als a-priori Wahrscheinlichkeiten und P( A i | B ) als a-posteriori
Wahrscheinlichkeiten bezeichnet. Diese a-priori Wahrscheinlichkeiten sind mit
den objektiven a-priori Wahrscheinlichkeiten (vgl. S. 333) nicht gleichzusetzen.
Diese Wahrscheinlichkeiten basieren auf Vorinformation der Vergangenheit oder
auf subjektiven Einschätzungen. Sie werden dazu verwendet, Wahrscheinlichkeiten nach Eintreten eines bestimmten Ereignisses neu („besser“) zu bewerten.
Eine konsequente Fortführung dieses Ansatzes findet sich in der sogenannten
„Bayes-Statistik“, die heute einen eigenen Zweig der Statistik bildet.
Grundlagen - Rechnen mit einfachem Mengenkalkül
391
Rechnen mit einfachem Mengenkalkül
Aufgabe 46
Die Bevölkerung eines Landes sezte sich im Wesentlichen aus vier verschiedenen
Bevölkerungsgruppen zusammen. Die überwiegende Mehrheit von 70% gehöre
Gruppe A an, 12% Gruppe B, 15% Gruppe C und 3% Gruppe D.
In einem Referendum soll über den Beitritt des Landes zu einer größeren Staatengemeinschaft („Ja“ oder „Nein“) entschieden werden. Es sei durch Umfragen bekannt, dass 80% von Gruppe A gegen den Beitritt sind. In Gruppe B befürworten
dagegen 60% den Beitritt, in Gruppe C 70% und in Gruppe D gar 90%.
Die Wahrscheinlichkeit, dass
R
F
ein zufällig ausgewählter Einwohner für den Beitritt stimmt,
ist größer als 0.3,
ein zufällig ausgewählter Beitrittsbefürworter aus Gruppe A
stammt, ist kleiner als 0.5.
Grundlagen - Rechnen mit einfachem Mengenkalkül
392
Rechnen mit einfachem Mengenkalkül
Aufgabe 47
Um zu prüfen, ob eine Person eine bestimmte Krankheit K hat (K+) oder nicht
(K-), wird ein Test T durchgeführt, der positiv (T+) oder negativ (T-) ausfallen
kann (T+ deutet auf eine Erkrankung hin), Die Terminologie lautet danach
Prävalenz = P(K+),
Spezifität = P(T-| K-),
Sensitivität = P(T+| K+).
In Deutschland ist die Prävalenz von HIV in heterosexuellen Männern, die keiner
bekannten Risikogruppe angehören, etwa 0.01%. Die Häufigkeit falsch-positiver
HIV-Tests, P(T+| K-) beträgt etwa 0.01%. Die Sensitivität des HIV-Tests beträgt
etwa 99.9%.
R
F
Die Wahrscheinlichkeit, HIV-infiziert zu sein, wenn der
HIV-Test positiv ausfällt, ist größer als 0.6.
Grundlagen - Rechnen mit einfachem Mengenkalkül
393
Eindimensionale Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Mehr über Zufallsvariablen und Verteilungen
Eindimensionale Zufallsvariablen
394
Diskrete Zufallsvariablen
Zufallsvariable und Wahrscheinlichkeitsverteilung
Ziel: Ergebnisse eines Zufallsvorgangs sollen (nur) durch Zahlen ausgedrückt werden
1. Beispiel: Viermaliger Münzwurf
Ω = {(W , W , W , W ), (Z , W , W , W ), (W , Z , W , W ), (W , W , Z , W ),
(W ,W ,W , Z ), (Z , Z ,W ,W ), (Z ,W , Z ,W ), (Z ,W ,W , Z ),
(W , Z , Z ,W ), (W , Z ,W , Z ), (W ,W , Z , Z ), (W , Z , Z , Z ),
(Z ,W , Z , Z ), (Z , Z ,W , Z ), (Z , Z , Z ,W ), (Z , Z , Z , Z )}
Angenommen, wir interessieren uns nur für die Anzahl von „Wappen“
nach viermaligem Münzwurf.
Dann betrachten wir eine Variable X = „Anzahl von Wappen“, die nur die
Werte 0, 1, 2, 3 oder 4 annehmen kann. D.h. formal ist X eine Abbildung
X : Ω → Ω∗ = { 0, 1, 2, 3, 4 }
ϖ a X (ϖ ) = x.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
395
Diskrete Zufallsvariablen
Hier gilt z.B. für ϖ 1 = (W , W , W , W ) und ϖ 5 = (W , W , W , Z )
X (ϖ 1 ) = 4
bzw. X (ϖ 5 ) = 3.
Mit anderen Worten, betrachten wir nun einen neuen Ereignisraum Ω* mit
Ω∗ = { 0, 1, 2, 3, 4 }.
Zur Berechnung der Wahrscheinlichkeit von Ereignissen auf dem Ereignisraum Ω*
können wir unter Kenntnis der Definition von X auf den ursprünglichen Ereignisraum Ω rückprojizieren.
Beispielsweise besteht das Ereignis A* =„Es tritt höchstens einmal Wappen auf“
also
A∗ ⊂ Ω∗ mit
A∗ = { 0, 1 }
aus dem ursprünglichen Ereignis A ⊂ Ω mit
A = { (Z , Z , Z , Z ), (W , Z , Z , Z ), (Z , W , Z , Z ), (Z , Z ,W , Z ), (Z , Z , Z , W ) }.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
396
Diskrete Zufallsvariablen
Damit ist die Wahrscheinlichkeit für das Ereignis A* gegeben durch
( )
({
P A∗ = P ( X ≤ 1) = P ϖ | X (ϖ ) ∈ A∗
Ω
ω14
ω2
ω13
ω12
ω15
ω3
ω4
12 ,ϖ 13 ,ϖ 14 ,ϖ 15 ,ϖ 16 }) =
5
.
16
X(ω12)
A
ω1
} ) = P({ϖ
ω5
ω6
ω11
ω16
X(ω16)
ω10
ω7
ω9
-2
-1
0
1
0
1
2
3
4
5
ω8
A*
Da die Werte von X die Ergebnisse eines Zufallsvorgangs
sind, bezeichnen wir X auch als „Zufallsvariable“.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
397
Diskrete Zufallsvariablen
2. Beispiel: Zweimaliger Würfelwurf
Ω = {ϖ ij | ϖ ij = (i, j ), 1 ≤ i, j ≤ 6 }
Betrachte Zufallsvarialbe X = Augensumme.
Dann gilt z.B. X(ω11) = 2, X(ω23) = 5 und X(ω55) = 10.
Analog zu den Überlegungen im 1. Beispiel gilt z.B. :
P(„Augensumme = 5“) = P(X = 5) = P({ω14, ω41, ω23, ω32 }) = 4/36 = 1/9.
3. Beispiel: Mietspiegelerhebung
Ω = { mietspiegelrelevante Wohnungen }
Betrachte z.B. X = Nettomiete, d.h.
X : Ω → Ω∗ = IR + = { x : x ≥ 0 }.
∗
Interessierendes Ereignis z.B. A = { X ≤ 1000 }.
Beachte:
Hier Kenntnis von Ω und der Definition von X wenig hilfreich zur Berechnung der
Wahrscheinlichkeit von A*. Als interessierender Ereignisraum wird deshalb gleich
ganz IR betrachtet und die „Wahrscheinlichkeitsverteilung“ von X auf IR .
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
398
Diskrete Zufallsvariablen
Zufallsvariable
Eine Variable oder ein Merkmal X, dessen Werte oder Ausprägungen die Ergebnisse
eines Zufallsvorgangs sind, heißt Zufallsvariable. Die Zahl x ∈ IR , die X bei einer
Durchführung des Zufallsvorgangs annimmt, heißt Realisierung oder Wert von X.
Bemerkung
Wir betrachten im Folgenden also nur noch den Ereignisraum mit reellen Zahlen.
Die interessierenden Ereignisse sind dann Teilmengen davon und z.B. von der Art
bzw. allgemein
{ X = a} , { X ≤ a} ,{ X > a} , { a ≤ X ≤ b}
{ X ∈I } ,
wobei I ein abgeschlossenes, offenes oder halboffenes Intervall ist. Weitere durch
X definierte zulässige Bereiche B ergeben sich daraus durch Komplementbildung
und abzählbare Durchschnitts- und Vereinigungsbildung.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
399
Diskrete Zufallsvariablen
!
Die grundlegenden Rechengesetze des Mengenkalküls bleiben erhalten!
Beispiele:
Sei X Zufallsvariable mit
P ( X = 1) = 0.5,
P( X = 2 ) = 0.3,
und
P( X = 3) = 0.2.
P (1 ≤ X ≤ 2 ) = 0.5 + 0.3 = 0.8
Sei Y Zufallsvariable mit
P (Y ∈ (− ∞, 0]) = 0.5,
P(Y ∈ (0, 10]) = 0.3, und P(Y ∈ [8, ∞ )) = 0.25.
P (Y > 0 ) = 1 − 0.5 = 0.5
P(Y ∈ [8, 10]) = P (Y ∈ (0, 10]) + P (Y ≥ 8) − P (Y > 0 )
= 0.3 + 0.25 − 0.5 = 0.05
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
400
Diskrete Zufallsvariablen
Wahrscheinlichkeitsverteilung
Die Menge aller Wahrscheinlichkeiten P( X ∈ I ) oder
P( X ∈ B ) für Intervalle I
oder zulässige Bereiche B nennt man auch Wahrscheinlichkeitsverteilung (von X).
Was folgt ...
Unterscheide generell
Wahrscheinlichkeitsverteilung von
diskreten Zufallsvariablen
Wahrscheinlichkeit ...
„über addieren“
stetigen Zufallsvariablen
„über integrieren“ (Flächen!)
zunächst: Rechnen mit diskreten Zufallsvariablen
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
401
Diskrete Zufallsvariablen
Verteilungen und Parameter von diskreten Zufallsvariablen
Definition und Verteilung
Diskrete Zufallsvariable und Wahrscheinlichkeitsfunktion
Eine Zufallsvariable X heißt diskret, falls sie nur endlich oder abzählbar unendlich
viele Werte a1 , a2 , K , ak , K annehmen kann. Die Wahrscheinlichkeitsverteilung
von X ist durch die Wahrscheinlichkeiten
P (X = a j ) = p j , j = 1, K, k ,
Träger
gegeben. Die Funktion
 P (X = a j ) , x = a j ∈ {a1 , a2 ,K , ak ,K}
f (x ) = 
0,
sonst

Analogie in der
deskriptiven Statistik?
heißt dabei Wahrscheinlichkeitsfunktion von X.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
402
Diskrete Zufallsvariablen
Verteilungsfunktion einer diskreten Zufallsvariable
Gegeben sei eine diskrete Zufallsvariable mit Wahrscheinlichkeitsfunktion f ( x ) .
Dann ist durch
F (x ) = P( X ≤ x ) =
∑ f (a )
j:a j ≤ x
die Verteilungsfunktion von X gegeben.
j
Analogie in der deskriptiven Statistik?
Welche grundlegenden Eigenschaften besitzt die Verteilungsfunktion
einer diskreten Zufallsvariable?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
403
Diskrete Zufallsvariablen
Übung:
Gegeben sei eine diskrete Zufallsvariable mit
P ( X = 1) = 0.5,
P( X = 2 ) = 0.3,
und
P( X = 3) = 0.2.
Zeichnen Sie die Wahrscheinlichkeitsfunktion und die Verteilungsfunktion von X.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
404
Diskrete Zufallsvariablen
=> Übungen
Eine faire Münze wird viermal geworfen, und man interessiert sich dafür, wie oft im
Ergebnis „Zahl“ erscheint. Die Zufallsvariable X gebe die Anzahl von „Zahl“ an.
a) Berechnen und zeichnen Sie die Verteilungsfunktion von X.
b) Berechnen Sie folgende Wahrscheinlichkeiten:
P (0 < X ≤ 2 ), P ( X > 1) und P( X < 3) .
Hinweis: Nutzen Sie die Ereignismenge Ω auf Seite 395.
Teil a):
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
405
Diskrete Zufallsvariablen
Teil b):
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
406
Herunterladen