Statistik, Sommersemester 2012

Werbung
Universität Erfurt
Sommersemester 2012 - Statistik
Teil B:
Wahrscheinlichkeitsrechnung
Dr. Matthias Arnold
157
Universität Erfurt
Sommersemester 2012 - Statistik
Kapitel 7: Zufällige Ereignisse und ihre
Wahrscheinlichkeiten
Motivation
Bisher:
Beschreibung/Komprimierung/Vereinfachung von
Datensätzen (beobachteten Merkmalsausprägungen) durch
• Grafiken
• Tabellen
• Kennzahlen
Jetzt:
Treffe auf Basis beobachteter Merkmalsausprägungen
Aussagen über zukünftige, unsichere“ Beobachtungen
”
Dr. Matthias Arnold
158
Universität Erfurt
Sommersemester 2012 - Statistik
Die Theorie der Wahrscheinlichkeit ist ein System,
”
das uns beim Raten hilft.“
R. Feynman, US-amerikanischer Physiker und Nobelpreisträger
(1918 – 1988)
Dr. Matthias Arnold
159
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.1
Ein Investitionsprojekt ist in Gefahr, wenn es während der
Bauphase zu viel regnet oder der Dollarkurs steigt. Bekannt sei:
Regenwahrscheinlichkeit
Wahrscheinlichkeit dass Dollar steigt
=
=
10%
40%
→ wie wahrscheinlich ist Gefährdung des Investitionsprojekts?
Dr. Matthias Arnold
160
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 7.1
Ein Zufallsexperiment ist ein Vorgang,
der mehrere, sich gegenseitig ausschließende mögliche
Ausgänge besitzt
dessen Ausgang nicht mit Sicherheit vorhergesagt werden
kann → Zufall“
”
der unter identischen Rahmenbedingungen beliebig oft
wiederholbar ist → Experiment“
”
Dr. Matthias Arnold
161
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 7.1 (Fortsetzung)
Die n möglichen Ausgänge ω1 , ω2 , . . . , ωn eines Zufallsexperiments heißen Elementarereignisse
Die Menge
Ω = {ω1 , ω2 , . . . , ωn }
aller Elementarereignisse heißt Ergebnismenge
Teilmengen A, B ⊆ Ω der Ergebnismenge heißen Ereignisse
Dr. Matthias Arnold
162
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.2
a) Einmaliges Würfeln entspricht Zufallsexperiment mit
Ausgängen 1,...,6
Ergebnismenge Ω
Elementarereignisse
Ereignis A : gerade Zahl“
”
Ereignis B : ungerade Zahl“
”
Ereignis C : Primzahl“
”
Ereignis D : Zahl größer 3“
”
Dr. Matthias Arnold
{1, 2, 3, 4, 5, 6}
{1}, {2}, {3}, {4}, {5}, {6}
{2, 4, 6}
{1, 3, 5}
{2, 3, 5}
{4, 5, 6}
163
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.2 (Fortsetzung)
b) Zweimaliges Würfeln → Elementarereignisse jetzt
Zahlenpaare, die sich aus {1, ..., 6} zusammensetzen
Ω = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3),
(2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),
(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3),
(5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)}
= {1, 2, 3, 4, 5, 6} ⊗ {1, 2, 3, 4, 5, 6}
(⊗ =Kartesisches Produkt=Menge aller geordneten Paare (a, b)
mit a ∈ A, b ∈ B)
Dr. Matthias Arnold
164
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.2 (Fortsetzung)
b) Zweimaliges Würfeln (Fortsetzung)
Ergebnismenge Ω
Elementarereignisse
Ereignis A : Augensumme=10“
”
B : nur ungerade Zahlen“
”
C : gerade Zahl in Wurf 1“
”
Dr. Matthias Arnold
{(1, 1), (1, 2), ..., (1, 6),
(2, 1), ..., (6, 5), (6, 6)}
{(1, 1)}, ..., {(6, 6)}
{(4, 6), (5, 5), (6, 4)}
{(1, 1), (1, 3), (1, 5),
(3, 1), ..., (5, 3), (5, 5)}
{(2, 1), (2, 2), ..., (2, 6),
(4, 1), ..., (6, 5), (6, 6)}
165
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 7.2
Betrachte Zufallsexperiment mit Ergebnismenge Ω und Ereignisse
A, B ⊆ Ω. Die Menge derjenigen Elementarereignisse ωi , die
a) sowohl in A als auch in B liegen, heißt Schnittmenge von A
und B (kurz: A ∩ B)
b) in A oder in B liegen, heißt Vereinigungsmenge von A und B
(kurz: A ∪ B)
c) in A aber nicht in B liegen, heißt Differenzmenge von A und
B (kurz: A \ B)
d) nicht in A liegen, heißt Komplementärmenge zu A (kurz: Ā);
Weiterhin heißen A und B disjunkt, falls ihre Schnittmenge die
leere Menge ist (A ∩ B = ∅)
Dr. Matthias Arnold
166
Universität Erfurt
Sommersemester 2012 - Statistik
Schnittmenge
a) Venn-Diagramm: A ∩ B, vgl. Definition 7.2 a)
Dr. Matthias Arnold
167
Universität Erfurt
Sommersemester 2012 - Statistik
Vereinigungsmenge
b) Venn-Diagramm: A ∪ B, vgl. Definition 7.2 b)
Dr. Matthias Arnold
168
Universität Erfurt
Sommersemester 2012 - Statistik
Differenzmenge
c) Venn-Diagramm: A \ B, vgl. Definition 7.2 c)
Dr. Matthias Arnold
169
Universität Erfurt
Sommersemester 2012 - Statistik
Komplementärmenge
d) Venn-Diagramm: Ā, vgl. Definition 7.2 d)
Dr. Matthias Arnold
170
Universität Erfurt
Sommersemester 2012 - Statistik
Disjunkte Mengen
e) Venn-Diagramm: A und B disjunkt, vgl. Definition 7.2
Dr. Matthias Arnold
171
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.3
a) Einmaliges Würfeln, vgl. Beispiel 7.2 a);
Für die betrachteten Ereignisse ergibt sich:
A ∩ B = gerade und ungerade Zahl
= ∅
A ∩ C = gerade Zahl und Primahl
= {2}
B ∪ D = ungerade Zahl oder Zahl größer als 3 = {1, 3, 4, 5, 6}
C \ D = Primzahl, die nicht größer als 3 ist
Ā = ungerade Zahl
Dr. Matthias Arnold
= {2, 3}
= B
172
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.3 (Fortsetzung)
b) Zweimaliges Würfeln, vgl. Beispiel 7.2 b);
Für die betrachteten Ereignisse ergibt sich:
A ∩ B = Augensumme=10
+nur ungerade Zahlen
= {(5, 5)}
A ∩ C = Augensumme=10
+gerade Zahl in Wurf 1
= {(4, 6), (6, 4)}
B ∩ C = nur ungerade Zahlen
+gerade Zahl in Wurf 1
= ∅
A ∪ C = Augensumme=10
oder gerade Zahl in Wurf 1
= {C, (5, 5)}
A \ B = Augensumme=10
+mindestens eine gerade Zahl = {(4, 6), (6, 4)}
Dr. Matthias Arnold
173
Universität Erfurt
Sommersemester 2012 - Statistik
Bemerkung
a) Wiederhole Zufallsexperiment mit K Elementarereignissen
n-mal → das zusammengesetzte Zufallsexperiment besitzt K n
Elementarereignisse
Betrachte etwa Beispiel 7.2 b), n = 2maliges Würfeln (K = 6)
→ {1, 2, 3, 4, 5, 6} ⊗ {1, 2, 3, 4, 5, 6} Elementarereignisse:
(1, 1), ..., (1, 6), (2, 1), ..., (2, 6), ..., (6, 1), ..., (6, 6)
6 Ereignisse
6 Ereignisse
6 Ereignisse
=6×6=62 =K n Elementarereignisse
→ Ω enthält 36 Elementarereignisse
Dr. Matthias Arnold
Bezeichnung: | Ω | = 36
174
Universität Erfurt
Sommersemester 2012 - Statistik
Bemerkung (Fortsetzung)
b) Bisher: Definition von Ereignissen, Mengen, Vereinigungen,
Schnitten,...
→ Jetzt von Interesse: Wie wahrscheinlich ist Eintritt eines
bestimmten Ereignisses?
Dr. Matthias Arnold
Beispiel 7.2 b), zweimaliges Würfeln: Wahrscheinlichkeit des
Eintritts von Ereignis A (Augensumme 10), B (nur ungerade
Zahlen), A ∪ B,...?
175
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 7.3
Ein Zufallsexperiment, bei dem alle Elementarereignisse mit
gleicher Wahrscheinlichkeit eintreten, heißt Laplace-Experiment. In
einem solchen Experiment ist die Wahrscheinlichkeit für das
Eintreten eines Ereignisses A ⊆ Ω gegeben durch
P (A) =
=
Dr. Matthias Arnold
|A|
|Ω|
Anzahl der in A enthaltenen Elementarereignisse
Anzahl aller möglichen Elementarereignisse
176
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.4
Zweimaliges Würfeln wie in Beispiel 7.2 b) entspricht einem Laplace-Experiment, da jedes Elementarereignis mit Wahrscheinlichkeit 1/36 eintritt
Ereignis
|·|
3
P (·)
3/36
{(1, 1), ..., (5, 5)}
9
9/36
{(2, 1), ..., (6, 6)}
18
18/36
verbal
A : Augensumme=10 “
”
mengentheoretisch
{(4, 6), (5, 5), (6, 4)}
B : nur ungerade Zahlen “
”
C : gerade Zahl in Wurf 1 “
”
Einmaliges Würfeln, vgl. Beispiel 7.2 a): Analog
Dr. Matthias Arnold
177
Universität Erfurt
Sommersemester 2012 - Statistik
Bemerkung
Problem: Nicht immer liegt Laplace-Experiment vor
Beispiel: Gezinkter Würfel mit
P(Augenzahl=6) = 1/3 und
P(Augenzahl=i) =
2/3
= 2/15, i = 1, ..., 5
5
→ allgemeinerer Wahrscheinlichkeitsbegriff notwendig
Dr. Matthias Arnold
178
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 7.4
Eine Abbildung P, die allen Ereignissen A ⊆ Ω eines
Zufallsexperiments eine Zahl P (A) zuordnet und die
Kolmogoroff’schen Axiome
0 ≤ P (A) ≤ 1 für alle A ⊆ Ω
P (Ω) = 1
P (A ∪ B) = P (A) + P (B) für alle A, B ⊆ Ω mit A ∩ B = ∅
erfüllt, heißt Wahrscheinlichkeitsmaß.
Dr. Matthias Arnold
179
Universität Erfurt
Sommersemester 2012 - Statistik
Bemerkung
Rechenregeln für Wahrscheinlichkeiten (ergeben sich aus
Kolmogoroff’schen Axiomen)
P (∅)
= 0
P (Ā)
= 1 − P (A)
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
P (A)
Dr. Matthias Arnold
=
ωi ∈A
P ({ωi })
180
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.5
Landtag NRW (Zusammensetzung nach Partei und Geschlecht)
CDU SPD Grüne FDP Linke
männlich
57
48
11
11
5
132
weiblich
10
19
12
2
6
49
67
67
23
13
11
181
zufällige Auswahl eines Landtagsmitglieds → LaplaceExperiment, jedes Elementarereignis (=Landtagsmitglied)
kann mit gleicher Wahrscheinlichkeit ausgewählt werden
Ω = Alle Mitglieder des Landtags“ → |Ω| = 181
”
Dr. Matthias Arnold
181
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.5 (Fortsetzung)
Definiere nun Ereignisse
• A = weibliche Person“
”
• B = SPD-zugehörig“
”
P (B) = 67/181 ≈ 0, 37
P (A ∪ B) = 97/181 ≈ 0, 54
P (A ∩ B) = 19/181 ≈ 0, 1
Dr. Matthias Arnold
182
Universität Erfurt
Sommersemester 2012 - Statistik
bedingte Wahrscheinlichkeiten
andere Frage: Wie wahrscheinlich ist SPD-Zugehörigkeit bei
weiblichen Landtagsmitgliedern?
Formell: → P (B gegeben A) bzw. P (B | A)
→ bedingte Wahrscheinlichkeit: Beschränkung der möglichen
Ereignisse auf eine Teilmenge von Ω (hier: A)
Dr. Matthias Arnold
183
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.5 (Fortsetzung)
Venn-Diagramm: Bedingte Wahrscheinlichkeit
• Hellgrau: Reduzierte Ergebnismenge (hier: weibliche Personen)
• Dunkelgrau: Teilmenge der reduzierten Ergebnismenge, dessen
Eintrittswahrscheinlichkeit gesucht wird (hier: SPD-Mitgl., w.)
• Rest (weißer Bereich): Uninteressant
Dr. Matthias Arnold
184
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 7.5
Sei P (A) > 0. Dann heißt
P (B | A) =
P (A ∩ B)
P (A)
bedingte Wahrscheinlichkeit von B gegeben A.
Beispiel 7.6
(Landtag NRW, vgl. Beispiel 7.5)
P (SPD | weiblich) = P (B | A) =
=
Dr. Matthias Arnold
19
= 0, 388
49
P (A ∩ B)
19/181
=
P (A)
49/181
185
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.7
a) Dreimaliger Münzwurf : Kopf (K) oder Zahl (Z)
Ω = {(Z, Z, Z), (Z, Z, K), (Z, K, Z), (K, Z, Z), (K, K, K),
(K, K, Z), (K, Z, K), (Z, K, K)}
Ereignis A : Mindestens 1× Zahl
Ereignis B : Mindestens 2× Kopf
Gesucht: P (B | A) → reduzierte Ergebnismenge A
A = {(Z, Z, Z), (Z, Z, K), (Z, K, Z), (K, Z, Z),
(K, K, Z), (K, Z, K), (Z, K, K)}
Ereignisse mit 2× Kopf
→ P (B | A) = 3/7 (da |A| = 7)
Dr. Matthias Arnold
186
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.7 (Fortsetzung)
a) Dreimaliger Münzwurf (Fortsetzung)
Alternative Berechnung von P (B | A) mit Def. 7.5
• |Ω| = 8
• P (A) = 7/8
• A ∩ B = {(K, K, Z), (K, Z, K), (Z, K, K)}
→ P (A ∩ B) = 3/8
→ P (B | A) =
Dr. Matthias Arnold
3/8
3
=
7/8
7
187
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.7 (Fortsetzung)
b) Zweimaliges Würfeln, vergleiche Beispiel 7.2 b)
Neben Ereignissen A − C definiere
D = ungerade Zahl in Wurf 2“
”
Zur Erinnerung: C = gerade Zahl in Wurf 1“
”
C
=
{(2, 1), ..., (2, 6), (4, 1), ..., (6, 6)}
→ |C| = 18 → P(C) = 1/2 (|Ω| = 36)
D
=
{(1, 1), ..., (1, 5), (2, 1), ..., (6, 5)}
→ |D| = 18 → P(D) = 1/2
C ∩D
=
{(2, 1), (2, 3), (2, 5), (4, 1), ..., (6, 5)}
→ |C ∩ D| = 9 → P(C ∩ D) = 1/4
Dr. Matthias Arnold
188
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.7 (Fortsetzung)
b) Zweimaliges Würfeln (Fortsetzung)
Gesucht: P( Wurf 2 ungerade“| Wurf 1 gerade“) :
”
”
P (D | C) =
P (D ∩ C)
1/4
1
=
= = P (D)
P (C)
1/2
2
→ Ereignis C hat keinen Einfluss auf Ereignis D, beide
Ereignisse hängen nicht voneinander ab
Dr. Matthias Arnold
189
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 7.6
Gilt für zwei Ereignisse A und B mit P (A) > 0 und P (B) > 0
P (A | B) = P (A)
und
P (B | A) = P (B),
so heißen diese stochastisch unabhängig.
Bemerkung
Die Aussage A und B stochastisch unabhängig“ ist äquivalent zu
”
P (A ∩ B) = P (A) · P (B)
Dr. Matthias Arnold
190
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.8
(Investitionsprojekt, vergleiche Beispiel 7.1)
A = zuviel Regen“ mit P (A) = 0, 1
”
B = Dollarkurs steigt“ mit P (B) = 0, 4
”
→ P (Investitionsprojekt in Gefahr) = P (A ∪ B)
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
= P (A) + P (B) − P (A) · P (B)
= 0, 1 + 0, 4 − 0, 1 · 0, 4
= 0, 46
Zu : Siehe Bemerkung nach Definition 7.4
Zu : A und B stochastisch unabhängig (plausible
Annahme) → wende Bemerkung nach Definition 7.6 an
Dr. Matthias Arnold
191
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.9
a) Stochastische Unabhängigkeit in der Öffentlichkeit: Mann für
Millionen (Westdeutsche Allgemeine Zeitung, 30.09.2010)
Bereits zum zweiten Mal in diesem Jahr hat ein Mann aus
”
dem US-Staat Missouri einen Millionengewinn mit
Rubbellosen einkassiert. Im Juni hatte der 57-Jährige beim
’100 Million Dollar Blockbuster’ eine Million gewonnen. Nun
gelang ihm die Sensation erneut, diesmal waren es gleich zwei
Millionen, die er beim ’Mega Monopoly’ gewann. Die
Chancen, bei einem der beiden Spiele den Höchstbetrag zu
gewinnen, lägen bei 1:2,28 Millionen, heißt es. Die Chancen,
gleich bei beiden Spielen abzusahnen, seien kaum zu
berechnen, da sie unabhängig voneinander seien.“
Dr. Matthias Arnold
192
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.9 (Fortsetzung)
a) Mann für Millionen (Fortsetzung)
Definiere
A = Gewinn beim 100 Million Dollar Blockbuster“
”
B = Gewinn beim Mega Monopoly“
”
Bekannt: P (A) = P (B) = 1 : 2, 28 Mio. und A und B
unabhängig
→ P (Gewinn bei beiden Spielen) = P (A ∩ B)
= P (A) · P (B)
≈ 1 : 5, 2 Billionen
Dr. Matthias Arnold
193
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.9 (Fortsetzung)
b) Bedingte Wahrscheinlichkeiten in der Öffentlichkeit 1:
Prozess gegen O. J. Simpson (1995)
• M. Dershowitz (Strafverteidiger): ...an infinitesimal
”
percentage - certainly fewer than 1 out of 2.500 - of men who
slap or beat their domestic partners go on to murder them“:
→ P (M |S) < 1/2.500
(M= Mann ermordet Ehefrau“, S= Mann schlägt Ehefrau“)
”
”
• Prozessurteil: Freispruch
Dr. Matthias Arnold
194
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.9 (Fortsetzung)
• Aber: Definiere zusätzlich m= Ehefrau wird ermordet“
”
→ P (M |{S ∩ m}) ≈ 0, 9 (vgl. Good, 1996)
• In Worten: Nur wenige schlagende Ehemänner bringen ihre
Frau um, aber wenn eine ermordete Frau von ihrem Mann
geschlagen wurde, dann ist der Mann mit hoher
Wahrscheinlichkeit auch der Täter
• Details:
Dershowitz (1996), Reasonable Doubts: The O.J. Simpson
Case and the Criminal Justice System, New York, 1996;
Good (1996), When batterer becomes murderer, Nature 381
Dr. Matthias Arnold
195
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 7.9 (Fortsetzung)
c) Bedingte Wahrscheinlichkeiten in der Öffentlichkeit 2:
Schäferhund besonders bissig (US-Studie)
Vorsicht, Schäferhund-Besitzer! Eine US-Studie fand heraus:
”
Am häufigsten werden Schäferhund-Herrchen von ihren Tieren
gebissen. Dann folgen Chow-Chows und Collies. Die
friedlichsten Hunde sind Pudel und Golden Retriever. Hunde,
die in einem Haushalt mit Kindern leben, beißen eher zu als
Hunde von Singles.“
→ Aussage:
P ( Schäferhund“| Biss“) > P ( Chow-Chow (etc.)“| Biss“)
”
”
”
”
Eigentlich jedoch von Interesse:
P ( Biss“| Schäferhund“) > P ( Biss“| Chow-Chow (etc.)“)
”
”
”
”
Dr. Matthias Arnold
196
Universität Erfurt
Sommersemester 2012 - Statistik
Bemerkung
Fazit/Zusammenfassung Kapitel 7
Zufallsexperiment, Ergebnismenge, Ereignisse
klassischer (Laplace) und axiomatischer (Kolmogoroff)
Wahrscheinlichkeitsbegriff
bedingte Wahrscheinlichkeit und stochastische
Unabhängigkeit
Vorsicht bei der Interpretation bedingter Wahrscheinlichkeiten
Dr. Matthias Arnold
197
Universität Erfurt
Sommersemester 2012 - Statistik
Kapitel 8: Zufallsvariablen
Kapitel 7: Betrachtung von Ereignissen ωi , ωj , A, B, ... ⊂ Ω
Jetzt: Ordne Ereignissen Zahlen zu
Dr. Matthias Arnold
198
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 8.1
Eine Abbildung X, deren mögliche Werte vom Ausgang eines
Zufallsexperiments abhängen, heißt Zufallsvariable. Formell:
X:Ω→R
X ordnet somit jedem Elementarereignis eine reelle Zahl zu. Die
möglichen Werte ω → X(ω) einer Zufallsvariablen nennt man
Realisationen. Weiterhin heißt X
diskrete Zufallsvariable, falls sie nur endlich viele oder
abzählbar viele Werte annehmen kann
stetige Zufallsvariable, wenn sie - eventuell innerhalb gewisser
Grenzen - alle möglichen reellen Zahlen als Werte annehmen
kann
Dr. Matthias Arnold
199
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.1
a) Zweimaliger Münzwurf
→ Ω = {(Z, K), (K, Z), (K, K), (Z, Z)}
Definiere Zufallsvariable X = Anzahl Würfe mit Kopf“
”
→ X(Z, K) = X(K, Z) = 1, X(K, K) = 2, X(Z, Z) = 0
→ X ∈ {0, 1, 2} diskrete Zufallsvariable
Dr. Matthias Arnold
200
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.1 (Fortsetzung)
b) Verschiedene Zufallsvariablen+Typ (stetig/diskret)
Zufallsvariable
Augensumme zweimaliges Würfeln
Wertebereich
{2, 3, 4, . . . , 12}
Typ
diskret
Lebensdauer eines Prozessors
[0, ∞)
stetig
Anzahl erfolgloser Lottotipps bis
zum ersten Hauptgewinn
{0, 1, 2, 3, . . .}
diskret
Logarithmierte Aktienrendite
an einem Börsentag
(−∞, ∞)
stetig
Dr. Matthias Arnold
201
Universität Erfurt
Sommersemester 2012 - Statistik
Bemerkung
a) Funktionen von Zufallsvariablen sind wieder Zufallsvariablen.
Betrachte etwa zweimaligen Würfelwurf (vgl. Beispiel 7.2 b)) und
definiere Zufallsvariablen: X1 = Augenzahl Wurf 1“;
”
X2 = Augenzahl Wurf 2“. Dann sind
”
Z1 = min {X1 , X2 }
Z2 = max {X1 , X2 }
Z 3 = X1 + X2
ebenfalls Zufallsvariablen.
b) Im Folgenden von Interesse: Wie lassen sich Wahrscheinlichkeiten angeben, dass Zufallsvariable X Wert xi annimmt?
Zunächst lediglich Betrachtung diskreter Zufallsvariablen.
Dr. Matthias Arnold
202
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 8.2
Sei X diskrete Zufallsvariable mit möglichen Realisationen
x1 , x2 , ..., xk . Dann heißt die Funktion f (·), die angibt, mit welcher
Wahrscheinlichkeit X die Realisation xi annimmt,
f (xi ) = P (X = xi ),
i = 1, . . . , k,
Wahrscheinlichkeitsfunktion von X.
Dr. Matthias Arnold
203
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.2
(Zweimaliges Würfeln, vgl. Beispiel 7.2 b))
Definiere X =Augensumme beider Würfe
7.2 b) bzw. 7.4: Zweimaliges Würfeln entspricht Laplace
Experiment mit |Ω| = 36
X(ω) = xi
X=2
X=3
X=4
..
.
X = 12
Dr. Matthias Arnold
{zugehörige ω}
{(1, 1)}
{(1, 2), (2, 1)}
{(1, 3), (2, 2), (3, 1)}
..
.
⇒
⇒
⇒
⇒
P (X
P (X
P (X
P (X
..
.
= xi )
= 2) = 1/36
= 3) = 2/36
= 4) = 3/36
{(6, 6)}
⇒ P (X = 12) = 1/36
204
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.2 (Fortsetzung)
Realisation xi
P (X = xi )
2
1/36
3
2/36
4
3/36
5
4/36
6
5/36
Realisation xi
P (X = xi )
8
5/36
9
4/36
10
3/36
11
2/36
12
1/36
⇒
i
7
6/36
P (X = xi ) = 1
(klar, da sich eine Augensumme zwischen 2 und 12
auf jeden Fall realisieren wird!)
Dr. Matthias Arnold
205
Universität Erfurt
Sommersemester 2012 - Statistik
0
1/36
2/36
3/36
P(X = xi)
4/36
5/36
6/36
Beispiel 8.2 (Fortsetzung)
2
Dr. Matthias Arnold
3
4
5
6
7
xi
8
9
10
11
12
206
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.2 (Fortsetzung)
Frage: Wie wahrscheinlich überschreitet die Zufallsvariable
einen bestimmten Wert nicht?
Hier etwa: Mit welcher Wahrscheinlichkeit ist die
Augensumme kleiner oder gleich Drei?
P(X ≤ 3) = P(X = 2) + P(X = 3)
= P({(1, 1)}) + P({(1, 2), (2, 1)})
Dr. Matthias Arnold
=
1
2
+
36 36
=
3
1
=
36
12
207
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 8.3
Für eine Zufallsvariable X heißt die Funktion F (·), die angibt, mit
welcher Wahrscheinlichkeit X einen Wert x nicht überschreitet,
F (x) = P (X ≤ x),
x ∈ R,
Verteilungsfunktion von X.
Bemerkung
Für eine diskrete Zufallsvariable X gilt
f (xi ), x ∈ R
F (x) =
xi ≤x
(vergleiche Definition 2.2: F (x) theoretisches Gegenstück“ zu
”
empirischer Verteilungsfunktion Fn (x))
Dr. Matthias Arnold
208
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.3
(Zweimaliges Würfeln, vgl. Beispiel 8.2)
Weiterhin sei X =Augensumme beider Würfe
In Bsp. 8.2 berechnet: F (3) = P(X = 2) + P(X = 3) =
3
36
Bem. nach Def. 8.3:
6
,
F (4) = P(X = 2) + P(X = 3) + P(X = 4) = 36
F (5) = P(X = 2)+P(X = 3)+P(X = 4)+P(X = 5) =
10
36 , ...
x∈
F (x)
(−∞, 2)
0
[2, 3)
1/36
[3, 4)
3/36
[4, 5)
6/36
[5, 6)
10/36
[6, 7)
15/36
x∈
F (x)
[7, 8)
21/36
[8, 9)
26/36
[9, 10)
30/36
[10, 11)
33/36
[11, 12)
35/36
[12, ∞)
1
Dr. Matthias Arnold
209
Universität Erfurt
Sommersemester 2012 - Statistik
1
Beispiel 8.3 (Fortsetzung)
●
●
●
5/6
●
2/3
●
1/2
P(X ≤ x)
●
1/3
●
●
1/6
●
0
●
−1
0
1
2
●
3
4
5
6
7
8
9
10
11
12
13
x
→ F (x) Treppenfunktion; Sprungstellen x = 2, 3, ..., 12, Sprunghöhen den Werten der Wahrscheinlichkeitsfunktion entsprechend
(1/36, 2/36, 3/36, ..., 1/36)
Dr. Matthias Arnold
210
Universität Erfurt
Sommersemester 2012 - Statistik
Verteilungsfunktion
Vergleich mit empirischer Verteilungsfunktion Fn (x) aus
Definition 2.2:
• Formal starke Ähnlichkeit, inhaltlicher Unterschied:
• Fn (x) beschreibt n Zahlen, Sprunghöhen entsprechen den
relativen Häufigkeiten h(ai )
• F (x) beschreibt eine Wahrscheinlichkeitsverteilung, die
Sprunghöhen entsprechen den Wahrscheinlichkeiten
Dr. Matthias Arnold
211
Universität Erfurt
Sommersemester 2012 - Statistik
Bemerkung
Betrachte nun stetige Zufallsvariable X; Hier Definition der
Wahrscheinlichkeitsfunktion durch f (xi ) = P(X = xi ) analog zu
Definition 8.2 nicht sinnvoll
Grund: X stetig → Sämtliche xi ∈ R können sich realisieren
(zumindest auf Intervall, vergleiche Definition 8.1)
Stetigkeit in Praxis jedoch Idealisierung, da Messungen
diskret
Sei etwa X = Körpergewicht (in kg) einer zufällig
ausgewählten Person i → P(X = 82, 514367842312) ???
→ deswegen (und aufgrund weiterer, technischer Aspekte)
P(X = x) = 0 für alle x ∈ R
Dr. Matthias Arnold
212
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 8.4
Sei X stetige Zufallsvariable mit möglichen Realisationen im
Intervall (a, b), a = −∞ und/oder b = ∞ erlaubt, und
differenzierbarer Verteilungsfunktion F (x) = P(X ≤ x). Dann
heißt die erste Ableitung
f (x) = F (x),
x ∈ R,
Dichtefunktion (kurz Dichte) von X.
Dr. Matthias Arnold
213
Universität Erfurt
Sommersemester 2012 - Statistik
Bemerkung 1
a) Zusammenhang zwischen Verteilungs- und Dichtefunktion
x
f (t) dt
f (x) = F (x) (vgl. Def. 8.4) und F (x) =
−∞
b) Interpretation der Dichtefunktion
schraffiert:
a
−∞
f (t) dt = F (a) = P(X ≤ a)
→ gesamter Flächeninhalt unter der Dichte=1
Dr. Matthias Arnold
214
Universität Erfurt
Sommersemester 2012 - Statistik
Bemerkung 2
a) Eigenschaften der Verteilungsfunktion ( Gegenstück“ zur
”
Bemerkung nach Beispiel 2.3): Sei X beliebige Zufallsvariable
mit Verteilungsfunktion F (x). Dann gilt
F (x) ist monoton nicht fallend
0 ≤ F (x) ≤ 1 für alle x ∈ R
Dr. Matthias Arnold
lim F (x) = 0 und
x→−∞
lim F (x) = 1
x→∞
P (a < X ≤ b) = F (b) − F (a)
215
Universität Erfurt
Sommersemester 2012 - Statistik
Bemerkung 2 (Fortsetzung)
b) Eigenschaften der Wahrscheinlichkeits-/Dichtefunktion:
Sei f (x) die der Zufallsvariablen X aus a) zugehörige
Wahrscheinlichkeits-/Dichtefunktion. Dann gilt
f (x) ≥ 0
i
f (xi ) = 1,
∞
−∞
Dr. Matthias Arnold
falls X diskret
f (x) dx = 1,
F (b) − F (a) =
b
a
falls X stetig
f (x) dx,
falls X stetig
216
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.4
a) Gleich-/Rechteckverteilung (einfachste stetige Verteilung)
X gleichverteilt auf Intervall [a, b] →
1
x ∈ [a, b]
b−a
f (x) =
0
sonst
→ Werte auf Intervall gleichmäßig“ verteilt
”
Dr. Matthias Arnold
217
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.4 (Fortsetzung)
0.00
0.01
0.02
f(x)
0.03
0.04
0.05
b) Sei X = Verspätung der S-Bahn an der Haltestelle Universität
”
Dortmund“; Annahme: X auf Intervall [0, 20] gleichverteilt
1
x ∈ [0, 20]
20
→ f (x) =
0 sonst
−5
0
5
10
15
20
25
Verspätung x in Minuten
Dr. Matthias Arnold
218
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.4 (Fortsetzung)
b) (Fortsetzung)
Frage: Mit welcher Wahrscheinlichkeit beträgt die Verspätung
zwischen fünf und zehn Minuten?
P (5 < X ≤ 10) = F (10) − F (5)
(vgl. Bem. 2 a) nach Def. 8.4) → Berechnung von F (x) :
x
F (x)
=
x
f (t) dt =
0
→ Insgesamt: F (x)
Dr. Matthias Arnold
=
0
⎧
⎪
⎨0,
x
20
⎪
⎩
1,
,
x
1
1 x
dt =
t =
20
20 0
20
x<0
0 ≤ x ≤ 20
x > 20
219
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.4 (Fortsetzung)
b) (Fortsetzung)
P (5 < X ≤ 10) = F (10) − F (5) =
10
20
−
5
20
= 0, 25
F(x)
0
0.25=F(5)
0.5=F(10)
0.75
1
→ P(fünf bis zehn Minuten zu spät)=25 %
−5
0
5
10
15
20
25
Verspätung x in Minuten
Dr. Matthias Arnold
220
Universität Erfurt
Sommersemester 2012 - Statistik
Definition 8.5
Gilt für zwei Zufallsvariablen X und Y und alle x, y ∈ R
P (X ≤ x, Y ≤ y) = P (X ≤ x) · P (Y ≤ y) = FX (x) · FY (y),
so heißen X und Y stochastisch unabhängig.
Beispiel 8.5
(zweimaliges Würfeln, vgl. u.a. Beispiel 8.2)
X =Augenzahl erster Wurf
Y =Augenzahl zweiter Wurf
Dr. Matthias Arnold
221
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.5 (Fortsetzung)
P (X ≤ 3, Y ≤ 5) = P (X ≤ 3 und Y ≤ 5)
= P ( {(1, 1), (1, 2), ..., (1, 6), (2, 1), ..., (3, 6)}
A mit |A|=18
und {(1, 1), ..., (1, 5), (2, 1), ..., (6, 5)} )
B mit |B|=30
= P (A ∩ B)
= P ({(1, 1), (1, 2), ..., (1, 5), (2, 1), ..., (3, 5)})
C mit |C|=15
=
Dr. Matthias Arnold
15
5
=
36
12
222
Universität Erfurt
Sommersemester 2012 - Statistik
Beispiel 8.5 (Fortsetzung)
Außerdem gilt:
P (X ≤ 3) = P (A) =
18
1
=
36
2
P (Y ≤ 5) = P(B) =
30
5
=
36
6
Und somit
P (X ≤ 3) · P (Y ≤ 5) =
1 5
5
· =
= P (X ≤ 3, Y ≤ 5)
2 6
12
Für alle (x, y) ∈ Ω nachweisbar → X und Y stochastisch
unabhängig
Dr. Matthias Arnold
223
Universität Erfurt
Sommersemester 2012 - Statistik
Bemerkung
Fazit/Zusammenfassung Kapitel 8
Zufallsvariablen zur vereinfachten Berechnung von
Wahrscheinlichkeiten; Quantifizierung von Ereignissen
Diskrete Zufallsvariablen besitzen Wahrscheinlichkeits- und
Verteilungsfunktion
stetige Zufallsvariablen besitzen Dichte und
Verteilungsfunktion
Dr. Matthias Arnold
224
Herunterladen