Woche 3 (185 kB, 50 Seiten) - (IMISE), Leipzig

Werbung
Statistisches Lernen
Einheit 3: Wahrscheinlichkeitsrechnung
Dr. rer. nat. Fabian Schwarzenberger
Institut für Medizinische Informatik, Statistik und Epidemiologie
Universität Leipzig
WS 2014/2015
1 / 50
Einleitung - Ziele und Motivation
Übersicht
1
Einleitung - Ziele und Motivation
2
Axiomatische Einführung des Begriffes “Wahrscheinlichkeit”
Was ist dieses P?
3
Kombinatorik
4
Bedingte Wahrscheinlichkeit
5
Unabhängigkeit und Unkorreliertheit
6
Zufallsvariablen
7
Spezielle Verteilungen
8
Grenzwertsätze der Wahrscheinlichkeitsrechnung
9
Aufgaben
2 / 50
Einleitung - Ziele und Motivation
Ziele und Motivation
Auffrischung des Wissens aus dem Bachelor-Studium
Beschreibung von Zufallssituationen mit Hilfe von Ereignissen/
Berechnung der zugehörigen Wahrscheinlichkeiten
Umgang mit Zufallsvariablen und ihren Verteilungen
Wichtige Verteilungen kennen lernen
Grenzwertsätze - Warum brauche ich große Fallzahlen?
Gefühl für Wahrscheinlichkeiten entwickeln:
“Young man, in mathematics you don’t understand things. You just
get used to them.” - John von Neumann
3 / 50
Einleitung - Ziele und Motivation
Zufallsexperiment
Ein Zufallsexperiment ist ein Vorgang
der einem genau festgelegtem Plan folgt,
bei dem alle möglichen Ergebnisse vorab bekannt sind,
dessen Ausgang nicht vorhergesagt werden kann.
(hier steckt der Zufall)
Beispiele:
Wurf eines Würfel
Ziehung der Lottozahlen
Anzahl der Notrufe pro Jahr in Leipzig
Ergebnis eines Schwangerschaftstests
Dauer einer Blinddram-OP
4 / 50
Einleitung - Ziele und Motivation
Ereignisraum I
Definition
Die Menge aller möglichen Ergebnisse eines Zufallsexperiments wird
Ereignisraum genannt und mit Ω bezeichent.
Beispiele:
Wurf eines Würfel: Ω = {1, 2, 3, 4, 5, 6}
Ziehung der Lottozahlen:
n
Ω = {1, 2, 3, 4, 5, 6}, {1, 2, 3, 4, 5, 7}, . . . , {1, 2, 3, 4, 5, 49},
{1, 2, 3, 4, 6, 7}, . . . , {1, 2, 3, 4, 6, 49}, . . . , {44, 45, 46, 47, 48, 49}
o
Anzahl der Notrufe pro Jahr in Leipzig: Ω = {0, 1, 2, . . . } = N0
Ergebnis eines Schwangerschaftstests: Ω = {0, 1}
Dauer einer Blinddram-OP: Ω = (0, ∞)
5 / 50
Einleitung - Ziele und Motivation
Ereignisraum II
3 grundlegende verschiedene Fälle
1
Ω ist endlich, z.B. Ω = {0, 1}
2
Ω ist unendlich, aber abzählbar, z.B. Ω = N0
3
Ω ist unendlich und überabzählbar, z.B. Ω = (0, 10)
Beachte
Eine Menge M heißt abzählbar wenn es eine Bijektion zwischen M und
den natürlichen Zahlen N gibt.
(d.h. man kann die Elemente der Menge M “durchnummerieren”)
Abzählbare Mengen: N, Z, Q, 2N = {2, 4, 6, 8, . . . }, . . .
Überabzählbare Mengen: R, C, (0, 1), . . .
6 / 50
Einleitung - Ziele und Motivation
Rechnen mit (Teil-)mengen
Sind A und B Teilmengen aus Ω, also A, B ⊆ Ω dann
enthält die Vereinigung A ∪ B alle Elemente aus Ω die entweder in A
oder B oder in beiden Mengen liegen
enthält der Schnitt A ∩ B alle Elemente aus Ω die sowohl in A als
auch in B liegen
enthält die Differenz A \ B alle Elemente aus Ω die A aber nicht in B
liegen
enthält Ā alle Elemente aus Ω die nicht in A liegen
Abkürzenden Schreibweisen:
Tn
Ai = A1 ∩ A2 ∩ · · · ∩ An
Si=1
n
i=1 Ai = A1 ∪ A2 ∪ · · · ∪ An
7 / 50
Einleitung - Ziele und Motivation
Rechenregeln für (Teil-)mengen
Kommutativgesetze:
A ∩ B = B ∩ A,
und A ∪ B = B ∪ A
Assoziativgesetze:
A ∩ (B ∩ C ) = (A ∩ B) ∩ C
A ∪ (B ∪ C ) = (A ∪ B) ∪ C
Distributivgesetze:
A ∩ (B ∪ C ) = (A ∩ B) ∪ (A ∩ C )
A ∪ (B ∩ C ) = (A ∪ B) ∩ (A ∪ C )
De Morgansche Regeln:
A ∩ B = A ∪ B,
und A ∪ B = A ∩ B
aus A ⊂ B folgt B ⊂ A und A \ B = A ∩ B
8 / 50
Einleitung - Ziele und Motivation
Ereignissystem, σ-Algebra
Definition
Eine Menge A von Teilmengen von Ω wird σ-Alegebra genannt, falls
Ω∈A
falls A ∈ A dann auch Ā ∈ A
falls A1 , A2 , A3 , · · · ∈ A dann auch
S∞
i=1 Ai
∈A
Beispiele:
P(Ω) = die Menge aller Teilmengen von Ω
Bei uns wird das fast immer die richtige Wahl sein.
Würfel: Ω = {1, 2, 3, 4, 5, 6},
A = {∅, {1, 2}, {3, 4, 5, 6}, {1, 2, 3, 4, 5, 6}}
Beachte: Im folgenden werden wir (der Einfachkeit halber) die σ-Algebra
oft nicht explizit erwähnen.
9 / 50
Einleitung - Ziele und Motivation
Ereignisse
Definition
Ein A ∈ A wird Ereignis genannt.
Damit ist jedes Ereignis eine Teilmenge von Ω.
Beispiele:
Würfel: Ω = {1, 2, 3, 4, 5, 6},
A = {2, 4, 6} =
b “Würfeln einer geraden Zahl”
Blinddarm-OP: Ω = (0, ∞),
A = (0, 20) =
b “Die OP dauert weniger als 20 min”
Spezialfälle:
A = {ω} für ein ω ∈ Ω, dann heißt A Elementarereignis
A = ∅ unmögliches Ereignis
A = Ω sicheres Ereignis
für A ⊆ Ω heißt Ā := Ω \ A Gegenereignis
10 / 50
Einleitung - Ziele und Motivation
Rechnen mit Ereignissen
UND: A ∩ B - heißt A und B treten gleichzeitig ein
ODER: A ∪ B - heißt entweder A oder B oder beide treten ein
MINUS: A \ B - heißt es tritt A aber nicht B ein
Da Ereignisse Teilmengen von Ω sind gelten
die
die
die
die
Kommutativgesetze
Assoziativgesetze
Distributivgesetze und
De Morganschen Regeln.
11 / 50
Axiomatische Einführung
Was ist dieses P?
Ziel: Jedem Ereignis A soll eine Wahrscheinlichkeit zugeordnet
werden. Diese soll die Chance beurteilen, dass das Ereignis A eintritt.
Definition
Sei Ω ein Ereignisraum und A eine σ-Alegebra über Ω. Sei P eine
Abbildung die jedem A ∈ A eine Zahl aus [0, 1] zuordnet und die
folgenden Eigenschaften erfüllt:
1
2
P(Ω) = 1
P
S
= ∞
P ∞
A
i
i=1
i=1 P(Ai ) falls alle A1 , A2 , · · · ∈ A und
für alle i 6= j gilt Ai ∩ Aj = ∅
Dann nennen wir P Wahrscheinlichkeitsmaß auf Ω und P(A) die
Wahrscheinlichkeit eines Ereignis A ∈ A. Das Tripel (Ω, A, P) heißt dann
Wahrscheinlichkeitsraum oder Wahrscheinlichkeitsmodell.
12 / 50
Axiomatische Einführung
Rechnen mit Wahrscheinlichkeiten
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und A, B ∈ A, dann gilt:
P(∅) = 0,
P(A ∪ B) = P(A) + P(B), falls A ∩ B = ∅,
P(Ā) = 1 − P(A),
P(A) ≤ 1,
P(A) ≤ P(B) falls A ⊆ B
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) und
P(A) = P(A ∩ B̄) + P(A ∩ B)
P(B \ A) = P(B) − P(A) falls A ⊆ B
13 / 50
Axiomatische Einführung
Aufgabe 1 zu Wahrscheinlichkeiten
Ansteckend oder nicht?
In einem Krankenhaus sei bekannt, dass der Anteil der Patienten die an
Rückenbeschwerden leiden und gleichzeitig eine ansteckende Krankheit
besitzen bei 5% liegt. Außerdem weiß man dass 10% der Patienten des
Krankenhauses an Rückenbeschwerden leiden, aber keine ansteckende
Krankheit besitzen. Weiter ist bekannt, dass 19% der Patienten
mindestens eins der beiden Krankeitsbilder aufweisen.
Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter
Patient eine ansteckende Krankheit besitzt?
Wie groß ist der Anteil der Patienten mit Rückenbeschwerden?
14 / 50
Axiomatische Einführung
Laplacesches Modell
Definition
Ein Wahrscheinlichkeitsmodell heißt Laplacesches Modell, falls Ω endlich
ist (also Ω = {ω1 , . . . , ωn }) und
P({ω1 }) = · · · = P({ωn }) =
1
.
n
In dieser Situation kann man für ein beliebiges A ∈ P(Ω) die
Wahrscheinlichkeit wie folgt bestimmen:
P(A) =
|A|
m
= ,
|Ω|
n
wobei m = |A| die Anzahl der Elemente in A ist. Es gilt also:
P(A) =
Anzahl günstiger Elementarereignisse
.
Anzahl aller Elementarereignisse
Man sagt dann: P ist die Gleichverteilung auf Ω.
15 / 50
Axiomatische Einführung
Aufgabe 2 zu Wahrscheinlichkeiten
Zwei Würfel
Bestimme die Wahrscheinlichkeit beim Wurf mit 2 Wüfeln mindestens die
Augensumme 10 zu erreichen!
16 / 50
Kombinatorik
Kombinatorik
Fragestellung
Wieviele Möglichkeiten gibt es aus einer n-elementigen Menge k Elemente
auszuwählen?
Dabei sind die Spielregeln zu klären! Insbesondere ist wichtig:
Spielt die Reihefolge eine ein Rolle?
Dürfen Elemente mehrfach ausgewählt werden (Ziehen mit zurück
legen oder nicht)?
17 / 50
Kombinatorik
Reihfolge wichtig
Reihefolge wichtig, Wiederholung möglich
Variation von n Elementen zur k-ten Klasse mit Wiederholungen
v̄nk = nk
Reihefolge wichtig, Wiederholung nicht möglich
Variation von n Elementen zur k-ten Klasse ohne Wiederholungen
vnk = n · (n − 1) · ... · (n − (k − 1)) =
n!
(n − k)!
Beachte: n! = n · (n − 1) · ... · 2 · 1
Wichtiger Spezialfall: n = k dann vnk = n!
Dies beschreibt die Anzahl der möglichen Anordnungen von n Elementen
(=Permutationen).
18 / 50
Kombinatorik
Reihfolge nicht wichtig
Reihefolge nicht wichtig, Wiederholung möglich
Kombination von n Elementen zur k-ten Klasse mit Wiederholungen
n+k −1
(n + k − 1)!
k
c̄n =
=
k!(n − 1)!
k
Reihefolge nicht wichtig, Wiederholung nicht möglich
Kombination von n Elementen zur k-ten Klasse ohne Wiederholungen
n
n!
k
=
cn =
k
k!(n − k)!
Wichtiger Spezialfall: n = k dann cnk = 1
19 / 50
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit, Wozu brauchen wir das?
Frage
Wie verändert sich die Wahrscheinlichkeit eines Ereignisses, falls ich
Zusatzwissen mit einfließen lasse?
Ereignisse können sich gegenseitig beeinflussen
falls bekannt ist, dass ein Ereignis eingetreten ist, kann sich die
Wahrscheinlichkeit für das Eintreten eines anderen Ereignisses ändern
20 / 50
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit, Wozu brauchen wir das?
Beispiel 1
HIV Prävalenz liegt weltweit bei 0, 8%, also
P1 ({zufällig ausgewählte Person ist HIV positiv}) = 0.008.
Modell 1: Ω = {0, 1}, P1 ({1}) = 0.008, P1 ({0}) = 0.992
Zusatzwissen: ausgewählte Person ist Europäer und HIV Prävalenz in
Europa liegt bei 0, 2%. Jetzt gilt also
P2 ({zufällig ausgewählte Person ist HIV positiv}) = 0.002.
Modell 2: Ω = {0, 1}, P2 ({1}) = 0.002, P2 ({0}) = 0.998
Problem
Wie kombiniert man die beiden Modelle?
Wir wollen nicht gleichzeitig mit 2 verschiedenen P’s rechnen!
WK für HIV positiv unter nicht-Europäern?
21 / 50
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit, Wozu brauchen wir das?
Beispiel 2
Wurf mit zwei Würfeln: Wie groß ist die Wahrscheinlichkeit, dass die
Augensumme mindestens 10 ergibt, falls man schon weiß dass ein Würfel
(a) eine 1 zeigt, oder
(b) eine 6 zeigt?
22 / 50
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit, Definition
Definition
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und seien A, B ∈ A zwei
Ereinisse mit P(B) > 0. Dann definieren wir
P(A | B) :=
P(A ∩ B)
P(B)
und nennen P(A | B) die Wahrscheinlichkeit von A bedingt auf B.
Interpretation:
“Wie groß ist die Wahrscheinlichkeit von A, wenn ich schon weiß dass B
eingetreten ist”
23 / 50
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit, Aufgabe
Aufgabe
Wurf mit zwei Würfeln: Wie groß ist die Wahrscheinlichkeit, dass die
Augensumme mindestens 10 ergibt, falls man schon weiß dass ein Würfel
(a) eine 1 zeigt, oder
(b) eine 6 zeigt?
24 / 50
Bedingte Wahrscheinlichkeit
Rechnen mit bedingten Wahrscheinlichkeiten
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und A, A1 , A2 , B ∈ A Ereignisse
mit P(B) > 0. Dann gilt
P(B | B) = 1 und P(∅ | B) = 0
falls A ∩ B = ∅ dann P(A | B) = 0
P(Ā | B) = 1 − P(A | B)
P(A1 ∪ A2 | B) = P(A1 | B) + P(A2 | B) − P(A1 ∩ A2 | B)
falls B ⊂ A dann P(A | B) = 1
falls A ⊂ B dann P(A | B) =
P(A)
P(B)
25 / 50
Bedingte Wahrscheinlichkeit
Formel von der totalen Wahrscheinlichkeit
Formel von der totalen Wahrscheinlichkeit
Seien B1 , . . . , Bn ∈ A mit
Sn
i=1 Bi = Ω und
Bi ∩ Bj = ∅ falls i 6= j (paarweise disjunkt)
P(Bi ) > 0 für alle i = 1, . . . , n
dann gilt für beliebiges A ∈ A
P(A) =
n
X
P(A | Bi ) · P(Bi )
i=1
26 / 50
Bedingte Wahrscheinlichkeit
Formel von Bayes
Formel von Bayes
Seien B1 , . . . , Bn ∈ A mit
Sn
i=1 Bi = Ω und
Bi ∩ Bj = ∅ falls i 6= j (paarweise disjunkt)
P(Bi ) > 0 für alle i = 1, . . . , n
dann gilt für beliebiges A ∈ A mit P(A) > 0 und j ∈ {1, . . . , n}
P(Bj | A) =
P(A | Bj ) · P(Bj )
P(A | Bj ) · P(Bj )
= Pn
P(A)
i=1 P(A | Bi ) · P(Bi )
27 / 50
Bedingte Wahrscheinlichkeit
Aufgabe 1 zur bedingten Wahrscheinlichkeit
Aufgabe zur Prävalenz von HIV
HIV Prävalenz liegt weltweit bei 0, 8% und in Europa bei 0.2%. Es gibt
etwa 7 Milliarden Menschen auf der Erde und etwa 740 Mio davon leben in
Europa.
Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter
Europäer HIV-positiv ist?
Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter
Nicht-Europäer HIV-positiv ist?
28 / 50
Bedingte Wahrscheinlichkeit
Zuverlässigkeit von Tests
Definition
Sensitivität := Wahrscheinlichkeit, dass Test “positiv” anzeigt, wenn
richtig-positiv
man tatsächlich “positiv” ist.
Spezifität := Wahrscheinlichkeit, dass Test “negativ” anzeigt, wenn
richtig-negativ
man tatsächlich “negativ” ist.
Übersicht
Test positiv
Test negativ
krank
richtig-positiv
falsch-negativ
gesund
falsch-positiv
richtig-negativ
29 / 50
Bedingte Wahrscheinlichkeit
Aufgabe 2 zur bedingten Wahrscheinlichkeit
Aufgabe zur Zuverlässigkeit von HIV Speicheltests
Für einen HIV Speicheltest werden folgende Werte angegeben:
Sensitivität = 0.98, Spezifität = 0.997.
Außerdem wissen wir:
Einwohner in Deutschland = 80, 8 Mio,
HIV Infizierte in Deutschland = 78000.
Wie hoch ist die Wahrscheinlichkeit, dass eine positiv geteste Person
tatsächlich kein HIV-Träger ist?
Wie hoch ist die Wahrscheinlichkeit, dass eine negativ geteste Person
tatsächlich HIV-Träger ist?
30 / 50
Bedingte Wahrscheinlichkeit
zur Lösung
Ereignisse: K := {Patient krank}, P := {Test ist positiv}
Gegeben: P(P | K ) = 0.98 und P(P̄ | K̄ ) = 0.997 und
78000
P(K ) = 80800000
≈ 0.001
Gesucht: P(K̄ | P) und P(K | P̄)
Bayes sagt:
P(K̄ | P) =
P(P | K̄ )P(K̄ )
0.003 · 0.999
=
0.003 · 0.999 + 0.98 · 0.001
P(P | K̄ )P(K̄ ) + P(P | K )P(K )
= 0.7535831 (absolut krass!)
und
P(K | P̄) =
P(P̄ | K )P(K )
0.02 · 0.001
=
0.02 · 0.001 + 0.997 · 0.999
P(P̄ | K )P(K ) + P(P̄ | K̄ )P(K̄ )
= 0.00002008
31 / 50
Unabhängigkeit und Unkorreliertheit
Unabhängigkeit
Definition
Zwei Ereignisse A, B ∈ A heißen stochastisch unabhängig wenn
P(A ∩ B) = P(A) · P(B).
Sind A und B unabhängig und P(B) > 0, dann gilt
P(A | B) =
P(A ∩ B)
P(A)P(B)
=
= P(A).
P(B)
P(B)
32 / 50
Unabhängigkeit und Unkorreliertheit
Eigenschaften unabhängiger Ereignisse
A und B disjunkt und P(A) > 0 und P(B) > 0
⇒ A und B stochastisch abhängig
Sind A und B stochastisch unabhängig, so sind
A und B̄ stochastisch unabhängig
Ā und B stochastisch unabhängig
Ā und B̄ stochastisch unabhängig
∅ und Ω sind zu jedem A ∈ A stochastisch unabhängig
33 / 50
Unabhängigkeit und Unkorreliertheit
Beispiel - Münze und Würfel
Wir werfen eine faire Münze (Werte 0 oder 1) und einen fairen Würfel
(Werte 1, . . . , 6). Untersuchen Sie die folgenden Ereignisse auf
Unabhängigkeit
1
A = {Wert der Münze ist 1} und B = {Wert des Würfel > 4}
2
A = {Wert der Münze ist 1} und
C = {Wert des Würfel + Wert der Münze > 4}
Möglichkeiten:
(0, 1), (0, 2), (0, 3), (0, 4), (0, 5), (0, 6), (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),
Laplace-Experiment (alle haben WK 1/12)
1
P(A) = 6/12, P(B) = 4/12, P(A ∩ B) = 2/12 also
P(A ∩ B) = 1/6 = 1/2 · 1/3 = P(A) · P(B) ⇒ unabhängig
2
P(A) = 6/12, P(C ) = 5/12, P(A ∩ C ) = 3/12 also
P(A ∩ C ) = 1/4 6= 1/2 · 5/12 = P(A) · P(C ) ⇒ abhängig
34 / 50
Zufallsvariablen
Zufallsvariablen
Definition
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum. Dann heißt eine Abbildung
X : Ω → R Zufallsvariable (oder Zufallsgröße) (Ω, A, P) falls für alle
Intervalle I ⊆ R gilt:
{ω ∈ Ω | X (ω) ∈ I } ∈ A
(1)
Eine ZV ordent also jedem Elementarereignis ein Zahl aus R zu.
Oft interessiert man sich für Wahrscheinlichkeiten
P({ω ∈ Ω | X (ω) ∈ I })
bzw. in Kurzschreibweise
P(X ∈ I )
Bedingung (1) stellt sicher, dass solche Wahrscheinlichkeiten
berechnet werden können
35 / 50
Zufallsvariablen
Beispiel Zufallsvariable
Würfelspiel
Christine und Fabian spielen ein Würfelspiel. Jeder hat einen Würfel.
Gewürfelt wird gleichzeitig. Das Ergebnis von Christines Würfel sagt
wieviel Euro sie von Fabian bekommt. Das Ergebnis von Fabians Würfel
sagt wieviel Euro er von Christine bekommt.
Stellen Sie ein passendes wahrscheinlichkeitstheoretisches Modell auf und
definieren Sie eine Zufallsvariable, die Christines (Netto-)Gewinn
wiedergibt.
Ω = {(i, j) | i, j ∈ {1, . . . , 6}}
(1.Koord = Christines Würfel, 2.Koord = Fabians Würfel)
A = P(Ω) (= Potenzmenge = {alle Teilengen von Ω }),
P = Gleichverteilung auf Ω, da Laplace-Experiment
Christines Gewinn ist z.B für Ergebnis (4, 1) gerade 4 − 1 = 3 Euro. Also
definieren wir
X : Ω → R,
X ((i, j)) := i − j.
36 / 50
Zufallsvariablen
Beispiel Zufallsvariable
Würfelspiel, reloaded
Christine und Fabian spielen wieder ihr Würfelspiel. Heute hat Christine
nur 3 Euro dabei. Sie fragt sich, wie groß die Wahrscheinlichkeit ist, dass
sie (netto) mehr als 3 Euro Verlust hat. Helfen Sie ihr!
Gesucht P(X < −3).
P(X < −3) = P({(i, j) ∈ Ω | i − j < −3})
= P({(1, 5), (1, 6), (2, 6)})
|{(1, 5), (1, 6), (2, 6)}|
3
1
=
=
=
|Ω|
36
12
37 / 50
Zufallsvariablen
Verteilungsfunktion
Definition
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und X eine Zufallsvariable. Die
Funktion FX : R → R mit
FX (x) := P(X ≤ x)
heißt Verteilungsfunktion der Zufallsvariable X .
Beispiel: Würfel, Ω = {1, . . . , 6}, X (ω) := ω dann
1
1/2
0
1
2
3
4
5
6
38 / 50
Zufallsvariablen
Eigenschaften der Verteilungsfunktion
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und X eine Zufallsvariable mit
Verteilungsfunktion F . Dann gilt
0 ≤ F (x) ≤ 1 für alle x ∈ R
für a ∈ R: P(X > a) = 1 − F (a)
für a < b: P(a < X ≤ b) = F (b) − F (a)
F ist monoton wachsend
limx→−∞ F (x) = 0
limx→∞ F (x) = 1
für x0 ∈ R: limx&x0 F (x) = F (x0 ) (F ist rechtsstetig)
39 / 50
Zufallsvariablen
Stetige vs. diskrete Zufallsvariablen
Wichtige Unterscheidung:
Diskrete Zufallsvariable: Eine ZV X heißt diskret, falls X nur endlich
viele oder abzählbar unendlich viele Werte annehmen kann.
Stetige Zufallsvariable: Eine ZV X heißt stetig, falls eine integrierbare
Funktion f : R → R existiert, so dass für die Verteilungsfunktion F
gilt
Z
x
F (x) =
f (y )dy .
−∞
Diese Funktion f heißt Dichtefunktion der Zufallsvariable X .
Die Art einer ZV (stetig oder diskret) entscheidet über Methoden zur
Berechnung wichtiger Kenngrößen wie etwa dem Erwartungswert und der
Varianz.
40 / 50
Zufallsvariablen
Diskrete Zufallsvariablen
Ist X eine diskrete ZV an, so nimmt X nur abzählbar viel Werte an (oder
endlich viele), etwa x1 , x2 , x3 , . . . . Wir definieren damit für jedes i
pi := P(X = xi ).
Dann gilt für die Verteilungsfunktion
X
X
F (x) = P(X ≤ x) =
P(X = xi ) =
pi
i:xi ≤x
Der Erwartungswert ist
E(X ) :=
∞
X
i:xi ≤x
xi pi
i=1
Die Varianz ist
∞
X
Var(X ) :=
(xi − E(X ))2 pi
i=1
(nimmt X nur endlich (n ∈ N) viele Werte an, gehen die Summen jeweils
bis n)
41 / 50
Zufallsvariablen
Stetige Zufallsvariablen
Ist X eine stetige ZV an mit Dichte f so gilt (nach Definition) für die
Verteilungsfunktion
Z x
F (x) = P(X ≤ x) =
f (y )dy
−∞
Der Erwartungswert ist
Z
∞
E(X ) :=
yf (y ) dy
−∞
Die Varianz ist
Z
∞
Var(X ) :=
(y − E(X ))2 f (y ) dy
−∞
42 / 50
Spezielle Verteilungen
Spezielle Verteilungen
siehe letzte Woche
43 / 50
Grenzwertsätze der Wahrscheinlichkeitsrechnung
Was sind Grenzwertsätze?
Kennt man die Verteilung einer ZV nicht, so kann man mittels vieler
Wiederholungen des Experimentes mehr Informationen über die ZV
sammeln
Diese Experimente sollten (nach Möglichkeit) immer gleich ablaufen
und sich gegenseitig nicht beeinflussen
Die Grundlage dass man mit Hilfe vieler einzelner Experimente zu
einer Aussage über die Tatsächliche Verteilung gelangt, bilden die
Grenzwertsätze der Wahrscheinlichkeitsrechnung
44 / 50
Grenzwertsätze der Wahrscheinlichkeitsrechnung
Beispiel Münzwurf
Wir werfen eine Münze wieder und wieder (z.B 1000 mal) und
notieren die Werte
z.B. 0, 0, 1, 0, 1, 1, 1, . . . , 0, 0, 1
Wir erwarten dann
0 + 0 + 1 + 0 + 1 + 1 + 1 + ··· + 0 + 0 + 1
≈ 0.5
1000
Warum erwarten wir das?
Weil unsere Münze fair ist und in etwa der Hälfte der Fälle 1
erscheinen sollte.
Die Formalisierung dieser Idee nennt sich Gesetz der großen Zahlen
45 / 50
Grenzwertsätze der Wahrscheinlichkeitsrechnung
Weitere wichtige Gesetze/Sätze zum Nachschlagen
Gesetz der Großen Zahlen
Sagt, dass empirische Mittelwerte gegen den Erwartungswert
konvergieren.
Zentraler Grenzwertsatz
Beantwortet die Frage warum die Normalverteilung so “normal” ist
und sie hinter jeder Ecke lauert.
Der Satz von Glivenko–Cantelli
wird auch der “Hauptsatz der Statistik” genannt. WICHTIG! Sagt,
dass die empirischen Verteilungsfunktionen gegen die tatsächliche
Verteilungsfunktion konvergiert.
Grenzwertsatz von Moivre/Laplace
Ist ein Spezialfall des Zentralen Grenzwertsatz. Beantwortet die Frage
warum sich die (diskrete) Binomialverteilung für große n fast wie die
Normalverteilung verhält.
Grenzwertsatz von Poisson
Beantwortet die Frage warum die Binomialverteilung bei großem n
auch manchmal der Poisson-Verteilung sehr ähnlich sein kann.
46 / 50
Aufgaben
DNA
Die menschliche DNA besteht aus etwa 3,2 Mrd Bausteinen, die sich
jeweils nur um eine Base unterscheiden. Als Basen kommen nur Adenin,
Guanin, Cytosin, und Thymin in Frage. Wieviel Möglichkeiten gibt es
(theoretisch) eine DNA aus diesen Basen herzustellen?
Elfmeterschießen I
Für das Elfmeterschießen muß der Trainer 5 der 11 Spieler auf dem Platz
benennen. Wie viele Möglichkeiten hat er bei
der Bestimmung der Kandidaten?
der Bestimmung der Reihenfolge der Schützen, nachdem die
Kandidaten gewählt wurden?
47 / 50
Aufgaben
Würfelspiel, rereloaded
Geben Sie die Verteilungfunktion zur Zufallsvariable X (die Christines
Nettogewinn beim Würfelspiel beschreibt) an.
Ziegenproblem
Nehme Sie an, Sie wären in einer Spielshow und hätten die Wahl zwischen
drei Toren. Hinter einem der Tore ist ein Auto, hinter den anderen sind
Ziegen. Sie wählen ein Tor, sagen wir, Tor Nummer 1, und der
Showmaster, der weiß was hinter den Toren ist, öffnet ein anderes Tor,
sagen wir, Nummer 3, hinter dem eine Ziege steht. Er fragt Sie nun:
“Möchten Sie jetzt lieber das Tor Nummer Zwei?” Ist es von Vorteil, die
Wahl des Tores zu ändern?
48 / 50
Aufgaben
Grippeschutz
In einer Gruppe von 900 Personen haben sich 600 prophylaktisch gegen
Grippe impfen lassen. Nach einer bestimmten Zeit wurde jedes
Gruppenmitglied danach befragt, wer an einer Grippe erkrankte. Die
Ergebnisse werden in einer 4-Feldertafel dargestellt.
mit Impfung
ohne Impfung
Summe
erkrankt
60
120
180
nicht erkrankt
540
180
720
Summe
600
300
900
Das Ereignis A sei “Person ist geimpft” und das Ereignis B sei “Person ist
erkrankt”. Berechnen Sie:
P(A), P(B), P(A ∩ B), P(B | A), P(A | B), P(Ā ∩ B), P(B | Ā)
Geben Sie die Bedeutung der einzelnen Ergebnisse an.
49 / 50
Aufgaben
Schafe
Das Schlachtgewicht von Schafen sei normalverteilt mit Mittelwert 60 kg
und Standardabweichung 10 kg. Wie groß ist die Wahrscheinlichkeit, dass
das Schlachtgewicht eines Schafes über 70 kg ist
Elfmeterschießen II
Die Wahrscheinlichkeit dass eine Spieler einen Elfmeter im Tor versenkt
liegt bei 0, 82. Wie groß ist die Wahrscheinlichkeit dass von 5
Elefmeterschüzten mindestens 2 treffen.
50 / 50
Herunterladen