Statistisches Lernen - Einheit 3: Wahrscheinlichkeitsrechnung

Werbung
Einleitung - Ziele und Motivation
Übersicht
Statistisches Lernen
1
Einleitung - Ziele und Motivation
2
Axiomatische Einführung des Begriffes “Wahrscheinlichkeit”
Was ist dieses P?
3
Kombinatorik
4
Bedingte Wahrscheinlichkeit
5
Unabhängigkeit und Unkorreliertheit
6
Zufallsvariablen
7
Spezielle Verteilungen
8
Grenzwertsätze der Wahrscheinlichkeitsrechnung
9
Aufgaben
Einheit 3: Wahrscheinlichkeitsrechnung
Dr. rer. nat. Fabian Schwarzenberger
Institut für Medizinische Informatik, Statistik und Epidemiologie
Universität Leipzig
WS 2014/2015
1 / 50
2 / 50
Einleitung - Ziele und Motivation
Einleitung - Ziele und Motivation
Ziele und Motivation
Zufallsexperiment
Ein Zufallsexperiment ist ein Vorgang
Auffrischung des Wissens aus dem Bachelor-Studium
der einem genau festgelegtem Plan folgt,
bei dem alle möglichen Ergebnisse vorab bekannt sind,
Beschreibung von Zufallssituationen mit Hilfe von Ereignissen/
Berechnung der zugehörigen Wahrscheinlichkeiten
dessen Ausgang nicht vorhergesagt werden kann.
(hier steckt der Zufall)
Umgang mit Zufallsvariablen und ihren Verteilungen
Beispiele:
Wichtige Verteilungen kennen lernen
Grenzwertsätze - Warum brauche ich große Fallzahlen?
Wurf eines Würfel
Gefühl für Wahrscheinlichkeiten entwickeln:
Ziehung der Lottozahlen
“Young man, in mathematics you don’t understand things. You just
get used to them.” - John von Neumann
Anzahl der Notrufe pro Jahr in Leipzig
Ergebnis eines Schwangerschaftstests
Dauer einer Blinddram-OP
3 / 50
4 / 50
Einleitung - Ziele und Motivation
Einleitung - Ziele und Motivation
Ereignisraum I
Ereignisraum II
Definition
Die Menge aller möglichen Ergebnisse eines Zufallsexperiments wird
Ereignisraum genannt und mit Ω bezeichent.
3 grundlegende verschiedene Fälle
Beispiele:
Wurf eines Würfel: Ω = {1, 2, 3, 4, 5, 6}
Ziehung der Lottozahlen:
n
Ω = {1, 2, 3, 4, 5, 6}, {1, 2, 3, 4, 5, 7}, . . . , {1, 2, 3, 4, 5, 49},
{1, 2, 3, 4, 6, 7}, . . . , {1, 2, 3, 4, 6, 49}, . . . , {44, 45, 46, 47, 48, 49}
o
1
Ω ist endlich, z.B. Ω = {0, 1}
2
Ω ist unendlich, aber abzählbar, z.B. Ω = N0
3
Ω ist unendlich und überabzählbar, z.B. Ω = (0, 10)
Beachte
Eine Menge M heißt abzählbar wenn es eine Bijektion zwischen M und
den natürlichen Zahlen N gibt.
(d.h. man kann die Elemente der Menge M “durchnummerieren”)
Anzahl der Notrufe pro Jahr in Leipzig: Ω = {0, 1, 2, . . . } = N0
Abzählbare Mengen: N, Z, Q, 2N = {2, 4, 6, 8, . . . }, . . .
Ergebnis eines Schwangerschaftstests: Ω = {0, 1}
Überabzählbare Mengen: R, C, (0, 1), . . .
Dauer einer Blinddram-OP: Ω = (0, ∞)
5 / 50
Einleitung - Ziele und Motivation
6 / 50
Einleitung - Ziele und Motivation
Rechnen mit (Teil-)mengen
Rechenregeln für (Teil-)mengen
Kommutativgesetze:
Sind A und B Teilmengen aus Ω, also A, B ⊆ Ω dann
enthält die Vereinigung A ∪ B alle Elemente aus Ω die entweder in A
oder B oder in beiden Mengen liegen
A ∩ B = B ∩ A,
und A ∪ B = B ∪ A
Assoziativgesetze:
A ∩ (B ∩ C ) = (A ∩ B) ∩ C
enthält der Schnitt A ∩ B alle Elemente aus Ω die sowohl in A als
auch in B liegen
A ∪ (B ∪ C ) = (A ∪ B) ∪ C
enthält die Differenz A \ B alle Elemente aus Ω die A aber nicht in B
liegen
Distributivgesetze:
A ∩ (B ∪ C ) = (A ∩ B) ∪ (A ∩ C )
enthält Ā alle Elemente aus Ω die nicht in A liegen
A ∪ (B ∩ C ) = (A ∪ B) ∩ (A ∪ C )
Abkürzenden Schreibweisen:
Tn
Ai = A1 ∩ A2 ∩ · · · ∩ An
Si=1
n
i=1 Ai = A1 ∪ A2 ∪ · · · ∪ An
De Morgansche Regeln:
A ∩ B = A ∪ B,
und A ∪ B = A ∩ B
aus A ⊂ B folgt B ⊂ A und A \ B = A ∩ B
7 / 50
8 / 50
Einleitung - Ziele und Motivation
Einleitung - Ziele und Motivation
Ereignissystem, σ-Algebra
Ereignisse
Definition
Ein A ∈ A wird Ereignis genannt.
Definition
Eine Menge A von Teilmengen von Ω wird σ-Alegebra genannt, falls
Damit ist jedes Ereignis eine Teilmenge von Ω.
Ω∈A
falls A ∈ A dann auch Ā ∈ A
falls A1 , A2 , A3 , · · · ∈ A dann auch
S∞
i=1 Ai
∈A
Beispiele:
P(Ω) = die Menge aller Teilmengen von Ω
Bei uns wird das fast immer die richtige Wahl sein.
Würfel: Ω = {1, 2, 3, 4, 5, 6},
A = {∅, {1, 2}, {3, 4, 5, 6}, {1, 2, 3, 4, 5, 6}}
Beachte: Im folgenden werden wir (der Einfachkeit halber) die σ-Algebra
oft nicht explizit erwähnen.
Beispiele:
Würfel: Ω = {1, 2, 3, 4, 5, 6},
A = {2, 4, 6} =
b “Würfeln einer geraden Zahl”
Blinddarm-OP: Ω = (0, ∞),
A = (0, 20) =
b “Die OP dauert weniger als 20 min”
Spezialfälle:
A = {ω} für ein ω ∈ Ω, dann heißt A Elementarereignis
A = ∅ unmögliches Ereignis
A = Ω sicheres Ereignis
für A ⊆ Ω heißt Ā := Ω \ A Gegenereignis
10 / 50
9 / 50
Einleitung - Ziele und Motivation
Axiomatische Einführung
Rechnen mit Ereignissen
Was ist dieses P?
Ziel: Jedem Ereignis A soll eine Wahrscheinlichkeit zugeordnet
werden. Diese soll die Chance beurteilen, dass das Ereignis A eintritt.
UND: A ∩ B - heißt A und B treten gleichzeitig ein
Definition
Sei Ω ein Ereignisraum und A eine σ-Alegebra über Ω. Sei P eine
Abbildung die jedem A ∈ A eine Zahl aus [0, 1] zuordnet und die
folgenden Eigenschaften erfüllt:
ODER: A ∪ B - heißt entweder A oder B oder beide treten ein
MINUS: A \ B - heißt es tritt A aber nicht B ein
Da Ereignisse Teilmengen von Ω sind gelten
1
die
die
die
die
Kommutativgesetze
Assoziativgesetze
Distributivgesetze und
De Morganschen Regeln.
2
P(Ω) = 1
S
P
∞
P ∞
A
i=1 i =
i=1 P(Ai ) falls alle A1 , A2 , · · · ∈ A und
für alle i 6= j gilt Ai ∩ Aj = ∅
Dann nennen wir P Wahrscheinlichkeitsmaß auf Ω und P(A) die
Wahrscheinlichkeit eines Ereignis A ∈ A. Das Tripel (Ω, A, P) heißt dann
Wahrscheinlichkeitsraum oder Wahrscheinlichkeitsmodell.
11 / 50
12 / 50
Axiomatische Einführung
Axiomatische Einführung
Rechnen mit Wahrscheinlichkeiten
Aufgabe 1 zu Wahrscheinlichkeiten
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und A, B ∈ A, dann gilt:
Ansteckend oder nicht?
In einem Krankenhaus sei bekannt, dass der Anteil der Patienten die an
Rückenbeschwerden leiden und gleichzeitig eine ansteckende Krankheit
besitzen bei 5% liegt. Außerdem weiß man dass 10% der Patienten des
Krankenhauses an Rückenbeschwerden leiden, aber keine ansteckende
Krankheit besitzen. Weiter ist bekannt, dass 19% der Patienten
mindestens eins der beiden Krankeitsbilder aufweisen.
P(∅) = 0,
P(A ∪ B) = P(A) + P(B), falls A ∩ B = ∅,
P(Ā) = 1 − P(A),
P(A) ≤ 1,
P(A) ≤ P(B) falls A ⊆ B
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) und
P(A) = P(A ∩ B̄) + P(A ∩ B)
Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter
Patient eine ansteckende Krankheit besitzt?
P(B \ A) = P(B) − P(A) falls A ⊆ B
Wie groß ist der Anteil der Patienten mit Rückenbeschwerden?
14 / 50
13 / 50
Axiomatische Einführung
Axiomatische Einführung
Laplacesches Modell
Aufgabe 2 zu Wahrscheinlichkeiten
Definition
Ein Wahrscheinlichkeitsmodell heißt Laplacesches Modell, falls Ω endlich
ist (also Ω = {ω1 , . . . , ωn }) und
P({ω1 }) = · · · = P({ωn }) =
1
.
n
Zwei Würfel
Bestimme die Wahrscheinlichkeit beim Wurf mit 2 Wüfeln mindestens die
Augensumme 10 zu erreichen!
In dieser Situation kann man für ein beliebiges A ∈ P(Ω) die
Wahrscheinlichkeit wie folgt bestimmen:
P(A) =
|A|
m
= ,
|Ω|
n
wobei m = |A| die Anzahl der Elemente in A ist. Es gilt also:
P(A) =
Anzahl günstiger Elementarereignisse
.
Anzahl aller Elementarereignisse
Man sagt dann: P ist die Gleichverteilung auf Ω.
15 / 50
16 / 50
Kombinatorik
Kombinatorik
Kombinatorik
Reihfolge wichtig
Reihefolge wichtig, Wiederholung möglich
Variation von n Elementen zur k-ten Klasse mit Wiederholungen
Fragestellung
Wieviele Möglichkeiten gibt es aus einer n-elementigen Menge k Elemente
auszuwählen?
Dabei sind die Spielregeln zu klären! Insbesondere ist wichtig:
v̄nk = nk
Reihefolge wichtig, Wiederholung nicht möglich
Variation von n Elementen zur k-ten Klasse ohne Wiederholungen
Spielt die Reihefolge eine ein Rolle?
vnk = n · (n − 1) · ... · (n − (k − 1)) =
Dürfen Elemente mehrfach ausgewählt werden (Ziehen mit zurück
legen oder nicht)?
n!
(n − k)!
Beachte: n! = n · (n − 1) · ... · 2 · 1
Wichtiger Spezialfall: n = k dann vnk = n!
Dies beschreibt die Anzahl der möglichen Anordnungen von n Elementen
(=Permutationen).
17 / 50
Kombinatorik
18 / 50
Bedingte Wahrscheinlichkeit
Reihfolge nicht wichtig
Bedingte Wahrscheinlichkeit, Wozu brauchen wir das?
Reihefolge nicht wichtig, Wiederholung möglich
Kombination von n Elementen zur k-ten Klasse mit Wiederholungen
n+k −1
(n + k − 1)!
k
c̄n =
=
k!(n − 1)!
k
Frage
Wie verändert sich die Wahrscheinlichkeit eines Ereignisses, falls ich
Zusatzwissen mit einfließen lasse?
Reihefolge nicht wichtig, Wiederholung nicht möglich
Kombination von n Elementen zur k-ten Klasse ohne Wiederholungen
n
n!
k
cn =
=
k
k!(n − k)!
Ereignisse können sich gegenseitig beeinflussen
falls bekannt ist, dass ein Ereignis eingetreten ist, kann sich die
Wahrscheinlichkeit für das Eintreten eines anderen Ereignisses ändern
Wichtiger Spezialfall: n = k dann cnk = 1
19 / 50
20 / 50
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit, Wozu brauchen wir das?
Bedingte Wahrscheinlichkeit, Wozu brauchen wir das?
Beispiel 1
HIV Prävalenz liegt weltweit bei 0, 8%, also
P1 ({zufällig ausgewählte Person ist HIV positiv}) = 0.008.
Beispiel 2
Wurf mit zwei Würfeln: Wie groß ist die Wahrscheinlichkeit, dass die
Augensumme mindestens 10 ergibt, falls man schon weiß dass ein Würfel
Modell 1: Ω = {0, 1}, P1 ({1}) = 0.008, P1 ({0}) = 0.992
Zusatzwissen: ausgewählte Person ist Europäer und HIV Prävalenz in
Europa liegt bei 0, 2%. Jetzt gilt also
(a) eine 1 zeigt, oder
(b) eine 6 zeigt?
P2 ({zufällig ausgewählte Person ist HIV positiv}) = 0.002.
Modell 2: Ω = {0, 1}, P2 ({1}) = 0.002, P2 ({0}) = 0.998
Problem
Wie kombiniert man die beiden Modelle?
Wir wollen nicht gleichzeitig mit 2 verschiedenen P’s rechnen!
WK für HIV positiv unter nicht-Europäern?
21 / 50
22 / 50
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit, Definition
Bedingte Wahrscheinlichkeit, Aufgabe
Definition
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und seien A, B ∈ A zwei
Ereinisse mit P(B) > 0. Dann definieren wir
P(A | B) :=
Aufgabe
Wurf mit zwei Würfeln: Wie groß ist die Wahrscheinlichkeit, dass die
Augensumme mindestens 10 ergibt, falls man schon weiß dass ein Würfel
P(A ∩ B)
P(B)
(a) eine 1 zeigt, oder
und nennen P(A | B) die Wahrscheinlichkeit von A bedingt auf B.
(b) eine 6 zeigt?
Interpretation:
“Wie groß ist die Wahrscheinlichkeit von A, wenn ich schon weiß dass B
eingetreten ist”
23 / 50
24 / 50
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit
Rechnen mit bedingten Wahrscheinlichkeiten
Formel von der totalen Wahrscheinlichkeit
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und A, A1 , A2 , B ∈ A Ereignisse
mit P(B) > 0. Dann gilt
Formel von der totalen Wahrscheinlichkeit
Seien B1 , . . . , Bn ∈ A mit
Sn
i=1 Bi = Ω und
P(B | B) = 1 und P(∅ | B) = 0
falls A ∩ B = ∅ dann P(A | B) = 0
Bi ∩ Bj = ∅ falls i 6= j (paarweise disjunkt)
P(Ā | B) = 1 − P(A | B)
P(Bi ) > 0 für alle i = 1, . . . , n
P(A1 ∪ A2 | B) = P(A1 | B) + P(A2 | B) − P(A1 ∩ A2 | B)
dann gilt für beliebiges A ∈ A
falls B ⊂ A dann P(A | B) = 1
falls A ⊂ B dann P(A | B) =
P(A) =
P(A)
P(B)
n
X
P(A | Bi ) · P(Bi )
i=1
26 / 50
25 / 50
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit
Formel von Bayes
Aufgabe 1 zur bedingten Wahrscheinlichkeit
Formel von Bayes
Seien B1 , . . . , Bn ∈ A mit
Sn
i=1 Bi = Ω und
Aufgabe zur Prävalenz von HIV
HIV Prävalenz liegt weltweit bei 0, 8% und in Europa bei 0.2%. Es gibt
etwa 7 Milliarden Menschen auf der Erde und etwa 740 Mio davon leben in
Europa.
Bi ∩ Bj = ∅ falls i 6= j (paarweise disjunkt)
P(Bi ) > 0 für alle i = 1, . . . , n
Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter
Europäer HIV-positiv ist?
dann gilt für beliebiges A ∈ A mit P(A) > 0 und j ∈ {1, . . . , n}
Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter
Nicht-Europäer HIV-positiv ist?
P(A | Bj ) · P(Bj )
P(A | Bj ) · P(Bj )
P(Bj | A) =
= Pn
P(A)
i=1 P(A | Bi ) · P(Bi )
27 / 50
28 / 50
Bedingte Wahrscheinlichkeit
Bedingte Wahrscheinlichkeit
Zuverlässigkeit von Tests
Aufgabe 2 zur bedingten Wahrscheinlichkeit
Definition
Sensitivität := Wahrscheinlichkeit, dass Test “positiv” anzeigt, wenn
man tatsächlich “positiv” ist.
richtig-positiv
Aufgabe zur Zuverlässigkeit von HIV Speicheltests
Für einen HIV Speicheltest werden folgende Werte angegeben:
Sensitivität = 0.98, Spezifität = 0.997.
Außerdem wissen wir:
Einwohner in Deutschland = 80, 8 Mio,
HIV Infizierte in Deutschland = 78000.
Spezifität := Wahrscheinlichkeit, dass Test “negativ” anzeigt, wenn
richtig-negativ
man tatsächlich “negativ” ist.
Übersicht
Test positiv
Test negativ
krank
richtig-positiv
falsch-negativ
Wie hoch ist die Wahrscheinlichkeit, dass eine positiv geteste Person
tatsächlich kein HIV-Träger ist?
gesund
falsch-positiv
richtig-negativ
Wie hoch ist die Wahrscheinlichkeit, dass eine negativ geteste Person
tatsächlich HIV-Träger ist?
29 / 50
Bedingte Wahrscheinlichkeit
30 / 50
Unabhängigkeit und Unkorreliertheit
zur Lösung
Unabhängigkeit
Ereignisse: K := {Patient krank}, P := {Test ist positiv}
Gegeben: P(P | K ) = 0.98 und P(P̄ | K̄ ) = 0.997 und
78000
P(K ) = 80800000
≈ 0.001
Gesucht: P(K̄ | P) und P(K | P̄)
Definition
Zwei Ereignisse A, B ∈ A heißen stochastisch unabhängig wenn
Bayes sagt:
P(P | K̄ )P(K̄ )
0.003 · 0.999
P(K̄ | P) =
=
0.003 · 0.999 + 0.98 · 0.001
P(P | K̄ )P(K̄ ) + P(P | K )P(K )
= 0.7535831 (absolut krass!)
und
P(K | P̄) =
P(A ∩ B) = P(A) · P(B).
Sind A und B unabhängig und P(B) > 0, dann gilt
P(A | B) =
P(A ∩ B)
P(A)P(B)
=
= P(A).
P(B)
P(B)
P(P̄ | K )P(K )
0.02 · 0.001
=
0.02
·
0.001
+ 0.997 · 0.999
P(P̄ | K )P(K ) + P(P̄ | K̄ )P(K̄ )
= 0.00002008
31 / 50
32 / 50
Unabhängigkeit und Unkorreliertheit
Unabhängigkeit und Unkorreliertheit
Eigenschaften unabhängiger Ereignisse
Beispiel - Münze und Würfel
Wir werfen eine faire Münze (Werte 0 oder 1) und einen fairen Würfel
(Werte 1, . . . , 6). Untersuchen Sie die folgenden Ereignisse auf
Unabhängigkeit
A und B disjunkt und P(A) > 0 und P(B) > 0
⇒ A und B stochastisch abhängig
Sind A und B stochastisch unabhängig, so sind
A und B̄ stochastisch unabhängig
Ā und B stochastisch unabhängig
Ā und B̄ stochastisch unabhängig
1
A = {Wert der Münze ist 1} und B = {Wert des Würfel > 4}
2
A = {Wert der Münze ist 1} und
C = {Wert des Würfel + Wert der Münze > 4}
Möglichkeiten:
(0, 1), (0, 2), (0, 3), (0, 4), (0, 5), (0, 6), (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),
Laplace-Experiment (alle haben WK 1/12)
∅ und Ω sind zu jedem A ∈ A stochastisch unabhängig
1
P(A) = 6/12, P(B) = 4/12, P(A ∩ B) = 2/12 also
P(A ∩ B) = 1/6 = 1/2 · 1/3 = P(A) · P(B) ⇒ unabhängig
2
P(A) = 6/12, P(C ) = 5/12, P(A ∩ C ) = 3/12 also
P(A ∩ C ) = 1/4 6= 1/2 · 5/12 = P(A) · P(C ) ⇒ abhängig
33 / 50
Zufallsvariablen
34 / 50
Zufallsvariablen
Zufallsvariablen
Beispiel Zufallsvariable
Definition
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum. Dann heißt eine Abbildung
X : Ω → R Zufallsvariable (oder Zufallsgröße) (Ω, A, P) falls für alle
Intervalle I ⊆ R gilt:
{ω ∈ Ω | X (ω) ∈ I } ∈ A
(1)
Eine ZV ordent also jedem Elementarereignis ein Zahl aus R zu.
Ω = {(i, j) | i, j ∈ {1, . . . , 6}}
(1.Koord = Christines Würfel, 2.Koord = Fabians Würfel)
A = P(Ω) (= Potenzmenge = {alle Teilengen von Ω }),
P = Gleichverteilung auf Ω, da Laplace-Experiment
Christines Gewinn ist z.B für Ergebnis (4, 1) gerade 4 − 1 = 3 Euro. Also
definieren wir
X : Ω → R,
X ((i, j)) := i − j.
Oft interessiert man sich für Wahrscheinlichkeiten
P({ω ∈ Ω | X (ω) ∈ I })
bzw. in Kurzschreibweise
Würfelspiel
Christine und Fabian spielen ein Würfelspiel. Jeder hat einen Würfel.
Gewürfelt wird gleichzeitig. Das Ergebnis von Christines Würfel sagt
wieviel Euro sie von Fabian bekommt. Das Ergebnis von Fabians Würfel
sagt wieviel Euro er von Christine bekommt.
Stellen Sie ein passendes wahrscheinlichkeitstheoretisches Modell auf und
definieren Sie eine Zufallsvariable, die Christines (Netto-)Gewinn
wiedergibt.
P(X ∈ I )
Bedingung (1) stellt sicher, dass solche Wahrscheinlichkeiten
berechnet werden können
35 / 50
36 / 50
Zufallsvariablen
Zufallsvariablen
Beispiel Zufallsvariable
Verteilungsfunktion
Würfelspiel, reloaded
Christine und Fabian spielen wieder ihr Würfelspiel. Heute hat Christine
nur 3 Euro dabei. Sie fragt sich, wie groß die Wahrscheinlichkeit ist, dass
sie (netto) mehr als 3 Euro Verlust hat. Helfen Sie ihr!
Definition
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und X eine Zufallsvariable. Die
Funktion FX : R → R mit
FX (x) := P(X ≤ x)
heißt Verteilungsfunktion der Zufallsvariable X .
Gesucht P(X < −3).
Beispiel: Würfel, Ω = {1, . . . , 6}, X (ω) := ω dann
P(X < −3) = P({(i, j) ∈ Ω | i − j < −3})
= P({(1, 5), (1, 6), (2, 6)})
|{(1, 5), (1, 6), (2, 6)}|
3
1
=
=
=
|Ω|
36
12
1
1/2
0
1
2
3
4
5
6
38 / 50
37 / 50
Zufallsvariablen
Zufallsvariablen
Eigenschaften der Verteilungsfunktion
Stetige vs. diskrete Zufallsvariablen
Wichtige Unterscheidung:
Sei (Ω, A, P) ein Wahrscheinlichkeitsraum und X eine Zufallsvariable mit
Verteilungsfunktion F . Dann gilt
0 ≤ F (x) ≤ 1 für alle x ∈ R
Diskrete Zufallsvariable: Eine ZV X heißt diskret, falls X nur endlich
viele oder abzählbar unendlich viele Werte annehmen kann.
Stetige Zufallsvariable: Eine ZV X heißt stetig, falls eine integrierbare
Funktion f : R → R existiert, so dass für die Verteilungsfunktion F
gilt
Z
für a ∈ R: P(X > a) = 1 − F (a)
für a < b: P(a < X ≤ b) = F (b) − F (a)
x
F ist monoton wachsend
F (x) =
f (y )dy .
−∞
limx→−∞ F (x) = 0
Diese Funktion f heißt Dichtefunktion der Zufallsvariable X .
limx→∞ F (x) = 1
Die Art einer ZV (stetig oder diskret) entscheidet über Methoden zur
Berechnung wichtiger Kenngrößen wie etwa dem Erwartungswert und der
Varianz.
für x0 ∈ R: limx&x0 F (x) = F (x0 ) (F ist rechtsstetig)
39 / 50
40 / 50
Zufallsvariablen
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Ist X eine diskrete ZV an, so nimmt X nur abzählbar viel Werte an (oder
endlich viele), etwa x1 , x2 , x3 , . . . . Wir definieren damit für jedes i
pi := P(X = xi ).
Dann gilt für die Verteilungsfunktion
X
X
F (x) = P(X ≤ x) =
P(X = xi ) =
pi
i:xi ≤x
Der Erwartungswert ist
E(X ) :=
∞
X
−∞
Der Erwartungswert ist
i:xi ≤x
Z
∞
E(X ) :=
xi pi
yf (y ) dy
−∞
i=1
Die Varianz ist
Ist X eine stetige ZV an mit Dichte f so gilt (nach Definition) für die
Verteilungsfunktion
Z x
F (x) = P(X ≤ x) =
f (y )dy
Die Varianz ist
∞
X
Var(X ) :=
(xi − E(X ))2 pi
Z
∞
Var(X ) :=
(y − E(X ))2 f (y ) dy
−∞
i=1
(nimmt X nur endlich (n ∈ N) viele Werte an, gehen die Summen jeweils
bis n)
41 / 50
Spezielle Verteilungen
42 / 50
Grenzwertsätze der Wahrscheinlichkeitsrechnung
Spezielle Verteilungen
Was sind Grenzwertsätze?
Kennt man die Verteilung einer ZV nicht, so kann man mittels vieler
Wiederholungen des Experimentes mehr Informationen über die ZV
sammeln
siehe letzte Woche
Diese Experimente sollten (nach Möglichkeit) immer gleich ablaufen
und sich gegenseitig nicht beeinflussen
Die Grundlage dass man mit Hilfe vieler einzelner Experimente zu
einer Aussage über die Tatsächliche Verteilung gelangt, bilden die
Grenzwertsätze der Wahrscheinlichkeitsrechnung
43 / 50
44 / 50
Grenzwertsätze der Wahrscheinlichkeitsrechnung
Grenzwertsätze der Wahrscheinlichkeitsrechnung
Beispiel Münzwurf
Wir werfen eine Münze wieder und wieder (z.B 1000 mal) und
notieren die Werte
z.B. 0, 0, 1, 0, 1, 1, 1, . . . , 0, 0, 1
Wir erwarten dann
0 + 0 + 1 + 0 + 1 + 1 + 1 + ··· + 0 + 0 + 1
≈ 0.5
1000
Warum erwarten wir das?
Weil unsere Münze fair ist und in etwa der Hälfte der Fälle 1
erscheinen sollte.
Die Formalisierung dieser Idee nennt sich Gesetz der großen Zahlen
Weitere wichtige Gesetze/Sätze zum Nachschlagen
Gesetz der Großen Zahlen
Sagt, dass empirische Mittelwerte gegen den Erwartungswert
konvergieren.
Zentraler Grenzwertsatz
Beantwortet die Frage warum die Normalverteilung so “normal” ist
und sie hinter jeder Ecke lauert.
Der Satz von Glivenko–Cantelli
wird auch der “Hauptsatz der Statistik” genannt. WICHTIG! Sagt,
dass die empirischen Verteilungsfunktionen gegen die tatsächliche
Verteilungsfunktion konvergiert.
Grenzwertsatz von Moivre/Laplace
Ist ein Spezialfall des Zentralen Grenzwertsatz. Beantwortet die Frage
warum sich die (diskrete) Binomialverteilung für große n fast wie die
Normalverteilung verhält.
Grenzwertsatz von Poisson
Beantwortet die Frage warum die Binomialverteilung bei großem n
auch manchmal der Poisson-Verteilung sehr ähnlich sein kann.
45 / 50
46 / 50
Aufgaben
Aufgaben
DNA
Die menschliche DNA besteht aus etwa 3,2 Mrd Bausteinen, die sich
jeweils nur um eine Base unterscheiden. Als Basen kommen nur Adenin,
Guanin, Cytosin, und Thymin in Frage. Wieviel Möglichkeiten gibt es
(theoretisch) eine DNA aus diesen Basen herzustellen?
Elfmeterschießen I
Für das Elfmeterschießen muß der Trainer 5 der 11 Spieler auf dem Platz
benennen. Wie viele Möglichkeiten hat er bei
der Bestimmung der Kandidaten?
der Bestimmung der Reihenfolge der Schützen, nachdem die
Kandidaten gewählt wurden?
47 / 50
Würfelspiel, rereloaded
Geben Sie die Verteilungfunktion zur Zufallsvariable X (die Christines
Nettogewinn beim Würfelspiel beschreibt) an.
Ziegenproblem
Nehme Sie an, Sie wären in einer Spielshow und hätten die Wahl zwischen
drei Toren. Hinter einem der Tore ist ein Auto, hinter den anderen sind
Ziegen. Sie wählen ein Tor, sagen wir, Tor Nummer 1, und der
Showmaster, der weiß was hinter den Toren ist, öffnet ein anderes Tor,
sagen wir, Nummer 3, hinter dem eine Ziege steht. Er fragt Sie nun:
“Möchten Sie jetzt lieber das Tor Nummer Zwei?” Ist es von Vorteil, die
Wahl des Tores zu ändern?
48 / 50
Aufgaben
Aufgaben
Grippeschutz
In einer Gruppe von 900 Personen haben sich 600 prophylaktisch gegen
Grippe impfen lassen. Nach einer bestimmten Zeit wurde jedes
Gruppenmitglied danach befragt, wer an einer Grippe erkrankte. Die
Ergebnisse werden in einer 4-Feldertafel dargestellt.
mit Impfung
ohne Impfung
Summe
erkrankt
60
120
180
nicht erkrankt
540
180
720
Schafe
Das Schlachtgewicht von Schafen sei normalverteilt mit Mittelwert 60 kg
und Standardabweichung 10 kg. Wie groß ist die Wahrscheinlichkeit, dass
das Schlachtgewicht eines Schafes über 70 kg ist
Summe
600
300
900
Das Ereignis A sei “Person ist geimpft” und das Ereignis B sei “Person ist
erkrankt”. Berechnen Sie:
Elfmeterschießen II
Die Wahrscheinlichkeit dass eine Spieler einen Elfmeter im Tor versenkt
liegt bei 0, 82. Wie groß ist die Wahrscheinlichkeit dass von 5
Elefmeterschüzten mindestens 2 treffen.
P(A), P(B), P(A ∩ B), P(B | A), P(A | B), P(Ā ∩ B), P(B | Ā)
Geben Sie die Bedeutung der einzelnen Ergebnisse an.
49 / 50
50 / 50
Herunterladen