Wahrscheinlichkeitsrechnung IAi ? IAi Zufallsexperiment

Werbung
Grundbegriffe
Zufallsexperiment
Wahrscheinlichkeitsrechnung
– Vorgang nach einer bestimmten Vorschrift ausgeführt
– (im Prinzip) beliebig oft wiederholbar
– sein Ergebnis ist zufallsabhängig
– bei mehrmaligen Durchführung des Experiments
beeinflussen die Ergebnisse einander nicht
Beispiele:
IAi
?
IAi
IA i
Würfelspiel
KAD 2012.09.27
Elementarereignisse
Roulett
?
IAi
Blutgruppenversuch
Fahrtversuch
2
Ereignis
die einzelnen, nicht mehr zerlegbaren und sich gegenseitig
ausschliessenden Ausgänge oder Ergebnisse eines
Zufallsexperimentes
jede beliebige Teilmenge des Ergebnisraumes
zB. Augenzahl des Würfels >3: {4, 5, 6}
Ereignismenge, Ereignisraum (Ω )
Reihe aller möglichen Elementarereignisse. Z.B:
beim Würfelspiel:
Ω = {1, 2, 3, 4, 5, 6 }
Augenzahl des Würfels ist gerade: {2, 4, 6}
beim Münzenexperiment: Ω = {Zahl, Kopf}
beim „Blutgruppenversuch”: Ω = {IA IA , IA i, iIA, ii}
beim „Fahrtversuch“:
{kein Unfall, Unfall}
Blutgruppe A: {IA IA , IA i, iIA }
3
4
Definition der Wahrscheinlichkeit
Operationen mit Ereignissen
Man kann mit Ereignissen rechnen wie mit Mengen.
Bernoulli (1654-1705), Laplace (1749-1827)
(klassische Wahrscheinlichkeit)
B
A
Vereinigung
Menge aller Elementarereignisse,
die zu A oder B gehören
A∪B
Durchschnitt
Menge aller Elementarereignisse, die
zu A und B gehören
A∩B
Komplementbildung
Menge aller Elementarereignisse des
Ereignisraumes, die nicht in Ereignis A
enthalten sind (Gegenereignis von A)
p(E ) =
g
m
p(E ) =
Anzahl der für E günstigen Elementare reignisse
Anzahl aller gleichmögl ichen Elementare reignisse
A
5
Beispiele
Würfelexperiment:
p(6) =
Bei einem Zufallsexperiment, was endlich viele Ausgänge hat,
die (zB. wegen Symmetriegründen) gleichwahrscheinlich sind,
die Wahrscheinlichkeit eines Ereignisses (E) ist:
p=probability, Probabilität
6
p(E ) =
Beispiele
Blutgruppenversuch
1
6
1
p(I I ) =
4
{IA IA}
IAi
A A
p(gerade Zahl ) =
3
6
{IA IA , IA i, iIA, ii}
p(Blutgruppe = A) =
3
4
Münzenexperiment:
p(Kopf ) =
g
m
p(Blutgruppe = 0) =
1
2
7
1
4
?
IAi
Ω={IA IA , IA i, iIA, ii}
{IA IA , IA i, iIA}
{IA IA , IA i, iIA, ii}
{ii}
{IA IA , IA i, iIA, ii}
8
1
g
„Fahrtversuch” ? keine Symmetrie ! p(E ) = m ≠ 2
Beispiel
Statistische Wahrscheinlichkeit
Ereignis A
Zufallsexperiment
Ereignis B
Tritt bei n-maliger Durchführung
eines Zufallsexperimentes ein
bestimmtes Ereignis A k-mal auf,
so bezeichnet man die in langen
Versuchsreihen zu beobachtende
relative Häufigkeit als
Wahrscheinlichkeit, p(A) :
p( A) =
k
n
9
10
Beispiele
Buffon (1707-1788):
2048
p( A) =
= 0.5069
4040
Pearson (1857-1936):
p( A) =
6019
= 0.5016
12000
p( A) =
12012
= 0.5005
24000
Eigenschaften der Wahrscheinlichkeit
0 ≤ p( A) ≤ 1
p(sicheres Ereignis) = 1
Häufigkeit der Krankheiten:
“Die Todesursachengruppe der bösartigen Neubildungen war in 2006
für 25,6% der Todesfälle verantwortlich” (http://www.statistik.at )
p(bösart. Neub.als Todesursache)= 19 056/74 295=25,6%
die Wahrscheinlichkeit,
dass ein Neugeborener
das n-te Lebensjahr
erlebt
Österreich, 2006
Jahr
30
40
50
60
70
p(unmögliches Ereignis) = 0
zB: p(Augenzahl des Würfels <10) = 1
p(Augenzahl des Würfels =10) = 0
80
90
M
0.986 0.977 0.955 0.893 0.766 0.513 0.152
W
0.994 0.990 0.978 0.947 0.879 0.703 0.290
11
im unseren Blutgruppenversuch:
p(Blutgruppe = B) = 0
12
Additionsregel
zB: Würfel:
p(A oder B) = p(A)+p(B)-p(A und B)
Unabhängige Ereignisse
Wenn die Ereignisse einander nicht beeinflussen:
p(A und B)=p(A) p(B)
p(gerade oder >3)=4/6
p(gerade) + p(>3) - p(gerade und >3)
3/6 + 3/6 2/6
=4/6
zB: Würfelexperiment mit zwei Würfeln
p(beide=6)=p(erste=6)·p(zweite=6)=1/36
für Ereignisse A und B p(A oder B) = p(A)+p(B)
ist gültig nur wenn A und B nicht gleichzeitig auftreten können (disjunkte
Ereignisse, p(A und B)=0)
zB: Würfel:
Münze:
p(5 oder 6)=1/6+1/6=1/3
p(Kopf oder Zahl)=1/2+1/2=1
Bedingte Wahrscheinlichkeit
13
p( A|B ) =
Die Wahrscheinlichkeit, dass A zutrifft unter
der Voraussetzung, dass B eingetreten ist*.
p( A und B )
p(B )
2
p( > 3 und gerade ) 6 2
= =
zB: bei Würfelexperiment: p(>3|gerade) =
3 3
p(gerade)
ungerade gerade
6
Die Wahrscheinlichkeit, dass der Mann eines Ehepaares das
80. und die Frau das 70. Lebensjahr erreichen :
p(M80 und W70) = p(M80)·p(W70) = 0.513·0.879 = 0.451 = 45.1%
Die Wahrscheinlichkeit, dass ein
Neugeborener das
n-te Lebensjahr
erlebt
30
40
50
60
70
80
90
M
Jahr
0.986
0.977
0.955
0.893
0.766
0.513
0.152
W
0.994
0.990
0.978
0.947
0.879
0.703
0.290
14
Wie groß ist die Wahrscheinlichkeit, dass ein 50
jähriger Mann das 80. Lebensjahr erreicht?
Die Wahrscheinlichkeit, dass ein
Neugeborener das
n-te Lebensjahr
erlebt
Jahr
30
40
50
60
70
Beispiele
80
90
M
0.986 0.977 0.955 0.893 0.766 0.513 0.152
W
0.994 0.990 0.978 0.947 0.879 0.703 0.290
p(M80|M50) = 0.513 / 0.955 = 0.537
Wie groß ist die Wahrscheinlichkeit, dass ein 60 jähriger
Mann das 80. Lebensjahr erreicht?
p(M80|M60) = 0.513 / 0.893 = 0.574
<=3
>3
p( > 3) =
3 1
=
6 2
p(gerade ) =
3 1
=
6 2
p( > 3 und gerade ) =
*oder: p(A gegeben B), p von A vorausgesetzt B
2
6
p( > 3 | gerade ) =
2 4
=
3 6
Wie groß ist die Wahrscheinlichkeit, dass ein 70 jähriger
Mann das 80. Lebensjahr erreicht?
p(M80|M70) = 0.513 / 0.766 = 0.670
16
Beispiel (Daten: USA 1991)
p(Krankheit | Risikofaktor)
Risikofaktor ja
Anzahl von
Neugeborenen
Das relative Risiko
Säuglingsmortalität
Risikofaktor: kleines Geburtsgewicht
„Krankheit“: Säuglingsmortalität
Risikofaktor nein
Krankheit
ja
Krankheit
nein
Teilsumme
a=21054
b=271269
a+b
c=14442 d=3804294
c+d
Teilsumme
a+c
b+d
a+b+c+d
a
p(K + und R+ ) a + b + c + d
21054
a
= p(K + R+ ) =
=
=
=
= 0.0720
+
a
b
p(R+ )
a + b 21054 + 271269
a+b+c +d
a
a
RR =
= +b
c
p(K + R− )
c +d
RR=
p(Säuglingsmortalität | normales Geburtsgewicht)=
c
p(K + und R− ) a + b + c + d
14442
c
= p(K + R− ) =
=
=
=
= 0.0037
c +d
p(R− )
c + d 14442 + 3804294
a+b+c +d
17
K-
R+
a
b
R-
c
d
Erkrankungswahrscheinlichkeit einer Risikogruppe relativ
zur Erkrankungswahrscheinlichkeit einer nicht Risikogruppe.
p(K + R+ )
p(Säuglingsmortalität | kleines Geburtsgewicht) =
K+
RR =
• zB: Relatives Risiko der
Säuglingsmortalität mit
Risikofaktor von Geburtsgewicht:
p(Säuglingsmortalität | kleines Geburtsgewicht)
p(Säuglingsmortalität | normales Geburtsgewicht)
0.0720
= 19.04
0.0037
18
Ergänzungsmaterial
Charakterisierungsmöglichkeiten
des Eintretens von Ereignissen
Das Chancenverhältnis (Odds ratio)
Ereignis A
Wahrscheinlichkeit p(A)
odds
unmögliches Ereignis
0
0
Ereignis A und Gegenereignis von A 0.5
haben die gleichen Chancen
1
sicheres Ereignis
∞
1
Ereignis A und Gegenereignis von A haben die gleiche Chance
-∞
0
1
+∞
Wahrscheinlichkeit
odds =
-∞
p
1− p
p=
0
1
+∞
odds
1 + odds
Odds (Chance)19
p(K +|R+ )
p(K − | R + )
OR =
=
p(K + | R− )
p(K − | R− )
a
a+b
b
a+b
c
c+d
d
c+d
a
⎛ a
⎜
= b =⎜ c
c
⎜ b
⎜
d
⎝ d
⎞
⎟ ad
⎟=
⎟ bc
⎟
⎠
K+
K-
R+
a
b
R-
c
d
• zB: Chancenverhältnis der Säuglingsmortalität mit
Risikofaktor von Geburtsgewicht:
0.0720
0.0720
OR = 1 − 0.0720 = 0.9280 = 20.4
0.00378
0.0037
1 − 0.00378 0.99622
20
Verteilungen
Verteilungen
Population
Wahrscheinlichkeitsverteilung
Wie kann man die theoretische Verteilung bestimmen?
Vermutung
?, ?, ...
Δn
Δx
(nach dem
Histogram)
Laplace-Prinzip:
wenn nichts dagegen spricht, gehen wir
davon aus, dass alle Elementarereignisse
gleich wahrscheinlich sind
⎛ Min ⎞
⎜
⎟
⎝ 5 ⎠
Häufigkeitsdichte
Stichprobe
Modellannahme
x , s , ...
Gleichverteilung?
Pulszahl
⎛ 1 ⎞
⎜
⎟21
⎝ Min ⎠
Gleichverteilung
Klassifizierung der Verteilungen
•
•
•
•
•
diskrete Verteilungen
diskrete Gleichverteilung
Binomialverteilung
Poisson Verteilung
...
diskrete Zufallsgröße
zB: Anzahl der
Kranken, Augenzahl
des Würfels
•
•
•
•
•
•
Laplace-Experiment:
es meint ein Zufalls-Experiment bei dem
davon ausgegangen wird, dass jeder
Versuchsausgang gleichwahrscheinlich ist
22
Diskrete Gleichverteilung
Beispiel:
kontinuierliche Verteilungen
kontinuierliche Gleichverteilung
Normalverteilung
Chi-Quadrat Verteilung
t-Verteilung
...
kontinuierliche Zufallsgröße
Wertebereich
1
2
3
4
5
6
Wahrscheinlichkeit
1
6
1
6
1
6
1
6
1
6
1
6
p(k)
weitere Beispiele:
1/6
Münzenversuch
1
zB: Blutdruck, Körperhöhe,...
2
p( k ) =
23
3
1
,
6
4
5
6
k = 1, 2, ..., 6
k
Würfelexperiment
mit einem
Ikosaeder
24
Nützliche Formel des arithmetischen Mittelwertes
Lageparameter der Verteilung
Es sei X eine diskrete Zufallsgröße mit Werten x1,x2… dann heisst
μ = ∑ x i p( x i )
Berechnung aus
Einzelbeobachtungen
(ungewogenes)
arithmetisches Mittel
n
x + x2 + K + xn
x= 1
=
n
Erwartungswert von X.
i
∑x
i =1
i
n
Berechnung aus
gruppierten Daten
(Merkmalausprägungen)
gewogenes
arithmetisches Mittel
Der Erwartungswert gibt denjenigen Wert an, den man als
Mittelwert (durchschnittlichen Wert) über viele
Versuchswiederholungen “erwarten” kann.
Dabei ist es durchaus möglich, dass der Erwartungswert bei
keinem einzigen Versuch realisiert wird oder sogar überhaupt
nicht vorkommen kann.
m
n x + n2 x 2 + K + nm x m
x= 1 1
=
n1 + n2 + K + nm
∑ ni x i
i =1
m
∑n
i =1
25
Erwartungswert und Durchschnittswert
μ = ∑ x i p( x i )
ni
hi
1
15
15/100
2
20
20/100
3
14
14/100
4
16
16/100
5
18
18/100
6
17
17/100
x=
=
15 ⋅ 1 + 20 ⋅ 2 + 14 ⋅ 3 + 16 ⋅ 4 + 18 ⋅ 5 + 17 ⋅ 6
=
100
14
16
18
17
15
20
⋅1+
⋅2+
⋅3 +
⋅4+
⋅5 +
⋅ 6 = 3.53 =
100
100
100
100
100
100
= h(1) ⋅ 1 + h(2) ⋅ 2 + h(3) ⋅ 3 + h( 4) ⋅ 4 + h(5) ⋅ 5 + h(6) ⋅ 6 →
⎯⎯ ⎯⎯→ P (1) ⋅ 1 + P (2) ⋅ 2 + P (3) ⋅ 3 + P ( 4) ⋅ 4 + P (5) ⋅ 5 + P (6) ⋅ 6 = μ
n→∞
xi: Augenzahl
ni: absolute Häufigkeit
hi: relative Häufigkeit
i
i =1
i
n
m
m
i =1
i =1
= ∑ hi x i = ∑ x i hi
i
ni: absolute Häufigkeit, hi: relative Häufigkeit
26
Es sei X eine diskrete Zufallsgröße mit Werten x1,x2,... und mit
dem Erwartungswert μ. Dann nennt man die Zahl
i
Beispiel: 100 Würfelexperimente. 2,5,4,3,6,6,1,5,4,2,3...
Insgesamt:
xi
=
∑n x
Streuung der Verteilung
x = ∑ x i hi
i
m
x ⎯⎯
⎯→ μ
n →∞
σ 2 = ∑ ( x i − μ )2 p( x i )
i
als Varianz von X, ihre Wurzel als (theoretische) Streuung (σ).
s ⎯⎯
⎯→ σ
n →∞
empirische
Streuung
→
theoretische
Streuung
(Standardabweichung)
27
28
Erwartungswert und Streuung der Gleichverteilung
xi = 1,2,…,n
p(xi) = 1/n
n
n
i =1
i =1
μ = ∑ x i p( x i ) = ∑ i
σ2 =
σ=
μ=3,5
zB: Würfel: n=6
Verteilungsdichtefunktion:
1 1 n
1 n ( n + 1) n + 1
= ∑i =
=
=μ
2
2
n n i =1
n
n2 − 1
12
⎛
⎝
σ 2 = ∑ ( x i − μ )2 p( x i ) = ∑ ⎜ i −
i
2
Ergänzungsmaterial
n2 − 1
1 n(n + 1)(2n + 1) 1 (n + 1) n + 1 n(n + 1)
+ n
−
= ... =
n
n
n
6
4
2
12
Streuung: σ =
2
=
Ergänzungsmaterial
+∞
1/(b-a)
29
f(x)
b
⎡ x2 1 ⎤
1
μ = ∫ xf ( x )dx = ∫ x
dx = ⎢
⎥ =
b−a
⎣ 2 b − a ⎦a
−∞
a
b
a
b
x
⎛ b 2 1 ⎞ ⎛ a 2 1 ⎞ b 2 − a 2 ( b − a )(b + a ) a + b
⎟⎟ =
⎟⎟ − ⎜⎜
=
=
= ⎜⎜
2(b − a )
2
⎝ 2 b − a ⎠ ⎝ 2 b − a ⎠ 2(b − a )
+∞
σ 2 = ∫ ( x − μ )2 f ( x )dx = ∫ (x 2 − 2μx + μ 2 )
b
−∞
a
1
dx =
b−a
1
2μ
μ2
2
1dx =
=
x dx −
xdx +
b − a ∫a
b − a ∫a
b − a ∫a
b
b
b
(b − a )2
1 ⎡ x3 ⎤
2μ ⎡ x 2 ⎤
μ2
b
[
]
...
−
+
x
=
=
a
⎢ ⎥
⎢ ⎥
12
b − a ⎣ 3 ⎦a b − a ⎣ 2 ⎦a b − a
b
=
a
a+b
Erwartungswert: μ =
2
(n + 1)2 − i (n + 1) ⎞⎟ = 1 i 2 + 1 (n + 1)2 − n + 1 i =
1 ⎛
= ∑ ⎜⎜ i 2 +
∑ 4
∑
⎟ n∑
n ⎝
n
n
4
⎠
b
31
b−a
12
f(x) statt p(x) !
1
b−a
Wahrscheinlichkeit
entspricht der Fläche
σ=1,71...
n + 1⎞ 1
=
⎟
2 ⎠ n
f(x)
⎧ 1 , für a ≤ x ≤ b
⎪ b−a
f (x) = ⎨
⎪
sonst
⎩ 0,
n2 − 1
12
σ2=35/12=2,92..
Kontinuierliche Gleichverteilung
b
p(α≤x≤β)
f(x)
= 0.289 b − a
x
1
b−a
a
α β
b
x
30
Herunterladen