Grundbegriffe Zufallsexperiment Wahrscheinlichkeitsrechnung – Vorgang nach einer bestimmten Vorschrift ausgeführt – (im Prinzip) beliebig oft wiederholbar – sein Ergebnis ist zufallsabhängig – bei mehrmaligen Durchführung des Experiments beeinflussen die Ergebnisse einander nicht Beispiele: IAi ? IAi IA i Würfelspiel KAD 2012.09.27 Elementarereignisse Roulett ? IAi Blutgruppenversuch Fahrtversuch 2 Ereignis die einzelnen, nicht mehr zerlegbaren und sich gegenseitig ausschliessenden Ausgänge oder Ergebnisse eines Zufallsexperimentes jede beliebige Teilmenge des Ergebnisraumes zB. Augenzahl des Würfels >3: {4, 5, 6} Ereignismenge, Ereignisraum (Ω ) Reihe aller möglichen Elementarereignisse. Z.B: beim Würfelspiel: Ω = {1, 2, 3, 4, 5, 6 } Augenzahl des Würfels ist gerade: {2, 4, 6} beim Münzenexperiment: Ω = {Zahl, Kopf} beim „Blutgruppenversuch”: Ω = {IA IA , IA i, iIA, ii} beim „Fahrtversuch“: {kein Unfall, Unfall} Blutgruppe A: {IA IA , IA i, iIA } 3 4 Definition der Wahrscheinlichkeit Operationen mit Ereignissen Man kann mit Ereignissen rechnen wie mit Mengen. Bernoulli (1654-1705), Laplace (1749-1827) (klassische Wahrscheinlichkeit) B A Vereinigung Menge aller Elementarereignisse, die zu A oder B gehören A∪B Durchschnitt Menge aller Elementarereignisse, die zu A und B gehören A∩B Komplementbildung Menge aller Elementarereignisse des Ereignisraumes, die nicht in Ereignis A enthalten sind (Gegenereignis von A) p(E ) = g m p(E ) = Anzahl der für E günstigen Elementare reignisse Anzahl aller gleichmögl ichen Elementare reignisse A 5 Beispiele Würfelexperiment: p(6) = Bei einem Zufallsexperiment, was endlich viele Ausgänge hat, die (zB. wegen Symmetriegründen) gleichwahrscheinlich sind, die Wahrscheinlichkeit eines Ereignisses (E) ist: p=probability, Probabilität 6 p(E ) = Beispiele Blutgruppenversuch 1 6 1 p(I I ) = 4 {IA IA} IAi A A p(gerade Zahl ) = 3 6 {IA IA , IA i, iIA, ii} p(Blutgruppe = A) = 3 4 Münzenexperiment: p(Kopf ) = g m p(Blutgruppe = 0) = 1 2 7 1 4 ? IAi Ω={IA IA , IA i, iIA, ii} {IA IA , IA i, iIA} {IA IA , IA i, iIA, ii} {ii} {IA IA , IA i, iIA, ii} 8 1 g „Fahrtversuch” ? keine Symmetrie ! p(E ) = m ≠ 2 Beispiel Statistische Wahrscheinlichkeit Ereignis A Zufallsexperiment Ereignis B Tritt bei n-maliger Durchführung eines Zufallsexperimentes ein bestimmtes Ereignis A k-mal auf, so bezeichnet man die in langen Versuchsreihen zu beobachtende relative Häufigkeit als Wahrscheinlichkeit, p(A) : p( A) = k n 9 10 Beispiele Buffon (1707-1788): 2048 p( A) = = 0.5069 4040 Pearson (1857-1936): p( A) = 6019 = 0.5016 12000 p( A) = 12012 = 0.5005 24000 Eigenschaften der Wahrscheinlichkeit 0 ≤ p( A) ≤ 1 p(sicheres Ereignis) = 1 Häufigkeit der Krankheiten: “Die Todesursachengruppe der bösartigen Neubildungen war in 2006 für 25,6% der Todesfälle verantwortlich” (http://www.statistik.at ) p(bösart. Neub.als Todesursache)= 19 056/74 295=25,6% die Wahrscheinlichkeit, dass ein Neugeborener das n-te Lebensjahr erlebt Österreich, 2006 Jahr 30 40 50 60 70 p(unmögliches Ereignis) = 0 zB: p(Augenzahl des Würfels <10) = 1 p(Augenzahl des Würfels =10) = 0 80 90 M 0.986 0.977 0.955 0.893 0.766 0.513 0.152 W 0.994 0.990 0.978 0.947 0.879 0.703 0.290 11 im unseren Blutgruppenversuch: p(Blutgruppe = B) = 0 12 Additionsregel zB: Würfel: p(A oder B) = p(A)+p(B)-p(A und B) Unabhängige Ereignisse Wenn die Ereignisse einander nicht beeinflussen: p(A und B)=p(A) p(B) p(gerade oder >3)=4/6 p(gerade) + p(>3) - p(gerade und >3) 3/6 + 3/6 2/6 =4/6 zB: Würfelexperiment mit zwei Würfeln p(beide=6)=p(erste=6)·p(zweite=6)=1/36 für Ereignisse A und B p(A oder B) = p(A)+p(B) ist gültig nur wenn A und B nicht gleichzeitig auftreten können (disjunkte Ereignisse, p(A und B)=0) zB: Würfel: Münze: p(5 oder 6)=1/6+1/6=1/3 p(Kopf oder Zahl)=1/2+1/2=1 Bedingte Wahrscheinlichkeit 13 p( A|B ) = Die Wahrscheinlichkeit, dass A zutrifft unter der Voraussetzung, dass B eingetreten ist*. p( A und B ) p(B ) 2 p( > 3 und gerade ) 6 2 = = zB: bei Würfelexperiment: p(>3|gerade) = 3 3 p(gerade) ungerade gerade 6 Die Wahrscheinlichkeit, dass der Mann eines Ehepaares das 80. und die Frau das 70. Lebensjahr erreichen : p(M80 und W70) = p(M80)·p(W70) = 0.513·0.879 = 0.451 = 45.1% Die Wahrscheinlichkeit, dass ein Neugeborener das n-te Lebensjahr erlebt 30 40 50 60 70 80 90 M Jahr 0.986 0.977 0.955 0.893 0.766 0.513 0.152 W 0.994 0.990 0.978 0.947 0.879 0.703 0.290 14 Wie groß ist die Wahrscheinlichkeit, dass ein 50 jähriger Mann das 80. Lebensjahr erreicht? Die Wahrscheinlichkeit, dass ein Neugeborener das n-te Lebensjahr erlebt Jahr 30 40 50 60 70 Beispiele 80 90 M 0.986 0.977 0.955 0.893 0.766 0.513 0.152 W 0.994 0.990 0.978 0.947 0.879 0.703 0.290 p(M80|M50) = 0.513 / 0.955 = 0.537 Wie groß ist die Wahrscheinlichkeit, dass ein 60 jähriger Mann das 80. Lebensjahr erreicht? p(M80|M60) = 0.513 / 0.893 = 0.574 <=3 >3 p( > 3) = 3 1 = 6 2 p(gerade ) = 3 1 = 6 2 p( > 3 und gerade ) = *oder: p(A gegeben B), p von A vorausgesetzt B 2 6 p( > 3 | gerade ) = 2 4 = 3 6 Wie groß ist die Wahrscheinlichkeit, dass ein 70 jähriger Mann das 80. Lebensjahr erreicht? p(M80|M70) = 0.513 / 0.766 = 0.670 16 Beispiel (Daten: USA 1991) p(Krankheit | Risikofaktor) Risikofaktor ja Anzahl von Neugeborenen Das relative Risiko Säuglingsmortalität Risikofaktor: kleines Geburtsgewicht „Krankheit“: Säuglingsmortalität Risikofaktor nein Krankheit ja Krankheit nein Teilsumme a=21054 b=271269 a+b c=14442 d=3804294 c+d Teilsumme a+c b+d a+b+c+d a p(K + und R+ ) a + b + c + d 21054 a = p(K + R+ ) = = = = = 0.0720 + a b p(R+ ) a + b 21054 + 271269 a+b+c +d a a RR = = +b c p(K + R− ) c +d RR= p(Säuglingsmortalität | normales Geburtsgewicht)= c p(K + und R− ) a + b + c + d 14442 c = p(K + R− ) = = = = = 0.0037 c +d p(R− ) c + d 14442 + 3804294 a+b+c +d 17 K- R+ a b R- c d Erkrankungswahrscheinlichkeit einer Risikogruppe relativ zur Erkrankungswahrscheinlichkeit einer nicht Risikogruppe. p(K + R+ ) p(Säuglingsmortalität | kleines Geburtsgewicht) = K+ RR = • zB: Relatives Risiko der Säuglingsmortalität mit Risikofaktor von Geburtsgewicht: p(Säuglingsmortalität | kleines Geburtsgewicht) p(Säuglingsmortalität | normales Geburtsgewicht) 0.0720 = 19.04 0.0037 18 Ergänzungsmaterial Charakterisierungsmöglichkeiten des Eintretens von Ereignissen Das Chancenverhältnis (Odds ratio) Ereignis A Wahrscheinlichkeit p(A) odds unmögliches Ereignis 0 0 Ereignis A und Gegenereignis von A 0.5 haben die gleichen Chancen 1 sicheres Ereignis ∞ 1 Ereignis A und Gegenereignis von A haben die gleiche Chance -∞ 0 1 +∞ Wahrscheinlichkeit odds = -∞ p 1− p p= 0 1 +∞ odds 1 + odds Odds (Chance)19 p(K +|R+ ) p(K − | R + ) OR = = p(K + | R− ) p(K − | R− ) a a+b b a+b c c+d d c+d a ⎛ a ⎜ = b =⎜ c c ⎜ b ⎜ d ⎝ d ⎞ ⎟ ad ⎟= ⎟ bc ⎟ ⎠ K+ K- R+ a b R- c d • zB: Chancenverhältnis der Säuglingsmortalität mit Risikofaktor von Geburtsgewicht: 0.0720 0.0720 OR = 1 − 0.0720 = 0.9280 = 20.4 0.00378 0.0037 1 − 0.00378 0.99622 20 Verteilungen Verteilungen Population Wahrscheinlichkeitsverteilung Wie kann man die theoretische Verteilung bestimmen? Vermutung ?, ?, ... Δn Δx (nach dem Histogram) Laplace-Prinzip: wenn nichts dagegen spricht, gehen wir davon aus, dass alle Elementarereignisse gleich wahrscheinlich sind ⎛ Min ⎞ ⎜ ⎟ ⎝ 5 ⎠ Häufigkeitsdichte Stichprobe Modellannahme x , s , ... Gleichverteilung? Pulszahl ⎛ 1 ⎞ ⎜ ⎟21 ⎝ Min ⎠ Gleichverteilung Klassifizierung der Verteilungen • • • • • diskrete Verteilungen diskrete Gleichverteilung Binomialverteilung Poisson Verteilung ... diskrete Zufallsgröße zB: Anzahl der Kranken, Augenzahl des Würfels • • • • • • Laplace-Experiment: es meint ein Zufalls-Experiment bei dem davon ausgegangen wird, dass jeder Versuchsausgang gleichwahrscheinlich ist 22 Diskrete Gleichverteilung Beispiel: kontinuierliche Verteilungen kontinuierliche Gleichverteilung Normalverteilung Chi-Quadrat Verteilung t-Verteilung ... kontinuierliche Zufallsgröße Wertebereich 1 2 3 4 5 6 Wahrscheinlichkeit 1 6 1 6 1 6 1 6 1 6 1 6 p(k) weitere Beispiele: 1/6 Münzenversuch 1 zB: Blutdruck, Körperhöhe,... 2 p( k ) = 23 3 1 , 6 4 5 6 k = 1, 2, ..., 6 k Würfelexperiment mit einem Ikosaeder 24 Nützliche Formel des arithmetischen Mittelwertes Lageparameter der Verteilung Es sei X eine diskrete Zufallsgröße mit Werten x1,x2… dann heisst μ = ∑ x i p( x i ) Berechnung aus Einzelbeobachtungen (ungewogenes) arithmetisches Mittel n x + x2 + K + xn x= 1 = n Erwartungswert von X. i ∑x i =1 i n Berechnung aus gruppierten Daten (Merkmalausprägungen) gewogenes arithmetisches Mittel Der Erwartungswert gibt denjenigen Wert an, den man als Mittelwert (durchschnittlichen Wert) über viele Versuchswiederholungen “erwarten” kann. Dabei ist es durchaus möglich, dass der Erwartungswert bei keinem einzigen Versuch realisiert wird oder sogar überhaupt nicht vorkommen kann. m n x + n2 x 2 + K + nm x m x= 1 1 = n1 + n2 + K + nm ∑ ni x i i =1 m ∑n i =1 25 Erwartungswert und Durchschnittswert μ = ∑ x i p( x i ) ni hi 1 15 15/100 2 20 20/100 3 14 14/100 4 16 16/100 5 18 18/100 6 17 17/100 x= = 15 ⋅ 1 + 20 ⋅ 2 + 14 ⋅ 3 + 16 ⋅ 4 + 18 ⋅ 5 + 17 ⋅ 6 = 100 14 16 18 17 15 20 ⋅1+ ⋅2+ ⋅3 + ⋅4+ ⋅5 + ⋅ 6 = 3.53 = 100 100 100 100 100 100 = h(1) ⋅ 1 + h(2) ⋅ 2 + h(3) ⋅ 3 + h( 4) ⋅ 4 + h(5) ⋅ 5 + h(6) ⋅ 6 → ⎯⎯ ⎯⎯→ P (1) ⋅ 1 + P (2) ⋅ 2 + P (3) ⋅ 3 + P ( 4) ⋅ 4 + P (5) ⋅ 5 + P (6) ⋅ 6 = μ n→∞ xi: Augenzahl ni: absolute Häufigkeit hi: relative Häufigkeit i i =1 i n m m i =1 i =1 = ∑ hi x i = ∑ x i hi i ni: absolute Häufigkeit, hi: relative Häufigkeit 26 Es sei X eine diskrete Zufallsgröße mit Werten x1,x2,... und mit dem Erwartungswert μ. Dann nennt man die Zahl i Beispiel: 100 Würfelexperimente. 2,5,4,3,6,6,1,5,4,2,3... Insgesamt: xi = ∑n x Streuung der Verteilung x = ∑ x i hi i m x ⎯⎯ ⎯→ μ n →∞ σ 2 = ∑ ( x i − μ )2 p( x i ) i als Varianz von X, ihre Wurzel als (theoretische) Streuung (σ). s ⎯⎯ ⎯→ σ n →∞ empirische Streuung → theoretische Streuung (Standardabweichung) 27 28 Erwartungswert und Streuung der Gleichverteilung xi = 1,2,…,n p(xi) = 1/n n n i =1 i =1 μ = ∑ x i p( x i ) = ∑ i σ2 = σ= μ=3,5 zB: Würfel: n=6 Verteilungsdichtefunktion: 1 1 n 1 n ( n + 1) n + 1 = ∑i = = =μ 2 2 n n i =1 n n2 − 1 12 ⎛ ⎝ σ 2 = ∑ ( x i − μ )2 p( x i ) = ∑ ⎜ i − i 2 Ergänzungsmaterial n2 − 1 1 n(n + 1)(2n + 1) 1 (n + 1) n + 1 n(n + 1) + n − = ... = n n n 6 4 2 12 Streuung: σ = 2 = Ergänzungsmaterial +∞ 1/(b-a) 29 f(x) b ⎡ x2 1 ⎤ 1 μ = ∫ xf ( x )dx = ∫ x dx = ⎢ ⎥ = b−a ⎣ 2 b − a ⎦a −∞ a b a b x ⎛ b 2 1 ⎞ ⎛ a 2 1 ⎞ b 2 − a 2 ( b − a )(b + a ) a + b ⎟⎟ = ⎟⎟ − ⎜⎜ = = = ⎜⎜ 2(b − a ) 2 ⎝ 2 b − a ⎠ ⎝ 2 b − a ⎠ 2(b − a ) +∞ σ 2 = ∫ ( x − μ )2 f ( x )dx = ∫ (x 2 − 2μx + μ 2 ) b −∞ a 1 dx = b−a 1 2μ μ2 2 1dx = = x dx − xdx + b − a ∫a b − a ∫a b − a ∫a b b b (b − a )2 1 ⎡ x3 ⎤ 2μ ⎡ x 2 ⎤ μ2 b [ ] ... − + x = = a ⎢ ⎥ ⎢ ⎥ 12 b − a ⎣ 3 ⎦a b − a ⎣ 2 ⎦a b − a b = a a+b Erwartungswert: μ = 2 (n + 1)2 − i (n + 1) ⎞⎟ = 1 i 2 + 1 (n + 1)2 − n + 1 i = 1 ⎛ = ∑ ⎜⎜ i 2 + ∑ 4 ∑ ⎟ n∑ n ⎝ n n 4 ⎠ b 31 b−a 12 f(x) statt p(x) ! 1 b−a Wahrscheinlichkeit entspricht der Fläche σ=1,71... n + 1⎞ 1 = ⎟ 2 ⎠ n f(x) ⎧ 1 , für a ≤ x ≤ b ⎪ b−a f (x) = ⎨ ⎪ sonst ⎩ 0, n2 − 1 12 σ2=35/12=2,92.. Kontinuierliche Gleichverteilung b p(α≤x≤β) f(x) = 0.289 b − a x 1 b−a a α β b x 30