Grundbegriffe Zufallsexperiment Wahrscheinlichkeitsrechnung – Vorgang nach einer bestimmten Vorschrift ausgeführt – (im Prinzip) beliebig oft wiederholbar – sein Ergebnis ist zufallsabhängig – bei mehrmaligen Durchführung des Experiments beeinflussen die Ergebnisse einander nicht Beispiele: IAi ? IAi IA i Würfelspiel KAD 2011.09.29 Elementarereignisse Roulett ? IAi Blutgruppenversuch Fahrtversuch 2 Ereignis die einzelnen, nicht mehr zerlegbaren und sich gegenseitig ausschliessenden Ausgänge oder Ergebnisse eines Zufallsexperimentes jede beliebige Teilmenge des Ergebnisraumes zB. Augenzahl des Würfels >3: {4, 5, 6} Ereignismenge, Ereignisraum (Ω ) Reihe aller möglichen Elementarereignisse. Z.B: beim Würfelspiel: Ω = {1, 2, 3, 4, 5, 6 } Augenzahl des Würfels ist gerade: {2, 4, 6} beim Münzenexperiment: Ω = {Zahl, Kopf} beim „Blutgruppenversuch”: Ω = {IA IA , IA i, iIA, ii} beim „Fahrtversuch“: {kein Unfall, Unfall} Blutgruppe A: {IA IA , IA i, iIA } 3 4 Definition der Wahrscheinlichkeit Operationen mit Ereignissen Man kann mit Ereignissen rechnen wie mit Mengen. Bernoulli (1654-1705), Laplace (1749-1827) (klassische Wahrscheinlichkeit) B A Vereinigung Menge aller Elementarereignisse, die zu A oder B gehören A∪B Durchschnitt Menge aller Elementarereignisse, die zu A und B gehören A∩B Komplementbildung Menge aller Elementarereignisse des Ereignisraumes, die nicht in Ereignis A enthalten sind (Gegenereignis von A) p(E ) = g m p(E ) = Anzahl der für E günstigen Elementare reignisse Anzahl aller gleichmögl ichen Elementare reignisse A 5 Beispiele Würfelexperiment: p(6) = Bei einem Zufallsexperiment, was endlich viele Ausgänge hat, die (zB. wegen Symmetriegründen) gleichwahrscheinlich sind, die Wahrscheinlichkeit eines Ereignisses (E) ist: p=probability, Probabilität 6 p(E ) = Beispiele Blutgruppenversuch 1 6 1 p(I I ) = 4 {IA IA} IAi A A p(gerade Zahl ) = 3 6 {IA IA , IA i, iIA, ii} p(Blutgruppe = A) = 3 4 Münzenexperiment: p(Kopf ) = g m p(Blutgruppe = 0) = 1 2 7 1 4 ? IAi Ω={IA IA , IA i, iIA, ii} {IA IA , IA i, iIA} {IA IA , IA i, iIA, ii} {ii} {IA IA , IA i, iIA, ii} 8 1 g „Fahrtversuch” ? keine Symmetrie ! p(E ) = m ≠ 2 Beispiel Statistische Wahrscheinlichkeit Ereignis A Zufallsexperiment Ereignis B Tritt bei n-maliger Durchführung eines Zufallsexperimentes ein bestimmtes Ereignis A k-mal auf, so bezeichnet man die in langen Versuchsreihen zu beobachtende relative Häufigkeit als Wahrscheinlichkeit, p(A) : p( A) = k n 9 10 Beispiele Buffon (1707-1788): 2048 p( A) = = 0.5069 4040 Pearson (1857-1936): p( A) = 6019 = 0.5016 12000 p( A) = 12012 = 0.5005 24000 Eigenschaften der Wahrscheinlichkeit 0 ≤ p( A) ≤ 1 p(sicheres Ereignis) = 1 Häufigkeit der Krankheiten: “Die Todesursachengruppe der bösartigen Neubildungen war in 2006 für 25,6% der Todesfälle verantwortlich” (http://www.statistik.at ) p(bösart. Neub.als Todesursache)= 19 056/74 295=25,6% die Wahrscheinlichkeit, dass ein Neugeborener das n-te Lebensjahr erlebt Österreich, 2006 Jahr 30 40 50 60 70 p(unmögliches Ereignis) = 0 zB: p(Augenzahl des Würfels <10) = 1 p(Augenzahl des Würfels =10) = 0 80 90 M 0.986 0.977 0.955 0.893 0.766 0.513 0.152 W 0.994 0.990 0.978 0.947 0.879 0.703 0.290 11 im unseren Blutgruppenversuch: p(Blutgruppe = B) = 0 12 Unabhängige Ereignisse Additionsregel Wenn die Ereignisse einander nicht beeinflussen: p(A und B)=p(A) p(B) für Ereignisse A und B p(A oder B) = p(A)+p(B) ist gültig nur wenn A und B nicht gleichzeitig auftreten können (disjunkte Ereignisse) zB: Würfel: Münze: zB: Würfelexperiment mit zwei Würfeln p(beide=6)=p(erste=6)·p(zweite=6)=1/36 p(5 oder 6)=1/6+1/6=1/3 p(gerade oder >3)=4/6=2/3≠ 1/2+1/2=1 p(Kopf oder Zahl)=1/2+1/2=1 Die Wahrscheinlichkeit, dass der Mann eines Ehepaares das 80. und die Frau das 70. Lebensjahr erreichen : p(M80 und W70) = p(M80)·p(W70) = 0.513·0.879 = 0.451 = 45.1% 13 Bedingte Wahrscheinlichkeit, p(A|B) 30 40 50 60 70 80 90 M Jahr 0.986 0.977 0.955 0.893 0.766 0.513 0.152 W 0.994 0.990 0.978 0.947 0.879 0.703 0.290 14 p( A|B ) = Bedingte Wahrscheinlichkeit Die Wahrscheinlichkeit, dass A zutrifft unter der Voraussetzung, dass B eingetreten ist. Oder: p(A gegeben B), p von A vorausgesetzt B p( A|B ) = Die Wahrscheinlichkeit, dass ein Neugeborener das n-te Lebensjahr erlebt p( A und B ) p(B ) Die Wahrscheinlichkeit, dass A zutrifft unter der Voraussetzung, dass B eingetreten ist. 2 p( > 3 und gerade ) 6 2 zB: bei Würfelexperiment: p(>3|gerade) = = = 3 3 p(gerade) 6 p( A und B ) p(B ) <3 >3 <3 >3 <3 >3 zB: beim Würfelexperiment: p(>3|gerade)= Vgl. p(>3) = 1 2 2 p( > 3 und gerade) 6 2 = = 3 3 p(gerade) 6 p>3 15 3 1 = 6 2 p(gerade) 3 1 = 6 2 p>3 und gerade 2 6 p(>3|gerade) 2 4 = 3 6 16 Beispiele Wie groß ist die Wahrscheinlichkeit, dass ein 50 jähriger Mann das 80. Lebensjahr erreicht? Die Wahrscheinlichkeit, dass ein Neugeborener das n-te Lebensjahr erlebt Jahr 30 40 50 60 70 80 0.986 0.977 0.955 0.893 0.766 0.513 0.152 W 0.994 0.990 0.978 0.947 0.879 0.703 0.290 K+ K- R+ a b R- c d Erkrankungswahrscheinlichkeit einer Risikogruppe relativ zur Erkrankungswahrscheinlichkeit einer nicht Risikogruppe. a=21054 b=271269 a+b c=14442 d=3804294 c+d Teilsumme a+c b+d • zB: Relatives Risiko der Säuglingsmortalität mit Risikofaktor von Geburtsgewicht: Charakterisierungsmöglichkeiten des Eintretens von Ereignissen Ereignis A Wahrscheinlichkeit p(A) odds unmögliches Ereignis 0 0 Ereignis A und Gegenereignis von A 0.5 haben die gleichen Chancen 1 sicheres Ereignis ∞ 1 Ereignis A und Gegenereignis von A haben die gleiche Chance 0 1 +∞ p(Säuglingsmortalität | kleines Geburtsgewicht) Wahrscheinlichkeit p(Säuglingsmortalität | normales Geburtsgewicht) 0.0720 = 19.04 0.0037 a+b+c+d c p(K + und R− ) a + b + c + d 14442 c = p(K + R− ) = = = = = 0.0037 c +d p(R− ) c + d 14442 + 3804294 a+b+c +d 18 -∞ RR = Teilsumme p(Säuglingsmortalität | normales Geburtsgewicht)= 17 RR= Krankheit nein a p(K + und R+ ) a + b + c + d 21054 a = p(K + R+ ) = = = = = 0.0720 a b + p(R+ ) a + b 21054 + 271269 a+b+c +d Wie groß ist die Wahrscheinlichkeit, dass ein 70 jähriger Mann das 80. Lebensjahr erreicht? p(M80|M70) = 0.513 / 0.766 = 0.670 a RR = = a+b c p(K + R− ) c +d Risikofaktor nein Krankheit ja p(Säuglingsmortalität | kleines Geburtsgewicht) = Wie groß ist die Wahrscheinlichkeit, dass ein 60 jähriger Mann das 80. Lebensjahr erreicht? p(M80|M60) = 0.513 / 0.893 = 0.574 p(K + R+ ) Säuglingsmortalität Risikofaktor ja Anzahl von Neugeborenen p(M80|M50) = 0.513 / 0.955 = 0.537 Das relative Risiko p(Krankheit | Risikofaktor) Risikofaktor: kleines Geburtsgewicht „Krankheit“: Säuglingsmortalität 90 M Beispiel (Daten: USA 1991) odds = -∞ 19 p 1− p p= 0 1 +∞ odds 1 + odds Odds (Chance)20 Ergänzungsmaterial Das Chancenverhältnis (Odds ratio) p(K +|R+ ) p(K − | R + ) OR = = p(K + | R− ) p(K − | R− ) a a+b b a+b c c+d d c+d a ⎛ a ⎜ = b =⎜ c c ⎜ b ⎜ d ⎝ d ⎞ ⎟ ad ⎟= ⎟ bc ⎟ ⎠ K+ K- R+ a b R- c d Verteilungen Population Wahrscheinlichkeitsverteilung ?, ?, ... Stichprobe ⎛ Min ⎞ ⎜ ⎟ ⎝ 5 ⎠ Häufigkeitsdichte • zB: Chancenverhältnis der Säuglingsmortalität mit Risikofaktor von Geburtsgewicht: 0.0720 0.0720 OR = 1 − 0.0720 = 0.9280 = 20.4 0.00378 0.0037 1 − 0.00378 0.99622 Δn Δx x , s , ... Pulszahl 21 Verteilungen ⎛ 1 ⎞ ⎜ ⎟22 ⎝ Min ⎠ Klassifizierung der Verteilungen Wie kann man die theoretische Verteilung bestimmen? Vermutung Modellannahme (nach dem Histogram) Laplace-Prinzip: wenn nichts dagegen spricht, gehen wir davon aus, dass alle Elementarereignisse gleich wahrscheinlich sind Gleichverteilung? Laplace-Experiment: es meint ein Zufalls-Experiment bei dem davon ausgegangen wird, dass jeder Versuchsausgang gleichwahrscheinlich ist Gleichverteilung 23 • • • • • diskrete Verteilungen diskrete Gleichverteilung Binomialverteilung Poisson Verteilung ... • • • • • • kontinuierliche Verteilungen kontinuierliche Gleichverteilung Normalverteilung Chi-Quadrat Verteilung t-Verteilung ... diskrete Zufallsgröße kontinuierliche Zufallsgröße zB: Anzahl der Kranken, Augenzahl des Würfels zB: Blutdruck, Körperhöhe,... 24 Diskrete Gleichverteilung Lageparameter der Verteilung Beispiel: Es sei X eine diskrete Zufallsgröße mit Werten x1,x2… dann heisst Wertebereich 1 2 3 4 5 6 Wahrscheinlichkeit 1 6 1 6 1 6 1 6 1 6 1 6 p(k) weitere Beispiele: 1/6 Münzenversuch 1 2 p( k ) = 3 1 , 6 4 5 k 6 μ = ∑ x i p( x i ) Der Erwartungswert gibt denjenigen Wert an, den man als Mittelwert (durchschnittlichen Wert) über viele Versuchswiederholungen “erwarten” kann. Dabei ist es durchaus möglich, dass der Erwartungswert bei keinem einzigen Versuch realisiert wird oder sogar überhaupt nicht vorkommen kann. Würfelexperiment mit einem Ikosaeder k = 1, 2, ..., 6 26 25 Erwartungswert und Durchschnittswert Nützliche Formel des arithmetischen Mittelwertes μ = ∑ x i p( x i ) Berechnung aus Einzelbeobachtungen (ungewogenes) arithmetisches Mittel x1 + x 2 + K + x n = n ∑x i =1 n Berechnung aus gruppierten Daten (Merkmalausprägungen) m n x + n2 x 2 + K + nm x m x= 1 1 = n1 + n2 + K + nm ∑n x i =1 m i ∑n i =1 m i = ∑n x i i =1 n i m m i =1 i =1 = ∑ hi x i = ∑ x i hi i ni: absolute Häufigkeit, hi: relative Häufigkeit i Beispiel: 100 Würfelexperimente. 2,5,4,3,6,6,1,5,4,2,3... Insgesamt: i gewogenes arithmetisches Mittel x = ∑ x i hi i n x= Erwartungswert von X. i xi ni hi 1 15 15/100 2 20 20/100 3 14 14/100 4 16 16/100 5 18 18/100 6 17 17/100 x= = 15 20 14 16 18 17 ⋅1+ ⋅2+ ⋅3 + ⋅4+ ⋅5 + ⋅ 6 = 3.53 = 100 100 100 100 100 100 = h(1) ⋅ 1 + h(2) ⋅ 2 + h(3) ⋅ 3 + h( 4) ⋅ 4 + h(5) ⋅ 5 + h(6) ⋅ 6 → ⎯⎯ ⎯⎯→ P (1) ⋅ 1 + P (2) ⋅ 2 + P (3) ⋅ 3 + P ( 4) ⋅ 4 + P (5) ⋅ 5 + P (6) ⋅ 6 = μ n→∞ xi: Augenzahl ni: absolute Häufigkeit 27 15 ⋅ 1 + 20 ⋅ 2 + 14 ⋅ 3 + 16 ⋅ 4 + 18 ⋅ 5 + 17 ⋅ 6 = 100 hi: relative Häufigkeit x ⎯⎯ ⎯→ μ n →∞ 28 Erwartungswert und Streuung der Gleichverteilung Streuung der Verteilung xi = 1,2,…,n Es sei X eine diskrete Zufallsgröße mit Werten x1,x2,... und mit dem Erwartungswert μ. Dann nennt man die Zahl n n i =1 i =1 μ = ∑ x i p( x i ) = ∑ i σ 2 = ∑ ( x i − μ )2 p( x i ) σ2 = i als Varianz von X, ihre Wurzel als (theoretische) Streuung (σ). s ⎯⎯ ⎯→ σ n →∞ p(xi) = 1/n 1 1 n 1 n ( n + 1) n + 1 = ∑i = = =μ 2 2 n n i =1 n n2 − 1 12 σ= μ=3,5 zB: Würfel: n=6 empirische Streuung → σ2=35/12=2,92.. ⎛ ⎝ σ 2 = ∑ ( x i − μ )2 p( x i ) = ∑ ⎜ i − i theoretische Streuung = (Standardabweichung) n2 − 1 12 2 n + 1⎞ 1 = ⎟ 2 ⎠ n 2 2 ⎞ 1 1 ⎛⎜ 2 (n + 1) 1 (n + 1) n + 1 2 ⎟ i i n = i + ( 1 ) + − + ∑ ∑ 4 − n ∑i = ⎟ n∑ n ⎜⎝ n 4 ⎠ n2 − 1 1 n(n + 1)(2n + 1) 1 (n + 1) n + 1 n(n + 1) + n − = ... = n n n 6 4 2 12 Ergänzungsmaterial 1/(b-a) Kontinuierliche Gleichverteilung Verteilungsdichtefunktion: f(x) ⎧ 1 , für a ≤ x ≤ b ⎪ b−a f (x) = ⎨ ⎪ sonst ⎩ 0, b−a 12 f(x) statt p(x) ! +∞ a b x p(α≤x≤β) f(x) b +∞ σ 2 = ∫ ( x − μ )2 f ( x )dx = ∫ (x 2 − 2μx + μ 2 ) b −∞ a a b x 1 dx = b−a 1 2μ μ2 2 1dx = = x dx − xdx + b − a ∫a b − a ∫a b − a ∫a b 1 b−a b a α β b x 31 = b (b − a )2 1 ⎡ x3 ⎤ 2μ ⎡ x 2 ⎤ μ2 b [ ] ... − + x = = a ⎢ ⎥ ⎢ ⎥ 12 b − a ⎣ 3 ⎦a b − a ⎣ 2 ⎦a b − a b = 0.289 b − a f(x) ⎡ x2 1 ⎤ 1 μ = ∫ xf ( x )dx = ∫ x dx = ⎢ ⎥ = b−a ⎣ 2 b − a ⎦a −∞ a b 30 ⎛ b 2 1 ⎞ ⎛ a 2 1 ⎞ b 2 − a 2 ( b − a )(b + a ) a + b ⎟⎟ = ⎟⎟ − ⎜⎜ = = = ⎜⎜ 2(b − a ) 2 ⎝ 2 b − a ⎠ ⎝ 2 b − a ⎠ 2(b − a ) 1 b−a Wahrscheinlichkeit entspricht der Fläche Streuung: σ = Ergänzungsmaterial 2 = 29 a+b Erwartungswert: μ = 2 σ=1,71... b 32