Wahrscheinlichkeitsrechnung und Statistik (Stochastik) D1 Kann man (wenigstens prinzipiell) einen Versuch beliebig oft in der gleichen Weise wiederholen und gibt es f€r den Ausgang des Versuchs wenigstens zwei (prinzipiell) m•gliche F‚lle, so heiƒt ein solcher Versuch Zufallsversuch oder Zufallsexperiment. Die m•glichen Versuchsergebnisse k•nnen, als Menge zusammengefasst, angegeben bzw. festgelegt werden. D2 Die Menge S aller m•glichen Versuchsergebnisse eines Zufallsversuchs heiƒen auch Ergebnisraum oder Stichprobenraum. D3 Ein Zufallsversuch werde n mal durchgef€hrt, a sei ein m•gliches Versuchsergebnis. Dann bezeichnet man a) die Anzahl der Versuchsdurchf€hrungen mit dem Versuchsergebnis a als absolute HÄufigkeit Hn(a) des Ergebnisses a; b) den Quotienten D4 H n (a) als relative HÄufigkeit hn(a) des Ergebnisses a. n (a) Ein Zufallsversuch heiƒt Laplace-Experiment, wenn f€r alle m•glichen Versuchsergebnisse die Wahrscheinlichkeit gleich groƒ ist. (b) Eine M€nze heiƒt Laplace-MÄnze (kurz: L-M€nze), wenn die beiden m•glichen Versuchsergebnisse die Wahrscheinlichkeit 1 2 haben. (c) Ein W€rfel heiƒt Laplace-WÄrfel (kurz: L-W€rfel), wenn jedes der sechs m•glichen Versuchsergebnisse die Wahrscheinlichkeit 1 6 hat. D5 R1 (a) Jede Teilmenge E des Stichprobenraums S heiƒt Ereignis. (b) Hat E nur ein Element, so heiƒt E Elementarereignis. Sprechweise in der Mengenlehre Grundmenge Formale Schreibweise S Sprechweise in der Wahrscheinlichkeitsrechnung sicheres Ereignis leere Menge unm•gliches Ereignis Komplementmenge von E E Gegenereignis von E („nicht E“) Schnittmenge von E und F EF UND-Ereignis von E und F („E und F“) Vereinigungsmenge von E und F EF ODER-Ereignis von E und F („E oder F“) E ist Teilmenge von F EF E zieht F nach sich E und F haben kein gemeinsames Element EF= E und F sind unvereinbar Regeln zur Berechnung von P(E) (1) F€r E = {a1, a2, …, an,} gilt die Summenregel: P(E) = P({a1}) + P({a2}) + … + P({an}) (2) P(S) = 1 (3) P(E) = 1 – P( E ) (4) P()= 0 (5) Bei einem Laplace-Experiment gilt P( E ) | E | Anz. der fÇr E gÇnstigen Ergebnisse |S| Anz. aller mÅgl. Ergebnisse -1- D6 (Axiomatischer Wahrscheinlichkeitsbegriff nach Kolmogorow, 1933) Eine Funktion P, die jedem Ereignis E (E S; S endlich) genau eine reelle Zahl P(E) („Wahrscheinlichkeit von E“) zuordnet, heiƒt Wahrscheinlichkeitsverteilung Äber S, wenn folgendes gilt: (K1) F€r alle A S gilt P(A) 0 (K2) P(S) = 1 (K3) F€r alle A, B S mit A B = gilt P(A B) = P(A) + P(B) R2 (1) – (5) vgl. S. - 1 Dar€ber hinaus gilt (6) A B P(A) ≤ P(B) (7) 0 ≤ P(A) ≤ 1 (8) P(A B) = P(A) + P(B) – P(A B) D7 B B B A A A S S S Denkt man sich n Versuche, die man nacheinander oder auch gleichzeitig durchf€hren kann, zu einem Versuch zusammengefasst, so nennt man diesen einen zusammengesetzten Versuch (oder auch n-stufigen Versuch). Den Ergebnis- bzw. Stichprobenraum veranschaulicht man in Baumdiagrammen. Grundlegendes ZÅhlprinzip Besteht ein zusammengesetzter Zufallsversuch aus n Stufen und betr‚gt die Anzahl der m•glichen Versuchsergebnisse auf den einzelnen Stufen z1, z2, …, zn, so hat der zusammengesetzte Zufallsversuch insgesamt z1 z2 … zn, m•gliche Versuchsergebnisse. D8 Wird bei einem mehrstufigen Versuch die Wahrscheinlichkeitsverteilung f€r einen Teilversuch nicht beeinflusst durch die Versuchsausg‚nge der vorangehenden Teilversuche, so heiƒt dieser Teilversuch unabhÅngig von den vorangehenden Teilversuchen. Anderenfalls heiƒt er abhÅngig. Insbesondere gilt fÇr n = 2 mit den Ereignissen A und B: (1) Dann heiƒt die Wahrscheinlichkeit f€r B unter der Bedingung, dass A bereits eingetreten ist, die durch A bedingte Wahrscheinlichkeit von B. Man schreibt PA(B). (2) Das Ereignis B ist vom Ereignis A unabhÅngig, falls im Baumdiagramm (s. u.) P(B) = P(AB) + P( A B) = PA(B) gilt. (3) Die Ereignisse sind unabhÅngig, wenn die H‚ufigkeiten in den Spalten oder Zeilen der Vierfeldertafel (s. u.) im gleichen festen Zahlenverh‚ltnis stehen. R3 Pfadregel Die Wahrscheinlichkeit f€r ein Elementarereignis bei einem mehrstufigen Versuch erh‚lt man, wenn man die Wahrscheinlichkeiten l‚ngs des zugeh•rigen Pfades im Baumdiagramm miteinander multipliziert. D9 A und B seien Ereignisse mit P(B) > 0. Dann heiƒt PB ( A) P( A B) die durch B bedingte WahrP( B) scheinlichkeit f€r A und ist im umgekehrten Baumdiagramm direkt ersichtlich. -2- A A gesamt B P( A B) B P ( A B) gesamt P ( A B) P ( A B) P (A) P (B) P (B) 1 P(A) P (A) PA (B) B P(A B) PA (B) B P(A B) PA (B) B P(A B) PA (B) B P(A B) A P(A) B A Venn-Diagramm (Vierfeldertafel) Baumdiagramm umgekehrtes Baumdiagramm: analog mit vertauschten Merkmalen (!) Satz von Bayes (Berechnung der umgekehrten bedingten Wahrscheinlichkeit, vgl. D 9) F€r die Ereignisse A und B sei 0<P(A)<1 und P(B)>0. Dann gilt PB ( A) P( A) PA ( B ) P( A) PA ( B ) P ( A) PA ( B ) D 10 Eine Funktion X, die jedem m•glichen Versuchsausgang a eines Zufallsversuchs eine Zahl X(a) zuordnet, heiƒt ZufallsgrÇÉe. Die Funktionswerte werden h‚ufig mit x1, x2, …, xk bezeichnet. Man sagt dann auch: die Zufallsgr•ƒe X kann die Werte x1, x2, …, xk annehmen. Die Wahrscheinlichkeiten der durch diese Zahlen beschriebenen Ereignisse werden mit pi bezeichnet; es ist pi=P(X=xi)=P({aS|X(a)=xi}). Besonders einfach zu untersuchen sind nun n-stufige Zufallsexperimente, bei denen alle Teilversuche unabh‚ngig sind und nur zwei Ergebnisse („Treffer“ – „Niete“; „T“ – „N“; „1“ – „0“) mit gleich bleibender Wahrscheinlichkeitsverteilung auftreten. Solche Versuche k•nnen immer durch eine n-fache Urnenziehung mit ZurÇcklegen (aus einer Urne!) simuliert werden. D 11 Besteht ein zusammengesetztes Zufallsexperiment aus n gleichwertigen Teilexperimenten mit dieser Wahrscheinlichkeitsverteilung (in jedem Teilexperiment), so nennt man es ein n-stufiges Bernoulli-Experiment oder auch eine Bernoulli-Kette der LÅnge n. R4 a 1 0 P({a}) p 1-p F€r Bernoulli-Ketten der L‚nge n, nIN, und der Trefferwahrscheinlichkeit p gilt: n P ( X k ) p k (1 p) n k . k Hierbei ist die Zufallsgr•ƒe X die Trefferanzahl k mit k ≤ n. D 12 Diese Zufallsgr•ƒe X heiƒt binomialverteilte ZufallsgrÇÉe. Die entsprechende Wahrscheinlichkeitsverteilung heiƒt Binomialverteilung Bn;p mit den Parametern n und p. Statt P(X=k) schreibt man auch oft Bn;p(k). D 13 X sei eine Zufallsgr•ƒe, die die Werte x1, x2, …, xk mit den Wahrscheinlichkeiten p1, p2, …, pk annehmen kann. Dann heiƒt E(X)= x1p1+x2p2+ … +xkpk Erwartungswert von X, V(X)=(x1-)‰p1+(x2-)‰p2+ … +(xk-)‰pk=E((X-)‰) Varianz von X und (X)=√V(X) Standardabweichung von X. R5 Ist X binomialverteilt mit den Parametern n und p, so gilt: (1) n p (2) n p (1 p) -3- Hypothesentests fÄr binomialverteilte ZufallsgrÇÉen Signifikanztests: Zweiseitiges Testen: Linksseitiges Testen: Rechtsseitiges Testen: 1. 2. 3. Hypothese H0: p=p0, Hypothese H0: p≥p0, Hypothese H0: p≤p0, Alternative H1: p≠p0 Alternative H1: p<p0 Alternative H1: p>p0 Strategie Festlegung von Stichprobenumfang n und Signifikanzniveau. Bestimmung des zugeh•rigen Annahmebereichs r ; r , bzw. r ; n , oder 0; r Formulierung der Entscheidungsregel: Die Hypothese wird beibehalten, wenn das Stichprobenergebnis im Annahmebereich liegt, ansonsten ist sie zu verwerfen. M•gliche Fehler: Hypothese abgelehnt wird… beibehalten Zustand der Wirklichkeit Hypothese ist wahr Hypothese ist falsch Richtige Entscheidung Fehler 1. Art () Richtige Entscheidung Fehler 2. Art () Mit den Annahmebereichbereichen A = [a;b] ist Pn; p(a≤X≤b)=Fn;p(b)Fn;p(a-1), A = [0;a] ist Pn; p(0≤X≤a)=Fn;p(a), A = [b;n] ist Pn; p(b≤X≤n)=1Fn;p(b1) das Risiko (der Fehler) 2. Art. !berichtigt! SchÅtzen von Parametern fÄr binomialverteilte ZufallsgrÇÉen Bei einen hinreichend groƒen Stichprobenumfang n gilt f€r das 95%-Vertrauensintervall I h(1 h) h(1 h) I h 1,96 ; h 1,96 n n Das 95%-Vertrauensintervall I f€r die Wahrscheinlichkeit zur relativen H‚ufigkeit h X hat n h•chstens die LÄnge d, wenn f€r den Stichprobenumfang n 1,96 d2 2 gilt. NÅherungsformel von DE MOIVRELAPLACE F€r eine binomialverteilte Zufallsgr•ƒe X mit n p und n p (1 p) gilt f€r groƒe n: k 0,5 k 0,5 P k1 X k 2 2 1 . 1 „Groƒe n“ bedeutet: n 2 4 p (1 p) 2 Mit der LaplaceBedingung 3 kann man auf die Summanden 0,5 im Z‚hler verzichten! Die (Normal)Verteilungsfunktion Φ ist auf S. l der Formelsammlung tabelliert. -4-