Hier werden die wichtigsten Sachverhalte der Wahrscheinlichkeitsrechnung plausibel wiederholt und wie man dabei die GTR von TI(T) und Casio(C) einsetzt. Teil 1 Elementare Statistik Wir betrachten folgende Tabelle der Treffer eines Handballspielers in 10 Spielen. Trefferzahl 3 4 5 6 %-Häufigkeit 10 30 40 20 Erläuterung: Er hat z.B. in 3 von 10 (30%) Spielen 4 Treffer erzielt. Grafische Darstellung: 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 1 2 3 4 5 6 7 8 9 . Um den Spieler mit anderen vergleichbar zu machen müssen wir diesen Sachverhalt etwas aufbereiten. A)Median, Modalwert, Spannweite, Interquartilsabstand, Mittelwert, Standardabweichung Wir ordnen die Daten x1=3; x2=4; x3=4; x4=4; x5=5; x6=5; x7=5; x8=5; x9=6; x10=6 Der Median Q2 (Bez.: s.u.) ist entweder der Wert in der Mitte oder die Hälfte der Summe aus Endwert der ersten Hälfte und Anfangswert der zweiten Hälfte, hier also (5+5)/2=5. Der Modalwert ist der Wert mit der größten Häufigkeit, hier also auch 5. Die Spannweite ist die Differenz des größten und des kleinsten Werts, hier 6-3=3. Der Median teilt die (geordnete) Datenreihe in 2 Bereiche auf. Diese beiden Bereichen kann man nun mit dem unteren Quartil Q1 und dem oberen Quartil Q3 nochmals unterteilen. Q1 : 1. n/4 ganz: Q1=(xn/4+xn/4+1)/2 2. n/4 nicht ganz: Q1=xn/4(aufgerundet zur nächst größeren Zahl) Q3: Wie Q1 mit 3n/4 statt n/4 n/4=10/4=2,5≈3: Q1=4 3n/4=7,5≈8: Q3=5 Interquartilsabstand: Q3-Q1=5-4=1 Natürlich bringt diese Größe nur bei umfangreicheren Datenreihen mit Ausreissern etwas. T: {3,4,4,4,5,5,5,5,6,6}STO>L1 [CATALOG] ...1-Var Stats [L1] ... C: [MENU] 2 z.B. bei LiSt 1 eingeben, dann CALC(F2) 1VAR(F1) Dabei werden auch Mittelwert und Standardabweichung berechnet (s.u.). B) Mittelwert, Standardabweichung Der Mittelwert μ ist gleich der Summe der Produkte aus Wert und seinem prozentualem Auftreten μ=3·10%+4·30%+5·40%+6·20%=4,7 (Überprüfe dies mit normaler Mittelwertbildung (3+3·4+4·5+2·6)/10) Die Standardabweichung σ ist folgendermaßen definiert: σ² ist der Mittelwert der Quadrate der Abweichungen der Einzelwerte vom Mittelwert. σ²=(3-4,7)²·10%+(4-4,7)²·30%+(5-4,7)²·40%+(6-4,7)²·20%=0,81 Also: σ=0,9 GTR: s.o. Hinweis: Durch die Umwandlung zi= x i−μ wird der z-Mittelwert 0 und man kann Standardabweichungen σ verschiedener Datenreihen hinsichtlich Standardabweichung vergleichen. Bei den Handballspielern würde man dann bei gleichem μ der x-Werte den mit dem kleinsten σ der z-Werte bevorzugen. Zu Korrelationen und Regression (linearer Fall): X (Sonnenstd) 1.9 2.5 3.2 3.8 4.7 5.5 5.9 7.2 Y (Badebesucher) 220 330 300 320 380 490 420 550 T: {1.9,2.5, ...}STO>L1 {220,330, ...}STO>L2 STAT PLOT Plot1...ON ZOOM ZoomStat C: MENU 2 ... An 8 Tagen wurde die Sonnenscheindauer gemessen und die dazugehörige Zahl der Badebesucher gezählt. Man erkennt, dass sich die in einem Koordinatensystem eingetragenen Punkte (1.9|220), (2.5|330), ... um eine Gerade gruppieren. Die Gerade kann so bestimmt werden, dass die Summe der Abweichungsquadrate der y-Werte Punkte zum jeweiligen Geradenpunkt gleichen x-Werts minimal wird: C: ... LinearReg(ax+b) a=55.699.. b=134.65.. r=0.941.. r²=0.886... Mse=1529.0... y=ax+b T: LinReg(ax+b) L1,L2 a=55.699.. b=134.65 nach DiagnosticOn erscheinen noch r² und r Der Korrelationskoeffizient r gibt an, wie gut die Gerade ist. Liegt r nahe bei 1 spricht man von einer hohe positiven Korrrelation zwischen Sonnenscheindauer und Badebesucherzahlen. Die Parameter a und b werden über die Mittelwerte der Datenreihen errechnet: (falls kein GTR zur Hand) b=Σ(x-μx)(y-μy)/Σ(x- μx)² a=(1-b)μx r=bσ*x/σ*y * bedeutet, dass in der obigen Formel für σ im Nenner n-1 statt n steht. ∩ Teil 2: Wahrscheinlichkeitsrechnung A) Ereignisse Beim Wurf eines Spielwürfels gibt es 6 mögliche Ausgänge. Diese fasst man zu einer Menge zusammen und schreibt dies folgendermaßen: S={1; 2; 3; 4; 5; 6} ... Stichprobenmenge Die Teilmengen dieser Menge nennt man Ereignisse. z.B. {2; 4; 6} S wäre das Ereignis „gerader Ausgang“ Die einelementigen Teilmengen heißen Elementarereignisse. Jedes Elementarereignis hat hier (aber nicht bei jedem Zufallsexperiment) die gleiche Wahrscheinlichkeit P({1})=P({2})=P({3})=P({4})=P({5})=P({6})= P({2; 4; 6})=P({2})+P({4})+P({6})= 1 ≈17%. (Summe muss 1=100% ergeben) 6 3 =0,5 6 Die Wahrscheinlichkeit eines Ereignisses ist die Summe der Wahrscheinlichkeit seiner Elementarereignisse. Um einen Spielwürfel auf Korrektheit zu testen wird er z.B. 100 mal geworfen. Man erwartet dann, dass jede Zahl etwa gleich oft fällt und zwar 100· 1 ≈17 mal bzw. prozentual ausgedrückt zu etwa 17% aller Ausgänge. 6 Eine Zahl von 1 bis 6 wird sicher gewürfelt, daher heißt {1; 2; 3; 4; 5; 6} sicheres Ereignis, es hat die Wahrscheinlichkeit 1. Eine 7 wird niemals gewürfelt, daher nennt man dieses Ereignis unmöglich, in Mengenschreibweise ist es die leere Menge {}, es hat die Wahrscheinlichkeit 0. Zu jedem Ereignis kann man das Komplementärereignis bilden. Zu A={2; 4; 6} lautet das Komplementärereignis A'={1; 3; 5} Anschaulich: 246 135 Es gilt P(A')=1-P(A) Zwei Ereignisse, die keine gemeinsamen Elemente haben nennt man disjunkt. Die Ereignisse A={1; 3; 5} … ungerade und B={2; 3; 5} … Primzahl sind nicht disjunkt. 1 35 2 46 Bezeichnungen: (Vorstellung A gelb/grün, B grün/blau bei subtraktiver Farbmischung:gelb&blau=grün) Vereinigungsmenge: A∪B ={1; 3; 5; 2}... A oder B treten ein (Anordnung bei Mengen egal) Schnittmenge: A∩B ={3; 5}... A und B treten ein Am Beispiel ersichtlich: P( A∪B )=P(A)+P(B)-P( A∩B ) Eine weitere Möglichkeit der Mengenverknüpfung stellt die Differenzmenge dar: A\B={1; 3; 5}\{2; 3; 5}={1} ... A ohne B P(A\B)=P(A)-P( A∩B ) ... A aber nicht B ist eingetreten Vorgänge wie das Werfen eines Spielwürfels und Feststellung der Augenzahl nennt man Zufallsexperimente. Ein weiteres Beispiel ist das Roulettespiel: 3 6 9 12 15 18 21 24 27 30 33 36 .2/1. 0 2 5 8 11 14 17 20 23 26 29 32 35 .2/1. 10 4 7 10 13 16 19 22 25 28 31 34 .2/1. .1-12. .13-24. .25-36. .1-18. gerade ungerade .19-36. Man kann auf eine bestimmte Zahl, ein bestimmtes Zahlenpaar, auf ein bestimmtes Zahlenquadrat oder die um das Feld gruppierten Ereignisse setzen. Die Wahrscheinlichkeit, für ein bestimmtes Zahlenfeld ist 1 , bei 0 gewinnt die Bank. 37 Berechne die Wahrscheinlichkeit für vollständigen Verlust, wenn der Spieler sowohl auf rot als auch auf gerade setzt. Es verlieren die 0 und die schwarzen ungeraden Zahlen.. Verlustwahrscheinlichkeit P({0, 11, 13, 15, 17, 29, 31, 33, 35})= 9 37 B) Bedingte Wahrscheinlichkeit Es soll beim Roulette(s.o.) die Wahrscheinlichkeit für einen geraden Ausgang (A) unter der Bedingung eines schwarzen Ausgangs (B) berechnet werden. Ereignisbaum: *P(A|B)=10/18 P( A∩ B =10/37=P(B)·P(A|B) *P(B)=18/37 * *P(A'|B)=8/18 P( A ' ∩B =8/37 * *P(A|B')=10/19 P( A∩ B ' =10/37 *P(B')=19/37 * *P(A'|B')=9/19 P( A '∩B ' =9/37 mit P(A|B)= P A∩B =bedingte Wahrscheinlichkeit von A unter der Bedingung B P B Zu beachten ist, dass A|B kein Ereignis darstellt. Vielmehr wird für ein festes Ereignis B für andere Ereignisse eine Wahrscheinlichkeit definiert, besser wäre die Bezeichnung PB(A) Gilt P(A|B)=P(A), so sind die Ereignisse unabhängig, für unabhängige Ereignisse gilt P( A∩ B )=P(A)·P(B) Im Beispiel wäre P( A∩B )=10/37≠(18/37)·(18/37)=P(A)·P(B) A und B also abhängig. Eine anschauliche Vorstellung von Abhängigkeit oder Unabhängigkeit von Ereignissen erhält man durch folgendes Beispiel: In einer Urne befinden sich 5 weiße und 5 schwarze Kugeln; es wird zweimal gezogen. Im ersten Fall wird die Kugel nicht zurückgelegt; im zweiten Fall wird sie zurückgelegt. In beiden Fällen lautet die Menge der Ausgänge S={ww, ws, sw, ss}. (evtl. auch {ww, sw, ss}) | | |☺☺☺☺☺☻ ☻☻☻☻| Für die Wahrscheinlichkeitsverteilung gilt aber im ersten Fall P1({ww})=P1({ss})= 5 4 20 · = 10 9 90 P1({sw)}=P1({ws})= 5 5 25 · = 10 9 90 (Elementarereignisse sind also nicht immer gleich wahrscheinlich!), im zweiten Fall dagegen 5 5 25 · = 10 10 100 Sei nun A={ss, sw} und B={ss, ws} so ist A∩B ={ss} und 45 45 20 P1(A)= , P1(B)= , P1( A∩B )= ≠P1(A)·P1(B) 90 90 90 P2(A)=P2(B)=0,5, P2( A∩ B )=0,25=P2(A)·P2(B) P2({ww})=P2({ss})=P2({sw)}=P2({ws})= Im Gegensatz zum ersten Fall haben wir im zweiten Fall Unabhängigkeit der Ereignisse. Legt man die Kugel zurück, so sind die Ereignisse erster Zug schwarz und zweiter Zug schwarz unabhängig. Ebenso erster Zug weiß und zweiter Zug schwarz, erster Zug weiß und zweiter Zug weiß, erster Zug weiß und zweiter Zug weiß. Kurz/allgemein: Beim Ziehen aus einer Urne mit Zurücklegen sind die Ereignisse irgendein Ereignis bei einem Zug und irgendein Ereignis beim nächsten Zug unabhängig. Die gilt generell, wenn Zufallsexperimente unter gleichen Bedingungen wiederholt werden. Merke: P( A∩B )=P(A)·P(B) (Produktregel für unabhängige Ereignisse)) Übung: 1) In einer Population sind durchschnittlich 0,1% der Personen an TBC erkrankt. Ein Test ist bei 95% der Kranken und bei 4% der Gesunden positiv. Eine beliebige Person wird getestet. Mit welcher Wahrscheinlichkeit zeigt der Test ein positives Ergebnis? Lösung: B das Ereignis Person hat TBC, A sei das Ereignis Test bei Person positiv Ereignisbaum: (Gegeben ist das Fettgedruckte) *P(A|B)=95% P( A∩ B =0,1%·95% *P(B)=0,1% * *P(A'|B)=5% P( A ' ∩B =0,1%·5% * *P(A|B')=4% P( A∩ B ' =99,9%·4% *P(B')=99,9%* *P(A'|B')=96% P( A '∩B ' =99,9%·96% (man beachte, dass die Summe der Gabelenden jeweils 1 sein muss) P(A)=P( A∩ B +P( A∩ B ' =0,1%·95%+99,9%·4%=4% (B blau, B' gelb, A rot, subtr. Farbm.) A∩ B B A∩ B ' B' 2: Ein BA-Student besteht die Klausur in Finanzmathematik mit einer Wahrscheinlichkeit von 80% und in Statistik mit 70%. Die Wahrscheinlichkeit für das Bestehen beider Klausuren ist 60%. a) Mit welcher Wahrscheinlichkeit besteht ein Student, nach bestandener Finanzmathematikprüfung (F) auch die Statisikklausur (S). b) Mit welcher Wahrscheinlichkeit besteht ein Student wenigstens eine Klausur. ∩ F F' Summen S 60% 10% 70% S' 20% 10% 30% Summen 80% 20% 100% a) PF(S)= P S ∩ F 60 = =75% 80 PF b) P(SUF)=P(S)+F(F)-P(S∩F)=70%+80%-60%=90% 3) Von 3 geschlossenen Dosen befinden sich in einer 50€. Der Spielleiter läßt den Spieler eine auswählen. Dann öffnet er eine der verbleibenden Dosen, die leer ist. Jetzt kann der Spieler unter den geschlossenen nochmals wählen. Die Frage ist, ob er wechseln soll. Lösung: B sei das Ereignis,bei der 1. Wahl richtige Dose, A das Ereignis, bei der 2. Wahl richtige Dose bei Wechsel. Ereignisbaum: *P(B)=1/3 * *P(A|B)=0 P( A∩ B =0 * *P(B')=2/3 * * P(A|B')=1 P( A∩ B ' =2/3 Ergebnis: Das Ereignis Gewinn bei Wechseln hat die Wahrscheinlichkeit 2/3 (ohne Wechsel 1/3) C) Zufallsvariable, Erwartungswert, Standardabweichung Wir betrachten einen Spielautomaten Es gibt 3 Walzen mit den Zahlen 1 bis 4, die auch entsprechend oft drauf sind (1x1, 2x2, 3x3, 4x4) und unabhängig voneinander laufen bzw. anhalten. | 1€ 2 4 1 Die folgende Tabelle gibt die Gewinn/Verlustübersicht in € an: Ausgang 111 222 333 444 sonst Gewinn x 99 19 9 0 -1 Für die Wahrscheinlichkeit der einzelnen Gewinne gilt nach der Produktregel für unabhängige Ereignisse P({111})=0,1·0,1·0,1=0,001 P({222})=0,2·0,2·0,2=0,008 P({333})=0,3·0,3·0,3=0,027 P({444})=0,4·0,4·0,4=0,064 Ein Verlust tritt mit einer Wahrscheinlichkeit von 1-0,001-0,008-0,027-0,064=0,9 ein. Wir berechnen 0,001·99+0,008·19+0,027·9+0,064·0+0,90·(-1)=-0,406 Dies bedeutet, dass wir bei einem Einsatz von 100€ etwa einen Verlust von 41€ erwarten müssen. Ordnet man wie im Beispiel den Ausgängen eines Zufallsexperiments (eindeutig reelle) Zahlen zu, so spricht man von einer Zufallsvariablen X, X(111) wäre 99, übliche Schreibweise: (X=99) statt {111}. Der soeben berechnete Wert wäre der Erwartungswert μ der Zufallsvariablen X. μ=P(X=99)·99+P(X=19)·19+P(X=9)·9+P(X=0)·0+P(X=-1)·(-1)=-0,406 Entsprechend gilt für die Standardabweichung σ²=P(X=99)·(99-μ)²+P(X=19)·(19-μ)²+P(X=9)·(9-μ)²+P(X=0)·(0-μ)²+P(X=-1)·(-1-μ)²=15,6 Dabei bedeuten X=99, X=19, X=9, X=0 die Mengen {111}, {222}, {333}, {444}. X>10 wäre {111, 222} (übliche Schreibweise) allgemein: μ=Σx·P(X=x) und σ²=Σ(x-μ)²·P(X=x) Hat man 2 Zufallsvariablen X und Y, so spricht man von Unabhängigkeit, wenn alle Ereignisse X=x und y=Y unabhängig sind, also stets P(X=x und Y=y)=P(X=x)·P(Y=y) gilt. D) Geometrische Verteilung und Binomialverteilung Geometrische Verteilung (weniger wichtig, bereitet aber das nächste Kapitel vor) Bei einem Würfelspiel benötigt man zunächst eine 6, damit man anfangen kann; man darf anfangs höchstens drei mal würfeln. Sei X die Zahl der Versuche für eine 6, dann gilt 1 6 5 1 P(X=2)= · (1. Wurf keine 6, 2. Wurf 6) 6 6 5 1 P(X=3)=( )²· (1. und 2. Wurf keine 6, 3. Wurf 6) u.s.w. (kann endlos sein) 6 6 P(X=1)= allgemein: mit p als Erfolgswahrscheinlichkeit und q=1-p als Misserfolgswahrscheinlichkeit und k als Nummer des ersten Erfolgs gilt P(X=k)=qk-1p … X geometrisch verteilt, X~Geo(p) Es gelten ohne Begründung folgende Beziehungen μ= q 1 , σ²= 2 P(X>k)=qk, P(X≤k)=1-qk p p 17% 16% 15% 14% 13% 12% 11% 10% 9% 8% 7% 6% 5% 4% 3% 2% 1% 1 2 3 4 5 6 7 8 9 10 Übung: Mit welcher Wahrscheinlichkeit tritt beim Roulette erst beim 10. Spiel schwarz auf? 18 19 (18 von 37 Felder sind schwarz) q= (18 rote und 1 grünes Feld von 37) k=10 37 37 19 9 18 P(X=k)= qk-1p=( ) ≈0,0012 (man müßte im Mittel 1000 mal spielen, bis das Ereignis auftritt) 37 37 P= Binomialverteilung: (sehr wichtig) Wir stellen uns jetzt ein Würfelspiel vor, bei dem sechsmal gewürfelt und die Zahl der Sechsen (X) festgestellt wird. S={111111; … ; 666666} P({111166})=( 5 4 1 ) ·( )² (1.-4. Wurf 1, 5. und 6. Wurf 6) 6 6 Gesucht: P(X=2) Dazu muss man die Anzahl der Elemente der Menge {661111; …; 111166} berechnen. Dazu geht man von der Zahl der Anordnungsmöglichkeiten von 123456 aus. Es sind dies 6·5·4·3·2·1=6! (6 Fakultät). Erläuterung bei 3!=6 2-3->123 *1< * 3-2->132 1-3->213 * * *2< 3-1->231 * 1-2->312 *3< 2-1->321 Damit ist die Zahl der Elemente unserer Menge Damit gilt P(X=2)= 6! ; 2 ! · 4! 6! 6! 5 1 ·P({111166}) = ·( )4·( )² 2 ! · 4! 2 ! · 4! 6 6 allgemein: n Wiederholungen, Trefferwahrscheinlichkeit p, Trefferzahl k≤n P(X=k)= n! pkqn-k … binomialverteilt, X~B(n, p) k ! ·n−k ! ohne Begründung gilt μ=np und σ²=npq Die Werte (a+b)n=Σ n! n = heißen Binomialkoeffizienten: k ! ·n−k ! k n akbn-k k T:n [MAT]...PRB...nCr [ENTER] k [ENTER] k 0 1 2 P(X=k) 0,33 0,4 0,2 C: n [OPTN] >[F6] PROB[F3] nCr[F3] k [EXE]} ! auch dort 3 4 5 6 0,05 0,01 0,0006... 0,00002... T: P(X=k)=binompdf(n,p,k) P(X≤k)=binomcdf(n,p,k) [CATALOG] C: P(X=k)=BinomialPD(k,n,p) P(X≤k)=BinomialCD(k,n,p) [CATALOG] Übungen: Bei einer Produktion gibt der Hersteller an, dass diese im Mittel 5% Auschuss enthält. Der Kunde entnimmt aus der laufenden Produktion 5 Teile und registiert 2 Auschussteile. Berechne die Wahrscheinlichkeit für dieses Ereignis unter der Vorraussetzung der Richtigkeit der Herstellerangabe. Er berechnet P(X=2)=binomialpdf(5,0.05,2)=BinomialPD(2,5,0.05)=0,0214. Auf Grund der geringen Wahrscheinlichkeit zweifelt er die Angabe an. (Genaueres s.u.) Hinweis: Entnimmt man eine Stichprobe aus einer laufenden Produktion so spielt es keine große Rolle, ob man die Objekte einzeln mit Zurücklegen oder auf einen Griff entnimmt. Falls keine Herstellerangaben über den Auschussanteil vorliegen, geht man davon aus, dass 2 Auschussteile aus 5 die höchste Wahrscheinlichkeit besitzt und untersucht P(X=k)= 52 p²(1-p)³ Man erhält 0,4. Dies ist auch die relative Häufigkeit der Defektteile in der Stichprobe. Hypothesentests Beispiel 1: Zweiseitiger Signifikanztest Ein Spielwürfel soll auf Korrektheit getestet. Dazu wird er 100 mal geworfen und die Zahl der Sechsen ermittelt. Die Zufallsvariable X gebe die Zahl der Sechsen an. Wir haben ein Bernoullieexperiment mit den Parametern n=100 und p=1/6≈17% (d.h. man geht von der Korrektheit aus) Ausgehend von μ=np≈17 werden wir den Würfel ablehnen, wenn eine zu große Abweichung von diesem Wert vorliegt. Z.B.: μ 0, 1, 2,3, ... 10, 11, ..., 17, ...,23, 24, 25,...,99, 100 Ablehnung...gl.......Annahme.......gr...Ablehnung Für die Wahrscheinlichkeit einer Ablehnung des Würfels gilt P(X≤10)=binomcdf(100,1/6,10)=BinomialCD(14,100,1/6)≈0,04 [CATALOG] P(X≥24)=1-P(X≤23)≈0,04 Damit werden wir mit einer 8%-igen Wahrscheinlichkeit einen korrekten Würfel ablehnen. Normalerweise ist bei einem Test die Ablehnungswahrscheinlichkeit vorgegeben und wird mit Irrtumswahrscheinlichkeit (Signifikanzniveau) α bezeichnet. Die vom Hersteller des Würfels behauptete Wahrscheinlichkeit p=p0=1/6 wird als Nullhypothese H0 bezeichnet. Der Annahmebereich wird von der linken (gl=10) und rechten Signifikanzgrenze (gr=24) begrenzt. Bei gegebenem n, p, α bestmmt man die Signifikanzgrenzen mittels GTR folgendermaßen: P(X≤gl)=binomcdf(n,p0,gl)=binomialCD(gl,n,p0)≤0,5α und P(X≥gr)=1-P(X≤gr-1)=binomcdf(n,p0,gr-1)=1-binomialCD(gr-1,n,p0)≤0,5α Vorgangsweise bei gegebenem α=2% im sonst gleichen Beispiel n=100, p=1/6: Für gl berechnet man der Reihe nach ausgehend vom Erwartungswert 17 P(X≤gl)=binomcdf(100,1/6,17)≈0,60 P(X≤gl)=binomcdf(100,1/6,16)≈0,49 ... P(X≤gl)=binomcdf(100,1/6,9)≈0,02 P(X≤gl)=binomcdf(100,1/6,8)≈0,009≤0,01 ... gl=8 (man muss nicht in Einerschritten vorgehen!) 8 ist 9 niedriger als 17, wir vermuten daher gr=17+9=26 P(X≥gr)=1-P(X≤gr-1)=1-binomcdf(100,1/6,25)≈0,01 Vorsichtshalber berechnen wir noch P(X≥gr)=1-P(X≤gr-1)=1-binomcdf(100,1/6,26)≈0,006 Also: gr=26 Beispiel 2: Linksseitiger Signifikanztest Ein Medikament gegen eine bestimmte Krankheit soll laut Hersteller eine Wirksamkeit von 90% besitzen. Ein Arzt testet dies an 15 Personen. Berechne die Irrtumswahrscheinlichkeit für den AblehnungbereichX≤11, wenn X die Anzahl der erfolgreichen Behandlungen mit diesem Medikament ist. Lösung: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 Ablehnungsbereich g Annahmebereich P(X≤11)=binomcdf(15,0.9,11)=BinomCD(11,15,0.9)≈0,055=5,5% allg: P(X≤g)≤α Vorgangsweise bei gegebenem α=0,5% im sonst gleichen Beispiel n=15, p=0,9: Für g berechnet man der Reihe nach ausgehend vom Erwartungswert np=13,5 P(X≤g)=binomcdf(15,0.9,13)≈0,45 ... P(X≤g)=binomcdf(15,0.9,10)≈0,01 P(X≤g)=binomcdf(15,0.9,9)≈0,002 also g=9 Beispiel 3 Rechtsseitiger Signifikanztest Bei einem Restposten von Filzstiften seien höchstens p=10% vertrocknet. Der Interessent testet n=50 zufällig ausgewählte Stifte. Berechne die Irrtumswahrscheinlichkeit für den Ablehnungsbereich X≥10, wenn X die Anzahl vertrockneter Stifte ist. Lösung: 0, 1, ..., 9, 10, 11, ..., 50 Annahme g Ablehnung P(X≥10)=1-P(X≤9)=1-binomcdf(50,0.1,9)≈0,024=2,4% allg: P(X≥g)≤α Vorgangsweise bei gegebenem α=1% im sonst gleichen Beispiel n=50, p=0,1: Für g berechnet man der Reihe nach ausgehend vom Erwartungswert np=5 P(X≥g)=1-P(X≤g-1)=1-binomcdf(50,0.1,6)≈0,23 ... P(X≥g)=1-P(X≤g-1)=1-binomcdf(50,0.1,9)≈0,02 P(X≥g)=1-P(X≤g-1)=1-binomcdf(50,0.1,10)≈0,009 also g=11 Merke: Beim einseitigen Signifikanztest muss man mit dem GTR bei gegebener Irrtumswahrscheinlichkeit α aus P(X≤gl)=binomcdf(n,p0,gl)=binomialCD(gl,n,p0)≤α (linksseitig) bzw. P(X≥gr)=1-binomcdf(n,p0,gr-1)=1-binomialCD(gr-1,n,p0)≤α (rechtsseitig) die Signifikanzgrenzen g berechnen. Beim zweiseitigen Test müssen beide Ungleichungen mit 0,5 α betrachtet werden. Dabei ist n der Umfang der Stichprobe und p0 der p-Wert der Nullhypothese. Aufgaben: . 01. Ein Medikament heilt eine bestimmte Krankheit mit einer Wahrscheinlichkeit von 95%. Durch Einnahme des Medikaments tritt bei 5% der Patienten eine Nebenwirkung auf. Eine heilende Wirkung ohne Nebenwirkung tritt bei 90% der Behandelten ein. A sei das Ereignis: Der Patient werde durch das Medikament geheilt. B sei das Ereignis: Das Medikament verursacht beim Patienten eine Nebenwirkung. Untersuche A und B auf Unabhängigkeit. Lösung: B:grün+blau A A∩B B A: gelb+grün P(A)=0,95 P(B)=0,05 P(A\B)=0,9 (gelb) P(A∩B)=P(A)-P(A\B)=0,05≠P(A)P(B)=0,0475 d.h. A und B sind abhängige Ereignisse. 02. In einer Urne befinden sich 2 schwarze und 2 weisse Kugeln. a) Wir ziehen 2 Kugeln auf einen Griff. Mit welcher Wahrscheinlichkeit werden 2 gleichfarbige bzw. 2 verschiedenfarbige Kugeln gezogen. Lösung: Das Ziehen mit einem Griff entspricht dem Ziehen nacheinander ohne Zurücklegen. Elementarereignisse seien {g, v} 1/3 *w ... 1/6 *w 2/4 2/3 *s ... 1/3 * 2/4 2/3 *w ... 1/3 *s 1/3 *s ... 1/6 P({g})=1/6+1/6=1/3 P({v})=1/3+1/3=2/3 b) Die Ziehung (von 2 Kugeln auf einen Griff) wird jetzt fünfmal wiederholt, wobei das gezogene Kugelpaar wieder zurückgelegt wird. Mit welcher Wahrscheinlichkeit zeht man dreimal ein gleichfarbiges Kugelpaar? Lösung: Wir haben Bernoulliketten der Länge n=5 X sei die Zahl der gleichfarbigen Kugelpaare. Dann ist p=1/3 und k=3. P(X=3)=binompdf(5,1/3,3)=16,5% 03. In einem Losbehälter befinden sich 25 Lose. Es handelt sich dabei um 15 Nieten und 10 Gewinne. a) Mit welcher Wahrscheinlichkeit zieht man dreimal nacheinander einen Gewinn? Lösung: X sei die Zahl der Gewinne bei dreimaligem Ziehen, dann gilt P(X=3)= 10 9 8 ≈5,2% 25 24 23 b) Mit welcher Wahrscheinlichkeit hat man bei fünfmaligem Ziehen 3 Gewinne? Lösung: Zunächst gilt P({gggnn})= 10 9 8 15 14 ≈2,37% 25 24 23 22 21 Da man die Lose auf einmal ziehen kann muss man noch mit der Anzahl der Anordnungsmöglichkeiten von gggnn multiplizieren: 52 =5 nCr 2=10 Mit der Zufallsvariablen X als Zahl der Gewinne bei fünfmaligem Ziehen gilt dann P(X=3)≈23,7% c) Mit welcher Wahrscheinlichkeit verbleiben nach 20 Loskäufen nur noch Gewinne in dem Behälter? Lösung: Zunächst gilt für 15 n und 5 g P({n...ng...g})= 15 1 25 ... ∙1∙...∙1=1/ 25 11 15 Mit der Zufallsvariablen X als Zahl der Nieten bei zwanzigmaligem Ziehen gilt dann P(X=20)= 205 1525 / ≈0,47% Das gleiche Ergebnis erhält man durch die Rechnung 10 9 8 7 6 ≈0,0047... 5 Gewinne bei fünfmaligem Ziehen 25 24 23 22 21 04. Bei der Einnahme eines Medikaments zur Blutdrucksenkung bekommt man mit einer Wahrscheinlichkeit von 5% Kopfschmerzen und mit einer Wahrscheinlichkeit von 2% Bauchschmerzen. Beide Nebenwirkungen treten unabhängig voneinander auf. a) Mit welcher Wahrscheinlichkeit bekommt man beide Nebenwirkungen? b) Mit welcher Wahrscheinlichkeit bekommt man mindestens eine Nebenwirkung? c) Mit welcher Wahrscheinlichkeit bekommt man entweder Kopfschmerzen oder Bauchschmerzen? d) Mit welcher Wahrscheinlichkeit bekommt man keine Nebenwirkung? Lösung: A sei das Ereignis Kopfschmerzen, B das Ereignis Bauchschmerzen. B: grün/blau 20 A(49) A∩B(1) B(19) A: gelb/grün 50 a) P(A∩B)=P(A)P(B)=0,05·0,02=0,001 (grün) ... 1 von 1000 b) P(AUB)=P(A)+P(B)-P(A∩B)=0,069 (gelb/grün/blau) ... 69 von 1000 c) P(AUB)\P(A∩B)=0,069-0,001=0,068 (gelb/blau) ... 68 von 1000 d) 1-P(AUB)=0,931 ... 931 von 1000 1. Gegeben ist eine Urne mit 6 Kugeln, die mit den Zahlen 1(1x), 2(2x) und 3(3x) beschriftet sind. Aus der Urne wird eine Kugel entnommen und wieder zurückgelegt. a) Mit welcher Wahrscheinlichkeit werden bei zweimaligem Ziehen 2 verschiedene Zahlen gezogen? Lösung: 1-P({11, 22, 33})=1-( 1 1 2 2 3 3 11 + + )= 6 6 6 6 6 6 18 b) Mit Welcher Wahrscheinlichkeit ist der Summenwert bei zweimaligem Ziehen höchstens 3? Lösung: P({11,12,21})= 1 1 1 2 2 1 7 = 6 6 6 6 6 6 36 c) Mit welcher Wahrscheinlichkeit wird bei 6 Ziehungen mindestens zweimal eine 3 gezogen? Lösung: Wir haben hier ein Bernoulliexperiment mit n=6(Zahl der Ziehungen), p=0,5(Einzelwahrscheinlichkeit für 3), k=2(Zahl der gezogenen 3en) P(X≥2)=1-P(X≤1)=1-binomcdf(6,0.5,1)=0,890625 c) Wie oft muss man mindestens ziehen, damit die Wahrscheinlichkeit mindestens eine 3 zu ziehen größer als 99% ist. Lösung: P(X>1)=1-P(X=0)=1-0,5n>0,99...0,01> 0,5n...100<2n...n>7 oder P(X>1)=1-P(X=0)=1-binompdf(n,0.5,0)>0,99 jetzt im GTR n=0, 1, 2, ... eingeben 2. Aus einer Urne mit 7 schwarzen und 3 weissen Kugeln werden nacheinander 2 Kugeln ohne Zurücklegen gezogen. a) Mit welcher Wahrscheinlichkeit sind sie gleichfarbig? Lösung: P({ss, ww})= 7 6 3 2 48 8 + = = 10 9 10 9 90 15 b) Zeige, dass die Ereignisse „1. Kugel schwarz“ bzw. „2. Kugel weiss“ abhängig sind. Lösung: 7 6 7 3 63 3 2 7 3 27 + = P({ww,sw})= + = 10 9 10 9 90 10 9 10 9 90 21 P({ss,sw}∩{ww,sw})=P({sw})= ≠P({ss,sw})P({ww,sw}) 90 P({ss,sw})= 3. Aus einer Urne mit 6 schwarzen und 4 weissen Kugeln werden nacheinander Kugeln mit Zurücklegen gezogen. a) Mit welcher Wahrscheinlichkeit ist die 3. gezogene Kugel erstmals weiss? Lösung: P({wwws})=0,6²·0,4=0,144=14,4% b) Mit welcher Wahrscheinlichkeit sind von 5 gezogenen Kugeln 2 weiss und 3 schwarz? Lösung: Die Zufallsvariable X gebe die Zahl der weissen Kugeln an, dann ist diese bernoulliverteilt mit n=5, p=0,4. P(X=2)=binompdf(5,0.4,2)=0,3456=34,56% 4. Ein Händler für elektronische Bauteile gibt den Anteil an fehlerhaften Bauteilen mit 5% an. a) Der Kunde entnimmt einer größeren Sendung 10 Bauteile. Mit welcher Wahrscheinlichkeit ist mindestens ein Bauteil defekt? Lösung: Wir betrachten die Stichprobe als Bernoullikette der Länge n=10 mit der Einzelwahrscheinlichkeit p=0,05 und berechnen P(X≥1). P(X≥1)=1-P(X=0)=1-binompdf(10,0.05,0)≈0,4 b) Der Kunde entnimmt einer größeren Sendung 20 Bauteile. Mit welcher Wahrscheinlichkeit sind mindestens zwei Bauteile defekt? Lösung: P(X≥2)=1-P(X≤1)=1-binomcdf(20,0.05,1)≈0,264 5. Das Glücksrad ist gerade bei der 4 stehen geblieben. Die Winkel über und unter dem horizontalen Durchmesser sind jeweils gleich groß. Das Glücksrad bleibe in keiner Stelle bevorzugt stehen, an den Trennstellen soll es aber nicht stehen bleiben. a) Das Glücksrad werde wird einmal gedreht. X sei die Zahl, bei der es stehenbleibt. Berechne P(X=1), P(X=2), P(X=3), P(X=4). Lösung: Die Wahrscheinlichkeiten der einzelnen Sektoren sind jeweils Winkel/360°. P(X=1)= 105 7 = =P(X=2)=P(X=3) 360 24 P(X=4)= 45 1 = 360 8 b) Mit welcher Wahrscheinlichkeit ist bei dreimaligem Drehen die Summe der Zahlen 6? Lösung: P({114, 141, 411, 222,123,...,321})=3( 7 1 7 )² +7( )³≈20,5% 24 8 24 c) Mit welcher Wahrscheinlichkeit tritt bei viermaligem Drehen die 2 mindestens zweimal auf. Lösung: X sei die Anzahl der auftretenden 2en. Dann gilt P(X≥2)=1-P(X≤1)=1-binomcdf(4, 7 ,1)≈33,36% 24 d) Mit welcher Wahrscheinlichkeit tritt bei zehnmaligem Drehen die 1 mindestens zweimal aber höchstens viermal auf? Lösung: X sei die Anzahl der auftretenden 1en. P(2≤X≤4)=P(X=2)+P(X=3)+P(X=4)=binompdf(10, 7 7 7 ,2)+binompdf(10, ,3)+binompdf(10, ,4)=70% 24 24 24 e) Durch hundertmaliges Drehen soll das Glücksrad auf Korrektheit getestet werden. Dabei wird die 1 beobachtet. Der Annahmebereich sei das Intervall [24; 34]. Mit welcher Wahrscheinlichkeit wird es abgelehnt, unter der Hypothese, dass es korrekt ist? Lösung: X sei die Anzahl der auftretenden 1en. P(24≤X≤34)=P(X≤34)-P(X≤23)=binomcdf(100, Irrtumswahrscheinlichkeit 22,6% Hinweis: Der Erwartungswert wäre μ=np=20 7 7 ,31)-binomcdf(100, ,26)=77,4% d.h. 24 24 7 ≈29 24 6. Bei einer größere Lieferung von Ventilen soll die Herstellerangabe von 10% Ausschuss getestetet werden. Es wird eine Stichprobe von 20 Stück entnommen werden. Bestimme den Ablehnungsbereich bei einer Irrtumswahrscheinlichkeit von 5%. Lösung: X gebe die Zahl defekter Ventile an. Man wird ablehnen, wenn zu viele defekt sind, d.h. wir haben einen rechtsseitigen Test. Es ist μ=np=2 (sinnvoller Startwert) Für den rechtsseitigen Test gilt (s.o.)t: P(X≥gr)=1-binomcdf(n,p0,gr-1)=1-binomialCD(gr-1,n,p0)≤α 1-binomcdf(20,0.1,2)≈0,33 1- binomcdf(20,0.1,3)≈0,13 1-binomcdf(20,0.1,4)≈0,043≤0,05 d.h. g-1=4, g=5 Ablehnungbereich {5, 6, ..., 20} 7. Ein Medikament soll eine bestimmte Krankheit mit einer Wahrscheinlichkeit von 80% heilen. Es wird ein Test mit 100 Personen durchgeführt. Bestimme den Ablehnungsbereich bei einer Irrtumswahrscheinlichkeit von 5%. Lösung: X gebe die Zahl der geheilten an, man wird ablehnen, wenn es zu wenige sind. Wir haben also einen linksseitigen Test. P(X≤gl)=binomcdf(n,p0,gl)=binomialCD(gl,n,p0)≤α Es ist μ=np=80 (sinnvoller Startwert) binomcdf100,0.8,80)≈0,54 binomcdf100,0.8,75)≈0,13 binomcdf100,0.8,74)≈0,09 binomcdf100,0.8,73)≈0,06 binomcdf100,0.8,72)≈0,03≤0,05 g=72 Ablehnungbereich {0,1, ..., 72} 8. Vor einem Tennismatch testet der Schiedsrichter seine Wahl-Münze. Dazu wirft er sie zwanzig Mal und stellt fest, wie oft Zahl erscheint. Bestimme den Ablehnungsbereich bei einer Irrtumswahrscheinlichkeit von 2%. Lösung: X gebe an, wie oft Zahl gefallen ist. Man wird ablehnen,wenn dies zu selten oder zu häufig ist, d.h. wir haben einen zweiseitigen Test. P(X≤gl)=binomcdf(n,p0,gl)=binomialCD(gl,n,p0)≤0,5α und P(X≥gr)=1-binomcdf(n,p0,gr-1)=1-binomialCD(gr-1,n,p0)≤0,5α binomcdf(20,0.5,10)≈0,59 binomcdf(20,0.5,5)≈0,02>0,01 binomcdf(20,0.5,4)≈0,006≤0,01 1-binomcdf(20,0.5,15)≈0,006≤0,01 1-binomcdf(20,0.5,14)≈0,02>0,01 gl=4 gr-1=15 Ablehnungbereich: {0, 1, 2, 3, 4, 16, 17, 18, 19, 20} 9. In der Tabelle ist das Setzfeld beim Roulette dargestellt: 3 6 9 12 15 18 21 24 27 30 33 36 .2/1. 0 2 5 8 11 14 17 20 23 26 29 32 35 .2/1. 10 4 7 10 13 16 19 22 25 28 31 34 .2/1. .1-12. .13-24. .25-36. .1-18. gerade ungerade .19-36. a) Ein Spieler setzt zweimal auf das letzte Zahlendrittel. Mit welcher Wahrscheinlichkeit gewinnt er mindestens einmal? b) Ein Spieler setzt fünfmal auf rot. Mit welcher Wahrscheinlichkeit gewinnt er höchstens dreimal? c) Ein Spieler setzt dreimal auf dieselbe Zahl 10€. Berechne den Erwartungswert seines Verlusts. d) Ein Spieler setzt 10€ auf 10. Bei Gewinn hört er auf; bei Verlust spielt er weiter. Verliert er nochmals, macht er noch ein letztes Spiel. Berechne den Erwartungswert seines Verlusts. Lösung: a) P({25, 26, ..., 36})= 12 37 b) X ... Anzahl roter Elementarereignisse mit p= 18 18 und n=5 ... P(X≤3)=binomcdf(5, ,3)≈82,9% 37 37 c) Wenn die gesetzte Zahl fällt erhält er das 36-fache ausbezahlt, also das 35-fache seines Einstzes. μ=1050P(X=3)+690P(X=2)+330P(X=1)-30P(X=0) 1 1 1 1 ,3)+690binompdf(3, ,2)+330binompdf(3, ,1)-30binompdf(3, ,0)≈-0,81 37 37 37 37 1 36 1 36 1 36 d) μ=350 +340 +330( )² -30( )³≈-0,79 37 37 37 37 37 37 μ=1050binompdf(3, Hinweis zu c und d: Bei 0 bleibt der Einsatz auf dem Feld, was hier kein neues Spiel ist. 10. Zur Behandlung einer Krankheit wird in eine Klinik das Medikament A eingesetzt, das eine Wirksamkeit von 80% besitzt. Wenn das Medikament A nicht wirkt, wird das Medikament B eingesetzt, das dann eine Wirksamkeit von 70% besitzt. Bestimme Erwartungswert und Standardabweichung für 100 so behandelte Patienten. Lösung: Wir haben Bernoulliketten mit n=100 und p=0,8+0,2∙0,7=0,94 μ=np=94 Ϭ²=np(1-p)=5,56 Das Folgende wird derzeit im Abitur nicht geprüft. D) Normalverteilung Bsp.: In der Tabelle sind die Resultate der Messung der Körperlänge von Neugeborenen eingetragen, anschließend wurden Mittelwert und Standardabweichung berechnet. l in cm 47 48 49 50 51 52 53 54 55 56 % 5 14 21 24 14 12 7 2 0 1 μ=0,05·47+0,14·48+0,21·49+0,24·50+0,14·51+0,12·52+0,07·53+0,02·54+0,00·55+0,01·56=50.09 σ²=0,05·3,09²+0,14·2,09²+0,21·1,09²+0,24·0,09²+0,14·0,91²+0,12·1,91²+0,07·2,91²+0,02·3,91²+0,00·4,91² +0,01·5,91²=3,14 Zwar liegen die Werte diskret vor, jedoch bedeutet der Ausgang X=48 auf Grund des Messvorgangs 47,5≤X<48,5. Die Zufallsvariable X ist kontinuierlich (stetig). Mit den Werten μ und σ und den Formeln μ=np und σ²=npq kann man passende Werte für n und p einer Binomialverteilung berechnen: n≈53 und p≈0.937. Die in der Tabelle angegebenen %-Angaben stimmen dann näherungsweise mit denen der binomial verteilten Zufallsvariablen überein. z.B.: P(X=48)=binompdf(53,0.937,48)=BinomPD(48,53,0.937)≈13 Es gibt aber noch ein besseres Verfahren nach Gauß, das weitergehende Anwendungen und bessere Theoretische Untersuchungen zuläßt. Im GTR ergibt Y1=binompdf(53,0.937,int(X+0.5))=BinomPD(int(X+0.5),53,0.937) ein Schaubild, das obige Häufigkeitsverteilung annähert. Der GTR zeichnet nur waagrechte Strecken der Länge 1. (Manko: Vertikale Strecken dürfte es nicht geben!) Im gleichen Koordinatensystem ist die zugehörige Gaußsche Glockenkurve, eine komplizierte Exponentialkurve mit den Parametern μ, σ gezeichnet: Y2=normalpdf(X,50.09,√(3.14))=NormPD(X,√(3.14),50.09) [CATALOG] (Eingabe von e^(-0.5(x- μ)²/ σ²)/√(2π σ²) ergibt die gleiche Kurve) 46 53 Bestimmt man den Inhalt der Fläche zwischen Gaußkurve x-Achse und den Geraden x=47.5 und x=48.5, so erkennt man eine Annäherung an die Wahrscheinlichkeit der zugehörigen Binomialverteilung für k=48. Im GTR sind diese Integralberechnungen ebenfalls fest einprogrammiert; es gilt für die Wahrscheinlichkeit, dass ein Messwert im Intervall [a;b] liegt mit μ, σ der Messreihe. P(a≤X≤b)=normalcdf(a,b,μ, σ)=NormCD(a,b,σ,μ) [CATALOG] Im folgenden werden obige Tabellenwerte mit den wie soeben angegeben berechneten verglichen: Gelb: Originalwerte Blau: errechnete Werte(s.u.) Grün: Überlappung 4 4 4 5 5 5 5 5 5 5 7 8 9 0 1 2 3 4 5 6 P(46,5≤X≤ 47,5)=normalcdf(46.5,47.5,50.09,√3.14)=NormCD(46.5,47.5,√3.14,50.09)=0.05=5% P(47.5≤X≤ 48.5)=11% P([48.5≤X≤ 49.5)=18% P(49.5≤X≤ 50.5)=22% P(50.5≤X≤5; 51.5)=20% P(51.5≤X≤ 52.5)=13% P(52.5≤X≤53.5)=:6% P(53.5≤X≤54.5)=2% P(54.5≤X≤55.5)=1% P(55.5≤X≤56.5=0% Dass nicht genau 100% herauskommen liegt an den gerundeten Werten. Hinweis: Folgendes gilt aus geometrischen Gründen (Symmetrie der Gaußkurve zu x= μ und Inhalt der Fläche zwischen Kurve und x-Achse gleich 1) P(X≤μ)=0,5 und a<μ: P(X≤a)=0,5-P(a≤X≤μ) a>μ: P(X≤a)=0,5+P(μ≤X≤a) GTR:P(X≤a)=0,5-normalcdf(a,μ μ,σ)=0,5-NormCD(a,μ,σ,μ) [CATALOG] Übung: Eine Firma stellt einen Artikel mit einem Gewicht von (1,95±0,05)g her. Ausgehend von einer Normalverteilung mit μ=1,95 und σ=0,05 beantworte man folgende Fragen. a) Mit welcher Wahrscheinlichkeit wiegt ein Artikel zwischen 1,8g und 2,1g? b) Mit welcher Wahrscheinlichkeit wiegt ein Artikel mindestens 2g. Wieviel solcher Artikel befinden sich in einer Charge von 100 Stück? a) P(1,8<X<2,1)=normalcdf(1.8,2.1,1.95,0.05)=NormCD(1.8,2.1,0.05,1,95)=0,9973 b) P(X≥2)=1-P(X<2)=1-normalcdf(0,2,1.95,0.05)=1-NormCD(0,2,0.05,1.95)=0,1587 Etwa 16 Stück. D1) Vertrauensintervall Es gibt noch weitere Besonderheiten bei normalverteilten Zufallsvariablen betreffend Abweichungen vom Mittelwert in Einheiten vonσ: P(|X-μ|≤1σ)=normalcdf(μ-1σ,μ+1σ,μ,σ)=NormCD(μ-1σ,μ+1σ,σ,μ)=γ(1)=68,3% P(|X-μ|≤2σ)=normalcdf(μ-2σ,μ+2σ,μ,σ)=NormCD(μ-2σ,μ+2σ,σ,μ)=γ(2)=95,4% P(|X-μ|≤3σ)=normalcdf(μ-2σ,μ+2σ,μ,σ)=NormCD(μ-3σ,μ+3σ,σ,μ)=γ(3)=99,7% unabhängig von μ und σ; man prüfe dies am Beispiel μ=5 und σ=1 nach. Man kann also davon ausgehen, dass bei einer Gaußverteilten Zufallsvariablen praktisch nur Werte aus dem Intervall [ μ-3σ; μ+3σ] auftreten. Allgemein heißt P(|X-μ|≤cσ)= γ(c) Vertrauenszahl Da Unabhängikkeit von μ und σ besteht, kann man zur Bestimmung von γ(c) μ=0 und σ=1 wählen: γ(c)=normalcdf(-c,c,0,1)=NormCD(-c,c,1,0) und c-Werte mit dem GTR leicht bestimmen. z.B. γ(c)=90%=0,9 … c=1,64... Wir betrachten nun eine binomialverteilte Zufallsvariable X mit Trefferwahrscheinlichkeit p und „großem“ n. Dann gilt näherungsweise P(x1≤X≤x2)=normalcdf(x1,x2, μ,σ) (im Folgenden nur GTR=T) μ=np und σ= np 1− p Ferner folgt aus P( μ- cσ≤X≤ μ+cσ)=normalcdf( μ- cσ, μ+cσ, μ,σ) P(np-c np 1− p ≤X≤ np+c np 1− p )= normalcdf(np-c np 1− p ,np+c np 1− p ,np, np 1− p )= X 1 X 1 )= μ(X) und σ( )= σ(X) folgt n n n n X p 1− p ≤ ≤p+c p 1− p )= P(p-c n n n p 1− p ,p+c p 1− p ,p, p 1− p )=γ(c) … unabhängig von p und n (s.o.) normalcdf(p-c n n n p 1− p ;p+c p 1− p ] heißt Vertrauensintervall für p zur Vertrauenszahl γ(c). Das Intervall [p-c n n Da μ( Beispiel: Bei einer Stichprobe vom Umfang 100 werden 10 defekte Teile festgestellt. Das Vertauensintervall zur Vertrauenszahl 0,9 wäre [0,1-1,64 0.09 ,0,1+1,64 0.09 ]=[0,50;0,15] 100 100 D.h. bei 90% derartiger Stichproben erhält man einen p-Wert aus diesem Intervall. D2) X²n-Verteilung (Chi-Quadrat) Beispiel: Ein Würfel soll auf Korrektheit getestet werden. Bei 60 Würfen ergab sich folgende Häufigkeitsverteilung Augenzahl 1 2 3 4 5 6 Beobachte Häufigkeit B 12 8 6 13 7 14 Erwartete Häufigkeit E 10 10 10 10 10 10 (B-E)²/E 0,4 0,4 1,6 0,9 0,9 1,6 B−E ² X²5= ∑ =6,8 E Der untere Index 5 gibt die Zahl der unabhängigen Größen an, die zur Berechnung herangezogen werden müssen. Da die Summe 60 ergeben muss besteht eine Abhängigkeit, die Zahl 5 nennt man Freiheitsgrad. (also: 5=6-1) Die Wahrscheinlichkeitsberechnungen bei der X²5-Verteilung erfolgt ähnlich wie bei der Normalverteilung. Die entsprechenden Funktionen sind ebenfalls im GTR vorhanden. P(X²5≤6,8)=0,764 Y1=x²pdf(x,5)=ChiPD(x,5) ([CATALOG] bei T unter Buchstabe C einsortiert) oder direkte Berechnung P(X²5≤6,8)=x²cdf(0,6.8,5)=ChiCD(0,6.8,5)=0.764 ([CATALOG] bei T unter Buchstabe C einsortiert) d.h die Irrtumswahrscheinlichkeit beträgt 1-0,764=23,6% Die Irrtumswahrscheinlichkeit wird auch mit Signifikanzniveau bezeichnet. Übung:Wir überprüfen obigen Spielautomaten Es gibt 3 Walzen mit den Zahlen 1 bis 4, die auch entsprechend oft drauf sind (1x1, 2x2, 3x3, 4x4). | 1€ 2 4 1 Bei 1000 Spielen ergab sich: Ausgang 111 222 333 444 sonst Beobachtet B 4 12 20 60 904 Erwartet E 1 8 27 64 900 (B-E)²/E 9 2 1,8 0,25 0,02 X²4= ∑ B−E ² =13,07 (Testgröße) E Überprüfe die Hypothese auf 5%-Niveau, ob der Automat der Erwartung gerecht wird. P(X²4≤13,07)=x²cdf(0,13.07,4)=ChiCD(0,13.07,4)=0,989=98,9%>95%, d.h. die Hypothese ist abzulehnen. Die schwarze Fläche zwischen x-Achse und Dichtekurve beträgt 0,95 Flächeneinheiten, die weisse Restfläche 0,05 Flächeneinheiten. Die Trennstelle lautet 9,49. Die Testgröße 13,07 liegt also im Ablehnungsbereich.