PRUEFUNGSVORBEREITUNG – STATISTIK - SS GRUNDAUFGABEN RECHNEN MIT WAHRSCHEINLICHKEITEN 1. Bei der Bearbeitung eines Problems sind 5 voneinander unabhängige Entscheidungen zu treffen, von denen jede einzelne mit der Wahrscheinlichkeit = 0,05 eine Fehlentscheidung sein kann. Man bestimme die simultane Irrtumswahrscheinlichkeit _g, d.h. die Wahrscheinlichkeit, dass eine oder mehr als eine der Entscheidungen falsch sind. 2. Bei einem Verfahren zur sterilen Abfüllung von Flaschen tritt mit der Wahrscheinlichkeit p=0,1% ein Ausschuss (unsterile Flasche) auf. Es werden n Flaschen zufällig aus einem (sehr großen) Produktionslos entnommen (Prüfstichprobe). Wie viele Flaschen müssen zur Prüfung vorgesehen werden, damit mit mindestens 95%iger Sicherheit in der Prüfstichprobe (wenigstens) eine unsterile Flasche auftritt? 3. In einem Unternehmen mit 500 Beschäftigten werden im Zuge einer Grippeimpfung 300 geimpft. In der Folge erkrankten 50 Personen, von denen 15 geimpft waren. Wie groß ist die Wahrscheinlichkeit dafür, dass a) eine Person erkrankt, b) eine geimpfte Person erkrankt, c) eine erkrankte Person zur Gruppe der Geimpften gehört? 4. Bei einem diagnostischen Verfahren zum Nachweis einer Erkrankung sei die Wahrscheinlichkeit, ein falsch-positives (falsch-negatives) Ergebnis zu erhalten, gleich 0,5% (2,5%). Die Wahrscheinlichkeit für das Auftreten der Krankheit in einer bestimmten Zielgruppe sei 1,5%. Man berechne die Wahrscheinlichkeit, dass bei positivem Ergebnis tatsächlich eine Erkrankung vorliegt. WAHRSCHEINLICHKEITSVERTEILUNGEN 1. Bei einem Test werden 5 Aufgaben derart gestellt, dass es bei jeder Aufgabe 4 Antwortmöglichkeiten gibt, von denen genau eine die richtige ist. Wie groß ist die Wahrscheinlichkeit, dass man mehr als die Hälfte der Aufgaben richtig löst, wenn die Lösungsauswahl aufs Geratewohl erfolgt, d.h., jeder Lösungsvorschlag mit der Wahrscheinlichkeit 1/4 gewählt wird? 2. Ein Produktionslos enthält 100 Widerstände. Der Hersteller garantiert, dass höchstens 5% defekt sind. Jedes Los wird vor Lieferung geprüft, indem 10 Widerstände entnommen werden. Sind alle 10 Widerstände in Ordnung, wird das Los zur Auslieferung freigegeben. Wie groß ist bei diesem Prüfverfahren die Wahrscheinlichkeit, dass ein Los zurückgewiesen wird, obwohl es den Bedingungen (höchstens 5% defekt) entspricht? 3. Für eine bestimmte Diagnosegruppe ist ein Laborparameter X normalverteilt mit einem Mittelwert von 75 Einheiten und einer Standardabweichung von 10 Einheiten. Laborwerte unter 55 und über 95 gelten als kritisch. a) Wie groß ist die Wahrscheinlichkeit, dass X einen kritischen Wert annimmt? b) Wie groß ist die Wahrscheinlichkeit, dass in einer Stichprobe von 5 Personen, mindestens viermal ein nicht kritischer Wert gemessen wird? 4. Die Masse (in mg) einer Wirksubstanz W in einem Präparat sei normalverteilt mit dem Mittelwert 10 und der Varianz 0,25. Mit welcher Wahrscheinlichkeit wird ein Wert außerhalb des 2-fachen Interquartilabstandes um den Mittelwert angenommen? EINDIMENSIONALE DATENBESCHREIBUNG 1. Wiederholte Messungen der Ozonkonzentration ergaben an einer Messstelle die folgenden Stichprobenwerte (Angaben in 10-2 ppm): 2.6, 1.9, 3.3, 4.0, 5.3, 2.8, 3.6, 4.4, 3.5, 4.1 a) Man berechne und interpretiere den Mittelwert und die Standardabweichung. b) Man beschreibe die Stichprobe durch ein Boxplot und interpretiere die verwendeten Kenngrößen. c) Man passe eine Normalverteilung an die Daten an und bestimme die Quartile dieser Normalverteilung. 75927904 1 PRUEFUNGSVORBEREITUNG – STATISTIK - SS 2. Man bestimme mit Hilfe der Stichprobe 28, 25, 24, 27, 25, 24, 25, 26, 23, 26 Schätzwerte für den Mittelwert und die Standardabweichung von X (Spaltöffnungslänge in m). Welcher Prozentsatz von Merkmalswerten liegt zwischen dem unteren und oberen Quartil? PROBETERMIN (mit Lösungen in R) Bitte stellen Sie ihre Ausführungen (wie lauten die Zufallvariablen, welche Verteilungsfunktionen werden angenommen, verwendete Formeln, Zwischenergebnisse, Endergebnis) strukturiert und nachvollziehbar dar! Es wird empfohlen, die Berechnungen mit R oder EXCEL durchzuführen! Arbeitszeit: 60 Minuten 1. Ein Prüfplan zur Entscheidung über die Annahme eines Produktionsloses von 5000 Einheiten sieht folgende Vorgangsweise vor: Es wird eine Zufallsstichprobe von 100 Einheiten ausgewählt; das Los wird abgelehnt, wenn mehr als zwei Einheiten der Zufallsstichprobe fehlerhaft ist. Wie groß ist die Wahrscheinlichkeit für eine Rückweisung des Loses, wenn der Ausschussanteil 0,5% beträgt? 2. Die wiederholte Messungen der Konzentration eines Wirkstoffes ergab im Rahmen eines Ringversuches für die Labors A und B die folgenden Werte (Angaben in mg/l): Proben-Nr. Labor A Labor B 1 2,34 3,14 2 2,15 2,95 3 2,86 3,52 4 2,67 3,26 5 2,23 3,65 6 2,43 2,86 7 2,52 2,69 8 2,19 3,15 a) Man beschreibe die Stichproben mit Hilfe der Statistiken (MIN, MAX, Mittelwert, Standardabweichung, Median, Quartilabstand) b) Welcher Prozentsatz der Messwerte ist größer als das untere Quartil? (Beantwortung für beide Messreihen) 3. Bei einem diagnostischen Test zum Nachweis einer Erkrankung sei die Wahrscheinlichkeit, ein falsch-positives Ergebnis (Test ist positiv, obwohl keine Erkrankung vorliegt) zu erhalten, gleich 0,25%; die Wahrscheinlichkeit eines falsch-negativen Testbefundes ist 0,04% (d.h. die Wahrscheinlichkeit, dass der Test negativ ist, obwohl die Erkrankung vorliegt, beträgt 0,04%). Die Wahrscheinlichkeit für das Auftreten der Krankheit in einer bestimmten Zielgruppe sei 2%. Man berechne die Wahrscheinlichkeit, dass bei positivem Testergebnis tatsächlich eine Erkrankung vorliegt. 4. Die Messgröße X ist normalverteilt mit dem Mittelwert 150pg und der Standardabweichung 20pg. a) Man bestimme die Wahrscheinlichkeit, dass ein Wert im 1½ -fachen „Streuintervall“ um den Mittelwert auftritt, d.h. zwischen 120pg und 180pg liegt. b) Wie groß ist das 95% Quantil der Verteilung von X? 5. Bei einem Test werden die 15 Aufgaben so gestellt, dass es bei jeder Aufgabe 5 Antwortmöglichkeiten gibt, von denen genau eine richtig ist. Wie groß ist die Wahrscheinlichkeit, dass man mehr als 7 Aufgaben richtig löst, wenn man die Lösung einer jeden Aufgabe aufs Geratewohl vornimmt, d.h. jede Antwortmöglichkeit mit gleicher Wahrscheinlichkeit gewählt wird. Beurteilung: Jede Teilaufgabe zählt gleich (2P). 4: >5 bis inkl. 6,5P 3: >6,5 bis 7,5P 2: >7,5 bis 8,5P 1: >8,5 bis 9,5P 1A: 10P 75927904 2 PRUEFUNGSVORBEREITUNG – STATISTIK - SS Lösungen zum Probetermin in R: 1. X = Anzahl der fehlerhaften Einheiten in der Prüfstichprobe (n=100) N = 5000 Umfang des Produktionsloses (Ausschussanteil p=0,5%, d.h. im Produktionslos sind a=5000 x 0,005 = 25 defekte Einheiten und 4975 intakte) X ist hypergeometrisch verteilt Gesucht: Wahrscheinlichkeit für Zurückweisung = 1 - Annahmewahrscheinlichkeit = 1 - P(X=0 oder X=1 oder X=2) > options(digits=4) > Pa <- phyper(2, 25, 4975, 100); 1-Pa [1] 0.01297 2a. > options(digits=5) > a <- c(2.34, 2.15, 2.86, 2.67, 2.30, 2.43, 2.52, 2.19) > b <- c(3.14, 2.95, 3.52, 3.26, 3.65, 2.86, 2.69, 3.15) > summary(a); sd(a) Min. 1st Qu. Median Mean 3rd Qu. Max. 2.15 2.27 2.38 2.43 2.56 2.86 [1] 0.24247 > summary(b); sd(b) Min. 1st Qu. Median Mean 3rd Qu. Max. 2.69 2.93 3.15 3.15 3.32 3.65 [1] 0.32398 2b. Labor A: unteres Quartil = 2,27 sortierte Stichprobe: > sort(a) [1] 2.15 2.19 2.30 2.34 2.43 2.52 2.67 2.86 Anzahl der Messwerte größer als 2,27: 6 Prozentsatz der Messwerte größer als 2,27: > 6/8*100 [1] 75 Labor B: unteres Quartil = 2,93 sortierte Stichprobe: > sort(b) [1] 2.69 2.86 2.95 3.14 3.15 3.26 3.52 3.65 Anzahl der Messwerte größer als 2,93: 5 Prozentsatz der Messwerte größer als 2,93: > 6/8*100 [1] 75 3. P_k = P(krank) = 2% P(Diagnose positiv|nicht krank) = 0,25% P(Diagnose negativ|krank) = 0,04% à P_rp = P(richtig-positives Ergebnis) = P(Diagnose positiv|krank) = 99,96% Gesucht: P_kp = P(krank|Diagnose positiv) Angenommen: Zielgruppe umfasst N=1000 Personen Davon sind N x P(krank) = 20 krank und 980 gesund Von den Erkrankten werden N_rp= 20 x 0,9996 richtig positiv diagnostiziert Von den Gesunden werden N_fp=980 x 0,0025 falsch positiv diagnostiziert Insgesamt werden N_p = N_rp + N_fp positiv diagnostiziert, davon sind N_rp richtige Diagnosen à P_kp = P(krank|Diagnose positiv) = N_rp/N_p 75927904 3 PRUEFUNGSVORBEREITUNG – STATISTIK - SS > N_k <- 1000*0.02; N_k [1] 20 > N_g <- 1000-N_k; N_g [1] 980 > N_rp <- N_k*0.9996; N_rp [1] 19.992 > N_fp <- N_g*0.0025; N_fp [1] 2.45 > N_p <- N_rp+N_fp; N_p [1] 22.442 > N_kp <- N_rp/N_p; N_kp [1] 0.89083 4a. X ist normalverteilt mit mu=150 und sigma=20. Gesucht: P(120<X<180) > PXzw120_180 <- pnorm(180, mean=150, sd=20) - pnorm(120, mean=150, sd=20) > PXzw120_180 [1] 0.86639 4b. > x095 <- qnorm(0.95, mean=150, sd=20); x095 [1] 182.90 5. X = Anzahl der richtig gelösten Aufgaben X ist binomialverteilt mit Parametern n=15, p=1/5 Gesucht: W=P(X>7)= 1-P(X<=7) > W <- 1-pbinom(7, 15, 1/5); W [1] 0.0042397 75927904 4 PRUEFUNGSVORBEREITUNG – STATISTIK - SS Probetermin SS 2010 1. N= n= p= a= 5000 100 0,005 25 X = Anzahl der defekten Einheiten in der Prüfstichprobe X ist hypergeometrisch verteilt. Gesucht: P(Zürückweisung) = P(X>2) = 1-P(X=0) - P(X=1)-P(X=2) x P(X=x) 0,6027 0,3090 0,0753 0,9870 P(Zurückweisung) = 0 1 2 2. Labor A Labor B 1a. Labor A: Labor B: 1b. Labor A: Labor B: P(X<=2)= 0,01297 2,34 3,14 MIN 0,01410292 Approx. Binomialverteilung 2,15 2,95 MAX 2,15 2,69 2,86 3,65 2,86 3,52 2,67 3,26 2,3 3,65 2,43 2,86 2,52 2,69 2,19 3,15 Mittelwert STD Median u. Quartil o. Quartil Quartilabstand 2,4325 0,2425 2,385 2,2725 2,5575 0,285 3,1525 0,3240 3,145 2,9275 3,325 0,3975 Prozentsatz der Messwerte > u. Quartil = 75,0% 75,0% 3. P_fp = P(falsch-positives Ergebnis) = P(Diagnose positiv|nicht krank) = P_fn = P(falsch-negatives Ergebnis) = P(Diagnose negativ|krank) = P_rp = P(richtig-positives Ergebnis) = P(Diagnose positiv|krank) = P_k = P(krank) = Gesucht: P_kp = P(krank|Diagnose positiv) 0,25% 0,04% 99,96% 2,00% 100000 krank nicht krank 98000 2000 Test + Test 1999,2 Test+ 0,8 P(krank|Diagnose positive)= 4. Mittelwert= STD= UG= OG= P(UG<X<OG) = 95%-Quantil= Test 245 97755 89,08% 150 20 120 180 0,866 182,897 5. X ist binomialverteilt mit n= 15 p= 0,2 Gesucht: P(X>10) = 1-P(X<=7) P(X<=7)= 0,9958 P(X>7) = 0,00424 75927904 5