grundaufgaben zum rechnen mit wahrscheinlichkeiten

Werbung
PRUEFUNGSVORBEREITUNG – STATISTIK - SS
GRUNDAUFGABEN
RECHNEN MIT WAHRSCHEINLICHKEITEN
1. Bei der Bearbeitung eines Problems sind 5 voneinander unabhängige Entscheidungen zu treffen,
von denen jede einzelne mit der Wahrscheinlichkeit  = 0,05 eine Fehlentscheidung sein kann.
Man bestimme die simultane Irrtumswahrscheinlichkeit _g, d.h. die Wahrscheinlichkeit, dass
eine oder mehr als eine der Entscheidungen falsch sind.
2. Bei einem Verfahren zur sterilen Abfüllung von Flaschen tritt mit der Wahrscheinlichkeit p=0,1%
ein Ausschuss (unsterile Flasche) auf. Es werden n Flaschen zufällig aus einem (sehr großen)
Produktionslos entnommen (Prüfstichprobe). Wie viele Flaschen müssen zur Prüfung vorgesehen
werden, damit mit mindestens 95%iger Sicherheit in der Prüfstichprobe (wenigstens) eine
unsterile Flasche auftritt?
3. In einem Unternehmen mit 500 Beschäftigten werden im Zuge einer Grippeimpfung 300 geimpft.
In der Folge erkrankten 50 Personen, von denen 15 geimpft waren. Wie groß ist die
Wahrscheinlichkeit dafür, dass a) eine Person erkrankt, b) eine geimpfte Person erkrankt, c) eine
erkrankte Person zur Gruppe der Geimpften gehört?
4. Bei einem diagnostischen Verfahren zum Nachweis einer Erkrankung sei die Wahrscheinlichkeit,
ein falsch-positives (falsch-negatives) Ergebnis zu erhalten, gleich 0,5% (2,5%). Die
Wahrscheinlichkeit für das Auftreten der Krankheit in einer bestimmten Zielgruppe sei 1,5%. Man
berechne die Wahrscheinlichkeit, dass bei positivem Ergebnis tatsächlich eine Erkrankung
vorliegt.
WAHRSCHEINLICHKEITSVERTEILUNGEN
1. Bei einem Test werden 5 Aufgaben derart gestellt, dass es bei jeder Aufgabe 4
Antwortmöglichkeiten gibt, von denen genau eine die richtige ist. Wie groß ist die
Wahrscheinlichkeit, dass man mehr als die Hälfte der Aufgaben richtig löst, wenn die
Lösungsauswahl aufs Geratewohl erfolgt, d.h., jeder Lösungsvorschlag mit der Wahrscheinlichkeit
1/4 gewählt wird?
2. Ein Produktionslos enthält 100 Widerstände. Der Hersteller garantiert, dass höchstens 5% defekt
sind. Jedes Los wird vor Lieferung geprüft, indem 10 Widerstände entnommen werden. Sind alle
10 Widerstände in Ordnung, wird das Los zur Auslieferung freigegeben. Wie groß ist bei diesem
Prüfverfahren die Wahrscheinlichkeit, dass ein Los zurückgewiesen wird, obwohl es den
Bedingungen (höchstens 5% defekt) entspricht?
3. Für eine bestimmte Diagnosegruppe ist ein Laborparameter X normalverteilt mit einem Mittelwert
von 75 Einheiten und einer Standardabweichung von 10 Einheiten. Laborwerte unter 55 und über
95 gelten als kritisch.
a) Wie groß ist die Wahrscheinlichkeit, dass X einen kritischen Wert annimmt?
b) Wie groß ist die Wahrscheinlichkeit, dass in einer Stichprobe von 5 Personen, mindestens
viermal ein nicht kritischer Wert gemessen wird?
4. Die Masse (in mg) einer Wirksubstanz W in einem Präparat sei normalverteilt mit dem Mittelwert
10 und der Varianz 0,25. Mit welcher Wahrscheinlichkeit wird ein Wert außerhalb des 2-fachen
Interquartilabstandes um den Mittelwert angenommen?
EINDIMENSIONALE DATENBESCHREIBUNG
1. Wiederholte Messungen der Ozonkonzentration ergaben an einer Messstelle die folgenden
Stichprobenwerte (Angaben in 10-2 ppm): 2.6, 1.9, 3.3, 4.0, 5.3, 2.8, 3.6, 4.4, 3.5, 4.1
a) Man berechne und interpretiere den Mittelwert und die Standardabweichung.
b) Man beschreibe die Stichprobe durch ein Boxplot und interpretiere die verwendeten
Kenngrößen.
c) Man passe eine Normalverteilung an die Daten an und bestimme die Quartile dieser
Normalverteilung.
75927904
1
PRUEFUNGSVORBEREITUNG – STATISTIK - SS
2. Man bestimme mit Hilfe der Stichprobe 28, 25, 24, 27, 25, 24, 25, 26, 23, 26 Schätzwerte für den
Mittelwert und die Standardabweichung von X (Spaltöffnungslänge in m). Welcher Prozentsatz
von Merkmalswerten liegt zwischen dem unteren und oberen Quartil?
PROBETERMIN (mit Lösungen in R)
Bitte stellen Sie ihre Ausführungen (wie lauten die Zufallvariablen, welche Verteilungsfunktionen
werden angenommen, verwendete Formeln, Zwischenergebnisse, Endergebnis) strukturiert und
nachvollziehbar dar!
Es wird empfohlen, die Berechnungen mit R oder EXCEL durchzuführen!
Arbeitszeit: 60 Minuten
1. Ein Prüfplan zur Entscheidung über die Annahme eines Produktionsloses von 5000 Einheiten
sieht folgende Vorgangsweise vor: Es wird eine Zufallsstichprobe von 100 Einheiten ausgewählt;
das Los wird abgelehnt, wenn mehr als zwei Einheiten der Zufallsstichprobe fehlerhaft ist. Wie
groß ist die Wahrscheinlichkeit für eine Rückweisung des Loses, wenn der Ausschussanteil 0,5%
beträgt?
2. Die wiederholte Messungen der Konzentration eines Wirkstoffes ergab im Rahmen eines
Ringversuches für die Labors A und B die folgenden Werte (Angaben in mg/l):
Proben-Nr.
Labor A
Labor B
1
2,34
3,14
2
2,15
2,95
3
2,86
3,52
4
2,67
3,26
5
2,23
3,65
6
2,43
2,86
7
2,52
2,69
8
2,19
3,15
a) Man beschreibe die Stichproben mit Hilfe der Statistiken (MIN, MAX, Mittelwert,
Standardabweichung, Median, Quartilabstand)
b) Welcher Prozentsatz der Messwerte ist größer als das untere Quartil? (Beantwortung für
beide Messreihen)
3. Bei einem diagnostischen Test zum Nachweis einer Erkrankung sei die Wahrscheinlichkeit, ein
falsch-positives Ergebnis (Test ist positiv, obwohl keine Erkrankung vorliegt) zu erhalten, gleich
0,25%; die Wahrscheinlichkeit eines falsch-negativen Testbefundes ist 0,04% (d.h. die
Wahrscheinlichkeit, dass der Test negativ ist, obwohl die Erkrankung vorliegt, beträgt 0,04%). Die
Wahrscheinlichkeit für das Auftreten der Krankheit in einer bestimmten Zielgruppe sei 2%. Man
berechne die Wahrscheinlichkeit, dass bei positivem Testergebnis tatsächlich eine Erkrankung
vorliegt.
4. Die Messgröße X ist normalverteilt mit dem Mittelwert 150pg und der Standardabweichung 20pg.
a) Man bestimme die Wahrscheinlichkeit, dass ein Wert im 1½ -fachen „Streuintervall“ um den
Mittelwert auftritt, d.h. zwischen 120pg und 180pg liegt.
b) Wie groß ist das 95% Quantil der Verteilung von X?
5. Bei einem Test werden die 15 Aufgaben so gestellt, dass es bei jeder Aufgabe 5
Antwortmöglichkeiten gibt, von denen genau eine richtig ist. Wie groß ist die Wahrscheinlichkeit,
dass man mehr als 7 Aufgaben richtig löst, wenn man die Lösung einer jeden Aufgabe aufs
Geratewohl vornimmt, d.h. jede Antwortmöglichkeit mit gleicher Wahrscheinlichkeit gewählt wird.
Beurteilung:
Jede Teilaufgabe zählt gleich (2P).
4: >5 bis inkl. 6,5P
3: >6,5 bis 7,5P
2: >7,5 bis 8,5P
1: >8,5 bis 9,5P
1A: 10P
75927904
2
PRUEFUNGSVORBEREITUNG – STATISTIK - SS
Lösungen zum Probetermin in R:
1.
X = Anzahl der fehlerhaften Einheiten in der Prüfstichprobe (n=100)
N = 5000 Umfang des Produktionsloses (Ausschussanteil p=0,5%, d.h. im Produktionslos sind a=5000 x 0,005 =
25 defekte Einheiten und 4975 intakte)
X ist hypergeometrisch verteilt
Gesucht: Wahrscheinlichkeit für Zurückweisung =
1 - Annahmewahrscheinlichkeit = 1 - P(X=0 oder X=1 oder X=2)
> options(digits=4)
> Pa <- phyper(2, 25, 4975, 100); 1-Pa
[1] 0.01297
2a.
> options(digits=5)
> a <- c(2.34, 2.15, 2.86, 2.67, 2.30, 2.43, 2.52, 2.19)
> b <- c(3.14, 2.95, 3.52, 3.26, 3.65, 2.86, 2.69, 3.15)
> summary(a); sd(a)
Min. 1st Qu. Median Mean 3rd Qu. Max.
2.15 2.27 2.38
2.43 2.56 2.86
[1] 0.24247
> summary(b); sd(b)
Min. 1st Qu. Median Mean 3rd Qu. Max.
2.69 2.93 3.15
3.15 3.32 3.65
[1] 0.32398
2b.
Labor A:
unteres Quartil = 2,27
sortierte Stichprobe:
> sort(a)
[1] 2.15 2.19 2.30 2.34 2.43 2.52 2.67 2.86
Anzahl der Messwerte größer als 2,27: 6
Prozentsatz der Messwerte größer als 2,27:
> 6/8*100
[1] 75
Labor B:
unteres Quartil = 2,93
sortierte Stichprobe:
> sort(b)
[1] 2.69 2.86 2.95 3.14 3.15 3.26 3.52 3.65
Anzahl der Messwerte größer als 2,93: 5
Prozentsatz der Messwerte größer als 2,93:
> 6/8*100
[1] 75
3.
P_k = P(krank) = 2%
P(Diagnose positiv|nicht krank) = 0,25%
P(Diagnose negativ|krank) = 0,04%
à P_rp = P(richtig-positives Ergebnis) = P(Diagnose positiv|krank) = 99,96%
Gesucht: P_kp = P(krank|Diagnose positiv)
Angenommen: Zielgruppe umfasst N=1000 Personen
Davon sind N x P(krank) = 20 krank und 980 gesund
Von den Erkrankten werden N_rp= 20 x 0,9996 richtig positiv diagnostiziert
Von den Gesunden werden N_fp=980 x 0,0025 falsch positiv diagnostiziert
Insgesamt werden N_p = N_rp + N_fp positiv diagnostiziert, davon sind N_rp richtige Diagnosen à P_kp =
P(krank|Diagnose positiv) = N_rp/N_p
75927904
3
PRUEFUNGSVORBEREITUNG – STATISTIK - SS
> N_k <- 1000*0.02; N_k
[1] 20
> N_g <- 1000-N_k; N_g
[1] 980
> N_rp <- N_k*0.9996; N_rp
[1] 19.992
> N_fp <- N_g*0.0025; N_fp
[1] 2.45
> N_p <- N_rp+N_fp; N_p
[1] 22.442
> N_kp <- N_rp/N_p; N_kp
[1] 0.89083
4a.
X ist normalverteilt mit mu=150 und sigma=20.
Gesucht: P(120<X<180)
> PXzw120_180 <- pnorm(180, mean=150, sd=20) - pnorm(120, mean=150, sd=20)
> PXzw120_180
[1] 0.86639
4b.
> x095 <- qnorm(0.95, mean=150, sd=20); x095
[1] 182.90
5.
X = Anzahl der richtig gelösten Aufgaben
X ist binomialverteilt mit Parametern n=15, p=1/5
Gesucht: W=P(X>7)= 1-P(X<=7)
> W <- 1-pbinom(7, 15, 1/5); W
[1] 0.0042397
75927904
4
PRUEFUNGSVORBEREITUNG – STATISTIK - SS
Probetermin SS 2010
1.
N=
n=
p=
a=
5000
100
0,005
25
X = Anzahl der defekten Einheiten in der Prüfstichprobe
X ist hypergeometrisch verteilt.
Gesucht:
P(Zürückweisung) = P(X>2) = 1-P(X=0) - P(X=1)-P(X=2)
x
P(X=x)
0,6027
0,3090
0,0753
0,9870
P(Zurückweisung) =
0
1
2
2.
Labor A
Labor B
1a.
Labor A:
Labor B:
1b.
Labor A:
Labor B:
P(X<=2)=
0,01297
2,34
3,14
MIN
0,01410292 Approx. Binomialverteilung
2,15
2,95
MAX
2,15
2,69
2,86
3,65
2,86
3,52
2,67
3,26
2,3
3,65
2,43
2,86
2,52
2,69
2,19
3,15
Mittelwert
STD
Median
u. Quartil
o. Quartil
Quartilabstand
2,4325
0,2425
2,385
2,2725
2,5575
0,285
3,1525
0,3240
3,145
2,9275
3,325
0,3975
Prozentsatz der Messwerte > u. Quartil =
75,0%
75,0%
3.
P_fp = P(falsch-positives Ergebnis) = P(Diagnose positiv|nicht krank) =
P_fn = P(falsch-negatives Ergebnis) = P(Diagnose negativ|krank) =
 P_rp = P(richtig-positives Ergebnis) = P(Diagnose positiv|krank) =
P_k = P(krank) =
Gesucht: P_kp = P(krank|Diagnose positiv)
0,25%
0,04%
99,96%
2,00%
100000
krank
nicht krank
98000
2000
Test +
Test 1999,2
Test+
0,8
P(krank|Diagnose positive)=
4.
Mittelwert=
STD=
UG=
OG=
P(UG<X<OG) =
95%-Quantil=
Test 245
97755
89,08%
150
20
120
180
0,866
182,897
5.
X ist binomialverteilt mit
n=
15
p=
0,2
Gesucht: P(X>10) = 1-P(X<=7)
P(X<=7)=
0,9958
P(X>7) =
0,00424
75927904
5
Herunterladen