ANGEWANDTE STATISTIK I – Prüfungstermin 22.5.2013 Name: Gruppe A Bitte stellen Sie ihre Ausführungen (wie lauten die Zufallsvariablen, welche Verteilungsfunktionen werden angenommen, verwendete Formeln, Zwischenergebnisse, Endergebnis) strukturiert und nachvollziehbar dar! Es wird empfohlen, die Berechnungen mit R durchzuführen! Arbeitszeit: 60 Minuten Beurteilung: Jede Teilaufgabe zählt gleich viel (2P), max. Punktezahl=16 4: (8, 10.5], 3: (10.5, 12.5], 2: (12.5, 14.5], 1: (14.5, 16] 1. Von einer N(µ, σ )-verteilten Zufallsvariablen X liegen folgende Messwerte vor: 13, 18, 21, 12, 14, 26,16, 20, 12, 8. a. Man beschreibe die Stichprobe mit Hilfe der Statistiken n, Minimum, Maximum, Mittelwert, Standardabweichung. Ferner bestimme man den Median und erkläre in Worten, was unter den Kennwerten „Mittelwert“ und „Median“ zu verstehen ist. b. Man berechne zu dem in a. bestimmten Schätzwert für σ zusätzlich ein 95%Konfidenzintervall für σ. Um wie viel % größer ist die Länge eines 99%igen Konfidenzintervalls für σ? c. Man berechne zu dem in a. bestimmten Schätzwert für µ zusätzlich ein 95%Konfidenzintervall für µ. Wie ist das Konfidenzintervall zu interpretieren? d. Welchen Mindeststichprobenumfang müsste man vorsehen, um die Mittelwertschätzung mit einer Genauigkeit (d.h. einer halben Breite des Konfidenzintervalls) von ± 1.5 und einer Sicherheit von 95% erwarten zu können? 2 2. Ein Produkt wird auf einer Anlage nach einem speziellen Fertigungsverfahren hergestellt. a. Nach einer Störung der Anlage werden in einem Testlauf 100 Produkte hergestellt, von denen 2 fehlerhaft waren. Man schätze die Wahrscheinlichkeit p, dass ein Produkt fehlerhaft ist und bestimme für p ein 95%-Konfidenzintervall. b. Wie groß ist die Wahrscheinlichkeit, dass von 5000 gefertigten Produkten mehr als 4900 fehlerfrei sind, wenn ein gefertigtes Produkt mit der Wahrscheinlichkeit p=2% fehlerhaft ist. c. Die gefertigten Produkte werden vom Hersteller in Packungen zu 500 Einheiten ausgeliefert. Im Rahmen der Eingangskontrolle wird von einem Konsumenten nach folgendem Plan geprüft: Es werden 10 Einheiten aus der gelieferten Packung zufällig ausgewählt und auf Fehler überprüft. Ist keine oder nur eine Einheit fehlerhaft, wird die Packung angenommen, andernfalls zurückgeschickt. Wie groß ist die Wahrscheinlichkeit, dass bei diesem Prüfplan die Packung angenommen wird, wenn ein gefertigtes Produkt mit der Wahrscheinlichkeit p=2% fehlerhaft ist. 3. Ein pharmazeutisches Produkt enthält eine Wirksubstanz, deren Masse X (in mg) N(µ, σ )-verteilt 2 ist mit µ=20 und σ =0.36. a. Wie groß ist die Wahrscheinlichkeit, dass X einen Wert innerhalb des einfachen Interquartilabstandes um den Mittelwert, also innerhalb des Intervalls (µ-IQR, µ + IQR) annimmt. 2 ANGEWANDTE STATISTIK I – Prüfungstermin 22.5.2013 Name: 1a. X<-c(13 ,18 ,21 ,12 ,14 ,26 ,16 ,20 ,12 , 8) A1<-cbind(length(X),min(X),mean(X),sd(X),max(X)) colnames(A1)<-c("n","min","mean","sd","max") n min mean sd max 10 8 16 5.312 26 > quantile(X, 0.5) 50% 15 Mittelwert: Summe der Messwerte dividiert durch deren Anzahl Median: mittlerer Wert der nach aufsteigender Größe geordneten Messreihe 1b. std<-sd(X); n<-length(X) # 95%-Konfidenzintervall für sigma alpha1<-0.05 LL_95<-sqrt((n-1)*var(X)/qchisq(1-alpha1/2,n-1)) UL_95<-sqrt((n-1)* var(X)/qchisq(alpha1/2,n-1)) length_95<-UL_95-LL_95 # 99% KOnfidenzintervall für sigma alpha2<-0.01 LL_99<-sqrt((n-1)* var(X)/qchisq(1-alpha2/2,n-1)) UL_99<-sqrt((n-1)* var(X)/qchisq(alpha2/2,n-1)) length_99<-UL_99-LL_99 A1b<-rbind(c(std,LL_95,UL_95,length_95),c(std,LL_99,UL_99,length_99)) colnames(A1b)<-c("SD","LL","UL","length CI") row.names(A1b)<-c("95% CI","99% CI") SD LL UL length CI 95% CI 5.312 3.654 9.698 6.044 99% CI 5.312 3.281 12.099 8.818 prozent<-(length_99-length_95)/length_95 *100 prozent [1] 45.89 1c. options(digits=5) xquer <- mean(X) # Schätzwert für mu Std <- sd(X) # Schätzwert für sigma n <- length(X) # Stichprobenumfang alpha <- 0.05 q <- qt(1-alpha/2, n-1) SE <- std/sqrt(n); d <- q*SE ug <- xquer-d; og <- xquer + d print(cbind(xquer, q, SE, d, ug, og)) xquer q SE d ug og [1,] 16 2.2622 1.6799 3.8003 12.2 19.8 Interpretation von [ug, og]: Die Grenzen ug und og sind Realisierungen von Zufallsvariablen, die den (unbekannten) Mittelwert mu mit der vorgegebenen Wahrscheinlichkeit 1-alpha=95% einschließen. ANGEWANDTE STATISTIK I – Prüfungstermin 22.5.2013 Name: 1d. d <- 1.5; sicher <- 0.95 alpha <- 1-sicher z_quantil <- qnorm(1-alpha/2) n_mindest <- (z_quantil*std/d)^2 print(cbind(d, sicher, n_mindest)) d sicher n_mindest [1,] 1.5 0.95 48.18422 2a. n <- 100; m <- 2 (pd <- m/n) # Schätzwert [1] 0.02 # Konfidenzintervall (exakt) alpha <- 0.05 qu <- qf(alpha/2, 2*m, 2*(n-m+1)); qo <- qf(1-alpha/2, 2*(m+1), 2*(n-m)) pu <- m*qu/(n-m+1+m*qu); po <- (m+1)*qo/(n-m+(m+1)*qo) print(cbind(alpha, pd, qu, qo, pu, po)) alpha pd qu qo pu po [1,] 0.05 0.02 0.1206 2.473 0.002431 0.07038 2b. p <- 0.02; n <- 5000 # X = Anzahl der fehlerhaften Einheiten ~ B(n, p)-verteilt # gesucht: P = P(X <= 99) (P <- pbinom(99, n, p)) [1] 0.4863 2c. N<-500; n<-10; a<-0.02*500 phyper(1,a,N-a,n) [1] 0.9851 # Approximation mit Binomialverteilung (Voraussetzung: n/N<0.1, N>60) pbinom(1, 10,0.02) [1] 0.9838 3a. 3a. mu <- 20; sigma <- sqrt(0.36) q025 <- qnorm(0.25, mu, sigma); q075 <- qnorm(0.75, mu, sigma) iqr <- q075-q025; print(cbind(q025, q075, iqr)) q025 q075 IQR [1,] 19.595 20.405 0.80939 ug<-mu-IQR; og<-mu+IQR P <-pnorm(og, mu, sigma)-pnorm(ug, mu, sigma) # P=P(ug <= X <= og) cbind(ug,og,p_innerhalb) ug og P [1,] 19.191 20.809 0.82266