ANGEWANDTE STATISTIK I – Prüfungstermin 22.5.2013 Name:

Werbung
ANGEWANDTE STATISTIK I – Prüfungstermin 22.5.2013
Name:
Gruppe A
Bitte stellen Sie ihre Ausführungen (wie lauten die Zufallsvariablen, welche Verteilungsfunktionen werden
angenommen, verwendete Formeln, Zwischenergebnisse, Endergebnis) strukturiert und nachvollziehbar dar! Es
wird empfohlen, die Berechnungen mit R durchzuführen!
Arbeitszeit: 60 Minuten
Beurteilung: Jede Teilaufgabe zählt gleich viel (2P), max. Punktezahl=16
4: (8, 10.5], 3: (10.5, 12.5], 2: (12.5, 14.5], 1: (14.5, 16]
1. Von einer N(µ, σ )-verteilten Zufallsvariablen X liegen folgende Messwerte vor:
13, 18, 21, 12, 14, 26,16, 20, 12, 8.
a. Man beschreibe die Stichprobe mit Hilfe der Statistiken n, Minimum, Maximum, Mittelwert,
Standardabweichung. Ferner bestimme man den Median und erkläre in Worten, was
unter den Kennwerten „Mittelwert“ und „Median“ zu verstehen ist.
b. Man berechne zu dem in a. bestimmten Schätzwert für σ zusätzlich ein 95%Konfidenzintervall für σ. Um wie viel % größer ist die Länge eines 99%igen
Konfidenzintervalls für σ?
c. Man berechne zu dem in a. bestimmten Schätzwert für µ zusätzlich ein 95%Konfidenzintervall für µ. Wie ist das Konfidenzintervall zu interpretieren?
d. Welchen Mindeststichprobenumfang müsste man vorsehen, um die Mittelwertschätzung
mit einer Genauigkeit (d.h. einer halben Breite des Konfidenzintervalls) von ± 1.5 und
einer Sicherheit von 95% erwarten zu können?
2
2. Ein Produkt wird auf einer Anlage nach einem speziellen Fertigungsverfahren hergestellt.
a. Nach einer Störung der Anlage werden in einem Testlauf 100 Produkte hergestellt, von
denen 2 fehlerhaft waren. Man schätze die Wahrscheinlichkeit p, dass ein Produkt
fehlerhaft ist und bestimme für p ein 95%-Konfidenzintervall.
b. Wie groß ist die Wahrscheinlichkeit, dass von 5000 gefertigten Produkten mehr als 4900
fehlerfrei sind, wenn ein gefertigtes Produkt mit der Wahrscheinlichkeit p=2% fehlerhaft
ist.
c. Die gefertigten Produkte werden vom Hersteller in Packungen zu 500 Einheiten
ausgeliefert. Im Rahmen der Eingangskontrolle wird von einem Konsumenten nach
folgendem Plan geprüft: Es werden 10 Einheiten aus der gelieferten Packung zufällig
ausgewählt und auf Fehler überprüft. Ist keine oder nur eine Einheit fehlerhaft, wird die
Packung angenommen, andernfalls zurückgeschickt. Wie groß ist die Wahrscheinlichkeit,
dass bei diesem Prüfplan die Packung angenommen wird, wenn ein gefertigtes Produkt
mit der Wahrscheinlichkeit p=2% fehlerhaft ist.
3. Ein pharmazeutisches Produkt enthält eine Wirksubstanz, deren Masse X (in mg) N(µ, σ )-verteilt
2
ist mit µ=20 und σ =0.36.
a. Wie groß ist die Wahrscheinlichkeit, dass X einen Wert innerhalb des einfachen
Interquartilabstandes um den Mittelwert, also innerhalb des Intervalls (µ-IQR, µ + IQR)
annimmt.
2
ANGEWANDTE STATISTIK I – Prüfungstermin 22.5.2013
Name:
1a.
X<-c(13 ,18 ,21 ,12 ,14 ,26 ,16 ,20 ,12 , 8)
A1<-cbind(length(X),min(X),mean(X),sd(X),max(X))
colnames(A1)<-c("n","min","mean","sd","max")
n min mean
sd
max
10
8
16 5.312
26
> quantile(X, 0.5)
50%
15
Mittelwert: Summe der Messwerte dividiert durch deren Anzahl
Median: mittlerer Wert der nach aufsteigender Größe geordneten Messreihe
1b.
std<-sd(X); n<-length(X)
# 95%-Konfidenzintervall für sigma
alpha1<-0.05
LL_95<-sqrt((n-1)*var(X)/qchisq(1-alpha1/2,n-1))
UL_95<-sqrt((n-1)* var(X)/qchisq(alpha1/2,n-1))
length_95<-UL_95-LL_95
# 99% KOnfidenzintervall für sigma
alpha2<-0.01
LL_99<-sqrt((n-1)* var(X)/qchisq(1-alpha2/2,n-1))
UL_99<-sqrt((n-1)* var(X)/qchisq(alpha2/2,n-1))
length_99<-UL_99-LL_99
A1b<-rbind(c(std,LL_95,UL_95,length_95),c(std,LL_99,UL_99,length_99))
colnames(A1b)<-c("SD","LL","UL","length CI")
row.names(A1b)<-c("95% CI","99% CI")
SD
LL
UL
length CI
95% CI 5.312
3.654
9.698
6.044
99% CI 5.312
3.281
12.099
8.818
prozent<-(length_99-length_95)/length_95 *100
prozent
[1] 45.89
1c.
options(digits=5)
xquer <- mean(X) # Schätzwert für mu
Std <- sd(X) # Schätzwert für sigma
n <- length(X) # Stichprobenumfang
alpha <- 0.05
q <- qt(1-alpha/2, n-1)
SE <- std/sqrt(n); d <- q*SE
ug <- xquer-d; og <- xquer + d
print(cbind(xquer, q, SE, d, ug, og))
xquer
q
SE
d
ug
og
[1,]
16 2.2622 1.6799 3.8003 12.2 19.8
Interpretation von [ug, og]:
Die Grenzen ug und og sind Realisierungen von Zufallsvariablen,
die den (unbekannten) Mittelwert mu mit der vorgegebenen
Wahrscheinlichkeit 1-alpha=95% einschließen.
ANGEWANDTE STATISTIK I – Prüfungstermin 22.5.2013
Name:
1d.
d <- 1.5; sicher <- 0.95
alpha <- 1-sicher
z_quantil <- qnorm(1-alpha/2)
n_mindest <- (z_quantil*std/d)^2
print(cbind(d, sicher, n_mindest))
d
sicher n_mindest
[1,] 1.5
0.95 48.18422
2a.
n <- 100; m <- 2
(pd <- m/n) # Schätzwert
[1] 0.02
# Konfidenzintervall (exakt)
alpha <- 0.05
qu <- qf(alpha/2, 2*m, 2*(n-m+1)); qo <- qf(1-alpha/2, 2*(m+1), 2*(n-m))
pu <- m*qu/(n-m+1+m*qu); po <- (m+1)*qo/(n-m+(m+1)*qo)
print(cbind(alpha, pd, qu, qo, pu, po))
alpha
pd
qu
qo
pu
po
[1,] 0.05 0.02 0.1206 2.473 0.002431 0.07038
2b.
p <- 0.02; n <- 5000
# X = Anzahl der fehlerhaften Einheiten ~ B(n, p)-verteilt
# gesucht: P = P(X <= 99)
(P <- pbinom(99, n, p))
[1] 0.4863
2c.
N<-500; n<-10; a<-0.02*500
phyper(1,a,N-a,n)
[1] 0.9851
# Approximation mit Binomialverteilung (Voraussetzung: n/N<0.1, N>60)
pbinom(1, 10,0.02)
[1] 0.9838
3a.
3a.
mu <- 20; sigma <- sqrt(0.36)
q025 <- qnorm(0.25, mu, sigma); q075 <- qnorm(0.75, mu, sigma)
iqr <- q075-q025; print(cbind(q025, q075, iqr))
q025
q075
IQR
[1,] 19.595 20.405 0.80939
ug<-mu-IQR; og<-mu+IQR
P <-pnorm(og, mu, sigma)-pnorm(ug, mu, sigma) # P=P(ug <= X <= og)
cbind(ug,og,p_innerhalb)
ug
og
P
[1,] 19.191 20.809 0.82266
Herunterladen