lösungen mit r

Werbung
BIOENG: Prüfung aus Angewandter Statistik II (WS)
MUSTERBEISPIELE 2 MIT LÖSUNGEN
AUFGABEN
1. In einer Studie wurde ein Blutparameter am Beginn und am Ende einer Therapie bestimmt. Es
ergab sich, dass bei 35 Probanden eine Veränderung des Parameters eintrat, und zwar lag der
Wert bei 15 Probanden vorher im Normbereich und nachher außerhalb und bei 20 Probanden
vorher außerhalb und nachher im Normbereich.
a. Weicht der Anteil der Veränderungen von „vorher außerhalb“ in „nachher innerhalb“ signifikant
von 0,5 ab (alpha = 5%)?
b. Welcher Anzahl von Probanden mit einer Veränderung müsste man haben, um mit dem Test
die beobachtete Abweichung des Anteils von 0,5 mit einer Sicherheit von 90% als signifikant
zu erkennen?
2. Im Rahmen einer Untersuchung des Ernährungsstatus von Schulkindern aus den Regionen A
und B wurde u.a. das Gesamtcholesterin (in mg/dl) stichprobenartig erfasst.
a. Man prüfe für die Region A auf 5%igem Niveau, ob der Anteil von Schulkindern in der
optimalen Kategorie signifikant über p0 = 0,5 liegt.
b. Welcher Stichprobenumfang müsste geplant werden, um mit dem Binomialtest auf dem
Niveau alpha = 5% eine Überschreitung des Referenzwertes p0 = 0,5 um 0,1 mit 80%iger
Sicherheit erkennen zu können?
Gesamtcholesterin
<170 (optimal)
>=170 (Risiko)
Region A
95
60
Region B
80
50
3. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2-Konzentration der Luft in
mg/m3) gemeldet: 32, 41, 33, 35, 34.
a. Weicht die mittlere SO2-Konzentration signifikant vom Wert o=30 ab? (alpha=5%)
b. Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine
Abweichung vom Referenzwert o um 5% (des Referenzwertes) mit einer Sicherheit von 95%
erkennen zu können?
4. In einer Studie mit 5 Probanden wurde eine bestimmte Zielgröße X am Studienbeginn (Xb) und –
nach erfolgter Behandlung - am Studienende (Xe) gemessen.
a. Man erfasse die Wirkung der Behandlung durch die Differenz Y= Xe - Xb und prüfe, ob der
Mittelwert von Y signifikant von Null abweicht (alpha=5%).
b. Welcher Stichprobenumfang müsste geplant werden, um die halbe beobachte Differenz der
mittleren Wirkungen mit einer Sicherheit von 90% als signifikant zu erkennen?
Proband
1
2
3
4
5
68624141
Xb
67
63
44
27
32
Xe
69
71
46
26
35
1
BIOENG: Prüfung aus Angewandter Statistik II (WS)
MUSTERBEISPIELE 2 MIT LÖSUNGEN
LÖSUNGEN MIT R
Aufgabe 1 (Grundaufgabe 4)
Präzisierung der Aufgabe:
Wir bezeichnen die Zufallsvariable „Veränderung des Blutparameters auf Grund der Therapie“ mit X.
X ist eine zweistufige Zufallsvariable mit den Werten „vorher außerhalb nachher innerhalb“ bzw.
„vorher innerhalb  nachher außerhalb“. Die Anzahl der Veränderungen von „vorher außerhalb
nachher innerhalb“ ist binomialverteilt mit den Parametern p = P(Veränderung von „vorher
außerhalb nachher innerhalb“) und n = 35.
Lösungsansatz:
In der Teilaufgabe a) ist gefragt, ob p von 0,5 abweicht, d.h. es geht um einen Vergleich einer
Wahrscheinlichkeit mit einem Sollwert. Die Alternativhypothese lautet H1: p <> 0,5, die
Nullhypothese ist H0: p=0,5. Die Testentscheidung wird mit dem Binomialtest auf dem Testniveau
alpha=5% durchgeführt. Aus der Stichprobe entnimmt man den Stichprobenumfang n=35 sowie die
Anzahl m = 20 der Probanden mit einer Veränderung von „vorher außerhalb nachher innerhalb“.
In der Teilaufgabe b) wird nach dem erforderlichen Mindeststichprobenumfang n_mindest (Anzahl der
Probanden mit einer Veränderung) gefragt, um mit dem in 1a) durchgeführten Binomialtest die
beobachtete Abweichung delta=|20/35-0,5| mit der Sicherheit 1-ß= 0,9 als signifikant zu erkennen.
Approximative Bestimmung des Mindeststichprobenumfangs mit der Formel ((Die Formel liefert
vertretbare Näherungswerte, wenn n >20 und 10<= np0 < n-10 ist.):
nmin dest 
1
z1 / 2  z1 2
2
4
Rechnerische Lösung:
> # 1a
> n <- 35
> m <- 20
> alpha <- 0.05
> soll=0.5
> # H0: p=0.5 versus H1: p<>0.5
> binom.test(m, n, p=soll, alternative="two.sided", conf.level=0.95)
Exact binomial test
data: m and n
number of successes = 20, number of trials = 35, p-value = 0.4996
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.3935309 0.7367728
sample estimates:
probability of success
0.5714286
Ergebnis:
Wegen p-value = 0.4996 >= 0.05 kann H0: p=0.5 nicht abgelehnt werden!
> # 1b (Approximation)
> delta <- abs(m/n-0.5)
> power <- 0.9
> alpha <- 0.05
> n_mindest <- 1/4/delta^2*(qnorm(1-alpha/2)+qnorm(power))^2
> options(digits=4)
68624141
2
BIOENG: Prüfung aus Angewandter Statistik II (WS)
MUSTERBEISPIELE 2 MIT LÖSUNGEN
> print(cbind(delta, alpha, power, n_mindest))
delta alpha power n_mindest
[1,] 0.07143 0.05 0.9 514.9
Ergebnis:
Es ist ein Mindeststichprobenumfang von n_mindest=515 erforderlich, um mit dem auf 5%igen
Signifikanzniveau geführten Test die Abweichung delta=0.07143 vom Sollwert 0.5 mit einer
Sicherheit von 90% als signifikant zu erkennen.
Aufgabe 2 (Grundaufgabe 4)
Präzisierung der Aufgabe:
Wir bezeichnen die Zufallsvariable „Gesamtcholesterin“ mit X. X ist auf einer zweistufigen Skala mit
den Werten „<170 (optimal)“ bzw. „>=170 (Risiko)“ dargestellt. Die Anzahl der Schulkinder mit
einem optimalen X-Wert ist binomialverteilt mit den Parametern p = P(ein Schulkind in Region A hat
einen optimalen X-Wert) und n = 95+60 = 155 (Region A).
Lösungsansatz:
In der Teilaufgabe a) ist gefragt, ob p größer als 0,5 ist; die Alternativhypothese lautet also H1: p>0,5;
die Nullhypothese ist H0: p<=0,5. Die Testentscheidung wird mit dem Binomialtest auf dem
Testniveau alpha=5% durchgeführt. Aus der Stichprobe entnimmt man den Stichprobenumfang n=155
(Region A) sowie die Anzahl m = 95 der Schulkinder mit einem optimalen Cholesterinwert.
In der Teilaufgabe b) wird nach dem erforderlichen Mindeststichprobenumfang n_mindest (Anzahl der
Schulkinder) gefragt, um mit dem in 2a) durchgeführten Binomialtest die Überschreitung delta=0,1
des Sollwertes p0=0,5 mit der Sicherheit 1-ß= 0,8 als signifikant zu erkennen. Die Bestimmung des
Mindeststichprobenumfangs erfolgt näherungsweise mit der Formel (Die Formel liefert vertretbare
Näherungswerte, wenn n >20 und 10<= np0 < n-10 ist.):
nmin dest 
1
z1  z1 2
2
4
Rechnerische Lösung:
> # Aufgabe 2a
> m <- 95
> n <- 95+60
> alpha <- 0.05
> soll=0.5
> # H0: p<=0.5 versus H1: p>0.5
> binom.test(m, n, p=soll, alternative="greater", conf.level=0.95)
Exact binomial test
data: m and n
number of successes = 95, number of trials = 155, p-value = 0.003066
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
0.5440993 1.0000000
sample estimates:
probability of success
0.6129032
Ergebnis:
Wegen p-value = 0.003066 <0.05 wird H0: p<=0.5 abgelehnt, d.h. der Anteil der Schulkinder mit
einem optimalen Cholesterinwert liegt auf 5%igem Testniveau signifikant über 0,5.
68624141
3
BIOENG: Prüfung aus Angewandter Statistik II (WS)
MUSTERBEISPIELE 2 MIT LÖSUNGEN
> # Aufgabe 2b (Approximation)
> delta <- 0.1
> power <- 0.9
> alpha <- 0.05
> n_mindest <- 1/4/delta^2*(qnorm(1-alpha)+qnorm(power))^2
> options(digits=4)
> print(cbind(delta, alpha, power, n_mindest))
delta alpha power n_mindest
[1,] 0.1 0.05 0.9 214.1
Ergebnis:
Es ist ein Mindeststichprobenumfang von n_mindest=215 erforderlich, um mit dem auf 5%igen
Signifikanzniveau geführten Binomialtest die Überschreitung delta=0.1 des Sollwertes p0=0.5 mit
einer Sicherheit von 80% als signifikant zu erkennen.
Aufgabe 3 (Grundaufgabe 5)
Präzisierung der Aufgabe:
Wir nehmen an, dass X normalverteilt ist mit dem Mittelwert  und der Varianz 2.
Lösungsansatz:
In der Teilaufgabe a) ist gefragt, ob  von 0=30 abweicht, d.h. es geht um den Vergleich eines
Mittelwerts mit einem Sollwert. Die Alternativhypothese lautet H1:  <> 30, die Nullhypothese ist
H0:  =30. Die Testentscheidung wird mit dem 1-Stichproben-t -Test auf dem Testniveau alpha=5%
durchgeführt. Aus der Stichprobe entnimmt man den Stichprobenumfang n sowie die Schätzwerte für
 und .
In der Teilaufgabe b) wird nach dem erforderlichen Mindeststichprobenumfang n_mindest (Anzahl der
Messwiederholungen) gefragt, um mit dem in 3a) durchgeführten t-Test die Abweichung delta=1,5
(5% von 0) vom Sollwert 0 mit der Sicherheit 1-ß= 0,95 als signifikant zu erkennen. Die
Bestimmung des Mindeststichprobenumfangs erfolgt (näherungsweise) mit der Formel
nmin dest 
2

2
z
1 / 2
 z1  
2
oder einfacher mit der R-Prozedur power.t.test().
Rechnerische Lösung:
> # Aufgabe 3a
> so2 <- c(32, 41, 33, 35, 34)
> n <- length(so2)
> xquer <- mean(so2)
> s <- sd(so2)
> options(digits=4)
> print(cbind(n, xquer, s))
n xquer s
[1,] 5 35 3.536
> t.test(so2, alternative="two.sided", mu=30, conf.level=0.95)
One Sample t-test
data: so2
t = 3.162, df = 4, p-value = 0.03411
alternative hypothesis: true mean is not equal to 30
95 percent confidence interval:
30.61 39.39
68624141
4
BIOENG: Prüfung aus Angewandter Statistik II (WS)
MUSTERBEISPIELE 2 MIT LÖSUNGEN
sample estimates:
mean of x
35
Ergebnis:
Wegen p-value = 0.03411 <0.05 wird H0: <>30 abgelehnt, d.h. die mittlere SO2-Konzentration
weicht auf 5%igem Testniveau signifikant vom Sollwert 30 ab.
> # Aufgabe 3b
> so2=c(32, 41, 33, 35, 34)
> s <- sd(so2)
> soll <- 30
> delta <- 0.05*soll
> print(cbind(soll, delta, s))
soll delta s
[1,] 30 1.5 3.536
> power.t.test(delta=delta, sd=s, sig.level=0.05, power=0.95,
+ type ="one.sample", alternative="two.sided")
One-sample t test power calculation
n = 74.14
delta = 1.5
sd = 3.536
sig.level = 0.05
power = 0.95
alternative = two.sided
Ergebnis:
Es ist ein Mindeststichprobenumfang von n_mindest=75 erforderlich, um mit dem auf 5%igen
Signifikanzniveau geführten t-Test die Abweichung delta=1,5 vom Sollwert 30 mit einer Sicherheit
von 95% als signifikant zu erkennen.
Aufgabe 4 (Grundaufgabe 5)
Präzisierung der Aufgabe:
Wir nehmen an, dass die Wirkung Y=Xe – Xb normalverteilt ist mit dem Mittelwert  und der
Varianz 2.
Lösungsansatz:
In der Teilaufgabe a) ist gefragt, ob  von 0=0 abweicht, d.h. es geht um den Vergleich eines
Mittelwerts mit einem Sollwert. Die Alternativhypothese lautet H1: <>0, die Nullhypothese ist H0:
=0. Die Testentscheidung wird mit dem 1-Stichproben-t -Test auf dem Testniveau alpha=5%
durchgeführt. Aus der Stichprobe entnimmt man den Stichprobenumfang n sowie die Schätzwerte
yquer und s für  bzw .
In der Teilaufgabe b) wird nach dem erforderlichen Mindeststichprobenumfang n_mindest (Anzahl der
Messwiederholungen) gefragt, um mit dem in 3a) durchgeführten t-Test die halbe beobachtete
Abweichung des Stichprobenmittelwerts yqer vom Sollwert 0 mit der Sicherheit 1-ß= 0,90 als
signifikant zu erkennen. Die Bestimmung des Mindeststichprobenumfangs erfolgt mit der R-Prozedur
power.t.test().
Rechnerische Lösung:
> # Aufgabe 4a
> xb <- c(67, 63, 44, 27, 32)
68624141
5
BIOENG: Prüfung aus Angewandter Statistik II (WS)
MUSTERBEISPIELE 2 MIT LÖSUNGEN
> xe <- c(69, 71, 46, 26, 35)
> y <- xe - xb
> print(cbind(xb, xe, y))
xb xe y
[1,] 67 69 2
[2,] 63 71 8
[3,] 44 46 2
[4,] 27 26 -1
[5,] 32 35 3
> n <- length(y)
> yquer <- mean(y)
> s <- sd(y)
> options(digits=4)
> print(cbind(n, yquer, s))
n yquer s
[1,] 5 2.8 3.271
> t.test(y, alternative="two.sided", mu=0, conf.level=0.95)
One Sample t-test
data: y
t = 1.914, df = 4, p-value = 0.1281
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
-1.262 6.862
sample estimates:
mean of x
2.8
Ergebnis:
Wegen p-value = 0.1281>=0.05 kann H0: <>0 nicht abgelehnt werden, d.h. die mittlere Wirkung
weicht auf 5%igem Testniveau nicht signifikant vom Sollwert 0 ab.
> # Aufgabe 4b
> xb <- c(67, 63, 44, 27, 32)
> xe <- c(69, 71, 46, 26, 35)
> y <- xe - xb
> soll <- 0
> s <- sd(y)
> delta <- abs(mean(y)/2- soll)
> print(cbind(soll, delta))
soll delta
[1,] 0 1.4
> options(digits=4)
> power.t.test(delta=delta, sd=s, sig.level=0.05, power=0.90,
+ type ="one.sample", alternative="two.sided")
One-sample t test power calculation
n = 59.32
delta = 1.4
sd = 3.271
sig.level = 0.05
power = 0.9
alternative = two.sided
68624141
6
BIOENG: Prüfung aus Angewandter Statistik II (WS)
MUSTERBEISPIELE 2 MIT LÖSUNGEN
Ergebnis:
Es ist ein Mindeststichprobenumfang von n_mindest=60 erforderlich, um mit dem auf 5%igen
Signifikanzniveau geführten t-Test die halbe beobachtete Abweichung delta=1,4 der mittleren
Wirkung vom Sollwert 0 mit einer Sicherheit von 90% als signifikant zu erkennen.
68624141
7
Herunterladen