BIOENG: Prüfung aus Angewandter Statistik II (WS) MUSTERBEISPIELE 2 MIT LÖSUNGEN AUFGABEN 1. In einer Studie wurde ein Blutparameter am Beginn und am Ende einer Therapie bestimmt. Es ergab sich, dass bei 35 Probanden eine Veränderung des Parameters eintrat, und zwar lag der Wert bei 15 Probanden vorher im Normbereich und nachher außerhalb und bei 20 Probanden vorher außerhalb und nachher im Normbereich. a. Weicht der Anteil der Veränderungen von „vorher außerhalb“ in „nachher innerhalb“ signifikant von 0,5 ab (alpha = 5%)? b. Welcher Anzahl von Probanden mit einer Veränderung müsste man haben, um mit dem Test die beobachtete Abweichung des Anteils von 0,5 mit einer Sicherheit von 90% als signifikant zu erkennen? 2. Im Rahmen einer Untersuchung des Ernährungsstatus von Schulkindern aus den Regionen A und B wurde u.a. das Gesamtcholesterin (in mg/dl) stichprobenartig erfasst. a. Man prüfe für die Region A auf 5%igem Niveau, ob der Anteil von Schulkindern in der optimalen Kategorie signifikant über p0 = 0,5 liegt. b. Welcher Stichprobenumfang müsste geplant werden, um mit dem Binomialtest auf dem Niveau alpha = 5% eine Überschreitung des Referenzwertes p0 = 0,5 um 0,1 mit 80%iger Sicherheit erkennen zu können? Gesamtcholesterin <170 (optimal) >=170 (Risiko) Region A 95 60 Region B 80 50 3. Von einer Messstelle wurden die folgenden Werte der Variablen X (SO2-Konzentration der Luft in mg/m3) gemeldet: 32, 41, 33, 35, 34. a. Weicht die mittlere SO2-Konzentration signifikant vom Wert o=30 ab? (alpha=5%) b. Welcher Mindeststichprobenumfang müsste geplant werden, um mit dem Test eine Abweichung vom Referenzwert o um 5% (des Referenzwertes) mit einer Sicherheit von 95% erkennen zu können? 4. In einer Studie mit 5 Probanden wurde eine bestimmte Zielgröße X am Studienbeginn (Xb) und – nach erfolgter Behandlung - am Studienende (Xe) gemessen. a. Man erfasse die Wirkung der Behandlung durch die Differenz Y= Xe - Xb und prüfe, ob der Mittelwert von Y signifikant von Null abweicht (alpha=5%). b. Welcher Stichprobenumfang müsste geplant werden, um die halbe beobachte Differenz der mittleren Wirkungen mit einer Sicherheit von 90% als signifikant zu erkennen? Proband 1 2 3 4 5 68624141 Xb 67 63 44 27 32 Xe 69 71 46 26 35 1 BIOENG: Prüfung aus Angewandter Statistik II (WS) MUSTERBEISPIELE 2 MIT LÖSUNGEN LÖSUNGEN MIT R Aufgabe 1 (Grundaufgabe 4) Präzisierung der Aufgabe: Wir bezeichnen die Zufallsvariable „Veränderung des Blutparameters auf Grund der Therapie“ mit X. X ist eine zweistufige Zufallsvariable mit den Werten „vorher außerhalb nachher innerhalb“ bzw. „vorher innerhalb nachher außerhalb“. Die Anzahl der Veränderungen von „vorher außerhalb nachher innerhalb“ ist binomialverteilt mit den Parametern p = P(Veränderung von „vorher außerhalb nachher innerhalb“) und n = 35. Lösungsansatz: In der Teilaufgabe a) ist gefragt, ob p von 0,5 abweicht, d.h. es geht um einen Vergleich einer Wahrscheinlichkeit mit einem Sollwert. Die Alternativhypothese lautet H1: p <> 0,5, die Nullhypothese ist H0: p=0,5. Die Testentscheidung wird mit dem Binomialtest auf dem Testniveau alpha=5% durchgeführt. Aus der Stichprobe entnimmt man den Stichprobenumfang n=35 sowie die Anzahl m = 20 der Probanden mit einer Veränderung von „vorher außerhalb nachher innerhalb“. In der Teilaufgabe b) wird nach dem erforderlichen Mindeststichprobenumfang n_mindest (Anzahl der Probanden mit einer Veränderung) gefragt, um mit dem in 1a) durchgeführten Binomialtest die beobachtete Abweichung delta=|20/35-0,5| mit der Sicherheit 1-ß= 0,9 als signifikant zu erkennen. Approximative Bestimmung des Mindeststichprobenumfangs mit der Formel ((Die Formel liefert vertretbare Näherungswerte, wenn n >20 und 10<= np0 < n-10 ist.): nmin dest 1 z1 / 2 z1 2 2 4 Rechnerische Lösung: > # 1a > n <- 35 > m <- 20 > alpha <- 0.05 > soll=0.5 > # H0: p=0.5 versus H1: p<>0.5 > binom.test(m, n, p=soll, alternative="two.sided", conf.level=0.95) Exact binomial test data: m and n number of successes = 20, number of trials = 35, p-value = 0.4996 alternative hypothesis: true probability of success is not equal to 0.5 95 percent confidence interval: 0.3935309 0.7367728 sample estimates: probability of success 0.5714286 Ergebnis: Wegen p-value = 0.4996 >= 0.05 kann H0: p=0.5 nicht abgelehnt werden! > # 1b (Approximation) > delta <- abs(m/n-0.5) > power <- 0.9 > alpha <- 0.05 > n_mindest <- 1/4/delta^2*(qnorm(1-alpha/2)+qnorm(power))^2 > options(digits=4) 68624141 2 BIOENG: Prüfung aus Angewandter Statistik II (WS) MUSTERBEISPIELE 2 MIT LÖSUNGEN > print(cbind(delta, alpha, power, n_mindest)) delta alpha power n_mindest [1,] 0.07143 0.05 0.9 514.9 Ergebnis: Es ist ein Mindeststichprobenumfang von n_mindest=515 erforderlich, um mit dem auf 5%igen Signifikanzniveau geführten Test die Abweichung delta=0.07143 vom Sollwert 0.5 mit einer Sicherheit von 90% als signifikant zu erkennen. Aufgabe 2 (Grundaufgabe 4) Präzisierung der Aufgabe: Wir bezeichnen die Zufallsvariable „Gesamtcholesterin“ mit X. X ist auf einer zweistufigen Skala mit den Werten „<170 (optimal)“ bzw. „>=170 (Risiko)“ dargestellt. Die Anzahl der Schulkinder mit einem optimalen X-Wert ist binomialverteilt mit den Parametern p = P(ein Schulkind in Region A hat einen optimalen X-Wert) und n = 95+60 = 155 (Region A). Lösungsansatz: In der Teilaufgabe a) ist gefragt, ob p größer als 0,5 ist; die Alternativhypothese lautet also H1: p>0,5; die Nullhypothese ist H0: p<=0,5. Die Testentscheidung wird mit dem Binomialtest auf dem Testniveau alpha=5% durchgeführt. Aus der Stichprobe entnimmt man den Stichprobenumfang n=155 (Region A) sowie die Anzahl m = 95 der Schulkinder mit einem optimalen Cholesterinwert. In der Teilaufgabe b) wird nach dem erforderlichen Mindeststichprobenumfang n_mindest (Anzahl der Schulkinder) gefragt, um mit dem in 2a) durchgeführten Binomialtest die Überschreitung delta=0,1 des Sollwertes p0=0,5 mit der Sicherheit 1-ß= 0,8 als signifikant zu erkennen. Die Bestimmung des Mindeststichprobenumfangs erfolgt näherungsweise mit der Formel (Die Formel liefert vertretbare Näherungswerte, wenn n >20 und 10<= np0 < n-10 ist.): nmin dest 1 z1 z1 2 2 4 Rechnerische Lösung: > # Aufgabe 2a > m <- 95 > n <- 95+60 > alpha <- 0.05 > soll=0.5 > # H0: p<=0.5 versus H1: p>0.5 > binom.test(m, n, p=soll, alternative="greater", conf.level=0.95) Exact binomial test data: m and n number of successes = 95, number of trials = 155, p-value = 0.003066 alternative hypothesis: true probability of success is greater than 0.5 95 percent confidence interval: 0.5440993 1.0000000 sample estimates: probability of success 0.6129032 Ergebnis: Wegen p-value = 0.003066 <0.05 wird H0: p<=0.5 abgelehnt, d.h. der Anteil der Schulkinder mit einem optimalen Cholesterinwert liegt auf 5%igem Testniveau signifikant über 0,5. 68624141 3 BIOENG: Prüfung aus Angewandter Statistik II (WS) MUSTERBEISPIELE 2 MIT LÖSUNGEN > # Aufgabe 2b (Approximation) > delta <- 0.1 > power <- 0.9 > alpha <- 0.05 > n_mindest <- 1/4/delta^2*(qnorm(1-alpha)+qnorm(power))^2 > options(digits=4) > print(cbind(delta, alpha, power, n_mindest)) delta alpha power n_mindest [1,] 0.1 0.05 0.9 214.1 Ergebnis: Es ist ein Mindeststichprobenumfang von n_mindest=215 erforderlich, um mit dem auf 5%igen Signifikanzniveau geführten Binomialtest die Überschreitung delta=0.1 des Sollwertes p0=0.5 mit einer Sicherheit von 80% als signifikant zu erkennen. Aufgabe 3 (Grundaufgabe 5) Präzisierung der Aufgabe: Wir nehmen an, dass X normalverteilt ist mit dem Mittelwert und der Varianz 2. Lösungsansatz: In der Teilaufgabe a) ist gefragt, ob von 0=30 abweicht, d.h. es geht um den Vergleich eines Mittelwerts mit einem Sollwert. Die Alternativhypothese lautet H1: <> 30, die Nullhypothese ist H0: =30. Die Testentscheidung wird mit dem 1-Stichproben-t -Test auf dem Testniveau alpha=5% durchgeführt. Aus der Stichprobe entnimmt man den Stichprobenumfang n sowie die Schätzwerte für und . In der Teilaufgabe b) wird nach dem erforderlichen Mindeststichprobenumfang n_mindest (Anzahl der Messwiederholungen) gefragt, um mit dem in 3a) durchgeführten t-Test die Abweichung delta=1,5 (5% von 0) vom Sollwert 0 mit der Sicherheit 1-ß= 0,95 als signifikant zu erkennen. Die Bestimmung des Mindeststichprobenumfangs erfolgt (näherungsweise) mit der Formel nmin dest 2 2 z 1 / 2 z1 2 oder einfacher mit der R-Prozedur power.t.test(). Rechnerische Lösung: > # Aufgabe 3a > so2 <- c(32, 41, 33, 35, 34) > n <- length(so2) > xquer <- mean(so2) > s <- sd(so2) > options(digits=4) > print(cbind(n, xquer, s)) n xquer s [1,] 5 35 3.536 > t.test(so2, alternative="two.sided", mu=30, conf.level=0.95) One Sample t-test data: so2 t = 3.162, df = 4, p-value = 0.03411 alternative hypothesis: true mean is not equal to 30 95 percent confidence interval: 30.61 39.39 68624141 4 BIOENG: Prüfung aus Angewandter Statistik II (WS) MUSTERBEISPIELE 2 MIT LÖSUNGEN sample estimates: mean of x 35 Ergebnis: Wegen p-value = 0.03411 <0.05 wird H0: <>30 abgelehnt, d.h. die mittlere SO2-Konzentration weicht auf 5%igem Testniveau signifikant vom Sollwert 30 ab. > # Aufgabe 3b > so2=c(32, 41, 33, 35, 34) > s <- sd(so2) > soll <- 30 > delta <- 0.05*soll > print(cbind(soll, delta, s)) soll delta s [1,] 30 1.5 3.536 > power.t.test(delta=delta, sd=s, sig.level=0.05, power=0.95, + type ="one.sample", alternative="two.sided") One-sample t test power calculation n = 74.14 delta = 1.5 sd = 3.536 sig.level = 0.05 power = 0.95 alternative = two.sided Ergebnis: Es ist ein Mindeststichprobenumfang von n_mindest=75 erforderlich, um mit dem auf 5%igen Signifikanzniveau geführten t-Test die Abweichung delta=1,5 vom Sollwert 30 mit einer Sicherheit von 95% als signifikant zu erkennen. Aufgabe 4 (Grundaufgabe 5) Präzisierung der Aufgabe: Wir nehmen an, dass die Wirkung Y=Xe – Xb normalverteilt ist mit dem Mittelwert und der Varianz 2. Lösungsansatz: In der Teilaufgabe a) ist gefragt, ob von 0=0 abweicht, d.h. es geht um den Vergleich eines Mittelwerts mit einem Sollwert. Die Alternativhypothese lautet H1: <>0, die Nullhypothese ist H0: =0. Die Testentscheidung wird mit dem 1-Stichproben-t -Test auf dem Testniveau alpha=5% durchgeführt. Aus der Stichprobe entnimmt man den Stichprobenumfang n sowie die Schätzwerte yquer und s für bzw . In der Teilaufgabe b) wird nach dem erforderlichen Mindeststichprobenumfang n_mindest (Anzahl der Messwiederholungen) gefragt, um mit dem in 3a) durchgeführten t-Test die halbe beobachtete Abweichung des Stichprobenmittelwerts yqer vom Sollwert 0 mit der Sicherheit 1-ß= 0,90 als signifikant zu erkennen. Die Bestimmung des Mindeststichprobenumfangs erfolgt mit der R-Prozedur power.t.test(). Rechnerische Lösung: > # Aufgabe 4a > xb <- c(67, 63, 44, 27, 32) 68624141 5 BIOENG: Prüfung aus Angewandter Statistik II (WS) MUSTERBEISPIELE 2 MIT LÖSUNGEN > xe <- c(69, 71, 46, 26, 35) > y <- xe - xb > print(cbind(xb, xe, y)) xb xe y [1,] 67 69 2 [2,] 63 71 8 [3,] 44 46 2 [4,] 27 26 -1 [5,] 32 35 3 > n <- length(y) > yquer <- mean(y) > s <- sd(y) > options(digits=4) > print(cbind(n, yquer, s)) n yquer s [1,] 5 2.8 3.271 > t.test(y, alternative="two.sided", mu=0, conf.level=0.95) One Sample t-test data: y t = 1.914, df = 4, p-value = 0.1281 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: -1.262 6.862 sample estimates: mean of x 2.8 Ergebnis: Wegen p-value = 0.1281>=0.05 kann H0: <>0 nicht abgelehnt werden, d.h. die mittlere Wirkung weicht auf 5%igem Testniveau nicht signifikant vom Sollwert 0 ab. > # Aufgabe 4b > xb <- c(67, 63, 44, 27, 32) > xe <- c(69, 71, 46, 26, 35) > y <- xe - xb > soll <- 0 > s <- sd(y) > delta <- abs(mean(y)/2- soll) > print(cbind(soll, delta)) soll delta [1,] 0 1.4 > options(digits=4) > power.t.test(delta=delta, sd=s, sig.level=0.05, power=0.90, + type ="one.sample", alternative="two.sided") One-sample t test power calculation n = 59.32 delta = 1.4 sd = 3.271 sig.level = 0.05 power = 0.9 alternative = two.sided 68624141 6 BIOENG: Prüfung aus Angewandter Statistik II (WS) MUSTERBEISPIELE 2 MIT LÖSUNGEN Ergebnis: Es ist ein Mindeststichprobenumfang von n_mindest=60 erforderlich, um mit dem auf 5%igen Signifikanzniveau geführten t-Test die halbe beobachtete Abweichung delta=1,4 der mittleren Wirkung vom Sollwert 0 mit einer Sicherheit von 90% als signifikant zu erkennen. 68624141 7