Klausur zur Vorlesung „Biomathematik“ WS 2003/04 Mittwoch, den 11. Februar 2004 ___________________________________________________________________________ 1: Induktive Statistik (1) Welche Aussage ist richtig? A. B. C. D. E. Je kleiner der ß-Fehler, desto geringer ist die Power eines Tests. Falsch. Die Power ist 1 - ß . Das heißt: Je kleiner der ß-Fehler, desto größer ist die Power und umgekehrt. Der ß-Fehler ist vom α-Fehler abhängig: Je kleiner der α-Fehler festgelegt wird, desto größer wird der ß-Fehler und umgekehrt. Richtig. Der ß-Fehler ist unabhängig vom Stichprobenumfang. Falsch. Den ß-Fehler kann man durch den Stichprobenumfang sehr wohl beeinflusse. Je größer dieser ist, umso geringer ist der ß-Fehler. Wenn der p-Wert kleiner ist als ein zuvor festgelegtes a, wird die Nullhypothese beibehalten. Falsch. Wenn p < a , nimmt man die Alternativhypothese an. Der p-Wert quantifiziert die exakte Größe des α-Fehlers. Ein a-Fehler wird gemacht, wenn man fälschlicherweise die Nullhypothese beibehält. Falsch. Das ist ein ß-Fehler oder Fehler 2. Art. Den α-Fehler macht man, wenn man fälschlicherweise die Alternativhypothese annimmt. 2: Induktive Statistik (2) In einer Studie wurde die Wirksamkeit von Johanniskraut gegen ein klassisches Antidepressivum (Maprotilin) mit Referenzstatus geprüft. Die Patienten wurden 4 Wochen lang behandelt; im Vorfeld wurde definiert, unter welchen Voraussetzungen die Behandlung als erfolgreich eingestuft werden kann. Von 44 Patienten, die mit Johanniskraut behandelt wurden, zeigte sich bei 27 ein Erfolg (61 %). Mit Maprotilin wurden 42 Patienten behandelt, davon 28 erfolgreich (67 %). Mit dem Chi2-Vierfeldertest erhält man die Prüfgröße c 2 = 0, 2621 und den p-Wert p = 0, 6087 . Getestet wurde auf dem Niveau a = 5% . Wie ist das Testergebnis zu interpretieren? A. B. C. Der p-Wert quantifiziert die Erfolgsrate der Therapie mit Referenzstatus. Falsch. Der p-Wert quantifiziert die Irrtumswahrscheinlichkeit, dass das Testergebnis unter der Nullhypothese zustande kommt. Wenn der p-Wert klein ist (genauer: wenn p < a ), ist das Testergebnis schwer mit der Nullhypothese zu vereinbaren. Deshalb nimmt man die Alternativhypothese an. Die mit Maprotilin behandelten Patienten weisen eine signifikant höhere Erfolgsrate auf als die mit Johanniskraut behandelten. Falsch. Der Unterschied ist nicht signifikant, da p > a ( 0,6087 > 0,05 ) Die beiden Therapien sind äquivalent. Falsch. Man kann zwar keinen Unterschied zwischen den beiden Therapien nachweisen. Das bedeutet aber nicht unbedingt, dass die Therapien äquivalent sind. 1 D. E. Mit 60,87%-iger Wahrscheinlichkeit unterscheiden sich die Therapien; über die Richtung des Unterschieds besagt das Testergebnis allerdings nichts. Falsch. Ein Unterschied lässt sich nicht nachweisen, und der p-Wert hat eine gänzlich andere Bedeutung (siehe unter Antwort A). Keine der Aussagen (A) bis (D) kann geschlussfolgert werden. Richtig! 3: Induktive Statistik (3) Ein Medikament A steht unter Verdacht, Leberschäden zu verursachen. Im Rahmen einer klinischen Studie werden 10 Patienten mit Therapie A und 9 Patienten mit Therapie B behandelt. Der Versuch wird randomisiert und doppelblind geplant. Bei jedem Patient wird das Ferment γ-GT im Serum als Zielgröße gemessen. Die Verteilung dieses Merkmals ist unbekannt. Welcher statistische Test erscheint Ihnen am besten geeignet? A. B. C. D. E. Der t-Test für 2 unverbundene Stichproben ist immer besser geeignet, weil er eine höhere Power hat. Falsch. Die höhere Power ist nicht allein ausschlaggebend; man sollte auch darauf achten, dass die Voraussetzungen annähernd erfüllt sind. Man sollte den U-Test anstelle des t-Tests verwenden, weil dessen Voraussetzungen eher erfüllt sind. Richtig. Bei einem großen Stichprobenumfang ist der t-Test robust gegenüber Verletzungen von seinen Voraussetzungen. Da aber hier kleine Stichprobenumfänge vorliegen und die Voraussetzungen des t-Tests nicht überprüft werden können (die Verteilung des Merkmals ist unbekannt – wie sollte man die Normalverteilung nachweisen?), sollte man den U-Test nehmen. Beide Tests sind gleichermaßen geeignet. Falsch. Der U-Test ist in diesem Fall besser geeignet; siehe Antworten A und B. Man sollte mit einem Anpassungstest die Normalverteilung in beiden Stichproben überprüfen. Falls dieser Test zur Beibehaltung der Nullhypothese führt, sollte man den t-Test verwenden. Falsch. Das wird zwar häufig so gemacht; aber eigentlich ist diese Vorgehensweise nicht sinnvoll. Bei einem kleinen Stichprobenumfang wird der Anpassungstest immer zur Beibehaltung der Nullhypothese führen. Damit ist die Normalverteilung keineswegs nachgewiesen; es kann nur nicht das Gegenteil nachgewiesen werden. Keiner der beiden Tests ist geeignet, da die Stichprobenumfänge der beiden Gruppen ungleich sind. Falsch. Die Stichprobenumfänge brauchen – weder beim t-Test noch beim U-Test – exakt gleich zu sein. 4: Wahrscheinlichkeitsrechnung (1) Bei einer Therapie betrage das Risiko einer schwerwiegenden Nebenwirkung im Einzelfall 10%. Es werden 50 Patienten behandelt. X sei die Anzahl der Patienten, bei denen diese Nebenwirkung auftritt. Welche der folgenden Aussagen ist falsch? A. Die Wahrscheinlichkeit, dass bei maximal 3 Patienten die Nebenwirkung auftritt, ist 2 B. C. D. E. æ 50 ö P( X = 3) = çç ÷÷ × 0,103 × 0,90 47 » 0,139 è3ø Falsch. Dies ist die Wahrscheinlichkeit, dass genau 3 Patienten eine Nebenwirkung zeigen. Die Wahrscheinlichkeit für maximal drei Patienten ist: 3 æ 50 ö P( X £ 3) = å ç ÷ × 0,10k × 0,9050 - k » 0, 251 k =0 è k ø Die Wahrscheinlichkeit, dass bei keinem einzigen Patienten die Nebenwirkung auftritt, ist P( X = 0) = 0,90 50 » 0,005 . Richtig. Dies kann man sich ganz einfach mit dem Multiplikationssatz ausrechnen, wenn man zugrunde legt, dass die Nebenwirkung bei den einzelnen Patienten unabhängig auftritt. Der Binomialkoeffizient in Antwort A beträgt 19.600 und quantifiziert die Anzahl der Möglichkeiten, von 50 Patienten genau 3 auszuwählen. æ 50 ö 50 × 49 × 48 = 19.600 Richtig. ç ÷ = 1× 2 × 3 è3ø Theoretisch gilt für jede natürliche Zahl k zwischen 0 und 50 (Grenzen eingeschlossen): P ( X = k ) > 0 Richtig. Die Wahrscheinlichkeiten sind zwar unterschiedlich und teilweise sehr klein; aber sie sind alle größer als 0. Der Erwartungswert von X beträgt 5; die Varianz ist 50 × 0,90 × 0,10 = 4,5 . Richtig. Bei einer Binomialverteilung ist der Erwartungswert m = n × p = 50 × 0,1 = 5 und die Varianz s 2 = n × p × q = 50 × 0,1 × 0,9 = 4,5 5: Deskriptive Statistik (1) Zur Datenerfassung und -analyse quantitativer Daten ist es manchmal zweckmäßig, bei jedem Stichprobenwert eine konstante Zahl a zu subtrahieren (z. B. bei der Körperlänge von Erwachsenen a = 100 cm ). Die ursprünglichen Daten haben den Mittelwert x und die Standardabweichung s. Wie ändern sich x und s , wenn bei jedem Messwert a subtrahiert wird? A. Beide Kenngrößen bleiben unverändert. Falsch. Anhand der bekannten Formeln leitet man für die Werte xi - a einfach her: Mittelwert: n å(x i i =1 Varianz: B. C. D. n - a ) / n =å xi / n - na / n = x - a i =1 n n i =1 i =1 å (( xi - a ) - ( x - a ))2 /(n - 1) =å ( xi - a )2 /(n - 1) = s 2 Die Variabilität der Daten ändert sich durch die Transformation nicht; also bleiben die Varianz (und damit auch die Standardabweichung) die selbe. x → x -a , s → s-a Falsch. Siehe Antwort A. x → x -a, s → a×s Falsch. Siehe Antwort A. Dass diese Aussage falsch sein muss, wird deutlich, wenn man a = 0 setzt. Dann würde die Standardabweichung s = 0 resultieren – und das kann nicht stimmen, da die Standardabweichung der Originaldaten s beträgt. x → x -a, s → a ×s Falsch. Siehe unter Antworten A und C. 3 E. x → x - a , s ändert sich nicht Richtig. Siehe Antwort A. 6: Induktive Statistik (4) Basierend auf der t-Verteilung wird aus den Daten einer Stichprobe ein 2-seitiges Konfidenzintervall für den Erwartungswert mit a = 5% berechnet. Welche Aussage ist falsch? A. B. C. D. E. Der Mittelwert liegt genau in der Mitte des Intervalls. Richtig. Das geht aus der Formel für das Intervall hervor: x ± tn -1;1-a / 2 × s / n . Bei kleinerer Irrtumswahrscheinlichkeit wird das Intervall schmaler. Falsch. Wenn die Irrtumswahrscheinlichkeit sehr klein sein soll, wird das Intervall größer. Man kann das leicht nachvollziehen: Ein Intervall, bei dem man mit 99%-iger Sicherheit (1 % Irrtumswahrscheinlichkeit) annehmen kann, dass es den Erwartungswert enthält, muss breiter sein als ein Intervall, bei dem 5 % Irrtumswahrscheinlichkeit zugrunde liegt. Mit 4-fachem Stichprobenumfang halbiert sich die Breite des Intervalls. Richtig. Die Breite ist (siehe Formel in A) 2tn -1;1-a / 2 × s / n . Wenn n durch 4n ersetzt wird, halbiert sich die Breite (wegen n im Nenner). Eine geringe Streuung der Daten trägt dazu bei, dass das Intervall schmal wird. Richtig. Bei geringer Streuung werden das s und damit auch die Breite kleiner. Die Standardabweichung s der Grundgesamtheit wird für die Berechnung des Intervalls nicht benötigt. Richtig. Das geht aus der Formel (unter A) hervor. Nur s ist erforderlich, nicht s (das ja normalerweise auch wirklich unbekannt ist). 7: Wahrscheinlichkeitsrechnung (2) Bei einer Screening-Untersuchung werden Patienten ohne nennenswerte Beschwerden mit Hilfe des Hämokulttests auf Darmkrebs untersucht. Die Prävalenz bei dieser Population liegt bei 0,3 %. Der Test fällt bei der Hälfte der erkrankten Personen positiv aus. Wenn eine Person keinen Darmkrebs hat, fällt der Test mit einer Wahrscheinlichkeit von 3 % ebenfalls positiv aus. Ergänzen Sie die Häufigkeiten in der folgenden Tabelle. Welche Aussage ist falsch? Darmkrebs vorhanden nicht vorhanden A. B. C. Positiv 15 300 315 Testbefund negativ 15 9.670 (gerundet) 9.685 30 9.970 10.000 Die Spezifität dieses Tests beträgt 50 %. Falsch. Die Spezifität beträgt 9.670 / 9.970 » 0,9699 . Die Sensitivität beträgt 50 % (15/30). Der Anteil der falsch negativen Ergebnisse liegt bei 50 %. Richtig. Dieser Anteil ist 15/30 ( = 1 – Sensitivität). Der positive Vorhersagewert ist unter 5 %. 4 D. E. Richtig. Der positive Vorhersagewert ist 15/ 315 = 0,0476 . Bei einem negativen Befund kann man mit hoher Wahrscheinlichkeit davon ausgehen, dass die betreffende Person keinen Darmkrebs hat. Richtig. Der negative Vorhersagewert beträgt nämlich 15/ 9.685 = 0,0015 . In Worten: Von 9.685 negativen Testergebnissen sind nur 15 falsch negativ. Wenn der selbe Test in einer anderen Population mit einer höheren Prävalenz durchgeführt wird, ändern sich die Vorhersagewerte. Richtig. Wenn die Prävalenz eine andere ist, ändern sich auch die Vorhersagewerte (nur die Sensitivität und Spezifität bleiben konstant). 8: Deskriptive Statistik (2) Um den Zusammenhang zweier quantitativer Merkmale x und y zu beschrieben, werden der Korrelationskoeffizient r und die Regressionsgerade y = a + bx bestimmt. Was ändert sich, wenn x und y vertauscht werden? (1) (2) (3) (4) A. B. C. D. E. der Korrelationskoeffizient r das Bestimmtheitsmaß r 2 das Vorzeichen von b die Regressionsgerade (beide Parameter a und b) Alle Parameter bleiben unverändert. Falsch. Der Korrelationskoeffizient (1) ändert sich nicht (es spielt dabei keine Rolle, welches das x- und welches das y-Merkmal ist). Demzufolge ändert sich auch das Bestimmtheitsmaß (2) nicht. Da das Vorzeichen von der Geradensteigung b mit dem Vorzeichen von r übereinstimmt, bleibt auch (3) unverändert. Die Regressionsgerade ändert sich aber, wenn man x und y vertauscht. Nur (1) und (2) ändern sich nicht. Falsch. Siehe unter A. Nur (4) ändert sich; (1) – (3) bleiben unverändert. Richtig. Siehe unter A. Es ändert sich lediglich das Vorzeichen von r. Falsch. r ändert sich nicht – auch nicht das Vorzeichen. Siehe unter A. Alle Parameter ändern sich und müssen neu berechnet werden. Falsch. Siehe unter A. 5 9: Induktive Statistik (5) Welche Voraussetzungen müssen beim t-Test für 2 unverbundene Stichproben (theoretisch) erfüllt sein? 1. die Daten beider Stichproben entstammen normalverteilten Grundgesamtheiten 2. die Varianzen der beiden Grundgesamtheiten sind gleich 3. der a-Fehler beträgt maximal 5% 4. es wird 2-seitig getestet 5. die Stichprobenumfänge stimmen überein A. B. C. D. E. alle Voraussetzungen müssen erfüllt sein Falsch. Der α-Fehler kann beliebig – je nach Fragestellung – festgelegt werden. Es kann 1-seitig getestet werden; die Stichprobenumfänge müssen keineswegs übereinstimmen. alle Voraussetzungen außer 4 müssen erfüllt sein - Falsch. Siehe unter A. nur 1 – 3 - Falsch. Siehe unter A. nur 1 und 2 - Richtig. Der t-Test für unverbundene Stichproben setzt normalverteilte Grundgesamtheiten mit gleichen Varianzen voraus. nur 1 - Falsch. Die Varianzen müssen streng genommen übereinstimmen. Der WelchTest ist eine Modifikation dahingehend, dass diese Bedingung nicht enthalten ist. 10: Deskriptive Statistik (3) In einer dermatologischen Klinik werden 30 Patienten mit Botulinumtoxin behandelt (zur Verminderung der Falten). Vor der Behandlung wird die Faltenbildung mittels eines Scores folgendermaßen beurteilt (0 = keine Falten, 1 = leichte, 2 = mäßige, 3 = starke Faltenbildung): Score Anzahl 0 3 1 12 2 9 3 6 Ordnen Sie zu: 1. 2. 3. 4. 5. Mittelwert Median Modus Standardabweichung Spannweite a. b. c. d. e. f. 3,0 1,6 1,5 1,0 0,93 Berechnung ist nicht sinnvoll Es handelt sich um ein ordinal-skaliertes Merkmal; also ist die Berechnung von Mittelwert und Standardabweichung nicht sinnvoll (1f, 4f). Der Median kann berechnet werden. Er ist 1,5 – der Durchschnitt aus x(15) = 1 und x(16) = 2 (2c). Der Modus ist die Ausprägung mit der größten Häufigkeit, also D = 1 (3d). Die Spannweite ist 3 - 0 = 3 , also 5a. A. B. C. D. E. 1b, 2c, 3d, 4e, 5a - Falsch (wegen 1b, 4e und 5a) 1b, 2d, 3d, 4e, 5d - Falsch (wegen 1b, 2d, 4e und 5d). 1f, 2f, 3d, 4f, 5a - Falsch (wegen 2f) 1f, 2d, 3d, 4f, 5a - Falsch (wegen 2d) 1f, 2c, 3d, 4f, 5a - Richtig 6 11: Wahrscheinlichkeitsrechnung (3) Bei einer Infektionskrankheit beträgt der Kontagionsindex (Wahrscheinlichkeit, dass sich eine mit dem Erreger in Kontakt gekommene Person infiziert) 0,9. Der Manifestationsindex (Wahrscheinlichkeit, dass eine infizierte Person manifest erkrankt) liegt bei 0,8. Wie groß ist dann die Wahrscheinlichkeit, dass eine mit dem Erreger in Kontakt getretene Person latent erkrankt? Lösung: Nach dem Multiplikationssatz ist die Wahrscheinlichkeit, dass sich eine Person infiziert (Ereignis I) und manifest erkrankt (Ereignis M), gleich: P ( I Ç M ) = P ( I ) × P ( M | I ) = 0,9 × 0,8 = 0,72 . Die Wahrscheinlichkeit, dass eine infizierte Person latent erkrankt (Ereignis L), ist nach dem Satz von der totalen Wahrscheinlichkeit, 0,2. Dann ist P ( I Ç L) = P ( I ) × P ( L | I ) = 0,9 × 0, 2 = 0,18 . Also Antwort C. A. B. C. D. E. 72 % 20 % 18 % 10 % 8% - falsch - falsch - richtig - falsch - falsch 12: Wahrscheinlichkeitsrechnung (4) In der erwachsenen Bevölkerung hat der Cholesteringehalt des Serums eine Verteilung mit einem Erwartungswert m = 180 und eine Standardabweichung von s = 20 (mit den Maßeinheiten mg / 100 ml). Wie sind die (theoretisch denkbaren) Mittelwerte verteilt, die sich aus zufälligen Stichproben des Umfangs 16 ergeben? Lösung: Nach dem zentralen Grenzwertsatz sind die Mittelwerte normalverteilt mit m x = 180 und s x = s / n = 20 / 16 = 5 . Also ist D die richtige Lösung. A. B. C. D. E. normalverteilt mit m x = 180 und s x = 20 - falsch normalverteilt mit m x = 180 und unbekannter Standardabweichung - falsch normalverteilt mit m x = 180 und s x = 1,25 - falsch normalverteilt mit m x = 180 und s x = 5 - richtig die Mittelwerte folgen derselben Verteilung wie der Cholesteringehalt des Serums falsch 13: Versuchsplanung (1) Welche Aussage bezüglich Fall-Kontroll-Studien ist falsch? A. B. C. Es handelt sich um retrospektive Studien. - Richtig. Die Studien dienen zum Nachweis, dass ein ätiologischer Faktor in Zusammenhang mit einer Krankheit steht. - Richtig. Man kann die Odds Ratio berechnen. Diese Maßzahl ist eine Näherung für das relative Risiko, falls die Inzidenz der Krankheit gering ist. - Richtig. 7 D. E. Die Studien haben gegenüber Kohortenstudien den Vorteil, dass die Ergebnisse schneller vorliegen. - Richtig. Die Studien haben experimentellen Charakter. Falsch. Es werden nur Daten ausgewertet, die bereits dokumentiert sind oder durch Befragungen erhoben werden müssen. Niemand greift modifizierend in das Geschehen ein. Daher sind alle retrospektiven Studien beobachtend, nicht experimentell. 14: Deskriptive Statistik (4) Bei Patienten mit Diabetes mellitus ergibt sich bezüglich des Zusammenhangs zwischen dem mittleren arteriellen Blutdruck (unabhängiges Merkmal, gemessen in mmHg) und dem Hämoglobingehalt (in %) folgende Regressionsgerade: y = 20,19 - 0,12 × x . Der Korrelationskoeffizient r hat den Betrag 0,84. Welche Aussage lässt sich aus diesen Angaben nicht herleiten? A. B. C. D. E. Der Korrelationskoeffizient ist negativ. Richtig. Da die Regressionsgerade negative Steigung hat, muss der Korrelationskoeffizient ebenfalls negativ sein. Etwa 70 % der Varianz des Hämoglobingehalts ist auf den Einfluss des Blutdrucks zurückzuführen. Richtig. Das Bestimmtheitsmaß ist r 2 = 0,842 » 0,70 . Daraus lässt sich die Aussage unter B herleiten. Patienten mit einem Blutdruck von 100 mmHg haben einen durchschnittlich 1,2% niedrigeren Hämoglobingehalt als Patienten mit einem Blutdruck von 90 mmHg. Richtig. Das ergibt sich aus der Gleichung der Regressionsgeraden. Für einen Bluthochdruckpatienten mit einem Blutdruck von 150 mmHg ist ein Hämoglobingehalt von 2,19 % zu erwarten. Richtig. Man muss nur in die Gleichung der Regressionsgeraden x = 150 einsetzen. Der beschriebene Zusammenhang ist schwach, da die Regressionsgerade eine geringe Steigung aufweist. Falsch. Die Steigung der Regressionsgeraden sagt nichts darüber aus, ob der Zusammenhang stark oder schwach ist. Wegen r = 0,84 ist der Zusammenhang eher stark. 15: Wahrscheinlichkeitsrechnung (5) Die Wahrscheinlichkeit, bei einem Bronchialkarzinom die richtige Diagnose zu stellen, sei 0,8 bei zytologischer Sputumuntersuchung und 0,9 bei histologischer Untersuchung von Material einer Probeexcision. Wir nehmen an, dass die Ergebnisse der beiden Diagnoseverfahren unabhängig voneinander sind. Mit welcher Wahrscheinlichkeit wird ein vorhandenes Karzinom entdeckt, wenn beide Verfahren angewandt werden? Lösung: Es wird der Additionssatz angewandt: P ( A È B ) = P( A) + P( B ) - P( A Ç B ) (wobei A das Ereignis „mit Sputumuntersuchung richtige Diagnose stellen“ und B das Ereignis „mit histologischer Unetrsuchung richtige Diagnsoe stellen“). Da A und B unabhängig voneinander sind, ist P ( A Ç B ) = P( A) × P( B ) . Also ist: P ( A È B ) = P( A) + P( B ) - P( A) × P( B ) = 0,8 + 0,9 - 0,8 × 0,9 = 1,70 - 0,72 = 0,98 8 A. B. C. D. E. 0,9 0,8 0,72 1,7 0,98 falsch, das ist P ( B ) falsch, das ist P ( A) falsch, das ist P ( A Ç B ) = P( A) × P( B ) falsch, das ist P ( A) + P ( B ) richtig, siehe oben 16: Versuchsplanung (2) Ein Arzt war beteiligt an der Entwicklung einer neuen Therapie. Er ist persönlich davon überzeugt, dass diese neue Therapie der bisher verwendeten Standardtherapie bezüglich ihrer Wirkung überlegen ist. Sie wurde im Tierversuch, bei einzelnen gesunden Probanden und kranken Patienten erfolgreich getestet und zeigte vielversprechende Ergebnisse. Der Arzt will nun nachweisen, dass die neue Therapie besser ist als die bisher verwendete. Welches Studiendesign ist zweckmäßig? A. B. C. D. E. Um keinen seiner Patienten zu benachteiligen, behandelt der Arzt fortan alle Patienten mit der neuen Therapie. Wenn genügend Ergebnisse bezüglich des Behandlungserfolgs vorliegen, vergleicht er diese mit den Ergebnissen von Patienten, die von ihm in früherer Zeit behandelt worden waren. Falsch. Dies wäre ein historischer Vergleich; dabei sind die beiden Gruppen nicht beobachtungsgleich. Er klärt die Patienten auf und behandelt jeden einzelnen Patienten mit der von ihm gewünschten Therapie. Danach vergleicht die beiden Therapiegruppen. Falsch. In diesem Fall kann man nicht annehmen, dass die Gruppen strukturgleich sind. Um ein möglichst geringes Risiko einzugehen, behandelt er nur die „leichteren“ Fälle mit der neuen Therapie. Patienten, deren Schweregrad höher eingestuft wird oder die zusätzliche Risiken aufweisen, erhalten sicherheitshalber die Standardtherapie. Danach werden die beiden Gruppen miteinander verglichen. Falsch. Die beiden Gruppen unterscheiden sich bezüglich eienr sehr wichtigen Einflussgröße und sind damit nicht strukturgleich. Er behandelt alle seine Patienten mit der neuen Therapie und bittet einen Kollegen in einer anderen Klinik, dass dieser seine Patienten zeitgleich mit der Standardtherapie behandelt. Diese beiden Gruppen werden dann miteinander verglichen. Falsch. Die Gruppen sind nicht beobachtungsgleich; auch Strukturgleichheit kann nicht vorausgesetzt werden. Er lässt durch einen Prüfarzt jeden Patienten seiner Klinik zufällig einer der beiden Therapieformen zuweisen und führt eine doppelblinde Studie durch, um danach Vergleiche ziehen zu können. Richtig. Durch die Randomisation ist die Sturkturgleichheit gewährt; durch die Doppelblindheit die Beobachtungsgleichheit. 17: Wahrscheinlichkeitsrechnung (6) Der diastolische Blutdruck bei einer Gruppe von jungen Männern ist normalverteilt mit einem Erwartungswert von 70 mmHg und einer Standardabweichung von 10 mmHg. Welche Aussage folgt daraus? 9 A. B. C. D. E. Etwa die Hälfte dieser Männer hat einen Blutdruck zwischen 60 und 80 mmHg. Falsch. Das Intervall 60 bis 80 mmHg entspricht m ± s . In diesem Bereich liegen etwa 68 % aller Messwerte. Es ist ausgeschlossen, dass ein Mann aus dieser Population einen diastolischen Blutdruck von mehr als 100 mmHg hat. Falsch. Es ist zwar extrem unwahrscheinlich, dass ein Wert außerhalb des 3σ-Bereichs liegt, aber nicht unmöglich. Etwa 95 % der jungen Männer haben einen Blutdruck zwischen 50 und 90 mmHg. Richtig. In diesem Bereich m ± 2s liegen etwa 95 % aller Messwerte. Der Median dieser Verteilung kann mit den vorliegenden Informationen nicht bestimmt werden. Falsch. Der Median einer Normalverteilung entspricht deren Erwartungswert und ist in diesem Fall 70 mmHg. Wenn man eine Standardabweichung von 14 mmHg zugrunde legt, wird die Glockenkurve schmaler und höher. Falsch. Bei einer größeren Streuung wird die Kurve breiter und niedriger. 18: Induktive Statistik (6) Um die Erfolgsraten 2er Therapien zu vergleichen, eignet sich der Chi2-Vierfeldertest. Dabei wird basierend auf 4 beobachteten Häufigkeiten a, b, c und d eine Prüfgröße mit einem dazugehörenden p-Wert berechnet ( a = 5% ). Wie ändern sich die folgenden Kenngrößen, wenn jede der 4 Häufigkeiten verdoppelt wird? ( ad - bc) 2 × n 2 Lösung: Die Prüfgröße wird berechnet als c = oder allge( a + b) × ( c + d ) × (a + c ) × (b + d ) ( E - B )2 (wobei E die erwarteten und B die beobachteten Häufigkeiten E sind). Daraus ergibt sich: Wenn man alle Häufigkeiten verdoppelt, verdoppelt sich auch die Prüfgröße. Der p-Wert wird dadurch kleiner. Das Ergebnis tendiert also mehr zur Alternativhypothese. mein als c 2 = å A. B. C. D. E. Die Prüfgröße und der p-Wert bleiben unverändert. - Falsch. Siehe oben. Die Prüfgröße verdoppelt sich, der p-Wert wird kleiner. - Richtig. Siehe oben. Die Prüfgröße und der p-Wert verdoppeln sich. - Falsch. Siehe oben. Die Prüfgröße wird viermal so groß; der p-Wert wird kleiner. - Falsch. Siehe oben. Diese Frage lässt sich mit den vorliegenden Informationen nicht beantworten. Falsch. Siehe oben. 19: Deskriptive Statistik (5) Im Rahmen einer klinischen Studie mit Neugeborenen werden folgende Merkmale erfasst: (1) (2) (3) (4) (5) (6) Geburtsgewicht in Gramm Alter der Mutter bei der Entbindung Geschlecht des Neugeborenen (1 = männlich, 2 = weiblich) Apgar-Score (0 bis maximal 10 Punkte) Anzahl der vorangegangenen Schwangerschaften der Mutter ID des Säuglings (durchnummeriert nach dem Alphabeth des Nachnamens) 10 Welche(s) dieser Merkmale ist (sind) quantitativ? A. B. C. D. E. alle Merkmale Falsch. Quantitativ sind (1), (2) und (5). Nur bei diesen Merkmalen ist die Berechnung des Mittelwerts erlaubt. Das Geschlecht ist ein Alternativmerkmal und damit qualitativ. Auch die ID ist qualitativ; die Nummerierung dient nur zur Codierung und erlaubt nicht die Berechnung eines Mittelwerts, der vollkommen unsinig wäre. Der Apgar-Score ist ordinal-skaliert und damit ebenfalls qualitativ. kein Merkmal - Falsch. Siehe unter A. nur (1) und (2) - Falsch. Auch (5) ist quantitativ. (5) unterscheidet sich von (1) und (2) dadurch, dass es diskret ist. nur (1), (2) und (5) - Richtig. Siehe unter A. nur (1), (2), (4) und (5) - Falsch. (4) ist nur ordinal-skaliert. Die Unterschiede zwischen jeweils 2 Ausprägungen sind nicht definiert. 20: Deskriptive Statistik (6) Welche der folgenden Aussagen ist falsch? A. B. C. D. E. Für die empirische Verteilungsfunktion gilt allgemein: F ( x ) = 0,50 (wobei x den Mittelwert bezeichnet). Falsch. Es gilt allgemein: F ( x% ) = 0,50 . Der Vergleich zwischen Mittelwert und Median ist nützlich zur Beurteilung, ob die Verteilung symmetrisch oder schief ist. Richtig. Wenn Mittelwert und Median ähnlich groß sind, ist die Verteilung symmetrisch – ansonsten ist sie schief. Bei Überlebenszeitstudien kann der Median für die Zielgröße „Überlebenszeit“ vor dem Ende der Studie berechnet werden. Richtig. Der Median kann schon berechnet werden, wenn die Hälfte (oder einer mehr) der Patienten verstorben ist. Der Mittelwert wird stärker von Ausreißern beeinflusst als der Median. Richtig. Wenn bei Überlebenszeitstudien zensierte Daten vorliegen, ist die Berechnung des Mittelwerts auch nach Beendigung der Studie nicht möglich. Richtig. Die mittlere Überlebenszeit kann nur dann berechnet werden, wenn alle Patienten verstorben sind. Bei zensierten Daten ist die genaue Überlebenszeit jedoch unbekannt. 11