Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ Institut für Medizinische Informatik und Statistik Medizinische Fakultät der Christian-Albrechts-Universität Kiel Universitäts-Klinikum Schleswig-Holstein Campus Kiel Brunswiker Straße 10 24105 Kiel Bemerkung: Die vorliegende Aufgabensammlung bildet die Grundlage der Übungen zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“. Bei den Übungen handelt es sich um eine Pflichtveranstaltung, die den Zweck hat, die in der begleitenden (wahlfreien) Vorlesung vermittelten Lehrinhalte zu vertiefen und die Studierenden auf das anschließend stattfindende Literaturseminar im Q1 vorzubereiten. Ungeachtet der nicht gegebenen Anwesenheitspflicht wird allen Studierenden im Q1 der regelmäßige Besuch der Vorlesung dringend empfohlen. Um einen möglichst nachhaltigen Lernerfolg zu erzielen, sollten zudem alle Aufgaben von allen Studierenden jeweils vor der entsprechenden Übungsstunde selbstständig bearbeitet werden. Die Lösungen werden während der Übung durch einzelne Studierende vorgestellt und von den Übungsleitern gegebenenfalls näher erläutert. Die Aufgabenstellung orientiert sich am Inhalt der Vorlesung, in der auch das zur Lösung benötigte Wissen vermittelt wird. Übung 1 (Deskriptive Statistik) 1. (Lage- und Streuungsmaße, Box-Whisker-Plot) a:1 b:1 c:1 d:1 Im Zuge einer bevölkerungsmedizinischen Untersuchung wurde der Body-Mass-Index (BMI) von 100 zufällig ausgewählten Männern im Alter von 18 bis 65 Jahren ermittelt. Die Ergebnisse der Messungen sind in der folgenden Tabelle der Größe nach sortiert aufgeführt. BMI (kg/m2) von 100 zufällig ausgewählten Männern (18-65 Jahre) 21.68 22.57 23.52 24.07 24.50 25.45 26.14 27.24 29.64 34.00 21.89 22.58 23.53 24.10 24.54 25.56 26.15 27.48 30.56 34.09 22.02 22.83 23.58 24.14 24.55 25.62 26.31 27.85 30.84 34.16 22.07 22.95 23.60 24.22 24.62 25.67 26.38 28.02 30.85 35.49 22.11 23.01 23.62 24.23 24.68 25.72 26.44 28.04 31.19 36.32 22.14 23.10 23.64 24.24 24.71 25.80 26.51 28.44 31.24 37.57 22.17 23.13 23.67 24.24 25.08 25.80 26.55 28.65 31.90 38.46 22.20 23.14 23.84 24.39 25.29 25.91 26.80 29.05 33.00 38.87 22.41 23.18 23.96 24.45 25.38 25.98 27.12 29.37 33.12 40.56 22.55 23.18 24.05 24.49 25.45 26.11 27.17 29.56 33.83 41.38 Aus den 100 Probanden wurden nach dem Zufallsprinzip 15 Kandidaten für eine eingebettete Interventionsstudie ausgewählt. Die BMI-Werte dieser Probanden sind in der Tabelle markiert. a. Ermitteln Sie für die Teilstichprobe den Mittelwert und die Standardabweichung des BMI. b. Ermitteln Sie für die Teilstichprobe den Median und die Quartile sowie den Interquartilabstand des BMI. c. Ermitteln Sie den Median und die Quartile des BMI für die gesamte Stichprobe. d. Skizzieren Sie für die gesamte Stichprobe den Box-Whisker-Plot. Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 2 Übung 2 (Wahrscheinlichkeitstheorie) 1. (diskrete Zufallsvariable, Wahrscheinlichkeitsfunktion, Erwartungswert) a:1 b:1 Etwa 8% der deutschen Bevölkerung sind so genannte „Non-Responder“ für die Hepatitis-B Schutzimpfung, d.h. bei ihnen führt auch die übliche dreistufige Impfung (nach 0, 1 und 6 Monaten) nicht zu einer Immunisierung. a. Berechnen Sie alle möglichen Werte der Wahrscheinlichkeitsfunktion der Zufallsvariablen „Anzahl der Non-Responder unter 6 geimpften Personen“ (kurz:„X). Berechnen Sie den Erwartungswert der Zufallsvariablen X. b. Mit welcher Wahrscheinlichkeit befindet sich unter 6 geimpften Personen höchstens ein Non-Responder? Mit welcher Wahrscheinlichkeit befindet sich unter 6 geimpften Personen mindestens ein Non-Responder? 2. (stetige Zufallsvariable, Dichtefunktion, Normalverteilung) a:1 b:1 c:1 Die Körpergröße Kieler Studentinnen ist normalverteilt mit einem Erwartungswert von 168 cm und einer Varianz von 36 cm2. a. Skizzieren Sie die Dichtefunktion der Zufallsvariablen „Körpergröße einer Kieler Studentin“ (kurz: Y). Interpretieren Sie anhand der Skizze den Erwartungswert und die Varianz von Y. b. Mit welcher Wahrscheinlichkeit ist eine zufällig ausgewählte Kieler Studentin höchstens 174 cm groß? Hinweis: Verwenden Sie zur Lösung die Transformation der Zufallsvariablen Y in eine Zufallsvariable Z mit Standard-Normalverteilung; die Quantile der N(0,1)-Verteilung finden Sie in Tabelle A.1. c. Mit welcher Wahrscheinlichkeit ist eine zufällig ausgewählte Kieler Studentin zwischen 171 cm und 178.5 cm groß? Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 3 Übung 3 (Parameterschätzung) 1. (Binomial-Verteilung, Maximum-Likelihood-Schätzung) a:1 b:1 Von den 100 Personen einer Population sind 10 Personen erkrankt. In drei Zufallsstichproben aus dieser Population (A, B, C) befanden sich 2, 3 bzw. 4 Erkrankte. a. Welcher Parameter kann aus diesen Stichproben sinnvollerweise geschätzt werden? Welche Voraussetzung muss dafür erfüllt sein? b. Welche Schätzfunktion sollte für die unter a. genannte Schätzung verwendet werden und warum? Schätzen Sie den unter a. genannten Parameter aus jeder der drei Stichproben und vergleichen Sie die Ergebnisse. 2. (Normalverteilung, Punktschätzung, Konfidenzintervall) a:1 b:1 c:1 Im Rahmen einer sportmedizinischen Studie wurde bei 100 Kieler Studentinnen deren Körpergröße gemessen. Die Ergebnisse sind in der folgenden Tabelle zusammengefasst. Körpergröße (cm) von 100 Kieler Studentinnen 174.5 170.2 173.1 172.5 170.4 169.1 168.5 169.4 169.1 180.5 177.2 169.1 174.0 167.3 166.5 173.9 173.7 166.6 177.4 182.4 169.5 170.9 175.8 178.7 168.1 159.7 171.9 172.7 166.1 169.1 170.4 171.3 170.9 169.7 169.5 171.4 175.6 167.4 165.0 174.3 163.9 172.5 167.6 176.5 168.5 166.7 171.7 171.2 171.2 173.3 171.7 174.6 169.0 168.8 168.7 166.9 174.4 180.4 169.5 172.5 186.4 178.1 164.2 170.1 177.9 173.8 169.5 178.2 177.9 169.6 176.1 180.6 166.9 164.9 170.4 167.5 162.4 163.2 168.2 170.9 171.9 165.7 175.4 167.4 176.2 167.6 169.8 169.8 168.3 175.5 174.4 169.7 182.1 175.9 181.0 177.4 173.7 166.5 174.8 178.0 a. Mit welchen Schätzfunktionen sollten Erwartungswert und Standardabweichung der (normalverteilten) Körpergröße der Kieler Studentinnen geschätzt werden und warum? Schätzen Sie beide Parameter aus der Stichprobe. Hinweis: n i1 (x i x)2 i1 x 2i n x 2 ; n n i1 x i 17170.9; n i1 x 2i 2950720 b. Geben Sie ein 95%- und ein 99%-Konfidenzintervall für den Erwartungswert an. Hinweis: Quantile der t-Verteilung sind t0.975,99=1.99 und t0.995,99=2.63. c. Für eine weitere Studie wurde eine Teilstichprobe von 10 Studentinnen entnommen (in der Tabelle grau markiert). Schätzen Sie aus dieser Teilstichprobe und geben Sie ein 95%- und ein 99%-Konfidenzintervall für an. Hinweis: Quantile der t-Verteilung sind t0.975,9=2.26; t0.995,9=3.25, x 170.54; s 5.36 . Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 4 Übung 4 (Epidemiologie) 1. (Fall-Kontrollstudie, Odds-Ratio) a:1 b:1 In einer Klinik wurde retrospektiv über einen Zeitraum von 5 Jahren der Einfluss eines erhöhten Alkohol-Konsums auf das Auftreten eines Ösophagus-Karzinoms untersucht. Als Vergleichsgruppe wurden dabei Patienten mit anderen internistischen Krankheitsbildern herangezogen. Alkoholkonsum >80g Alkohol pro Tag 80g Alkohol pro Tag Gesamt Ösophagus-Karzinom Ja Nein 192 54 208 333 400 387 a. Schätzen Sie die Odds-Ratio erhöhten Alkoholkonsums (>80g pro Tag) für das Auftreten eines Ösophagus-Karzinoms. Warum kann aus dieser Studie kein relatives Risiko bestimmt werden? b. Geben Sie für die Odds-Ratio ein 95%-Konfidenzintervall an. 2. (Kohorten Studie, relatives Risiko, Überschussanteil) a:1 b:1 c:1 In einer chirurgischen Abteilung wurde prospektiv über einen Zeitraum von 6 Monaten das Auftreten von Wundheilungsstörungen während der stationären Liegezeit nach OP erfasst. Zusätzlich wurde vor der OP bei allen Patienten eine Risiko-Anamnese erhoben. RisikoAnamnese Positiv Negativ Gesamt Wundheilungsstörung Ja Nein 44 171 64 734 108 905 Gesamt 215 798 1013 a. Schätzen Sie das relative Risiko einer Risiko-Anamnese für eine Wundheilungsstörung. b. Wie hoch ist das populationsattributable Risiko (Überschussanteil)? c. Geben Sie für das relative Risiko ein 95%-Konfidenzintervall an. Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 5 Übung 5 (Diagnostische Tests) 1. (bedingte Wahrscheinlichkeit, Bayes Theorem) a:1 b:1 c:1 Das Vorliegen einer HIV-Infektion kann mithilfe eines ELISA-Tests überprüft werden. Dieses Verfahren, bei dem Antikörper gegen HIV (nicht das Virus selbst) im Blut des Probanden nachgewiesen werden, verfügt über eine Sensitivität und Spezifität von jeweils 99.5%. Die Prävalenz der HIV-Infektion beträgt in Deutschland etwa 0.01% unter Mitgliedern der so genannten „low-risk“ Population (d.h. heterosexuell, nicht drogenabhängig etc.) und 15% unter intravenösen Drogenbenutzern. a. Ermitteln Sie für beide Bevölkerungsgruppen die jeweiligen positiv prädiktiven Werte des ELISA-Tests. b. Ermitteln Sie für beide Bevölkerungsgruppen die jeweiligen negativ prädiktiven Werte des ELISA-Tests. c. Wie hoch ist der positiv prädiktive Wert eines zweiten, unabhängigen ELISA-Tests für „low-risk“ Probanden, bei denen der erste Test positiv ausgefallen war? 2. (Sensitivität, Spezifität) a:1 b:1 Zur Diagnose des Gestationsdiabetes (GD) gibt es zwei alternative Diagnoseverfahren, die deutlich weniger belastend sind als der übliche orale 100g Glucose-Toleranz-Test (der „GoldStandard“ der GD-Diagnostik). Hierbei handelt es sich um den 50g Glucose-Challenge-Test (GCT) und die Bestimmung des Nüchternblutzuckers (Fasting Plasma Glucose Concentration, FPGC). Beide Verfahren wurden in einer prospektiven Studie hinsichtlich ihrer Aussagekraft und Zuverlässigkeit miteinander verglichen. In einer Stichprobe von 520 zufällig ausgewählten Schwangeren wurde bei 53 Teilnehmerinnen mittels oralem 100g Glucose-Toleranz-Test ein Gestationsdiabetes (GD) diagnostiziert. Die gleichen Frauen waren zuvor auch einem GCT und einer FPGC Bestimmung unterzogen worden. GD Ja Nein GCT Positiv 36 84 FPGC Negativ 17 383 Positiv 43 112 Negativ 10 355 a. Schätzen Sie aus den Daten der Tabelle Sensitivität und Spezifität der GCTBestimmung für den GD. b. Schätzen Sie aus den Daten der Tabelle Sensitivität und Spezifität der FPGCBestimmung für den GD. Welches Verfahren ist Ihrer Meinung nach (aus ärztlicher Sicht) besser zum routinemäßigen Screening auf GD geeignet? Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 6 Übung 6 (Statistisches Testen I) 1. (Hypothesen, Signifikanzniveau, Power) a:1 b:1 c:1 d:1 Bei gesunden Personen im Alter zwischen 20 und 44 Jahren beträgt die mittlere PlasmaCalcium-Konzentration (Ca) 2.5 mmol/l. Es wird vermutet, dass die Ca-Werte von Patienten mit Congenital Central Hypoventilation Syndrome (CCHS) erhöht sind. In einer Stichprobe von acht CCHS-Patienten wurden folgende Ca-Werte gemessen. Patient Ca (mmol/l) 1 5.4 2 2.6 3 4.3 4 3.3 5 2.7 6 2.3 7 2.4 8 3.7 a. Formulieren Sie die eingangs skizzierte wissenschaftliche Fragestellung als statistisches Entscheidungsproblem. Benennen Sie Nullhypothese (H0) und Alternativhypothese (HA), und legen Sie ein geeignetes Signifikanzniveau fest. b. Welcher statistische Test kann zur Entscheidung zwischen H0 und HA verwendet werden, wenn man annimmt, dass die Ca-Konzentration einer Normalverteilung folgt? Wie lauten die kritischen Werte der zugehörigen Teststatistik zum 5%, 1% und 0.1% Signifikanzniveau (siehe Tabelle A.2)? c. Berechnen Sie die unter b. genannte Teststatistik aus den tabellierten Ca-Werten und interpretieren Sie das Ergebnis. d. Bei hinreichend feiner Tabellierung der t-Quantile ließe sich für die unter c. errechnete Teststatistik auch der p-Wert bestimmen. Welche qualitative Aussage über dessen Größe lässt sich bereits auf der Grundlage des Ergebnisses von c. und der t-Quantile in Tabelle A.2 treffen? Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 7 Übung 7 (Statistisches Testen II) 1. (Fallzahlplanung, Signifikanzniveau, Power) a:1 b:1 c:1 In einer Phase-II-Studie an 20 adipösen Probanden wurde die Wirkung einer täglichen Gabe von 250 mg M-Oglitin auf das Körpergewicht untersucht. Innerhalb von acht Wochen erreichten die Probanden eine mittlere Gewichtsabnahme von 5.2 kg, bei einer geschätzten Standardabweichung von 3.7 kg. a. Mit welchem statistischen Test lässt sich das Ergebnis dieser Studie bewerten? Berechnen Sie die Teststatistik und interpretieren Sie das Ergebnis. Welche Konsequenzen ergeben sich daraus für die Fragestellung einer folgenden Phase III-Studie (siehe b.)? b. Wie viele Probanden müsste man in eine placebokontrollierte Phase-III-Studie einschließen, um den beobachteten Effekt auf dem 5% Signifikanzniveau mit 80% Power zu verifizieren? Gehen Sie dabei von einem Placeboeffekt von 3.0 kg Gewichtsabnahme bei gleicher Standardabweichung von 3.7 kg aus. c. Wie viele Probanden würde man benötigen, wenn bei gleicher Power (80%) das Signifikanzniveau auf 1% gesenkt bzw. bei gleichem Signifikanzniveau (5%) die Power auf 90% erhöht würde? 2. (Vergleich von Anteilen, multiples Testen) a:1 b:1 c:1 In einer prospektiven, doppelblinden und placebokontrollierten Phase-III-Studie wurde die Wirksamkeit des Medikaments Bulliforton zur Behandlung postprandialer Verdauungsbeschwerden von Typ II Diabetes-Patienten untersucht. Primärer Endpunkt (EP) der Studie war eine Reduktion des Upper Abdominal Discomfort Severity Scores nach 4 Wochen (UADS4) um mindestens 200 Punkte gegenüber der Baseline (UADS0). Sekundäre EP waren eine Reduktion des UADS Scores um mindestens 200 Punkte nach 2 Wochen, und auf weniger als 150 Punkte nach 4 Wochen. Die Ergebnisse der Studie sind in der folgenden Tabelle zusammengefasst. Gruppe Gesamt Verum Placebo 493 487 primärer EP UADS4 UADS0-200 148 122 sekundäre EP UADS2 UADS4150 UADS0-200 128 98 101 71 a. Formulieren Sie die wissenschaftliche Fragestellung der Studie als statistisches Entscheidungsproblem hinsichtlich des primären EP. Wie lauten H0 und HA? Welche Teststatistik kann sinnvoller Weise zur Entscheidungsfindung verwendet werden? b. Berechnen Sie die Teststatistik für den primären EP und interpretieren Sie das Ergebnis. Hinweis: Das Quantil der Chiquadrat-Verteilung ist 20.95,1=3.841. c. Für die sekundären EP ergaben sich folgende Werte der unter a. gewählten Teststatistik: 3.734 (UADS2UADS0-200) und 4.821 (UADS4150). Wie sind diese und das unter b. ermittelte Resultat bei Annahme eines 5% Signifikanzniveaus zu interpretieren? Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 8 Übung 8 (Korrelation und Regression) 1. (Lineare Regression, Pearson- und Spearman-Korrelationskoeffizient) a:1 b:1 c:1 d:1 e:1 Bei 10 männlichen Unfallpatienten wurde der Harnstoff im Serum (mmol/l) bestimmt. Patient 1 2 3 4 5 6 7 8 9 10 Alter 70 76 81 85 44 58 51 74 45 67 Harnstoff 4.1 5.6 8.8 9.7 2.9 3.1 3.5 6.8 2.8 3.8 a. Schätzen Sie aus den Daten in der Tabelle den Achsenabschnitt und die Steigung einer Regressionsgeraden. b. Schätzen Sie aus den Daten Pearson-Korrelationskoeffizient und Bestimmtheitsmaß. Hinweis: Zur Berechnung von sX, sY und sXY verwenden Sie bitte 10 10 10 i1(xi x) (yi y) 292.99 . i1(xi x)2 1972.90 i1(yi y)2 57.37 (siehe auch Fußnote 1) c. Ist der Pearson-Korrelationskoeffizient signifikant von 0 verschieden? Welche Teststatistik kann zur Prüfung der Null-Hypothese verwendet werden? Berechnen Sie diese Teststatistik und interpretieren Sie das Ergebnis. d. Zeichnen Sie die Regressionsgerade aus b. in das folgende Streudiagramm ein. Wie ist das Resultat der linearen Regressionsanalyse zu interpretieren? e. Berechnen Sie für die Daten der Tabelle den Spearman-Korrelationskoeffizienten XY und vergleichen Sie diesen mit dem Pearson-Korrelationskoeffizienten. Wie ist der Unterschied der beiden Korrelationskoeffizienten zu erklären? 1 Für eine Stichprobe gepaarter Beobachtungen (x1,y1),…,(xn,yn) gilt: 1 1 n n i1 (xi x) (yi y) i1( x i x)2 und sXY s 2X n 1 n1 Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 9 Übung 9 (Statistische Modellbildung) 1. (multiple lineare Regression) a:1 Durch die Untersuchung einer repräsentativen Stichprobe (n=100) sollte geklärt werden, ob bei den Mitarbeitern von Cadmium verarbeitenden Chemieunternehmen ein Zusammenhang zwischen deren Lungen-Vitalkapazität (VK, gemessen in Liter) und der Betriebszugehörigkeit (gemessen in Jahren) besteht. In der folgenden Tabelle sind die Resultate der einfachen und multiplen Regressionsanalysen unter Adjustierung für das Lebensalter (in Jahren) aufgeführt. Einflussgröße/Parameter Betriebszugehörigkeit Lebensalter Achsenabschnitt Bestimmtheitsmaß b (p-Wert) -0.048 (<0.001) --6.020 (<0.001) 0.762 einfache Analyse b (p-Wert) ---0.051 (<0.001) 7.023 (<0.001) 0.822 multiple Analyse b (p-Wert) -0.006 (0.452) -0.046 (<0.001) 6.924 (<0.001) 0.823 a. Stellen Sie für die beiden einfachen Regressionsanalysen und für die multiple Regressionsanalyse die resultierenden Modellgleichungen auf. Wie sind die Resultate dieser linearen Regressionsanalysen zu interpretieren (siehe dazu auch Abbildung A.3)? 2. (logistische Regression, Odds-Ratio) a:1 b:1 c:1 In einer retrospektiven Studie wurden medizinische und epidemiologische Daten von 244 holländischen Männern im Alter zwischen 55 und 65 Jahren ausgewertet, bei denen aufgrund eines PSA-Wertes (Prostate-Specific Antigen) in der diagnostischen Grauzone von 3-10 g/l ein Verdacht auf Prostatakrebs bestand. Dabei konnten mittels logistischer Regressionsanalyse neben dem Quotienten von freiem (F) und totalem (T) PSA auch ein positiver rektaler Tastbefund (Digital Rectal Examination, DRE) und eine positive Familienanamnese als signifikante diagnostische Marker für Prostatakrebs identifiziert werden. Logistische Regressionsanalyse diagnostischer Marker für Prostatakrebs, durchgeführt an 244 Männern im Alter zwischen 55 und 65 Jahren Parameter Achsenabschnitt Quotient F :T DRE (+) Familienanamnese (+) Regressionskoeffizient -0.169 -10.197 1.643 1.076 95% KI -.(-18.932,-3.053) (0.752,2.559) (0.012,2.131) p-Wert -.0.0054 0.0004 0.0437 a. Wie sind die Resultate der logistischen Regressionsanalyse zu interpretieren? Transformieren Sie dazu die Regressionskoeffizienten der beiden dichotomen Einflussgrößen DRE und Familienanamnese auf geeignete Weise in Odds-Ratios. b. Ermitteln Sie die Wahrscheinlichkeit für das Vorliegen eines Prostatakrebs bei einem F:T Quotienten von 0.07, positivem Tastbefund und positiver Familienanamnese. c. Ermitteln Sie die Wahrscheinlichkeit für das Vorliegen eines Prostatakrebs bei einem F:T Quotienten von 0.35, negativem Tastbefund und negativer Familienanamnese. Vergleichen Sie das Ergebnis mit der unter b. ermittelten Wahrscheinlichkeit. Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 10 Übung 10 (Überlebenszeitanalyse) 1. (Kaplan-Meier-Schätzung) a:1 b:1 Für fünf Individuen liegen folgende Überlebenszeiten (in Jahren) vor. Individuum Überlebenszeit 1 2 3 6 7(*) 2 (*): zensierte Beobachtungen 4 8 5 4(*) a. Schätzen Sie mit dem Kaplan-Meier-Verfahren die Überlebenswahrscheinlichkeiten für die Jahre 1 bis 8. Ergänzen Sie hierzu die nachstehende Sterbetafel. ti 2 ni 5 P̂(T t i1 ) 1.000 di 1 P̂(T t i ) 0.800 P̂(T t i | T t i1 ) 0.800 b. Skizzieren Sie den Verlauf der geschätzten Überlebenswahrscheinlichkeiten („KaplanMeier-Kurve“) und markieren Sie die zensierten Beobachtungen. 2. (Log-Rank-Test) a:1 b:1 In der folgenden Tabelle sind die Überlebenszeiten (in Monaten) aufgeführt, die in zwei Patientengruppen nach Durchlaufen unterschiedlicher Behandlungsschemata C1 und C2 beobachtet wurden. Therapie C1 Therapie C2 12 24 18(*) 22 22 25(*) 27 36(*) (*): zensierte Beobachtungen 23 37 27 a. Formulieren Sie H0 und HA. Ergänzen Sie die nachstehende Tabelle um die fehlenden Angaben zur Anzahl von Personen unter Risiko (nC1,i, nC2,i), zur beobachteten Anzahl an Todesfällen (dC1,i, dC2,i) sowie zur unter der Annahme von H0 erwarteten Anzahl (eC1,i, eC2,i) an Todesfällen. ti 12 22 23 24 27 37 Summe nC1,i 6 dC1,i 1 2 1 1 0 0 n.a. 0 5 nC2,i 5 4 2 n.a. dC2,i 0 0 0 1 eC1,i 0.5455 eC2,i 0.4545 1 3 b. Berechnen Sie aus den Ergebnissen unter a. die Teststatistik eines Log-Rank-Tests und entscheiden Sie auf dem 5% Signifikanzniveau zwischen den Hypothesen H0 und HA anhand des Quantils der Chiquadrat-Verteilung 20.95,1=3.841. Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 11 Tabelle A.1: Verteilungsfunktion (z) einer Standard-Normalverteilung z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 0 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.9997 1 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9987 0.9991 0.9993 0.9995 0.9997 2 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.9987 0.9991 0.9994 0.9995 0.9997 3 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.9988 0.9991 0.9994 0.9996 0.9997 4 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988 0.9992 0.9994 0.9996 0.9997 5 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.9989 0.9992 0.9994 0.9996 0.9997 6 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.9989 0.9992 0.9994 0.9996 0.9997 7 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.9997 8 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.9997 9 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 0.9998 (z) kann aus der Tabelle für z-Werte zwischen 0.00 und 3.49 abgelesen werden, z.B. (1.96)=0.9750. Eine separate Tabellierung von (z) für negative z-Werte ist nicht erforderlich, da wegen der Symmetrie der Normalverteilung (-z)=1-(z) gilt, so dass z.B. (-1.64)=1-(1.64)=1-0.9495=0.0505. Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 12 Tabelle A.2: Ausgewählte Quantile t1-, der t-Verteilung Freiheitsgrade () t0.900, t0.950, t0.975, t0.990, t0.999, 1 3.0777 6.3138 12.7062 31.8205 318.3088 2 1.8856 2.9200 4.3027 6.9646 22.3271 3 1.6377 2.3534 3.1824 4.5407 10.2145 4 1.5332 2.1318 2.7764 3.7469 7.1732 5 1.4759 2.0150 2.5706 3.3649 5.8934 6 1.4398 1.9432 2.4469 3.1427 5.2076 7 1.4149 1.8946 2.3646 2.9980 4.7853 8 1.3968 1.8595 2.3060 2.8965 4.5008 9 1.3830 1.8331 2.2622 2.8214 4.2968 10 1.3722 1.8125 2.2281 2.7638 4.1437 11 1.3634 1.7959 2.2010 2.7181 4.0247 12 1.3562 1.7823 2.1788 2.6810 3.9296 13 1.3502 1.7709 2.1604 2.6503 3.8520 14 1.3450 1.7613 2.1448 2.6245 3.7874 15 1.3406 1.7531 2.1314 2.6025 3.7328 16 1.3368 1.7459 2.1199 2.5835 3.6862 17 1.3334 1.7396 2.1098 2.5669 3.6458 18 1.3304 1.7341 2.1009 2.5524 3.6105 19 1.3277 1.7291 2.0930 2.5395 3.5794 20 1.3253 1.7247 2.0860 2.5280 3.5518 Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“ 13 Abbildung A.3: Einfache und multiple lineare Regressionsanalyse des Zusammenhangs von Lungen-Vitalkapazität und Betriebszugehörigkeit