Übungsaufgaben - Christian-Albrechts

Werbung
Übungsaufgaben zur Vorlesung
„Methodik des wissenschaftlichen Arbeitens“
Institut für Medizinische Informatik und Statistik
Medizinische Fakultät der Christian-Albrechts-Universität Kiel
Universitäts-Klinikum Schleswig-Holstein Campus Kiel
Brunswiker Straße 10
24105 Kiel
Bemerkung: Die vorliegende Aufgabensammlung bildet die Grundlage der Übungen zur
Vorlesung „Methodik des wissenschaftlichen Arbeitens“. Bei den Übungen handelt es sich um
eine Pflichtveranstaltung, die den Zweck hat, die in der begleitenden (wahlfreien) Vorlesung
vermittelten Lehrinhalte zu vertiefen und die Studierenden auf das anschließend stattfindende
Literaturseminar im Q1 vorzubereiten. Ungeachtet der nicht gegebenen Anwesenheitspflicht
wird allen Studierenden im Q1 der regelmäßige Besuch der Vorlesung dringend empfohlen. Um
einen möglichst nachhaltigen Lernerfolg zu erzielen, sollten zudem alle Aufgaben von allen
Studierenden jeweils vor der entsprechenden Übungsstunde selbstständig bearbeitet werden.
Die Lösungen werden während der Übung durch einzelne Studierende vorgestellt und von den
Übungsleitern gegebenenfalls näher erläutert. Die Aufgabenstellung orientiert sich am Inhalt der
Vorlesung, in der auch das zur Lösung benötigte Wissen vermittelt wird.
Übung 1 (Deskriptive Statistik)
1. (Lage- und Streuungsmaße, Box-Whisker-Plot) a:1 b:1 c:1 d:1
Im Zuge einer bevölkerungsmedizinischen Untersuchung wurde der Body-Mass-Index (BMI)
von 100 zufällig ausgewählten Männern im Alter von 18 bis 65 Jahren ermittelt.
Die Ergebnisse der Messungen sind in der folgenden Tabelle der Größe nach sortiert
aufgeführt.
BMI (kg/m2) von 100 zufällig ausgewählten Männern (18-65 Jahre)
21.68
22.57
23.52
24.07
24.50
25.45
26.14
27.24
29.64
34.00
21.89
22.58
23.53
24.10
24.54
25.56
26.15
27.48
30.56
34.09
22.02
22.83
23.58
24.14
24.55
25.62
26.31
27.85
30.84
34.16
22.07
22.95
23.60
24.22
24.62
25.67
26.38
28.02
30.85
35.49
22.11
23.01
23.62
24.23
24.68
25.72
26.44
28.04
31.19
36.32
22.14
23.10
23.64
24.24
24.71
25.80
26.51
28.44
31.24
37.57
22.17
23.13
23.67
24.24
25.08
25.80
26.55
28.65
31.90
38.46
22.20
23.14
23.84
24.39
25.29
25.91
26.80
29.05
33.00
38.87
22.41
23.18
23.96
24.45
25.38
25.98
27.12
29.37
33.12
40.56
22.55
23.18
24.05
24.49
25.45
26.11
27.17
29.56
33.83
41.38
Aus den 100 Probanden wurden nach dem Zufallsprinzip 15 Kandidaten für eine eingebettete
Interventionsstudie ausgewählt. Die BMI-Werte dieser Probanden sind in der Tabelle markiert.
a. Ermitteln Sie für die Teilstichprobe den Mittelwert und die Standardabweichung des BMI.
b. Ermitteln Sie für die Teilstichprobe den Median und die Quartile sowie den
Interquartilabstand des BMI.
c. Ermitteln Sie den Median und die Quartile des BMI für die gesamte Stichprobe.
d. Skizzieren Sie für die gesamte Stichprobe den Box-Whisker-Plot.
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
2
Übung 2 (Wahrscheinlichkeitstheorie)
1. (diskrete Zufallsvariable, Wahrscheinlichkeitsfunktion, Erwartungswert) a:1 b:1
Etwa 8% der deutschen Bevölkerung sind so genannte „Non-Responder“ für die Hepatitis-B
Schutzimpfung, d.h. bei ihnen führt auch die übliche dreistufige Impfung (nach 0, 1 und 6
Monaten) nicht zu einer Immunisierung.
a. Berechnen Sie alle möglichen Werte der Wahrscheinlichkeitsfunktion der
Zufallsvariablen „Anzahl der Non-Responder unter 6 geimpften Personen“ (kurz:„X).
Berechnen Sie den Erwartungswert der Zufallsvariablen X.
b. Mit welcher Wahrscheinlichkeit befindet sich unter 6 geimpften Personen höchstens ein
Non-Responder?
Mit welcher Wahrscheinlichkeit befindet sich unter 6 geimpften Personen mindestens ein
Non-Responder?
2. (stetige Zufallsvariable, Dichtefunktion, Normalverteilung) a:1 b:1 c:1
Die Körpergröße Kieler Studentinnen ist normalverteilt mit einem Erwartungswert von 168 cm
und einer Varianz von 36 cm2.
a. Skizzieren Sie die Dichtefunktion der Zufallsvariablen „Körpergröße einer Kieler
Studentin“ (kurz: Y).
Interpretieren Sie anhand der Skizze den Erwartungswert und die Varianz von Y.
b. Mit welcher Wahrscheinlichkeit ist eine zufällig ausgewählte Kieler Studentin höchstens
174 cm groß?
Hinweis: Verwenden Sie zur Lösung die Transformation der Zufallsvariablen Y in eine
Zufallsvariable Z mit Standard-Normalverteilung; die Quantile der N(0,1)-Verteilung
finden Sie in Tabelle A.1.
c. Mit welcher Wahrscheinlichkeit ist eine zufällig ausgewählte Kieler Studentin zwischen
171 cm und 178.5 cm groß?
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
3
Übung 3 (Parameterschätzung)
1. (Binomial-Verteilung, Maximum-Likelihood-Schätzung) a:1 b:1
Von den 100 Personen einer Population sind 10 Personen erkrankt. In drei Zufallsstichproben
aus dieser Population (A, B, C) befanden sich 2, 3 bzw. 4 Erkrankte.
a. Welcher Parameter kann aus diesen Stichproben sinnvollerweise geschätzt werden?
Welche Voraussetzung muss dafür erfüllt sein?
b. Welche Schätzfunktion sollte für die unter a. genannte Schätzung verwendet werden
und warum?
Schätzen Sie den unter a. genannten Parameter aus jeder der drei Stichproben und
vergleichen Sie die Ergebnisse.
2. (Normalverteilung, Punktschätzung, Konfidenzintervall) a:1 b:1 c:1
Im Rahmen einer sportmedizinischen Studie wurde bei 100 Kieler Studentinnen deren
Körpergröße gemessen. Die Ergebnisse sind in der folgenden Tabelle zusammengefasst.
Körpergröße (cm) von 100 Kieler Studentinnen
174.5
170.2
173.1
172.5
170.4
169.1
168.5
169.4
169.1
180.5
177.2
169.1
174.0
167.3
166.5
173.9
173.7
166.6
177.4
182.4
169.5
170.9
175.8
178.7
168.1
159.7
171.9
172.7
166.1
169.1
170.4
171.3
170.9
169.7
169.5
171.4
175.6
167.4
165.0
174.3
163.9
172.5
167.6
176.5
168.5
166.7
171.7
171.2
171.2
173.3
171.7
174.6
169.0
168.8
168.7
166.9
174.4
180.4
169.5
172.5
186.4
178.1
164.2
170.1
177.9
173.8
169.5
178.2
177.9
169.6
176.1
180.6
166.9
164.9
170.4
167.5
162.4
163.2
168.2
170.9
171.9
165.7
175.4
167.4
176.2
167.6
169.8
169.8
168.3
175.5
174.4
169.7
182.1
175.9
181.0
177.4
173.7
166.5
174.8
178.0
a. Mit welchen Schätzfunktionen sollten Erwartungswert  und Standardabweichung  der
(normalverteilten) Körpergröße der Kieler Studentinnen geschätzt werden und warum?
Schätzen Sie beide Parameter aus der Stichprobe.
Hinweis:

n
i1
(x i  x)2 i1 x 2i  n  x 2 ;
n

n
i1
x i  17170.9;

n
i1
x 2i  2950720
b. Geben Sie ein 95%- und ein 99%-Konfidenzintervall für den Erwartungswert  an.
Hinweis: Quantile der t-Verteilung sind t0.975,99=1.99 und t0.995,99=2.63.
c. Für eine weitere Studie wurde eine Teilstichprobe von 10 Studentinnen entnommen (in
der Tabelle grau markiert). Schätzen Sie  aus dieser Teilstichprobe und geben Sie ein
95%- und ein 99%-Konfidenzintervall für  an.
Hinweis: Quantile der t-Verteilung sind t0.975,9=2.26; t0.995,9=3.25, x  170.54; s  5.36 .
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
4
Übung 4 (Epidemiologie)
1. (Fall-Kontrollstudie, Odds-Ratio) a:1 b:1
In einer Klinik wurde retrospektiv über einen Zeitraum von 5 Jahren der Einfluss eines erhöhten
Alkohol-Konsums auf das Auftreten eines Ösophagus-Karzinoms untersucht. Als
Vergleichsgruppe wurden dabei Patienten mit anderen internistischen Krankheitsbildern
herangezogen.
Alkoholkonsum
>80g Alkohol pro Tag
80g Alkohol pro Tag
Gesamt
Ösophagus-Karzinom
Ja
Nein
192
54
208
333
400
387
a. Schätzen Sie die Odds-Ratio erhöhten Alkoholkonsums (>80g pro Tag) für das
Auftreten eines Ösophagus-Karzinoms.
Warum kann aus dieser Studie kein relatives Risiko bestimmt werden?
b. Geben Sie für die Odds-Ratio ein 95%-Konfidenzintervall an.
2. (Kohorten Studie, relatives Risiko, Überschussanteil) a:1 b:1 c:1
In einer chirurgischen Abteilung wurde prospektiv über einen Zeitraum von 6 Monaten das
Auftreten von Wundheilungsstörungen während der stationären Liegezeit nach OP erfasst.
Zusätzlich wurde vor der OP bei allen Patienten eine Risiko-Anamnese erhoben.
RisikoAnamnese
Positiv
Negativ
Gesamt
Wundheilungsstörung
Ja
Nein
44
171
64
734
108
905
Gesamt
215
798
1013
a. Schätzen Sie das relative Risiko einer Risiko-Anamnese für eine Wundheilungsstörung.
b. Wie hoch ist das populationsattributable Risiko (Überschussanteil)?
c. Geben Sie für das relative Risiko ein 95%-Konfidenzintervall an.
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
5
Übung 5 (Diagnostische Tests)
1. (bedingte Wahrscheinlichkeit, Bayes Theorem) a:1 b:1 c:1
Das Vorliegen einer HIV-Infektion kann mithilfe eines ELISA-Tests überprüft werden. Dieses
Verfahren, bei dem Antikörper gegen HIV (nicht das Virus selbst) im Blut des Probanden
nachgewiesen werden, verfügt über eine Sensitivität und Spezifität von jeweils 99.5%. Die
Prävalenz der HIV-Infektion beträgt in Deutschland etwa 0.01% unter Mitgliedern der so
genannten „low-risk“ Population (d.h. heterosexuell, nicht drogenabhängig etc.) und 15% unter
intravenösen Drogenbenutzern.
a. Ermitteln Sie für beide Bevölkerungsgruppen die jeweiligen positiv prädiktiven Werte des
ELISA-Tests.
b. Ermitteln Sie für beide Bevölkerungsgruppen die jeweiligen negativ prädiktiven Werte
des ELISA-Tests.
c. Wie hoch ist der positiv prädiktive Wert eines zweiten, unabhängigen ELISA-Tests für
„low-risk“ Probanden, bei denen der erste Test positiv ausgefallen war?
2. (Sensitivität, Spezifität) a:1 b:1
Zur Diagnose des Gestationsdiabetes (GD) gibt es zwei alternative Diagnoseverfahren, die
deutlich weniger belastend sind als der übliche orale 100g Glucose-Toleranz-Test (der „GoldStandard“ der GD-Diagnostik). Hierbei handelt es sich um den 50g Glucose-Challenge-Test
(GCT) und die Bestimmung des Nüchternblutzuckers (Fasting Plasma Glucose Concentration,
FPGC). Beide Verfahren wurden in einer prospektiven Studie hinsichtlich ihrer Aussagekraft
und Zuverlässigkeit miteinander verglichen.
In einer Stichprobe von 520 zufällig ausgewählten Schwangeren wurde bei 53 Teilnehmerinnen
mittels oralem 100g Glucose-Toleranz-Test ein Gestationsdiabetes (GD) diagnostiziert. Die
gleichen Frauen waren zuvor auch einem GCT und einer FPGC Bestimmung unterzogen
worden.
GD
Ja
Nein
GCT
Positiv
36
84
FPGC
Negativ
17
383
Positiv
43
112
Negativ
10
355
a. Schätzen Sie aus den Daten der Tabelle Sensitivität und Spezifität der GCTBestimmung für den GD.
b. Schätzen Sie aus den Daten der Tabelle Sensitivität und Spezifität der FPGCBestimmung für den GD.
Welches Verfahren ist Ihrer Meinung nach (aus ärztlicher Sicht) besser zum
routinemäßigen Screening auf GD geeignet?
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
6
Übung 6 (Statistisches Testen I)
1. (Hypothesen, Signifikanzniveau, Power) a:1 b:1 c:1 d:1
Bei gesunden Personen im Alter zwischen 20 und 44 Jahren beträgt die mittlere PlasmaCalcium-Konzentration (Ca) 2.5 mmol/l. Es wird vermutet, dass die Ca-Werte von Patienten mit
Congenital Central Hypoventilation Syndrome (CCHS) erhöht sind.
In einer Stichprobe von acht CCHS-Patienten wurden folgende Ca-Werte gemessen.
Patient
Ca (mmol/l)
1
5.4
2
2.6
3
4.3
4
3.3
5
2.7
6
2.3
7
2.4
8
3.7
a. Formulieren Sie die eingangs skizzierte wissenschaftliche Fragestellung als statistisches
Entscheidungsproblem. Benennen Sie Nullhypothese (H0) und Alternativhypothese (HA),
und legen Sie ein geeignetes Signifikanzniveau fest.
b. Welcher statistische Test kann zur Entscheidung zwischen H0 und HA verwendet
werden, wenn man annimmt, dass die Ca-Konzentration einer Normalverteilung folgt?
Wie lauten die kritischen Werte der zugehörigen Teststatistik zum 5%, 1% und 0.1%
Signifikanzniveau (siehe Tabelle A.2)?
c. Berechnen Sie die unter b. genannte Teststatistik aus den tabellierten Ca-Werten und
interpretieren Sie das Ergebnis.
d. Bei hinreichend feiner Tabellierung der t-Quantile ließe sich für die unter c. errechnete
Teststatistik auch der p-Wert bestimmen.
Welche qualitative Aussage über dessen Größe lässt sich bereits auf der Grundlage des
Ergebnisses von c. und der t-Quantile in Tabelle A.2 treffen?
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
7
Übung 7 (Statistisches Testen II)
1. (Fallzahlplanung, Signifikanzniveau, Power) a:1 b:1 c:1
In einer Phase-II-Studie an 20 adipösen Probanden wurde die Wirkung einer täglichen Gabe
von 250 mg M-Oglitin auf das Körpergewicht untersucht.
Innerhalb von acht Wochen erreichten die Probanden eine mittlere Gewichtsabnahme von 5.2
kg, bei einer geschätzten Standardabweichung von 3.7 kg.
a. Mit welchem statistischen Test lässt sich das Ergebnis dieser Studie bewerten?
Berechnen Sie die Teststatistik und interpretieren Sie das Ergebnis.
Welche Konsequenzen ergeben sich daraus für die Fragestellung einer folgenden
Phase III-Studie (siehe b.)?
b. Wie viele Probanden müsste man in eine placebokontrollierte Phase-III-Studie
einschließen, um den beobachteten Effekt auf dem 5% Signifikanzniveau mit 80%
Power zu verifizieren? Gehen Sie dabei von einem Placeboeffekt von 3.0 kg
Gewichtsabnahme bei gleicher Standardabweichung von 3.7 kg aus.
c. Wie viele Probanden würde man benötigen, wenn bei gleicher Power (80%) das
Signifikanzniveau auf 1% gesenkt bzw. bei gleichem Signifikanzniveau (5%) die Power
auf 90% erhöht würde?
2. (Vergleich von Anteilen, multiples Testen) a:1 b:1 c:1
In einer prospektiven, doppelblinden und placebokontrollierten Phase-III-Studie wurde die
Wirksamkeit des Medikaments Bulliforton zur Behandlung postprandialer Verdauungsbeschwerden von Typ II Diabetes-Patienten untersucht. Primärer Endpunkt (EP) der Studie war
eine Reduktion des Upper Abdominal Discomfort Severity Scores nach 4 Wochen (UADS4) um
mindestens 200 Punkte gegenüber der Baseline (UADS0). Sekundäre EP waren eine Reduktion
des UADS Scores um mindestens 200 Punkte nach 2 Wochen, und auf weniger als 150 Punkte
nach 4 Wochen. Die Ergebnisse der Studie sind in der folgenden Tabelle zusammengefasst.
Gruppe
Gesamt
Verum
Placebo
493
487
primärer EP
UADS4
UADS0-200
148
122
sekundäre EP
UADS2
UADS4150
UADS0-200
128
98
101
71
a. Formulieren Sie die wissenschaftliche Fragestellung der Studie als statistisches
Entscheidungsproblem hinsichtlich des primären EP. Wie lauten H0 und HA?
Welche Teststatistik kann sinnvoller Weise zur Entscheidungsfindung verwendet
werden?
b. Berechnen Sie die Teststatistik für den primären EP und interpretieren Sie das Ergebnis.
Hinweis: Das Quantil der Chiquadrat-Verteilung ist 20.95,1=3.841.
c. Für die sekundären EP ergaben sich folgende Werte der unter a. gewählten
Teststatistik: 3.734 (UADS2UADS0-200) und 4.821 (UADS4150).
Wie sind diese und das unter b. ermittelte Resultat bei Annahme eines 5%
Signifikanzniveaus zu interpretieren?
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
8
Übung 8 (Korrelation und Regression)
1. (Lineare Regression, Pearson- und Spearman-Korrelationskoeffizient) a:1 b:1 c:1 d:1 e:1
Bei 10 männlichen Unfallpatienten wurde der Harnstoff im Serum (mmol/l) bestimmt.
Patient
1
2
3
4
5
6
7
8
9
10
Alter
70
76
81
85
44
58
51
74
45
67
Harnstoff
4.1
5.6
8.8
9.7
2.9
3.1
3.5
6.8
2.8
3.8
a. Schätzen Sie aus den Daten in der Tabelle den Achsenabschnitt und die Steigung einer
Regressionsgeraden.
b. Schätzen Sie aus den Daten Pearson-Korrelationskoeffizient und Bestimmtheitsmaß.
Hinweis: Zur Berechnung von sX, sY und sXY verwenden Sie bitte
10
10
10
i1(xi  x)  (yi  y)  292.99 .
i1(xi  x)2  1972.90 i1(yi  y)2  57.37
(siehe auch Fußnote 1)
c. Ist der Pearson-Korrelationskoeffizient signifikant von 0 verschieden? Welche
Teststatistik kann zur Prüfung der Null-Hypothese verwendet werden?
Berechnen Sie diese Teststatistik und interpretieren Sie das Ergebnis.
d. Zeichnen Sie die Regressionsgerade aus b. in das folgende Streudiagramm ein.
Wie ist das Resultat der linearen Regressionsanalyse zu interpretieren?
e. Berechnen Sie für die Daten der Tabelle den Spearman-Korrelationskoeffizienten XY
und vergleichen Sie diesen mit dem Pearson-Korrelationskoeffizienten.
Wie ist der Unterschied der beiden Korrelationskoeffizienten zu erklären?
1
Für eine Stichprobe gepaarter Beobachtungen (x1,y1),…,(xn,yn) gilt:
1
1
n
n
i1 (xi  x)  (yi  y)
i1( x i  x)2 und sXY 
s 2X 
n 1
n1
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
9
Übung 9 (Statistische Modellbildung)
1. (multiple lineare Regression) a:1
Durch die Untersuchung einer repräsentativen Stichprobe (n=100) sollte geklärt werden, ob bei
den Mitarbeitern von Cadmium verarbeitenden Chemieunternehmen ein Zusammenhang
zwischen deren Lungen-Vitalkapazität (VK, gemessen in Liter) und der Betriebszugehörigkeit
(gemessen in Jahren) besteht. In der folgenden Tabelle sind die Resultate der einfachen und
multiplen Regressionsanalysen unter Adjustierung für das Lebensalter (in Jahren) aufgeführt.
Einflussgröße/Parameter
Betriebszugehörigkeit
Lebensalter
Achsenabschnitt
Bestimmtheitsmaß
b (p-Wert)
-0.048 (<0.001)
--6.020 (<0.001)
0.762
einfache Analyse
b (p-Wert)
---0.051 (<0.001)
7.023 (<0.001)
0.822
multiple Analyse
b (p-Wert)
-0.006 (0.452)
-0.046 (<0.001)
6.924 (<0.001)
0.823
a. Stellen Sie für die beiden einfachen Regressionsanalysen und für die multiple
Regressionsanalyse die resultierenden Modellgleichungen auf.
Wie sind die Resultate dieser linearen Regressionsanalysen zu interpretieren (siehe
dazu auch Abbildung A.3)?
2. (logistische Regression, Odds-Ratio) a:1 b:1 c:1
In einer retrospektiven Studie wurden medizinische und epidemiologische Daten von 244
holländischen Männern im Alter zwischen 55 und 65 Jahren ausgewertet, bei denen aufgrund
eines PSA-Wertes (Prostate-Specific Antigen) in der diagnostischen Grauzone von 3-10 g/l ein
Verdacht auf Prostatakrebs bestand. Dabei konnten mittels logistischer Regressionsanalyse
neben dem Quotienten von freiem (F) und totalem (T) PSA auch ein positiver rektaler
Tastbefund (Digital Rectal Examination, DRE) und eine positive Familienanamnese als
signifikante diagnostische Marker für Prostatakrebs identifiziert werden.
Logistische Regressionsanalyse diagnostischer Marker für Prostatakrebs,
durchgeführt an 244 Männern im Alter zwischen 55 und 65 Jahren
Parameter
Achsenabschnitt
Quotient F :T
DRE (+)
Familienanamnese (+)
Regressionskoeffizient
-0.169
-10.197
1.643
1.076
95% KI
-.(-18.932,-3.053)
(0.752,2.559)
(0.012,2.131)
p-Wert
-.0.0054
0.0004
0.0437
a. Wie sind die Resultate der logistischen Regressionsanalyse zu interpretieren?
Transformieren Sie dazu die Regressionskoeffizienten der beiden dichotomen
Einflussgrößen DRE und Familienanamnese auf geeignete Weise in Odds-Ratios.
b. Ermitteln Sie die Wahrscheinlichkeit für das Vorliegen eines Prostatakrebs bei einem F:T
Quotienten von 0.07, positivem Tastbefund und positiver Familienanamnese.
c. Ermitteln Sie die Wahrscheinlichkeit für das Vorliegen eines Prostatakrebs bei einem F:T
Quotienten von 0.35, negativem Tastbefund und negativer Familienanamnese.
Vergleichen Sie das Ergebnis mit der unter b. ermittelten Wahrscheinlichkeit.
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
10
Übung 10 (Überlebenszeitanalyse)
1. (Kaplan-Meier-Schätzung) a:1 b:1
Für fünf Individuen liegen folgende Überlebenszeiten (in Jahren) vor.
Individuum
Überlebenszeit
1
2
3
6
7(*)
2
(*): zensierte Beobachtungen
4
8
5
4(*)
a. Schätzen Sie mit dem Kaplan-Meier-Verfahren die Überlebenswahrscheinlichkeiten für
die Jahre 1 bis 8. Ergänzen Sie hierzu die nachstehende Sterbetafel.
ti
2
ni
5
P̂(T  t i1 )
1.000
di
1
P̂(T  t i )
0.800
P̂(T  t i | T  t i1 )
0.800
b. Skizzieren Sie den Verlauf der geschätzten Überlebenswahrscheinlichkeiten („KaplanMeier-Kurve“) und markieren Sie die zensierten Beobachtungen.
2. (Log-Rank-Test) a:1 b:1
In der folgenden Tabelle sind die Überlebenszeiten (in Monaten) aufgeführt, die in zwei
Patientengruppen nach Durchlaufen unterschiedlicher Behandlungsschemata C1 und C2
beobachtet wurden.
Therapie C1
Therapie C2
12
24
18(*)
22
22
25(*)
27
36(*)
(*): zensierte Beobachtungen
23
37
27
a. Formulieren Sie H0 und HA.
Ergänzen Sie die nachstehende Tabelle um die fehlenden Angaben zur Anzahl von
Personen unter Risiko (nC1,i, nC2,i), zur beobachteten Anzahl an Todesfällen (dC1,i, dC2,i)
sowie zur unter der Annahme von H0 erwarteten Anzahl (eC1,i, eC2,i) an Todesfällen.
ti
12
22
23
24
27
37
Summe
nC1,i
6
dC1,i
1
2
1
1
0
0
n.a.
0
5
nC2,i
5
4
2
n.a.
dC2,i
0
0
0
1
eC1,i
0.5455
eC2,i
0.4545
1
3
b. Berechnen Sie aus den Ergebnissen unter a. die Teststatistik eines Log-Rank-Tests und
entscheiden Sie auf dem 5% Signifikanzniveau zwischen den Hypothesen H0 und HA
anhand des Quantils der Chiquadrat-Verteilung 20.95,1=3.841.
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
11
Tabelle A.1: Verteilungsfunktion (z) einer Standard-Normalverteilung
z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
0
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
1
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
2
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
3
0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983
0.9988
0.9991
0.9994
0.9996
0.9997
4
0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7704
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984
0.9988
0.9992
0.9994
0.9996
0.9997
5
0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984
0.9989
0.9992
0.9994
0.9996
0.9997
6
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.9997
7
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
8
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
9
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
(z) kann aus der Tabelle für z-Werte zwischen 0.00 und 3.49 abgelesen werden, z.B. (1.96)=0.9750.
Eine separate Tabellierung von (z) für negative z-Werte ist nicht erforderlich, da wegen der Symmetrie
der Normalverteilung (-z)=1-(z) gilt, so dass z.B. (-1.64)=1-(1.64)=1-0.9495=0.0505.
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
12
Tabelle A.2: Ausgewählte Quantile t1-, der t-Verteilung
Freiheitsgrade ()
t0.900,
t0.950,
t0.975,
t0.990,
t0.999,
1
3.0777
6.3138
12.7062
31.8205
318.3088
2
1.8856
2.9200
4.3027
6.9646
22.3271
3
1.6377
2.3534
3.1824
4.5407
10.2145
4
1.5332
2.1318
2.7764
3.7469
7.1732
5
1.4759
2.0150
2.5706
3.3649
5.8934
6
1.4398
1.9432
2.4469
3.1427
5.2076
7
1.4149
1.8946
2.3646
2.9980
4.7853
8
1.3968
1.8595
2.3060
2.8965
4.5008
9
1.3830
1.8331
2.2622
2.8214
4.2968
10
1.3722
1.8125
2.2281
2.7638
4.1437
11
1.3634
1.7959
2.2010
2.7181
4.0247
12
1.3562
1.7823
2.1788
2.6810
3.9296
13
1.3502
1.7709
2.1604
2.6503
3.8520
14
1.3450
1.7613
2.1448
2.6245
3.7874
15
1.3406
1.7531
2.1314
2.6025
3.7328
16
1.3368
1.7459
2.1199
2.5835
3.6862
17
1.3334
1.7396
2.1098
2.5669
3.6458
18
1.3304
1.7341
2.1009
2.5524
3.6105
19
1.3277
1.7291
2.0930
2.5395
3.5794
20
1.3253
1.7247
2.0860
2.5280
3.5518
Übungsaufgaben zur Vorlesung „Methodik des wissenschaftlichen Arbeitens“
13
Abbildung A.3: Einfache und multiple lineare Regressionsanalyse des Zusammenhangs von Lungen-Vitalkapazität und Betriebszugehörigkeit
Herunterladen