Medizinische Biometrie (L5)

Werbung
Quantitative Methoden in
der klinischen Epidemiologie
Korrelation und lineare Regression
IBE, Korr. (L6-2)
1
Lernziele
• Besteht ein funktioneller Zusammenhang zwischen zwei Messungen
an einem Patienten?
• Korrelation als Maßzahl für die Stärke eines linearen
Zusammenhanges
• Beschreiben des linearen Zusammenhanges
• Korrelationsanalysen wenn eine Folge von Messwertpaaren pro
Patient erhoben wird.
• Nicht-parametrische Korrelation: Monotonie des Zusammenhanges.
• Probleme: Scheinkorrelation und Korrelation bei aggregierten
Daten.
• Korrelation und kausaler Zusammenhang
• Prädiktion von zukünftigen Werten
• Übereinstimmung von Messungen
IBE, Korr. (L6-2)
2
Beispiel: Alter und Fettanteil (I)
Eine Studie von Mazess et al. (1984) untersucht den prozentualen
Fettanteil (% Fett) im Körper von n=18 gesunden Erwachsenen im
Alter von 23 bis 61 Jahren.
Besteht ein Zusammenhang zwischen dem Alter und dem Fettgehalt
im Körper?
Subj. Alter Fett[%]
Subj. Alter Fett[%]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
23
23
27
27
39
41
45
49
50
9.5
27.9
7.8
17.8
31.4
25.9
27.4
25.2
31.1
IBE, Korr. (L6-2)
53
53
54
56
57
58
58
60
61
34.7
42.0
29.1
32.5
30.3
33.0
33.8
41.1
34.5
3
Beispiel: Alter und Fettanteil (II)
25
20
15
10
Fett [%]
30
35
40
Beispiel „Fettanteil“
30
40
50
60
Alter [Jahre]
IBE, Korr. (L6-2)
4
Pearson‘s Korrelationskoeffizient: Formel (I)
Formel:
Gleichsinnigkeit von x- und y-Werten
führt zu großen Werten in
n
 (xi  x )  ( yi  y )
n
 (xi  x )  ( yi  y )
r=
i1
n
n
i1
i1
2
2
 (xi  x )   ( yi  y )
i1
Straffheit bedeutet geringe Variabilität,
damit wird der Nenner klein und der Bruch
groß.
n
n
2
 (xi  x )   ( yi  y )2
i1
i1
Der Korrelationswert ändert sich nicht, wenn die Rolle von x und y
vertauscht wird.
IBE, Korr. (L6-2)
5
Beispiel: Alter und Fettanteil (II)
30
35
40
Beispiel „Fettanteil“
25
20
15
10
Fett [%]
y=28,3
30
40
50
60
Alter [Jahre]
IBE, Korr. (L6-2)
x=46,3
6
Pearson‘s Korrelationskoeffizient: Richtung (II)
Erwünschte Eigenschaften eines statistischen Maßes für einen linearen
Zusammenhang :
Vorzeichen gibt die Richtung des Zusammenhanges an.
Negativer Wert:
Mit zunehmendem x-Wert nimmt der y-Wert ab
Positiver Wert:
Mit zunehmendem x-Wert nimmt der y-Wert zu
Positive
Korrelation
y-Achse
Negative
Korrelation
y-Achse
•
x-Achse
x-Achse
IBE, Korr. (L6-2)
7
Pearson‘s Korrelationskoeffizient: Quiz (III)
Abweichen (in beiden Richtungen) von der Null gibt Stärke des Zusammenhanges
an:
= 0, falls kein linearer Zusammenhang
= 1 (bzw. = -1), bei maximalem linearen Zusammenhang
Korrelationsquiz: Für welche der abgebildeten Situationen vermuten Sie einen
Korrelationswert, der näher an der 0 als an +1 oder -1 liegt?
IBE, Korr. (L6-2)
8
Pearson‘s Korrelationskoeffizient: Skalierung (IV)
Der Korrelationskoeffizient ist dimensionslos und skalenunabhängig:
Die Multiplikation der Variablenwerte mit einem konstanten Faktor oder deren
Verschiebung um einen konstanten Wert haben keinen Einfluß auf den Wert des
Korrelationsmaßes.
Beispiel: Der Korrelationskoeffizient ist unabhängig davon, ob die Messung in
Metern oder Zentimetern erfolgt ist.
Gleiche Korrelation
IBE, Korr. (L6-2)
9
Pearson‘s Korrelationskoeffizient: Statistik (V)
Beispiel „Fettanteil“:
Nach Anwendung der Formel auf die Daten von Mazess et al.
ergibt sich r = 0.792
95% Konfidenzintervall: [0.516; 0.919]
Formeln für diese Berechnung sind kompliziert, Angaben
werden aber von den meisten Statistikprogrammen
geliefert.
Test auf Korrelation:
Nullhypothese: Es besteht kein linearer Zusammenhang
p-Wert: 0.000893
IBE, Korr. (L6-2)
10
Interpretationsprobleme mit Korrelationen (I)
Statistischer Zusammenhang ist kein kausaler Zusammenhang. Das
gleichsinnige Verhalten beider Variablen kann durch eine verborgene dritte
Variable gesteuert werden.
Anderes Beispiel:
Abhängigkeit von Gehalt und Schuhgröße:
Korrelation durch
Confounding
Männer
Frauen
Einkommen
Beispiel: Der Korrelationskoeffizient zwischen der Fähigkeit Rechenaufgaben
zu lösen und der Körpergröße bei Kindern ist positiv. Beides nimmt mit dem
Alter zu.
Schuhgröße
IBE, Korr. (L6-2)
11
Interpretationsprobleme mit Korrelationen (II)
•
Pro Individuum darf nur ein Beobachtungspaar vorliegen. Oft wird
aber auch die Frage nach der Korrelation zweier „Marker“ im
Verlauf einer Erkrankung bei einem Patienten gefragt. Hier müssen andere
Verfahren zur Berechnung der Korrelation verwendet werden
•
Selektionsprozesse können Korrelationsaussagen beeinflussen:
Auswahl innerer Werte
Auswahl extremer Werte
vergrößert die Korrelation
verringert die Korrelation
IBE, Korr. (L6-2)
12
Interpretationsprobleme mit Korrelationen (III)
40
Verzerrte Korrelation bei gemischten Stichproben
25
20
15
Fett[%]
30
35
Korrelation
aller: r = 0.792
Männer: r = 0.89
Frauen: r = 0.51
Mann
Frau
10
•
30
IBE, Korr. (L6-2)
40
Alter[Jahre]
50
60
13
Interpretationsprobleme mit Korrelationen (IV)
•
Gefahr der Überinterpretation beim simultanen Untersuchen
vieler Korrelationen. Manche signifikante Korrelation kann falsch
positiv sein. (Adjustierung für multiples Testen).
10 stetige Variablen erlauben die Untersuchung von 45
Korrelationen.
•
Korrelation misst den Grad des Zusammenhanges, nicht den Grad
der Übereinstimmung.
Gleiche Korrelation
Übereinstimmung
und guter Zusammenhang
Keine Übereinstimmung
aber guter Zusammenhang
IBE, Korr. (L6-2)
14
Interpretationsprobleme mit Korrelationen (V)
Grenzen der Anwendung des Korrelationskoeffizienten von Pearson:
Hat eine der zu untersuchenden Variablen nur ordinales Skalenniveau
oder liegt ein monotoner, nicht-linearer Zusammenhang vor, so ist der
Korrelationskoeffizient nach Pearson nicht das geeignete Instrument
zur Quantifizierung des Zusammenhanges.
IBE, Korr. (L6-2)
15
Spearman‘s Korrelationskoeffizient (I)
Der Korrelationskoeffizient nach Spearman entspricht dem
Korrelationskoeffizienten nach Pearson, beruht aber bei der
Berechnung nicht auf den Originalmesswerten (xi, yi), sondern auf
deren zugehörigen Rangzahlen (ri, si), die separat nach der Stellung
der jeweiligen Beobachtung in der nach Größe geordneten Messreihe
aller x und y Messwerte bestimmt werden.
rS  1 
6
n3  n
n
  di2
i1
Dabei sind di die Differenzen der Rangwerte bezüglich X bzw. Y
und n die Anzahl der Beobachtungen.
IBE, Korr. (L6-2)
16
Spearman‘s Korrelationskoeffizient (II)
Wikipedia: Spearman Korrelationskoeffizient
IQ, Xi
Stunden TV pro Woche, Yi
Rang xi
Rang yi
di
d²
86
0
1
1
0
0
97
20
2
6
-4
16
99
28
3
8
-5
25
100
27
4
7
-3
9
101
50
5
10
-5
25
103
29
6
9
-3
9
106
7
7
3
4
16
110
17
8
5
3
9
112
6
9
2
7
49
113
12
10
4
6
36
6
n
6
rS  1  3
  di2  1 
 194   0.176
1000

10
n  n i1
IBE, Korr. (L6-2)
17
Spearman‘s Korrelationskoeffizient (III)
Voraussetzungen:
• Der aus der Punktwolke vermutete Zusammenhang muss nur monoton
sein (monoton wachsend oder fallend). Es ist kein linearer
Zusammenhang notwendig.
• Beide Merkmale sind mindestens ordinalskaliert.
Eigenschaften:
Analog zum Korrelationskoeffizienten nach Pearson;
Unterschied: keine direkte Beziehung zur Regressionsanalyse, da
jetzt nicht die lineare Assoziation quantifiziert wird, sondern eine
breiter gefasste monotone Assoziation von Interesse ist.
Sein Wert wird weniger von Ausreißern beeinflusst als der des
Pearson Korrelationskoeffizienten
IBE, Korr. (L6-2)
18
Spearman‘s Korrelationskoeffizient (IV)
Zusammenhang zwischen Lungenkrebstodesfällen und Zigarettenkonsum:
Korrelationskoeffizient nach Pearson: 0.715
Korrelationskoeffizient nach Spearman: 0.726
IBE, Korr. (L6-2)
19
Fett [%]
25
20
15
10
Fett [%]
30
35
40
Beschreiben eines linearen Zusammenhanges (I)
30
40
50
60
Alter [Jahre]
Alter [Jahre]
IBE, Korr. (L6-2)
20
Beschreiben eines linearen Zusammenhanges (II)
Er Wert des Pearson-Korrelationskoeffizienten, der deutlich von der
Null verschieden ist, läßt auf einen linearen Zusammenhang schließen.
Der Wert des Pearson-Korrelationskoeffizienten gibt jedoch
keinerlei Information über die Form des linearen Zusammenhanges.
Das Verfahren der linearen Regression ermöglicht eine quantitative
Beschreibung des vermuteten Zusammenhanges.
IBE, Korr. (L6-2)
21
Lineare Regression (I)
Vorhersage einer Zielgröße Y bei gegebener Einflußgröße X durch eine
lineare Gleichung:
y = a + b•x
Der Achsenabschnitt a und die Steigung b werden so bestimmt, daß man
die Gerade enthält, die den geringsten quadratischen Abstand zu den
beobachteten (x,y) Punkten hat.
Mit dieser Strategie ergibt sich
b = r • sy / sx
mit r – Korrelation zwischen x und y,
sx – Standardabweichung der x-Werte
sy - Standardabweichung der y-Werte
a = y - b• x
mit y Mittelwert der y-Werte,
x Mittelwert der x-Werte
IBE, Korr. (L6-2)
y
x
22
Lineare Regression (II)
Beispiel „Fettanteil“:
r=
0.7539
Korrelation zwischen x und y
sx =
13.217
x – Alter in Jahren
Standardabweichung
sy =
9.144
y – Fettgehalt [%]
Standardabweichung
b=
0.5215
Steigung der Regressionsgeraden
x=
46.33333
x – Alter in Jahren
Mittelwert
y=
28.61111
y – Fettgehalt [%]
Mittelwert
a =
3.2209
Achsenabschnitt der Regressionsgerade
Regressionsgerade: y = 3.2209 + 0.5480 • x
Pro weiterem Lebensjahr nimmt der mittlere Fettgehalt des Körpers
um etwa 0.55% zu.
IBE, Korr. (L6-2)
23
Abweichung vom Mittelwert
yi – y = (yi – y*i) + (y*i – y)
y: Mittelwert aller y-Messungen
y*i = a + b•xi: Geradenwert für Beobachtung i
yi: y-Wert der Beobachtung i
n
2
 ( yi  y)
i1
n
  ( yi  yi* )2
i1
SStotal = SSResiduen
n
  ( yi*  y)2
i1
+ SSRegression
Anteil der erklärten Varianz: SSRegression / SStotal = r²
Das Quadrat der Korrelation wird auch Bestimmtheitsmaß genannt.
IBE, Korr. (L6-2)
24
Residualanalyse (I)
Ein Residuum
Unter den Residuen einer Regressionsanalyse
versteht man die Unterschiede zwischen der
Beobachtung und dem Wert, der durch die
Regressionsgerade für diese Beobachtung
vorgegeben wird.
Die Residuen quantifizieren das Rauschen der
Beobachtungen um die Regressionsgerade.
Die Varianz der Residuen wird als Schätzer für
das Rauschen der Beobachtungen um die
Regressionsgerade verwendet.
Noch ein
Residuum
Ist die Varianz der Residuen klein, so liegen die
Beobachtungen eng um die Gerade und somit ist
der Pearson Korrelationskoeffizient der
Beobachtungen nahe an -1 oder 1.
IBE, Korr. (L6-2)
25
Residualanalyse (II)
Passt ein lineares Regressionsmodell zu den Daten:
•
Residuen repräsentieren Rauschen, sie sollten den Mittelwert 0
haben und keine Struktur aufweisen.
Ideal: ein um die Null liegendes Band, falls man auf der x-Achse den
x-Wert einer Beobachtung aufträgt und auf der y-Achse deren
Residuum.
•
Falls die Residuen normalverteilt sind, so lassen sich Aussagen über
die Regression auch statistisch testen. Es lassen sich dann
Konfidenzintervalle berechnen:
95% Konfidenzintervall für die Abszisse der Geraden und die
Geradensteigung.
•
Betrachte Residuen mit dem QQ-Plot um die Normalverteilungsannahme zu prüfen.
IBE, Korr. (L6-2)
26
Residualanalyse (III)
-2
+
0
2
4
6
3
+
+
+
+ +
+
++ +
+
++ +
++ ++
+
+
1
+
+
+
+
+
+
++
+
+
+
+
+
+
++
++
++ +
+
+
+
+
+
+ +
+
+
+
+
+
++
+
+
++
+
+
+
+
+ +
+
++
+++
++
+
+
+
++
++
2
+
+
++
0
+ +
+ +
+
+
+
+
++
+ +
+ ++
+
++ +
+
+
-1
+
+
+
+
++
+
-2
+++
+
-1
0
1
+
+
+
+
+
+
+
++ +
+
++
+
+
++
+
+
+
+
+
++
+
+
+ +
+
+ ++
+
+ ++
++
++ +
+
+
+ ++ + + +
+ + ++
++
+
+
+
+
+
+
+
+
+ ++
+ ++
++
+
+
+
+
-3
+
y
+
+
+
+
Kruemmung
y
2
Ideale Situation
8
10
+
0
x
2
4
6
8
10
x
8
zunehmende Variabilitaet
6
4
+
+
+
+
+
2
+
+ +
+
+
+
-6
0
2
+
+
+
+
+ +
+
++ + ++ +
+ +
++++
+
+
+
+ + +
+ ++
+
-4
-2
0
y
+
+
+
+
++
+
++ + +
+
+
++ +
+
+
+ +
+
+
+
+
+
+ + + +
+
+ ++
++ + + +
+
+ +
+ +
+
+
+
+
+ +
+
+
+
+
4
+
+
6
x
8
IBE, Korr. (L6-2)
27
QQ-Plot
Die tatsächlichen Realisationen der interessierenden Variablen werden
gegen die erwarteten Werte der zu untersuchenden Verteilung (hier
Normalverteilung) geplottet:
IBE, Korr. (L6-2)
28
Korrelation innerhalb Patienten (I)
Bei 8 Probanden werden wiederholt pH und PaCO2 Messungen durchgeführt.
Wie groß ist die Korrelation zwischen beiden Messungen?
Subj. pH
PaCO2
Subj. pH
PaCO2
Subj.
pH
PaCO2
1
1
1
1
2
2
2
2
3
3
3
3
3
3
3
3
3
3.91
4.12
4.09
3.97
5.27
5.37
5.41
5.44
5.67
3.64
4.32
4.73
4.96
5.04
5.22
4.82
5.07
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
5
5.67
5.10
5.53
4.75
5.51
4.28
4.32
3.23
4.46
4.44
4.32
3.23
4.46
4.72
4.75
4.99
6
6
6
6
6
6
7
7
7
8
8
8
8
8
8
8
8
7.38
7.30
7.29
7.33
7.31
7.33
6.86
6.94
6.92
7.19
7.29
7.21
7.25
7.20
7.19
6.77
6.82
4.78
4.73
5.12
4.93
5.03
4.93
6.85
6.44
6.52
5.28
4.56
4.34
4.32
4.41
3.69
6.09
5.58
6.68
6.53
6.43
6.33
6.85
7.06
7.13
7.17
7.40
7.42
7.41
7.37
7.34
7.35
7.28
7.30
7.34
7.36
7.33
7.29
7.30
7.35
7.35
7.30
7.37
7.27
7.30
7.30
7.37
7.27
7.28
7.32
7.32
IBE, Korr. (L6-2)
Bland, Altman
(1995) BMJ,
310:446
29
7.2
7.4
Korrelation innerhalb Patienten (II)
3
3
36
5
3 33
5 656 4
5 5 8 564 3
63
5
8
88
8
5
8
3
4 4
4
2
2
7.0
7
6.8
2
6.6
1
1
1
1
4
5
7
7
8
8
6.4
Intramuraler pH
2
6
PaCO2
IBE, Korr. (L6-2)
Addiere für jeden
Patienten die
quadrierten Residuen
um seine Gerade und
die quadrierten
Abweichungen der
Geradenwerte vom
Mittelwert des
Patienten. Dies ergibt
SSResiduen und SSRegression
Daraus errechnet man
SStotal = SSResiduen +
SSRegression und für das
Quadrat der
Korrelation r²:
SSRegression / SStotal = r²
30
Korrelation innerhalb Patienten – Berechnung (III)
Problem: Eine unabhängige Variable liegt in Ordinal- oder Nominalskalierung in n Ausprägungen vor
Lösung: Umkodieren – es werden (n-1) Dummyvariablen erzeugt
Beispiel: Subject
8 Ausprägungen -> 7 Dummys
Neue Variablen
Alte Variable
Subject
p1
p2
p3
p4
p5
p6
p7
1
1
0
0
0
0
0
0
2
0
1
0
0
0
0
0
3
0
0
1
0
0
0
0
4
0
0
0
1
0
0
0
5
0
0
0
0
1
0
0
6
0
0
0
0
0
1
0
7
0
0
0
0
0
0
1
8
0
0
0
0
0
0
0
IBE, Korr. (L6-2)
31
Korrelation innerhalb Patienten – Berechnung (IV)
ANOVA
PaCO2
Subjects
Residuals
Df
1
7
41
Sum Sq
0.03438
3.00425
0.33642
SStotal = SSResiduen + SSRegression
SSResiduen
= 0.33642
SSRegression
= 0.03438
Mean Sq
F
0.03438 4.1903
0.42918 52.3054
0.00821
value Pr(>F)
0.0471 *
<2e-16 ***
Berechnung der Quadratsummen
mittels ANOVA (etwa in SPSS)
SStotal = 0.3708
r² = SSRegression / SStotal = 0.03438 / 0.3708 = 0.093
r (Korrelation) = - 0.304 (aufgrund der Richtung der Geraden)
IBE, Korr. (L6-2)
32
Vorhersage von Werten - Prädiktion
Ein Patient hat zum Zeitpunkt der Untersuchung einen Blutdruckwert von
x mmHg.
Wie kann sein Blutdruckwert für das nächste Jahr vorhergesagt werden?
Aus Studien sind folgende Tatsachen bekannt:
• Mittelwert des Blutdrucks in der Altersgruppe des Patienten (m);
• Streuung des Blutdrucks in der Altersgruppe des Patienten (s2);
• Mittlere Veränderung des Blutdrucks, wenn die Population
um ein Jahr altert (d);
• Korrelation der Blutdruckwerte, wenn ein Patient um 1 Jahr altert (ρ).
Antwort:
Vorhersage: m+d+ρ∙(x-m)
Präzision: (1-ρ2)∙s2
IBE, Korr. (L6-2)
33
Regression zum Mittelwert
m+d
d
m
m-x
d
x
Die vorhergesagte Veränderung ist exakt
Zeit
• d, wenn die Korrelation zwischen den Zeitpunkten 1 ist;
• d+(m-x), wenn es keine Korrelation zwischen beiden Zeitpunkten gibt;
• d + (1-ρ)·(m-x), wenn die Korrelation zwischen beiden Zeitpunkten ρ beträgt;
IBE, Korr. (L6-2)
34
Regression zum Mittelwert
Regression zum Mittelwert beschreibt das Phänomen, dass bei zwei
verbundenen Messungen extreme Werte bei einer der beiden Messungen im
Durchschnitt mit weniger extremen Werten bei der anderen Messung
einhergehen.
• Es tritt dann auf, wenn die Stichprobenauswahl anhand von extremen
Baselinewerten des Untersuchungsmerkmals durchgeführt wurde
• Bei perfekter Korrelation zwischen den beiden Messungen tritt der Effekt
nicht auf
• Je stärker die Korrelation zwischen den beiden Messungen ist, desto
geringer ist der Effekt
IBE, Korr. (L6-2)
35
Regression zum Mittelwert
Beispiel: Writing Group of the PREMIER Collaborative Research Group
(2003) JAMA, 289(16):2083-2093
Patienten mit hohem Blutdruck (120-159mm Hg
bzw. 80-95mm Hg, Durchschnitt aus 3
Messungen) werden in 3 Gruppen randomisiert:
Zwei Gruppen mit Verhaltensintervention
(Established/Established+DASH) und eine
Vergleichsgruppe (Advice Only)
Nach 3 Monaten und nach 6 Monaten werden
erneut Blutdruckmessungen durchgeführt
Durchschnittliche Ruhewerte:
100–130 mmHg (systolischer Wert)
60–85 mmHg (diastolischer Wert )
IBE, Korr. (L6-2)
36
Zusammenfassung
• Die Korrelation nach Pearson quantifiziert, wie gut ein Zusammenhang
durch eine lineare Funktion beschrieben werden kann.
• Liegt eine ausreichend starke Korrelation bei den untersuchten Daten vor,
so kann der lineare Zusammenhang durch eine lineare Regression
quantitativ beschrieben werden.
• Funktionelle Zusammenhänge lassen sich oft in lineare Zusammenhänge
transformieren und dann geeignet durch eine lineare Regression
beschreiben.
• Residualanalyse ist ein wichtiges Instrument um eine korrekte Beschreibung
eines linearen Zusammenhanges durch eine lineare Regression zu analysieren.
• Der Spearman‘sche Korrelationskoeffizient ist ein geeignetes Instrument
um die Güte bei monotonen Zusammenhängen zu quantifizieren.
• Korrelation ist nicht mit Übereinstimmung gleichzusetzen
• Korrelation ist verantwortlich für das Phänomen: Regression zum Mittelwert.
IBE, Korr. (L6-2)
37
Quiz
Was ist ein Residuum im linearen Modell?
a) Der Anteil der erklärten Varianz an der Gesamtvarianz
b) Die Differenz zwischen zwischen der Beobachtung und dem Wert, der
durch die Regressionsgerade für diese Beobachtung vorgegeben wird
c) Der y-Achsenabschnitt der Regressionsgerade
d) Die Steigung der Regressionsgerade
IBE, Korr. (L6-2)
38
Quiz
Welche Aussage über den Korrelationskoeffizienten von Pearson trifft nicht
zu?
a) X und Y lassen sich beliebig vertauschen
b) Der Korrelationskoeffizient von Pearson liegt zwischen -1 und 1
c) Der Korrelationskoeffizient von Pearson gibt die Stärke und die Richtung
eines beliebigen monotonen Zusammenhangs wieder
d) Liegt eine der beiden Variablen nur in ordinalem Skalenniveau vor, ist der
Korrelationskoeffizient von Pearson nicht anwendbar
IBE, Korr. (L6-2)
39
Quiz
Wann kann Regression zum Mittelwert auftreten?
a) Wenn die Stichprobenauswahl anhand von extremen Baselinewerten des
Untersuchungsmerkmals durchgeführt wurde
b) Wenn der Korrelationskoeffizient von Pearson auf einen nichtmonotonen Zusammenhang angewendet wurde
c) Wenn bei der linearen Regression die Residuen eine nicht-zufällige
Struktur aufweisen
d) Wenn der Korrelationskoeffizient von Pearson auf verbundene
Beobachtungen angewendet wurde
IBE, Korr. (L6-2)
40
Quiz
Wir wollen den Zusammenhang zwischen Gesundheitszustand (aus einem
Fragebogen, Kategorien: 1=„gut“, 2=„mittel“, 3=„schlecht“) und dem Alter
des Patienten untersuchen.
Was sollten wir berechnen?
a) Korrelationskoeffizient von Pearson
b) Korrelationskoeffizient von Spearman
c) QQ-Plot
d) Regression zum Mittelwert
e) Keine der Methoden unter a) – d) sind für die Lösung der Fragestellung
geeignet
IBE, Korr. (L6-2)
41
Quiz
Welches der folgenden Maße misst die Übereinstimmung zweier Merkmale?
a) Korrelationskoeffizient von Pearson
b) Korrelationskoeffizient von Spearman
c) Bestimmtheitsmaß
d) Keines dieser Maße
IBE, Korr. (L6-2)
42
Quiz
Welche der folgenden Aussagen über die lineare Regression trifft zu?
a) X und Y lassen sich beliebig vertauschen
b) Wenn das Modell korrekt spezifiziert ist, ist die Varianz der Residuen
konstant
c) Das Quadrat des Korrelationskoeffizienten von Spearman wird auch
Bestimmtheitsmaß genannt
d) Die abhängige Variable muss mindestens ordinales Skalenniveau haben
IBE, Korr. (L6-2)
43
Herunterladen