Tests für verbundene Stichproben

Werbung
Nagl, Materialien zu Nichtparametrischen Verfahren
Seite 6
Tests für verbundene Stichproben
Anwendung: Feststellen von Unterschieden zwischen zwei verbundenen Stichproben. Bei zwei verbundenen
Stichproben gibt es zu jeder Messung der ersten Stichprobe genau eine Messung in der zweiten Stichprobe.
Bezeichnungen
Größe (Stichprobe)
1. Stichprobe
2. Stichprobe
Bezeichnung der
Meßwerte
y(1)
y(2)
n
n
Verteilung (Gesamtheit)
F1 (y(1))
F2 (y(2))
Lagekonstante
(Gesamtheit)
θ1
θ2
Nullhypothese:
H 0:
F1 (y)= F2 (y) für alle y
bzw.
F1 (y-θ1)= F2 (y-θ2)
für alle y, zudem gilt: θ1=θ2
bzw.
F1 (y)= F2 (y-θ)
für alle y, zudem gilt: θ=0
d. h.: die Stichproben stammen aus der gleichen Verteilung
oder: Unabhängigkeit zwischen Gruppe und Meßwerten
oder: beide Verteilungen sind gleich, neben allen möglichen
anderen Aspekten stimmen die Verteilungen auch bezüglich der Lage überein
oder: (mit θ:=θ2-θ1), sonst wie oben.
Mögliche Alternativhypothesen:
HL: F1 (y)= F2 (y-θ) für alle y und ein θ≠0
Die Lage der beiden (gleichen) Verteilungen ist verschieden
Die Werte der ersten Stichprobe sind kleiner
HLL F1 (y)= F2 (y-θ) für alle x und ein θ<0
Überlegungen zur Konstruktion von Teststatistiken bei verbundenen Stichproben
Da bei verbundenen Stichproben jede Beobachtung aus der einen Stichprobe auf Grund einer Zuordnungsregel genau einer bestimmten Beobachtung der anderen Stichprobe vergleichbar ist, werden speziell
diese Paare verglichen. Bei quantitativen Merkmalen werden meist Differenzen gebildet.
Beschreibung
Formel
Konsequenz
Differenzen bilden
di =
Verteilung der Differenzen:
FD(d - θ), symmetrisch um 0, mit
θ=θ2 - θ1, wobei
Symmetriepunkt θ = 0
Nullhypothese: Symmetrie bei 0
Alternativ-Hypothese: 1. Gruppe
kleiner als 2. Gruppe
Alternativ-Hypothese: 2. Gruppe
kleiner als 1. Gruppe
( 2)
i
(1)
i
y −y
für alle Paare i
Symmetriepunkt θ= θ2 - θ1> 0
Symmetriepunkt θ= θ2 - θ1< 0
⇒ Verteilung der Differenzen
⇒ Formulierung der Hypothesen
für die Differenzen
⇒ ungefähr gleich viel negative
wie positive Differenzen
⇒ positive Differenzen überwiegen
⇒ negative Differenzen überwiegen
Der VorzeichenTest
Der Vorzeichentest berücksichtigt nur, wieviele positive (bzw. negative)Vorzeichen vorhanden sind. Unter
Geltung der Nullhypothese ist die Wahrscheinlichkeit, daß bei einem bestimmten Paar eine positive Differenz
gefunden wird gleich ½.
Beschreibung
Daten der 2. Stichprobe
Daten der 1. Stichprobe
Formel
( 2)
( 2)
( 2)
( 2)
y1 , y2 , ... , yi , ... , yn
(1)
y1
Differenzenwerte
,
(1)
(1)
(1)
y2 , ... , yi , ... , yn
d i = y i( 2) − y i(1)
Beispiel
Blutdruck nach Biofeedback:
130.2, 180.2, 149.6, 153.2, 162.6, 160.1
Vorher:
136.9, 201.4, 166.8, 150.0, 173.2, 169.3
-6.7,
-20.7, -17.2,
3.2, -10.6, -9.2
Nagl, Materialien zu Nichtparametrischen Verfahren
Seite 7
Diagramm der individuellen Veränderungen
210
210
200
200
190
190
180
180
170
170
Blutdruck
Blutdruck nachher
Streudiagramm
160
160
150
150
140
140
130
130
120
120
120
140
160
BD vorher
180
nachher
200
vorher
Zeit
Teststatistik: Anzahl positiver Differenzen( =Anzahl ’Erfolge’)
k= I(d1) + I(d2) + ...... + I(dn),
mit Indikatorfunktion:
I(di)=1, falls di>0; I(di)= 0, sonst
allgemein: K ∼ Bin(n,π)
unter Ho: K ∼ Bin(n,0.50)
Testverteilung für Anzahl Erfolge
bei n Versuchen ist binomialverteilt,
unter Ho mit Einzelerfolgswahrscheinlichkeit=0.50
Kritischer Bereich (Werte der TestAuf Grund Ho und Ha Bereich für
statistik, bei denen Ha präferiert wird K festlegen (links-, rechts- oder
und deren Wahrscheinlichbeidseitig)
keitssumme in der Testverteilung
∑ W( i) ≤ α
kleiner gleich Signifikanzniveau ist)
i ∈ krit. Bereich
einseitig (links bzw. rechts) oder
zweiseitig (links und rechts)
Entscheidung: Ho ablehnen zugunsten von Ha, falls Testwert im kritischen Bereich liegt
Testwert k im krit. Bereich
⇒ Ho ablehnen.
Ho akzeptieren, sonst.
k= 0 + 0 + 0 + 1 + 0 +
0 =1
n=6, k=1, p= 0.50
W(Anzahl Erfolge=0 | Ho richtig)= 0.016
W(Anzahl Erfolge=1 | Ho richtig)= 0.094
usw. (aus Binomial-Tabelle)
Ho: kein Effekt. Ha: Effekt vorhanden
⇒ zweiseitig: großer oder kleiner Wert ...führt
zu Ablehnung.
kritischer Bereich: 0 bzw. 6
W(K ist 0 oder K ist 6)= 0.032 <= 0.05(=α)
bzw. Ha: Verbesserung(Blutdruckreduktion).
⇒Anzahl der ‚Erfolge‘ sehr klein.
W(K=0)=0.016<=0.05
W(K=0 oder K=1)=0.11> α ⇒ krit.Bereich:
k=0
Ho wird bei einseitigem ebenso wie beim
zweiseitigen Bereich akzeptiert,
da der Testwert (k=1) nicht im kritischen
Bereich liegt
Annäherung für großes n (n>20) mit Hilfe der Normalverteilung: K ∼ NV(n*0.5, n*0.25) unter Ho.
Falls Ties vorhanden sind, werden nur jene Differenzen betrachtet, die nicht 0 sind (d.h. n wird reduziert).
Der Vorzeichen-Rang-Test (Wilcoxon)
Nicht nur das Vorzeichen, auch die Größenordnung der Veränderung (als Ränge) wird beim Vorzeichenrangtest
berücksichtigt. Zuerst wird der Fall ohne Ties behandelt.
Beschreibung
Daten der 2. Stichprobe
Daten der 1. Stichprobe
Formel
( 2)
y1 ,
(1)
y1
,
( 2)
y2 ,
... ,
( 2)
yn
(1)
(1)
(1)
y2 , ... , yi , ... , yn
Differenzenwerte
Rangordnung der Veränderungen feststellen (Veränderungen, egal in welche
Richtung)
Teststatistik: W + = Summe der Ränge
für die die Differenzen positiv sind
(=‘positive Rangsumme‘)
... ,
( 2)
yi ,
d i = y i( 2) − y i(1)
Ränge der Beträge der Differenzen: R ( | d i | )
W+ =
∑ I (d ) R ( | d
i
i
|)
i
mit: I(di)=1, falls di>0, sonst 0
I( ) heißt Indikatorfunktion
Beispiel
Blutdruck nach Biofeedback
130.2, 180.2, 149.6, 153.2, 162.6, 160.1
Vorher:
136.9, 201.4, 166.8, 150.0, 173.2, 169.3
-6.7, -20.7, -17.2,
2,
6,
5,
3.2, -10.6, -9.2
1,
4,
3
I (d i ) : 0 0
0
1
0
0
W+ = 0 2 + 0 6 + 0 5 + 1 1 + 0 4 + 0 3
=1
Nagl, Materialien zu Nichtparametrischen Verfahren
Seite 8
Testverteilung für W+ unter Geltung der Nullhypothese
Die Testverteilung für W+ entsteht auf Grund der Aufzählung aller möglichen Werte von W+ . Die möglichen
Werte ergeben sich aus der Summe der Ränge, wobei jedes Vorzeichen jeweils positiv oder negativ sein
kann, für n Meßwerte ergeben sich daher 2n Konstellationen, die alle unter Geltung der Nullhypothese gleich
wahrscheinlich sind. W+ . kann minimal 0 werden, maximal die Summe der Ränge sein, d.h. n(n+1)/2 (‚Gauß
in Volksschule‘-Story).
Beispielsweise für n=3: Für jede Vorzeichenkonstellation (hier 8 verschiedene) wird Wilcoxons w+ berechnet (Ränge
im Tabellenkopf entsprechend mit 0 bzw. 1 multipliziert und summiert).
Rang:
1
0
0
0
0
1
1
1
1
2
0
0
1
1
0
0
1
1
3
0
1
0
1
0
1
0
1
w+
0
3
2
5
1
4
3
6
Die Verteilung für
W + unter Geltung der
Nullhypothese
(rechts).
Zudem wurde der Erwartungswert und die
Varianz berechnet.
w+
0
1
2
3
4
5
6
Anz
1
1
1
2
1
1
1
W( W + = w + )
1/8
1/8
1/8
2/8
1/8
1/8
1/8
W( W + ≤ w + )
1/8
2/8
3/8
5/8
6/8
7/8
8/8
E( W + ) =3 Var( W + ) = 3.5
Für n=6 entstehen 64 Vorzeichen-Konstellationen, für jede dieser Konstellationen wird wiederum mit den
Rängen als Gewichten ein w+ berechnet. Als Verteilung zusammengefaßt:
w + Anz W( W + = w + ) W( W + ≤ w + )
1
1
1
2
2
3
4
4
4
5
5
5
5
4
4
4
3
2
2
1
1
1
0.0156
0.0156
0.0156
0.0313
0.0313
0.0469
0.0625
0.0625
0.0625
0.0781
0.0781
0.0781
0.0781
0.0625
0.0625
0.0625
0.0469
0.0313
0.0313
0.0156
0.0156
0.0156
0.0156
0.0313
0.0469
0.0781
0.1094
0.1563
0.2188
0.2813
0.3438
0.4219
0.5000
0.5781
0.6563
0.7188
0.7813
0.8438
0.8906
0.9219
0.9531
0.9688
0.9844
1.0000
Stabdiagramm: Verteilung von W+
5
4
3
2
1
0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Die Verteilung für W + wurde für n<= 30 tabelliert (siehe im Tabellenanhang). Die Verteilung ist symmetrisch, wie auch im obigen
Beispiel ersichtlich. Daher muß nur eine Seite der Verteilung tabelliert werden. Für Tests sind zudem nur die Extrembereiche notwendig, daher werden die kumulierten Wahrscheinlichkeiten werden
angezeigt.
E( W + ) =10.5 Var( W + ) = 22.75
Beschreibung
Formeln
Kritischer Bereich (Werte der TestAuf Grund Ho und Ha Bestatistik, bei denen Ha präferiert wird reich für W + festlegen (links-,
und deren Wahrscheinlichrechts- oder beidseitig)
keitssumme in der Testverteilung
∑ W( i) ≤ α
kleiner gleich Signifikanzniveau ist)
i ∈ krit. Bereich
einseitig (links bzw. rechts) oder
zweiseitig (links und rechts)
Beispiel
Ha: Effekt vorhanden
⇒ zweiseitig: großer oder kleiner Wert führt zu
Ablehnung. kritischer Bereich: 0 bzw. 21
W( W + ist 0 oder W + ist 21)= 0.032 <= 0.05;
Würde 1 und 20 noch dem Kritischen Bereich hinzugefügt, wäre die W’tssumme zu groß.
Ha: Verbesserung(Blutdruckreduktion).
⇒ einseitig: Anzahl der ‚pos. Diff‘ sehr klein.
W( W + <=2)= 0.0469 <=0.05; krit.Bereich: 0, 1, 2
Nagl, Materialien zu Nichtparametrischen Verfahren
Entscheidung: Ho ablehnen zugunsten von Ha, falls Testwert im kritischen Bereich liegt
Seite 9
Testwert W + im krit. Bereich Ho wird bei einseitigem abgelehnt,
beim zweiseitigen Bereich akzeptiert
⇒ Ho ablehnen.
Ho akzeptieren, sonst.
Berücksichtigung von Ties
Ties können in zwei Situationen auftreten:
Falls die Differenzen = 0 werden. Diese Beobachtungspaare werden dann eliminiert, die weiteren Berechnungen werden mit reduziertem n durchgeführt.
Die Beträge der Differenzen verschiedener Paare sind gleich. Bei diesen werden Rangmittel (Midranks)
verwendet.
Beschreibung
Formel
Daten der 2. Stichprobe
( 2)
( 2)
( 2)
( 2)
y1 , y2 , ... , yi , ... , yn
Daten der 1. Stichprobe
(1)
y1
,
(1)
(1)
(1)
y2 , ... , yi , ... , yn
Differenzenwerte
d i = y i( 2) − y i(1)
Rangordnung der Veränderungen
feststellen (egal in welche Richtung)
Teststatistik: W + = Summe der
Beispiel
Angst nach Behandlung
31, 35, 37, 39, 40, 53
davor
35, 45, 49, 49, 51, 52
di =
Ränge der Beträge der Differenzen: R ( | d i | ) , bzw. Midranks
W+ =
Ränge (bzw. Midranks)
∑ I (d ) R ( | d
i
| ) wie oben
i
− 4 , − 10 , - 12, - 10, - 11, 1
2,
3.5,
6,
3.5,
5,
1
W+ = 1
i
Häufigkeit von gleichen Midranks (Tievektor) bei K verschiedenen Midranks
t 1 , t 2 ,..., t k ,..., t K
t k = Häufigkeit des k. Midranks
Hier gibt es 5 (=K) verschiedene Midranks:
1, 2, 3.5, 5, 6, wobei:
t 1 = 1, t 2 = 1, t 3 = 2, t 4 = 1, t 5 = 1
Testverteilung für W+ unter Geltung der Nullhypothese, bei Vorliegen von Ties
Die Testverteilung für W+ entsteht wiederum wie oben, allerdings muß die spezielle Tie-Konstellation berücksichtigt werden.
Für n=3: Seien die 2. und 3. absolute Differenz gleich. Das ergibt folgende Rangkonstellation: 1, 2.5, 2.5. Daher:
Die Verteilung für
w+
w+
W( W+ ≤ w + )
Rang:
1
2.5 2.5
Anz W( W+ = w + )
W + unter Geltung
0
1
1/8
1/8
0
0
0
0
der Nullhypothese
1
1
1/8
2/8
0
0
1
2.5
(rechts).
2.5
2
2/8
4/8
0
1
0
2.5
3.5
2
2/8
6/8
0
1
1
5
Der Erwartungswert
5
1
1/8
7/8
1
0
0
1
6
1
1/8
8/8
ist gleich wie vorher,
1
0
1
3.5
die Varianz kleiner.
E( W+ ) =3 Var( W+ ) = 3.375
1
1
0
3.5
1
1
1
6
Für n=6 und die oben gegebene Rangkonstellation: 1 2 3.5 3.5 5 6 wird nach demselben Verfahren wie oben Verteilung erstellen:
Anz W( W + = w + ) W( W + ≤ w + )
0
1
2
3
3.5
4.5
5
5.5
....
15.5
16
16.5
17.5
18
19
20
21
1
1
1
1
2
2
1
2
....
2
1
2
2
1
1
1
1
0.0156
0.0156
0.0156
0.0156
0.0313
0.0313
0.0156
0.0313
....
0.0313
0.0156
0.0313
0.0313
0.0156
0.0156
0.0156
0.0156
0.0156
0.0313
0.0469
0.0625
0.0938
0.1250
0.1406
0.1719
.....
0.8594
0.8750
0.9063
0.9375
0.9531
0.9688
0.9844
1.0000
E( W + ) =10.5 Var( W + ) = 22.625
Stabdiagramm: Verteilung für W+, mit Ties
5
4
3
2
1
0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
w+
Die Verteilung für
W + für die spezielle Rang-Konstellation ist oben als Stabdia-
gramm vollständig dargestellt. Die Werte links stellen eine Auswahl dar.
Nagl, Materialien zu Nichtparametrischen Verfahren
Seite 10
Da für jede Rang-Konstellation eine eigene Tabelle notwendig wäre, müsste ein riesiges Tabellenwerk für die
Verteilung W + mit Ties erstellt werden.
Als Annäherung bei nicht allzu kleinen Stichproben kann die Normalverteilung verwendet werden. Dabei wird
der Erwartungswert und die Varianz von W + benötigt:
Der Erwartungswert von W + : E( W + )= n (n+1)/4. Die Varianz von W + ist kleiner bei Vorliegen von Ties:
Var( W + )=
n (n + 1)(2n + 1) ∑ ( t 3k − tk )
−
, wobei t 1 , t 2 ,..., t k ,..., t K der Tievektor ist.
24
48
Berechnen von Erwartungswert und
Varianz
Beispiel : n=6.
Tievektor: t1
E( W +
)=6*7/4 = 10.5
= 1, t 2 = 1, t 3 = 2, t 4 = 1, t 5 = 1 . ∑ ( t 3k − tk ) =0+0+(8-2)+0+0=6.
Var( W+ )=(6 . 7 . 13) / 24 – 6/ 48=22.625.
Kritischer Bereich und Entscheidung bei Ties
Beschreibung
Formeln
Kritischer Bereich, wie oben(exakt)
und Entscheidung
Auf Grund der Verteilung der
Teststatistik unter Ho
Kritischer Bereich, (approximativ, auf
Grund der Normalverteilung)
z-Werte bilden
z=
Entscheidung(bei approximativem
Test): Ho ablehnen zugunsten von Ha,
falls Testwert im kritischen Bereich
liegt
W+ − E ( W + )
Var ( W+ )
Liegt der Testwert W + im
kritischen Bereich, wird
Ho abgelehnt.
Beispiel
entsprechende kritische Region und Entscheidung
wie oben(jetzt aber mit Ties) bei α ≤ 0.05:
Kritischer Bereich einseitig links: {0,1,2}
Kritischer Bereich einseitig rechts: {19,20,21}
Kritischer Bereich zweiseitig: {0,21}.
E( W+ )=10.5
Var( W+ )=22.625.
z = (1 – 10.5) / 4.75657 = -1.9972
Ho wird bei einseitigem und
zweiseitigen Bereich abgelehnt.
Kritischer Bereich einseitig links: z-Werte <= -1.645
Kritischer Bereich einseitig rechts: z-Werte >= 1.645
Kritischer Bereich zweiseitig: |z-Werte| <= 1.96
Herunterladen