Vergleich von Anteilen dichotomer Merkmale

Werbung
Nagl, Materialien zu Nichtparametrischen Verfahren
Seite 27
Vergleich von Anteilen dichotomer Merkmale
Beim Vergleich zweier Anteile dichotomer Merkmale muss unterschieden werden, ob die Stichproben verbunden oder unverbunden sind.
Vergleich von 2 Anteilen (Zwei Gruppen)
1. Vergleich von Zwei Anteilen aus verbundenen Stichproben.
Beim Vergleich von Anteilen
aus verbundenen Stichproben
sollen (und können) die gemeinsamen Anteile mit betrachtet werden.
Kreuztabelle (Populationsbezeichnung) mit Randanteilen:
B
nein
ja
nein
 AB
 AB
A
ja
 AB
 AB
A
B
B
1
A
Untersuchung der Nullhypothese der Gleichheit der Anteile. Die gemeinsamen Anteile in der Diagonalen der
Kreuztabelle sind für die
Hypothese irrelevant.
Beispiel: Die Schwierigkeit zweier Aufgaben (A, B) soll
untersucht werden. Die beiden Aufgaben werden 100 Personen vorgelegt. Aufgabe A lösen 84%, Aufgabe B lösen
74% der Personen. Diese Information sollte ergänzt werden
durch die Information, wie viele Personen beide Aufgaben
gelöst haben.
StichprobenB
anteile:
nein gelöst
nein
0.06
0.10
0.16
A
gelöst 0.20
0.64
0.84
0.26
0.74
1
Sei H0:  A =  B .
Die Null-Hypothese, dass beide Aufgaben gleich schwer
d.h.  A B +  AB =  AB +  AB sind, ist
Es gilt daher:  A B =  AB ist
äquivalent zur obigen H0-Hypothese.
H0:  A B =  AB
Zu prüfen ist die Hypothese
gleichstarken ‚Wechselns’.
Konsequenz für die Überprü- Häufigkeitstabelle
fung der Hypothese: Nur die
‚Wechsel’ liefern die wahre
B
nein
ja
Information über die Randverteilung.
n AB
nein n A B
A
n A B n AB
ja
nA
nB
n
nB
nA
Mit Hilfe der ‚Wechsler’ wird Im Sinne eines bedingten
nun die Hypothese überprüft. Anteils (Bedingung: ‚Wechsel’) lautet die Hypothese,
H0:  *A B =  *AB =0.5
Diese Hypothese wurde ben* sei die Anzahl der Wechsreits beim Vorzeichentest
ler = n A B + n AB .
(bzw. Binomialtest) behandelt
Wechsel
+
n AB
n AB
äquivalent zur Hypothese, dass folgende Anteile in der
Population gleich sind:
Der Anteil der Personen die Aufgabe A löst und B nicht
= Anteil der Personen die Aufgabe A nicht löst und B löst
Zu untersuchen sind daher nicht die Randanteile, sondern
zwei spezielle gemeinsame Anteile.
Die Fragestellung konzentriert sich nun auf die beiden
außerhalb der Diagonalen liegenden Häufigkeiten (da
n=100, sind die obigen Anteile leicht in Häufigkeiten umzurechnen):
B
nein gelöst
nein
6
10
16
A
Nur die 30
gelöst
20
63
84
‚Wechsler’
26
74
100
(20+10) außerhalb
der Diagonalen geben Auskunft über die Hypothese.
Unter der Hypothese, dass die beiden Anteile Randanteile
gleich sind, gilt äquivalent die Hypothese, dass die auf die
‚Wechsel’ eingeschränkten Anteile gleich 0.5 sind.
Mit Hilfe des Vorzeichentests ist die Hypothese zu überprüfen, dass die Wahrscheinlichkeit des Wechsel gleich
Wechsel
wahrscheinlich (=0.5) ist, unter
+
der Voraussetzung, dass ge20
10
30 wechselt wird.
n*
MCNEMAR hat diesen Test für große Stichproben entwickelt. Der sogenannte MCNEMAR-Test besteht in einem
chi**2-Anpassungstest für die Wechsel-Tabelle:
Die tatsächlichen Wechsel
Wechsel
Mit Hilfe des Vorzeichentests ist die Hypothese zu überprü+
Wechsel
werden den unter der Nullhyfen, dass die Wahrscheinlichkeit
Häufigkeit
+
pothese erwarteten Wechsel
des Wechsel gleich wahrscheinn A B n AB n*
20
10
30 lich (=0.5) ist, unter der Vorausgegenübergestellt; danach mit
Erwarsetzung, dass gewechselt wird.
15
15
einem chi**2-Anpassungstest tungswerte n*/2 n*/2
verglichen.
2=(20- 15)2/15+ (10- 15)2/15=(5)2 /15+ (5)2/15 =2(5)2 /15
Chi**2-Test; mit einem Frein* 2 n*

)
/
2=2* ( n
=3.333.
2
2
AB
heitsgrad
Der KB ist bei einem Freiheitsgrad  3.84. Daher wird die
2
=4( n A B - n*/2) / n*
Nullhypothese nicht abgelehnt.
Nagl, Materialien zu Nichtparametrischen Verfahren
Seite 28
2. Vergleich von Zwei Anteilen aus unverbundenen Stichproben.
Eine Ausprägung des dichotomen Merkmals sei die ‚Erfolgsausprägung’, was auch immer als Erfolg definiert
werde.
Vergleich der Anteile für den Kreuztabelle (Populationsbe- Beispiel: Die Wirkung des ‚Einreibens der Haut mit VanilErfolg aus zwei unverbunde- zeichnung der Anteile für den leduftstoff’ auf die Reduktion des Appetits soll untersucht
werden. Einerseits wird eine Kontrollgruppe (0) gebildet,
nen Stichproben sollen kön- Erfolg in den beiden Gruppen die nur mit Plazebo-Vanille eingerieben werden. Die Vernen nur die Anteile.
0 und 1, am Rand Stichprosuchsgruppe (=1) erhält die Behandlung mit echter Vanille.
Die Plazebogruppe enthält 4, die Versuchsgruppe 6 Persobengrößen) :
nen.
Erfolg sei definiert als Gewichtsreduktion von mindestens
einem kg nach einer Woche.
Erfolg
Die Nullhypothese behauptet,
dass die Anteile in beiden
Gruppen gleich groß sind:
 0 = 1
nein
Grup 0 1   0
pe 1 1  1
ja
0
1
n0
n1
n
Das Ergebnis wird meist in
a, b, c, d sind die entspreForm einer Häufigkeitstabelle chenden Häufigkeiten:
präsentiert
Erfolg
Grup 0
pe 1
nein
ja
a
b
c
d
k
Nullhypothese: Der Erfolgsanteil in der Plazebogruppe ist
gleich dem Erfolgsanteil in der Versuchsgruppe.
Bemerkung: Die Hypothese könnte genau so für den Misserfolgsanteil formuliert werden.
Das Ergebnis
in Form der Häufigkeitstabelle:
n0
n1
n
Gruppe
0
1
Erfolg
nein
ja
3
1
2
4
5
4
6
10
Nun soll ein sogenannter bedingter Test konstruiert werden:
Für jede der beiden Gruppen b ist binomialverteilt; bei n 0 Versuchen und 0 ist die Wahrscheinlichkeit,
ist die Anzahl der Erfolge
dass die Anzahl der Erfolge=b (B):
binomialverteilt.
n 
P(B) =  0  0b (1   0 ) n 0  b
 b 
d ist binomialverteilt; bei n 1 Versuchen und 1 ist die Wahrscheinlichkeit,
 n1 
P(AnzErf=d)=  1d (1  1 ) n1 d
d
d ist binomialverteilt; bei n 1 Versuchen und 0 ist die Wahrscheinlichkeit,
dass die Anzahl der Erfolge=d (D):
 n1 
P(D) =   d0 (1   0 ) n1 d
d
dass die Anzahl der Erfolge=d:
Unter der Voraussetzung
(Nullhypothese), dass
 0 = 1 gilt ist für die 2.
Gruppe die Verteilung gleich
wie in der ersten.
Unter der Voraussetzung
(Nullhypothese), dass  0 = 1 Randverteilung des Erfolgsmerkmals:
k (=b+d) ist binomialverteilt; bei n Versuchen und 0 ist die Wahrscheinlichist die Wahrscheinlichkeit,
keit, dass die Anzahl der Erfolge=k (G)
dass bei n Versuchen k
n 
(=b+d) Erfolge zu verzeichP(G) =   0k (1   0 ) n  k
nen sind ebenfalls durch die
 k 
Binomialverteilung gegeben
Zwischenbemerkung zur bedingten
Wahrscheinlichkeit
Identifikation der Ereignisse B, D und
G und formale Berechnung der
bedingten Wahrscheinlichkeit für das
Ereignis, dass bei n0 Versuchen b
Erfolge resultieren unter der Bedingung, dass bei n Versuchen k Erfolge resultieren.
Die bedingte Wahrscheinlichkeit des Ereignis B unter Bedingung G: P(B | G) = P(B  G) / P(G).
Sei B das Ereignis, dass bei n0 Versuchen b Erfolge resultieren.
Sei D das Ereignis, dass bei n1 Versuchen d Erfolge resultieren.
G sei das Ereignis, dass bei n Versuchen k(=b+d) Erfolge resultieren.
Dann ist die das Ereignis B  G das zugleich das Ereignis, dass bei n0 Versuchen b Erfolge und bei
n1 Versuchen d Erfolge resultieren; d. h. B  G = B  D.
Andererseits sind B und D unabhängig; daher gilt: P(B  D) = P(B) P(D).
Daher gilt: P(B | G) = P(B) P(D) / P(G).
Nagl, Materialien zu Nichtparametrischen Verfahren
Seite 29
 n 0  n 1 
 n 0  n  n 0 
  
 

 b  k  b 
 b  d 
Berechnung der TestverteiP(B | G) =
=
lung unter Geltung der Nulln
n
 


hypothese für gegebene
k
k


Randhäufigkeiten
Das ist die hypergeometrische Verteilung, die nun nicht mehr vom Populationsparameter 0 abhängt.
Der auf der hypergeometrischen Verteilung aufbauende Test für die Gleichheit von Anteilen wird auch als FISHER Exakt-Test bezeichnet. Er könnte auch direkt aus den Prinzipien der Randomisierung aufgebaut werden.
Der -Koeffizient
Die Häufigkeiten zweier dia, b, c, d sind Häufigkeiten; zusätzlich
Das obige Ergebnis
chotomer Merkmale werden
Randhäufigkeiten:
in Form der Häufigkeits-Kreuztabelle:
häufig in der Form einer
y
Erfolg
Kreuztabelle der beiden
0
1
nein
ja
Merkmale x und y dargeboten
0
a
b
n(x=0)
0
3
1
4
x
Gruppe
1
1
2
4
6
c
d
n(x=1)
5
5
10
n(y=0) n(y=1)
n
Der Zusammenhang wird
ad  bc

meist mit Hilfe des n(x  0)n(x  1)n( y  0)n( y  1)  = (12-2)/ 5*5*4*6  10/24.5=0.41
Koeffizient berechnet
Der -Koeffizient gibt ebenfalls Auskunft darüber, ob die
Anteile in den beiden Gruppen gleich sind
 in der Population ist genau dann 0,
wenn die Anteile in der Population
gleich sind. D.h. die obenformulierte
Nullhypothese kann auch als Hypothese über  formuliert werden: H0: =0
Für diese Form der Kreuztabelle wurde die Tabelle für den
exakten FISHER –Test konstruiert
Die Tabelle enthält die Verteilung für
a bei gegebenem n(x=0) und n(y=0)
und Gesamt n.
Die Nullhypothese in -Form: Der Erfolg hat
keinen Zusammenhang mit Gruppe.
Mögliche Alternativhypothese: Erfolg einen
positiven Zusammenhang mit der Gruppe.
(Der Code für Gruppe wurde hier entsprechend
gewählt)
n=10, n(x=0) = 4; n(y=0)=5.
n
a
P(a)
kumuliert

10
4
5
0
0.024
0.024
-0.82
10
4
5
1
0.238
0.262
-0.41
10
4
5
2
0.476
0.738
0.00
10
4
5
3
0.238
0.976
0.41
0.024
1.000
0.82
10
4
5
4
Vergleich von G Anteilen (G Gruppen)
1. Vergleich von G Anteilen aus verbundenen Stichproben.
Zur Überprüfung der Nullhypothese, dass die ‚Erfolgs’-Anteile in mehreren Gruppen gleich sind, hat COCHRAN
einen Test entwickelt, der wie im Fall der FRIEDMAN-Rangvarianzanalyse die ‚Fähigkeit’ der Blöcke mit berücksichtigt.
Gegeben seien dichotome
Die Messwerte ygb sind dichotom für
Messwerte (mit den Ausprädie g. Gruppe und den b. Block:
Erfolge
gungen 0 für Misserfolg; 1 für
Blöcke 1. 2.
n.
pro Gruppe
Erfolg) mit Block- und
y1
1. y11 y12 ... y1n
Gruppenzugehörigkeit.
Pro Gruppe wird die Anzahl
der Erfolge ermittelt, ebenfalls für jeden Block; zudem
die Gesamtanzahl der Erfolge.
Grup- 2. y21 y22 ... y2n
... ... ... ...
pen
G. yG1 yG2 ... yGn
Erfolge y
1 y2 ... yn
pro Block
y2
...
yG
y
Beispiel: Vier Aufgaben (auch Gruppen genannt)
sollen verglichen werden. Jede Person bearbeitete
jede Aufgabe richtig (=1) bzw. falsch (=0):
1. (A)
2. (B)
3. (C)
4. (D)
1.
0
0
0
0
0
2.
0
1
1
1
3
3.
0
0
1
1
2
4.
0
0
0
0
0
5.
0
1
1
0
2
6.
1
0
1
1
3
7.
0
0
0
1
1
8.
0
1
1
1
3
9.
0
0
1
1
2
10.
1
1
1
1
4
2
4
7
7
20
Nagl, Materialien zu Nichtparametrischen Verfahren
Die Anteile in Stichprobe für
die G Gruppen werden geschätzt.
Die Nullhypothese fordert,
dass die Anteile in allen
Gruppen gleich sind.
Zur Überprüfung der Nullhypothese hat COCHRAN (1950)
die q-Statistik vorgeschlagen
(COCHRANs q genannt).
Hier werden nicht nur die Anzahl der Erfolge pro Gruppe
berücksichtigt, sondern auch
die ‚Fähigkeit der Blöcke’
Seite 30
Anteil in g. Gruppe ˆ g 
Geschätzte Erfolgsanteile in den Gruppen:
y g
7
7
2
4
ˆ 1  10
, ˆ 2  10
, ˆ 3  10
, ˆ 4  10
n
Die Nullhypothese 1 = 2= 3= 4 besagt hier,
dass alle Aufgaben gleich schwierig sind; d. h.
der Erfolgsanteil bei allen Aufgaben ist gleich.
H0: 1 = 2= ...= G
q
 G

(G  1) G  y g2  y 2 
 g 1

n
wobei:
Gy    y 2b
b 1
 y g
2
= quadrierte Gruppenerfolge summiert;
g
Die Summe der quadrierten Gruppenerfolge=
4+16+49+49= 118.
Die Summe der quadrierten Blockerfolge=
0+9+4+0+4+9+1+9+4+16= 56
Die Gesamtsumme der Erfolge= 20.
COCHRANs q 

( 4  1) 4 * 118  20
4 * 20  56
2
 = 9.
2
 y b = quadrierte Blockerfolge summiert.
b
Verteilung von COCHRANs q
COCHRANs q ist approximativ 2 –
unter Geltung der Nullhypoverteilt mit G-1 Freiheitsgraden
these:
Kritischen Bereich bestimmen q  2-() bei G1 Freiheitsgraden
Entscheidung
Anzahl der Freiheitsgrade = 4-1 =3
KB (kritischer Bereich): q  7.81 (aus 2Tabelle bei =0.05).
q in der Stichprobe = 9; liegt im KB; daher
Nullhypothese ablehnen.
Nullhypothese ablehnen, falls der Wert
q in der Stichprobe im KB liegt
Exakt das gleiche Ergebnis würde resultieren, wenn die H-Statistik der FRIEDMAN Zwei-Weg-Rangvarianzanalyse berechnet würde. COCHRANs q ist daher nur ein Spezialfall der H-Statistik von Friedman (unter Beachtung
der Ties).
Die exakte Verteilung von q (unter Geltung der Nullhypothese) könnte nach dem gleichen Blockrandomisierungsschema erzeugt werden, wie dies bei der Friedmananalyse gezeigt wurde.
2. Vergleich von G Anteilen aus unverbundenen Stichproben.
Der Vergleich von G unverbundenen Gruppen führt auf die ‚klassische’ Überprüfung der stochstischen Unabhängigkeit der beiden Merkmale: Gruppierungsvariable (=x) und dichotome ‚Erfolgsvariable’ (=y).
Als Test für die Überprüfung der Unabhängigkeit wird i. a. der 2-Test (von PEARSON entwickelt) verwendet.
Die Daten werden als Kreuztabelle mit Häufigkeiten dargestellt.
Die Anzahl der Fälle in der g. Gruppe ist ng. Die Anzahl der Erfolge in
der g. Gruppe gleich ag.
Insgesamt
werden bei
n Versuchen a Erfolge verzeichnet.
Die Anteile in Stichprobe für
die G Gruppen werden geschätzt.
Die Nullhypothese fordert,
dass die Anteile in allen
Gruppen gleich sind.
Als Teststatistik kann nun das
übliche PEARSON 2 berechnet
werden. Eine vereinfachte
Formel für den Fall eines
Grup
pen
Erfolg
0
1
1. n1- a1
2. n2- a2
.
...
G. nG- aG
n-a
Anteil in g. Gruppe ˆ g 
a1 n1
a2 n2
...
aG nG
a n
ag
ng
H0: 1 = 2= ...= G
Pearson 2 (für dichotomes y) =

n  n G a i2
  a 

n  a  a g 1 n i

Beispiel: Jeweils eine von 4 Aufgaben (A,B,C,D)
wurde jeweils 10 Personen vorgelegt. Daher entstehen 4 Gruppen mit jeweils 10 Personen. Die Aufgaben können wieder richtig(=1) oder falsch (=0)
gelöst werden. Das Ergebnis
0 1
wurde in der Kreuztabelle
1. (A) 8 2 10
zusammengefasst.
2. (B)
6
4 10
Die hier dargestellten Erfolge 3. (C) 3 7 10
4. (D) 3 7 10
entsprechen aus Vergleichs20 20 40
gründen genau den oben bei
den verbundenen Gruppen erzielten Erfolgen (hier
wurden allerdings 40, dort nur 10 Personen untersucht)
Geschätzte Erfolgsanteile in den Gruppen:
ˆ 1 
2
20
, ˆ 2 
4
20
, ˆ 3 
7
20
, ˆ 4 
7
20
Die Nullhypothese 1 = 2= 3= 4 besagt hier,
dass alle Aufgaben gleich schwierig sind; d. h.
der Erfolgsanteil bei allen Aufgaben ist gleich.
PEARSON 2
40 4
49
49
 16  10
 10
= 40
20 20 10 10
 
= 2(2*11.8 – 20) = 7.2
  20 =
Nagl, Materialien zu Nichtparametrischen Verfahren
dichotomen Merkmals erleichtert die Berechnung
Verteilung von PEARSONs 2
PEARSONs 2 ist approximativ 2 – verunter Geltung der Nullhypoteilt mit G-1 Freiheitsgraden
these:
Kritischen Bereich bestimmen q  2-() bei G1 Freiheitsgraden
Entscheidung
Seite 31
Anzahl der Freiheitsgrade = 4-1 =3
KB (kritischer Bereich): q  7.81 (aus 2Tabelle bei =0.05).
PEARSONs 2 in der Stichprobe = 7.2; liegt daher
nicht im KB; daher Nullhypothese akzeptieren.
Nullhypothese ablehnen, falls der Wert
q in der Stichprobe im KB liegt
Auch in diesem Fall könnte eine exakte Verteilung unter Geltung der Nullhypothese etabliert werden (als Erweiterung des FISHER-schen Überlegungen).
Herunterladen