Nagl, Materialien zu Nichtparametrischen Verfahren Seite 27 Vergleich von Anteilen dichotomer Merkmale Beim Vergleich zweier Anteile dichotomer Merkmale muss unterschieden werden, ob die Stichproben verbunden oder unverbunden sind. Vergleich von 2 Anteilen (Zwei Gruppen) 1. Vergleich von Zwei Anteilen aus verbundenen Stichproben. Beim Vergleich von Anteilen aus verbundenen Stichproben sollen (und können) die gemeinsamen Anteile mit betrachtet werden. Kreuztabelle (Populationsbezeichnung) mit Randanteilen: B nein ja nein AB AB A ja AB AB A B B 1 A Untersuchung der Nullhypothese der Gleichheit der Anteile. Die gemeinsamen Anteile in der Diagonalen der Kreuztabelle sind für die Hypothese irrelevant. Beispiel: Die Schwierigkeit zweier Aufgaben (A, B) soll untersucht werden. Die beiden Aufgaben werden 100 Personen vorgelegt. Aufgabe A lösen 84%, Aufgabe B lösen 74% der Personen. Diese Information sollte ergänzt werden durch die Information, wie viele Personen beide Aufgaben gelöst haben. StichprobenB anteile: nein gelöst nein 0.06 0.10 0.16 A gelöst 0.20 0.64 0.84 0.26 0.74 1 Sei H0: A = B . Die Null-Hypothese, dass beide Aufgaben gleich schwer d.h. A B + AB = AB + AB sind, ist Es gilt daher: A B = AB ist äquivalent zur obigen H0-Hypothese. H0: A B = AB Zu prüfen ist die Hypothese gleichstarken ‚Wechselns’. Konsequenz für die Überprü- Häufigkeitstabelle fung der Hypothese: Nur die ‚Wechsel’ liefern die wahre B nein ja Information über die Randverteilung. n AB nein n A B A n A B n AB ja nA nB n nB nA Mit Hilfe der ‚Wechsler’ wird Im Sinne eines bedingten nun die Hypothese überprüft. Anteils (Bedingung: ‚Wechsel’) lautet die Hypothese, H0: *A B = *AB =0.5 Diese Hypothese wurde ben* sei die Anzahl der Wechsreits beim Vorzeichentest ler = n A B + n AB . (bzw. Binomialtest) behandelt Wechsel + n AB n AB äquivalent zur Hypothese, dass folgende Anteile in der Population gleich sind: Der Anteil der Personen die Aufgabe A löst und B nicht = Anteil der Personen die Aufgabe A nicht löst und B löst Zu untersuchen sind daher nicht die Randanteile, sondern zwei spezielle gemeinsame Anteile. Die Fragestellung konzentriert sich nun auf die beiden außerhalb der Diagonalen liegenden Häufigkeiten (da n=100, sind die obigen Anteile leicht in Häufigkeiten umzurechnen): B nein gelöst nein 6 10 16 A Nur die 30 gelöst 20 63 84 ‚Wechsler’ 26 74 100 (20+10) außerhalb der Diagonalen geben Auskunft über die Hypothese. Unter der Hypothese, dass die beiden Anteile Randanteile gleich sind, gilt äquivalent die Hypothese, dass die auf die ‚Wechsel’ eingeschränkten Anteile gleich 0.5 sind. Mit Hilfe des Vorzeichentests ist die Hypothese zu überprüfen, dass die Wahrscheinlichkeit des Wechsel gleich Wechsel wahrscheinlich (=0.5) ist, unter + der Voraussetzung, dass ge20 10 30 wechselt wird. n* MCNEMAR hat diesen Test für große Stichproben entwickelt. Der sogenannte MCNEMAR-Test besteht in einem chi**2-Anpassungstest für die Wechsel-Tabelle: Die tatsächlichen Wechsel Wechsel Mit Hilfe des Vorzeichentests ist die Hypothese zu überprü+ Wechsel werden den unter der Nullhyfen, dass die Wahrscheinlichkeit Häufigkeit + pothese erwarteten Wechsel des Wechsel gleich wahrscheinn A B n AB n* 20 10 30 lich (=0.5) ist, unter der Vorausgegenübergestellt; danach mit Erwarsetzung, dass gewechselt wird. 15 15 einem chi**2-Anpassungstest tungswerte n*/2 n*/2 verglichen. 2=(20- 15)2/15+ (10- 15)2/15=(5)2 /15+ (5)2/15 =2(5)2 /15 Chi**2-Test; mit einem Frein* 2 n* ) / 2=2* ( n =3.333. 2 2 AB heitsgrad Der KB ist bei einem Freiheitsgrad 3.84. Daher wird die 2 =4( n A B - n*/2) / n* Nullhypothese nicht abgelehnt. Nagl, Materialien zu Nichtparametrischen Verfahren Seite 28 2. Vergleich von Zwei Anteilen aus unverbundenen Stichproben. Eine Ausprägung des dichotomen Merkmals sei die ‚Erfolgsausprägung’, was auch immer als Erfolg definiert werde. Vergleich der Anteile für den Kreuztabelle (Populationsbe- Beispiel: Die Wirkung des ‚Einreibens der Haut mit VanilErfolg aus zwei unverbunde- zeichnung der Anteile für den leduftstoff’ auf die Reduktion des Appetits soll untersucht werden. Einerseits wird eine Kontrollgruppe (0) gebildet, nen Stichproben sollen kön- Erfolg in den beiden Gruppen die nur mit Plazebo-Vanille eingerieben werden. Die Vernen nur die Anteile. 0 und 1, am Rand Stichprosuchsgruppe (=1) erhält die Behandlung mit echter Vanille. Die Plazebogruppe enthält 4, die Versuchsgruppe 6 Persobengrößen) : nen. Erfolg sei definiert als Gewichtsreduktion von mindestens einem kg nach einer Woche. Erfolg Die Nullhypothese behauptet, dass die Anteile in beiden Gruppen gleich groß sind: 0 = 1 nein Grup 0 1 0 pe 1 1 1 ja 0 1 n0 n1 n Das Ergebnis wird meist in a, b, c, d sind die entspreForm einer Häufigkeitstabelle chenden Häufigkeiten: präsentiert Erfolg Grup 0 pe 1 nein ja a b c d k Nullhypothese: Der Erfolgsanteil in der Plazebogruppe ist gleich dem Erfolgsanteil in der Versuchsgruppe. Bemerkung: Die Hypothese könnte genau so für den Misserfolgsanteil formuliert werden. Das Ergebnis in Form der Häufigkeitstabelle: n0 n1 n Gruppe 0 1 Erfolg nein ja 3 1 2 4 5 4 6 10 Nun soll ein sogenannter bedingter Test konstruiert werden: Für jede der beiden Gruppen b ist binomialverteilt; bei n 0 Versuchen und 0 ist die Wahrscheinlichkeit, ist die Anzahl der Erfolge dass die Anzahl der Erfolge=b (B): binomialverteilt. n P(B) = 0 0b (1 0 ) n 0 b b d ist binomialverteilt; bei n 1 Versuchen und 1 ist die Wahrscheinlichkeit, n1 P(AnzErf=d)= 1d (1 1 ) n1 d d d ist binomialverteilt; bei n 1 Versuchen und 0 ist die Wahrscheinlichkeit, dass die Anzahl der Erfolge=d (D): n1 P(D) = d0 (1 0 ) n1 d d dass die Anzahl der Erfolge=d: Unter der Voraussetzung (Nullhypothese), dass 0 = 1 gilt ist für die 2. Gruppe die Verteilung gleich wie in der ersten. Unter der Voraussetzung (Nullhypothese), dass 0 = 1 Randverteilung des Erfolgsmerkmals: k (=b+d) ist binomialverteilt; bei n Versuchen und 0 ist die Wahrscheinlichist die Wahrscheinlichkeit, keit, dass die Anzahl der Erfolge=k (G) dass bei n Versuchen k n (=b+d) Erfolge zu verzeichP(G) = 0k (1 0 ) n k nen sind ebenfalls durch die k Binomialverteilung gegeben Zwischenbemerkung zur bedingten Wahrscheinlichkeit Identifikation der Ereignisse B, D und G und formale Berechnung der bedingten Wahrscheinlichkeit für das Ereignis, dass bei n0 Versuchen b Erfolge resultieren unter der Bedingung, dass bei n Versuchen k Erfolge resultieren. Die bedingte Wahrscheinlichkeit des Ereignis B unter Bedingung G: P(B | G) = P(B G) / P(G). Sei B das Ereignis, dass bei n0 Versuchen b Erfolge resultieren. Sei D das Ereignis, dass bei n1 Versuchen d Erfolge resultieren. G sei das Ereignis, dass bei n Versuchen k(=b+d) Erfolge resultieren. Dann ist die das Ereignis B G das zugleich das Ereignis, dass bei n0 Versuchen b Erfolge und bei n1 Versuchen d Erfolge resultieren; d. h. B G = B D. Andererseits sind B und D unabhängig; daher gilt: P(B D) = P(B) P(D). Daher gilt: P(B | G) = P(B) P(D) / P(G). Nagl, Materialien zu Nichtparametrischen Verfahren Seite 29 n 0 n 1 n 0 n n 0 b k b b d Berechnung der TestverteiP(B | G) = = lung unter Geltung der Nulln n hypothese für gegebene k k Randhäufigkeiten Das ist die hypergeometrische Verteilung, die nun nicht mehr vom Populationsparameter 0 abhängt. Der auf der hypergeometrischen Verteilung aufbauende Test für die Gleichheit von Anteilen wird auch als FISHER Exakt-Test bezeichnet. Er könnte auch direkt aus den Prinzipien der Randomisierung aufgebaut werden. Der -Koeffizient Die Häufigkeiten zweier dia, b, c, d sind Häufigkeiten; zusätzlich Das obige Ergebnis chotomer Merkmale werden Randhäufigkeiten: in Form der Häufigkeits-Kreuztabelle: häufig in der Form einer y Erfolg Kreuztabelle der beiden 0 1 nein ja Merkmale x und y dargeboten 0 a b n(x=0) 0 3 1 4 x Gruppe 1 1 2 4 6 c d n(x=1) 5 5 10 n(y=0) n(y=1) n Der Zusammenhang wird ad bc meist mit Hilfe des n(x 0)n(x 1)n( y 0)n( y 1) = (12-2)/ 5*5*4*6 10/24.5=0.41 Koeffizient berechnet Der -Koeffizient gibt ebenfalls Auskunft darüber, ob die Anteile in den beiden Gruppen gleich sind in der Population ist genau dann 0, wenn die Anteile in der Population gleich sind. D.h. die obenformulierte Nullhypothese kann auch als Hypothese über formuliert werden: H0: =0 Für diese Form der Kreuztabelle wurde die Tabelle für den exakten FISHER –Test konstruiert Die Tabelle enthält die Verteilung für a bei gegebenem n(x=0) und n(y=0) und Gesamt n. Die Nullhypothese in -Form: Der Erfolg hat keinen Zusammenhang mit Gruppe. Mögliche Alternativhypothese: Erfolg einen positiven Zusammenhang mit der Gruppe. (Der Code für Gruppe wurde hier entsprechend gewählt) n=10, n(x=0) = 4; n(y=0)=5. n a P(a) kumuliert 10 4 5 0 0.024 0.024 -0.82 10 4 5 1 0.238 0.262 -0.41 10 4 5 2 0.476 0.738 0.00 10 4 5 3 0.238 0.976 0.41 0.024 1.000 0.82 10 4 5 4 Vergleich von G Anteilen (G Gruppen) 1. Vergleich von G Anteilen aus verbundenen Stichproben. Zur Überprüfung der Nullhypothese, dass die ‚Erfolgs’-Anteile in mehreren Gruppen gleich sind, hat COCHRAN einen Test entwickelt, der wie im Fall der FRIEDMAN-Rangvarianzanalyse die ‚Fähigkeit’ der Blöcke mit berücksichtigt. Gegeben seien dichotome Die Messwerte ygb sind dichotom für Messwerte (mit den Ausprädie g. Gruppe und den b. Block: Erfolge gungen 0 für Misserfolg; 1 für Blöcke 1. 2. n. pro Gruppe Erfolg) mit Block- und y1 1. y11 y12 ... y1n Gruppenzugehörigkeit. Pro Gruppe wird die Anzahl der Erfolge ermittelt, ebenfalls für jeden Block; zudem die Gesamtanzahl der Erfolge. Grup- 2. y21 y22 ... y2n ... ... ... ... pen G. yG1 yG2 ... yGn Erfolge y 1 y2 ... yn pro Block y2 ... yG y Beispiel: Vier Aufgaben (auch Gruppen genannt) sollen verglichen werden. Jede Person bearbeitete jede Aufgabe richtig (=1) bzw. falsch (=0): 1. (A) 2. (B) 3. (C) 4. (D) 1. 0 0 0 0 0 2. 0 1 1 1 3 3. 0 0 1 1 2 4. 0 0 0 0 0 5. 0 1 1 0 2 6. 1 0 1 1 3 7. 0 0 0 1 1 8. 0 1 1 1 3 9. 0 0 1 1 2 10. 1 1 1 1 4 2 4 7 7 20 Nagl, Materialien zu Nichtparametrischen Verfahren Die Anteile in Stichprobe für die G Gruppen werden geschätzt. Die Nullhypothese fordert, dass die Anteile in allen Gruppen gleich sind. Zur Überprüfung der Nullhypothese hat COCHRAN (1950) die q-Statistik vorgeschlagen (COCHRANs q genannt). Hier werden nicht nur die Anzahl der Erfolge pro Gruppe berücksichtigt, sondern auch die ‚Fähigkeit der Blöcke’ Seite 30 Anteil in g. Gruppe ˆ g Geschätzte Erfolgsanteile in den Gruppen: y g 7 7 2 4 ˆ 1 10 , ˆ 2 10 , ˆ 3 10 , ˆ 4 10 n Die Nullhypothese 1 = 2= 3= 4 besagt hier, dass alle Aufgaben gleich schwierig sind; d. h. der Erfolgsanteil bei allen Aufgaben ist gleich. H0: 1 = 2= ...= G q G (G 1) G y g2 y 2 g 1 n wobei: Gy y 2b b 1 y g 2 = quadrierte Gruppenerfolge summiert; g Die Summe der quadrierten Gruppenerfolge= 4+16+49+49= 118. Die Summe der quadrierten Blockerfolge= 0+9+4+0+4+9+1+9+4+16= 56 Die Gesamtsumme der Erfolge= 20. COCHRANs q ( 4 1) 4 * 118 20 4 * 20 56 2 = 9. 2 y b = quadrierte Blockerfolge summiert. b Verteilung von COCHRANs q COCHRANs q ist approximativ 2 – unter Geltung der Nullhypoverteilt mit G-1 Freiheitsgraden these: Kritischen Bereich bestimmen q 2-() bei G1 Freiheitsgraden Entscheidung Anzahl der Freiheitsgrade = 4-1 =3 KB (kritischer Bereich): q 7.81 (aus 2Tabelle bei =0.05). q in der Stichprobe = 9; liegt im KB; daher Nullhypothese ablehnen. Nullhypothese ablehnen, falls der Wert q in der Stichprobe im KB liegt Exakt das gleiche Ergebnis würde resultieren, wenn die H-Statistik der FRIEDMAN Zwei-Weg-Rangvarianzanalyse berechnet würde. COCHRANs q ist daher nur ein Spezialfall der H-Statistik von Friedman (unter Beachtung der Ties). Die exakte Verteilung von q (unter Geltung der Nullhypothese) könnte nach dem gleichen Blockrandomisierungsschema erzeugt werden, wie dies bei der Friedmananalyse gezeigt wurde. 2. Vergleich von G Anteilen aus unverbundenen Stichproben. Der Vergleich von G unverbundenen Gruppen führt auf die ‚klassische’ Überprüfung der stochstischen Unabhängigkeit der beiden Merkmale: Gruppierungsvariable (=x) und dichotome ‚Erfolgsvariable’ (=y). Als Test für die Überprüfung der Unabhängigkeit wird i. a. der 2-Test (von PEARSON entwickelt) verwendet. Die Daten werden als Kreuztabelle mit Häufigkeiten dargestellt. Die Anzahl der Fälle in der g. Gruppe ist ng. Die Anzahl der Erfolge in der g. Gruppe gleich ag. Insgesamt werden bei n Versuchen a Erfolge verzeichnet. Die Anteile in Stichprobe für die G Gruppen werden geschätzt. Die Nullhypothese fordert, dass die Anteile in allen Gruppen gleich sind. Als Teststatistik kann nun das übliche PEARSON 2 berechnet werden. Eine vereinfachte Formel für den Fall eines Grup pen Erfolg 0 1 1. n1- a1 2. n2- a2 . ... G. nG- aG n-a Anteil in g. Gruppe ˆ g a1 n1 a2 n2 ... aG nG a n ag ng H0: 1 = 2= ...= G Pearson 2 (für dichotomes y) = n n G a i2 a n a a g 1 n i Beispiel: Jeweils eine von 4 Aufgaben (A,B,C,D) wurde jeweils 10 Personen vorgelegt. Daher entstehen 4 Gruppen mit jeweils 10 Personen. Die Aufgaben können wieder richtig(=1) oder falsch (=0) gelöst werden. Das Ergebnis 0 1 wurde in der Kreuztabelle 1. (A) 8 2 10 zusammengefasst. 2. (B) 6 4 10 Die hier dargestellten Erfolge 3. (C) 3 7 10 4. (D) 3 7 10 entsprechen aus Vergleichs20 20 40 gründen genau den oben bei den verbundenen Gruppen erzielten Erfolgen (hier wurden allerdings 40, dort nur 10 Personen untersucht) Geschätzte Erfolgsanteile in den Gruppen: ˆ 1 2 20 , ˆ 2 4 20 , ˆ 3 7 20 , ˆ 4 7 20 Die Nullhypothese 1 = 2= 3= 4 besagt hier, dass alle Aufgaben gleich schwierig sind; d. h. der Erfolgsanteil bei allen Aufgaben ist gleich. PEARSON 2 40 4 49 49 16 10 10 = 40 20 20 10 10 = 2(2*11.8 – 20) = 7.2 20 = Nagl, Materialien zu Nichtparametrischen Verfahren dichotomen Merkmals erleichtert die Berechnung Verteilung von PEARSONs 2 PEARSONs 2 ist approximativ 2 – verunter Geltung der Nullhypoteilt mit G-1 Freiheitsgraden these: Kritischen Bereich bestimmen q 2-() bei G1 Freiheitsgraden Entscheidung Seite 31 Anzahl der Freiheitsgrade = 4-1 =3 KB (kritischer Bereich): q 7.81 (aus 2Tabelle bei =0.05). PEARSONs 2 in der Stichprobe = 7.2; liegt daher nicht im KB; daher Nullhypothese akzeptieren. Nullhypothese ablehnen, falls der Wert q in der Stichprobe im KB liegt Auch in diesem Fall könnte eine exakte Verteilung unter Geltung der Nullhypothese etabliert werden (als Erweiterung des FISHER-schen Überlegungen).