Nagl, Materialien zu Nichtparametrischen Verfahren Seite 6 Tests für verbundene Stichproben Anwendung: Feststellen von Unterschieden zwischen zwei verbundenen Stichproben. Bei zwei verbundenen Stichproben gibt es zu jeder Messung der ersten Stichprobe genau eine Messung in der zweiten Stichprobe. Bezeichnungen Größe (Stichprobe) 1. Stichprobe 2. Stichprobe Bezeichnung der Meßwerte y(1) y(2) n n Verteilung (Gesamtheit) F1 (y(1)) F2 (y(2)) Lagekonstante (Gesamtheit) θ1 θ2 Nullhypothese: H 0: F1 (y)= F2 (y) für alle y bzw. F1 (y-θ1)= F2 (y-θ2) für alle y, zudem gilt: θ1=θ2 bzw. F1 (y)= F2 (y-θ) für alle y, zudem gilt: θ=0 d. h.: die Stichproben stammen aus der gleichen Verteilung oder: Unabhängigkeit zwischen Gruppe und Meßwerten oder: beide Verteilungen sind gleich, neben allen möglichen anderen Aspekten stimmen die Verteilungen auch bezüglich der Lage überein oder: (mit θ:=θ2-θ1), sonst wie oben. Mögliche Alternativhypothesen: HL: F1 (y)= F2 (y-θ) für alle y und ein θ≠0 Die Lage der beiden (gleichen) Verteilungen ist verschieden Die Werte der ersten Stichprobe sind kleiner HLL F1 (y)= F2 (y-θ) für alle x und ein θ<0 Überlegungen zur Konstruktion von Teststatistiken bei verbundenen Stichproben Da bei verbundenen Stichproben jede Beobachtung aus der einen Stichprobe auf Grund einer Zuordnungsregel genau einer bestimmten Beobachtung der anderen Stichprobe vergleichbar ist, werden speziell diese Paare verglichen. Bei quantitativen Merkmalen werden meist Differenzen gebildet. Beschreibung Formel Konsequenz Differenzen bilden di = Verteilung der Differenzen: FD(d - θ), symmetrisch um 0, mit θ=θ2 - θ1, wobei Symmetriepunkt θ = 0 Nullhypothese: Symmetrie bei 0 Alternativ-Hypothese: 1. Gruppe kleiner als 2. Gruppe Alternativ-Hypothese: 2. Gruppe kleiner als 1. Gruppe ( 2) i (1) i y −y für alle Paare i Symmetriepunkt θ= θ2 - θ1> 0 Symmetriepunkt θ= θ2 - θ1< 0 ⇒ Verteilung der Differenzen ⇒ Formulierung der Hypothesen für die Differenzen ⇒ ungefähr gleich viel negative wie positive Differenzen ⇒ positive Differenzen überwiegen ⇒ negative Differenzen überwiegen Der VorzeichenTest Der Vorzeichentest berücksichtigt nur, wieviele positive (bzw. negative)Vorzeichen vorhanden sind. Unter Geltung der Nullhypothese ist die Wahrscheinlichkeit, daß bei einem bestimmten Paar eine positive Differenz gefunden wird gleich ½. Beschreibung Daten der 2. Stichprobe Daten der 1. Stichprobe Formel ( 2) ( 2) ( 2) ( 2) y1 , y2 , ... , yi , ... , yn (1) y1 Differenzenwerte , (1) (1) (1) y2 , ... , yi , ... , yn d i = y i( 2) − y i(1) Beispiel Blutdruck nach Biofeedback: 130.2, 180.2, 149.6, 153.2, 162.6, 160.1 Vorher: 136.9, 201.4, 166.8, 150.0, 173.2, 169.3 -6.7, -20.7, -17.2, 3.2, -10.6, -9.2 Nagl, Materialien zu Nichtparametrischen Verfahren Seite 7 Diagramm der individuellen Veränderungen 210 210 200 200 190 190 180 180 170 170 Blutdruck Blutdruck nachher Streudiagramm 160 160 150 150 140 140 130 130 120 120 120 140 160 BD vorher 180 nachher 200 vorher Zeit Teststatistik: Anzahl positiver Differenzen( =Anzahl ’Erfolge’) k= I(d1) + I(d2) + ...... + I(dn), mit Indikatorfunktion: I(di)=1, falls di>0; I(di)= 0, sonst allgemein: K ∼ Bin(n,π) unter Ho: K ∼ Bin(n,0.50) Testverteilung für Anzahl Erfolge bei n Versuchen ist binomialverteilt, unter Ho mit Einzelerfolgswahrscheinlichkeit=0.50 Kritischer Bereich (Werte der TestAuf Grund Ho und Ha Bereich für statistik, bei denen Ha präferiert wird K festlegen (links-, rechts- oder und deren Wahrscheinlichbeidseitig) keitssumme in der Testverteilung ∑ W( i) ≤ α kleiner gleich Signifikanzniveau ist) i ∈ krit. Bereich einseitig (links bzw. rechts) oder zweiseitig (links und rechts) Entscheidung: Ho ablehnen zugunsten von Ha, falls Testwert im kritischen Bereich liegt Testwert k im krit. Bereich ⇒ Ho ablehnen. Ho akzeptieren, sonst. k= 0 + 0 + 0 + 1 + 0 + 0 =1 n=6, k=1, p= 0.50 W(Anzahl Erfolge=0 | Ho richtig)= 0.016 W(Anzahl Erfolge=1 | Ho richtig)= 0.094 usw. (aus Binomial-Tabelle) Ho: kein Effekt. Ha: Effekt vorhanden ⇒ zweiseitig: großer oder kleiner Wert ...führt zu Ablehnung. kritischer Bereich: 0 bzw. 6 W(K ist 0 oder K ist 6)= 0.032 <= 0.05(=α) bzw. Ha: Verbesserung(Blutdruckreduktion). ⇒Anzahl der ‚Erfolge‘ sehr klein. W(K=0)=0.016<=0.05 W(K=0 oder K=1)=0.11> α ⇒ krit.Bereich: k=0 Ho wird bei einseitigem ebenso wie beim zweiseitigen Bereich akzeptiert, da der Testwert (k=1) nicht im kritischen Bereich liegt Annäherung für großes n (n>20) mit Hilfe der Normalverteilung: K ∼ NV(n*0.5, n*0.25) unter Ho. Falls Ties vorhanden sind, werden nur jene Differenzen betrachtet, die nicht 0 sind (d.h. n wird reduziert). Der Vorzeichen-Rang-Test (Wilcoxon) Nicht nur das Vorzeichen, auch die Größenordnung der Veränderung (als Ränge) wird beim Vorzeichenrangtest berücksichtigt. Zuerst wird der Fall ohne Ties behandelt. Beschreibung Daten der 2. Stichprobe Daten der 1. Stichprobe Formel ( 2) y1 , (1) y1 , ( 2) y2 , ... , ( 2) yn (1) (1) (1) y2 , ... , yi , ... , yn Differenzenwerte Rangordnung der Veränderungen feststellen (Veränderungen, egal in welche Richtung) Teststatistik: W + = Summe der Ränge für die die Differenzen positiv sind (=‘positive Rangsumme‘) ... , ( 2) yi , d i = y i( 2) − y i(1) Ränge der Beträge der Differenzen: R ( | d i | ) W+ = ∑ I (d ) R ( | d i i |) i mit: I(di)=1, falls di>0, sonst 0 I( ) heißt Indikatorfunktion Beispiel Blutdruck nach Biofeedback 130.2, 180.2, 149.6, 153.2, 162.6, 160.1 Vorher: 136.9, 201.4, 166.8, 150.0, 173.2, 169.3 -6.7, -20.7, -17.2, 2, 6, 5, 3.2, -10.6, -9.2 1, 4, 3 I (d i ) : 0 0 0 1 0 0 W+ = 0 2 + 0 6 + 0 5 + 1 1 + 0 4 + 0 3 =1 Nagl, Materialien zu Nichtparametrischen Verfahren Seite 8 Testverteilung für W+ unter Geltung der Nullhypothese Die Testverteilung für W+ entsteht auf Grund der Aufzählung aller möglichen Werte von W+ . Die möglichen Werte ergeben sich aus der Summe der Ränge, wobei jedes Vorzeichen jeweils positiv oder negativ sein kann, für n Meßwerte ergeben sich daher 2n Konstellationen, die alle unter Geltung der Nullhypothese gleich wahrscheinlich sind. W+ . kann minimal 0 werden, maximal die Summe der Ränge sein, d.h. n(n+1)/2 (‚Gauß in Volksschule‘-Story). Beispielsweise für n=3: Für jede Vorzeichenkonstellation (hier 8 verschiedene) wird Wilcoxons w+ berechnet (Ränge im Tabellenkopf entsprechend mit 0 bzw. 1 multipliziert und summiert). Rang: 1 0 0 0 0 1 1 1 1 2 0 0 1 1 0 0 1 1 3 0 1 0 1 0 1 0 1 w+ 0 3 2 5 1 4 3 6 Die Verteilung für W + unter Geltung der Nullhypothese (rechts). Zudem wurde der Erwartungswert und die Varianz berechnet. w+ 0 1 2 3 4 5 6 Anz 1 1 1 2 1 1 1 W( W + = w + ) 1/8 1/8 1/8 2/8 1/8 1/8 1/8 W( W + ≤ w + ) 1/8 2/8 3/8 5/8 6/8 7/8 8/8 E( W + ) =3 Var( W + ) = 3.5 Für n=6 entstehen 64 Vorzeichen-Konstellationen, für jede dieser Konstellationen wird wiederum mit den Rängen als Gewichten ein w+ berechnet. Als Verteilung zusammengefaßt: w + Anz W( W + = w + ) W( W + ≤ w + ) 1 1 1 2 2 3 4 4 4 5 5 5 5 4 4 4 3 2 2 1 1 1 0.0156 0.0156 0.0156 0.0313 0.0313 0.0469 0.0625 0.0625 0.0625 0.0781 0.0781 0.0781 0.0781 0.0625 0.0625 0.0625 0.0469 0.0313 0.0313 0.0156 0.0156 0.0156 0.0156 0.0313 0.0469 0.0781 0.1094 0.1563 0.2188 0.2813 0.3438 0.4219 0.5000 0.5781 0.6563 0.7188 0.7813 0.8438 0.8906 0.9219 0.9531 0.9688 0.9844 1.0000 Stabdiagramm: Verteilung von W+ 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Die Verteilung für W + wurde für n<= 30 tabelliert (siehe im Tabellenanhang). Die Verteilung ist symmetrisch, wie auch im obigen Beispiel ersichtlich. Daher muß nur eine Seite der Verteilung tabelliert werden. Für Tests sind zudem nur die Extrembereiche notwendig, daher werden die kumulierten Wahrscheinlichkeiten werden angezeigt. E( W + ) =10.5 Var( W + ) = 22.75 Beschreibung Formeln Kritischer Bereich (Werte der TestAuf Grund Ho und Ha Bestatistik, bei denen Ha präferiert wird reich für W + festlegen (links-, und deren Wahrscheinlichrechts- oder beidseitig) keitssumme in der Testverteilung ∑ W( i) ≤ α kleiner gleich Signifikanzniveau ist) i ∈ krit. Bereich einseitig (links bzw. rechts) oder zweiseitig (links und rechts) Beispiel Ha: Effekt vorhanden ⇒ zweiseitig: großer oder kleiner Wert führt zu Ablehnung. kritischer Bereich: 0 bzw. 21 W( W + ist 0 oder W + ist 21)= 0.032 <= 0.05; Würde 1 und 20 noch dem Kritischen Bereich hinzugefügt, wäre die W’tssumme zu groß. Ha: Verbesserung(Blutdruckreduktion). ⇒ einseitig: Anzahl der ‚pos. Diff‘ sehr klein. W( W + <=2)= 0.0469 <=0.05; krit.Bereich: 0, 1, 2 Nagl, Materialien zu Nichtparametrischen Verfahren Entscheidung: Ho ablehnen zugunsten von Ha, falls Testwert im kritischen Bereich liegt Seite 9 Testwert W + im krit. Bereich Ho wird bei einseitigem abgelehnt, beim zweiseitigen Bereich akzeptiert ⇒ Ho ablehnen. Ho akzeptieren, sonst. Berücksichtigung von Ties Ties können in zwei Situationen auftreten: Falls die Differenzen = 0 werden. Diese Beobachtungspaare werden dann eliminiert, die weiteren Berechnungen werden mit reduziertem n durchgeführt. Die Beträge der Differenzen verschiedener Paare sind gleich. Bei diesen werden Rangmittel (Midranks) verwendet. Beschreibung Formel Daten der 2. Stichprobe ( 2) ( 2) ( 2) ( 2) y1 , y2 , ... , yi , ... , yn Daten der 1. Stichprobe (1) y1 , (1) (1) (1) y2 , ... , yi , ... , yn Differenzenwerte d i = y i( 2) − y i(1) Rangordnung der Veränderungen feststellen (egal in welche Richtung) Teststatistik: W + = Summe der Beispiel Angst nach Behandlung 31, 35, 37, 39, 40, 53 davor 35, 45, 49, 49, 51, 52 di = Ränge der Beträge der Differenzen: R ( | d i | ) , bzw. Midranks W+ = Ränge (bzw. Midranks) ∑ I (d ) R ( | d i | ) wie oben i − 4 , − 10 , - 12, - 10, - 11, 1 2, 3.5, 6, 3.5, 5, 1 W+ = 1 i Häufigkeit von gleichen Midranks (Tievektor) bei K verschiedenen Midranks t 1 , t 2 ,..., t k ,..., t K t k = Häufigkeit des k. Midranks Hier gibt es 5 (=K) verschiedene Midranks: 1, 2, 3.5, 5, 6, wobei: t 1 = 1, t 2 = 1, t 3 = 2, t 4 = 1, t 5 = 1 Testverteilung für W+ unter Geltung der Nullhypothese, bei Vorliegen von Ties Die Testverteilung für W+ entsteht wiederum wie oben, allerdings muß die spezielle Tie-Konstellation berücksichtigt werden. Für n=3: Seien die 2. und 3. absolute Differenz gleich. Das ergibt folgende Rangkonstellation: 1, 2.5, 2.5. Daher: Die Verteilung für w+ w+ W( W+ ≤ w + ) Rang: 1 2.5 2.5 Anz W( W+ = w + ) W + unter Geltung 0 1 1/8 1/8 0 0 0 0 der Nullhypothese 1 1 1/8 2/8 0 0 1 2.5 (rechts). 2.5 2 2/8 4/8 0 1 0 2.5 3.5 2 2/8 6/8 0 1 1 5 Der Erwartungswert 5 1 1/8 7/8 1 0 0 1 6 1 1/8 8/8 ist gleich wie vorher, 1 0 1 3.5 die Varianz kleiner. E( W+ ) =3 Var( W+ ) = 3.375 1 1 0 3.5 1 1 1 6 Für n=6 und die oben gegebene Rangkonstellation: 1 2 3.5 3.5 5 6 wird nach demselben Verfahren wie oben Verteilung erstellen: Anz W( W + = w + ) W( W + ≤ w + ) 0 1 2 3 3.5 4.5 5 5.5 .... 15.5 16 16.5 17.5 18 19 20 21 1 1 1 1 2 2 1 2 .... 2 1 2 2 1 1 1 1 0.0156 0.0156 0.0156 0.0156 0.0313 0.0313 0.0156 0.0313 .... 0.0313 0.0156 0.0313 0.0313 0.0156 0.0156 0.0156 0.0156 0.0156 0.0313 0.0469 0.0625 0.0938 0.1250 0.1406 0.1719 ..... 0.8594 0.8750 0.9063 0.9375 0.9531 0.9688 0.9844 1.0000 E( W + ) =10.5 Var( W + ) = 22.625 Stabdiagramm: Verteilung für W+, mit Ties 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 w+ Die Verteilung für W + für die spezielle Rang-Konstellation ist oben als Stabdia- gramm vollständig dargestellt. Die Werte links stellen eine Auswahl dar. Nagl, Materialien zu Nichtparametrischen Verfahren Seite 10 Da für jede Rang-Konstellation eine eigene Tabelle notwendig wäre, müsste ein riesiges Tabellenwerk für die Verteilung W + mit Ties erstellt werden. Als Annäherung bei nicht allzu kleinen Stichproben kann die Normalverteilung verwendet werden. Dabei wird der Erwartungswert und die Varianz von W + benötigt: Der Erwartungswert von W + : E( W + )= n (n+1)/4. Die Varianz von W + ist kleiner bei Vorliegen von Ties: Var( W + )= n (n + 1)(2n + 1) ∑ ( t 3k − tk ) − , wobei t 1 , t 2 ,..., t k ,..., t K der Tievektor ist. 24 48 Berechnen von Erwartungswert und Varianz Beispiel : n=6. Tievektor: t1 E( W + )=6*7/4 = 10.5 = 1, t 2 = 1, t 3 = 2, t 4 = 1, t 5 = 1 . ∑ ( t 3k − tk ) =0+0+(8-2)+0+0=6. Var( W+ )=(6 . 7 . 13) / 24 – 6/ 48=22.625. Kritischer Bereich und Entscheidung bei Ties Beschreibung Formeln Kritischer Bereich, wie oben(exakt) und Entscheidung Auf Grund der Verteilung der Teststatistik unter Ho Kritischer Bereich, (approximativ, auf Grund der Normalverteilung) z-Werte bilden z= Entscheidung(bei approximativem Test): Ho ablehnen zugunsten von Ha, falls Testwert im kritischen Bereich liegt W+ − E ( W + ) Var ( W+ ) Liegt der Testwert W + im kritischen Bereich, wird Ho abgelehnt. Beispiel entsprechende kritische Region und Entscheidung wie oben(jetzt aber mit Ties) bei α ≤ 0.05: Kritischer Bereich einseitig links: {0,1,2} Kritischer Bereich einseitig rechts: {19,20,21} Kritischer Bereich zweiseitig: {0,21}. E( W+ )=10.5 Var( W+ )=22.625. z = (1 – 10.5) / 4.75657 = -1.9972 Ho wird bei einseitigem und zweiseitigen Bereich abgelehnt. Kritischer Bereich einseitig links: z-Werte <= -1.645 Kritischer Bereich einseitig rechts: z-Werte >= 1.645 Kritischer Bereich zweiseitig: |z-Werte| <= 1.96