Methoden der Psychologie Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg 2 R. 06-206 (Persike) R. 06-321 (Meinhardt) Forschungsstatistik I Sprechstunde jederzeit nach Vereinbarung Dr. Malte Persike } [email protected] http://psymet03.sowi.uni-mainz.de/ SS 2009 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz Methoden der Psychologie Binomialtest χ²-Test Tests für Anteile Binomialtest für unabhängige Stichproben Ziel: Prüfung, ob Häufigkeiten aus zwei Stichproben gleich oder unterschiedlich sind Beispiele: Ist die Wahrscheinlichkeit für ein Todesurteil bei farbigen und weißen Angeklagten unterschiedlich; Werden Männer häufiger zu Bewerbungsgesprächen eingeladen als Frauen. Voraussetzungen: Die Auftretenswahrscheinlichkeiten in beiden Stichproben müssen binomialverteilt sein und die Stichproben müssen unabhängig sein. Methoden der Psychologie Binomialtest χ²-Test Tests für Anteile Binomialtest für unabhängige Stichproben Es werden folgende mögliche Hypothesen geprüft: a) H 0 : pˆ1 = pˆ 2 ; H1 : pˆ1 ≠ pˆ 2 b) H 0 : pˆ1 ≤ pˆ 2 ; H1 : pˆ1 > pˆ 2 c) H 0 : pˆ1 ≥ pˆ 2 ; H1 : pˆ1 < pˆ 2 Die geschätzten Populations-Wahrscheinlichkeiten p_dach für die 2 Stichproben werden direkt aus den beobachteten Wahrscheinlichkeiten p geschätzt Methoden der Psychologie Binomialtest χ²-Test Tests für Anteile Binomialtest für unabhängige Stichproben Prüfgröße bei zwei Stichproben der Umfänge n1 und n2 und des Gesamtumfangs N = n1+n2. z= mit Δp σ Δp = pˆ1 − pˆ 2 pˆ12 ⋅ (1 − pˆ12 ) ⋅ (1 n1 + 1 n2 ) n1 n2 pˆ12 = ⋅ pˆ1 + ⋅ pˆ 2 N N Die Prüfgröße ist standardnormalverteilt, wenn in der 2x2 Kreuztabelle der beobachteten absoluten Häufigkeiten alle nij > 5 sind. Methoden der Psychologie Binomialtest χ²-Test Tests für Anteile Fishers exakter Test für unabhängige Stichproben In manchen Untersuchungen liegen zu wenige Beobachtungen vor, um von einer Normalverteilung der Prüfgröße bei binomialverteilten Daten aus zwei Stichproben ausgehen zu können. Für mindestens eines (meistens mehrere) der gilt dann: nij ≤ 5. In diesem Fall wird statt des Binomialtests Fishers Exakter Test verwendet (Fisher‘s exact test). Methoden der Psychologie Binomialtest χ²-Test Tests für Anteile Fishers exakter Test für unabhängige Stichproben Man habe für 2 unabhängige Stichproben x1 und x2 folgende Kontingenztabelle der Beobachtung A bzw. ¬A (nicht A) erhalten: x1 x2 h(A) n11 n12 n1 h(¬A) n21 n22 n2 n n n 1 2 Die Punktwahrscheinlichkeit für eine solche Beobachtung von Häufigkeiten folgt der hypergeometrischen Verteilung ⎛ n1• ⎞ ⎛ n2• ⎞ ⎛ n•• ⎞ n1• !n2• !n•1 !n•2 ! ⎜ ⎟⎜ ⎟ ⎜ ⎟ = ⎝ n11 ⎠ ⎝ n21 ⎠ ⎝ n•1 ⎠ n•• !n11 !n12 !n21 !n22 ! Methoden der Psychologie Binomialtest χ²-Test Tests für Anteile Fishers exakter Test für unabhängige Stichproben Problem: Im Rahmen des Testens ist man nicht an der Punktwahrscheinlichkeit interessiert, sondern an der Intervallwahrscheinlichkeit für das erhaltene oder ein noch extremeres Ergebnis. Bei Fishers Exaktem Test ermittelt man diese Wahrscheinlichkeit, indem man tatsächlich alle bei gleichen Randhäufigkeiten noch extremeren Kontingenztabellen konstruiert, ihre Punktwahrscheinlichkeit bestimmt und dann die erhaltenen Wahrscheinlichkeiten addiert. Für einseitiges Testen sind dies die Kontingenztabellen in Richtung der beobachteten Abweichung, für zweiseitiges Testen auch die entgegen gesetzte Richtung Methoden der Psychologie Binomialtest χ²-Test Tests für Anteile χ²-Test für unabhängige Stichproben Wenn das an zwei Stichproben erhobene Merkmal nicht nur in zwei, sondern in multiplen Ausprägungen gemessen werden soll, wird zur Prüfung der Homogenität bzw. Unterschiedlichkeit der Stichproben der χ²-Test verwendet. Beispiele: Wählen Frauen Parteien in anderen Häufigkeiten als Männer? Kommen bei endogen Depressiven andere Komorbiditäten vor als bei reaktiv Depressiven? Voraussetzungen: Die Auftretenswahrscheinlichkeiten in beiden Stichproben müssen multinomialverteilt sein und die Stichproben müssen unabhängig sein. Methoden der Psychologie Binomialtest χ²-Test Tests für Anteile χ²-Test für unabhängige Stichproben Es werden folgende Hypothesen geprüft: H 0 : pˆ (Y1 = i ) = pˆ (Y2 = i ) für alle i = 1...k H1 : pˆ (Y1 = i ) ≠ pˆ (Y2 = i ) für mindestens ein i Die geschätzten Populations-Wahrscheinlichkeiten p_dach für die 2 Stichproben werden direkt aus den beobachteten Wahrscheinlichkeiten p geschätzt Methoden der Psychologie χ²-Test Binomialtest Tests für Anteile χ²-Test für unabhängige Stichproben Man habe folgende Kontingenztafel: x1 x2 h(1) n11 n12 n1 h(2) n21 n22 n2 … … … h(k) nk1 nk2 nk n n n 1 2 Methoden der Psychologie χ²-Test Binomialtest Tests für Anteile χ²-Test für unabhängige Stichproben Die Prüfgröße ist dann wie bereits gesehen: χ2 = ∑ ( beobachtet − erwartet ) erwartet Für absolute Häufigkeiten ni• ⋅ n• j ⎞ ⎛ ⎜ nij − ⎟ k 2 n ⎠ •• χ 2 = ∑∑ ⎝ ni• ⋅ n• j i =1 j =1 2 Für relative Häufigkeiten 2 2 k χ = n•• ⋅ ∑∑ 2 i =1 j =1 (p ij − pi• ⋅ p• j ) 2 pi• ⋅ p• j n•• Die Prüfgröße ist χ²-verteilt mit df=k-1 Freiheitsgraden wenn in der Kontingenztabelle der beobachteten absoluten Häufigkeiten alle nij > 5 sind. Methoden der Psychologie χ²-Test Binomialtest Tests für Anteile χ²-Test für unabhängige Merkmale Die Prüfgröße kann leicht auf den Fall einer k×m Kontingenztabelle erweitert werden. Für absolute Häufigkeiten ni• ⋅ n• j ⎞ ⎛ ⎜ nij − ⎟ m k n ⎠ •• χ 2 = ∑∑ ⎝ ni• ⋅ n• j i =1 j =1 Für relative Häufigkeiten 2 m k χ = n•• ⋅ ∑∑ 2 i =1 j =1 (p ij − pi• ⋅ p• j ) pi• ⋅ p• j n•• Es kann so allgemein die Unabhängigkeit von zwei nominalskalierten Merkmalen mit beliebig vielen Ausprägungen geprüft werden. Die Prüfgröße ist χ²-verteilt mit df=(k-1)·(m-1) Freiheitsgraden wenn in der Kontingenztabelle der beobachteten absoluten Häufigkeiten alle nij > 5 sind. 2