a /2 - Johannes Gutenberg

Werbung
Methoden der
Psychologie
Evaluation
&
Forschungsstrategien
WS2011/12
Prof. Dr. G. Meinhardt
Johannes Gutenberg Universität Mainz
Methoden der
Psychologie
Seminar
Evaluation & Forschungsstrategien
Anwendung statistischer Verfahren in
•
•
•
•
Überblick
Grundprinzip
wichtigsten mathematischen Beziehungen
Anwendungsbeispiele in Excel & Statistica
HA/Tut
• Vertiefung mit Anwendungsbeispielen
• Aufgabenbearbeitung mit Excel & Statistica
Prüfung
Mündliche Modulabschlußprüfung
Stud.Leistung
Bearbeitung eines Project Files
Methoden der
Psychologie
Einführung
Verfahren
Versuchspläne
Ziele
Evaluation & Forschungsstrategien
Evaluationsproblem am Beispiel der
Wirksamkeitsprüfung einer therapeutischen
Maßnahme: Grundprobleme und Prüfstrategien
•
•
•
•
•
ANOVA, Hotelling‘s T2
ANOVA – Messwiederholungsdesigns/Trendanalyse
Effektstärkenprüfung
Faktoranalyse
Fallklassifikation
Typische Designs aus der klinischen Psychologie
• Wissen über statistische Verfahren
• Wissen über Untersuchungsstrategien
• Umsetzung mit Software
Methoden der
Psychologie
Evaluationsproblem
Design
Evaluation & Forschungsstrategien
Problemstellung
Eine Psychologin leitet eine Therapie-Evaluationsstudie zur Wirksamkeit einer neuen Behandlungsmethode für
depressive Verstimmungen. Dazu werden 22 Patienten über 8 Wochen lang mit der neuen Methode behandelt, und die
Werte in 3 Kontrollvariablen V1: erlebte Beanspruchung, V2: Ohnmacht/Hilflosigkeit, V3: Körperbeschwerden jede Woche
erhoben (Vx: Mehritemskalen, die einen intervallskalierten Score pro Variable liefern). Zugleich existiert eine
Kontrollgruppe, an der die Variablen ebenfalls erhoben werden. Alle 3 Variablen sind für die Beurteilung des
Behandlungserfolges gleichermaßen wichtig, und sollten in das Urteil über die Eignung der Behandlungsmethode
eingehen.
ANOVA mit einem Gruppierungsfaktor und mind.
einem Messwiederholungsfaktor
Control
Therapy
t1
v1 v2 v3
v1 v2 v3
t2
v1 v2 v3
v1 v2 v3
…
…
…
tk
v1 v2 v3
v1 v2 v3
Hierbei wird jede Variable Vj auf ni Versuchspersonen
gemessen.
i = 1: Kontrollgruppe
i = 2: Therapiegruppe
(die Stichprobenumfänge beider Gruppen dürfen
verschieden sein)
Methoden der
Psychologie
Evaluation & Forschungsstrategien
Daten
TIME*VAR*Group; LS Means
Current effect: F(12, 504)=68.837, p=0.0000
Effective hypothesis decomposition
Vertical bars denote 0.95 confidence intervals
7.0
6.5
DV_1
6.0
5.5
5.0
4.5
4.0
3.5
TIME:
2
3
4
5
Group: Control
6
7
TIME:
2
3
4
5
Group: Therapy
6
7
VAR
1 Bean
VAR
2 Ohnm
VAR
3 Hilf
Methoden der
Psychologie
Fragen
Evaluation & Forschungsstrategien
Methoden der
Psychologie
Literatur
Multivariate Analysemethoden & Multivariates Testen
a)
Bortz
b)
c)
Winer
Bortz/Döring
Methoden der
Psychologie
Problem
Univariate Mittelwertevergleiche - Problemstellung
Gruppierungsvariable
Messgröße
(metrisch)
Beispiel
Geschlecht
x
Anzahl der gefundenen
Zielelemente in einem
Konzentrationsleistungstest
M
Frage
J
Unterscheidet sich die Leistung von Mädchen und Jungen
im statistischen Mittelwert ?
Methoden der
Psychologie
Stichprobe
Beispieldaten
Frage
Univariate Mittelwertevergleiche - Problemstellung
Wir untersuchen 40 Mädchen und 45 Jungen
Geschlecht
M
J
xM
xJ
23.7
17.2
xM  xJ  x
23.7 – 17.2 = 6.5
Gibt es wirkliche Leistungsunterschiede zwischen Jungen
und Mädchen, oder ist der gefundene Unterschied „rein
zufällig“ ?
Methoden der
Psychologie
Strategie
Annahme
Univariate Mittelwertevergleiche - Prüfstrategie
Ermittle die Wahrscheinlichkeit für den beobachteten
Mittelwertsunterschied unter der Annahme, dass beide
Gruppen in der Population denselben Mittelwert besitzen
Die Populationsmittelwerte von Jungen und Mädchen sind gleich
Null-Hypothese
H 0 :  J  M
AlternativHypothese
H1 :  J  M
Urteil
Ist der beobachtete Mittelwertsunterschied unter der H0 sehr
unwahrscheinlich (höchstens 5%), so lehnen wir die H0 ab,
und sehen die H1 als die bessere Alternative an.
Methoden der
Psychologie
Sampling
Theoretische Verteilung – Sampling Distribution
Population der Jungen
Stichprobe des Umfangs NJ
Mittelwertsdifferenz
xJ
x  xM  xJ
x1  xM 1  xJ 1
Tue dies k - mal:
Population der Mädchen
x2  xM 2  xJ 2
xk  xMk  xJk
xM
Stichprobe des Umfangs NM
Verteilung der
Differenzen von
Mittelwerten
 x1
x2
xi
xk 
Methoden der
Psychologie
Central Limit
Theorem
Theoretische Verteilung – Sampling Distribution
Die Verteilung von Differenzen von Mittelwerten nähert sich
mit wachsendem Umfang der Sample-Stichproben einer
Normalverteilung. Für N > 30 ist die Approximation gut.
Wahrscheinlichkeitsdichte
f  x 
x  0
0.10
s x (wird geschätzt)
s x
0.05
0.00
Inferenzstat.
Schluss
Es gilt:
2sx
sx
0
sx
2sx
x
In der theoretischen Verteilung der Differenzen von Mittelwerten wird die Wahrscheinlichkeitsbestimmung vorgenommen. Sie liegt dem inferenzstatistischen Schluss zugrunde.
Methoden der
Psychologie
Unabhängigkeit
Sampling Distribution – Bestimmung des Standardfehlers
Ist die Messvariable eine in beiden Populationen unabhängige ZV:
s x 
Gleichheit der
Populationsvarianz
Standardfehler
s M2
NM

s J2
NJ
Jungen und Mädchen kommen aus derselben Population
s M2  s J2  s 2
s x
 1
1 
 s 


N
N
J 
 M
2
Methoden der
Psychologie
Schätzung aus
Stichproben
“Pooling”
Sampling Distribution – Schätzung des Standardfehlers
Für die Populationsvarianz verwendet man eine Schätzung aus
den Daten beider Stichproben:
2
2
N

s

N

s
SAQM  SAQJ
2
M
M
J
J
ˆ
s 

NM  N J  2
df M  df J
wobei sM2 und sJ2 die Stichprobenvarianzen sind
Dann gilt
Schätzformel
sˆ x 
N M  sM2  N J  sJ2
1
1


NM  N J  2
NM N J
(Beste Schätzung des Standardfehlers aus Stichprobendaten)
Methoden der
Psychologie
Normalverteilung – z –Standardnormalverteilung
f (z)
Wahrscheinlichkeitsdichte
Wahrscheinlichkeitsdichte
f (x)
0.10
sx
0.05
0.00
20
30
_
x
Normalverteilung
40
50
60
70
80
x
0.10
sz 1
0.05
0.00
-3
1
2
3
_0
z
Standard-Normalverteilung
-2
-1
xx
z
s
Die
_ z- Transformation übersetzt die Rohdatenskala in die Standardskala
( z = 0, sz = 1)
z
Methoden der
Psychologie
Sampling Distribution – Prüfgrösse
z- Skala der
Differenzen von
Mittelwerten
z
Unter der H0 gilt
Prüfgrösse
Transformation
[
2s x
[
2
s x
1
s x
x  0
z
Dann gilt:
x   x
x
s x
0
0
ist standardnormalverteilt
s x
1
]
x
]
z
2s x
2
Methoden der
Psychologie
Entscheidung über Prüfgrösse mit Standardnormalverteilung
f t 
Prüfgrösse
z
95%
-4
 z1 /2
  0.05
2.5%
0.1
-2
s x
Signifikanzniveau
0.2
2.5%
x
0
2
P  z  z1 /2   
4
z
z1 /2
Ablehnungsbereich
Annahmebereich
Ablehnungsbereich
z  z1 /2
z  z1 /2
z  z1 /2
Testen zum Signifikanzniveau : Ist |z| > z1-/2?
Methoden der
Psychologie
Entscheidung über Signifikanz des Mittelwerteunterschieds
x
1. Prüfgrösse
Berechne
2. Kritischer
z - Wert
Ermittle kritischen z - Wert z1-/2 für ein  Fehlerniveau
3. Entscheide
A. Gilt |z| > z1-/2
z
s x
Ablehnung von H0
(die Mittelwerte der J. und M. sind signifikant verschieden)
_ z1-/2
B. Gilt |z| <
Beibehalten von H0
(die Mittelwerte der J. und M. unterscheiden sich zufällig)
Methoden der
Psychologie
Numerisches Beispiel
xM
Differenz der
Mittelwerte
23.7
xJ
xM  xJ  x
17.2
23.7 – 17.2 = 6.5
sM2
sJ2
173
106
40 173  45 106
1
1


 2.58
40  45  2
40 45
Standardfehler
sˆ x 
Prüfgrösse und
Kritischer Wert
z
Entscheidung
2.52 > 1.96
6.5
 2.52
2.58
z1-/2 = z0.975 = 1.96
d.h. |z| > z1-/2
H0 ablehnen
Die Mittelwerte entstammen nicht derselben Population
(unterscheiden sich signifikant)
Methoden der
Psychologie
Voraussetzungen der Prüfung
Varianzhomogenität
a. Die Populationsvarianzen die beiden Stichproben zu
Grunde liegen, müssen gleich (homogen) sein.
(Prüfung mit geignetem Verfahren)
Unabhängigkeit
b. Die Messeinheiten innerhalb jeder Stichprobe müssen
unabhängig sein.
c. Die Messeinheiten beider Stichproben dürfen nicht
teilweise paarweise zuzuordnen sein.
Verletzungen
Der Test ist relativ robust gegen Verletzungen der
Varianzhomogenität. Verletzungen der Unabhängigkeit
(b.) führen zur Ungültigkeit der Prüfgrösse, der Unabhängigkeit (c.) je nach Höhe der Korrelationen zu
progressiven (kleine Korr.) oder zu konservativen
Entscheidungen (hohe Korr.).
Methoden der
Psychologie
Beispiel
Mittelwertsprüfung bei mehreren Variablen
Lebenszufriedenheit
Arbeit
10 Variablen
Privatsphäre
X1: Gehalt
X4: Ehe
X2: Entscheidungsfreiheit
X3: Qualität der Kommunikation
X5: Freunde/Beziehungen
X6: Sexualität
Person
Aktivität
X7: Lebensansprüche
X9: Hobbies
X8: Sinnhaftigkeit
X10: Sport/Fitness
(x1 , x2 ,K , x10 )
2 Gruppen
Gesunde
Herzinfarktpatienten
Methoden der
Psychologie
Multivariate Mittelwertsvergleiche - Einzeltestungen
Frage
Unterscheiden sich Gesunde und Patienten im Variablenkomplex Lebenszufriedenheit?
Teststrategie
Wir testen auf jeder der 10 Skalen den Gruppenunterschied
mit einem t- Test. Wenn irgend einer der Tests signifikant
wird, sehen wir die Gruppen als verschieden an.
Probleme
1. Multiples Testen: Dieselbe Hypothese wird 10 mal geprüft.
2. Unterstellte Unabhängigkeit: Man behandelt die einzelnen
Skalen als unabhängig voneinander.
3. Fehlendes Konstrukt: Lebenszufriendenheit wird nicht als
Variablenkomplex mit Binnenstruktur behandelt.
4. Mangelnde Teststärke: Man nutzt nicht die Korrelationsstruktur der Variablen für einen leistungsfähigen Test.
Ausweg
Verwendung eines multivariaten Tests, der die Information
aller 10 Variablen und ihrer Korrelationsstruktur in eine
statistische Prüfgrösse einfliessen lässt.
Methoden der
Psychologie
  Fehler
Kumulierung
Einzeltestungen - Bonferronikorrektur
Bei simultanen Einzeltestungen „kumuliert“ sich das  – Risiko:
ˆ  P  mind. 1 falsch   1  P  keinen 1 falsch 
 1  P T1  T2 
 1  1   1   
Overall 
 1  1   
 Tm 
1   
m
Setzt man das overall ̂ -Niveau fest und löst nach auf, folgt
  1  1  ˆ 
1/ m
Bonferroni
Approximation

ˆ
m
Um alle m Tests auf einem konventionellen Alpha Niveau
abzusichern, muss dieses durch die Anzahl der Tests geteilt
werden. Bei 10 Tests muss man für ein overall Alpha = 5% ein
Test-Alpha von 0.5% verwenden.
Methoden der
Psychologie
Multivariate Mittelwertsvergleiche - Verfahren
Variablenkomplex
Multivariates
Testkonstrukt
(x1 , x2 ,K , x10 )
Multivariate Distanz
(Mahalanobisdistanz)
Optimale Linearkombination
(Linear Discriminant Function)
Multivariate Quadratsummen
(SSCP-Matrizen-Zerlegung)
Verfahren
Hotelling‘s T2
MANOVA
DiskriminanzAnalyse
Alle Verfahren entscheiden über den Gruppenunterschied im
gesamten Variablenkomplex mit einem statistischen Test
Herunterladen