I. Was ist Sozialpsychologie und wie geht sie vor? 2. Methoden der Sozialpsychologie • Empirische Erkenntnisgewinnung • Kontrolle, Korrelation, Experiment – Übung: Alternativerklärungen finden • Merkmale des sozialpsychologischen Experiments – Faktorielle Versuchspläne • Gütekriterien – Schlüsselstudie – Techniken der Datenerhebung • Einige Grundlagen der Inferenzstatistik Schlüsselstudie: Rosenthal & Fode (1963) © Gerd Bohner 2007 Empirische Erkenntnisgewinnung • Methoden der Sozialpsychologie dienen der systematischen Gewinnung empirischer Daten zur Überprüfung einer Theorie oder zur Untersuchung eines Problems -- allgemein: zur Beantwortung einer Forschungsfrage. • Drei Ebenen der Fragestellung (Rosenthal & Rosnow, 2008): – deskriptiv – korrelativ – experimentell => Beispiele? © Gerd Bohner 2007 • Theorie: System aus abstrakten Begriffen (= Konstrukten), deren Definitionen und Aussagen darüber, wie diese Konstrukte miteinander zusammenhängen. • Eine empirische Theorie enthält Aussagen, die sich auf beobachtbare Sachverhalte beziehen. • Weitere Definitionsmerkmale (Smith & Mackie): – beschreibt kausale Zusammenhänge – ist allgemein (Geltungsbereich!) • Hypothese: Aussage über einen Zusammenhang zwischen Konstrukten. – Kann aus einer Theorie abgeleitet sein. – Soll empirisch falsifizierbar sein. © Gerd Bohner 2007 • Beispiel: Schachters Affiliationstheorie (1959). Enthält Aussagen über die Bedingungen, unter denen Personen die Gesellschaft anderer suchen (= Affiliation), und die Effekte dieses Verhaltens. • Eine Hypothese der Affiliationstheorie: Eine Furcht auslösende Situation erzeugt den Wunsch, die Gesellschaft anderer aufzusuchen, die sich in derselben Situation befinden. • Operationalisierung: Vom Konstrukt zur Variablen (z.B.: wie lässt sich "Furcht" operationalisieren, wie der "Wunsch nach Gesellschaft anderer"?) © Gerd Bohner 2007 Kontrolle, Korrelation, Experiment • Mögliche Überprüfungen von Schachters Hypothese (?): – Befragung von Personen zu (1) empfundener Furcht und (2) Streben nach Gesellschaft anderer in verschiedenen Situationen. Ist ein positiver Zusammenhang zwischen (1) und (2) ein Beleg für die Hypothese? – Beobachtung von Personen (1) im Wartezimmer eines Zahnarztes (starke Furcht) und (2) beim Warten auf eine Sprechstunde an der Uni (geringe Furcht). Ist mehr Affiliationsverhalten unter (1) ein Beleg für die Hypothese? – Beobachtung von Studierenden, die (1) auf eine Prüfung warten (starke Furcht) bzw. (2) bei der Studienberatung warten (geringe Furcht). Ist mehr Affiliationsverhalten unter (1) ein Beleg für die Hypothese? • Probleme bei diesen Herangehensweisen? © Gerd Bohner 2007 • Experimenteller Test der Affiliationshypothese: – Herstellung unterschiedlicher Grade von Furcht in unterschiedlichen Versuchsbedingungen – Ermöglichen einer Wahl zwischenVerhaltensalternativen, die unterschiedlichen Graden der Affiliationstendenz entsprechen • Schachter (1959): "Dr. Zilstein"-Experiment Zufallszuweisung zu 2 Bedingungen: – starke Furcht (Erwartung schmerzhafter und evtl. schädlicher Elektroschocks) – geringe Furcht (Erwartung harmloser Elektroschocks) Dann Frage, ob Vp lieber allein oder mit anderen auf die "Schockbehandlung" warten will. Ergebnis: Vpn in der Bedingung "starke Furcht" warten lieber in Gesellschaft als Vpn in der Bedingung "geringe Furcht" . © Gerd Bohner 2007 • Begriffe: unabhängige Variable (UV) – hier: Furcht abhängige Variable (AV) – hier: Verhaltenswahl • Zufallszuweisung dient dem Ausschluss von Alternativerklärungen. – Eine Alternativerklärung besagt, dass Veränderungen in der AV nicht durch die UV, sondern durch Störvariablen zustande kommen. – Oder (v.a. bei nichtexperimenteller Forschung), dass die Kausalrichtung eine andere ist als in der Theorie angenommen • Zufallszuweisung ist eine Kontrolltechnik. • Praktische Demonstration: Körpergröße © Gerd Bohner 2007 Übung: Alternativerklärungen finden • Bitte bilden Sie Gruppen von ca. 4 Personen und nehmen Sie sich einige Minuten Zeit, gemeinsam die Fragen auf dem Übungsblatt 2-1 zu beantworten, das gerade verteilt wird. • Kurze Besprechung der Antworten © Gerd Bohner 2007 Merkmale des sozialpsychologischen Experiments • Hauptvorteil: Ermöglicht Kausalanalyse. Warum ist Zufallszuweisung der Schlüssel hierzu? – Kausalität hat 3 notwendige Bedingungen: • dass die AV mit der UV kovariiert, • dass die UV der AV zeitlich vorausgeht, und • dass eine Verursachung der AV durch alternative Mechanismen ausgeschlossen werden kann. – Auch nichtexperimentelle Methoden erlauben die Beobachtung von Kovariation und zeitlicher Abfolge sowie die Kontrolle von bekannten Störvariablen. – Allein Zufallszuweisung ermöglicht die Kontrolle bisher unbekannter Störvariablen. © Gerd Bohner 2007 • Weitere Aspekte und Begriffe – – – – – – Manipulationskontrolle ("manipulation check") Coverstory Täuschung und postexperimentelle Aufklärung Kontrollgruppe / Kontrollbedingung Faktorielle Versuchspläne Haupteffekt / Interaktionseffekt © Gerd Bohner 2007 Faktorielle Versuchspläne • In einem faktoriellen Versuchsplan werden mehrere UVn miteinander gekreuzt (UV = "Faktor"). • Vorteil: Ermöglicht die Überprüfung komplexer Interaktionshypothesen • Beispiel: –UV1: –UV2: –AV: Qualität der Argumente einer Botschaft (gut, schlecht) Grad der Ablenkung (gering, stark) Einstellung zur Position der Botschaft Hypothese: Ablenkung reduziert die Überzeugungskraft guter Argumente und erhöht die Überzeugungskraft schlechter Argumente. => Interaktionseffekt von UV1 x UV2 © Gerd Bohner 2007 Interaktionseffekt: Beispiel 1 Einstellung 25 20 gute Argumente 15 A1 10 A2 5 schlechte Argumente 0 B1 geringe Ablenkung B2 starke Ablenkung Interaktionseffekt: Beispiel 2 25 20 15 A1 10 A2 5 0 B1 B2 © Gerd Bohner 2007 Kein Interaktionseffekt 25 20 15 A1 10 A2 5 0 B1 B2 © Gerd Bohner 2007 Beispiel für faktoriellen Versuchsplan: "Asian-Disease"Problem (Kahneman & Tversky, 1984; Daten aus der Vorlesung) "Stellen Sie sich vor, dass in Deutschland der Ausbruch einer seltenen schweren Krankheit bevorsteht, der nach Schätzungen 600 Menschen zum Opfer fallen werden. Ein Gremium von WissenschaftlerInnen berät über zwei verschiedene Programme, die vorgeschlagen wurden, um diese Krankheit zu bekämpfen. Die exakte wissenschaftliche Schätzung der Konsequenzen der Programme lautet folgendermaßen: Falls Programm A angenommen wird, werden 200 Menschen gerettet [werden 400 Menschen sterben]. Falls Programm B angenommen wird, besteht eine Ein-Drittel-Wahrscheinlichkeit, dass 600 Menschen gerettet werden [niemand sterben wird], und eine Zwei-Drittel-Wahrscheinlichkeit, dass niemand gerettet wird [600 Menschen sterben werden]. Die Mehrheit [Eine Minderheit] der beratenden WissenschaftlerInnen spricht sich für Programm A aus, während eine Minderheit [die Mehrheit] Programm B bevorzugt. Welches der beiden Programme würden Sie bevorzugen?" A ____ B ____ "Asian-Disease"-Problem: Daten aus der Vorlesung % riskante Option 100 Gewinn-Framing Verlust-Framing 80.6 80 71.0 60 50.0 40 43.3 20 Mehrheit für sichere Option Mehrheit für riskante Option © Gerd Bohner 2007 Nur der Haupteffekt des Framings ist signifikant (p < .01). • Einige Kritikpunkte am Experiment – Künstliche Situation? => oft sinnvoll! (Alltagsrealismus vs. experimenteller Realismus) – Ethisch bedenklich? (Stichwort Täuschung) => Zweck der Täuschung; informierte Einwilligung, Aufklärung – Nicht alle Fragestellungen sind experimentell untersuchbar => aber mehr als Sie vielleicht glauben Beispiele? © Gerd Bohner 2007 Gütekriterien • Reliabilität: Konsistenz der Messung; Vermeidung von Zufallsvariation • Validität: Die Messung erfasst, was sie zu messen vorgibt; Vermeidung systematischer Variation, die auf Störvariablen beruht • Im Experiment: – Konstruktvalidität – interne Validität – externe Validität © Gerd Bohner 2007 • Konstruktvalidität: Wie gut entsprechen UV und AV den zugrunde liegenden theoretischen Konstrukten? • Interne Validität: Wie sicher ist die Schlussfolgerung, dass Variationen in der AV durch Variationen in der UV (und nicht durch Störvariablen) verursacht werden? • Externe Validität: Grad der Generalisierbarkeit von Forschungsergebnissen auf andere als die untersuchten Personen, Zeitpunkte und Umstände. © Gerd Bohner 2007 • Studien haben oft Stärken auf bestimmten Validitätskriterien, dafür Schwächen auf anderen. Hierzu 2 Beispiele: • Fragestellung: Erhalten gut aussehende Angeklagte mildere Strafen? 1. Stewart (1980): Nichtexperimentelle Studie – Strafrechtsprozesse in mehreren Bezirken, 74 Angeklagte. 10 Beobachter beurteilen vor dem Urteilsspruch jeden Angeklagten nach physischer Attraktivität (und 8 weiteren Merkmalen, z.B. "arm - reich"). Ergebnis: Die Korrelation zwischen Attraktivität und Strafmaß beträgt r = -.40 – Wie beurteilen Sie diese Studie auf jedem der 3 Validitätskriterien? © Gerd Bohner 2007 2. Sigall & Ostrove (1975): Experiment – Studierende (Vpn) lesen eine Fallbeschreibung (UV1, Delikt: Einbruch oder Betrug); Angeklagt ist eine Frau (UV2, Attraktivität: hoch, niedrig, oder keine Info), Zufallszuweisung zu den 2 x 3 Bedingungen. Die Fallbeschreibung legt einen Schuldspruch nahe. AV: Höhe der empfohlenen Strafe (in Jahren). Ergebnis: attraktiv keine Info unattraktiv Betrug 5.5 4.4 4.4 Einbruch 2.8 5.2 5.1 – Wie beurteilen Sie diese Studie auf jedem der 3 Validitätskriterien? © Gerd Bohner 2007 Schlüsselstudie von Rosenthal & Fode (1963) Bedrohung der Konstruktvalidität durch Aufforderungscharakteristika (hier Versuchsleitereffekte)? • Experimente zur "Personenwahrnehmung" • Vpn beurteilen, wie "erfolgreich" 10 Personen auf Fotos sind (Skala von -10 bis +10). Vortest: Stimuli sind neutral (mittleres Rating nahe 0). • UV: Erwartung des Versuchsleiters (VL). 5 VL glauben, dass aufgrund von Vorstudien ein Ergebnis von +5 herauskommen sollte; 5 VL glauben, dass ein Ergebnis von -5 herauskommen sollte. • Standardisierte Instruktionen – VL darf diese vorlesen und die Antworten der Vp notieren, sonst aber nichts sagen. © Gerd Bohner 2007 • Exp. 1: VL erhält doppelte Bezahlung, wenn er/sie "den Job gut macht". – Bei allen 5 VL mit der Erwartung "+5" liegen die Ratings der Vpn höher als bei jedem der 5 VL mit der Erwartung "-5" (keine Überlappung der Verteilungen!) – Mittelwertvergleich: +4.05 / -0.95 Differenz: 5.00 (signifikant) • Exp. 2: Woran liegt's? Variation visueller und auditiver Hinweisreize; 4 Bedingungen: – Gruppe 1: Erwartung "-5", VL sichtbar, liest Instruktionen vor – Gruppe 2: Erwartung "+5", VL sichtbar, liest Instruktionen vor – Gruppe 3: Erwartung "+5", VL unsichtbar, liest Instruktionen vor – Gruppe 4: Erwartung "+5", VL sichtbar, sagt aber nichts (d.h. Gruppen 1 und 2 wie im vorigen Experiment; 3 und 4 neu) – Mittelwerte: Gruppe 1 +0.48a Gruppe 2 +2.27c © Gerd Bohner 2007 Gruppe 3 +1.32b Gruppe4 +0.41a • Fazit zu Rosenthal & Fode (Experimente 1 und 2): – Versuchsleitererwartungen können starken Einfluss auf Ergebnisse ausüben. – Visuelle, nonverbale Hinweise, aber vor allem die Verbalisierung der Instruktionen vermitteln diesen Effekt. – Alternativerklärungen? • Aufgabe: Überlegen Sie sich Gegenmaßnahmen, die eingesetzt werden können, um VL-Effekte zu verhindern. © Gerd Bohner 2007 Techniken der Datenerhebung Erhebungsverfahren – Beobachtung – Selbstbeurteilungsmaße ("self-report measures") – nonreaktive / implizite Maße (oft "performance measures") Multiple Operationalisierungen => Optimierung der Validität © Gerd Bohner 2007 Selbstbeurteilungsmaß I: Semantisches Differential (zur Erfassung der Einstellung gegenüber Vulkaniern) Vulkanier unlogisch :_____:_____:_____:_____:_____:_____:_____: logisch (-3) (-2) (-1) ( 0) (+1) (+2) (+3) freundlich :_____:_____:_____:_____:_____:_____:_____: unfreundlich (+3) (+2) (+1) ( 0) (-1) (-2) (-3) schlecht :_____:_____:_____:_____:_____:_____:_____: gut schön :_____:_____:_____:_____:_____:_____:_____: hässlich © Gerd Bohner 2007 Selbstbeurteilungsmaß II: Items einer Likert-Skala (zur Erfassung sexistischer Einstellungen; Tougas, Brown, Beaton, & Joly, 1995) Discrimination against women in the labor force is no longer a problem in Canada. totally disagree 1 2 3 4 5 6 7 totally agree I consider the present employment system to be unfair to women.* It is difficult to work for a female boss. In order not to appear sexist, many men are inclined to overcompensate women. In a fair employment system, men and women would be considered equal.* © Gerd Bohner 2007 Priming-Aufgabe zur indirekten Erfassung rassistischer Einstellungen time axis wonderful racial prime (315 ms) interval (135 ms) target adjective interval to next trial (until response key is pressed) (2500 ms) 1 Quelle: Bohner & Wänke, 2002 0 “good” “bad” response keys Einige Grundlagen der Inferenzstatistik • Falsifizierbarkeit von Hypothesen • Signifikanztest – Nullhypothese (H0) und Alternativhypothese (H1) – Signifikanzniveau • Was bedeutet es, wenn ein Ergebnis "statistisch signifikant" ist? – Die Wahrscheinlichkeit, diese Daten (oder noch extremere) zu erhalten, wäre bei Gültigkeit der H0 sehr klein. – Das ist nicht dasselbe wie eine hohe Wahrscheinlichkeit, dass eine bestimmte H1 zutrifft! © Gerd Bohner 2007 • Statistische Tests bestehen aus einem statistischen Kennwert, dessen Auftretenswahrscheinlichkeit (p) unter Annahme der H0 aus einer Zufallsverteilung von Kennwerten abgeleitet wird. • Je kleiner p, desto eher wird H0 verworfen (und damit H1 akzeptiert). • Konvention: Wenn p < 0.05, dann ist das Ergebnis signifikant. • Einige statistische Kennwerte (Tests), die häufig in sozialpsychologischen Untersuchungen vorkommen: © Gerd Bohner 2007 • Der Korrelationskoeffizient (auch ProduktmomentK. oder Pearson-K.) r – gibt Richtung und Ausmaß des linearen Zusammenhangs zwischen zwei Variablen an; – variiert zwischen -1 und +1. • Student's t – gibt den Unterschied zwischen zwei Mittelwerten oder zwei wiederholten Messungen an; – ist eine Funktion der Differenz zwischen den zu vergleichenden Mittelwerten, kann beliebige reale negative oder positive Werte annehmen: je größer der Betrag von t, desto größer (unter sonst gleichen Bedingungen) der Effekt. © Gerd Bohner 2007 • Das F der Varianzanalyse – dient ebenfalls dem Vergleich von (zwei oder mehr) Mittelwerten; – entspricht dem Quotienten aus der Varianz zwischen Versuchsbedingungen (Zähler; wobei jeder Wert durch seinen Gruppenmittelwert repräsentiert wird) und der Varianz innerhalb der Versuchsbedingungen (Nenner; auch "Fehlervarianz"); – variiert zwischen 0 und beliebig großen positiven realen Werten; je größer der Wert von F, desto größer (unter sonst gleichen Bedingungen) die Unterschiede zwischen Versuchsbedingungen. © Gerd Bohner 2007 Literaturempfehlungen • Strack und Ernst (1978) in der Zeitschrift "Psychologie Heute": Eine witzige und gut lesbare Einführung in das sozialpsychologische Experiment. • Cohen (1994): Eine ausgezeichnete kritische Würdigung des Signifikanztests in der Psychologie - anspruchsvoll, aber wichtig. © Gerd Bohner 2007 Zitierte Literatur Bohner, G. & Wänke, M. (2002). Attitudes and attitude change. Hove, UK: Psychology Press. (Kapitel 2). Cohen, J. (1994). The earth is round (p < .05). American Psychologist, 49, 997-1003. Kahneman, D., & Tversky, A. (1984). Choices, values, and frames. American Psychologist, 19, 341-350. Rosenthal, R., & Fode, K. L. (1963). Three experiments in experimenter bias. Psychological Reports, 12, 491-511. Rosenthal, R., & Rosnow, R. L. (2008). Essentials of behavioral research (3rd ed.). Boston, MA: McGraw-Hill. Schachter, S. (1959). The psychology of affiliation. Palo Alto, CA: Stanford University Press. Sigall, H., & Ostrove, N. (1975). Beautiful but dangerous: Effects of offender attractiveness and nature of the crime on juridic judgment. Journal of Personality and Social Psychology, 31, 410-414. Stewart, J. E. (1980). Defendant's attractiveness as a factor in the outcome of criminal trials: An observational study. Journal of Applied Social Psychology, 10, 348-361. Strack, F., & Ernst, H. (1978). Experimentieren geht über Studieren. Psychologie heute, 5 (4), 43-47. Tougas, F., Brown, R., Beaton, A. M., & Joly, S. (1995). Neosexism: Plus ça change, plus c'est pareil. Personality and Social Psychology Bulletin, 21, 842-849. © Gerd Bohner 2007