Heiner Ellring, Kapitel 12 Verhaltensbeurteilung als Methode der Different. Psychologie 1. Einführung Psych. Konstrukte der Persönlichkeit = beziehen sich auf potentielles Verhalten, 1. dem Vergleich mit anderen 2. dem Versuch eine Vorhersage über künfitges Verhalten zu machen Verfahren zur Verhaltensbeurteilung: dienen dazu, Verhalten (potentiell + aktuell beobachtetes) 1. systemat. zu beschreiben 2. quantitativ einzustufen 1.1 Definition der Syst. Verhaltensbeurteilung (Rating) Rating von Verhalten = Vorgang bei dem ein Urteiler (Rater) ein beobachtetes Verhalten im Hinblick auf ein Kriterium - kategorisiert / einstuft - oder wertet Syst. Verhaltensbeurteilung Syst. Verhaltensbeobachtung Systematische Verhaltensbeurteilung, weil o Urteile anhand vorgegebener Kategorien o an definiertem, vorgegebenen Merkmal o ! stärker subjektive Urteile Systematische Verhaltensbeobachtung, weil o Objektive Beschreibung der Verhaltensweisen o Quantitative Analysen o ! allerdings nur möglich für elementare Verhaltensklassen, die man sehen kann 1.2 Ziele und Funktionen der syst. Verhaltensbeurteilung Ziele: o Kategorisierung = Verhalten zu best. Klasse ordnen (! Abgrenzung der Kategorien evt. problematisch) o Quantifizierung = Verhalten zu einem best. Wert zuordnen (! Zuordnung entspricht evt. keinen reelen Zahlen) o Bewertung = Vergleich Verhalten – implizite Normen, Vergleich Verhalten – vorgegebene Normen (! Interrater Reliabilität oft schlecht) o Inferenz = Zuordnung zu psych. Konstrukten + Schlussfolgerungen (! Evt. geringe Interrater Reliabilität / schlechte Validität) Funktionen: o Fundierung von psych. Konstrukten (Verhalten als Indikator psych. Prozesse) o Materielle Basis für Schlussfolgerungen o Vorhersagen künftigen Verhaltens (!) Verhalten als Referenz für individuelle Differenzen zukünft. Erlebens/ Verhaltnes 1.3 Allgemeine Einwände gegen Beurteilungsverfahren Skepsis und Kritik, z.B. an Qualität der Daten, da vielfache Fehlermöglichkeiten Zusammenfassung von Ruth Seite 1 von 4 2. Kategorien, Schätzskalen, Globalbewertungen 2.1 Fremdbeurteilung vs. Selbstbeurteilung In der Persönlichkeitspsych. am häufigsten Selbstbeurteilung (z.B. Rating spez. Merkmale) 2.2 Kategoriale Urteile und Beurteilungs-Skalen (Rating Scales) Kategoriale Beurteilungen = trifft zu – trifft nicht zu (Beispiel Q-Sort Verfahren von Block, Objekte nach Ähnlichkeit ordnen, dadurch werden Kategorien erst definiert) Rating Skalen = Quantitative Einstufung (Beispiele - graphisch visuell - mehrstufig numerisch (Likert Skala) - semantisch außerdem: - unipolar vs. bipolar - gerade vs. ungerade Abstufung (ewige Diskussion) ungerade = gut, da weniger indifferente Urteile negativ, da evt. forced choice (! mittelt sich aus) 2.3 Kriterien der Beurteilung Quantitative Krit. (Dauer, Häufigkeit, Intensität) Qualitative Krit. (offene Fragen, dann Kategorien) Zahl der Abstufungen abhängig von: Art d. Merkmals, Differenzierfähigkeit der Urteiler, Differenziertheit d. Auswertung ! oft gar nicht so einfach geeignete semantische Umschreibung zu finden 3-7 Stufen scheinen meist am angemessensten 2.4 Stichproben-Probleme, Repräsentativität zu beachten hinsichtl. Repräsentativität sind: o welche Verhaltensweisen? o Welche Beobachtungssituationen? o Wie lange Beobachtungsintervalle? Validere Interpretation / Generalisierung möglich wenn etwas länger beobachtet 2.5 Skalenqualität Rationalskalen = kaum geeignet für Verhaltensbeurteilungen, da kein Nullpunkt Intervallskalen = Summen + Mittelwerte bildbar, ! Rating Skalen werden oft so benutzt, als ob sie intervallskaliert wären Ordinal/ Rangskala = Relation der Objekte, Reihenfolge ohne Info wie weit die Abstände ! Rating Skalen sind eigentlich nur ordinalskalliert Nominalskala = dichotom, z.B. ja - nein, wichtig für Persönlichkeitstests 3. Beurteilungsskalen als Operrationalisierungen 3.1 Kontinuum von Messung und Beurteilung des Verhaltens Frage ob zuordnen von Kategorien/ Zahlenwerte eine Messung ist Antwort: je nach Ebene JA = wenn eindeutig z.B. bei Ablesen eines Instrumentes NEIN = wenn nicht eindeutig z.B. bei Mimikeinschätzung ! oft nein, da wenig Einigkeit über Interpretationen Zusammenfassung von Ruth Seite 2 von 4 außerdem ist es von der betrachteten Ebene abhängig (bei Blickverhalten ist z.B. messbar 1. Dauer = genau, 2. Aufmerksamkeit = mittel, 3. Angemessenheit = schwammig) FAZIT: Kontinuum, je nachdem ob Beobachtung (eher genau) oder Beurteilung (ungenau) 3.2 Normative Bewertung und objektive Beschreibung Dilemma: - Praktische Notwendigkeiten (normative Bewertung) - Methodische Anforderungen (objektive Beschreibung) Kompromiss = normative Bewertung anhand einer idiograph. gefundenen Referenz Beispiel = Goal Attainment hat beides: 1. objekt. Beschreibung des Zielverhaltens 2. normative Bewertung d. Veränderungen 3.3 Beispiele für Instrumente der Verhaltensänderung Formen psych. Messinstrumente o Art der Abbildung des Verhaltens (z.B. Kategorien, Rating Skalen etc.) o Beschreibung spez. Verhaltensweisen (z.B. Blickabwendung, Lautstärke etc.) o Globale Bewertung (z.B. gesprächig, klinisches Urteil, Selbstsicherheit etc.) Unterschieden werden auch o Verhalten beobachten und direkt normativ bewerten o Verhalten beobachten und implizit bewerten o Nur Verhalten beobachten Betriebs-Organisationspsych.: Leistungsbeurteilung anhand von Checklisten, Ratingskalen und in stand. Beurteilungssituationen (Assessment Center soll prototyp. Verhalten hervorrufen) 4. Theoretische Grundlagen der Verhaltensbeurteilung 4.1 Verhalten als Indikator für Disposition (Trait) und Zustand (State) Nonverbales Verhalten wird immer mehr beachtet – auf psych. Zustände schliessen ! Vorsicht Täuschung möglich Immer zu beachten: Probabilistische Kodierung (Verhalten ist ein Zeichen und übermittelt die ihm zugeordnete Bedeutung nur mit einer gewissen Wahrscheinlichkeit) Idiosynkratisch = nur bei dieser Person auftretend und sie kennzeichnend (oft sind Verhaltensweisen ohne jegliches Wissen über die Person nicht interpretierbar?) FAZIT: Zusammenhang individuenspezifisch zwischen 1. nonverbales Verhalten 2. Psychische Prozessen 4.2 Verarbeitung und Integration von Verhaltens-Information Meist geht es um: Umsetzung von Verhaltens-Info in Urteile ! wichtig dabei, das Absichern über Vergleichsurteile Brunswicksches Linsenmodell: o Grundidee = Formalisierung der Prozesse der Eindrucksbildung o Sender drückt mit Verhalten etwas aus und enkodiert es, sendet „Distale Cues“ o Empfänger/ Beurteiler empfängt „Proximale Perzepte“ und attribuiert, dekodiert also und macht sich einen Eindruck o Wozu? Quantifiziert, inwieweit Hinweisreize korrekt wahrgenommen werden und zeit, wie häufig es zu Fehlschlüssen kommt o „Utilization“ = Beziehung zwischen distalen Cues und Proximalen Prozessen (wie viel an gesendeter Info verwendet der Beurteiler für sein Urteil) FAZIT: Für ein Urteil nutzt der Wahrnehmende nur Teile des Infoangebotes, Zusammenfassung von Ruth Seite 3 von 4 obendrein gewichtet er die Aspekte differentiell! Urteilsprozess: oft sehr rasch (wenige Sek.), ! aber: generelle Validitätsprobleme & schnelle Stabilisierung des Eindrucks Cue-Modell (Goldman) konnte zeigen, dass lineare Kombination versch. Infos einem intuitiven klinischen Urteil überlegen ist 5. Qualität von Verhaltensbeurteilung;: Methodische Probleme Problem: Subjetivität des Urteils! Einflussgrößen dabei: Attributionsprozesse & vorangegangene Erfahrungen des Beurteilers & Interaktionen Beurteilungsfehler: o Fehler der zentralen Tendenz (Tendenz zur Mitte) o Fehler zu großer Milde (engl. Liniency Effect = neg. Skala nicht ausgenutzt) o Primacy – Recency Effekt o Halo Effekt (ein gutes Merkmal, dann noch 10 weitere gute angenommen) o Logische Fehler (z.B. Implizite Persönlichkeitstheorien, die syst. verzerren) o Kontaktfehler (Person entsprechend Position beurteilen) o Erwartungen einfliessen lassen o Interessen und Werte die beeinflussen Kritik an Rating Verfahren: o Interrater Reliabilität nicht hoch genug o Observer drift (Massstäbe verschieben sich im Zeitverlauf) o Zweifel ob reelle Zahlen abgebildet o Bei abstrakten Merkmalen wird generelles Urteil verlangt, das man nicht unbedingt aus dem beob. Verhalten folgern kann o Retrospektiv 6. Ausblick !Einfache Handhabung der Ratingskalen täuscht über so manche Unzulänglichkeit hinweg Folgerungen/ Forderungen: o Unter optimalen Bedingungen beobachten o Zwischen 2 Objekten genauer vergleichen (nicht gut in Gruppen) o Hohe räumliche und zeitliche Nähe Mögliche Entwicklung für die Diff. Psych. o Mehr auf Verhaltensseite beobachten (Häufigkeiten von Handlungen) o Weitere Objektivierung o Verhalten in repräsentativen Situationen o Stärkere Situationsabhängigkeit des Verhaltens, weniger transsituat. Inferenzen Ratingskalen sollten Notlösung sein, weil man nichts anderen hatte !! wir benutzen sie immer noch!! Warum? Weil sie ökonomisch einsetzbar sind! Aufgabe: Skalen verbessern, Sit. definieren, präziser verankern und eindeutiger beurteilen Zusammenfassung von Ruth Seite 4 von 4