Skript - Tests

Werbung
qwertyuiopasdfghjklzxcvbnmqwerty
uiopasdfghjklzxcvbnmqwertyuiopasd
fghjklzxcvbnmqwertyuiopasdfghjklzx
cvbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
DIAGNOSTIK
opasdfghjklzxcvbnmqwertyuiopasdfg
-Testshjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmrtyuiopasdfghjklzxcvbn
mqwertyuiopasdfghjklzxcvbnmqwert
yuiopasdfghjklzxcvbnmqwertyuiopas
dfghjklzxcvbnmqwertyuiopasdfghjklz
xcvbnmqwertyuiopasdfghjklzxcvbnm
INHALT
KonzentrationsTests .........................................................................................................................................................4
Frankfurter Aufmerksamkeitsinventar: FAIR (Moosbrugger) ..............................................................4
Frankfurter Adaptiver Konzentrationsleistungstest: FAKT (Moosbrugger) ...................................5
Aufmerksamkeits-Belastungs-Test: d2 (Brickenkamp) ...........................................................................6
Konzentrations-Leistungs-Test: KLT-R (Düker) .........................................................................................7
Intelligenztests ....................................................................................................................................................................9
HAMBURG-WECHSLER-INTELLIGENZTEST FüR ERWACHSENE: HAWIE-R ..................................9
INTELLIGENZ-STRUKTUR-TEST 2000R: IST 2000R (AMTHAUER) ................................................ 10
LeistungsPrüfsystem (lps, Horn) .................................................................................................................... 11
Berliner intelligenzstrukturtest BIS .............................................................................................................. 12
RAVEN (RAVENS PROGRESSIVE MATRIZEN) ........................................................................................... 12
BOMAT BOCHUMER MATRIZENTEST VON HOSSIEP ET AL. .............................................................. 12
WIT - 2 WILDE INTELLIGENZ TEST VON JAGER UND ALTHOFF...................................................... 12
Entwicklungstests ........................................................................................................................................................... 13
HAMBURG-WECHSLER-INTELLIGENZTEST FUR KINDER: HAWIK-III .......................................... 13
ADAPTIVES INTELLIGENZ DIAGNOSTIKUM 2.2 : AID2.2 .................................................................... 13
KOGNITIVER FäHIGKEITSTEST FüR 4. BIS 12. KLASSEN, REVISION: KFT 4-12+ R.................. 14
GRUNDINTELLIGENZTEST SKALA 2: CFT 20-R MIT WORTSCHATZTEST (WS) UND
ZAHLENFOLGETEST (ZF) .................................................................................................................................. 15
HEIDELBERGER SPRACHENTWICKLUNGSTEST: HSET ....................................................................... 16
Eignungstests.................................................................................................................................................................... 16
BERUFSEIGNUNGSTEST: BET VON SCHMALER & SCHMIDTKE ....................................................... 16
BERUFSINTERESSENTEST BIT-II VON IRLE (1984) .............................................................................. 17
BÜROTEST: BT VON MARSCHNER................................................................................................................. 18
Computerbasierte tests ................................................................................................................................................ 19
Persönlichkeitstests ....................................................................................................................................................... 19
MINNESOTA MULTIPHASIC PERSONALITY INVENTORY: MMPI UND MMPI-2 VON
HATHAWAY& MC KINLEY. DT. VON ENGEL .............................................................................................. 21
FREIBURGER PERSONLICHKEITSINVENTAR: FPI-R ............................................................................. 22
16-PERSöNLICHKEITS-FAKTOREN-TEST REVIDIERTE FASSUNG: 16PF-R VON
SCHNEEWIND & GRAF ........................................................................................................................................ 22
NEO-PERSöNLICHKEITSINVENTAR UND NEO-FüNF-FAKTOREN-INVENTAR: NEO-PI-R
VON BORKENAU& OSTENDORF UND NEO-FFI VON HOSSIEP& PASCHEN.................................. 23
BOCHUMER INVENTAR ZUR BERUFSBEZOGENEN PERSöNLICHKEITSBESCHREIBUNG: BIP
VON HOSSIEP & PASCHEN ................................................................................................................................ 25
andere Persönlichkeitstests .............................................................................................................................. 26
Projektive Tests ............................................................................................................................................................... 27
RORSCHACH-PSYCHODIAGNOSTIK............................................................................................................... 27
THEMATISCHER APPERZEPTIONS-TEST: TAT VON MURRAY (1936) .......................................... 28
DER KINDER- APPERZEPTIONS-TEST: CAT VON BELLAK & BELLAK (1955) DEUTSCH VON
MOOG.......................................................................................................................................................................... 28
Gruppendiagnostik ......................................................................................................................................................... 29
Paardiagnostik ........................................................................................................................................................ 29
FAMILIENDIAGNOSTIK....................................................................................................................................... 30
TEAMDIAGNOSTIK ............................................................................................................................................... 31
klinische Verfahren ........................................................................................................................................................ 31
ANGSTFRAGEBOGEN FüR SCHULER: AFS VON WIECZERKOWSKI (1998) .................................. 31
STRUKTURIERTES KLINISCHES INTERVIEW FüR DSM-IV: SKID von Wittchen, Zaudig und
Fydrich ....................................................................................................................................................................... 32
KONZENTRATIONSTESTS





Definition: Konzentration = Fahigkeit:
o
unter bestimmten Bedingungen schnell und genau zu arbeiten
o
die andere kognitive Leistungen beeintrachtigt
Anforderungen an einen Konzentrationstest
o
einfache, klar und eindeutig wahrnehmbare Reize
o
einfach zu erinnernde Regeln
o
absichtsvolle Teilhandlungen sind aufzufuhren
o
die Leistung wird durch die Geschwindigkeit und die Fehler abgebildet
Aufmerksamkeitstest
o
variieren in Abhangigkeit der untersuchten Aufmerksamkeitsdimension
o
gemessen wir die Geschwindigkeit und Genauigkeit mit der ein Reiz entdeckt wird
Aufgabentyp
o
Computerbasierte Tests: erfassen die Reaktionszeit auf einen Reiz und die Anzahl richtiger
Lösungen, Pausen und damit das Arbeitstempo werden von Programm vorgegeben
o
Durchstreichtests: erfassen das Bearbeitungstempo und die Anzahl richtiger Lösungen,
Pausen sind selbst gewählt d.h. es wird das tatsachliche Arbeitstempo erfasst
Kennwerte:
o
Arbeitstempo
o
mittlere RT
o
Auslassungen (Misses)
o
Verwechslungsfehler (false alarms)
FRANKFURTER AUFMERKSAMKEITSINVENTAR: FAIR (MOOSBRUGGER)

Aufgabe
o
2 Testbogen 16 Zeilen a 20 Items
o
Zielitems in Testform A: 2 (Kreis mit 3 Punkten und Quadrat mit 2 Punkten); Distraktoren
in Testform A (Kreis mit 2 Punkten und Quadrat mit 3 Punkten) ;in Testform B vice versa
o
Instruktion: „so schnell aber auch so genau wie möglich arbeiten“
o
Linie unter den Zeichen ziehen und sobald ein Zielitem auftaucht eine Zacke nach oben
machen
Objektivität
Reliabilität
Validität
Gegenstand
Ökonomie
ja
SH= .78-.92,
rtt. =.85-.91,
PT= .81-.83
- Korrelationen zu
anderen
Konzentrationstests (d2)
gering  erfassen
unterschiedliche
Konstrukte
- niedrige Korr. mit IQ
(für Hälfte mit
höherem IQ) 
Annahme: Bearbeitung
des FAIR
fordert gewisse
Mindestintelligenz, ist also
nicht für alle geeignet
Konzentrationsleistungswert,
Konzentrationsgenauigkeit,
Konzentrationshomogenitat
10min,
Gruppe,
kein
Computer,
Auswertungsprogramm
 objektiv, reliabel, valide (trotz einiger Unstimmigkeiten), verfälschungssicher, ökonomsich
FRANKFURTER ADAPTIVER KONZENTRATIONSLEISTUNGSTEST: FAKT
(MOOSBRUGGER)


allgemein:
o
basiert auf dem FAIR
o
misst die Konzentrationsfähigkeit und den Leistungsverlauf (Konzentrationsleistung pro
Minute Testzeit)
adaptiver Test:
o
Anpassung der Itemschwierigkeit an das Konzentrationsvermögen der Vp 
o
Darbietung umso rascher je höher die Konzentrationsleistung
Alter
14-72
o

Ziel: gleiche Beanspruchung auf dem interindividuellen Leistungsniveau
Messwerte
o
Anzahl der bearbeiteten Zeichen
o
Fehleranzahl
o
Reaktionszeit

Aufgabe und Material  siehe FAIR

Anwendungsbereich:
o
Objektivität
ABO, klinische Neuro, pädagogische Psychologie
Reliabilität Validität
Gegenstand
Ökonomie
Alter
ja (einfache
Bedienung +
Computerauswertung)
α (KLW)=
.91-.97
rtt = .70.91
Korrelation mit
D2, FAIR
diskriminante
und konvergente Validität
zufriedenstellend
Konzentrationsleistungswert, Zeit:
Konzentrationsgenauigkeit,
variabel, da
Konzentrationshomogenität
adaptiv (ca.
10
min),
Computer
(inkl.
Auswertung)
Ab
10
 innovativer Test zur adaptiven Ermittlung der Konzentrationsfähigkeit und
Leistungsverlaufs, ökonomisch, objektiv, reliabel, rasch-homogen (nach IRT)
AUFMERKSAMKEITS-BELASTUNGS-TEST: D2 (BRICKENKAMP)


Allgemein:
o
ist ein Aufmerksamkeitstest: erfasst selektive Aufmerksamkeit
o
ist ein Konzentrationstest, da die Aufmerksamkeitsleistung kontinuierlich, schnell und
genau erbracht werden muss (Instruktion wichtig: „bitte arbeiten sie so schnell und so genau
wie möglich“)
o
Belastungstest, da die Leistung unter Zeitdruck zu erbringen ist (Zeilenwechsel jeweils
nach 20 Sekunden)
Anwendung:
o



Klinische, ABO, Verkehrspsychologie, pädagogische Psychologie (Erziehungsberatung),
Schulpsychologie
Aufgabentyp:
o
sowohl Durchstreichtest
o
als auch computerbasiert
o
die Computer- und Durchstreichversionen sind aber nicht äquivalent: anderes Material
(Computer sind es d´s mit Punkten und es wird immer nur eine Zeile angezeigt)
Kennwerte
o
Bearbeitungsgeschwindigkeit (Anzahl bearbeiteter Zeichen)
o
Genauigkeit (Fehlerprozent)
o
Gesamtwert (fehlerkorrigierte Tempoleistung): Gesamtzahl - Fehler
Material und Aufgabe:
o

Alle d´s mit 2 Strichen durchstreichen
Auswertung
o
Schablone
o
Verfälschbarkeit:
-

Arbeitstempo wesentlich besser als Genauigkeit  Vp hat Zeichen übersprungen 
Verfälschung nach oben ist nicht möglich
Verwechslungsfehler treten seltener auf als Auslassungen, ab 10 Verwechselungen wird
Simulation unterstellt
Normierung
o
neue Normierung: 1999 -2000
o
Altersgruppen: 9-10 bis 40-60 Jahre; bei Kindern und Jugendlichen ist die Unterteilung im
2- Jahresabstand
Objektivität
Reliabilität
Validität
Ökonomie
Alter
Ja
Durchführungsobjektivität
(standard. Instruktion +
Untersuchungssituation)
Auswertungsobjektivität
(eindeutige Auswertungsregeln)
Interpretationsobjektivität
(breite Normierung)

α/SH
variieren
fur
Testwerte
95-.98 
hoch
reliabel
Konstruktvalidität:
Korrelation mit
Konzentrationstest hoch &
mit IQ-Tests niedrig,
Kriteriumsvalidität:
Eignung als Kraftfahrer und
d2 korreliert zu .54  gut;
Augenschein- und
Inhaltsvalidität ist
gegeben
5 min,
Gruppe 
einfach
und
schnell
Bewertung gesamt:
o
Vorteile:
-
Außerordentlich reliables, ökonomisches Verfahren mit aktuellen Normen
einfache und schnelle Durchführung
gewonnene Informationen in ganz vielen Bereichen von Bedeutung
sehr bewährtes Verfahren (wird sehr häufig eingesetzt, Platz 3 der häufigsten Verfahren)
gute Informationsausbeute
Nachteile:
-
theoretische Konzeption unklar, wichtige Theorien der Aufmerksamkeits- und
Konzentrationsforschung nicht im Manual
problematisch ist der Wert „Schwankungsbreite“, weil unterschiedlich schwere Items
o
-
KONZENTRATIONS-LEISTUNGS-TEST: KLT-R (DÜKER)

9 bis
60
Allgemein:

o
Annahme: Die Rechenoperation hat bei allen Teilnehmern einen hohen
Automatisiertheitsgrad  Unterschiede werden durch die interindividuelle
Konzentrationsfähigkeit verursacht
o
Konzentration = ist die Voraussetzung für das Zusammensetzen einzelner Tätigkeiten
(Bsp. für Einzeltätigkeiten: Auffassen, Rechnen, Merken, Regelabruf,…); AG benötigt
Konzentration um die Info zu halten, zu verbinden und zu modulieren
Aufgaben:
o
2 Parallelformen mit zwei unterschiedlichen Schwierigkeitsstufen
o
Pro Zeile muss das Ergebnis berechnet werden
-


-
einfachere Version: das kleinere Ergebnis muss vom größeren abgezogen werden (4. bis 6.
Klasse)
schwerere Version: Ist das Ergebnis in der oberen Zeile kleiner, dann werden die
Ergebnisse der beiden Zeilen addiert; ist das obere größer, wird das untere abgezogen (6.
bis 13. Klasse)
-
es dürfen keine Zwischenergebnisse notiert werden
Normierung
o
einzelne Klassenstufen
o
ab der 5. Klassen zusätzliche Unterscheidung nach Schultyp (Hauptschule, Realschule,
Gymnasium)
o
ab der 10ten Klasse Unterscheidung nach Berufsschule
o
ab 18 gibt es eine zusammengefasste Normgruppe für Erwachsene
Kritik
o
er misst nicht die gleiche Konzentrationsfähigkeit wie die anderen Tests
o
es zeigt sich eine deutliche Abhängigkeit von der Rechenfähigkeit
o
Normen stützen sich auf bayrische Schulen
Objektivität Reliabilität
Validität
Gegenstand
Ökonomie
Alter
ja
Hoch
besonders
für richtig
gelöst:
.94- .96,
für falsch:
.79- .93
sehr
reliabel
divergente Validität
mit
Rechentest: relativ
hoch: .53  d.h.
niedrige
Konzentrationsleistung
evtl. durch niedrige
numerische
Fertigkeiten verursacht,
niedrigere
Korrelationen mit d2
Gesamtmenge,
Fehlerprozentwert,
Schwankungsbreite,
Leistungsverlauf
18 min, kein
Computertest,
Gruppentestung
Möglich
(Parallelformen)
ab 4.
Klasse
INTELLIGENZTESTS

Allgemein:
o

erfolgreichstes Verfahren; gute Vorhersage (Schul- Ausbildungs- und Berufserfolg
korreliert zu .5 mit IQ)
Auswahl des Verfahrens ist abhängig von:
Messintention „Was genau will ich messen?“:
o
-
Messung einer Komponente (g Faktor, schlussfolgerndes Denken)
Messung verschiedener Bereiche der Intelligenz
Messung sprachfreier, kulturfairer oder bildungsunabhängiger Intelligenz
Durchführung „Wo will ich den Test einsetzen?“:
o
-
Einzel vs. Gruppensetting;
Speed vs. Power (Power: Schwierigkeit nimmt von Aufgabe zu Aufgabe zu; ist dem
Speedtest vorzuziehen, wenn Vp kognitiv oder motorisch verlangsamt ist);
Papier und Bleistift vs. PC;
Dauer der Testdurchführung
Durchführungszeit „wie viel Zeit habe ich bzw. was überwiegt?
o
o
der Wunsch nach geringer Zeit oder Genauigkeit der Messung
Entscheidung abhängig von der Frage, ob eine gründliche Messung oder ein Screening
gemacht werden muss
adaptive Tests sind hilfreich
Zielgruppe
-
„liegen die passenden Normen vor, damit das Ergebnis überhaupt richtig interpretiert
werden kann?“
sind die Normtabellen ausreichend?
wie gut ist Test für eine Fragestellung geeignet (bspw. differenziert der HAWIE nicht gut
im oberen Bereich  nur Screening auf Hochbegabung möglich, keine Diagnose)
HAMBURG-WECHSLER-INTELLIGENZTEST FÜR ERWACHSENE: HAWIE-R


Allgemein:
o
besteht aus Verbal (6 Untertests) und Handlungsteil (5 Untertests)
o
Verbal: Allgemeines Wissen, Zahlen nachsprechen, Wortschatztest, rechnerisches Denken,
Allgemeines Verständnis, Gemeinsamkeiten finden
o
Handlung: Bilderergänzen, Bilderordnen, Mosaik-Test, Figurenlegen, Zahlen-Symbol-Test
o
Teile können gesondert durchgeführt werden bspw. bei sprachlich oder motorisch
beeinträchtigten Personen
o
im Sinne eines standardisierten Dialogs aufgebaut  so auch Testung von psychisch oder
neurologisch behinderten Personen möglich
Ziel:
o
allgemeines Leistungsvermögen bestimmen
o
Untersuchung von Ausfallerscheinungen der Intelligenz
o

Unterschied Verbal- und Handlungsteil: Info darüber, ob die Person eher praktisch oder
verbaltheoretisch orientiert ist
Normierung:
o
N = 2000
o
9 Altersgruppen
Objektivität
Reliabilität Validität
Gegenstand
Ökonomie
Alter
Durchführung ja,
Auswertung nicht
perfekt, da
Ermessensspielraum
bei Bewertung einiger
Aufgaben

Gesamt.
Cronbach
Alpha:
.95-.97
für
GesamtIQ
Kriteriumsvalidität.:
FA  2 Faktoren,
bessere Leistung
bei besserer
Schulbildung,
zu wenig
Untersuchungen
zur Validität
g+
Komponenten:
IQ-Werte für
Verbal-,
Handlungs- und
Gesamttest,
Wertepunkte für
Untertests
60-90
1674
min,
keine
Gruppe,
kein
Computertestung
Bewertung
o
Positiv:
o
- Differenziert sehr gut im unteren Leistungsbereich (3 SD)
- hoch reliabler Gesamt IQ
- gute Beobachtungsmöglichkeit (Einzeltest)
- für klinische Einzelfalldiagnostik konkurrenzlos
Kritik:
-
Missverhältnis zeitlicher Aufwand und Ergebnis: nur IQ
Keine Parallelform
Weniger gute Differenzierung im oberen Leistungsbereich (nur 2 SD)
Profilauswertungen schwierig wegen Interkorrelation von verbalem und Handlungsteil
INTELLIGENZ-STRUKTUR-TEST 2000R: IST 2000R (AMTHAUER)


Allgemein
o
Will 5 der 7 Thurstone Faktoren messen: verbale, numerische, figurale Intelligenz,
Merkfähigkeit (verbal und figural) und Reasoning (schlussfolgerndes Denken als
Summenscore der ersten drei)  Grundmodul
o
Erweiterungsmodul: Wissenstest (40min)
o
unechter Paralleltest Form B: identische Aufgaben in unterschiedlicher Reihenfolge, andere
Distraktoren  echte Parallelformen in Entstehung
Normierung:
o
Normierung ist noch nicht ausreichend differenziert bezüglich Alter (geringes
Altersspektrum) und Bildung (Übergewicht an Gymnasiasten)
o
Erweiterungsmodulnormierung basiert auf anderer Stichprobe
Objektivität
Reliabilität
Validität
Gegenstand
Ja, in allen
Punkten
Gesamt
Grundmodul:
.95,
FA, Korrelation mit
Intelligenztest,
Korrelation mit
Schulnoten, wenig
mit anderen
Außenkriterien
 befriedigende
Validität
G+
2h (Grundmodul), 15 bis 50
Intelligenzstruktur: Gruppe,
fluide &
Computertestung
kristallisierte +
5 von Thurstones 7
Primärfaktoren
noch keine rtt
Ökonomie
Alter
 theoretisch hervorragend begründet, sehr sorgfältig konstruiert, reliabel für 5 Primär- &
2 Sekundärfaktoren, inhaltsunabhängige Erfassung, einziges Manko: Normen
LEISTUNGSPRÜFSYSTEM (LPS, HORN)

Untertests:
o


Allgemeinbildung, Denkfähigkeit, Worteinfall, technische Begabung, Ratefähigkeit,
Wahrnehmungstempo, Rechenfähigkeit
Ziel:
o
Bildungs- und Berufsberatung
o
soll gut in Extrembereichen differenzieren
Kritik
o
Setzt Rechtschreibfähigkeit voraus Benachteiligung für Leute mit Defiziten in diesem
Bereich
o
Normen veraltet
o
Sehr lange Instruktion
Objektivität
Reliabilität
Validität
Gegenstand
Ökonomie
ja
Split- Half
Konstrukt Validität:
ja:
G+ Komponenten ,
90/40 min, teilw.
Computertestung
gesamt: .99,
rtt: .95,
FA, Korrelation mit
IST,
hochreliabel,
Kriteriumsvalidität.:
stabil
1a Vorhersage für
Noten
Erfassung der
ThurstoneFaktoren
Gruppentest
vorrangig
Ökonomie: 2
DinA4- Blatter
 hoch reliabel, stabil, valide, gut für kurzfristige Schulleistungsprognose, ABER alte
Normen
KURZFORM DES LPS: PSB – R 4-6 UND PSB – R 6 – 13

Allgemein:
Alter
9-50

o
10 von 15 Untertests die sich am Besten eigenen hinsichtlich der 3 Schulformen zu trennen
o
Erfassung der Primärfähigkeiten
Normierung:
o
sowohl für Klassen als auch für Alter
Objektivität
Reliabilität
Validität
Ökonomie
Geringe
Durchführungsobjektivität,
da Instruktion
an Probandengruppe
angepasst
werden soll
Hohe
Auswertungsobjektivität
Gesamtleistung
PSB – R 6 – 13
(alpha):
.93/94
Gesamtleistung
PSB – R 4-6 :
.74/.72 bis 94
Interne V.: Korr. Untertests –
Gesamttest = .66
Konstrukt – V.: hohe Korrelation
mit CFT 20
Kriteriums – V.: hohe Korr. mit
Schulnoten
Testzeit
gesamt:
60min
BERLINER INTELLIGENZSTRUKTURTEST BIS

Allgemein
o
erfasst Vielfalt und Breite von Intelligenzleistungen
-
o
Verarbeitungskapazitat (K)
Einfallsreichtum (E): Flexible Ideenproduktion, die Verfügbarkeit vielfältiger
Informationen und Perspektivenwechsel werden als zentrale Fähigkeit für erfolgreiche
Problemlöseprozesse mit erfasst.
Bearbeitungsgeschwindigkeit (B)
Merkfähigkeit (M)
liegt als Kurz- oder Langform vor
RAVEN (RAVENS PROGRESSIVE MATRIZEN)

Allgemein
o
sprachfrei d.h. culture faire
o
Power Test (Unterschied zu CFT 20 –R)
o
darunter lassen sich 3 Tests zusammenfassen:
-
Standard Progressive Matrice (SPM): leichte Version,
Advanced Progressive Matrice (APM): schwerer,
Coloured Progressive Matrice (CPM): Altersbereich 4-12
BOMAT BOCHUMER MATRIZENTEST VON HOSSIEP ET AL.

verwendet gleichen Typ von Matrizen-Aufgaben wie der CFT 20

Testung der allgemeinen Intelligenz
WIT - 2 WILDE INTELLIGENZ TEST VON JAGER UND ALTHOFF

Intelligenztest basiert auf 5 von 7 Primarfaktoren von Thurstone
Alter
9-20

Test wurde vorrangig für die berufsbezogene Diagnostik entwickelt
ENTWICKLUNGSTESTS
HAMBURG-WECHSLER-INTELLIGENZTEST FUR KINDER: HAWIK-III


Allgemein:
o
gibt es für Vorschulkinder (HAWIVA), Kinder (HAWIK) und Erwachsene (HAWIE– R)
o
Aufbau sehr ähnlich: 10 – 12 Subtests die sich in Handlung- und Verbalteil aufteilen lassen
(Revision HAWIK IV: wahrnehmungsgebundenes logisches Denken, Arbeitsgedächtnis,
Verarbeitungsgeschwindigkeit, Sprachverständnis und der Gesamt IQ)
Bewertung:
o
brauchbar und nützlich
o
liefert zusätzlich zum IQ auch Info über die Stärken und Schwächen der Probanden
o
große Informationsausbeute  gut für Einzelfalldiagnostik
o
Verfahren wird national und international intensiv beforscht
o
Testung Hochbegabung: lediglich Screening mit HAWIK, da im oberen Bereich nicht
differenziert genug erfasst wird
Objektivität
Reliabilität
Validität
Gegenstand
Ökonomie
Alter
nicht perfekt, da
erhebliche
Anforderungen an
TL
(Bearbeitungszeit,
Antworten gleich
bewerten und
Abbruch)
in erwartete
Richtung.
Gesamt SH:
.96 sehr
hoch,
Schwankungen
bei Subtests
(.68), keine rtt
 Mangel!
Angaben im
Manual
spärlich:
fehlen Korr. mit
anderen
Intelligenztests,
FA 2
Faktoren,
Testleistung
variieren i. A.
vom Schultyp
G + Komponenten:
Gesamt-IQ, Verbal/
Handlungs- IQ, Werte
für
Subtests,
Verhaltensbeobachtung
ADAPTIVES INTELLIGENZ DIAGNOSTIKUM 2.2 : AID2.2

Aufgabentypen im AID entsprechen denen im HAWIK

Ziel:

o
Erfassung der Teilleistungsstörung oder – schwäche
o
testet viele komplexe und basale Fähigkeiten
Vorteil:
keine
6-16
Gruppe
50-70 min,
kein
Computertest,

o
Basiert auf dem Rasch-Modell
o
Testung ist adaptiv, richtet sich an dem Fähigkeitsniveau der Probanden in vorangegangenen
Aufgaben aus, d.h. für den Probanden zu schwere und zu leichte Aufgaben werden
weggelassen erhöht die Ökonomie im Sinne einer reduzierten Testzeit oder erhöhten
Testgenauigkeit
o
es werden immer Aufgaben mit einem Schwierigkeitsgrad von ca. p= .50 ausgewählt
o
gute Normierung
o
durch Profilinterpretation differenzierte Aussagen zum Vorliegen von Teilleistungsstörungen
Nachteil:
o
keine Berechnung des Gesamt-IQ  nicht vergelichbar
o
hohe Anforderungen an den Testleiter
Objektivität Reliabilität
Validität
Ökonomie
TLEffekte
FA, Bezug
auf
Vorgänger,
Diskriminante Validität gut
(Leistungstests, PK-Tests und objektive
Tests (sensu Catell))
Konvergente Validität nicht immer
ausreichend; für spez. Leistungstests
und CFT:
AID Untertests korrelieren in der Regel
sehr niedrig mit anderen Testverfahren
mit ähnlichen Inhalten
30-75 min, kein
Computertest und –
auwertungssoftware
keine Gruppe,
adaptive
Testvorgabe
Rasch- Modell
gilt. Split-halfRel. für
Untertests .91 .95; rtt 4 Wo:
.83 - .95;
1 Jahr: .60-.80.
(AID-Rel!)
 innovativ (PTT), ökonomisch, psychometrisch gut, Instrument zu förderungsorientierter
Diagnostik
KOGNITIVER FÄHIGKEITSTEST FÜR 4. BIS 12. KLASSEN, REVISION: KFT 4-12+ R

Aufgabe: dient der differenziellen Bestimmung kognitiver Fähigkeitsdimensionen, die
insbesondere für schulisches Lernen relevant sind

Einsatz in der Schullaufbahnberatung, Individualberatung, Studienberatung, Forschung,
Evaluation von Schulversuchen und Förderprogrammen,

Aufbau: 3 Teile: (Strukturmodelle von Thorndike waren die Basis)
o
Verbaler Teil (sprachliche Intelligenz),
o
Quantitativer Teil (numerische Fähigkeiten),
o
Nonverbaler Teil (figurales Denken)
o
Aufgaben der Subtests sind nach Schwierigkeit gestaffelt.
o
 Die Untertests dürfen nicht als eigenständige Fähigkeiten interpretiert werden

Es gibt einen Paralleltest und eine Kurzform

Die meisten Items sind Rasch-homogen

Normierung:
Alter
6-15
o
Jahrgangs- und schulspezifische Normen
Objektivität
Reliabilität
Validität
Gegenstand
Ökonomie
Alter
ja
αgesamt:
.95,
rtt: .8387
Kriteriums
V.: zwischen
.30 und .40
(gering)
FA,
geringe
Kennwerte verbaler
Teil,
quantitativer Teil,
nonverbaler Teil,
Gesamtleistung.
basieren
auf Strukturmodellen
von Thorndike
4-13
90/130, Gruppe,
Auswertungssoftware, Klasse
kein Computer,
 reliabler, 3-faktorieller IQ Test, aber hoher Zeitbedarf/Kosten und geringe prädiktive Validität
GRUNDINTELLIGENZTEST SKALA 2: CFT 20-R MIT WORTSCHATZTEST (WS) UND
ZAHLENFOLGETEST (ZF)



Allgemein:
o
dient der sprachfreien und damit auch kulturfairen Messung der fluiden Intelligenz;
Ergänzungstests dienen der Erfassung der kristallinen Intelligenz
o
liegt als paper and pencil und PC Test vor
o
zwei Pseudoparallelformen A und B: Normalerweise werden beide Teil durchgeführt, es kann
aber auch nur der erste Teil durchgeführt werden
o
zusätzlich können noch der fakultative Wortschatz (Testung des Wortschatzes der
Umgangssprache, der Allgemeinbildung und verbale Verarbeitungskapazität und der
Zahlenfolgetest (Testung numerischer Verarbeitungskapazität) durchgeführt werden
Ziel
o
kein Instrument zur Prognose von Schulleistungen (da hierfür Sprache wichtig)
o
Diagnose der grundlegenden geistigen Leistungsfähigkeit d.h. er dient der Untersuchung von
sprachretardierten und Ausländerkindern
Normierung:
o
Für Alters- und Klassenstufen
Objektivität
Reliabilität
Validität
Gegenstand
Ökonomie
ja
rtt: .80-82,
SH: .95,
interne
Konsistenz
.86,
Konstrukt –V.:
Höhere Korr. zu
konstruktnahen als
zu konstruktfernen
(z. B.
Rechtschreibtest)
Variablen
Kriteriums V.:
bspw. gute
Vorhersagte der
Mathematikleistung
sprachfreie Messung
der
fluide Intelligenz,
mit
WS& ZF grob
krisallisierte
Intelligenz,
wenn keine
Differenzen 
GesamtIQ
30-60 min, 60 Min
beide Teile, 45 Min
Zusatztests,
Gruppentest
möglich,
Computerform
Alter
8-70
HEIDELBERGER SPRACHENTWICKLUNGSTEST: HSET

Allgemein:
o
13 Untertests
o
Verwendung in der kinder- und schulpsychologischen Praxis
o
dient der differenzierten Erfassung der sprachlichen Fähigkeiten von Kindern; erfasst
sprachliche linguistische & pragmatische Kompetenz)
o
Einsatz bei Sprachentwicklungsauffälligkeiten, Legasthenie, Lernschwierigkeiten
o
HSET zeichnet sich dadurch aus, dass er den Sprachbereich so umfassend diagnostiziert
-
konkurriert nicht mit verbalen Intelligenztests oder Wortschatztests; es geht nicht um
Wortflüssigkeit oder sprachliches Repertoire, sondern Wissen im Sinne von Regeln, die
bei der Produktion und dem Verstehen von Sprache (unbewusst) befolgt werden
Objektivität
Reliabilität
ja, hohe
α Subtest=
Standardisierung .74- .95,
α gesamt
.98
Validität
Gegenstand
Ökonomie
bedeutsame
MWAnstiege, FA
(hohe
Korrelation
zw. den 2
Faktoren 
nicht gut),
Kriterium
sprachliches
Leistungsprofil,
Gesamt
40 – 80 min,
Keine
Gruppentestung
Alter
4-9,
sind die Kinder
sehr
leistungsschwach
kann der Test
auch noch länger
angewandt
werden
 theoriegeleitet, reliabel, valide, zur differenziellen Deskription des sprachlichen
Entwicklungsstandes, aber unökonomisch und Mängel bzgl. Normierung
EIGNUNGSTESTS


Ziel:
o
Maximierung der beruflichen Zufriedenheit
o
Maximierung der beruflichen Leistung
Einsatz:
o
mehrere Stellen ein Bewerber  optimale Stelle
o
gleich viele Stellen und Bewerber  optimale Zuteilung
o
eine Stelle viele Bewerber  optimaler Bewerber
BERUFSEIGNUNGSTEST: BET VON SCHMALER & SCHMIDTKE

Allgemein
o
Der Test erfasst verschiedene Grundfunktionen beruflicher Eignung (Werkzeugvergleich,
Rechenaufgaben (paper pencil) Zapfen stecken, (Gerätetests))

o
spezifischen Stärken und Schwächen werden dabei mit Mittelwerten von kaufmännischen,
gewerblichen, technischen und industriellen Berufen sowie Berufen der Informatik in
Deutschland verglichen.
o
12 Einzeltests
o
Für die Tests 1 bis 7 liegen Parallelformen (A und B) vor
o
Einzel- und Gruppentest.
Anwendungsbereich:
o


Eignungsauslese, beruflichen Rehabilitation, Berufsberatung.
Normierung:
o
für jeden einzelnen Untertest alterspezifische Standardwertnormen für 9 verschiedene
Altersgruppen vor (14; 15; 16; 17; 18-19; 20-21; 22-24; 25-31; 32-38 Jahre)
o
berufsspezifische Anforderungsnormen für 70 verschiedene deutsche Berufsbezeichnungen im
kaufmännischen, gewerblichen, technischen, industriellen sowie im Informatik-Bereich
Vorteile:
o

Gute Normen, schnelle und einfache Auswertung
Nachteile:
o
Kein theoretisches Konzept, aufwendige Durchführung, Prognose von Berufserfolg nicht
befriedigend
Objektivität
Reliabilität
Validität
Ökonomie
hoch
hoch rtt (7
Tage)=
.88-.93
FA,
Konstrukt-V.: Korr. Untertests mit
IST- gesamt (-.01-.68)
Kriteriums-V.:
Ausbildungserfolg/Prüfung = -.09.59
150 min,
Gruppe,
weder
Computertestung noch
Auswertung,
materialintensiv
wenig ökonomisch
BERUFSINTERESSENTEST BIT-II VON IRLE (1984)


Konzept:
o
Intendiert Erfassung berufsbezogener Interessen (neun berufliche Interessensrichtungen
o
eher zu Klassifikation als Selektionszwecken gedacht
o
Interessensrichtungen
o Technisches Handwerk
o Gestaltendes Handwerk
o Technische und naturwissenschaftliche Berufe
o Ernährungshandwerk
o Land- und forstwirtschaftliche Berufe
o Kaufmännische Berufe
o Verwaltende Berufe
o Literarische und geisteswissenschaftliche Berufe
o Sozialpflege und Erziehung
Gliederung:
o

2 je parallele Formen
Vorteile: Abfrage konkreter Tätigkeiten, breite Normen
Alter
15-38

Nachteil:
o
Normen sind zwar breit, aber veraltet
o
Keine Erweiterung der Tätigkeitsfelder (komplette Computerbranche nicht enthalten), keine
Reliabilitäts- und Validitätsangaben
Objektivität
Reliabilität
Validität
Ökonomie
Alter
ja
NEIN
k. A. Verweis
auf
Monographie
von
Allehoff
theoriekonforme, über
Stichproben hinweg
invariante
Faktorstruktur, keine
Angaben zur
Kriteriumsvaliditat,
Verweis auf
Monographie
Allehoff
9. bis 13.
30 min- 2h (?),
Gruppe,
Klasse
kein Computertest
keine
Auwertungssoftware
 wegen nicht zeitgemäßen Items und alten Normen heutzutage für Berufsberatung nicht mehr
geeignet, aber es gibt keine Alternative
BÜROTEST: BT VON MARSCHNER

Anwendung: Eingangsuntersuchungen im Rahmen der Auswahl kaufmännischer, aber auch
handwerklich-technischer Berufe, Umschulung etc.

Konzept:

o
die zur Bearbeitung und Lösung angebotenen Arbeitsproben sollen zusammen einen typischen
Ausschnitt aus komplexer Arbeitssituation eines Büros bilden
o
Arbeitsvorgänge ohne spezielle kaufmännische Fachkenntnisse lösbar
o
Deckt Bereich
o „praktisch anschauliches Denken“
o „Kombinationsfähigkeit“
o „organisatorische Befähigung“ ab
kaufmännisch-verwaltungsmäßige Tätigkeiten
Gliederung:
o
Je 2 Arbeitsproben aus den Feldern mit steigender Schwierigkeit

o Ordnen & Verteilen von Post (OV),
o Arbeitsabläufe planen (AP) und
o Umgang mit Zahlen (UZ)
Paralleltest liegt vor

Normierung
o
nach Lebensalter und kaufmännischer Ausbildung erstellt
o
Normen zu alt,

Vorteile: Gütekriterien gut

Nachteile: keine Anpassung an Veränderungen (keine Aufnahme von EDV Fähigkeiten, was in
der heutigen Bürozeit unerlässlich ist)
Objektivität
Reliabilität
Validität
Ökonomie
Bei Beachtung der
Lösungsschlüssel und Übung
gegeben (TL muss geschult sein)
Auswerterübereinstimmung bei
geschulten Beurteilern .98
α = .91
rtt
Konstrukt-V.: Korr. mit LPS
und IST gering
Testzeit ca.
45min
(6Monate)=.71
Alter
Ab 14
Prognose: r mit
Ausbildungserfolg .49-.89
COMPUTERBASIERTE TESTS
Beispiele wären der FAIR und der FAKT (vgl. oben)
PERSÖNLICHKEITSTESTS
ALLGEMEINES
PERSÖNLICHKEIT


Definition
o
Persönlichkeit umfasst: Charakter, Temperamentsunterschiede, Bedürfnisse, Interessen,
morphologische und physische Wesensänderung
o
Persönlichkeit im engeren Sinne d.h. gewöhnliche Faktoren die erfasst werden: emotionales,
motivationales und soziales Verhalten
Abgrenzung: Temperament
o

Temperament liegt der Persönlichkeit zu Grunde und ist stärker genetisch determiniert
Umweltfaktoren
o
haben nur einen Einfluss, wenn sie lang anhaltend und massiv sind
FRAGEBÖGEN



Definition
o
„messen wie man sich selbst sieht oder beurteilt“
o
„Fragebögen erfassen die von einer Person bevorzugte Wahrnehmung und Darstellung ihrer
selbst“
Vorteile von Fragebögen
o
haben eine hohe Durchführungs-, Auswertungs- und Interpretationsobjektivität
o
beste Methode zur Erfassung innerer Zustande, Einstellungen, Erleben und Kognitionen 
Voraussetzung: Fähigkeit zur Selbsteinsicht und Selbstbeobachtung sowie ein Mindestmaß an
Intelligenz
Probleme von Fragebögen
o
uneindeutige Formulierung der Frage (Bspw. „häufig“ wird von verschiedenen Personen
unterschiedliche interpretiert)
o
Eigenschaftseinschätzung (z.B. „ich bin hilfsbereit“) erfordert
-
Erinnerung an Ereignisse bei denen man das Verhalten gezeigt hat
das Relativieren des eigenen Verhaltens an dem der anderen
 DESWEGEN
o Standardisierung von Fragebogen reduziert die Varianz der Itemformulierung
o

Objektivität von Fragebögen
o

ist einigermaßen gut
Reliabilität von Fragebögen
o

Reduktion der Testleiter-Interaktion
interne Konsistenz: .60-.80; Stabilität: .50-.70
Validität von Fragebögen
o
überschreitet magische Grenze von .30 fast NIE
o
bei großen Gruppen ist die Validität ausreichend
o
bei Einzelergebnissen jedoch nicht
o
Validität ist grundlegend für Persönlichkeitstest, da auf Grund der Ergebnisse wichtige
Entscheidungen (bspw. für den Beruf, die Ausbildung) getroffen werden
o Problem bei der Testung der Konstruktvalidität:
-
Steinbruch – Problem:
 neue Skalen werden aus alten erstellt Ähnlichkeit wird durch Übernahme alter
Items verursacht

DESWEGEN Bestimmung der Konstruktvalidität durch Fremdeinschätzung bzw. am
besten durch gemittelte Fremdeinschätzung

Fremdeinschatzung ist aber abhängig von
-
Dauer der Bekanntschaft
dem zu beobachtenden Merkmal
-
verzerrte Selbstwahrnehmung
-
Verfälschung: positive oder negative Selbstdarstellung
 Beheben:
-
Instruktion (ehrlich antworten, lügen fallt auf)
-
forced choice: man muss sich zwischen ähnlichen soziale erwünschten Antworten
entscheiden
-
Kontrollskalen (Bspw. Lügenskala)  VORSICHT: keine eindeutige Interpretation
der Skala möglich; hohe Ausprägung gibt nur Hinweis auf mögliches Lügen / sozial
erwünschtes Verhalten
-
Verkürzung der Antwortzeit HILFT NICHT
TROTZ sozialer Erwünschtheitstendenz kann Kriteriumsvalidität gegeben sein (soziale
Erwünschtheit korreliert mit Ausbildungserfolg)
-
Antwortstile
 Antworten werden nicht nur nach Wahrheit sondern auch nach anderen Prinzipien
beantwortet
- unsystematische Beantwortung (ungewöhnlich viele seltene Antworten)
- Ja – sage – Tendenz
MINNESOTA MULTIPHASIC PERSONALITY INVENTORY: MMPI UND MMPI-2 VON
HATHAWAY& MC KINLEY. DT. VON ENGEL

Ziel
o

Testung aller wichtigen Persönlichkeitseigenschaften und psychischen Störungen
Allgemein
o
external konstruiert (1000 Items wurden Gruppen (Patienten (Schizophrene, Depressive und
Gesunde) vorgegeben  566 Items, die Gruppen differenzieren
o
13 Basisskalen und 4 Validitätsskalen; außerdem Bildung von Zusatzskalen möglich
-

Basisskalen: Depression, Hypochondrie, Hysterie, Psychopathie,
Maskulinität/Femininität, Paranoia, Schizophrenie, Psychasthenie, Hypomanie, Social
Introversion
- Validitätsskalen: Lügenskala, Korrekturskala, Weiß-nicht-Skala, Seltenheitsskala
- Zusatzskalen: Suchtproblematik, Eheprobleme, PTBS
Normierung: 18 -70, gut

Vorteile:

o
Große Informationsausbeute
o
Kann Hinweise für die klinische Interpretation liefern
o
Messintention verborgen
Kritik:
o
basiert auf veralteten diagnostischen Kriterien (NICHT ICD-10 und DSM-IV)
o
Itemoverlap d.h. Itemantwort Ja/Nein differenziert nur zwischen gesund und krank;
innerhalb der Krank-Gruppe gibt es aber nochmal weitere Gruppen, die bei der ja / nein
Antwort nicht differenziert werden; außerdem wird einmalige Itemantwort mehrfach
verrechnet
Objektivität
Reliabilität
Validität
Ökonomie
ja
rtt: .66-.92
interne
Konsistenz: α = .52
-.88
(schlecht bis sehr
guter Bereich)
Keine Befunde für
Deutschland
dürftige Angaben
(amerikanische Version,
MMPI),
lediglich Faktorenanalyse
1 h +, (Beschränkung
auf 370
Items möglich)
Einzel/Gruppe,
Faxauswertung
möglich,
Software, Computer
Alter
18-70
FREIBURGER PERSONLICHKEITSINVENTAR: FPI-R

Ziel:
o

Beschreibung interindividueller Unterschiede, weniger Einzelfalldiagnostik
Allgemein
o
Hypothetisch deduktive, empirisch induktive Entstehung mit faktoranalytischer Rechtfertigung,
teils nach Trennschärfe der Items Autoren wehren sich gegen Vorwurf der
„blindanalytischen“ Vorgehensweise
o
10 Standardskalen (z. B. Gesundheitssorgen, Erregbarkeit, Lebenszufriedenheit, Soziale
Orientierung, Leistungsorientierung, Gehemmtheit, Aggressivität, Beanspruchung, körperliche
Beschwerden, Offenheit); 2 Zusatzskalen: Extraversion & Emotionalität (Eysenck)
o
Vorteile:
-
Gemessen werden auch solche Konstrukte, die in anderen Inventaren nicht enthalten sind
(psychosomatische Konstrukte)
- Platz 1 der am häufigsten verwendeten Testverfahren (spricht für nützliche Skalenauswahl
in der Praxis)
- Gütekriterien gut und aktuelle Normen
Nachteile:
o
-
diagnostische Zielsetzung und theoretische Grundlagen nur kurz in Handanweisung
(dadurch reduzierte Vergleichbarkeit)
Skalen unabhänig?
Kein Paralleltest
Objektivität
Reliabilität
Validität
Ökonomie
ja
α Skalen:
.71-.84
rtt= .69-.85
Stabilitat gut
Faktoren laden auf 5 Faktoren des
NEO, Zusammenhänge körperlicher
Beschwerden (FPI-R) und schlechtem
Gesundheitszustand, Zusammenhänge
allg. Lebenszufriedenheit (FPI-R) und
Zufriedenheit mit familiärer Situation
Studien stützen die Validität der Skalen
hinreichend
10-30 min,
PC &
Auswertungssoftware
16-PERSÖNLICHKEITS-FAKTOREN-TEST REVIDIERTE FASSUNG: 16PF-R VON
SCHNEEWIND & GRAF

Allgemein:
o
Induktiv faktorenanalytisch konstruierte Skalen
-
o
16 inhaltliche Skalen
5 Globalfaktoren (Extraversion, Ängstlichkeit, Selbstkontrolle, Unabhängigkeit,
Unnachgiebigkeit)
- Impression Management, Zustimmungstendenz, Zufälligkeit
Unterteilung: Geschlecht, 3 Altergruppen
Alter
Ab 16


Ziel:
o
Erfassung der Big Five
o
differenzierter Zugang zu den verschiedenen Merkmalsbereichen
Vorteile
o

Normen sind aktuell und repräsentativ
Nachteile:
o
Messgenauigkeit der Primärskalen gering (wäre günstiger gewesen unter Verzicht auf
Durchführungsökonomie Skalen zu verlängern)
o
daher keine Profilinterpretation durchführen
o
härtere Validitätsbelege stehen noch aus
Objektivität
Reliabilität
Validität
Ökonomie
ja
nur mittlere α
Primärskalen:.64-.89.
Profilinterpretationen
nicht für alle Skalen
unproblematisch, daher
für Einzeldiagnosen
fragwürdig
rtt (1 Monat) = .83
faktorielle Validität bestätigt,
zahlreiche Untersuchungen zur
Konstruktvalidität: Analysen
mit anderen Persönlichkeitsfragebögen,
konvergente Validität mit NEOFFI und diskriminante Validität
mit MMPI
Fremdeinschätzungswerte bei
Vorgänger: .30 /.40
45 min, Gruppentest
möglich,
Computerversion,
Auswertungssoftware
Alter
Ab 18
NEO-PERSÖNLICHKEITSINVENTAR UND NEO-FÜNF-FAKTOREN-INVENTAR: NEO-PIR VON BORKENAU& OSTENDORF UND NEO-FFI VON HOSSIEP& PASCHEN

Allgemeines:
o
Der NEO ist ein faktorenanalytisch konstruiertes Fragebogenverfahren
o
dient der Erfassung individueller Merkmalsausprägungen (Big Five: Neurotizismus,
Extraversion, Offenheit f. Erfahrung, Verträglichkeit, Gewissenhaftigkeit  haben noch
Unterfacetten)
o
Geschichte Big Five
-
o
Taxonomie persönlichkeitsbeschreibender Begriffe von Allport und Odbert
Cattell extrahierte daraus 35 bipolare Adjektive, die er als repräsentativ für die
Gesamtpersönlichkeit ansah
- Allerdings sind die Reduktionsschritte sehr subjektiv und zum Teil heute nicht mehr
nachvollziehbar
- Fiske 1949: Fand 5 Faktoren
- Die Big Five:
- fünf breite invariante Persönlichkeitsdimensionen auf einem sehr hohen abstrakten
Niveau
- unabhängig von der Urteiler- oder Beurteiltenstichprobe und von Antwortformat.
Grenzen des Fünf-Faktoren- Modells:
-

Ergebnisse der Faktorenanalyse von Variablenstichprobe abhängig.(Bei der Analyse
einiger Fragebogen zeigten sich mitunter weniger als 5 Faktoren)
- Unklarheiten bzgl. der adäquaten Interpretation der fünf Faktoren (Streitigkeiten bzgl. der
Benennung, evtl. da sehr abstrakte und globale Konzepte, v.a. Offenheit für Erfahrung).
- Verfälschbarkeit: Grundsätzlich dürfte der NEO- FFI verfälschbar sein.  Dann zu
erwarten, wenn starkes Interesse an Selbstdarstellung und (!) bekannt ist, was ist
jeweiligen Situation erwünscht ist.
Anwendungsfelder:
o
Forschung
o
Klinische: Entwicklung für klinisch unauffällige Personen  Beratungszwecke, für
Psychotherapie ebenso vorteilhaft: allgemeinen Überblick. Beziehungen zwischen Störungen
und den fünf Faktoren: Die meisten Störungen gehen mit erhöhten Neurotizismuswerten
einher.
o
Pädagogische Psychologie: Insbesondere Gewissenhaftigkeit und Offenheit für Erfahrung
o
Berufsberatung: eindrucksvolle Befunde bezüglich der Vorhersage von Berufserfolg:
Gewissenhaftigkeit als valider Prädiktor. Ebenso Extraversion und Verträglichkeit.
-
Da nur geringe Korrelationen mit IQ, gute inkrementelle Validität hinsichtlich des
Berufserfolgs zu erwarten. (v.a. wenn Personen mit ähnlichem Bildungsabschluss
verglichen werden, ist die prädiktive Validität des IQ reduziert)
NEO–PI–R


Allgemein:
o
zusätzlich Unterteilung der 5 Faktoren in Facetten
o
es liegen sowohl Selbst- und Fremdbeurteilungsversionen vor
Normierung:
o
Gesamtstichprobe, repräsentative Gesamtstichprobe, Geschlecht, 5 Altersklassen
o
Norm auch für Fremdbeurteilung

FAZIT: sehr gut fundiertes Verfahren, gut repliziertes, kulturübergreifendes und umfassendes
Bezugsystem für Persönlichkeitseigenschaften auf aktuellem Stand der Forschung

Vorteile gegenüber NEO FFI

o
Big Five werden zuverlässiger gemessen
o
Subskalen ermöglichen eine differenzierte Beschreibung
o
Fremdbeurteilerversion
o
bessere Normierung
Nachteile gegenüber dem NEO-FFI
o
Der NEO-FFI ist kürzer und daher ökonomischer
Objektivität Reliabilität
ja
Einzelne Facetten
durchschnittlich nur
Konsistenzen von .73
(einzelne fallen bis .53
ab),
Validität
Ökonomie
zahlreiche Hinweise auf
Konstruktvalidität und
Faktorenstruktur; Faktorenstruktur
korrespondiert sehr gut zwischen
Selbst- und Fremdbericht, Männer
und Frauen und verschiedenen
30-60
min
Alter
16über 50
ABER fünf Hauptskalen
super (.87 aufwärts),
Altersgruppen
Retest nach 5 Jahren
noch durchschnittlich
bei .75
NEO-FFI


Konzept:
o
Vgl. NEO-PI-R, deutschsprachige Übersetzung und Adaptation
o
Kurzform des PI-R mit 60 Items
o
Erfassung der 5 Faktoren jedoch ohne Facetten
Normierung: bis dato noch keine
Objektivität Reliabilität
α für Neurotizismus, Extraversion,
Gewissenhaftigkeit > .80,
Offenheit, Verträglichkeit .70
Retest nach 2 Jahren .65 bis .81
(hoch) mit Ausnahme von
Verträglichkeit
ja
Validität
Ökonomie
Alter
faktorielle Struktur
überwiegend
bestätigt,
Analysen mit anderen
Persönlichkeitstest
untermauern
Konstruktvalidität,
Selbst- Fremdkorrelation
bei .54
Ab 16
35 min,
Einzel/Gruppe,
Auswertsoftware
BOCHUMER INVENTAR ZUR BERUFSBEZOGENEN PERSÖNLICHKEITSBESCHREIBUNG:
BIP VON HOSSIEP & PASCHEN


Ziel:
o
Vorhersage von Berufserfolg
o
Einschätzung einer Person in Hinblick auf bestimmte berufliche Anforderungen, Training,
Coaching, Beratung
o
VORSICHT: BIP ist kein Vorauswahlinstrument
o
BIP sollte nicht das alleinige Platzierungs- oder Entscheidungsinstrument sein  soll der
Hypothesengenerierung dienen; kann gute Grundlage sein für Exploration, Beratung,
Rückmeldungsgespräch
Allgemein
o
4 Bereiche (Berufl. Orientierung, Arbeitsverhalten, soziale Kompetenzen, psychische
Konstitution) mit insgesamt 14 Dimensionen, Zusatzindizes
o
Fremdeinschätzungsbögen

Normierung
o

Vorteil
o

Geschlecht, Alter, Berufsgruppe
auf den betrieblichen Kontext zugeschnitten ist  besser kommunizierbar durch
Augenscheinvalidität, Ergebnisse des BIP lassen sich (da zugeschnitten) mit Sicherheit besser
rückmelden (auf Frage, warum man nicht den NEO nehmen würde)
Nachteil:
o
Leicht verfälschbar in Richtung sozial erwünscht
o
Siehe Validität
Objektivität Reliabilität
α Skalen um .85
ebenso rtt
ja
Validität
Ökonomie
4- Faktoren- Struktur,
inkrem. Validität (gg. NEO) nicht
belegt,
Kriteriumsvalidität gering, schlechte
Korrelation Fremd/Selbst
Ab 20
45 min,
Software,
Computer
ANDERE PERSÖNLICHKEITSTESTS


TIPI: Trierer integriertes Persönlichkeitsinventar
o
konstruiert nach dem Rasch – Modell
o
Erfasst Eigenschaften und Dimensionen von „normalen“ und gestörten Persönlichkeiten
o
findet Anwendung: Klinische, ABO, Forensik, Forschung, Verhaltensmedizin
D-PRF: Deutsche Version des Personality Research Form
Alter
PROJEKTIVE TESTS

Allgemein:
o

Projektion = Verlegung einer Eigenschaft (aus dem ES), die das Ich bedroht und an der eigenen
Person nicht wahrgenommen wird auf eine Person der Außenwelt
Ziel:
o
durch mehrdeutige Reize sollen Projektionen des ES provoziert werden
o
Projektionen geben Auskunft über nichtbewusste Aspekte der Persönlichkeit

Klassifikation des Tests nicht nach Konstrukt oder äußeren Kriterien (Einzel-, Gruppentest,…)
sondern nach der Theorie

Güterkriterien sind nicht in einem ausreichenden Bereich  sofern es möglich ist, sind immer
andere Tests mit besseren Gütekriterien den projektiven Tests vorzuziehen

FAZIT:

o
projektive Verfahren decken keine verdeckten Bewusstseinsinhalte auf 
o
ergiebiger ist die direkte Befragung
o
bei Kindern können p.rojektive Verfahren als Explorationshilfe genutzt werden
GÜTEKRITERIEN sind nicht erfüllt
RORSCHACH-PSYCHODIAGNOSTIK


Allgemein:
o
Formdeuteverfahren
o
ursprünglich als Wahrnehmungstest entwickelt
Ziel:
o


Erfassung der Persönlichkeitsstruktur und Persönlichkeitsdynamik
Aufgabe
o
10 Klecksbilder werden vorgelegt: „was konnte das sein?“
o
Tafeln dürfen gedreht werden und es dürfen so viele Antworten abgegeben werden, wie man
will
o
bewertet wird: Erfassungsmodus (Ganz- vs. Detaildeutung), Determinanten (Form, Farbe,
Bewegung), Inhalt und Grad der Originalität
Normierung
o
Fehlt
o
Comprehensive System (Exner): Handbuch mit detaillierten Anweisungen für Ausführung und
Auswertung sowie mit Normen für Kinder und Erwachsene
Objektivität
Reliabilität
Validität
Ökonomie
Alter
Nein:
(Übereinstimmung
variiert zwischen
52-98%)
schwer berechenbar 
s. TAT (zufrieden
stellende rtt bei Patienten
mit Gedächtnisstörung
nein, teilweise gelingt
Gruppenzuordnung,
aber viele diskrepante
Befunde
großes Problem für die
Validität: fehlende
Kinder
20-30 min,
ab 2
kein
Computer,
Jahren
Software
zur
Auswertung
theoretische
Fundierung
von Exner
THEMATISCHER APPERZEPTIONS-TEST: TAT VON MURRAY (1936)


Allgemein
o
Phantasietest
o
besteht aus 20 Bildtafeln, die grundlegende menschliche Problemsituationen ansprechen und
einer ganz weißen Bildtafel
o
Aufgabe: zu Bildtafeln sollen möglichst dramatische Geschichten erfunden werden
Ziel:
o
Erfassung der dominanten, vor allem der unterdrückten Triebe, Gefühle, Konflikte einer
Persönlichkeit
Objektivität

Reliabilität
Instruktion
nicht eindeutig,
die Enge des
Kontaktes und die
ungewöhnliche
Aufgabenstellung
verstärkt
Testleitereffekte
(z.B. aus dem
nonverbalen
Verhaltens des
Testleiters
Schlüsse ziehen)

interne Konsistenz
nicht sinnvoll
Paralleltest fehlt
Retest berechnet,
aber problematisch,
weil das wiederholte
Vorgehen die
Geschichte
beeinflusst
Validität
Ökonomie
Schwierigkeit nachzuweisen, dass es
sich bei angesprochenen Themen um
die Projektion unbewusster
Probleme handelt
Ab 4
2 mal 50
Min.;
keine
Gruppe,
kein
Computer
selbst wenn: was hat das für einen
Stellenwert? Zeigt sich das
verbalisierte Merkmal im Verhalten?
Fazit:
o
Gütekriterien nicht erfüllt
o
eher Kommunikationsmedium zur Bearbeitung der biographischen Grundsituation und als
explorative Technik zur Erfassung der Kognitionen und Emotionen
o
fraglich, ob das eine normale Befragung nicht auch könnte
DER KINDER- APPERZEPTIONS-TEST: CAT VON BELLAK & BELLAK (1955)
DEUTSCH VON MOOG

Allgemein
o
Vorlage von Bildern mit Problemsituationen die häufig bei Kindern auftreten (bspw.
Geschwisterneid, Beziehung zu Eltern, Alleinsein)
Alter
o

früher waren die Bilder nur mit Tieren (Annahme, dass Kinder mehr durch Tiere angesprochen
werden und mehr Geschichten produzieren  konnte widerlegt werden); heute auch Bilder mit
Menschen
Ziel
o
Erfassung von Wünschen, Impulsen, Ängsten und Konflikten
Objektivität
Reliabilität
keine vorgegebene
Keine Angaben
Instruktion, keine
Auswertungsobjektivität

Validität
Ökonomie
Keine angaben (Problem: auch
Kinder sind sich
ihren Äußerungen bewusst)
15-30 min,
keine Gruppe,
kein Computer,
keine Software
Alter
3-10
Fazit:
o
Testgütekriterien nicht erreicht
o
Kann als Explorationshilfe zur Generierung von Untersuchungshypothesen brauchbar sein,
wenn ein direktes Gespräch nicht in Gang kommt
o
Die These, dass unbewusste Inhalte zu Tage zu kommen, ist auch bei Kindern nicht unbedingt
haltbar, da diese auch ab einem gewissen Alter in der Lage sind, z.B. ihre verbalen
Aggressionen zu kontrollieren
GRUPPENDIAGNOSTIK
PAARDIAGNOSTIK
DER GIEßEN-TEST VON BRÄHLER & BRÄHLER, 1993



Allgemein:
o
gehört auch zu den psychoanalytischen und psychodynamischen Verfahren
o
erfasst wie Personen sich selbst in Beziehung zu anderen darstellen unter Verwendung von
psychoanalytischen Kategorien
o
Erfassung von Selbst-, Ideal- und Fremdbild
o
6 Skalen: Dominanz, Kontrolle, Grundstimmung, (soziale Potenz) & Resonanz,
Durchlässigkeit
o
Proband gibt über sich ein Idealselbst und Realselbst und über den Partner eine
Fremdbeschreibung ab (auch Real und Ideal)
o
Übereinstimmung und Differenz wird beachtet und nicht individuelle Ausprägung
Ziel:
o
Feststellungen von Übereinstimmungen / Differenzen zwischen Selbst/Fremd, Ideal/Real je
Partner
o
Diskrepanzen zwischen Selbst- und Fremdbild sind relevante Hinweise für die Beratung und
Therapie
Kritik
o
GT wurde nicht als Paartest konstruiert
o
Skalenzuordnung wurde nachträglich geändert ohne diese faktoranalytisch zu überprüfen
o

Änderungssensitivität des Fragebogens nach Intervention ist fraglich
Fazit:
o
Was bringt Ähnlichkeit und Verschiedenheit diagnostisch? Was ist besser?
o
In erster Linie ist der Test sinnvoll als Anregung für weitere Gespräche und um erste
Anhaltspunkte zu liefern, mehr als absolute Aussagen über die einzelnen Beziehungstypen zu
machen
Objektivität
Reliabilität
Validität
Ökonomie
ja
α Fremd/Selbst:
um
.60,
rtt um .70
FA,
für unterschiedliche Gruppen
verschiedene
Skalenkonfigurationen,
korrelative Validierung mit
Fragebogen
je Bogen 15 min
(30 min)
 gut
Alter
Ab 18
ANDERE INSTRUMENTE ZUR PAARDIAGNOSTIK

FPD: Fragebogen zur Partnerschaftsdiagnostik
o

PFB Partnerschaftsfragebogen
o


Bestimmung der partnerschaftlichen oder Ehequalitäten
PL (Problemlisten)
o
kein Test
o
Erfassung der wesentliche Konfliktbereiche und Änderungswünsche in der Partnerschaft
o
Ziel: spezifische Analyse von partnerschaftlichen Konfliktbereichen und die Suche nach
konkreten Änderungswünschen im Verlauf der Therapie
FLP (halbstandardisierter Fragebogen zur Lebensgeschichte und Partnerschaft)
o

Instrument für die Eheberatung und die psychotherapeutische Behandlung von psychischen
Störungen
unterstützt die Anamnese (Fragen zur Partnerschaft, dem Streitverhalten und zur Sexualität)
TPI: Das Trierer Partnerschaftsinventar
o
Beziehung der Partner zueinander sollte Gegenstand der Paardiagnostik sein und weniger die
das einzelne Individuum; Beziehung bestimmt sich in erster Linie aus den Handlungen der
Partner
FAMILIENDIAGNOSTIK
 FKS (Familienklimaskalen)
o
Erfassung des Interaktionsgeschehens in der Familie
o
Zusammenhalt der Familie, gegenseitiges Unterstützen Offenheit bzgl. Gefühlen, Spontaneität,
etc.


o
Konfliktsneigung: Häufigkeit von Streitereien, Ausdruck von Ärger
o
Persönlichkeitsreifung etc.
FDTS (Familiendiagnostisches Testsystem)
o
FKS in Testsystem FDTS integriert
o
Ziel: Erfassung der dyadischen Beziehungen in den Kernfamilien
FB (Familienbogen)
o
erfasst die Familien als Ganzes, geht aber auch auf Dyaden ein und erfasst zusätzlich die
Funktion der einzelnen Familienmitglieder über einen Selbsteinschätzungsbogen
TEAMDIAGNOSTIK

TKI Teamklima Inventar
o
erfasst die Atmosphäre bzw. das Klima in Arbeitsgruppen durch Mittelung der Teammitglieder
Scores
KLINISCHE VERFAHREN
ANGSTFRAGEBOGEN FÜR SCHULER: AFS VON WIECZERKOWSKI (1998)


Allgemein
o
4 Testskalen (Prüfungsangst, manifeste Angst, Schulunlust, soziale Erwünschtheit)
o
Fremdbeurteilung durch den Lehrer, Überprüfung der Übereinstimmung Selbst und
Fremdurteil
Ziel
o
AFS dient
-

der Erfassung des Ausmaßes der Angstatmosphäre in Schulklassen
als Material für Selbsterfahrungsgruppen zur individuellen Diagnostik, Therapieindikation
und –kontrolle
- als Forschungsinstrument zur Erfassung der Angstkomponenten in psychologischen,
soziologischen und pädagogischen Untersuchungen
Normierung
o
Repräsentativ
o
Alter 9-17 Jahre
Objektivität
Reliabilität
Validität
Ökonomie
ja
rtt = .67-.77, α =
.67-.77
niedrige bis mittlere
Korrelation der Skalen,
Kriteriumsvalidität (Lehrer,
Eltern, Noten),
sensitiv auf Änderungen des
10-25 min,
Gruppe,
Computer
Alter
916/17
Angstniveaus
 ausreichende Validität
STRUKTURIERTES KLINISCHES INTERVIEW FÜR DSM-IV: SKID VON WITTCHEN,
ZAUDIG UND FYDRICH

Allgemein
o
halbstrukturiertes Interview: Achse-I und II Störungen entsprechend DSM-IV, zusätzlich
Achse III-V möglich
o
Einsatzbereich:
-
o
bei ambulanten und stationär behandelten Patienten mit psychischen Störungen im
psychiatrischen und psychotherapeutischen Bereich
- auch zu Forschungszwecken
SKID-II ist ein zweistufiges Verfahren:
-

Fragebogen (Items repräsentieren die Kriterien des DSM-IV ) entspricht Screening für die
Merkmale der zwölf erfassten Persönlichkeitsstörungen
Im Interview werden nur Fragen gestellt, die im Fragebogen eine ja-Antwort hatten
Ziel
o
SKID-I
-
o

Erfassung und Diagnostik ausgewählter psychischer Syndrome und Störungen
Zusätzlich Kodierung von Achse III (körperliche Störungen) und Achse V
(Psychosoziales Funktionsniveau) Störungen
SKID-II
- Diagnostik der Persönlichkeitsstörungen.
Probleme
o
Hohe Anforderungen an den Interviewer  psychiatrisch diagnostische Kompetenz notwendig,
ausführliche Einarbeitung in das Instrument, Vertrautheit mit der Klassifikation nach DSM IV
Voraussetzung
o
Keine Angaben zur Normierung
Objektivität
Reliabilität
Validität
Ökonomie
Alter
ja
Verbesserung
durch gezieltes
Interviewertraining,
befriedigende RetestReliabilität,
5 diagnostische Kategorien
zeigen
schlechte RetestÜbereinstimmungswerte
(Kappa) u.a. Panikstörung
keine
Angaben!
schwer zu
beurteilen, da
strukturierte
klinische
Interviews die
beste verfügbare
Methode sind
Ab 18,
SKID-I: 100 min,
begründet
SKID-II: 30 min,
PC für SKID-II,
ab 14
keine
Auswertungssoftware
Herunterladen