NeuroCogFX – eine computergestützte neuropsychologische

Werbung
Fliessbach & Hoppe et al.
NeuroCogFX – eine computergestützte neuropsychologische Testbatterie für
Verlaufsuntersuchungen bei neurologischen Erkrankungen
Zusammenfassung
Dr. med. Klaus Fliessbach, Dipl.Psych.*1, Dr. rer.nat. Christian Hoppe, Dipl.Psych.
Dipl.Theol.*1, Prof. Dr. med. Uwe Schlegel2, Prof. Dr. med. Christian E. Elger1, Prof. Dr. phil.
Bei vielen neurologischen Therapiestudien ist eine längsschnittliche Erfassung der kognitiven
Christoph Helmstaedter, Dipl.Psych.1
Leistungsfähigkeit erforderlich. Ein für diesen Zweck geeignetes Messinstrument sollte nicht nur
den Gütekriterien der Testtheorie entsprechen, sondern zudem wiederholbar und ökonomisch in
* K.F. und C.H. haben zu gleichen Teilen zu der Studie beigetragen
Durchführung und Auswertung sein. Die von uns entwickelte computergestützte Testbatterie
NeuroCogFX enthält Untertests für die neuropsychologische Leistungsmessung in den Bereichen
1
Klinik und Poliklinik für Epileptologie der Universität Bonn
(Direktor: Prof. Dr. C. E. Elger)
Kurzzeitgedächtnis, Arbeitsgedächtnis, psychomotorische Geschwindigkeit, selektive
Aufmerksamkeit, verbales und figurales Gedächtnis sowie Wortflüssigkeit. Der Test (mittlere
Durchführungsdauer: 25 Minuten) wurde an 244 Probanden ohne neurologische oder
2
Neurologische Universitätsklinik Bochum-Langendreer
(Direktor: Prof. Dr. U. Schlegel)
psychiatrische Erkrankung in vier Altersgruppen normiert (Altersspanne 16-75 Jahre).
Zweiundvierzig Probanden der Normstichprobe wurden zur Ermittelung von Reliabilität und
Übungseffekten nach durchschnittlich 8 Wochen (Spanne: 6 - 10 Wochen) erneut getestet. Mit
einer Ausnahme zeigten sich in den Untertests mittelstarke Retest-Reliabilitäten zwischen r12 =
0.5 und r12 = 0.7 (2-back-Test: r12=0.37). Zur Konstruktvalidierung wurde NeuroCogFX parallel
zu einer umfassenden neuropsychologischen Testbatterie an einem Kollektiv von 40 gesunden
Korrespondenz an:
Probanden sowie an 42 Patienten mit chronischen Epilepsien durchgeführt. Dabei zeigte sich,
Dr. Christian Hoppe
dass der Computertest die Funktionsbereiche Kurzzeitgedächtnis, Reaktionsgeschwindigkeit,
Universitätsklinik für Epileptologie
Gedächtnis und Wortflüssigkeit valide erfasst. NeuroCogFX ist ein ökonomisches, hinreichend
- Neuropsychologie -
reliables und valides Messinstrument zur Verlaufskontrolle in der Einzelfalldiagnostik sowie in
Sigmund-Freud-Str. 25
Gruppenstudien, das immer dann eingesetzt werden kann, wenn eine umfassende
53105 Bonn
neuropsychologische Testdiagnostik nicht durchführbar ist.
Tel.: 0228 / 287-6172
Fax: 0228 / 287-6294
E-mail: [email protected]
Fließbach, K.*, Hoppe, C.*, Schlegel, U., Elger, C.E., Helmstaedter, C. (2006). NeuroCog FX - eine computergestützte neuropsychologische
Testbatterie für Verlaufsuntersuchungen bei neurologischen Erkrankungen. Fortschritte Neurologie Psychiatrie, 74, 643-650.
-2-
Fliessbach & Hoppe et al.
Fliessbach & Hoppe et al.
NeuroCogFX – a computer-based neuropsychological assessment battery for the follow-up
Einleitung
examination of neurological patients
Zahlreiche Therapien neurologischer Erkrankungen haben Auswirkungen auf die kognitive
Abstract
Leistungsfähigkeit. Dabei sind positive Auswirkungen bei einer erfolgreichen Behandlung der
Many neurological therapeutic trials require a longitudinal assessment of cognitive functions. An
Zielsymptomatik oder negative Auswirkungen in Form unerwünschter Nebenwirkungen möglich.
ideal instrument for that purpose should be in accordance to the criteria of classical testing theory
Zum Beispiel führt die erfolgreiche Behandlung eines Hirntumors häufig zu einer Besserung von
and, furthermore, it should be repeatable and economic in administration and interpretation. We
tumorbedingten kognitiven Defiziten; andererseits gehen Operation, Radiatio und Chemotherapie
developed NeuroCogFX, a computerized assessment battery, according to these criteria.
jedoch mit einem Risiko für teils erhebliche kognitive Langzeitfolgen einher [1]. Auch bei der
NeuroCogFX comprises subtests for short term memory, working memory, psychomotor speed,
Epilepsiebehandlung kann effiziente therapeutische Anfallkontrolle zu einer verbesserten
selective attention, verbal and figural memory and verbal fluency (mean duration: 25 minutes).
kognitiven Leistungsfähigkeit beitragen; andererseits sind kognitive Beeinträchtigungen typische
Age-related normative data was obtained from 244 subjects without history of neurological or
Komplikationen der medikamentösen Epilepsietherapie, und auch epilepsiechirurgische Eingriffe
psychiatric disease (age range 16-75 years). Forty-two subjects were re-tested after an average of
können sich unter Umständen kognitiv ungünstig auswirken [2]. Die Erhaltung oder
8 weeks (range: 6 - 10 weeks) in order to assess retest reliability and training effects. Retest-
Verbesserung der kognitiven Leistungsfähigkeit durch eine neurologische Therapie ist bei
reliabilities were middle-sized in all but one subtest, ranging from r12= 0.5 to r12=0.7 (2-back
zahlreichen weiteren neurologischen Krankheitsbildern von Bedeutung, so bei demenziellen
Test: r12=0.37). For construct validation NeuroCogFX was administered in addition to a
Erkrankungen [3], Multipler Sklerose [4], Morbus Parkinson [5] und anderen Störungen.
comprehensive neuropsychological assessment battery in a group of 40 healthy subjects and in 42
patients with chronic epilepsy. The test allows a valid assessment of short-term memory, reaction
In vielen Therapiestudien wird die kognitive Leistungsfähigkeit bisher gar nicht oder nur
speed, memory and verbal fluency. NeuroCogFX is an economic, sufficiently reliable and valid
unzureichend mit unspezifischen oder wenig sensitiven Verfahren wie der Mini Mental Status
instrument for the neuropsychological follow-up examination in single patients and study groups
Examination erfasst [6]. Ein wesentlicher Grund hierfür dürfte in dem großen zeitlichen und
which can be administered if a comprehensive neuropsychological assessment is unavailable.
personellen Aufwand liegen, den eine ausführliche neuropsychologische Testdiagnostik erfordert.
Ferner werden für längsschnittliche Studien Testverfahren mit Parallelversionen benötigt, die im
deutschen Sprachraum für viele relevante neuropsychologische Funktionsbereiche nicht im
erforderlichen Umfange zur Verfügung stehen.
Man wird der gewachsenen Bedeutung neuropsychologischer Aspekte in der neurologischen
Therapie nur dann Rechnung tragen können, wenn es gelingt, Messverfahren zu entwickeln, die
die folgenden Kriterien erfüllen:
ƒ
Testgütekriterien: Objektivität, Reliabilität, Validität (klassische Testtheorie),
ƒ
Normierung: mögliche Verwendung als einzelfalldiagnostisches, abrechenbares klinisches
Diagnoseverfahren,
-3-
-4-
Fliessbach & Hoppe et al.
Fliessbach & Hoppe et al.
ƒ
ƒ
Einfachheit: Anwendung durch nichtakademisches Personal (z.B. medizinisch-technische
Der Test kann an jedem handelsüblichen Notebook oder Desktop-Computer durchgeführt werden
Assistenten oder Arzthelferinnen),
(Betriebssystem MS Windows 95 aufwärts). Die Reaktionen des Probanden werden
geringer Gesamtzeitaufwand: max. 30-40 Minuten für Durchführung, Auswertung und
ausschließlich über die Tastatur erfasst. Um auch Patienten mit Halbseitensymptomatik
Dokumentation.
untersuchen zu können, ist bei fast allen Untertests ausschließlich die Leertaste die Reaktionstaste
(Ausnahme Untertest Ziffernspanne: Zifferntasten). Der Untertest Wortflüssigkeit wurde
Unter den Gesichtspunkten der Durchführungsobjektivität sowie der automatischen Auswertung
anknüpfend an den Untertest 6 aus dem Leistungs-Prüfsystem [11] als Paper & Pencil-Test
und Dokumentation erscheinen computergestützte Verfahren besonders geeignet. Im
realisiert. Vor den einzelnen Untertests erscheinen knappe schriftliche Instruktionen auf dem
deutschsprachigen Raum hat sich als computergestütztes neuropsychologisches Testinstrument in
Bildschirm. Bei Verständnisschwierigkeiten gibt der Testleiter zusätzliche Erläuterungen
7
erster Linie die Testbatterie zur Aufmerksamkeitsprüfung (TAP) etabliert [ ]. Diese zielt auf eine
entsprechend den Vorgaben des Testmanuals.
differenzierte Erfassung verschiedener Aufmerksamkeits- und Arbeitsgedächtnisleistungen,
andere im Zusammenhang neurologischer Therapiestudien relevante funktionelle Teilbereiche
Normkollektiv
wie Sprach- und Gedächtnisleistungen deckt sie dagegen nicht ab.
Zur Normierung wurden 244 Probanden ohne neurologische oder psychiatrische Vorerkrankung
im Alter zwischen 16 und 75 Jahren untersucht. Der Anteil von Frauen an der Gesamtstichprobe
In der vorliegenden Arbeit stellen wir die Entwicklung, Normierung und Prüfung der
betrug 57.8 %. Als Schätzmaß für das bildungsabhängige Intelligenzniveau wurde der
Testgütekriterien für die computergestützte Testbatterie NeuroCogFX („neurocognitive effects“)
Mehrfachwahl-Wortschatztest (MWT-B) [12] durchgeführt. Der mittlere geschätzte IQ betrug im
vor. Vorläuferversionen dieser Testbatterie wurden bereits im Rahmen einer Therapiestudie bei
Gesamtkollektiv 115.4 (±15.3).
primär zerebralen Lymphomen [8] und bei Studien zu kognitiven Therapieauswirkungen in der
Epileptologie [9, 10] eingesetzt.
Normierung
Es wurden vier Altersgruppen mit folgenden Stichprobenumfängen gebildet: 16-29 Jahre (n=87),
Methoden
30-44 Jahre (n=57), 45-59 Jahre (n=46) und 60-75 Jahre (n=52). Durch eine
Flächentransformation wurde gewährleistet, dass die Standardwerte (SW) auch bei nicht
Computertestbatterie
normalverteilten Testwerten in vertrauter Weise Prozentrangwerten (PR) entsprechen [13]. Für
NeuroCogFX ist eine computergestützte neuropsychologische Testbatterie mit sechs Untertests,
jeden Rohwert (RW) wurden hierzu innerhalb der einzelnen Altersgruppen die Perzentile 1, 3,
die normalerweise in einer vorgegebenen Reihenfolge durchlaufen werden. Tabelle 1 gibt einen
10, 16, 20, 30, 40, 50, 60, 70, 80, 86, 90, 97 und 99 bestimmt; diesen Perzentilwerten wurden
Überblick über die eingesetzten Untertests, die mit ihnen erfassten neuropsychologischen
entsprechend der Normalverteilung SW zugewiesen (Mittelwert 100, Standardabweichung 10).
Funktionsbereiche, die jeweiligen Aufgabenstellungen sowie die jeweils erfassten und normierten
Schließlich erfolgte eine lineare Übersetzung des SW in einen Kategorienwert (KW; weit
Ergebnisparameter.
unterdurchschnittlich/SW ≤ 80: KW -2; unterdurchschnittlich/80 < SW ≤ 85: KW -1;
> Tabelle 1 bitte hier einfügen <
überdurchschnittlich/ SW > 120: KW +2). Auf diese Weise erhält man für jeden normierten
durchschnittlich 85 < SW ≤115: KW 0; überdurchschnittlich/115 < SW ≤ 120: KW +1; weit
Testparameter RW, PR, SW und KW.
-5-
-6-
Fliessbach & Hoppe et al.
Fliessbach & Hoppe et al.
Retest-Reliabilität und Übungseffekte
Normdaten von 235 Probanden ohne neurologische und psychiatrische Vorerkrankungen aus dem
Zur Bestimmung der Retest-Reliabiliäten (r12) wurden 44 Probanden der Normstichprobe
Jahre 2004, die wir im Rahmen einer Normierung der gesamten Testbatterie zur prächirurgischen
durchschnittlich 8 Wochen nach der ersten Untersuchung erneut untersucht (Spanne: 6 – 10
Epilepsiediagnostik erhoben haben (unveröffentlichte Daten).
Wochen). Die Retest-Reliabilität für die einzelnen Untertests wurde mittels der Produkt-MomentKorrelation zwischen den Rohwerten der ersten und der zweiten Untersuchung geschätzt. Als
> Tabelle 2 bitte hier einfügen <
Maß für den Übungseffekt bei wiederholter Messung wurde die mittlere Differenz (MD)
zwischen den Rohwerten der ersten und zweiten Messung ermittelt. Neunzehn Probanden wurden
Der Zusammenhang zwischen den Testparametern von NeuroCogFX und denen der übrigen
außerdem zwei weitere Male im Abstand von jeweils circa 8 Wochen untersucht, um das Ausmaß
Testverfahren wurde auf verschiedene Weise analysiert:
von Übungseffekten bei mehr als zweimaliger Testung zu bestimmen.
1. Interkorrelationen zwischen den einzelnen Testparametern: Die Gruppe der Probanden ohne
neurologische Vorerkrankungen und die Gruppe der Patienten wurden getrennt analysiert, um
Individuelle Beurteilung von Verläufen
artifiziell hohe Korrelationen durch eine inhomogene Stichprobe zu vermeiden. Berichtet
Aus den Retest-Reliabilitäten und der mittleren Differenz MD zwischen erster und zweiter
werden die Interkorrelationen zwischen den Rohwerten, um einen Vergleich mit der Retest-
Messung wurden für jeden Ergebnisparameter so genannte kritische Differenzen ∆krit berechnet
Reliabilität zu ermöglichen.
[13]. Diese geben unter Berücksichtigung der Messgenauigkeit sowie der durchschnittlichen
2. Faktorenanalyse aller Testparameter: Um eine ausreichende Stichprobengröße und genügend
Übungseffekte an, wie groß bei einem Individuum die Leistungsdifferenz zwischen einer ersten
Varianz zu erzielen, wurden für die Faktorenanalyse Normalprobanden und Patienten
und einer zweiten Messung sein muss, damit diese als signifikante Verschlechterung oder
zusammengefasst. Es wurde eine Hauptkomponentenanalyse (Abbruchkriterium: Eigenwerte
Verbesserung beurteilt werden kann. Die kritischen Differenzen wurden berechnet zu ∆krit = SED
< 1) mit anschließender VARIMAX-Rotation über die alterskorrigierten Standardwerte
* (±zα) = SED * (±1.64) für α=.10 (90%-Konfidenzintervall), mit dem Standardfehler der
durchgeführt.
1/2
Differenzen SED = 2
3. Berechnung von Sensitivität und Spezifität einzelner Untertests: Für die kognitiven Domänen
1/2
*SE und dem Standardmessfehler SE = [1-r12] .
Verbalgedächtnis, Figuralgedächtnis, Kurzzeitgedächtnis und Wortflüssigkeit gab es analoge
Konstruktvalidität
Testverfahren in beiden verwendeten Batterien. Hier legten wir die Annahme zugrunde, dass
Bei der Konstruktvalidierung wird geprüft, inwieweit ein Test zu ähnlichen Ergebnissen gelangt
die konventionellen, etablierten Testverfahren die Diagnose eines pathologischen Befundes
wie andere etablierte Testverfahren, die dasselbe theoretische Konstrukt erfassen. Dazu führten
sichern. Als pathologischer Befund in einer funktionellen Domäne galt das Vorliegen eines
wir den Test an 40 Probanden der Normstichprobe und 42 stationären Patienten der
weit unterdurchschnittlichen Testwertes (entsprechend KW = -2) in wenigstens einem
Universitätsklinik für Epileptologie in Bonn in geringem zeitlichen Abstand (Spanne: 1-10 Tage)
Testparameter dieser Domäne (z.B. Verbalgedächtnisdefizit bei mindestens einem weit
zu einer umfangreichen Testbatterie mit etablierten neuropsychologischen Verfahren durch. Die
unterdurchschnittlichen Wert in einem der vier Parameter des verbalen Gedächtnistests). Die
Patientengruppe umfasste neben Patienten mit chronischen Epilepsien (n=34) acht Patienten mit
Sensitivität und die Spezifität der entsprechenden NeuroCogFX-Untertests wurden in Bezug
anderen Anfallsleiden (dissoziative Anfälle, Synkopen). Die ausführliche Testbatterie umfasste
auf die zugehörigen konventionellen Tests berechnet, wobei bei den NeuroCogFX-Tests
die in Tabelle 2 aufgeführten Testverfahren (genaue Beschreibung dieser Verfahren in [ , ]). Die
einmal ein strenges Kriterium (SW < 80; KW = -2) und einmal ein weniger strenges
Rohwerte dieser Tests wurden analog dem Vorgehen bei der Normierung von NeuroCogFX in
Kriterium (SW < 85; KW ≤ -1) für die computergestützte Diagnose eines pathologischen
altersabhängige Prozentrang-, Standard- und Kategoriewerte überführt. Wir verwendeten hierzu
Befundes zugrunde gelegt wurde.
2 8
-7-
-8-
Fliessbach & Hoppe et al.
Fliessbach & Hoppe et al.
Bis auf den Untertest 2-back-Test (r12 = 0.37) zeigen sich durchgehend Retest-Reliabilitäten
Ergebnisse
zwischen r12 = 0.50 und r12 = 0.70. Beim Vergleich zwischen erster und zweiter Messung für 44
Durchführung
Probanden zeigen sich signifikante Mittelwertsunterschiede im Sinne von
Der Test konnte problemlos von nicht speziell geschultem Personal (Medizindoktoranden) bei
Leistungsverbesserungen in allen Untertests bis auf die Untertests 2-back-Test und Reaktionszeit.
Probanden und Patienten angewendet, ausgewertet und dokumentiert werden. Die
Auch die Mittelwertsunterschiede zwischen Erst- und Wiederholungstestung sind in Tabelle 3
durchschnittliche Durchführungsdauer betrug 25 Minuten (Spanne 18 bis 39 Minuten). Beim
wiedergegeben. Zwischen der zweiten und dritten Messung finden sich in der kleineren
Untertest 2-Back-Test traten bei mehreren Probanden Instruktionsverständnisschwierigkeiten auf;
Stichprobe der insgesamt vier Mal getesteten Patienten (n=19) signifikante
bei drei Probanden konnte dieser Test letztlich nicht durchgeführt werden. Ansonsten wurde die
Mittelswertsunterschiede nur noch für die Untertests Reaktionszeit und Wahlreaktion 1 (nicht
Testbatterie von allen Probanden vollständig bearbeitet.
gezeigt). Zwischen dritter und vierter Messung finden sich in keinem Untertest signifikante
Mittelwertsunterschiede. Tabelle 3 zeigt schließlich die kritischen Differenzen ∆krit für
Altersbezogene Normierung
signifikante Leistungsveränderungen im individuellen Verlauf, die sich aus den Reliabilitäten
Die Analyse der Testwertverteilungen bei den gesunden Probanden zeigte für einzelne
und den Mittelwertsunterschieden ergeben (p<.10, 90%-Konfidenzintervall).
Testparameter schiefe Verteilungen, die auf Deckeneffekte schließen lassen. Insbesondere für die
Differenzen zwischen richtigen Antworten und falschen Alarmen in den Untertests 2-back-Test,
Validität, Sensitivität und Spezifität
Wahlreaktion 1 und Wahlreaktion 2 war dies zu erwarten. In geringerem Maße zeigten sich auch
Tabelle 4 zeigt die Korrelationen zwischen sich entsprechenden Untertests von NeuroCogFX und
Deckeneffekte für den Untertest Verbales Gedächtnis.
der konventionellen Testbatterie.
Die Normen wurden getrennt für die oben genannten vier Altersgruppen berechnet (16-29, 30-44,
45-59, 60-75 Jahre). Die Normtabellen sind in die aktuelle Version von NeuroCogFX integriert,
> Tabelle 4 bitte hier einfügen <
sodass eine automatische Zuweisung eines altersbezogenen PR und SW zu einem Testrohwert
erfolgt. Auf eine Wiedergabe der Normtabellen wird daher hier verzichtet. NeuroCogFX erlaubt
Insgesamt zeigen sich hierbei meist mittelstarke (r = 0.30 bis r = 0.62) signifikante Korrelationen.
zusätzlich auch die grafische Darstellung eines individuellen altersbezogen normierten
Eine Ausnahme stellt der Untertest Verbales Gedächtnis in der Patientengruppe dar, der nur
Leistungsprofils (vgl. Abbildung 1).
schwach mit der Lernleistung im Verbalen Lern- und Merkfähigkeitstest (VLMT, Durchgänge 15) korreliert ist (r = 0.36), und mit den übrigen Parametern keine signifikanten Korrelationen
> Abbildung 1 bitte hier einfügen <
aufweist. Der 2-back-Test zeigt innerhalb der Patientengruppe eine Reihe von signifikanten
Korrelationen (Trail Making Test [TMT], Labyrinth-Test, Corsi-Block-Test, Diagnosticum
Retest-Reliabilität, Übungseffekte und kritische Differenzen
cerebraler Schädigungen [DCS], Wortflüssigkeit), während sich in der Probandengruppe keine
Die Retest-Reliabilitäten r12 der Untertests sind in Tabelle 3 aufgeführt.
systematischen Zusammenhänge ergeben (nicht gezeigt); letzteres ist sehr wahrscheinlich auf die
infolge des Deckeneffekts fehlende Varianz in der 2-back-Testleistung bei den gesunden
> Tabelle 3 bitte hier einfügen <
Probanden zurückzuführen. Die Untertests Reaktionszeit und Wahlreaktion 1 und 2 korrelieren
erwartungsgemäß hoch miteinander (r = 0.6 bis r = 0.75) sowie mit einer Reihe von
geschwindigkeitsabhängigen Aufgaben (TMT, Labyrinth-Test, Wortflüssigkeit). Der Untertest
-9-
- 10 -
Fliessbach & Hoppe et al.
Fliessbach & Hoppe et al.
Wahlreaktion 2 weist dabei in der Patientengruppe deutlich höhere Korrelationen mit Tests der
Befund: KW ≤ -1) werden für alle Tests außer dem Untertest Ziffernspanne Verbesserungen der
exekutiven Funktionen (TMT, Labyrinth) und der Wortflüssigkeit auf als der Untertest
Sensitivität erzielt, die den Verlust an Spezifität deutlich übertreffen. Die höchste Sensitivität
Wahlreaktion 1 (nicht gezeigt).
erzielt der Untertest Verbales Gedächtnis für die Diagnose eines Verbalgedächtnisdefizits (0.73
bei einer Spezifität von 0.87) und die Diagnose eines allgemeinen Gedächtnisdefizits (0.77 bei
Tabelle 5 zeigt die Ladungsmatrix der Faktorenanalyse über sämtliche Testparameter.
einer Spezifität von 0.94) unter Zusammenfassung der Leistungen in den Untertests Verbales und
Figurales Gedächtnis.
> Tabelle 5 bitte hier einfügen <
Diskussion
Es wurden sechs Faktoren mit einem Eigenwert >1 extrahiert. Der erste Faktor fasst den
Untertest Figurales Gedächtnis mit Parametern des VLMT (Zahl der Wörter bei verzögertem
Wir stellen mit NeuroCogFX eine computergestützte neuropsychologische Testbatterie vor, die
freien Abruf und Wiedererkennen) und des DCS (Gesamtlernleistung und Maximallernleistung)
speziell für längsschnittliche Verlaufsuntersuchungen im Rahmen von Therapiestudien sowie für
zusammen und wird daher als allgemeiner Gedächtnisfaktor interpretiert. Der zweite Faktor fasst
die individuelle Verlaufsdiagnostik bei neurologischen Erkrankungen entwickelt wurde. Die
den Untertest Ziffernspanne mit den Tests Zahlennachsprechen vorwärts und rückwärts sowie
Daten aus den hier vorgestellten Normierungsstudien verweisen auf folgende Vorteile des Tests:
dem Untertest Interferenzvermeidung aus dem cerebralen Insuffizienztest (c.I.T.) zusammen und
ƒ
unproblematische Durchführung durch nicht speziell ausgebildetes Personal,
wird als Kurzzeitgedächtnisfaktor interpretiert. Der Faktor 3 enthält die Untertests Verbales
ƒ
gute Durchführbarkeit und hohe Akzeptanz seitens der Probanden,
Gedächtnis und Wortflüssigkeit sowie die Tests phonematische und semantische Wortflüssigkeit
ƒ
kurze durchschnittliche Testdauer (25 Minuten),
und die Lernleistung des VLMT (Durchgänge 1-5). Wir interpretieren ihn als verbalen
ƒ
altersbezogene, in das Programm integrierte Normierung für einen breiten Altersbereich,
Informationsverarbeitungsfaktor. Faktor 4 bündelt die Untertests Reaktionszeit sowie
ƒ
kritische Differenzen zur Beurteilung individueller Leistungsveränderungen verfügbar,
Wahlreaktionen 1 und 2 und wird als Reaktionsschnelligkeit interpretiert. Faktor 5 enthält keinen
ƒ
weitgehend sinnvolle Zuordnung der Untertests zu neuropsychologischen Funktionsbereichen
Untertest aus NeuroCogFX; er bündelt die Tests TMT (Formen A und B) und Labyrinth-Test und
wird als Faktor für exekutive Funktionen interpretiert. Faktor 6 enthält den Untertest 2-back-Test
und den Corsi-Block-Test; er wird als Arbeitsgedächtnisfaktor interpretiert.
(Ausnahme: Verbales Gedächtnis),
ƒ
zufriedenstellende bis hohe Sensitivität und Spezifität für die Individualdiagnostik
neuropsychologischer Teilleistungsstörungen.
Tabelle 6 zeigt die Sensitivität und Spezifität der Untertests Ziffernspanne, Verbales und
Der Untertest Verbales Gedächtnis zeigt insbesondere im Patientenkollektiv nur eine niedrige
Figurales Gedächtnis (sowie Gedächtnis insgesamt) und Wortflüssigkeit.
Interkorrelation mit Parametern des VLMT, der die Langzeitenkodierung verbalen Materials
erfasst. Auch in der Faktorenanalyse lädt dieser Untertest nicht gesondert auf einem
> Tabelle 6 bitte hier einfügen <
Verbalgedächtnisfaktor, sondern zusammen mit den Tests zur Wortflüssigkeit und der
Lernleistung auf einem allgemeineren Faktor, den wir als verbale Informationsverarbeitung
Bei Anwendung des strengen Kriteriums für die Untertests von NeuroCogFX (pathologischer
interpretiert haben. Dem steht positiv der Befund gegenüber, dass dieser Untertest mit hoher
Befund: KW = -2) zeigt sich für alle Untertests eine hohe Sensitivität (≥0.89) bei mittlerer
Sensitivität und Spezifität Individuen identifizieren kann, die ein auf der Basis des VLMT
Spezifität (0.44 – 0.66). Legt man das weniger strenge Kriterium zugrunde (pathologischer
diagnostiziertes Verbalgedächtnisdefizit aufweisen. Fasst man darüber hinaus die Untertests
- 11 -
- 12 -
Fliessbach & Hoppe et al.
Fliessbach & Hoppe et al.
Verbales und Figurales Gedächtnis zusammen, so werden mit hoher Spezifität (0.94) immerhin
Übungseffekte sind ein grundsätzliches Problem bei neuropsychologischen
77% der Personen, die nach DCS oder VLMT ein Gedächtnisdefizit aufweisen, identifiziert.
Verlaufsuntersuchungen und treten auch bei etablierten Testverfahren auf. Durch die Berechnung
Insofern erscheint die Schlussfolgerung, dass die beiden Untertests Verbales und Figurales
von kritischen Differenzen können Übungseffekte bei wiederholter Durchführung von
Gedächtnis Gedächtnisdefizite in hohem Maße richtig diagnostizieren, gerechtfertigt. Offen ist,
NeuroCogFX bei der einzelfalldiagnostischen Interpretation von Leistungsveränderungen im
inwieweit die beiden Untertests zusätzlich spezifische Rückschlüsse auf materialabhängige
Verlauf berücksichtigt werden (vgl. Tabelle 3). Über die zweite Messwiederholung hinaus
Gedächtnisdefizite erlauben.
zeigten sich Übungseffekte nur noch in sehr geringem Maße. Dennoch ist nicht auszuschließen,
dass bei häufigeren Wiederholungen in Einzelfällen weitere Übungseffekte auftreten. Im
Keine externe Validierung erfahren die Reaktionszeittests, die in der Faktorenanalyse einen
Studienkontext werden unspezifische Übungseffekte ohnehin durch eine geeignete
eigenen Faktor bilden und mit keinem der konventionellen Tests korrelieren. Allerdings kommt
Kontrollbedingung ausgeschlossen.
Reaktionszeitmessungen in hohem Maße Augenscheinvalidität zu.
Der 2-back-Test weist - vermutlich aufgrund von Deckeneffekten - die niedrigste Reliabilität auf
Den positiven Aspekten stehen folgende Einschränkungen gegenüber:
und korreliert nicht gut mit anderen Maßen, die Arbeitsgedächtnis und exekutive
ƒ
nur mittelhohe Retest-Reliabilitäten,
Handlungsteuerung erfordern. Zudem führte er bei Probanden und Patienten am häufigsten zu
ƒ
signifikante Übungseffekte in den meisten Untertests,
Instruktionsverständnisschwierigkeiten. Wir werden diesen Test daher in zukünftigen
ƒ
niedrige Reliabilität und keine externe Validierung für 2-back-Test,
Programmversionen nicht mehr verwenden. Da kein Untertest komplexe exekutive Funktionen
komplexere exekutive Leistungen (z.B. TMT, Labyrinthe) werden von NeuroCogFX nicht
erfasst, empfehlen wir, NeuroCogFX durch einen gut eingeführten, frei verfügbaren und
erfasst,
ökonomischen Paper & Pencil-Test (z.B. TMT Formen A und B [14]) zu ergänzen.
ƒ
ƒ
Untertest Wortflüssigkeit bei Patienten mit handmotorischen Beeinträchtigungen nicht in
schriftlicher Form durchführbar.
Für den Paper & Pencil-Untertest Wortflüssigkeit, dessen Gestaltung sich an dem
Leistungsprüfsystem von Horn orientierte [11], wird derzeit eine Version für die mündliche
Im Hinblick auf die nur mittleren Retest-Reliabilitäten ist insbesondere auf die niedrige Varianz
Durchführung in das Computerprogramm integriert, die auch eine Untersuchung handmotorisch
in einzelnen Testparametern (Deckeneffekte) zu verweisen, die höheren Korrelationen
beeinträchtigter, schreibunfähiger Patienten ermöglicht.
entgegensteht; möglicherweise wäre die Reliabilität auf der Basis von Patientenstudien mit
höherer Leistungsvarianz höher einzuschätzen. Ferner dürfte sich das relativ lange Retest-
Zusammenfassend ist NeuroCogFX ein ökonomisches Messinstrument zur Verlaufsuntersuchung
Intervall (im Durchschnitt 8 Wochen) ungünstig ausgewirkt haben. Schließlich sind
von kognitiven Therapieeffekten sowohl im Rahmen individueller Behandlungen wie auch bei
Einschränkungen der Reliabilität bei computergestützten Verfahren generell bekannt.
Therapiestudien, wenn eine ausführliche neuropsychologische Testdiagnostik durch entsprechend
Beispielsweise weisen die Untertests der gut etablierten TAP ebenfalls nur mittelstarke Retest-
geschultes Fachpersonal nicht realisierbar ist. Nach unserer Einschätzung erfüllt es die eingangs
7
Reliabilitäten auf [ ]. Unter Berücksichtigung der nur mittleren Reliabilitäten fallen die
genannten psychometrischen und pragmatischen Kriterien hinreichend. Im Unterschied zu bloßen
Korrelationen der Subtests von NeuroCogFX mit herkömmlichen Testverfahren im Sinne der
Screening-Tests erlaubt das Instrument eine differentielle Erfassung verschiedener kognitiver
Konstruktvalidität größtenteils zufriedenstellend aus.
Funktionen (Kurzzeitgedächtnis, Gedächtnis, Reaktionsgeschwindigkeit, Wortflüssigkeit), ohne
den Anspruch zu erheben, dabei die hohe Differenzierungsfähigkeit ausführlicher Testbatterien
- 13 -
- 14 -
Fliessbach & Hoppe et al.
Fliessbach & Hoppe et al.
zu erreichen. Einschränkungen bestehen bei der Erfassung von exekutiven Dysfunktionen. Die
Tabellen und Abbildungen
Testbatterie wird aktuell im Rahmen des nationalen Verbundnetzes „Gliome“ der Deutschen
Krebshilfe multizentrisch eingesetzt.
Tabelle 1: NeuroCogFX: Untertests.
Tabelle 2: Konstruktvalidierung: konventionelle Testverfahren.
Danksagung
Anm. Nähere Angaben zu allen Tests in [2, 8].
Wir bedanken uns bei Nina Stephanie Lehnen, Alexander Höinghaus, Frederike Adler und
Johanna Michel, die die dieser Arbeit zugrunde liegenden Daten im Rahmen ihrer medizinischen
Tabelle 3: Retest-Reliabilitäten, Übungseffekte und kritische Differenzen.
Doktorarbeiten erhoben haben.
r12 = Retest-Reliabilität, M1 = Mittelwert Erstmessung, M2 = Mittelwert
Wiederholungsmessung, SD = Standardabweichung, p = Signifikanz
(Mittelwertsvergleich M1 und M2), ∆krit = kritische Differenzen (Punktzahl- bzw.
Reaktionszeitunterschied, bei der ein Testergebnis als signifikante Verschlechterung /
Verbesserung zwischen Erst- und Wiederholungsmessung gelten kann, p<.10, 90%Konfidenzintervall).
Tabelle 4: Korrelationen zwischen NeuroCogFX-Untertests und konventionellen Tests
(Auswahl).
Tabelle 5: Faktorisierung von NeuroCogFX und konventioneller Testbatterie:
Ladungsmatrix.
Anm.: Nur Ladungen >0.5 (Testparameter mit Ladungen <.05 in Klammern).
Tabelle 6: Sensitivität und Spezifität relativ zu konventionellen Tests.
Abbildung 1: Graphische Darstellung eines individuellen altersbezogen normierten
Leistungsprofils.
- 15 -
- 16 -
Fliessbach & Hoppe et al.
Fliessbach & Hoppe et al.
Tabelle 1: NeuroCogFX: Untertests.
Fortsetzung Tabelle 1: NeuroCogFX: Untertests.
Untertest
Funktion
Aufgabe
Ergebnismaße
normiert
Ziffernspanne
verbales
Kurzzeitgedächtnis
Sukzessive Darbietung einer
Ziffernfolge. Unmittelbare
Reproduktion (Zifferntasten).
Schwierigkeit steigt mit jeder
richtigen Antwort.
ƒ
Punkte
2-back-Test
Arbeitsgedächtnis
ƒ
Kontinuierliche Darbietung einzelner ƒ
Ziffern. Reagieren, wenn die gezeigte
Ziffer mit der vorletzten Ziffer
ƒ
identisch ist (Leertaste).
Punkte: Anzahl korrekter Wiedergaben;
Ziffernspanne: maximale Länge korrekt
wiedergegebener Ziffernfolgen
Median der Reaktionszeiten bei korrekten
Reaktionen
Reagieren bei blauem Kreis
(Leertaste).
ƒ
Median der Reaktionszeiten (RZ)
RZ
Wahlreaktion 1
selektive
Aufmerksamkeit
Reagieren bei blauem Kreis
(Leertaste), gelbe Kreise ignorieren
(Go/No go).
ƒ
Median der Reaktionszeiten (RZ)
RZ
ƒ
Anzahl richtiger Reaktionen
ƒ
Anzahl von Fehlreaktionen
Umgekehrt: Reagieren bei gelbem
Kreis (Leertaste), blaue Kreise
ignorieren.
ƒ
Median der Reaktionszeiten (RZ)
ƒ
Anzahl richtiger Reaktionen
ƒ
Anzahl von Fehlreaktionen
- 17 -
Anzahl Treffer für jeden Test (Hits)
ƒ
Anzahl Fehlreaktionen für jeden Test
(false alarms, FA),
ƒ
mittlere Reaktionszeit für alle Hits
(Median)
ƒ
mittlere Reaktionszeit für alle FA
(Median)
figurales Lernen
und Wiedererkennen
Durchführung analog zum Untertest
Verbales Gedächtnis. "Schachbrett"Muster: 4 hervorgehobene aus 3x3
Feldern.
ƒ
analog Untertest Verbales Gedächtnis
Hits - FA
Wortflüssigkeit phonematischMöglichst viele Wörter mit
(Paper & Pencil) literale Wortflüssig- Anfangsbuchstaben "P" aufschreiben
keit
ƒ
Punkte: Anzahl richtiger Wörter
Punkte
Figurales
Gedächtnis
"alertness",
Reaktionsbereitschaft
Interferenzanfälligkeit, kognitive
Umstellfähigkeit
ƒ
Punkte: Anzahl richtiger abzüglich falscher Punkte
Reaktionen
Reaktionszeit
Wahlreaktion 2
verbales Lernen und Wortlistenlernen: 3 Lerndurchgänge,
Wiedererkennen
12 Wörter. Ja/Nein-Rekognitionstest
(Items:Distraktoren 1:2) nach jedem
Lerndurchgang sowie verzögert nach
dem Untertest Figurales Gedächtnis.
Ja = Leertaste (Reaktionsintervall: 2
Sekunden).
Verbales
Gedächtnis
RZ
- 18 -
Hits - FA
Fliessbach & Hoppe et al.
Fliessbach & Hoppe et al.
Tabelle 2: Konstruktvalidierung: konventionelle Testverfahren.
Tabelle 3: Retest-Reliabilitäten, Übungseffekte und kritische Differenzen.
Funktion
Test
Untertests
Ergebnisparameter
Aufmerksamkeit und exekutive
Funktionen
Test für cerebrale Insuffizienz
(c.I.T.)
Symbole zählen
Lösungsdauer
r12
M1 (SD)
M2 (SD)
M2-M1
p
∆krit
Trail Making Test (TMT)
Form A und B
Lösungsdauer
Zahlenspanne (Punkte)
0.68
7.4 (2.2)
8.2 (2.1)
0.8
<0.01
-3 / +4
Lösungsdauer
2-back-Test (Punkte)
0.35
8.8 (2.3)
9.2 (1.4)
0.41
n.s.
-4 / +4
Hamburg WechslerIntelligenztest für Erwachsene
(HAWIE-III)
Zahlen nachsprechen vorwärts
Spanne
Reaktionszeit (Median-RZ, ms)
0.50
262 (54)
261 (48)
-1
n.s
+80 / -80
Zahlen nachsprechen rückwärts
Spanne
Wahlreaktion 1 (Median-RZ, ms)
0.53
362 (58)
342 (57)
-20
<0.05
+78 / -97
Wechsler Memory Scale
(WMS-III)
Corsi-Block-Test vorwärts
Blockspanne
Wahlreaktion 2 (Median-RZ, ms)
0.60
373 (49)
349 (49)
-24
<0.01
+68 / -110
- 4 / +10
AB-Interferenztest
Labyrinthtest (nach Chapuis)
Kurzzeitgedächtnis und
Arbeitsgedächtnis
Verbalgedächtnis
Verbaler Lern- und
Merkfähigkeitstest (VLMT)
NeuroCogFX
Summe richtige Wörter
Durchgänge 1-5 (Lernen),
richtige Wörter Dg. 7 (Gesamt),
Verlust von Dg. 5 zu Dg. 7
(Behalten), fehlerkorrigierte
Ja/Nein-Rekognitionsleistung
Figuralgedächtnis
Diagnosticum für
Cerebralschädigung - revidiert
(DCS)
Wortflüssigkeit phonematischliteral
Leistungsprüfsystem
Untertest 6: Wortflüssigkeit
(schriftlich)
Anzahl richtiger Wörter
Wortflüssigkeit semantisch
Demenz-Test nach Kessler
Supermarktaufgabe (schriftlich)
Anzahl richtiger Wörter
Summe gelernter Muster
Durchgänge 1 bis 5 (Lernen),
richtige Muster Dg. 5 (Gesamt)
Gedächtnis/verbal (Punkte)
0.66
39.4 (4.9)
42.6 (4.4)
3.1
< 0.001
Gedächtnis/figural (Punkte)
0.58
10.2 (8.4)
12.8 (7.7)
2.6
<0.05
-9 / +17
Wortflüssigkeit (Punkte)
0.69
14.2 (3.1)
16.0 (3.3)
1.8
< 0.001
-3 / + 6
r12 = Retest-Reliabilität, M1 = Mittelwert Erstmessung, M2 = Mittelwert Wiederholungsmessung, SD = Standardabweichung, p =
Signifikanz (Mittelwertsvergleich M1 und M2), ∆krit = kritische Differenzen (Punktzahl- bzw. Reaktionszeitunterschied, bei der ein
Testergebnis als signifikante Verschlechterung / Verbesserung zwischen Erst- und Wiederholungsmessung gelten kann, p<.10, 90%Konfidenzintervall).
Anm. Nähere Angaben zu allen Tests in [2, 8].
- 19 -
- 20 -
Fliessbach & Hoppe et al.
Tabelle 4: Korrelationen zwischen NeuroCogFX-Untertests und konventionellen Tests (Auswahl).
Fliessbach & Hoppe et al.
Tabelle 5: Faktorisierung von NeuroCogFX und konventioneller Testbatterie:
Ladungsmatrix.
NeuroCogFX
Ziffernspanne
Verbales Gedächtnis
Figurales Gedächtnis
Wortflüssigkeit
Konventionelle Tests
Probanden
Patienten
Zahlennachsprechen (vorwärts)
0.30*
0.61**
Zahlennachsprechen (rückwärts)
0.36*
0.62**
VLMT (Durchgänge 1-5)
0.47**
0.36*
VLMT (Durchgang 7)
0.62**
0.10
VLMT (Verlust von Dg. 5 nach Dg. 7)
0.55**
-0.12
NeuroCogFX
VLMT (Rekognition)
0.49**
0.20
Figurales Gedächtnis
DCS (Durchgänge 1-5)
0.47**
0.62**
Ziffernspanne
DCS (letzter Durchgang)
0.38**
0.61**
phonematische Wortflüssigkeit
0.60**
0.49**
semantische Wortflüssigkeit
0.45**
0.34*
* p<.05, ** p<.01
Faktoren
Test
1
2
3
4
5
6
0.69
0.68
Verbales Gedächtnis
0.70
Wortflüssigkeit
0.65
Reaktionszeit
0.75
Wahlreaktion 1
0.79
Wahlreaktion 2
0.83
2-back-Test
0.55
Konventionelle Testbatterie
- 21 -
VLMT Durchgang 7
0.75
VLMT Rekognition
0.76
DCS Durchgang 1-5
0.81
DCS letzter Durchgang
0.73
Zahlennachsprechen vorwärts
0.75
Zahlennachsprechen rückwärts
0.83
c.I.T Interferenzvermeidung
0.56
Wortflüssigkeit phonematisch
0.60
Wortflüssigkeit semantisch
0.56
VLMT Durchgang 1-5
0.65
TMT Form A
0.70
TMT Form B
0.53
Labyrinth-Test
0.72
Corsi-Block-Test
0.84
(c.I.T Symbolezählen)
(VLMT Verlust von 5 nach 7)
Anm.: Nur Ladungen >0.5 (Testparameter mit Ladungen <.05 in Klammern).
- 22 -
Fliessbach & Hoppe et al.
Fliessbach & Hoppe et al.
Literatur
Tabelle 6: Sensitivität und Spezifität relativ zu konventionellen Tests.
1
Strenges Kriterium
(KW = -2)
weniger strenges Kriterium
(KW ≤ -1)
NeuroCogFX
Sensitivität
Spezifität
Sensitivität
Spezifität
Ziffernspanne
0.45
0.92
0.52
0.81
Verbales Gedächtnis
0.73
0.87
0.73
0.87
Figurales Gedächtnis
0.48
0.98
0.58
0.94
Gedächtnis (insgesamt)
0.66
1.00
0.77
0.94
Wortflüssigkeit
0.44
0.94
0.50
0.92
Taphoorn MJ, Klein M. Cognitive deficits in adult patients with brain tumours. Lancet
Neurol 2004; 3: 159-168
2
Helmstaedter C, Kurthen M, Lux S, Johanson K, Quiske A, Schramm J, Elger CE.
Temporallappenepilepsie: Längsschnittliche klinische, neuropsychologische und
psychosoziale Entwicklung operativ und konservativ behandelter Patienten. Der Nervenarzt
2000; 71: 629-642
3
Sparks DL, Sabbagh MN, Connor DJ, Lopez J, Launer LJ, Browne P, Wasser D, JohnsonTraver S, Lochhead J, Ziolwolski C. Atorvastatin for the treatment of mild to moderate
Alzheimer disease: preliminary results. Arch Neurol 2005; 62: 753-757
4
KW = Kategoriewert.
Panitch H, Miller A, Paty D, Weinshenker B. Interferon beta-1b in secondary progressive
MS: results from a 3-year controlled study. Neurology 2004; 63: 1788-1795
5
Ravina B, Putt M, Siderowf A, Farrar JT, Gillespie M, Crawley A, Fernandez HH,
Trieschmann MM, Reichwein S, Simuni T. Donepezil for dementia in Parkinson's disease: a
randomised, double blind, placebo controlled, crossover study. J Neurol Neurosurg
Psychiatry 2005; 76: 934-939
6
Brown PD, Buckner JC, O'Fallon JR, Iturria NL, Brown CA, O'Neill BP, Scheithauer BW,
Dinapoli RP, Arusell RM, Curran WJ, Abrams R, Shaw EG. Effects of radiotherapy on
cognitive function in patients with low-grade glioma measured by the Folstein Mini Mental
State Examination. J Clin Oncol 2003; 21: 2519-2524
7
Zimmermann, P, Fimm, B. Testbatterie zur Aufmerksamkeitsprüfung (Version 1.7).
8
Fliessbach K, Helmstaedter C, Urbach H, Althaus A, Pels H, Linnebank M, Juergens A,
Würselen: Psytest, 2003
Glasmacher A, Schmidt-Wolf IG, Klockgether T, Schlegel U. Neuropsychological outcome
after chemotherapy for primary CNS lymphoma: a prospective study. Neurology 2005; 64:
1184-1188
9
Jünemann H, Helmstaedter C, Elger CE. Die Möglichkeiten des Einsatzes computerisierter
Gedächtnistests in der prächirurgischen Epilepsiediagnostik. In: Scheffner D (Hrsg.).
Epilepsie 91 (S. 449-452). Einhorn-Presse Verlag, Reinbeck, 1992
10 Helmstaedter C, Hoppe C, Elger CE. Memory alterations during acute high-intensity vagus
nerve stimulation. Epilepsy Res 2001; 47: 37-42
- 23 -
- 24 -
Fliessbach & Hoppe et al.
11 Horn W. Leistungsprüfsystem L-P-S. Göttingen: Hogrefe, 1983
12 Lehrl S, Merz J, Burkhard, et al. Mehrfachwahl-Wortschatz-Intelligenztest MWT-B.
Göttingen: Hogrefe, 1999
13 Krauth J. Testkonstruktion und Testtheorie. Weinheim: Psychologie Verlags Union, 1995
14 Reitan RM. Trail Making Test: Manual for Administration and Scoring. Tucson:
Neuropsychology Laboratory, 1992
- 25 -
Herunterladen