Fliessbach & Hoppe et al. NeuroCogFX – eine computergestützte neuropsychologische Testbatterie für Verlaufsuntersuchungen bei neurologischen Erkrankungen Zusammenfassung Dr. med. Klaus Fliessbach, Dipl.Psych.*1, Dr. rer.nat. Christian Hoppe, Dipl.Psych. Dipl.Theol.*1, Prof. Dr. med. Uwe Schlegel2, Prof. Dr. med. Christian E. Elger1, Prof. Dr. phil. Bei vielen neurologischen Therapiestudien ist eine längsschnittliche Erfassung der kognitiven Christoph Helmstaedter, Dipl.Psych.1 Leistungsfähigkeit erforderlich. Ein für diesen Zweck geeignetes Messinstrument sollte nicht nur den Gütekriterien der Testtheorie entsprechen, sondern zudem wiederholbar und ökonomisch in * K.F. und C.H. haben zu gleichen Teilen zu der Studie beigetragen Durchführung und Auswertung sein. Die von uns entwickelte computergestützte Testbatterie NeuroCogFX enthält Untertests für die neuropsychologische Leistungsmessung in den Bereichen 1 Klinik und Poliklinik für Epileptologie der Universität Bonn (Direktor: Prof. Dr. C. E. Elger) Kurzzeitgedächtnis, Arbeitsgedächtnis, psychomotorische Geschwindigkeit, selektive Aufmerksamkeit, verbales und figurales Gedächtnis sowie Wortflüssigkeit. Der Test (mittlere Durchführungsdauer: 25 Minuten) wurde an 244 Probanden ohne neurologische oder 2 Neurologische Universitätsklinik Bochum-Langendreer (Direktor: Prof. Dr. U. Schlegel) psychiatrische Erkrankung in vier Altersgruppen normiert (Altersspanne 16-75 Jahre). Zweiundvierzig Probanden der Normstichprobe wurden zur Ermittelung von Reliabilität und Übungseffekten nach durchschnittlich 8 Wochen (Spanne: 6 - 10 Wochen) erneut getestet. Mit einer Ausnahme zeigten sich in den Untertests mittelstarke Retest-Reliabilitäten zwischen r12 = 0.5 und r12 = 0.7 (2-back-Test: r12=0.37). Zur Konstruktvalidierung wurde NeuroCogFX parallel zu einer umfassenden neuropsychologischen Testbatterie an einem Kollektiv von 40 gesunden Korrespondenz an: Probanden sowie an 42 Patienten mit chronischen Epilepsien durchgeführt. Dabei zeigte sich, Dr. Christian Hoppe dass der Computertest die Funktionsbereiche Kurzzeitgedächtnis, Reaktionsgeschwindigkeit, Universitätsklinik für Epileptologie Gedächtnis und Wortflüssigkeit valide erfasst. NeuroCogFX ist ein ökonomisches, hinreichend - Neuropsychologie - reliables und valides Messinstrument zur Verlaufskontrolle in der Einzelfalldiagnostik sowie in Sigmund-Freud-Str. 25 Gruppenstudien, das immer dann eingesetzt werden kann, wenn eine umfassende 53105 Bonn neuropsychologische Testdiagnostik nicht durchführbar ist. Tel.: 0228 / 287-6172 Fax: 0228 / 287-6294 E-mail: [email protected] Fließbach, K.*, Hoppe, C.*, Schlegel, U., Elger, C.E., Helmstaedter, C. (2006). NeuroCog FX - eine computergestützte neuropsychologische Testbatterie für Verlaufsuntersuchungen bei neurologischen Erkrankungen. Fortschritte Neurologie Psychiatrie, 74, 643-650. -2- Fliessbach & Hoppe et al. Fliessbach & Hoppe et al. NeuroCogFX – a computer-based neuropsychological assessment battery for the follow-up Einleitung examination of neurological patients Zahlreiche Therapien neurologischer Erkrankungen haben Auswirkungen auf die kognitive Abstract Leistungsfähigkeit. Dabei sind positive Auswirkungen bei einer erfolgreichen Behandlung der Many neurological therapeutic trials require a longitudinal assessment of cognitive functions. An Zielsymptomatik oder negative Auswirkungen in Form unerwünschter Nebenwirkungen möglich. ideal instrument for that purpose should be in accordance to the criteria of classical testing theory Zum Beispiel führt die erfolgreiche Behandlung eines Hirntumors häufig zu einer Besserung von and, furthermore, it should be repeatable and economic in administration and interpretation. We tumorbedingten kognitiven Defiziten; andererseits gehen Operation, Radiatio und Chemotherapie developed NeuroCogFX, a computerized assessment battery, according to these criteria. jedoch mit einem Risiko für teils erhebliche kognitive Langzeitfolgen einher [1]. Auch bei der NeuroCogFX comprises subtests for short term memory, working memory, psychomotor speed, Epilepsiebehandlung kann effiziente therapeutische Anfallkontrolle zu einer verbesserten selective attention, verbal and figural memory and verbal fluency (mean duration: 25 minutes). kognitiven Leistungsfähigkeit beitragen; andererseits sind kognitive Beeinträchtigungen typische Age-related normative data was obtained from 244 subjects without history of neurological or Komplikationen der medikamentösen Epilepsietherapie, und auch epilepsiechirurgische Eingriffe psychiatric disease (age range 16-75 years). Forty-two subjects were re-tested after an average of können sich unter Umständen kognitiv ungünstig auswirken [2]. Die Erhaltung oder 8 weeks (range: 6 - 10 weeks) in order to assess retest reliability and training effects. Retest- Verbesserung der kognitiven Leistungsfähigkeit durch eine neurologische Therapie ist bei reliabilities were middle-sized in all but one subtest, ranging from r12= 0.5 to r12=0.7 (2-back zahlreichen weiteren neurologischen Krankheitsbildern von Bedeutung, so bei demenziellen Test: r12=0.37). For construct validation NeuroCogFX was administered in addition to a Erkrankungen [3], Multipler Sklerose [4], Morbus Parkinson [5] und anderen Störungen. comprehensive neuropsychological assessment battery in a group of 40 healthy subjects and in 42 patients with chronic epilepsy. The test allows a valid assessment of short-term memory, reaction In vielen Therapiestudien wird die kognitive Leistungsfähigkeit bisher gar nicht oder nur speed, memory and verbal fluency. NeuroCogFX is an economic, sufficiently reliable and valid unzureichend mit unspezifischen oder wenig sensitiven Verfahren wie der Mini Mental Status instrument for the neuropsychological follow-up examination in single patients and study groups Examination erfasst [6]. Ein wesentlicher Grund hierfür dürfte in dem großen zeitlichen und which can be administered if a comprehensive neuropsychological assessment is unavailable. personellen Aufwand liegen, den eine ausführliche neuropsychologische Testdiagnostik erfordert. Ferner werden für längsschnittliche Studien Testverfahren mit Parallelversionen benötigt, die im deutschen Sprachraum für viele relevante neuropsychologische Funktionsbereiche nicht im erforderlichen Umfange zur Verfügung stehen. Man wird der gewachsenen Bedeutung neuropsychologischer Aspekte in der neurologischen Therapie nur dann Rechnung tragen können, wenn es gelingt, Messverfahren zu entwickeln, die die folgenden Kriterien erfüllen: Testgütekriterien: Objektivität, Reliabilität, Validität (klassische Testtheorie), Normierung: mögliche Verwendung als einzelfalldiagnostisches, abrechenbares klinisches Diagnoseverfahren, -3- -4- Fliessbach & Hoppe et al. Fliessbach & Hoppe et al. Einfachheit: Anwendung durch nichtakademisches Personal (z.B. medizinisch-technische Der Test kann an jedem handelsüblichen Notebook oder Desktop-Computer durchgeführt werden Assistenten oder Arzthelferinnen), (Betriebssystem MS Windows 95 aufwärts). Die Reaktionen des Probanden werden geringer Gesamtzeitaufwand: max. 30-40 Minuten für Durchführung, Auswertung und ausschließlich über die Tastatur erfasst. Um auch Patienten mit Halbseitensymptomatik Dokumentation. untersuchen zu können, ist bei fast allen Untertests ausschließlich die Leertaste die Reaktionstaste (Ausnahme Untertest Ziffernspanne: Zifferntasten). Der Untertest Wortflüssigkeit wurde Unter den Gesichtspunkten der Durchführungsobjektivität sowie der automatischen Auswertung anknüpfend an den Untertest 6 aus dem Leistungs-Prüfsystem [11] als Paper & Pencil-Test und Dokumentation erscheinen computergestützte Verfahren besonders geeignet. Im realisiert. Vor den einzelnen Untertests erscheinen knappe schriftliche Instruktionen auf dem deutschsprachigen Raum hat sich als computergestütztes neuropsychologisches Testinstrument in Bildschirm. Bei Verständnisschwierigkeiten gibt der Testleiter zusätzliche Erläuterungen 7 erster Linie die Testbatterie zur Aufmerksamkeitsprüfung (TAP) etabliert [ ]. Diese zielt auf eine entsprechend den Vorgaben des Testmanuals. differenzierte Erfassung verschiedener Aufmerksamkeits- und Arbeitsgedächtnisleistungen, andere im Zusammenhang neurologischer Therapiestudien relevante funktionelle Teilbereiche Normkollektiv wie Sprach- und Gedächtnisleistungen deckt sie dagegen nicht ab. Zur Normierung wurden 244 Probanden ohne neurologische oder psychiatrische Vorerkrankung im Alter zwischen 16 und 75 Jahren untersucht. Der Anteil von Frauen an der Gesamtstichprobe In der vorliegenden Arbeit stellen wir die Entwicklung, Normierung und Prüfung der betrug 57.8 %. Als Schätzmaß für das bildungsabhängige Intelligenzniveau wurde der Testgütekriterien für die computergestützte Testbatterie NeuroCogFX („neurocognitive effects“) Mehrfachwahl-Wortschatztest (MWT-B) [12] durchgeführt. Der mittlere geschätzte IQ betrug im vor. Vorläuferversionen dieser Testbatterie wurden bereits im Rahmen einer Therapiestudie bei Gesamtkollektiv 115.4 (±15.3). primär zerebralen Lymphomen [8] und bei Studien zu kognitiven Therapieauswirkungen in der Epileptologie [9, 10] eingesetzt. Normierung Es wurden vier Altersgruppen mit folgenden Stichprobenumfängen gebildet: 16-29 Jahre (n=87), Methoden 30-44 Jahre (n=57), 45-59 Jahre (n=46) und 60-75 Jahre (n=52). Durch eine Flächentransformation wurde gewährleistet, dass die Standardwerte (SW) auch bei nicht Computertestbatterie normalverteilten Testwerten in vertrauter Weise Prozentrangwerten (PR) entsprechen [13]. Für NeuroCogFX ist eine computergestützte neuropsychologische Testbatterie mit sechs Untertests, jeden Rohwert (RW) wurden hierzu innerhalb der einzelnen Altersgruppen die Perzentile 1, 3, die normalerweise in einer vorgegebenen Reihenfolge durchlaufen werden. Tabelle 1 gibt einen 10, 16, 20, 30, 40, 50, 60, 70, 80, 86, 90, 97 und 99 bestimmt; diesen Perzentilwerten wurden Überblick über die eingesetzten Untertests, die mit ihnen erfassten neuropsychologischen entsprechend der Normalverteilung SW zugewiesen (Mittelwert 100, Standardabweichung 10). Funktionsbereiche, die jeweiligen Aufgabenstellungen sowie die jeweils erfassten und normierten Schließlich erfolgte eine lineare Übersetzung des SW in einen Kategorienwert (KW; weit Ergebnisparameter. unterdurchschnittlich/SW ≤ 80: KW -2; unterdurchschnittlich/80 < SW ≤ 85: KW -1; > Tabelle 1 bitte hier einfügen < überdurchschnittlich/ SW > 120: KW +2). Auf diese Weise erhält man für jeden normierten durchschnittlich 85 < SW ≤115: KW 0; überdurchschnittlich/115 < SW ≤ 120: KW +1; weit Testparameter RW, PR, SW und KW. -5- -6- Fliessbach & Hoppe et al. Fliessbach & Hoppe et al. Retest-Reliabilität und Übungseffekte Normdaten von 235 Probanden ohne neurologische und psychiatrische Vorerkrankungen aus dem Zur Bestimmung der Retest-Reliabiliäten (r12) wurden 44 Probanden der Normstichprobe Jahre 2004, die wir im Rahmen einer Normierung der gesamten Testbatterie zur prächirurgischen durchschnittlich 8 Wochen nach der ersten Untersuchung erneut untersucht (Spanne: 6 – 10 Epilepsiediagnostik erhoben haben (unveröffentlichte Daten). Wochen). Die Retest-Reliabilität für die einzelnen Untertests wurde mittels der Produkt-MomentKorrelation zwischen den Rohwerten der ersten und der zweiten Untersuchung geschätzt. Als > Tabelle 2 bitte hier einfügen < Maß für den Übungseffekt bei wiederholter Messung wurde die mittlere Differenz (MD) zwischen den Rohwerten der ersten und zweiten Messung ermittelt. Neunzehn Probanden wurden Der Zusammenhang zwischen den Testparametern von NeuroCogFX und denen der übrigen außerdem zwei weitere Male im Abstand von jeweils circa 8 Wochen untersucht, um das Ausmaß Testverfahren wurde auf verschiedene Weise analysiert: von Übungseffekten bei mehr als zweimaliger Testung zu bestimmen. 1. Interkorrelationen zwischen den einzelnen Testparametern: Die Gruppe der Probanden ohne neurologische Vorerkrankungen und die Gruppe der Patienten wurden getrennt analysiert, um Individuelle Beurteilung von Verläufen artifiziell hohe Korrelationen durch eine inhomogene Stichprobe zu vermeiden. Berichtet Aus den Retest-Reliabilitäten und der mittleren Differenz MD zwischen erster und zweiter werden die Interkorrelationen zwischen den Rohwerten, um einen Vergleich mit der Retest- Messung wurden für jeden Ergebnisparameter so genannte kritische Differenzen ∆krit berechnet Reliabilität zu ermöglichen. [13]. Diese geben unter Berücksichtigung der Messgenauigkeit sowie der durchschnittlichen 2. Faktorenanalyse aller Testparameter: Um eine ausreichende Stichprobengröße und genügend Übungseffekte an, wie groß bei einem Individuum die Leistungsdifferenz zwischen einer ersten Varianz zu erzielen, wurden für die Faktorenanalyse Normalprobanden und Patienten und einer zweiten Messung sein muss, damit diese als signifikante Verschlechterung oder zusammengefasst. Es wurde eine Hauptkomponentenanalyse (Abbruchkriterium: Eigenwerte Verbesserung beurteilt werden kann. Die kritischen Differenzen wurden berechnet zu ∆krit = SED < 1) mit anschließender VARIMAX-Rotation über die alterskorrigierten Standardwerte * (±zα) = SED * (±1.64) für α=.10 (90%-Konfidenzintervall), mit dem Standardfehler der durchgeführt. 1/2 Differenzen SED = 2 3. Berechnung von Sensitivität und Spezifität einzelner Untertests: Für die kognitiven Domänen 1/2 *SE und dem Standardmessfehler SE = [1-r12] . Verbalgedächtnis, Figuralgedächtnis, Kurzzeitgedächtnis und Wortflüssigkeit gab es analoge Konstruktvalidität Testverfahren in beiden verwendeten Batterien. Hier legten wir die Annahme zugrunde, dass Bei der Konstruktvalidierung wird geprüft, inwieweit ein Test zu ähnlichen Ergebnissen gelangt die konventionellen, etablierten Testverfahren die Diagnose eines pathologischen Befundes wie andere etablierte Testverfahren, die dasselbe theoretische Konstrukt erfassen. Dazu führten sichern. Als pathologischer Befund in einer funktionellen Domäne galt das Vorliegen eines wir den Test an 40 Probanden der Normstichprobe und 42 stationären Patienten der weit unterdurchschnittlichen Testwertes (entsprechend KW = -2) in wenigstens einem Universitätsklinik für Epileptologie in Bonn in geringem zeitlichen Abstand (Spanne: 1-10 Tage) Testparameter dieser Domäne (z.B. Verbalgedächtnisdefizit bei mindestens einem weit zu einer umfangreichen Testbatterie mit etablierten neuropsychologischen Verfahren durch. Die unterdurchschnittlichen Wert in einem der vier Parameter des verbalen Gedächtnistests). Die Patientengruppe umfasste neben Patienten mit chronischen Epilepsien (n=34) acht Patienten mit Sensitivität und die Spezifität der entsprechenden NeuroCogFX-Untertests wurden in Bezug anderen Anfallsleiden (dissoziative Anfälle, Synkopen). Die ausführliche Testbatterie umfasste auf die zugehörigen konventionellen Tests berechnet, wobei bei den NeuroCogFX-Tests die in Tabelle 2 aufgeführten Testverfahren (genaue Beschreibung dieser Verfahren in [ , ]). Die einmal ein strenges Kriterium (SW < 80; KW = -2) und einmal ein weniger strenges Rohwerte dieser Tests wurden analog dem Vorgehen bei der Normierung von NeuroCogFX in Kriterium (SW < 85; KW ≤ -1) für die computergestützte Diagnose eines pathologischen altersabhängige Prozentrang-, Standard- und Kategoriewerte überführt. Wir verwendeten hierzu Befundes zugrunde gelegt wurde. 2 8 -7- -8- Fliessbach & Hoppe et al. Fliessbach & Hoppe et al. Bis auf den Untertest 2-back-Test (r12 = 0.37) zeigen sich durchgehend Retest-Reliabilitäten Ergebnisse zwischen r12 = 0.50 und r12 = 0.70. Beim Vergleich zwischen erster und zweiter Messung für 44 Durchführung Probanden zeigen sich signifikante Mittelwertsunterschiede im Sinne von Der Test konnte problemlos von nicht speziell geschultem Personal (Medizindoktoranden) bei Leistungsverbesserungen in allen Untertests bis auf die Untertests 2-back-Test und Reaktionszeit. Probanden und Patienten angewendet, ausgewertet und dokumentiert werden. Die Auch die Mittelwertsunterschiede zwischen Erst- und Wiederholungstestung sind in Tabelle 3 durchschnittliche Durchführungsdauer betrug 25 Minuten (Spanne 18 bis 39 Minuten). Beim wiedergegeben. Zwischen der zweiten und dritten Messung finden sich in der kleineren Untertest 2-Back-Test traten bei mehreren Probanden Instruktionsverständnisschwierigkeiten auf; Stichprobe der insgesamt vier Mal getesteten Patienten (n=19) signifikante bei drei Probanden konnte dieser Test letztlich nicht durchgeführt werden. Ansonsten wurde die Mittelswertsunterschiede nur noch für die Untertests Reaktionszeit und Wahlreaktion 1 (nicht Testbatterie von allen Probanden vollständig bearbeitet. gezeigt). Zwischen dritter und vierter Messung finden sich in keinem Untertest signifikante Mittelwertsunterschiede. Tabelle 3 zeigt schließlich die kritischen Differenzen ∆krit für Altersbezogene Normierung signifikante Leistungsveränderungen im individuellen Verlauf, die sich aus den Reliabilitäten Die Analyse der Testwertverteilungen bei den gesunden Probanden zeigte für einzelne und den Mittelwertsunterschieden ergeben (p<.10, 90%-Konfidenzintervall). Testparameter schiefe Verteilungen, die auf Deckeneffekte schließen lassen. Insbesondere für die Differenzen zwischen richtigen Antworten und falschen Alarmen in den Untertests 2-back-Test, Validität, Sensitivität und Spezifität Wahlreaktion 1 und Wahlreaktion 2 war dies zu erwarten. In geringerem Maße zeigten sich auch Tabelle 4 zeigt die Korrelationen zwischen sich entsprechenden Untertests von NeuroCogFX und Deckeneffekte für den Untertest Verbales Gedächtnis. der konventionellen Testbatterie. Die Normen wurden getrennt für die oben genannten vier Altersgruppen berechnet (16-29, 30-44, 45-59, 60-75 Jahre). Die Normtabellen sind in die aktuelle Version von NeuroCogFX integriert, > Tabelle 4 bitte hier einfügen < sodass eine automatische Zuweisung eines altersbezogenen PR und SW zu einem Testrohwert erfolgt. Auf eine Wiedergabe der Normtabellen wird daher hier verzichtet. NeuroCogFX erlaubt Insgesamt zeigen sich hierbei meist mittelstarke (r = 0.30 bis r = 0.62) signifikante Korrelationen. zusätzlich auch die grafische Darstellung eines individuellen altersbezogen normierten Eine Ausnahme stellt der Untertest Verbales Gedächtnis in der Patientengruppe dar, der nur Leistungsprofils (vgl. Abbildung 1). schwach mit der Lernleistung im Verbalen Lern- und Merkfähigkeitstest (VLMT, Durchgänge 15) korreliert ist (r = 0.36), und mit den übrigen Parametern keine signifikanten Korrelationen > Abbildung 1 bitte hier einfügen < aufweist. Der 2-back-Test zeigt innerhalb der Patientengruppe eine Reihe von signifikanten Korrelationen (Trail Making Test [TMT], Labyrinth-Test, Corsi-Block-Test, Diagnosticum Retest-Reliabilität, Übungseffekte und kritische Differenzen cerebraler Schädigungen [DCS], Wortflüssigkeit), während sich in der Probandengruppe keine Die Retest-Reliabilitäten r12 der Untertests sind in Tabelle 3 aufgeführt. systematischen Zusammenhänge ergeben (nicht gezeigt); letzteres ist sehr wahrscheinlich auf die infolge des Deckeneffekts fehlende Varianz in der 2-back-Testleistung bei den gesunden > Tabelle 3 bitte hier einfügen < Probanden zurückzuführen. Die Untertests Reaktionszeit und Wahlreaktion 1 und 2 korrelieren erwartungsgemäß hoch miteinander (r = 0.6 bis r = 0.75) sowie mit einer Reihe von geschwindigkeitsabhängigen Aufgaben (TMT, Labyrinth-Test, Wortflüssigkeit). Der Untertest -9- - 10 - Fliessbach & Hoppe et al. Fliessbach & Hoppe et al. Wahlreaktion 2 weist dabei in der Patientengruppe deutlich höhere Korrelationen mit Tests der Befund: KW ≤ -1) werden für alle Tests außer dem Untertest Ziffernspanne Verbesserungen der exekutiven Funktionen (TMT, Labyrinth) und der Wortflüssigkeit auf als der Untertest Sensitivität erzielt, die den Verlust an Spezifität deutlich übertreffen. Die höchste Sensitivität Wahlreaktion 1 (nicht gezeigt). erzielt der Untertest Verbales Gedächtnis für die Diagnose eines Verbalgedächtnisdefizits (0.73 bei einer Spezifität von 0.87) und die Diagnose eines allgemeinen Gedächtnisdefizits (0.77 bei Tabelle 5 zeigt die Ladungsmatrix der Faktorenanalyse über sämtliche Testparameter. einer Spezifität von 0.94) unter Zusammenfassung der Leistungen in den Untertests Verbales und Figurales Gedächtnis. > Tabelle 5 bitte hier einfügen < Diskussion Es wurden sechs Faktoren mit einem Eigenwert >1 extrahiert. Der erste Faktor fasst den Untertest Figurales Gedächtnis mit Parametern des VLMT (Zahl der Wörter bei verzögertem Wir stellen mit NeuroCogFX eine computergestützte neuropsychologische Testbatterie vor, die freien Abruf und Wiedererkennen) und des DCS (Gesamtlernleistung und Maximallernleistung) speziell für längsschnittliche Verlaufsuntersuchungen im Rahmen von Therapiestudien sowie für zusammen und wird daher als allgemeiner Gedächtnisfaktor interpretiert. Der zweite Faktor fasst die individuelle Verlaufsdiagnostik bei neurologischen Erkrankungen entwickelt wurde. Die den Untertest Ziffernspanne mit den Tests Zahlennachsprechen vorwärts und rückwärts sowie Daten aus den hier vorgestellten Normierungsstudien verweisen auf folgende Vorteile des Tests: dem Untertest Interferenzvermeidung aus dem cerebralen Insuffizienztest (c.I.T.) zusammen und unproblematische Durchführung durch nicht speziell ausgebildetes Personal, wird als Kurzzeitgedächtnisfaktor interpretiert. Der Faktor 3 enthält die Untertests Verbales gute Durchführbarkeit und hohe Akzeptanz seitens der Probanden, Gedächtnis und Wortflüssigkeit sowie die Tests phonematische und semantische Wortflüssigkeit kurze durchschnittliche Testdauer (25 Minuten), und die Lernleistung des VLMT (Durchgänge 1-5). Wir interpretieren ihn als verbalen altersbezogene, in das Programm integrierte Normierung für einen breiten Altersbereich, Informationsverarbeitungsfaktor. Faktor 4 bündelt die Untertests Reaktionszeit sowie kritische Differenzen zur Beurteilung individueller Leistungsveränderungen verfügbar, Wahlreaktionen 1 und 2 und wird als Reaktionsschnelligkeit interpretiert. Faktor 5 enthält keinen weitgehend sinnvolle Zuordnung der Untertests zu neuropsychologischen Funktionsbereichen Untertest aus NeuroCogFX; er bündelt die Tests TMT (Formen A und B) und Labyrinth-Test und wird als Faktor für exekutive Funktionen interpretiert. Faktor 6 enthält den Untertest 2-back-Test und den Corsi-Block-Test; er wird als Arbeitsgedächtnisfaktor interpretiert. (Ausnahme: Verbales Gedächtnis), zufriedenstellende bis hohe Sensitivität und Spezifität für die Individualdiagnostik neuropsychologischer Teilleistungsstörungen. Tabelle 6 zeigt die Sensitivität und Spezifität der Untertests Ziffernspanne, Verbales und Der Untertest Verbales Gedächtnis zeigt insbesondere im Patientenkollektiv nur eine niedrige Figurales Gedächtnis (sowie Gedächtnis insgesamt) und Wortflüssigkeit. Interkorrelation mit Parametern des VLMT, der die Langzeitenkodierung verbalen Materials erfasst. Auch in der Faktorenanalyse lädt dieser Untertest nicht gesondert auf einem > Tabelle 6 bitte hier einfügen < Verbalgedächtnisfaktor, sondern zusammen mit den Tests zur Wortflüssigkeit und der Lernleistung auf einem allgemeineren Faktor, den wir als verbale Informationsverarbeitung Bei Anwendung des strengen Kriteriums für die Untertests von NeuroCogFX (pathologischer interpretiert haben. Dem steht positiv der Befund gegenüber, dass dieser Untertest mit hoher Befund: KW = -2) zeigt sich für alle Untertests eine hohe Sensitivität (≥0.89) bei mittlerer Sensitivität und Spezifität Individuen identifizieren kann, die ein auf der Basis des VLMT Spezifität (0.44 – 0.66). Legt man das weniger strenge Kriterium zugrunde (pathologischer diagnostiziertes Verbalgedächtnisdefizit aufweisen. Fasst man darüber hinaus die Untertests - 11 - - 12 - Fliessbach & Hoppe et al. Fliessbach & Hoppe et al. Verbales und Figurales Gedächtnis zusammen, so werden mit hoher Spezifität (0.94) immerhin Übungseffekte sind ein grundsätzliches Problem bei neuropsychologischen 77% der Personen, die nach DCS oder VLMT ein Gedächtnisdefizit aufweisen, identifiziert. Verlaufsuntersuchungen und treten auch bei etablierten Testverfahren auf. Durch die Berechnung Insofern erscheint die Schlussfolgerung, dass die beiden Untertests Verbales und Figurales von kritischen Differenzen können Übungseffekte bei wiederholter Durchführung von Gedächtnis Gedächtnisdefizite in hohem Maße richtig diagnostizieren, gerechtfertigt. Offen ist, NeuroCogFX bei der einzelfalldiagnostischen Interpretation von Leistungsveränderungen im inwieweit die beiden Untertests zusätzlich spezifische Rückschlüsse auf materialabhängige Verlauf berücksichtigt werden (vgl. Tabelle 3). Über die zweite Messwiederholung hinaus Gedächtnisdefizite erlauben. zeigten sich Übungseffekte nur noch in sehr geringem Maße. Dennoch ist nicht auszuschließen, dass bei häufigeren Wiederholungen in Einzelfällen weitere Übungseffekte auftreten. Im Keine externe Validierung erfahren die Reaktionszeittests, die in der Faktorenanalyse einen Studienkontext werden unspezifische Übungseffekte ohnehin durch eine geeignete eigenen Faktor bilden und mit keinem der konventionellen Tests korrelieren. Allerdings kommt Kontrollbedingung ausgeschlossen. Reaktionszeitmessungen in hohem Maße Augenscheinvalidität zu. Der 2-back-Test weist - vermutlich aufgrund von Deckeneffekten - die niedrigste Reliabilität auf Den positiven Aspekten stehen folgende Einschränkungen gegenüber: und korreliert nicht gut mit anderen Maßen, die Arbeitsgedächtnis und exekutive nur mittelhohe Retest-Reliabilitäten, Handlungsteuerung erfordern. Zudem führte er bei Probanden und Patienten am häufigsten zu signifikante Übungseffekte in den meisten Untertests, Instruktionsverständnisschwierigkeiten. Wir werden diesen Test daher in zukünftigen niedrige Reliabilität und keine externe Validierung für 2-back-Test, Programmversionen nicht mehr verwenden. Da kein Untertest komplexe exekutive Funktionen komplexere exekutive Leistungen (z.B. TMT, Labyrinthe) werden von NeuroCogFX nicht erfasst, empfehlen wir, NeuroCogFX durch einen gut eingeführten, frei verfügbaren und erfasst, ökonomischen Paper & Pencil-Test (z.B. TMT Formen A und B [14]) zu ergänzen. Untertest Wortflüssigkeit bei Patienten mit handmotorischen Beeinträchtigungen nicht in schriftlicher Form durchführbar. Für den Paper & Pencil-Untertest Wortflüssigkeit, dessen Gestaltung sich an dem Leistungsprüfsystem von Horn orientierte [11], wird derzeit eine Version für die mündliche Im Hinblick auf die nur mittleren Retest-Reliabilitäten ist insbesondere auf die niedrige Varianz Durchführung in das Computerprogramm integriert, die auch eine Untersuchung handmotorisch in einzelnen Testparametern (Deckeneffekte) zu verweisen, die höheren Korrelationen beeinträchtigter, schreibunfähiger Patienten ermöglicht. entgegensteht; möglicherweise wäre die Reliabilität auf der Basis von Patientenstudien mit höherer Leistungsvarianz höher einzuschätzen. Ferner dürfte sich das relativ lange Retest- Zusammenfassend ist NeuroCogFX ein ökonomisches Messinstrument zur Verlaufsuntersuchung Intervall (im Durchschnitt 8 Wochen) ungünstig ausgewirkt haben. Schließlich sind von kognitiven Therapieeffekten sowohl im Rahmen individueller Behandlungen wie auch bei Einschränkungen der Reliabilität bei computergestützten Verfahren generell bekannt. Therapiestudien, wenn eine ausführliche neuropsychologische Testdiagnostik durch entsprechend Beispielsweise weisen die Untertests der gut etablierten TAP ebenfalls nur mittelstarke Retest- geschultes Fachpersonal nicht realisierbar ist. Nach unserer Einschätzung erfüllt es die eingangs 7 Reliabilitäten auf [ ]. Unter Berücksichtigung der nur mittleren Reliabilitäten fallen die genannten psychometrischen und pragmatischen Kriterien hinreichend. Im Unterschied zu bloßen Korrelationen der Subtests von NeuroCogFX mit herkömmlichen Testverfahren im Sinne der Screening-Tests erlaubt das Instrument eine differentielle Erfassung verschiedener kognitiver Konstruktvalidität größtenteils zufriedenstellend aus. Funktionen (Kurzzeitgedächtnis, Gedächtnis, Reaktionsgeschwindigkeit, Wortflüssigkeit), ohne den Anspruch zu erheben, dabei die hohe Differenzierungsfähigkeit ausführlicher Testbatterien - 13 - - 14 - Fliessbach & Hoppe et al. Fliessbach & Hoppe et al. zu erreichen. Einschränkungen bestehen bei der Erfassung von exekutiven Dysfunktionen. Die Tabellen und Abbildungen Testbatterie wird aktuell im Rahmen des nationalen Verbundnetzes „Gliome“ der Deutschen Krebshilfe multizentrisch eingesetzt. Tabelle 1: NeuroCogFX: Untertests. Tabelle 2: Konstruktvalidierung: konventionelle Testverfahren. Danksagung Anm. Nähere Angaben zu allen Tests in [2, 8]. Wir bedanken uns bei Nina Stephanie Lehnen, Alexander Höinghaus, Frederike Adler und Johanna Michel, die die dieser Arbeit zugrunde liegenden Daten im Rahmen ihrer medizinischen Tabelle 3: Retest-Reliabilitäten, Übungseffekte und kritische Differenzen. Doktorarbeiten erhoben haben. r12 = Retest-Reliabilität, M1 = Mittelwert Erstmessung, M2 = Mittelwert Wiederholungsmessung, SD = Standardabweichung, p = Signifikanz (Mittelwertsvergleich M1 und M2), ∆krit = kritische Differenzen (Punktzahl- bzw. Reaktionszeitunterschied, bei der ein Testergebnis als signifikante Verschlechterung / Verbesserung zwischen Erst- und Wiederholungsmessung gelten kann, p<.10, 90%Konfidenzintervall). Tabelle 4: Korrelationen zwischen NeuroCogFX-Untertests und konventionellen Tests (Auswahl). Tabelle 5: Faktorisierung von NeuroCogFX und konventioneller Testbatterie: Ladungsmatrix. Anm.: Nur Ladungen >0.5 (Testparameter mit Ladungen <.05 in Klammern). Tabelle 6: Sensitivität und Spezifität relativ zu konventionellen Tests. Abbildung 1: Graphische Darstellung eines individuellen altersbezogen normierten Leistungsprofils. - 15 - - 16 - Fliessbach & Hoppe et al. Fliessbach & Hoppe et al. Tabelle 1: NeuroCogFX: Untertests. Fortsetzung Tabelle 1: NeuroCogFX: Untertests. Untertest Funktion Aufgabe Ergebnismaße normiert Ziffernspanne verbales Kurzzeitgedächtnis Sukzessive Darbietung einer Ziffernfolge. Unmittelbare Reproduktion (Zifferntasten). Schwierigkeit steigt mit jeder richtigen Antwort. Punkte 2-back-Test Arbeitsgedächtnis Kontinuierliche Darbietung einzelner Ziffern. Reagieren, wenn die gezeigte Ziffer mit der vorletzten Ziffer identisch ist (Leertaste). Punkte: Anzahl korrekter Wiedergaben; Ziffernspanne: maximale Länge korrekt wiedergegebener Ziffernfolgen Median der Reaktionszeiten bei korrekten Reaktionen Reagieren bei blauem Kreis (Leertaste). Median der Reaktionszeiten (RZ) RZ Wahlreaktion 1 selektive Aufmerksamkeit Reagieren bei blauem Kreis (Leertaste), gelbe Kreise ignorieren (Go/No go). Median der Reaktionszeiten (RZ) RZ Anzahl richtiger Reaktionen Anzahl von Fehlreaktionen Umgekehrt: Reagieren bei gelbem Kreis (Leertaste), blaue Kreise ignorieren. Median der Reaktionszeiten (RZ) Anzahl richtiger Reaktionen Anzahl von Fehlreaktionen - 17 - Anzahl Treffer für jeden Test (Hits) Anzahl Fehlreaktionen für jeden Test (false alarms, FA), mittlere Reaktionszeit für alle Hits (Median) mittlere Reaktionszeit für alle FA (Median) figurales Lernen und Wiedererkennen Durchführung analog zum Untertest Verbales Gedächtnis. "Schachbrett"Muster: 4 hervorgehobene aus 3x3 Feldern. analog Untertest Verbales Gedächtnis Hits - FA Wortflüssigkeit phonematischMöglichst viele Wörter mit (Paper & Pencil) literale Wortflüssig- Anfangsbuchstaben "P" aufschreiben keit Punkte: Anzahl richtiger Wörter Punkte Figurales Gedächtnis "alertness", Reaktionsbereitschaft Interferenzanfälligkeit, kognitive Umstellfähigkeit Punkte: Anzahl richtiger abzüglich falscher Punkte Reaktionen Reaktionszeit Wahlreaktion 2 verbales Lernen und Wortlistenlernen: 3 Lerndurchgänge, Wiedererkennen 12 Wörter. Ja/Nein-Rekognitionstest (Items:Distraktoren 1:2) nach jedem Lerndurchgang sowie verzögert nach dem Untertest Figurales Gedächtnis. Ja = Leertaste (Reaktionsintervall: 2 Sekunden). Verbales Gedächtnis RZ - 18 - Hits - FA Fliessbach & Hoppe et al. Fliessbach & Hoppe et al. Tabelle 2: Konstruktvalidierung: konventionelle Testverfahren. Tabelle 3: Retest-Reliabilitäten, Übungseffekte und kritische Differenzen. Funktion Test Untertests Ergebnisparameter Aufmerksamkeit und exekutive Funktionen Test für cerebrale Insuffizienz (c.I.T.) Symbole zählen Lösungsdauer r12 M1 (SD) M2 (SD) M2-M1 p ∆krit Trail Making Test (TMT) Form A und B Lösungsdauer Zahlenspanne (Punkte) 0.68 7.4 (2.2) 8.2 (2.1) 0.8 <0.01 -3 / +4 Lösungsdauer 2-back-Test (Punkte) 0.35 8.8 (2.3) 9.2 (1.4) 0.41 n.s. -4 / +4 Hamburg WechslerIntelligenztest für Erwachsene (HAWIE-III) Zahlen nachsprechen vorwärts Spanne Reaktionszeit (Median-RZ, ms) 0.50 262 (54) 261 (48) -1 n.s +80 / -80 Zahlen nachsprechen rückwärts Spanne Wahlreaktion 1 (Median-RZ, ms) 0.53 362 (58) 342 (57) -20 <0.05 +78 / -97 Wechsler Memory Scale (WMS-III) Corsi-Block-Test vorwärts Blockspanne Wahlreaktion 2 (Median-RZ, ms) 0.60 373 (49) 349 (49) -24 <0.01 +68 / -110 - 4 / +10 AB-Interferenztest Labyrinthtest (nach Chapuis) Kurzzeitgedächtnis und Arbeitsgedächtnis Verbalgedächtnis Verbaler Lern- und Merkfähigkeitstest (VLMT) NeuroCogFX Summe richtige Wörter Durchgänge 1-5 (Lernen), richtige Wörter Dg. 7 (Gesamt), Verlust von Dg. 5 zu Dg. 7 (Behalten), fehlerkorrigierte Ja/Nein-Rekognitionsleistung Figuralgedächtnis Diagnosticum für Cerebralschädigung - revidiert (DCS) Wortflüssigkeit phonematischliteral Leistungsprüfsystem Untertest 6: Wortflüssigkeit (schriftlich) Anzahl richtiger Wörter Wortflüssigkeit semantisch Demenz-Test nach Kessler Supermarktaufgabe (schriftlich) Anzahl richtiger Wörter Summe gelernter Muster Durchgänge 1 bis 5 (Lernen), richtige Muster Dg. 5 (Gesamt) Gedächtnis/verbal (Punkte) 0.66 39.4 (4.9) 42.6 (4.4) 3.1 < 0.001 Gedächtnis/figural (Punkte) 0.58 10.2 (8.4) 12.8 (7.7) 2.6 <0.05 -9 / +17 Wortflüssigkeit (Punkte) 0.69 14.2 (3.1) 16.0 (3.3) 1.8 < 0.001 -3 / + 6 r12 = Retest-Reliabilität, M1 = Mittelwert Erstmessung, M2 = Mittelwert Wiederholungsmessung, SD = Standardabweichung, p = Signifikanz (Mittelwertsvergleich M1 und M2), ∆krit = kritische Differenzen (Punktzahl- bzw. Reaktionszeitunterschied, bei der ein Testergebnis als signifikante Verschlechterung / Verbesserung zwischen Erst- und Wiederholungsmessung gelten kann, p<.10, 90%Konfidenzintervall). Anm. Nähere Angaben zu allen Tests in [2, 8]. - 19 - - 20 - Fliessbach & Hoppe et al. Tabelle 4: Korrelationen zwischen NeuroCogFX-Untertests und konventionellen Tests (Auswahl). Fliessbach & Hoppe et al. Tabelle 5: Faktorisierung von NeuroCogFX und konventioneller Testbatterie: Ladungsmatrix. NeuroCogFX Ziffernspanne Verbales Gedächtnis Figurales Gedächtnis Wortflüssigkeit Konventionelle Tests Probanden Patienten Zahlennachsprechen (vorwärts) 0.30* 0.61** Zahlennachsprechen (rückwärts) 0.36* 0.62** VLMT (Durchgänge 1-5) 0.47** 0.36* VLMT (Durchgang 7) 0.62** 0.10 VLMT (Verlust von Dg. 5 nach Dg. 7) 0.55** -0.12 NeuroCogFX VLMT (Rekognition) 0.49** 0.20 Figurales Gedächtnis DCS (Durchgänge 1-5) 0.47** 0.62** Ziffernspanne DCS (letzter Durchgang) 0.38** 0.61** phonematische Wortflüssigkeit 0.60** 0.49** semantische Wortflüssigkeit 0.45** 0.34* * p<.05, ** p<.01 Faktoren Test 1 2 3 4 5 6 0.69 0.68 Verbales Gedächtnis 0.70 Wortflüssigkeit 0.65 Reaktionszeit 0.75 Wahlreaktion 1 0.79 Wahlreaktion 2 0.83 2-back-Test 0.55 Konventionelle Testbatterie - 21 - VLMT Durchgang 7 0.75 VLMT Rekognition 0.76 DCS Durchgang 1-5 0.81 DCS letzter Durchgang 0.73 Zahlennachsprechen vorwärts 0.75 Zahlennachsprechen rückwärts 0.83 c.I.T Interferenzvermeidung 0.56 Wortflüssigkeit phonematisch 0.60 Wortflüssigkeit semantisch 0.56 VLMT Durchgang 1-5 0.65 TMT Form A 0.70 TMT Form B 0.53 Labyrinth-Test 0.72 Corsi-Block-Test 0.84 (c.I.T Symbolezählen) (VLMT Verlust von 5 nach 7) Anm.: Nur Ladungen >0.5 (Testparameter mit Ladungen <.05 in Klammern). - 22 - Fliessbach & Hoppe et al. Fliessbach & Hoppe et al. Literatur Tabelle 6: Sensitivität und Spezifität relativ zu konventionellen Tests. 1 Strenges Kriterium (KW = -2) weniger strenges Kriterium (KW ≤ -1) NeuroCogFX Sensitivität Spezifität Sensitivität Spezifität Ziffernspanne 0.45 0.92 0.52 0.81 Verbales Gedächtnis 0.73 0.87 0.73 0.87 Figurales Gedächtnis 0.48 0.98 0.58 0.94 Gedächtnis (insgesamt) 0.66 1.00 0.77 0.94 Wortflüssigkeit 0.44 0.94 0.50 0.92 Taphoorn MJ, Klein M. Cognitive deficits in adult patients with brain tumours. Lancet Neurol 2004; 3: 159-168 2 Helmstaedter C, Kurthen M, Lux S, Johanson K, Quiske A, Schramm J, Elger CE. Temporallappenepilepsie: Längsschnittliche klinische, neuropsychologische und psychosoziale Entwicklung operativ und konservativ behandelter Patienten. Der Nervenarzt 2000; 71: 629-642 3 Sparks DL, Sabbagh MN, Connor DJ, Lopez J, Launer LJ, Browne P, Wasser D, JohnsonTraver S, Lochhead J, Ziolwolski C. Atorvastatin for the treatment of mild to moderate Alzheimer disease: preliminary results. Arch Neurol 2005; 62: 753-757 4 KW = Kategoriewert. Panitch H, Miller A, Paty D, Weinshenker B. Interferon beta-1b in secondary progressive MS: results from a 3-year controlled study. Neurology 2004; 63: 1788-1795 5 Ravina B, Putt M, Siderowf A, Farrar JT, Gillespie M, Crawley A, Fernandez HH, Trieschmann MM, Reichwein S, Simuni T. Donepezil for dementia in Parkinson's disease: a randomised, double blind, placebo controlled, crossover study. J Neurol Neurosurg Psychiatry 2005; 76: 934-939 6 Brown PD, Buckner JC, O'Fallon JR, Iturria NL, Brown CA, O'Neill BP, Scheithauer BW, Dinapoli RP, Arusell RM, Curran WJ, Abrams R, Shaw EG. Effects of radiotherapy on cognitive function in patients with low-grade glioma measured by the Folstein Mini Mental State Examination. J Clin Oncol 2003; 21: 2519-2524 7 Zimmermann, P, Fimm, B. Testbatterie zur Aufmerksamkeitsprüfung (Version 1.7). 8 Fliessbach K, Helmstaedter C, Urbach H, Althaus A, Pels H, Linnebank M, Juergens A, Würselen: Psytest, 2003 Glasmacher A, Schmidt-Wolf IG, Klockgether T, Schlegel U. Neuropsychological outcome after chemotherapy for primary CNS lymphoma: a prospective study. Neurology 2005; 64: 1184-1188 9 Jünemann H, Helmstaedter C, Elger CE. Die Möglichkeiten des Einsatzes computerisierter Gedächtnistests in der prächirurgischen Epilepsiediagnostik. In: Scheffner D (Hrsg.). Epilepsie 91 (S. 449-452). Einhorn-Presse Verlag, Reinbeck, 1992 10 Helmstaedter C, Hoppe C, Elger CE. Memory alterations during acute high-intensity vagus nerve stimulation. Epilepsy Res 2001; 47: 37-42 - 23 - - 24 - Fliessbach & Hoppe et al. 11 Horn W. Leistungsprüfsystem L-P-S. Göttingen: Hogrefe, 1983 12 Lehrl S, Merz J, Burkhard, et al. Mehrfachwahl-Wortschatz-Intelligenztest MWT-B. Göttingen: Hogrefe, 1999 13 Krauth J. Testkonstruktion und Testtheorie. Weinheim: Psychologie Verlags Union, 1995 14 Reitan RM. Trail Making Test: Manual for Administration and Scoring. Tucson: Neuropsychology Laboratory, 1992 - 25 -