Zelle 2

Abschlussbericht
an das
Bundesministerium für Gesundheit
und Soziale Sicherung (BMGS)
Am Probsthof 78a; 53121 Bonn
Vorbereitung der Erhebung und Auswertung zur
Prävalenz des Aufmerksamkeits-DefizitHyperaktivitäts-Syndroms (ADHS) in Deutschland
im Rahmen des Kinder- und Jugendsurveys des
Robert-Koch-Instituts
Dr. med. Dipl.-Psych. Michael Huss
Facharzt für Kinder- und Jugendpsychiatrie
Oberarzt an der Klinik für Psychiatrie, Psychosomatik und Psychotherapie
des Kindes- und Jugendalters
Charité Universitätsmedizin Berlin Campus Virchow-Klinikum
Augustenburger Platz 1; 13353 Berlin
1. Verzeichnisse
1.1 Inhaltsverzeichnis
1.
VERZEICHNISSE......................................................................................................................... 2
1.1
Inhaltsverzeichnis...................................................................................................................................... 2
1.2
Tabellenverzeichnis................................................................................................................................... 3
1.3
Abbildungsverzeichnis.............................................................................................................................. 3
2.
ZUSAMMENFASSUNG ............................................................................................................... 4
3.
THEORETISCHER HINTERGRUND: DER BEDARF AN NATIONALEN PRÄVALENZDATEN5
4.
WAS IST BEKANNT? .................................................................................................................. 8
5.
DER GESUNDHEITS-SURVEY DES ROBERT-KOCH-INSTIUTS ALS GRUNDLAGE EINER
DEUTSCHEN PRÄVALENZSCHÄTZUNG................................................................................ 12
6.
HOHE PRÄVALENZDATEN IN DER FORSCHUNGSLITERATUR: EIN METHODISCHES
ARTEFAKT? .............................................................................................................................. 14
7.
OPERATIONALISIERUNG DER FORSCHUNGSFRAGE IM HAUPTSURVEY....................... 17
7.1
Forschungskriterien................................................................................................................................ 17
7.2
Im Hauptsurvey bereits implementierte Items..................................................................................... 19
7.2.1
Strengths and Difficulties Questionnaire (SDQ) ............................................................................... 19
7.2.2
Rating trainierter Beobachter ............................................................................................................ 20
7.2.3
Objektive Verfahren.......................................................................................................................... 23
7.2.4
Diagnosealgorithmus auf der Grundlage der im Hauptsurvey implementierten Informationen........ 24
8
SDQ-ERGEBNISSE AUS DEM PRETEST ................................................................................... 35
9
ERGEBNISSE DES RELIABILITÄTS-TRAINING FÜR DEN HAUPTSURVEY ........................... 43
10
WELCHE VORLÄUFIGEN PRÄVALENZSCHÄTZUNGEN ERGEBEN SICH AUS DEN
BISHER VERFÜGBAREN DATEN DES PRETESTS? ............................................................. 46
11
ZUSAMMENFASSENDE WERTUNG UND AUSBLICK ........................................................... 50
12
LITERATUR ............................................................................................................................... 52
13
ANHANG .................................................................................................................................... 53
13.1 Beschreibung des Doppler-Radar-Aktometer ....................................................................................... 53
13.2 SPSS-Steuerfile SDQ-Auswertung ....................................................................................................... 54
2
1.2 Tabellenverzeichnis
Tabelle 1: Original-Items, mit denen das Verhalten während der Untersuchung eingeschätzt wird (nach Conners
adaptiert) ....................................................................................................................................................... 21
Tabelle 2: HKS-Diagnosealgorithmus .................................................................................................................. 25
Tabelle 3: Schwellenwerte der SDQ-Skalen nach Goodman (www.sdqinfo.com)............................................... 36
Tabelle 4: Deskritpivstatistik der SDQ-Skalen gegliedert nach Stichprobe.......................................................... 40
Tabelle 5: Varianzanalytischer Vergleich der Skalenwerte zwischen den Stichproben........................................ 42
Tabelle 6: Kappa-Gewichte für die Berechnung der ordinalen Urteilsübereinstimmung ..................................... 43
Tabelle 7: Kappa-Ergebnisse des Reliabilitätstests gegliedert nach Items, Skalen und Gesamt-Mittelwert......... 45
Tabelle 8: Anteil auffälliger HKS-Scores (Schwellenwertmodell) gegliedert nach Stichprobe ........................... 47
Tabelle 9: Deskriptivstatistik des Impact-Scores in der Klinikstichprobe ............................................................ 47
1.3 Abbildungsverzeichnis
Abbildung 1: Altersverteilung der HKS-Rohwerte gegliedert nach Geschlecht und Stichprobe.......................... 38
Abbildung 2: Skalenmittelwerte mit 95%igem Konfidenzintervall gegliedert nach Stichprobe .......................... 41
3
2. Zusammenfassung
Das Hyperkinetische Syndrom (HKS) bzw. das Aufmerkamkeits-Defizit-HyperaktivitätsSyndrom (ADHS) gilt als die häufigste psychiatrische Störung im Kindes- und Jugendalters.
Prävalenzschätzungen gehen von etwa 5% betroffener Schulkinder aus. Trotz der erheblichen
gesundheitspolitischen Bedeutung der Prävalenz des ADHS/HKS liegen keine hinreichend
wissenschaftlich abgesicherten Daten für die Bundesrepublik Deutschland vor. Studien
insbesondere aus dem anglo-amerikanischen Sprachraum weisen erhebliche Schwankungen
bezüglich der Prävalenzen auf (4% bis 26%).
In dem Forschungsbericht wird die Notwendigkeit nationaler Prävalenzdaten erläutert.
Weiterhin werden Gründe für die erhebliche Schwankungsbreite bisheriger internationaler
Studien angeführt. In diesem Zusammenhang wird auf ein methodisches Artefakt verwiesen,
das bei dem Einsatz der klassischen dimensionalen Verfahren (SDQ, CBCL, Conners-Skalen)
zu einer Überschätzung der Prävalenz führt (Verletzung der Normalverteilungsannahme).
Vorschläge werden unterbreitet, dieser Überschätzung zu begegnen.
Als aktuell größte repräsentative bundesdeutsche Querschnittserhebung bietet sich im Kinderund Jugend Gesundheitssurvey, der unter Leitung von Frau Dr. Kurth am Robert-KochInstitut durchgeführt wird, die Gelegenheit, nationale Prävalenzdaten zu bestimmen. In
diesem Zusammenhang war es möglich, neben den bereits verfügbaren Fragebogenverfahren
ein Untersuchertraining sowie eine objektive Messung der motorischen Unruhe mittels RadarAktometrie in dem Kernsurvey zu verankern.
In einem Vergleich der Survey-Vorstudie (sog. Pretest mit n = 1.364 Kindern und
Jugendlichen) mit einer parallel gezogenen Inanspruchnahme-Stichprobe in der Klinik für
Kinder- und Jugendpsychiatrie (Leitung: Frau Prof. Lehmkuhl) an der Charité Berlin (n =
1.221) werden orientierende SDQ-Analysen zu Alters- und Geschlechtseffekten, sowie zur
Schätzung der ADHS/HKS-Prävalenz durchgeführt.
Es wird ein Algorithmus vorgestellt, nach dem nationale Prävalenzdaten berechnet werden
können. Methodische Stärken und Schwächen des Algorithmus werden diskutiert.
Schließlich erfolgt eine theoriegeleitete Schätzung der Prävalenz von ADHS/HKS. Es
resultiert ein oberer Schätzwert der Prävalenz von 3,9%.
4
3. Theoretischer Hintergrund: Der Bedarf an nationalen
Prävalenzdaten
Das Hyperkinetische Syndrom (HKS) bzw. die Aufmerksamkeits-Hyperaktivitäts-Störung
(ADHS) gilt als die häufigste psychische Auffälligkeit im Kindes- und Jugendalters. In einer
Vielzahl von Studien konnte gezeigt werden, dass insbesondere Kinder mit nicht behandeltem
ADHS/HKS eine ungünstige Prognose hinsichtlich ihrer persönlichen und beruflichen
Entwicklung haben. Erste Studien über die ökonomischen Auswirkungen der Störung lassen
die hohen Kosten erahnen, die dem Gesundheitssystem mittel- und langfristig durch
ADHS/HKS-Betroffene entstehen (Barkley 2002).
In den öffentlichen Medien ist ADHS/HKS seit Jahren ein kontroverses Thema. Dabei
werden die Symptome der Störung meist verkürzt dargestellt (z.B. ‚wirkt verträumt’; ‚hat
Wutausbrüche’; ‚bleibt nicht bei der Sache’), so dass bei verunsicherten Eltern schnell der
Eindruck entsteht, das eigene Kind sei ebenfalls betroffen. Merkmale, aus denen man ableiten
kann, dass das eigene Kind nicht betroffen ist, finden sich in den Beiträgen öffentlicher
Medien nur sehr selten.
Aus gesundheitspolitischer Sicht ist es von zentraler Bedeutung, eine intensive Aufklärung
über die tatsächlichen – und in der Regel wesentlich strengeren - Kriterien der Störung
anzustreben. Darüber hinaus gilt es zu klären, ob und wenn ja wo in Deutschland von Über-,
Unter-
und
Fehlversorgung
des
ADHS/HKS
auszugehen
ist.
Für
nahezu
alle
gesundheitspolitischen Ansätze ist die Kenntnis über die zu erwartende Häufigkeit der
Störung (Prävalenz) maßgeblich.
Über Definition, Diagnose und Behandlung des ADHS/HKS konnte in Deutschland in
Abstimmung
mit
den
internationalen
Fachgesellschaften
und
der
verfügbaren
wissenschaftlichen Evidenz ein breiter Konsens gefunden werden. Über die Prävalenz der
Störung liegen allerdings für die Bundesrepublik Deutschland bislang keine repräsentativen
Daten vor. Alle bisherigen Angaben beruhen auf Studien, die in anderen Ländern – meist in
den USA – durchgeführt wurden. Verfügbare deutsche Daten stammen entweder nicht aus
repräsentativen Stichproben bzw. legen Instrumente zugrunde, aus denen das Vorliegen eines
ADHS/HKS nicht abgeleitet werden kann (Schmeck et al. 2001).
5
Die Bedeutung nationaler Prävalenzdaten ist in mehrer Hinsicht erheblich:
A) Wie den Angaben des Statistischen Bundesamtes (www.destatis.de/basis/d/bevoe/bevoetab5.htm) zu entnehmen ist, lebten im Jahr 2002 in der Bundesrepublik Deutschland
7.791.100 Kinder im Alter zwischen 6 und 15 Jahren. Weichen die Prävalenzschätzungen um
einen Prozentpunkt nach oben ab, so entspricht dies bereits rund 80.000 Kindern, von denen
zusätzlich angenommen wird, dass sie psychisch erkrankt seien. Umgekehrt bedeutet eine
Unterschätzung der tatsächlichen Störung um einen Prozentpunkt, dass für die gleiche Anzahl
an Kindern dringend benötigte Therapieangebote möglicherweise nicht vorgehalten werden
und so dem ungünstigen Verlauf der Störung Vorschub geleistet wird.
B) Ist die Prävalenz der Störung bekannt, so lassen sich bei derzeit jährlich steigenden
Verordnungen von Methylphenidat frühe Rückschlüsse auf Arzneimittel-Missbrauch bzw.
nicht leitlinien-konforme Verordnungen ziehen (hierzu ist die Kenntnis zusätzlicher
Parameter erforderlich wie beispielsweise der zu erwartende Anteil der ADHS/HKS-Kinder,
die nach den therapeutischen Leitlinien eine pharmakologische Behandlung benötigen).
C) Angesichts steigender Verordnungen von Stimulanzien bei Kindern stellt sich die Frage,
ob wir es mit einer realen Zunahme an ADHS/HKS im Sinne einer erhöhten Inzidenz zu tun
haben. Auf der Basis mehrerer Prävalenzbestimmungen lassen sich epidemiologische
Aussagen zu einem möglichen Anstieg der Erkrankungshäufigkeit machen.
D) Die Prävalenz ist ein basaler Parameter der Versorgungsforschung. Nur auf der Grundlage
von zuverlässigen Prävalenzdaten lassen sich jeweils an den wirtschaftlichen und
gesellschaftlichen Verhältnissen optimierte Kosten-Nutzen-Modelle im Gesundheitswesen
realisieren.
E) Die Kenntnis der Prävalenz ist auch wichtig für die Evaluation von diagnostischen Tests in
der Medizin. Will man beispielsweise die positiven oder negativen Vorhersagewerte eines
Tests bewerten, so ist dazu die Kenntnis der Prävalenz der jeweiligen Störung erforderlich.
Was ist derzeit über die Prävalenz von ADHS/HKS in Deutschland bekannt?
In Lehrbüchern und populärwissenschaftlichen Arbeiten finden sich diesbezüglich erhebliche
Schwankungen. Unterschiede von bis zu 10 Prozentpunkte sind keine Seltenheit und hängen
angesichts fehlender nationaler Daten in erster Linie davon ab, welche internationale
Studienergebnisse auf Deutschland übertragen wurden.
Wir hatten oben bereits auf den nachhaltigen Effekt solcher ungenauer Prävalenzdaten
hingewiesen: In Absolutzahlen bedeutet für Deutschland ein Anstieg der Prävalenz um einen
6
Prozentpunkt, dass bei zusätzlichen 80.000 Kindern davon ausgegangen wird, dass sie an
einem ‚ADHS/HKS’ erkrankt sind.
Da wissenschaftlich hochwertige Erhebungen von nationalen Prävalenzdaten mit einem
erheblichen Forschungsaufwand verbunden sind, sei aus forschungsökonomischer Sicht
zunächst die Frage aufgeworfen, welcher Erkenntnisgewinn aus einem solchen Projekt zu
erwarten ist.
Ein wesentlicher Nutzen besteht darin, in Zukunft nicht mehr auf Daten anderer Länder insbesondere den USA - angewiesen zu sein und damit Fehleinschätzungen in Kauf nehmen
zu müssen. Damit ließen sich einer Reihe von Fehlerquellen ausschließen, die in Kapitel 4
noch genauer erläutert werden:
-
Kulturelle Einflüsse (je nach Kulturkreis werden unterschiedliche Verhaltensweisen in
unterschiedlichem Ausmaß als auffällig eingeschätzt)
-
Genetische Einflüsse (nationale Unterschiede hinsichtlich der genetischen Belastung;
beispielsweise wird durch die sog. Gen-shift-Hypothese eine höhere Prävalenz von
ADHS/HKS in den USA postuliert)
-
Einflüsse unterschiedlicher Klassifikationssysteme (in den USA wird nach DSM-IV,
in den meisten europäischen Ländern nach ICD-10 klassifiziert)
Der unter Leitung von Frau Dr. Kurth am Robert-Koch-Institut durchgeführte Kinder- und
Jugend Gesundheitssurvey (nachfolgend auch als Hauptsurvey bezeichnet) bietet eine
einzigartige Möglichkeit, nationale Prävalenzdaten zu bestimmen.
Gegenstand des vorgelegten Forschungsberichts ist es, Möglichkeiten und Grenzen
aufzuzeigen, wie anhand der Daten aus dem Gesundheits-Survey möglichst valide ADHDPrävalenzschätzungen für Deutschland vorgenommen werden können. Darüber hinaus
werden Ergebnisse des Pretests im Vergleich zu einer Klinikstichprobe sowie Ergebnisse des
Untersucher-Trainings im Hauptsurvey mitgeteilt.
7
4. Was ist bekannt?
Auf den mittlerweile zahlreichen Konsensuskonferenzen über ADHS/HKS werden einheitlich
Prävalenzen von ca. 5% angenommen. Die Forschungsliteratur zeigt im Gegensatz zu diesen
Schätzwerten allerdings ein sehr heterogenes Bild.
Eine gründliche Sichtung der verfügbaren US-amerikanischen Originalarbeiten aus dem
Publikationszeitraum von 1980 bis 1997 haben Brown und Mitarbeiter (2001) vorgelegt. Wie
die Autoren betonen, variieren die empirisch ermittelten Prävalenzdaten für ADHS erheblich.
Sie reichen von 4% (Pelham et al. 1992) bis 26% (Newcorn et al. 1994). Erwartungsgemäß
werden die Ergebnisse von dem zu Grunde gelegten Diagnose-Schema (DSM III, DSM-IIIR
oder DSM-IV) beeinflusst. Auch die Erhebungsmethoden (Interview vs. Fragebogen) und die
Art der Informationsquellen (Eltern-, Lehrer-, Selbst-, Klinikerurteil bzw. entsprechende
Kombinationen) wirken sich auf die Prävalenz aus.
Weiterhin sind demographische Einflüsse (Stadt vs. Land), kulturelle, ethnische, sozioökonomische und insbesondere geschlechtsbezogene Effekte bekannt (Wender 2002).
Bislang liegt nur eine Arbeit vor, die auf Interview-Daten nach dem 1994 veröffentlichten,
aktuellen amerikanischen Klassifikationssystem (DSM-IV) beruht. Es handelt sich dabei um
die Studie von Wolraich und Mitarbeitern (1998), die an 4.323 Kindergarten- und
Schulkindern bis zur fünften Klasse durchgeführt wurde. Ein wesentliches Qualitätsmerkmal
der Studie ist es, dass - in Übereinstimmung mit den aktuellen diagnostischen Kriterien - die
Beeinträchtigung des psychosozialen Funktionsniveaus berücksichtigt wurde. Wolraich et al.
(1998) ermittelten eine Prävalenz für alle Subtypen von ADHS von insgesamt 6,8%.
Ist dieser Wert auch für Deutschland zu erwarten? Wie eingangs erwähnt, sollten
transkulturelle Verallgemeinerungen insbesondere bei kinderpsychiatrischen Störungsbildern
nur mit großer methodischer Zurückhaltung oder gar nicht erfolgen, da mit einer Vielzahl von
Fehlerquellen zu rechnen ist. Diese seien nachfolgende im Detail erläutert:
A) Wie in einer kulturvergleichenden Studie (Huss et al. 2002) gezeigt werden konnte,
weisen beispielsweise die Conners-Skalen (Conners 1989), die bis heute als
‚Klassiker’ in der ADHS/HKS-Forschung gelten, deutliche Unterschiede im
Urteilsverhalten deutscher und US-amerikanischer Eltern auf. Die Unterschiede
beruhen nicht auf einfachen ‚Sollwertverschiebungen’, die aus methodischer Sicht
ohne großen Aufwand durch eine Lineartransformation korrigiert werden könnten.
8
Vielmehr
zeigte
sich,
dass
die
drei
Hauptsymptome
des
ADHS
(Aufmerksamkeitsprobleme, mangelnde Impulskontrolle und gesteigerte motorische
Unruhe) unterschiedlich anfällig für Kultureffekte sind.
Während für die Aufmerksamkeitsstörungen nahezu keine Unterschiede zwischen den
Kulturen nachweisbar waren, fanden wir bei der Einschätzung der motorischen
Unruhe mittelgradige Unterschiede. Die stärksten Abweichungen waren für die
Störungen
der
Impulskontrolle
(impulsives
und
aggressives
Verhalten)
zu
verzeichnen. Ohne differenzierte Kenntnis dieser Effekte lassen sich deutsche Daten
nicht mit hinreichender Sicherheit als auffällig oder unauffällig einschätzen.
Darüber hinaus konnte unsere Arbeitsgruppe zeigen, dass es bei international
eingesetzten Fragebogen möglicherweise kulturgebundene semantische Effekte gibt,
die sich bis in die Faktorenstruktur hinein nachweisen lassen (Huss et al. 2001). Auch
unter diesem Gesichtspunkt ist eine nationale Validierung internationaler Verfahren
geboten.
B) US-amerikanische
Studien
beruhen
auf
dem
Klassifikationssystem
der
Amerikanischen Psychiatrischen Gesellschaft (APA), dem sog. DSM-IV. In
Deutschland sind die Ärzte jedoch verpflichtet, nach dem Klassifikationssystem der
WHO, der sog. ICD-10 zu diagnostizieren. Hinsichtlich der Items unterscheiden sich
beide Systeme nicht, so dass eine Transformation auf Itemebene möglich ist.
Unterschiede ergeben sich allerdings in dem Algorithmus, nach dem die Diagnose auf
der Grundlage der Items gestellt wird. So fasst das DSM-IV die beiden
Hauptkategorien ‚Impulsivität’ und ‚Hyperaktivität’ zu einer Klasse zusammen. Das
ICD-10 trennt diese. Andererseits müssen nach DSM-IV die Symptome nur in zwei
von drei Settings (Familie, Schule, Praxis/Klinik) auftreten. Nach Lesart des ICD-10
müssen dagegen die Probleme in allen drei Settings nachweisbar sein. Die DSM-IV
Kriterien sind damit insgesamt als ‚weicher’ einzuschätzen, was mit einer höheren
Prävalenz der Störung einhergeht.
C) Die bisherige Forschung über die Ursachen der Störung weist auf starke genetische
Einflussfaktoren hin. Berechnungen auf der Grundlage von Zwillingsstudien ergaben
einen genetischen Anteil von bis zu 80% (Ding et al. 2002). Man geht heute von
einem polygenetischen Erbgang mit variabler Genexpression aus. Als maßgebliche
9
genetische Einflussgrößen haben sich Allele des DRD4 Gens und des DAT1 Gens
erwiesen. International vergleichende Genanalysen, wie sie beispielsweise von Prof.
Swanson (persönliche Kommunikation, 2002; (Ding et al. 2002)) vorgestellt wurden,
legen für das 7bp-repeat Allel des D4-Rezeptors eine Wanderbewegung nach
Nordamerika nahe (Teil der sog. Gen-Shift-Hypothese). Auf der Grundlage dieser
Befunde muss zwischen den Kontinenten eine unterschiedliche genetische Disposition
in Betracht gezogen werden. Dies müsst sich auch in den jeweiligen Prävalenzdaten
niederschlagen.
In der wegweisenden Studie von Wolraich et al. (1998) findet sich ein weiteres wichtiges
Detail: Die ermittelte Prävalenz von 6,8% kommt nur dann zustande, wenn neben den
Symptomausprägungen auch die Auswirkungen auf das sog. psychosoziale Funktionsniveau
des Kindes berücksichtigt werden. Wird nur aufgrund der Symptome, nicht aber aufgrund der
damit verbundenen Einschränkung des Funktionsniveaus bewertet, so steigt die Prävalenz auf
16% an.
Wie kommt es zu diesem erheblichen Anstieg?
Bekanntermaßen lässt sich kein psychiatrisches Krankheitsbild ausschließlich nach der
Quantität von Symptomen definieren. Maßgeblich ist immer die Auswirkung auf die Person
bzw. das psychosoziale Umfeld. Man spricht in diesem Zusammenhang von dem sog.
Leidensdruck, den ein bestimmtes Symptom oder ein Symptomkomplex bewirkt.
Psychometrisch erfasst werden die Auswirkungen der Störung in der Regel durch das bereits
erwähnte psychosoziale Funktionsniveau.
Dies gilt auch für ADHS/HKS. Als Spezifikum kommt jedoch hinzu, dass die drei
Hauptsymptome des ADHS – mangelnde Aufmerksamkeit, Impulsivität und motorische
Unruhe – jeweils ein Kontinuum darstellen. Jungen sind insgesamt über alle Altersstufen
hinweg stärker betroffen als Mädchen.
Damit wird auch verständlich, warum in der Studie von Wolraich et al. (1998) unter
Missachtung des psychosozialen Funktionsniveaus überproportional viele Jungen zusätzlich
in die diagnostische Kategorie ‚ADHS’ fallen. Aus biologischer Sicht muss angenommen
werden, dass u.a. das dopaminerge System bei Jungen quantitativ und möglicherweise auch
qualitativ anderen Entwicklungsprozessen unterworfen ist. Das gruppenstatistisch über alle
Bevölkerungen und Kulturen hinweg bei Jungen vermehrt nachweisbare Symptom der
motorischen
Unruhe
darf
-
auch
in
Kombination
mit
einer
geringeren
Aufmerksamkeitsleistung und einer geringeren Impulskontrolle – nicht mit einer
10
kinderpsychiatrischen Störung gleichgesetzt werden, allenfalls mit einem Risikofaktor für
ADHS/HKS.
Der Vorgang, wie aus einem Symptom eine Störung wird, ist wesentlich komplexer:
ADHS/HKS generiert sich erst in einem Wechselverhältnis zwischen den biologischen und
kognitiven Möglichkeiten des Kindes und den Anforderungen, die an das Kind gestellt
werden (sog. Stress-Diathese-Modell). Unter günstigen psychosozialen und pädagogischen
Förderbedingungen kann ein genetisch belastetes Kind seine Anlage zu einem gewissen
Grade kompensieren. Eine medikamentöse Behandlung lässt sich möglicherweise vermeiden
(Huss 2002). Umgekehrt werden Kinder trotz eines geringeren genetischen Risikos
psychiatrisch auffällig, wenn sie unter sehr ungünstigen Bedingungen leben.
Wie die Studie von Wolraich et al. (1998) eindrücklich zeigt, müssen stärkere
Symptomausprägungen
bei
Jungen
nicht
mit
einer
Störung
im
Sinne
einer
kinderpsychiatrischen Erkrankung einhergehen. Es ist davon auszugehen, dass das
psychosoziale Umfeld die stärker ausgeprägte Unruhe- und Impulsivität bei Jungen zum Teil
kompensiert.
Bei der Bestimmung von ADHS/HKS-Prävalenzdaten spielt daher das psychosoziale
Funktionsniveau eine maßgebliche moderierende Rolle.
Die Arbeit von Wolraich wurde in diesem Forschungsbericht exemplarisch herausgegriffen,
weil es sich dabei um eine der wenigen Studien handelt, in der mit strukturierten Interviews
diagnostiziert wurde. Dieses Verfahren ist aus zeitökonomischen Gründen im Rahmen des
Gesundheitssurveys nicht realisierbar. Die Prävalenzschätzung muss daher auf der Basis von
Fragebogen- und Beobachtungs- und Messverfahren erfolgen.
11
5. Der Gesundheits-Survey des Robert-Koch-Instiuts als Grundlage
einer deutschen Prävalenzschätzung
Bei dem Kinder- und Jugend-Gesundheitssurvey handelt es sich um die erste umfassende und
bundesweit repräsentative Untersuchung zur gesundheitlichen Lage von Kindern und
Jugendlichen in Deutschland (www.kiggs.de). Die Studie ist als Querschnittsdesign
konzipiert. Die Grundgesamtheit umfasst alle Kinder und Jugendlichen im Alter zwischen 0
und 18 Jahren. Die Stichprobenziehung erfolgt nach festgelegten Repräsentativitätskriterien
anhand des Einwohnermeldeamt-Registers. Angestrebt wird eine Stichprobe von 17.100
Kindern und Jugendlichen, die in 150 Erhebungszentren bundesweit untersucht werden. Die
Studie durchlief eine Reihe von wissenschaftlichen Begutachtungen. Im Rahmen des sog.
Pretests an 1.630 Kindern und Jugendlichen konnte die Durchführbarkeit der Studie erprobt
und die potentielle Umsetzung der wissenschaftlichen Fragestellungen überprüft werden. Eine
ausführliche Beschreibung des Pretests findet sich bei Kurth und Mitarbeitern (2002).
Der Kinder- und Jugend-Gesundheitssurvey deckt folgende Themengebiete ab (siehe
Kurzbeschreibung des Projekts im PDF-Format unter www.kiggs.de).
Körperliche Beschwerden und Befindlichkeit
Akute und chronische Krankheiten
Behinderungen
Gesundheitsrisiken, Unfälle
Psychische Gesundheit und Verhaltensauffälligkeiten
Subjektive Gesundheit (Lebensqualität)
Soziale Kontakte, soziales Netz, Unterstützungsprogramme
Personale Ressourcen (Schutzfaktoren für eine gesunde psychische Entwicklung)
Ernährung, Essstörungen, Adipositas
Gesundheitsverhalten und Freizeitaktivitäten
Medikamentenkonsum, Impfstatus
Inanspruchnahme medizinischer Leistungen
12
Der Kinder- und Jugend-Gesundheitssurvey bietet hinsichtlich der Repräsentativität und des
Stichprobenumfangs nahezu optimale Bedingungen für eine Prävalenzbestimmung des
ADHS/HKS, die auf absehbare Zeit nicht mehr in dieser Form gegeben sein werden.
Angesichts des fortgeschrittenen Stadiums der Studienplanung (die Fragebogen für den
Hauptsurvey waren bereits in der Drucklegung; der Pretest war bereits abgeschlossen) sowie
des damit verbundenen hohen Zeitaufwandes, war die Durchführung eines strukturierten
kinderpsychiatrischen Interviews aus zeitlichen und organisatorischen Gründen nicht
realisierbar. Das NIMH-DISC als das bekannteste strukturierte Interview benötigt je nach
Komorbidität zwischen 1,5 bis 2,5 Stunden Untersuchungszeit. Für die Durchführung des KSADS als dem am häufigsten verwendeten semistrukturierten Interview sind ähnliche
Untersuchungszeiten zu veranschlagen.
Nach den heutigen international anerkannten Leitlinien für die Diagnose und Therapie des
ADHS/HKS kann eine Diagnose nur auf der Grundlage eines klinisch fundierten Interviews
gestellt werden. Mittels Fragebogen, Verhaltenseinschätzungen durch die Eltern, Angaben
über Probleme in der Schule, systematische Beobachtungen trainierter Untersucher, sowie
objektive Befunde (Aktometrie) lässt sich jedoch mit hinreichender Sicherheit eine Aussage
über das wahrscheinliche Vorliegen der Störung und somit über die Prävalenz machen. Dieses
Vorgehen wird instrumentenbezogen durch vergleichende Analysen untermauert, die an über
1.200 Patienten unserer Klinik mit dem gleichen Verfahren (SDQ) durchgeführt wurden.
Der Gesundheitssurvey beinhaltet ein reichhaltiges Instrumentarium, das auf der Grundlage
eines a-priori zu erstellenden Algorithmus als Approximation einer Diagnose genutzt werden
kann.
Eine wünschenswerte Ergänzung um eine 18 Items umfassende Diagnose-Checkliste
(SWAN) musste aus forschungsökonomischen Gründen und aus den bereits genannten
Gründen der nahezu abgeschlossenen Studienplanung fallengelassen werden. Der Vorteil des
SWAN hätte in seiner spezifischen Ausrichtung auf die ADHS-Kriterien und seiner
Verteilungseigenschaften gelegen, die den Erfordernissen epidemiologischer Studien
angepasst sind. Der SWAN ist das derzeit einzige international etablierte Verfahren, das die
Voraussetzungen einer Normalverteilung hinreichend erfüllt.
Wie Swanson und Mitarbeiter (submitted) zeigen konnten, fallen Prävalenzbestimmungen auf
der Grundlage dimensionaler Verfahren mit Likert-Antwortskalen (z.B. SDQ, CBCL,
Conners-Skalen) aufgrund der Verletzung der Normalverteilungsannahme zu hoch aus. Diese
13
Verzerrung muss bei der Interpretation der Ergebnisse des Gesundheitssurveys berücksichtigt
werden.
Ein Schwerpunkt des vorgelegten Forschungsberichts ist es, auf der Grundlage der
internationalen ADHS/HKS-Forschungskriterien einen Auswertungsalgorithmus für das
verfügbare Datenmaterial zu erstellen und Erweiterungsmöglichkeiten aufzuzeigen und ggf.
zu implementieren, mit denen das angestrebte Ziel einer validen Prävalenzschätzung
verbessert werden kann.
Mit dem beschriebenen Algorithmus lässt sich in einem weiteren Analyseschritt unter
Hinzuziehung von Daten über die Einnahme von Stimulanzien abschätzen, ob diejenigen
Kinder medikamentös behandelt wurden, die aufgrund der Symptomausprägung ihres
ADHS/HKS ein solches Vorgehen nahe legen.
Da die Angaben über den Medikamentengebrauch in dem Pretest nur aus Gründen der
Studiendurchführbarkeit, nicht aber zur Beantwortung der Frage einer leitlinien-orientierten
Behandlung von ADHS/HKS erhoben wurden und keinen Anspruch auf Repräsentativität
haben, wurden Medikamenten-bezogene Auswertungen von Seiten des RKI im Sinne guter
wissenschaftlicher Praxis nicht durchgeführt. Darüber hinaus wurden im Pretest auch nur die
Medikamente der vergangenen 7 Tage erfasst. Kinder, die jemals im Rahmen ihres
ADHS/HKS mit Stimulanzien behandelt wurden, wären nicht berücksichtigt worden. Die
große Stichprobe des Hauptsurveys sowie deren Repräsentativität stellt hingegen sicher, dass
ein valides Abbild des zum Befragungszeitpunkt aktuellen Medikamentengebrauchs für
Psychostimulanzien bei Kindern erstellt werden kann.
6. Hohe Prävalenzdaten in der Forschungsliteratur: Ein
methodisches Artefakt?
Bisherige Prävalenzdaten auf der Grundlage von dimensionalen Fragebogenverfahren – wie
etwa der Conners Rating Scale (CRS), der Child Behavior Checklist (CBCL) oder des
Strengths and Difficulties Questionnaires (SDQ) – erwiesen sich in der Vergangenheit als
erstaunlich hoch. Prävalenzwerte von über 10% der Schulkinder sind dabei nicht unüblich.
Dabei stellt sich die Frage, ob bei solch hohen Prävalenzwerten noch sinnvollerweise von
14
einer Krankheit im engeren Sinn gesprochen werden kann. Würden alle anderen
Störungsbilder zusätzlich einbezogen, so wäre jedes zweite bis dritte Kind psychiatrisch
krank.
Das dimensionale Störungskonzept, das den genannten Instrumentarien (CRS, CBCL, SDQ)
zugrunde liegt, geht davon aus, dass Merkmale wie eine kurze Aufmerksamkeitsspanne,
Impulsivität und motorische Unruhe in der Bevölkerung normalverteilt sind. Die Berechnung
der
jeweiligen
Cut-off
Werte
erfolgt
daher
immer
an
bevölkerungsbezogenen
Normstichproben.
Üblicherweise werden mehr als zwei Standardabweichungen von der Norm oder Werte
oberhalb
der
95.
Perzentile
als
auffällig
eingeschätzt.
Je
nach
Fragestellung
(einseitig/zweiseitig) sind demnach extreme Werte in etwa 2,5% bzw. 5% der Fälle zu
erwarten. Robert Goodman (2001) hat abweichend von diesem Konzept für die SDQ die 90.
Perzentile als Cut-off für auffälliges Verhalten als und die 80. Perzentile als grenzwertig
definiert.
Obwohl das zugrunde gelegte Störungskonzept (und vermutlich auch die reale Verteilung in
der Bevölkerung) am besten durch eine Normalverteilung beschrieben werden kann, führen
die Itemformulierungen und die vorgegebenen Antwortmuster (z.B. 0 = überhaupt nicht, 1 =
ein wenig, 2 = ziemlich, 3 = sehr stark) in epidemiologischen Stichproben zu extrem schiefen,
J-förmigen Verteilungen, in denen die erste Antwortkategorie
(0 = überhaupt nicht)
dominiert.
Dies konnte durch Ullmann und Mitarbeiter (1985) für die Conners-Skalen gezeigt werden.
Für die CBCL, die SDQ wie auch für die ADHD-Checkliste SNAP sind die J-förmigen
Verteilungen in epidemiologischen Studien hinlänglich bekannt.
Swanson und Mitarbeiter (Swanson et al. submitted) berechneten, dass die Verletzung der
Normalverteilungsannahme die Prävalenz der Störung um absolut 3% bis 4% überschätzt.
Dieser Effekt ist darauf zurückzuführen, dass die Verteilung der Merkmale im unteren
Bereich abgeschnitten ist.
Swanson und Mitarbeiter (submitted) adaptierten daher die nach den bisherigen Likert-Skalen
konstruierte SNAP, indem die Itemformulierungen neutraler bzw. positiver wurden (z.B.
SNAP-Item 9: ‚Ist bei alltäglichen Aufgaben häufig vergesslich’; SWAN-Item 9: ‚Denkt an
alltägliche Aufgaben’).
Die daraus resultierende SWAN vermeidet J-förmige Verteilungen und kommt dem Desiderat
normalverteilter Skalen in epidemiologischen Studien sehr nahe. Um die Normalverteilung
der Merkmale besser abbilden zu können, wurde auch die negativ formulierte Antwortskala in
15
eine 7stufige symmetrische Skala verändert, deren Ausprägungen auf den (neutralen)
Durchschnitt bezogen werden (-3 = deutlich unterhalb des Durchschnitts, -2 = unterhalb des
Durchschnitts, -1 = geringfügig unterhalb des Durchschnitts, 0 = Durchschnitt, 1 =
geringfügig oberhalb des Durchschnitts, 2 = oberhalb des Durchschnitts, 3 = deutlich oberhalb
des Durchschnitts).
In einer Studie mit 847 Schülern (Swanson et al. submitted) konnte nachgewiesen werden,
dass mit der neuen Formulierung keine Verletzungen der Normalverteilung mehr auftraten.
Damit eignet sich die SWAN für Prävalenzbestimmungen in epidemiologischen Studien.
Verteilungsbedingte Überschätzungen der Prävalenz von ADHS/HKS sind mit der SWAN
nicht mehr zu erwarten.
Aufgrund des weit fortgeschrittenen Planungsstadiums des Hauptsurveys sowie aus
forschungsökonomischen Gründen bei bereits als maximal einzuschätzender Belastung der
Probanden musste auf die Ergänzung des SWAN verzichtet werden. Da der Survey sehr breit
angelegt ist und die psychische Gesundheit in dem Fragen- und Untersuchungsspektrum
bereits einen sehr großen Raum einnimmt, hätte die zusätzliche Einführung des SWAN eine
Überfrachtung des Untersuchungsablaufs bedeutet und wäre möglicherweise mit einer
höheren Verweigerungsrate und damit verbundenen Einbußen bei der Repräsentativität
einhergegangen.
Die Repräsentativität und die Stichprobengröße sind wesentliche Qualitätsmerkmale des
Survey, die nicht beeinträchtigt werden sollten. Der vorgelegte Algorithmus greift daher auf
verfügbare Daten zu, ordnet diese gemäß den internationalen Forschungskriterien einem
Bewertungs-Schema zu und ergänzt dieses durch A) trainierte Beobachtungsdaten und B)
objektive Daten. Die Schlussfolgerungen werden durch vergleichende Analysen an einer
parallel erhobenen Klinikstichprobe validiert.
16
7. Operationalisierung der Forschungsfrage im Hauptsurvey
7.1 Forschungskriterien
Die Operationalisierung der Forschungsfrage erfolgt nach den ICD-10 Forschungskriterien,
die nachfolgend in Originalformulierung aufgelistet sind.
Erstes ICD-10 Hauptkriterium G1 ‚Unaufmerksamkeit’
Mind. 6 Monate bestanden mind. 6 der folgenden Kriterien:
(cave: Entwicklungsstand berücksichtigen!)
Die Kinder
1.
2.
3.
4.
5.
6.
7.
8.
9.
sind häufig unaufmerksam gegenüber Details oder machen Flüchtigkeitsfehler bei den
Schularbeiten und sonstigen Arbeiten und Aktivitäten
sind häufig nicht in der Lage, die Aufmerksamkeit bei Aufgaben und beim Spielen
aufrechtzuerhalten
hören häufig scheinbar nicht, was ihnen gesagt wird
können oft Erklärungen nicht folgen oder ihre Schularbeiten, Aufgaben oder Pflichten
am Arbeitsplatz nicht erfüllen (nicht wegen oppositionellem Verhalten oder weil die
Erklärungen nicht verstanden werden können)
sind häufig beeinträchtigt, Aufgaben und Aktivitäten zu organisieren
vermeiden ungeliebte Arbeiten, wie Hausaufgaben, die geistiges Durchhaltevermögen
erfordern
verlieren häufig Gegenstände, die für bestimmte Aufgaben oder Tätigkeiten wichtig
sind, z.B. Unterrichtsmaterialien, Bleistifte, Bücher, Spielsachen und Werkzeuge
werden häufig von externen Stimuli abgelenkt
sind im Verlauf der alltäglichen Aktivitäten oft vergesslich.
Zweites ICD-10 Hauptkriterium G2 ‚Überaktivität’
Mind. 6 Monate bestanden mind. 3 der folgenden Kriterien
(cave: Entwicklungsstand berücksichtigen!)
Die Kinder
1.
2.
zappeln häufig mit Händen und Füßen oder winden sich auf den Sitzen
verlassen ihren Platz im Klassenraum oder in anderen Situationen, in denen
Sitzenbleiben erwartet wird
17
3.
4.
5.
laufen häufig herum oder klettern exzessiv in Situationen, in denen dies unpassend ist
(bei Jugendlichen oder Erwachsenen entspricht dem möglicherweise nur ein
Unruhegefühl)
sind häufig unnötig laut beim Spielen oder haben Schwierigkeiten, sich ruhig mit
Freizeitbeschäftigungen zu befassen
zeigen ein anhaltendes Muster exzessiver motorischer Aktivitäten, die durch die
soziale Umgebung oder Vorschriften nicht durchgreifend beeinflussbar sind.
Drittes ICD-10 Hauptkriterium G3 ‚Impulsivität’
Mind. 6 Monate bestanden mind. eines der folgenden Kriterien
(cave: Entwicklungsstand berücksichtigen!)
Die Kinder
1.
2.
3.
4.
platzen häufig mit der Antwort heraus, bevor die Fragen beendet sind
können häufig nicht in einer Reihe warten oder warten, bis sie bei Spielen oder in
Gruppensituationen an die Reihe kommen
unterbrechen und stören andere häufig (z.B. mischen sie sich ins Gespräch oder Spiel
anderer ein)
reden häufig exzessiv, ohne angemessen auf soziale Beschränkungen zu reagieren.
Zusatzkriterium: ‚Erstmaliges Auftreten’
Die Störung muss vor dem siebten Lebensjahr erstmalig aufgetreten sein
Zusatzkriterium: ‚Setting-Kriterium’
Die Störung muss situationsübergreifend d.h. in mehr als einem Setting (Familie, Schule,
Untersuchungssituation) auftreten.
Zusatzkriterium: ‚Zeitstabilität’
Die Störung muss über mind. 6 Monate bestehen. Angesichts der genetischen bzw.
neurobiologischen
Einflussfaktoren
muss
allerdings
eine
lebenslange
Disposition
angenommen werden, was viele Expertengremien dazu veranlasst hat, das 6-MonatsKriterium als methodische Untergrenze insbesondere bei jüngeren Kindern anzusehen, die in
der Praxis hinsichtlich der Dauer der Symptomausprägungen weit übertroffen werden sollte.
18
7.2 Im Hauptsurvey bereits implementierte Items
7.2.1 Strengths and Difficulties Questionnaire (SDQ)
Ein zentraler Baustein für Einschätzung psychischer Auffälligkeiten im Kinder- und Jugend
Gesundheitssurvey stellt der 25 Items umfassende Screening-Fragebogen Strengths and
Difficulties Questionnaire (SDQ) von Robert Goodman (1997) dar. Für das Instrument liegen
umfassende Daten des British Child Mental Health Survey aus dem Jahr 1999 vor. Der
britische Survey wurde an 10.438 Kindern und Jugendlichen im Alter von 5 bis 15 Jahren
durchgeführt und stellt eine ideale Vergleichsmöglichkeit für den deutschen Survey dar.
Goodman und Mitarbeiter (Goodman et al. 2000) haben zusätzlich eine Analyse über die
Prädiktion kinderpsychiatrischer Störungen mittels des SDQ auf der Grundlage der britischen
Surveys vorgelegt, die für unsere Forschungsfrage eine wichtige Bezugsgröße darstellt.
Der britische Survey unterscheidet sich jedoch in wesentlichen Punkten von dem deutschen
Survey, die für die Güte der ADHD-Prävalenzschätzung relevant sind.
Im Gegensatz zu dem deutschen Survey wurden in der britischen Studie neben den ElternSDQ auch die korrespondierenden Lehrer-SDQ sowie die Schüler-SDQ (ab 11 Jahren)
erhoben. Zusätzlich wurde ein Interview auf der Basis einer Batterie von Fragebogen, Tests
und strukturierten Interview-Items durchgeführt. Das Datenmaterial wurde von Klinikern
gesichtet und sowohl dem ICD-10 als auch dem DSM-IV Schlüssel zugeordnet. Die
klinischen Rater waren blind gegenüber den SDQ-Daten.
Die Spezifität des SDQ für eine psychiatrische Diagnose lag insgesamt bei 94,6% mit einem
95%igen Konfidenzintervall zwischen 94,1% und 95,1%. Die Sensitivität wurde mit 63,3%
(KI 59,7 – 66,9%) berechnet.
In dem deutschen Survey werden diese Werte etwas schlechter ausfallen, da sich die Zahl der
Informanten unterscheidet: Der britische Survey bezieht Eltern-SDQ, Lehrer-SDQ und auch
das Selbsturteil in Form des Schüler-SDQ (ab 11 Jahren) ein. Der deutsche Survey beschränkt
sich auf das Elternurteil.
Des Weiteren fehlt in dem deutschen Survey die Impact Skala des SDQ, was eine
Einschätzung des psychosozialen Funktionsniveaus erschwert. Wie bereits in den ersten
Kapiteln des Berichts erläutert, ist nicht nur die Symptomausprägung, sondern auch der
daraus resultierende Leidensdruck für die diagnostische Einschätzung von Bedeutung.
19
In dem hier vorgelegten Abschlussbericht wird mittels einer parallel gezogenen
Klinikstichprobe eine Grundlage geschaffen, den Impact-Score auf konservativem Wege zu
schätzen.
Insgesamt ist in dem deutschen Survey von einer geringeren Prädiktionskraft für die
ADHS/HKS-Prävalenz auf der Grundlage der SDQ- und begleitenden Daten auszugehen. In
Abwägung der methodischen Einschränkungen bezogen auf die Bestimmung des ADHS/HKS
und der ansonsten optimalen Survey-Bedingungen (Repräsentativität, Stichprobengröße)
sollten jedoch die avisierten Analysen zur Bestimmung der Prävalenz und Behandlung von
Kindern mit ADHS/HKS vorangetrieben werden, da sie die auf absehbare Zeit einzigen und
aussagekräftigsten
Ergebnisse
darstellen
werden
und
somit
von
erheblichen
gesundheitspolitischen Nutzen sind.
7.2.2
Rating trainierter Beobachter
Die Interviewer des Gesundheitssurvey wurden anhand von Videomaterial der Klinik
geschult. Das Videomaterial rekrutierte sich aus 130 Filmen aus der BfArM-Langzeitstudie
von Kindern und Jugendlichen, die multiaxial mittels strukturierten kinderpsychiatrischen
Interviews diagnostiziert wurden. Ergänzt wurde das Videomaterial durch exemplarische
Bänder von Patienten unserer Klinik. Für die forschungsbezogene Verwendung der Bänder
für Trainingszwecke liegt ein schriftliches Einverständnis vor.
Das Training wurde am 9. Mai 2003 in Berlin durchgeführt. Zunächst erfolgte eine
umfassende theoretische Schulung bezüglich der diagnostischen Kriterien, insbesondere
bezüglich der drei Hauptsymptome Aufmerksamkeitsstörung, Impulskontrollstörung und
motorische Unruhe. In der sich anschließenden Trainingsphase wurden die Untersucher an
Videobeispielen unterrichtet, die drei Hauptsymptome einzuschätzen. Am Ende der Schulung
erfolgte die Überprüfung der Interrater-Reliabilität an 5 ausgewählten Videobändern.
Ziel des Trainings war eine möglichst hohe Urteils-Übereinstimmung (Inter-Rater
Reliabilität) der Untersucher auf 6 Items mit vierfach gestuften Likert-Skalen. Die Items,
deren Wortlaut in Tabelle 1 wiedergeben ist, sind den Conners-Skalen entnommen. Den drei
Hauptsymptomen des ADHS/HKS sind jeweils zwei Items zugeordnet.
20
Bitte beschreiben Sie das Kind / den Jugendlichen während der Untersuchung
überhaupt
ein wenig
ziemlich
sehr stark
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
nicht
War unruhig, zappelig
Konnte sich schlecht auf die Aufgaben
konzentrieren
War erregbar, impulsiv
War leicht ablenkbar
Redete dazwischen
Konnte nicht lange stillsitzen
Tabelle 1: Original-Items, mit denen das Verhalten während der Untersuchung eingeschätzt wird (nach
Conners adaptiert)
Die Interviewer benötigten für das Training keine fachspezifischen Vorkenntnisse. Angestrebt
wurde ein Kappa-Wert von über .80, was einer exzellenten Urteilsübereinstimmung
entspricht.
Cohen (1960, 1968) hatte den Kappa-Koeffizienten ursprünglich für die Übereinstimmung
zweier Beurteiler konzipiert, die mehrere Probanden einschätzen. Für nominale Daten wird
der klassische Kappa-Koeffizient angewendet, für ordinale Daten erfolgt die Berechnung der
Urteilsübereinstimmung nach dem gewichteten Kappa (sog. weighted Kappa). Der klassische
Kappa-Koeffizient berechnet sich nach po – pe / 1 – pe, wobei po für die beobachtete
Häufigkeit der jeweiligen Urteilskategorie und pe für die aus den Randverteilungen geschätzte
zufällige Urteilsübereinstimmung steht. Wie der Formel zu entnehmen ist, gibt der KappaKoeffizient darüber Auskunft, wie gut zwei Beurteiler über die zufällige Übereinstimmung
hinaus in ihrem Urteil übereinstimmen. Damit ist der Kappa-Koeffizient ein überaus
konservatives Mass. Wie bereits erwähnt, gelten Kappa-Werte von über .80 in der
sozialwissenschaftlichen Forschung als exzellente Übereinstimmung. Der gewichtete KappaKoeffizient berücksichtigt nicht nur die Urteile, die exakt übereinstimmen, sondern im Falle
unterschiedlicher Einschätzungen auch das Ausmaß der jeweiligen Abweichung. Bei der von
21
uns eingesetzten 4fach gestuften Likert-Skala handelt es sich um ein ordinales Skalenniveau.
Somit ist der gewichtete Kappa-Koeffizient als das angemessene Verfahren für die
Berechnung der Urteilsübereinstimmung anzusehen.
Cohen (1960, 1968) hatte den Kappa-Koeffizienten für die Übereinstimmung von zwei
Beurteilern entwickelt, und bereits auf Möglichkeiten hingewiesen, diesen für mehrere
Urteiler zu erweitern. Der Kappa-Koeffizient für mehrere Urteiler wurde dann von Fleiss
(1971) realisiert. Konsistente Kennwerte des Fleiss’schen Kappa-Koeffizienten sind erst bei
hinreichend vielen Urteilen zu erwarten (z.B. erwartete Zellhäufigkeit von pe >= 5). Im
Rahmen des Untersuchertrainings lagen jedoch Urteile von 8 Untersuchern über 5
exemplarische Videobänder vor. Viele der über die Randverteilungen geschätzten erwarteten
Zellhäufigkeiten hätten in unserem Falle den von Fleiss (1971) vorausgesetzten Kriterien
nicht genügt. Daher entschieden wir uns für ein von Bortz und Koautoren (1997)
favorisiertes, konservatives Vorgehen und berechneten Mittelwerte der klassischen KappaWerte, die sich aus allen möglichen Urteiler-Paaren ergaben. Die Anzahl möglicher
Urteilerpaare bei 8 Untersuchern berechnet sich nach der Formel: 8! / 2! x 6!. Somit ergeben
sich bei 8 Untersuchern 23 Möglichkeiten des Paarvergleichs.
Die Auswahl der Rating-Items und deren Formulierung orientierte sich an bereits für
standardisierte Testsituationen etablierte Beobachtungsverfahren (Swanson 1992), die sich als
reliabel und valide erwiesen haben (Roberts 1990).
Die Antwort-Skala ist in Anlehnung an die beiden ‚Klassiker’ der ADHS-Forschung
(Conners-Skala und die SNAP-IV) vierfach gestuft ( 0 = überhaupt nicht; 1 = ein wenig; 2 =
ziemlich; 3 = sehr stark). Die vierfache Stufung hat auch den Vorteil, einer Antwort-Tendenz
zur Mitte, wie sie bei ungeübten Ratern häufig anzutreffen ist, entgegenzuwirken (Bortz et al.
1995; S.167).
Die Itemformulierungen wurden den international evaluierten Übersetzungen (Huss et al.
2001) der Conners-Skalen entnommen. Die Zuordnung von jeweils 2 Items zu den drei
Hauptsymptomen ist klinisch in höchstem Maße evident. Erwartungsgemäß fiel eine
probeweise Rückzuordnung durch Fachärzte unserer Klinik zu 100% übereinstimmend aus
(leicht ablenkbar; konnte sich schlecht konzentrieren = Aufmerksamkeitsproblem; zappelig;
konnte nicht lange stillsitzen = motorische Unruhe; redet dazwischen; impulsiv =
Impulskontrollstörung).
22
7.2.3
Objektive Verfahren
Mangels hinreichend reliabler und valider objektiver Messverfahren werden in der
ADHS/HKS-Forschung überwiegend subjektive Testverfahren wie Fragebogen oder
Interviews
eingesetzt.
Dennoch
gab
es
in
den
vergangenen
Jahren
erhebliche
Forschungsanstrengungen, auch objektive Messverfahren in der Diagnostik des ADHS zu
etablieren. Dabei hat sich gezeigt, dass sich die drei Hauptsymptome des ADHS/HKS
unterschiedlich gut messen lassen. Bei den Aufmerksamkeits- und Impulskontrollstörungen
haben sich neuropsychologische Verfahren durchgesetzt, die meist auf der Grundlage sog. gono-go Paradigmen beruhen. Gemessen werden Fehlerraten und Reaktionszeiten. Dabei haben
sich sog. Auslassungsfehler (omission errors) als indikativ für Aufmerksamkeitsprobleme und
sog. Inhibitionsfehler (comission errors) als indikativ für Impulsivitätsprobleme erwiesen.
Beide Fehler lassen sich mit dem sog. Continuous Performance Test messen. Aufgrund
fehlender Normwerte sowie aufgrund des erheblichen technischen und zeitlichen Aufwandes
konnten diese Verfahren nicht im Hauptsurvey verankert werden.
Bei der objektiven Messung der motorischen Unruhe waren in den vergangenen Jahren
ebenfalls Neuerungen zu verzeichnen. Unsere Arbeitsgruppe (Huss 2003 siehe Anhang) hat in
diesem Zusammenhang ein Doppler-Radar Gerät entwickelt, das sich im klinischen Alltag
bereits seit mehreren Jahren bewährt hat. Mittlerweile wurde von der Charité Berlin in
Zusammenarbeit mit der Investitionsbank Berlin ein internationales Patentverfahren auf den
Weg gebracht. Das Verfahren wurde für den europäischen Innovationspreis der AltranStiftung nominiert und erhielt im Juni 2003 vor der UNESCO in Paris einen der sechs
Finalistenpreise. Im Anhang ist eine Projektskizze wiedergegeben, die das Verfahren und das
Gerät beschreibt.
Für den Einsatz im Rahmen des Gesundheitssurveys bot sich das Radar-Gerät an, da es keine
zusätzliche Untersuchungszeit erforderlich macht, das kindliche Verhalten nicht beeinflusst
und einfach zu bedienen ist.
Das Gerät misst – ähnlich wie der ‚klinische Blick’ - die globalmotorische Unruhe, d.h. alle
Bewegungen der Körperoberfläche werden aufgezeichnet, unabhängig von der Körperpartie
und den dabei beteiligten Muskelgruppen.
Um
eine
möglichst
standardisierte
Untersuchungssituation
unter
gleichen
Anforderungsbedingungen zu gewährleisten, entschieden wir uns, die motorische Unruhe
während des Sehtests im Rahmen des Gesundheitssurveys aufzuzeichnen.
23
Es wurden dafür eigens drei Prototypen bereitgestellt und eine Software (ActoTrace Version
1.0.3) entwickelt, welche die motorische Unruhe mit einer Genauigkeit von 1 ms auf den im
Survey verwendeten Laptops in Echtzeit unter einem 32bit-Betriebssystem aufzeichnet. Im
Rahmen des Trainings am 9. Mai 2003 wurden die Untersucher mit dem Gerät und der
Software vertraut gemacht.
Die Rohdaten werden in anonymisierter Form per e-mail an Herrn Huss geschickt und von
diesem statistisch ausgewertet. Bislang konnten auf diesem Wege bereits 600 Probanden des
Hauptsurveys ausgewertet werden.
Somit werden in Zukunft objektive Daten über die motorische Unruhe der Probanden in
standardisierten Testsituationen zur Verfügung stehen. Wir erhoffen uns davon einen
Zugewinn an Genauigkeit hinsichtlich der Prävalenzbestimmung des ADHS/HKS.
7.2.4
Diagnosealgorithmus auf der Grundlage der im Hauptsurvey
implementierten Informationen
Aufmerksamkeit
Eltern-/Selbsturteil
Lehrerurteil
Untersuchung
(Familie)
(Schule)
(Survey)
1)
2)
3)
SDQ: Aufmerksamkeits-
nur indirekt über:
Rating trainierter
Probleme
Schulnoten
Beobachter
Itemblock Wohlbefinden
Item 2 + 4
in der Schule (insb. Item
über Schulaufgaben)
Impulsivität
4)
5)
6)
SDQ: Störungen der
nicht verfügbar
Rating trainierter
Impulskontrolle
Beobachter
Item 3 + 5
motorische Unruhe
7)
8)
9)
SDQ: Hyperaktivität
nicht verfügbar
Rating trainierter
Beobachter
Item 1 + 6
Aktometrie
24
Psychosoziales
Funktionsniveau
(Impact / bzw.
Setting-Kriterium)
10)
11)
12)
Inanspruchnahme von
indirekt:
keine Angaben
Hilfe
Schulnoten
Wohlbefinden
Klassenwiederholungen
(Eltern/Kinder/
Eltern/Kinder/
Jugendliche)
Jugendliche:
Wohlbefinden in der
Schule (insb.
Schulaufgaben)
Zeitkriterium
13)
14)
15)
Elternangaben über
keine Angaben
keine Angaben
Zeitdauer
Tabelle 2: HKS-Diagnosealgorithmus
Für die einzelnen Zellen (siehe Tabelle 2) sind folgende Items verfügbar:
Zelle 1)
Elternfragebogen 3-6 Jahre
Skala Hyperaktivität (Aufmerksamkeits-Items):
•
Item 53_15: Leicht ablenkbar (positive Kodierung: 0-1-2)
•
Item 53_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne
(negative Kodierung: 2-1-0)
Elternfragebogen 7-10 Jahre
Skala Hyperaktivität (Aufmerksamkeits-Items):
•
Item 54_15: Leicht ablenkbar (positive Kodierung: 0-1-2)
•
Item 54_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne
(negative Kodierung: 2-1-0)
Elternfragebogen 11-13 Jahre
Skala Hyperaktivität (Aufmerksamkeits-Items):
•
Item 46_15: Leicht ablenkbar (positive Kodierung: 0-1-2)
25
•
Item 46_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne
(negative Kodierung: 2-1-0)
Kinderfragebogen 11-13 Jahre
Skala Hyperaktivität (Aufmerksamkeits-Items):
•
Item 16_15: Leicht ablenkbar (positive Kodierung: 0-1-2)
•
Item 16_25: Was ich angefangen habe, macht ich zu Ende, ich kann mich lange genug
konzentrieren (negative Kodierung: 2-1-0)
CAVE: in der uns vorliegenden Fragebogenversion für Kinder 11-13 Jahre wurde
fälschlicherweise die Reihenfolge der SDQ-Items 24 und 25 vertauscht.
Elternfragebogen 14-17 Jahre
Skala Hyperaktivität (Aufmerksamkeits-Items):
•
Item 46_15: Leicht ablenkbar (positive Kodierung: 0-1-2)
•
Item 46_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne
(negative Kodierung: 2-1-0)
Jugendfragebogen 14-17 Jahre
Skala Hyperaktivität (Aufmerksamkeits-Items):
•
Item 37_15: Leicht ablenkbar (positive Kodierung: 0-1-2)
•
Item 37_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne
(negative Kodierung: 2-1-0)
CAVE: in der uns vorliegenden Fragebogenversion für Jugendliche 14-17 Jahre wurde
fälschlicherweise die Reihenfolge der SDQ-Items 24 und 25 vertauscht.
Zelle 2)
Es liegen keine direkten Lehrerurteile über das Verhalten der Schüler vor.
Indirekt kann eine orientierende Aussage über Aufmerksamkeitsprobleme mittels der
Schulnoten (Mathematik- und Deutschnote) getroffen werden: Wenn sich in den Schulnoten
keine Leistungsprobleme abzeichnen, liegt keine schwerwiegende Aufmerksamkeitsstörung
vor. Umgekehrt kann allerdings aus dem Vorliegen von Schulleistungsproblemen nicht auf
Aufmerksamkeitsstörungen geschlossen werden, da diese vielfältige Ursachen haben können.
26
Orientierend können auch die Angaben der Eltern über das Wohlbefinden der Kinder und
Jugendliche in der Schule herangezogen werden. Hierbei ist insbesondere das Item ‚In der
letzten Woche hat mein Kind die Schulaufgaben gut geschafft (nie – selten – manchmal – oft
– immer)’ von Bedeutung.
Zelle 3)
Hinweise auf Aufmerksamkeitsprobleme während der Untersuchung werden von den
trainierten Untersuchern auf der in Kapitel 7.2.2 beschriebenen adaptierten Conners-Skala
eingeschätzt.
Folgende Items beziehen sich auf Aufmerksamkeitsprobleme:
Item 2: Konnte sich auf die Aufgaben schlecht konzentrieren
0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark
Item 4: War leicht ablenkbar
0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark
Wie dem Kapitel über die Ergebnisse des Untersuchertrainings (Kapitel 10) zu entnehmen ist,
wurden bei dem Reliabilitätstest für die Aufmerksamkeits-Items mit Kappa = .62 bzw.
weigthed Kappa = .91 sehr gute Urteilsübereinstimmungen erzielt.
Zelle 4)
Elternfragebogen 3-6 Jahre
Skala Hyperaktivität (Impulsivitäts-Item):
•
Item 53_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0)
Elternfragebogen 7-10 Jahre
Skala Hyperaktivität (Impulsivitäts-Item):
•
Item 54_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0)
Elternfragebogen 11-13 Jahre
Skala Hyperaktivität (Impulsivitäts-Item):
27
•
Item 46_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0)
Kinderfragebogen 11-13 Jahre
Skala Hyperaktivität (Impulsivitäts-Item):
•
Item 16_21: Ich denke nach, bevor ich handle (negative Kodierung: 2-1-0)
Elternfragebogen 14-17 Jahre
Skala Hyperaktivität (Impulsivitäts-Item):
•
Item 46_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0)
Jugendfragebogen 14-17 Jahre
Skala Hyperaktivität (Impulsivitäts-Item):
•
Item 37_21: Ich denke nach, bevor ich handle (negative Kodierung: 2-1-0)
Zelle 5)
Es liegen keine Lehrerinformationen über impulsives Verhalten in der Schule/ dem
Kinderhort vor. Darüber hinaus ergeben sich aus dem vorliegenden Datenmaterial keine
Möglichkeiten, impulsives Verhalten in der Schule /dem Hort abzuschätzen.
Zelle 6)
Hinweise auf Probleme der Impulskontrolle während der Untersuchung werden von den
trainierten Untersuchern auf der in Kapitel 7.2.2 beschriebenen adaptierten Conners-Skala
eingeschätzt.
Folgende Items beziehen sich auf Probleme der Impulskontrolle:
Item 3: War erregbar, impulsiv
0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark
Item 5: Redete dazwischen
0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark
28
Wie dem Kapitel über die Ergebnisse des Untersuchertrainings (Kapitel 10) zu entnehmen ist,
wurden bei dem Reliabilitätstest für die Impulsivitäts-Items mit Kappa = .63 bzw. weigthed
Kappa = .93 sehr gute Urteilsübereinstimmungen erzielt.
Zelle 7)
Elternfragebogen 3-6 Jahre
Skala Hyperaktivität:
•
Item 53_2: Unruhig, überaktiv, kann nicht lange stillsitzen
(positive Kodierung: 0-1-2)
•
Item 53_10: Ständig zappelig (positive Kodierung: 0-1-2)
Elternfragebogen 7-10 Jahre
Skala Hyperaktivität:
•
Item 54_2: Unruhig, überaktiv, kann nicht lange stillsitzen
(positive Kodierung: 0-1-2)
•
Item 54_10: Ständig zappelig (positive Kodierung: 0-1-2)
Elternfragebogen 11-13 Jahre
Skala Hyperaktivität:
•
Item 46_2: Unruhig, überaktiv, kann nicht lange stillsitzen
(positive Kodierung: 0-1-2)
•
Item 46_10: Ständig zappelig (positive Kodierung: 0-1-2)
Kinderfragebogen 11-13 Jahre
Skala Hyperaktivität:
•
Item 16_2: Ich bin oft unruhig, ich kann nicht lange stillsitzen
(positive Kodierung: 0-1-2)
•
Item 16_10: Ich bin dauernd in Bewegung und zappelig (positive Kodierung: 0-1-2)
Elternfragebogen 14-17 Jahre
Skala Hyperaktivität:
•
Item 46_2: Unruhig, überaktiv, kann nicht lange stillsitzen
29
(positive Kodierung: 0-1-2)
•
Item 46_10: Ständig zappelig (positive Kodierung: 0-1-2)
Jugendfragebogen 14-17 Jahre
Skala Hyperaktivität:
•
Item 37_2: Ich bin oft unruhig, ich kann nicht lange stillsitzen
(positive Kodierung: 0-1-2)
•
Item 37_10: Ich bin dauernd in Bewegung und zappelig (positive Kodierung: 0-1-2)
Zelle 8)
Es liegen keine Lehrerinformationen über motorische Unruhe in der Schule/ dem Kinderhort
vor. Darüber hinaus ergeben sich aus dem vorliegenden Datenmaterial keine Möglichkeiten,
die motorische Unruhe in der Schule /dem Hort abzuschätzen.
Zelle 9)
Hinweise auf motorische Unruhe während der Untersuchung werden von den trainierten
Untersuchern auf der in Kapitel 7.3 beschriebenen adaptierten Conners-Skala eingeschätzt.
Folgende Items beziehen sich auf die motorische Unruhe:
Item 1: War unruhig, zappelig
0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark
Item 6: Konnte nicht lange stillsitzen
0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark
Wie dem Kapitel über die Ergebnisse des Untersuchertrainings (Kapitel 10) zu entnehmen ist,
wurden bei dem Reliabilitätstest für die Hyperaktivitäts-Items mit Kappa = .54 bzw. weigthed
Kappa = .88 gute Urteilsübereinstimmungen erzielt.
Zusätzlich wird die motorische Unruhe objektiv mittels Radar-Aktometrie während einer
standardisierten Untersuchungssituation (Sehtest) erfasst. Da bislang zu dem im Survey
eingesetzten Untersuchungs-Setting keine Normwerte vorliegen, wird die Extremgruppe mit
30
überdurchschnittlich
hohen
Hyperaktivitätswerten
anhand
der
Verteilung
der
Gesamtstichprobe (>= 95. Perzentile) ermittelt.
Zelle 10)
Elternfragebogen 3-6 Jahre:
Frage 27_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für
die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein
Fragenblock zum Wohlbefinden: Block 47 ‚Seelisches Wohlbefinden’; Block 48 ‚Selbstwert’;
Block 49 ‚Familie’; Block 50 ‚Freunde’
Elternfragebogen 7-10 Jahre:
Frage 28_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für
die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein
Fragenblock zum Wohlbefinden: Block 48 ‚Seelisches Wohlbefinden’; Block 49 ‚Selbstwert’;
Block 50 ‚Familie’; Block 51 ‚Freunde’
Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens
Elternfragebogen 11-13 Jahre:
Frage 28_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für
die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein
Fragenblock zum Wohlbefinden: Block 40 ‚Seelisches Wohlbefinden’; Block 41 ‚Selbstwert’;
Block 42 ‚Familie’; Block 43 ‚Freunde’
Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens
Kinderfragebogen 11-13 Jahre:
Fragenblock zum Wohlbefinden: Block 10 ‚Seelisches Wohlbefinden’; Block 11 ‚Selbstwert’;
Block 12 ‚Familie’; Block 13 ‚Freunde’
Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens
Elternfragebogen 14-17 Jahre:
Frage 28_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für
die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein
31
Fragenblock zum Wohlbefinden: Block 40 ‚Seelisches Wohlbefinden’; Block 41 ‚Selbstwert’;
Block 42 ‚Familie’; Block 43 ‚Freunde’
Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens
Jugendlichenfragebogen 14-17 Jahre:
Fragenblock zum Wohlbefinden: Block 31 ‚Seelisches Wohlbefinden’; Block 32 ‚Selbstwert’;
Block 33 ‚Familie’; Block 34 ‚Freunde’
Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens
Zelle 11)
Es liegen keine direkten Lehrerurteile über Auswirkungen des ADHS auf die Schulleistung
bzw. das Verhalten der Schüler und deren sozialer Integration vor.
Ähnlich wie bereits für die Aufmerksamkeitsstörungen, kann eine indirekte Einschätzung des
Leistungsniveaus durch die Schulnoten (Mathematik- und Deutschnote) vorgenommen
werden. Zusätzlich ergeben sich Indikatoren aus Klassenwiederholungen. Die Interpretation
muss erneut sehr zurückhaltend erfolgen. Wenn sich in den Schulnoten keine
Leistungsprobleme abzeichnen bzw. keine Klassenwiederholungen erfolgt sind, liegen keine
schwerwiegenden Einschränkungen des Funktionsniveaus im schulischen Bereich vor. In der
Regel gehen schwere ADHS/HKS-Verhaltensauffälligkeiten mit Einschränkungen der
schulischen Leistungsfähigkeit – häufig auch mit Klassenwiederholungen - einher.
Orientierend können auch die Angaben der Eltern über das Wohlbefinden der Kinder und
Jugendliche in der Schule herangezogen werden. Hierbei ist insbesondere das Item ‚In der
letzten Woche hat mein Kind die Schulaufgaben gut geschafft (nie – selten – manchmal – oft
– immer)’ von Bedeutung.
Elternfragebogen 7-10 Jahre
•
Frage 61: Seit dem Schuleintritt hat mein Kind eine/mehrere Klassen wiederholt.
•
Frage 62: Falls noch keine Noten vergeben werden -> Einschätzung der
Schulleistungen durch die Eltern in
ungenügend – unterdurchschnittlich – durchschnittlich - überdurchschnittlich
•
Frage 62: Falls Noten vergeben wurden:
Welche Note bzw. welche Punktzahl hat Ihr Kind auf dem letzten Zeugnis in..?
32
… Mathematik
… Deutsch
Elternfragebogen 11-13 Jahre
•
Frage 53: Seit dem Schuleintritt hat mein Kind eine/mehrere Klassen wiederholt.
•
Frage 54: Welche Note bzw. welche Punktzahl hat Ihr Kind auf dem letzten Zeugnis
in..?
… Mathematik
… Deutsch
Elternfragebogen 14-17 Jahre
•
Frage 53: Seit dem Schuleintritt hat mein Kind eine/mehrere Klassen wiederholt.
•
Frage 54: Welche Note bzw. welche Punktzahl hat Ihr Kind auf dem letzten Zeugnis
in..?
… Mathematik
… Deutsch
Die indirekten Informationen über die Schule (Schulnoten; Klassenwiederholungen;
Wohlbefinden bezogen auf die Schule) sind zu unspezifisch als dass sie mit hinreichender
Sicherheit einer der Zellen
2, 5, 8, 11 oder 14 zugeordnet werden könnten. Die beste
Zuordnung ist für die Zellen 2 und 11 zu erwarten. Für den Diagnosealgorithmus schlagen wir
daher eine Zuordnung zu beiden Zellen mit entsprechend niedriger Gewichtung vor.
Zelle 12)
Die Untersucher erheben keine Daten über das psychosoziale Funktionsniveau im schulischen
Bereich.
Zelle 13)
Elternfragebogen 3-6 Jahre
•
Frage 27_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von
mindestens 12 Monaten zu erwarten? ja/nein
33
(Bezug:
Frage
29_13:
Hat
Ihr
Kind
emotionale,
Entwicklungs-
oder
Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?)
Elternfragebogen 7-10 Jahre
•
Frage 28_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von
mindestens 12 Monaten zu erwarten? ja/nein
(Bezug:
Frage
29_13:
Hat
Ihr
Kind
emotionale,
Entwicklungs-
oder
Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?)
Elternfragebogen 11-13 Jahre
•
Frage 28_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von
mindestens 12 Monaten zu erwarten? ja/nein
(Bezug:
Frage
29_13:
Hat
Ihr
Kind
emotionale,
Entwicklungs-
oder
Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?)
Elternfragebogen 14-17 Jahre
•
Frage 28_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von
mindestens 12 Monaten zu erwarten? ja/nein
(Bezug:
Frage
29_13:
Hat
Ihr
Kind
emotionale,
Entwicklungs-
oder
Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?)
Zelle 14)
Es
liegen
keine
Angaben
der
Lehrer
über
den
Zeitverlauf
von
keine
Daten
über
den
Zeitverlauf
einer
Lern-
und
Verhaltensauffälligkeiten vor.
Zelle 15)
Die
Untersucher
erheben
eventuellen
Verhaltensauffälligkeit.
34
8 SDQ-Ergebnisse aus dem Pretest
Für die hier vorgelegte Auswertung der Pretest-Daten erhielten wir vom Robert-Koch-Institut
einen SDQ-Datensatz von ursprünglich n = 1.626 Kindern und Jugendlichen. 207 Fälle
enthielten keine Daten (als missing data deklariert). Bei 55 Fällen fehlten die Angaben zu
mehr als einem Item und wurden daher aus Gründen eines konservativen Vorgehens von der
Analyse ausgeschlossen. Es resultiert somit ein verwertbarer Datensatz von n = 1.364 Fällen.
Die Geschlechtsverteilung beträgt 685 (50,2%) Jungen zu 679 (49,8%) Mädchen. Der
Altersmittelwert liegt bei 11,31 Jahren mit einer Standardabweichung von 3,94 Jahren.
Parallel dazu wurden in unserer Klinik im Zeitraum vom 16. Januar 2001 bis zum 16. Juli
2003 eine Stichprobe von n = 1.221 Kindern und Jugendlichen mittels des SDQ erhoben. Bei
der Geschlechtsverteilung überwiegen – wie in kinderpsychiatrischen Inanspruchnahmepopulationen üblich - die Jungen mit n = 827 (67,7%) gegenüber den Mädchen mit n = 394
(32,3%). Der Altersmittelwert der Klinikstichprobe liegt bei 10,56 Jahren mit einer
Standardabweichung von 3,42 Jahren.
Die Auswertung der SDQ-Daten erfolgt nach den Vorgaben von Prof. Robert Goodman
(www.sdqinfo.com). Wie der SPSS-Steuerdatei im Anhang zu entnehmen ist, werden 5
Skalen gebildet, in die jeweils 5 Items eingehen.
Die 5 Skalen sind inhaltlich charakterisiert als: 1) Emotionale Probleme, 2) AufmerksamkeitsDefizit-Hyperaktivitäts Probleme, 3) Betragensprobleme, 4) Probleme mit Peers und 5)
Prosoziales Verhalten. Die Summe der vier erstgenannten Skalen bildet den sog. ProblemScore, der als allgemeiner Index für psychische Auffälligkeiten gewertet wird. Die Skala
‚Prosoziales Verhalten’ erfragt explizit positive Ressourcen der Kinder und geht damit nicht
in die Berechnung psychischer Auffälligkeiten ein. Üblicherweise fallen die Werte für
prosoziales Verhalten in Klinikstichproben gegenüber einer Feldstichprobe niedriger aus.
Bei der Konstruktion des Fragebogens ging Robert Goodman auch bei manchen ProblemItems ressourcen-orientiert vor. Dies bedeutet, dass manche Fragen positiv umformuliert
wurden und bei der Auswertung der Problem-Skalen gegensinnig kodiert werden müssen.
Beispielsweise wird in der Skala der Aufmerksamkeitsstörungen mit Item 25 erfragt, ob das
Kind Aufgaben zu Ende führen kann. Wird die Frage von den Eltern verneint, so wird diese
Angabe mit positivem Itemwert in der Skala verrechnet. Die genaue Konstruktion der Skalen
und ihrer Umkodierungen sind dem Steuerfile im Anhang zu entnehmen.
35
In der Einleitung des Forschungsberichts wurde bereits darauf hingewiesen, dass die
Ausprägung von Symptomen noch keine hinreichende Aussage über das Vorliegen einer
Erkrankung bzw. psychischen Störung erlaubt. Insbesondere bei dem hier zu untersuchenden
ADHS/HKS muss zusätzlich eine Beeinträchtigung des psychosozialen Funktionsniveaus
vorliegen. Wie in Kapitel 7 erläutert, muss darüber hinaus noch die Dauer der Symptome
mindestens 6 Monate betragen.
In der Klinikstichprobe lassen sich die Beeinträchtigung des psychosozialen Funktionsniveau
wie auch die Zeitdauer der Probleme sehr gut aus dem Impact-Teil ableiten. Wie dem
Original-Fragebogen im Anhang zu entnehmen ist, wird erfragt, ob sich aus den
beschriebenen Symptomen Probleme im Alltagsleben – gegliedert nach Familie, Schule,
Freizeit und Umgang mit Gleichaltrigen – ergeben. Die Zeitdauer wird stratifiziert erfasst (0 =
weniger als 1 Monat; 1 = 1 bis 5 Monate; 2 = 6 – 12 Monate; 3 = über ein Jahr).
Die genaue Berechnung des sog. Impact-Scores, der Zeitangaben sowie der Auswirkungen
auf das Alltagsleben können dem SPSS-Steuerfile im Anhang entnommen werden.
Goodman und Mitarbeiter (2000) haben auf der Grundlage des britischen Surveys
Schwellenwerte (cut-off-values) gebildet, die sich an den Perzentilen der repräsentativen
britischen Stichprobe orientieren. Die Schwellenwerte wurden so gewählt, dass etwa 80% der
Kinder als unauffällig, 10% der Kinder als grenzwertig auffällig und 10% der Kinder als
auffällig klassifiziert werden. Wörner et al. (2002) hat diese Schwellenwerte für Deutschland
weitgehend replizieren können.
Die von Goodman (www.sdqinfo.com) ermittelten Schwellenwerte sind nachfolgender
Tabelle zu entnehmen.
Normal
Grenzwertig
Auffällig
Gesamtproblemwert
0-13
14-16
17-40
Emotionale Probleme
0-3
4
5-10
Verhaltensprobleme
0-2
3
4-10
Hyperaktivität
0-5
6
7-10
Probleme mit Peers
0-2
3
4-10
Prosoziales Verhalten
6-10
5
0-4
Impact-Skala
0
1
2-10
Tabelle 3: Schwellenwerte der SDQ-Skalen nach Goodman (www.sdqinfo.com)
36
Da die Rohwerte (z.B. für Zappeln, Dazwischenreden etc.) alters- und geschlechtsabhängig
sind, wurde bei der T-Wert-Berechnung bekannter internationaler Screening-Instrumente
(z.B. Child Behavior Checklist, Conners-Skalen) eine Alters- und Geschlechtsstratifizierung
vorgenommen. Umso verwunderlicher ist es, dass bei den cut-off-values von Robert
Goodman weder Geschlechts- noch Alterseffekte berücksichtigt wurden. Gemäß dieser
Vorgabe gilt ein dreijähriger Junge als ebenso auffällig, wenn er Rohwertpunkte über 6 auf
der Hyperaktivitätsskala aufweist, wie ein 17jähriges Mädchen.
Wir gehen davon aus, dass die SDQ-Daten des Hauptsurveys die Schwächen dieses
Verfahrens aufweisen und als Grundlage dienen werden, alters- und geschlechtsstratifizierte
cut-off-values für die Bundesrepublik zu erstellen.
Die nachfolgende Graphik einer orientierenden Analyse (Ordinate = Mittelwert mit 95%igem
Konfidenzintervall der Rohwerte aus der Hyperaktivitätsskala; Abzisse = Alter der Kinder)
der uns vorliegenden SDQ-Daten aus der Klinik und aus dem Pretest des RKI bestätigt, dass
mit Alters- und insbesondere mit Geschlechtseffekten zu rechnen ist.
37
HKS-Skalenwert mit 95% Konfidenzintervall
10
8
6
RKI Jungen
4
RKI Mädchen
Charite Jungen
2
Charite Mädchen
0
4
6
5
8
7
10
9
12
11
14
13
16
15
17
Alter
Abbildung 1: Altersverteilung der HKS-Rohwerte gegliedert nach Geschlecht und Stichprobe
Da die Repräsentativität der Pretest-Daten nicht belegt ist, verzichten wir auf eine deutsche
Adaptation der cut-off-values und übernehmen die von Goodman veröffentlichten Werte. Im
Rahmen der Prävalenzschätzung mit den Daten des Hauptsurveys sollte allerdings eine
entsprechende Adjustierung insbesondere für das Geschlecht durchgeführt werden.
Wie bereits erwähnt, wurde der SDQ im Pretest wie auch im Hauptsurvey aus
zeitökonomischen Gründen ohne Impact-Teil eingesetzt. Damit entfällt die Möglichkeit, den
38
Impact-Score und das Zeitkriterium in die Analysen direkt einzubeziehen. Für die hier
vorzunehmende Prävalenzbestimmung sind wir daher auf konservative Schätzverfahren
angewiesen.
Für den Umgang mit fehlenden SDQ-Daten über das psychosoziale Funktionsniveau sowie
der Zeitdauer der Symptome wurden folgend methodische Vorüberlegungen angestellt:
A)
Ein erster methodischer Zugang zu dem Problem fehlender Impact-Daten im
Pretest und Hauptsurvey besteht darin, das psychosoziale Funktionsniveau und
die Zeitdauer der Symptome bei der Prävalenzbestimmung nicht zu
berücksichtigen.
Die
SDQ-Analysen
müssten
sich
dann
auf
die
Symptomausprägung beschränken. Wie bereits ausgeführt, definiert sich
ADHS/HKS aber nicht nur auf der Grundlage von Symptomen, sondern auch aus
deren Dauer und ihren Auswirkungen auf das Alltagsleben des Kindes. Wie bei
Wolraich et al. (1998) gezeigt werden konnte, ist bei einer Analyse, die sich nur
auf Symptome bezieht, mit einer deutlichen Überschätzung der Prävalenz zu
rechnen. Wir entschieden uns daher, nicht auf das psychosoziale Funktionsniveau
und die Zeitdauer zu verzichten, sondern diese aus der parallel erhobenen
Klinikstichprobe zu schätzen.
B)
Patienten einer kinderpsychiatrischen Klinik zeigen erwartungsgemäß höhere
Symptomausprägungen als Kinder einer unausgelesenen Feldstichprobe. Die
genauen Werte werden nachfolgend aufgeführt. Die zu ewartende Prävalenz von
ADHS/HKS ist in der Klinik um ein Vielfaches (Faktor 10 bis 15) höher als in
einer unausgelesenen Feldstichprobe. Dennoch finden sich in der Klinik eine
Reihe von Kinder, die hohe Symptomausprägungen haben, ohne jedoch das
Kriterium der Zeitdauer (mind. 6 Monate) oder das Kriterium ‚Leidensdruck’ zu
erfüllen. Eine ADHS-Diagnose wäre somit bei diesen Kindern nicht
gerechtfertigt.
Da die Klinikpatienten aufgrund meist schwerwiegender Probleme bei uns
vorgestellt werden, ist davon auszugehen, dass der Anteil der hohen
Symptomträger
mit
niedrigem
Leidensdruck
bzw.
kurzzeitiger
Symptomausprägung gering ausfällt. Nimmt man diese Rate als Schätzwert für
eine Feldstichprobe, unterschätzt man die Anzahl der Symptomträger ohne
39
Leidensdruck im Feld. Mit anderen Worten: bezogen auf unsere Forschungsfrage
wird ein konservativer Fehler begangen.
Die Rohwertevergleiche für alle SDQ-Skalen einschließlich des sog. Total-ProblemScore sind Tabelle 4 zu entnehmen.
Deskriptivstatistik Pretest(RKI)- und Klinik(Charite)- Skalen des SDQ
Emotionale VerhaltensProbleme
probleme
Mittelwert
N
Standardabweichung
Mittelwert
Charite
N
Standardabweichung
Mittelwert
Insgesamt N
Standardabweichung
RKI
1,85
1364
1,82
3,72
1221
2,56
2,74
2585
2,39
2,06
1364
1,63
3,32
1221
2,34
2,66
2585
2,09
ADHS/
HKS
Probleme
mit Peers
3,22
1364
2,27
5,89
1221
2,86
4,48
2585
2,89
1,57
1364
1,66
3,06
1221
2,42
2,27
2585
2,18
Prosoziales
Verhalten
TOTAL
7,68
1364
1,70
6,89
1221
2,21
7,31
2585
2,00
8,69
1364
5,30
16,00
1221
6,78
12,14
2585
7,06
Tabelle 4: Deskritpivstatistik der SDQ-Skalen gegliedert nach Stichprobe
Die graphische Darstellung des Gruppenvergleichs mit Skalenmittelwerten und 95%igem
Konfidenzintervall ist nachfolgend wiedergegeben. Erwartungsgemäß finden sich in allen
Problem-Skalen
und
dem
Total-Score
signifikant
höhere
Rohwerte
in
der
Klinikstichprobe. Die Skala für prosoziales Verhalten fällt für die Klinikstichprobe –
ebenfalls erwartungskonform – signifikant niedriger aus.
40
20
Emotionale
Skalenwert mit 95% Konfidenzintervall
Probleme
Verhaltensprobleme
ADHS/HKS
10
Probleme
mit Peers
Prosoziales
Verhalten
total
0
RKI
Charite
Abbildung 2: Skalenmittelwerte mit 95%igem Konfidenzintervall gegliedert nach Stichprobe
Wie dem F-Wert von 702,3 in der nachfolgenden Tabelle zu entnehmen ist, fällt der
Stichprobeneffekt für den Bereich der hyperkinetischen Störungen (ADHS/HKS)
besonders deutlich aus.
41
Varianzanalytischer Vergleich (ANOVA) zwischen
Pretest- und Klinik-Daten bezogen auf die SDQ-Skalen
Quadratsumme
Emotionale
Probleme
Zwischen den
(Kombiniert)
Gruppen
Innerhalb der Gruppen
Insgesamt
Betragensprobleme
Zwischen den
(Kombiniert)
Gruppen
Innerhalb der Gruppen
Insgesamt
Zwischen den
(Kombiniert)
Hyperkinetische Gruppen
Innerhalb der Gruppen
Störung
Insgesamt
Probleme mit
Gleichaltrigen
Zwischen den
(Kombiniert)
Gruppen
Innerhalb der Gruppen
Insgesamt
Prosoziales
Verhalten
Gesamtwert
psychischer
Auffälligkeiten
Zwischen den
(Kombiniert)
Gruppen
2244,807
Mittel der
Quadrate
Df
1
12515,733 2583
14760,540 2584
1034,331
1
10311,869 2583
11346,200 2584
4612,000
1
16963,143 2583
21575,143 2584
1447,137
1
10880,950 2583
12328,087 2584
410,218
1
Insgesamt
9901,126 2583
10311,345 2584
Zwischen den
(Kombiniert)
Gruppen
34407,792
Innerhalb der Gruppen
Innerhalb der Gruppen
Insgesamt
1
94360,674 2583
128768,467 2584
F
Signifikanz
2244,807 463,284
,000
4,845
1034,331 259,088
,000
3,992
4612,000 702,275
,000
6,567
1447,137 343,532
,000
4,213
410,218 107,017
,000
3,833
34407,792 941,868
,000
36,531
Tabelle 5: Varianzanalytischer Vergleich der Skalenwerte zwischen den Stichproben
Da das Geschlechtsverhältnis in den beiden Stichproben unterschiedlich ist und sowohl die
Prävalenz als auch die Symptomausprägung zwischen Jungen und Mädchen unterschiedlich
ist, muss bei den oben dargestellten Ergebnissen noch kontrolliert werden, ob der
Stichprobeneffekt mit dem Geschlechtseffekten konfundiert ist. Zu diesem Zweck wurde ein
linares Modell gerechnet, in dem als abhängige Variable die Rohdaten der SDQ-Skala ‚HKS’
und als Prädiktoren sowohl die Stichprobenzugehörigkeit als auch das Geschlecht
eingegangen sind.
Dabei zeigte sich, dass die Stichprobenzugehörigkeit auch nach der Kontrolle des
Geschlechtseffektes weiterhin der Prädiktor mit der höchsten Vorhersagekraft bleibt
(partielles Eta-Quadrat als Mass für die von dem Prädiktor erklärte Varianz = 0,176). Als
zweiter Haupteffekt erwies sich erwartungskonform das Geschlecht (partielles Eta-Quadrat =
0,075). Der Interaktioneffekt zwischen Stichprobe und Geschlecht war zu vernachlässigen
(partielles Eta-Quadrat = 0,004). Somit lässt sich der Gesamteffekt nicht auf unterschiedliche
Geschlechtsverteilungen zwischen der RKI- und der Klinikstichprobe zurückführen.
42
9 Ergebnisse des Reliabilitäts-Training für den Hauptsurvey
Wie in Kapitel 7.2.2 erläutert, wurden die 8 Untersucher des Hauptsurveys einem
Videotraining mit anschließender Reliabilitätsprüfung unterzogen. Die Reliabilität wurde für
5 exemplarisch ausgewählte Fälle berechnet. Jeder Untersucher musste sich pro Kind bei 6
Items jeweils auf einer 4fach gestuften Likert-Skala festlegen.
Somit stehen für die Reliabilitätsprüfung insgesamt 240 Urteile (8 Untersucher x 6 Items x 5
Kinder) zur Verfügung. Wie in Kapitel 7.2.2 weiterhin ausgeführt, erfolgte die Berechnung
sowohl nach dem ungewichteten als auch nach dem gewichteten Kappa. Angestrebt wurde ein
Kappa-Wert von über .80.
Die Antwortmuster - 0 = überhaupt nicht; 1 = ein wenig; 2 = ziemlich; 3 = sehr stark –
werden als Ordinalskala aufgefasst (0<1<2<3). Wie bereits erläutert, muss bei dem
gewichteten Kappa a priori eine Gewichtung festgelegt werden, die das jeweils abweichende
Urteilsverhalten eines Untersuchers in Relation zu den anderen Urteilern ‚bestraft’. Da die
vorgegebene Likert-Skala häufig in der sozialwissenschaftlichen Forschung als quasimetrisch verstanden wird, erschien eine lineare Gewichtung als angemessen. Dabei wird der
exakten Übereinstimmung zwischen zwei Urteilern das Gewicht Null (keine Bestrafung) und
der maximalen Abweichung der Wert Eins (maximale Bestrafung) zugeordnet. Die beiden
Zwischenwerte erhalten das Gewicht 1/3 bzw. 2/3.
Tabelle 6 stellt die Gewichtung im Überblick dar.
ein wenig
ziemlich
sehr stark
überhaupt nicht
ein wenig
ziemlich
sehr stark
überhaupt nicht
Urteiler Y
Urteiler X
0,00
0,33
0,67
1,00
0,33
0,00
0,33
0,67
0,67
0,33
0,00
0,33
1,00
0,67
0,33
0,00
Tabelle 6: Kappa-Gewichte für die Berechnung der ordinalen Urteilsübereinstimmung
43
Da SPSS nur eine sehr unflexible Routine der klassischen Kappa-Berechnung zur Verfügung
stellt und weder eine Gewichtung zulässt noch die Erweiterung nach Fleiss beinhaltet,
entschlossen wir uns, eine eigene Routine unter Excel zu programmieren, die alle
erforderlichen Erweiterungen der Kappa-Berechnung auf nominalem und ordinalen
Datenniveau beinhaltet. Die hier mitgeteilten Werte wurden mit dieser Excel-Routine
berechnet.
Als Gesamtergebnis ergab sich bei der Berechnung auf nominalem Datenniveau ein KappaWert nach Fleiss von 0,60. Berücksichtigt man, dass es sich dabei um einen von zufälligen
Übereinstimmungen
bereinigten
Wert
handelt,
so
kann
von
einer
akzeptablen
Übereinstimmung ausgegangen werden. Dennoch wurde das Ziel des Trainings (Kappa >=
.80) für die nominale Berechnung nicht erreicht.
Wie bereits in den theoretischen Ausführungen über das Kappa-Maß erläutert, erscheint der
gewichtete Kappa-Koeffizient für unsere Forschungsfrage als angemessener. Mit der oben
genannten Gewichtungsmatrix erzielten die Untersucher ein Gesamt-Kappa von .90, was als
exzellentes Ergebnis anzusehen ist. Der deutliche Zugewinn an Übereinstimmung bei der
Berechung auf ordinalen Datenniveau resultiert im Wesentlichen aus der Tatsache, dass in
keinem Paarvergleich mehr als zwei Antwortkategorien abgewichen wurde. Mit anderen
Worten: in keinem der 23 Paarvergleiche über 6 Items hinweg wurde jemals die maximale
Abweichung von 3 Antwortkategorien realisiert.
Da das Ausmaß der Abweichung bei dem nominalen Kappa nicht berücksichtigt wird, kommt
es formal zu erheblich schlechteren Übereinstimmungsmaßen, die jedoch die faktisch hohe
Übereinstimmung nur unzureichend spiegelt.
Die Urteilskategorien decken mit den 6 Items die drei Hauptsymptome von ADHS/HKS ab.
Damit ist es möglich, die Übereinstimmungen auf Symptom-Ebene zu überprüfen.
Tabelle 7 zeigt beide Kappa-Koeffizienten differenziert nach den Items, den drei
Hauptsymptomen und den Gesamt-Koeffizienten.
44
Kappa nach
Fleiss
Weighted
Kappa
1) War unruhig, zappelig
0,55
0,88
2) Konnte sich schlecht auf die Aufgaben konzentrieren
0,57
0,89
3) War erregt, impulsiv
0,60
0,92
4) War leicht ablenkbar
0,67
0,92
5) Redete dazwischen
0,65
0,93
6) Konnte nicht lange stillsitzen
0,53
0,87
Mittelwert Aufmerksamkeitsprobleme 2) + 4)
0,62
0,91
Mittelwert Impulskontrollstörung 3) + 5)
0,63
0,93
Mittelwert Motorische Unruhe 1) + 6)
0,54
0,88
Gesamt-Mittelwert:
0,60
0,90
Es werden jeweils nur die ersten beiden Stellen
hinter dem Komma dargestellt
Tabelle 7: Kappa-Ergebnisse des Reliabilitätstests gegliedert nach Items, Skalen und Gesamt-Mittelwert
Die Daten überraschen zunächst, da die motorische Unruhe, von der häufig angenommen
wird, dass sie am einfachsten ohne fachliche Vorkenntnisse zu beurteilen sei, die
schlechtesten Übereinstimmungen aufweist. Diese Ergebnisse decken sich jedoch mit der
klinischen Erfahrung, der zu Folge auch versierte Therapeuten besondere Schwierigkeiten
haben, die motorische Unruhe reliabel zu quantifizieren.
Diese Erfahrung hat uns vor Jahren dazu bewogen, eine reliable und valide Methode zur
objektiven Quantifizierung motorischer Unruhe zu entwickeln.
Durch den Einsatz des Radar-Aktometers kann diese Lücke nun geschlossen werden.
45
10 Welche vorläufigen Prävalenzschätzungen ergeben sich aus den
bisher verfügbaren Daten des Pretests?
Die hier vorgenommene, vorläufige Prävalenzschätzung für ADHS beruht auf den
verfügbaren SDQ-Daten des Pretests und der Klinikstichprobe.
Unter Berücksichtigung der Vorläufigkeit der Ergebnisse werden folgende (überwiegend
nicht belegte, bzw. aus der Literatur oder der Klinikstichprobe approximierte) Annahmen
gemacht:
A) Der Pretest stellt eine grobe Näherung der zu erwartenden repräsentativen SurveyDaten dar (nicht belegte Annahme).
B) Die Eltern-Einschätzungen auf der SDQ-Skala für Hyperaktivität stellen eine
Näherung des ADHS-Diagnose dar (Positiver prädikativer Wert für Hyperkinetische
Störungen nach ICD-10 = 63,5% gemäß Goodman et al. 2000).
C) Das Elternurteil approximiert die im Rahmen der ADHS-Diagnostik geforderte
Urteilskonvergenz zwischen Eltern, Lehrer und Untersucher (Goodman et al. 2000).
D) Die von Robert Goodman veröffentlichten Schwellenwerte lassen sich auf deutsche
Verhältnisse übertragen (Wörner et al. 2002).
E) Das Verhältnis von Symptomausprägung und daraus resultierendem Leidensdruck ist
in der Pretest-Stichprobe maximal so groß wie in der Klinikstichprobe (theoretische
Überlegung).
F) Die Symptomdauer ist in der Feldstichprobe maximal so lang wie in der
Klinikstichprobe (theoretische Überlegung).
Bei der Analyse der Klinikdaten ergab sich, dass nach den Goodman-Kriterien 551 von 1.221
(45,1%) Patienten auffällige HKS-Scores hatten. Dieser Anteil lag in der Feldstichprobe mit
116 von 1.364 (8,4%) deutlich niedriger. Die genauen Daten einschliesslich der
grenzwertigen und unauffälligen Probanden sind Tabelle 8 zu entnehmen.
46
SAMPLE RKI vs CVK * HKS_JN Kreuztabelle
SAMPLE RKI
vs CVK
1 RKI
2 Charite
Gesamt
Anzahl
% von SAMPLE
RKI vs CVK
Anzahl
% von SAMPLE
RKI vs CVK
Anzahl
% von SAMPLE
RKI vs CVK
,00 normal
1151
HKS_JN
1,00 grenzw.
97
2,00 auff.
116
Gesamt
1364
84,4%
7,1%
8,5%
100,0%
530
140
551
1221
43,4%
11,5%
45,1%
100,0%
1681
237
667
2585
65,0%
9,2%
25,8%
100,0%
Tabelle 8: Anteil auffälliger HKS-Scores (Schwellenwertmodell) gegliedert nach Stichprobe
Die Verteilung der Impact-Rohwerte in der Klinikstichprobe, die für die nachfolgenden
Analysen als Approximation herangezogen wird, findet sich in Tabelle 9.
Deskriptiv-Statistik Impact Scores in der Klinikstichprobe
Häufigkeit Prozent Gültige Prozente Kumulierte Prozente
,00
1,00
2,00
3,00
4,00
5,00
Gültig
6,00
7,00
8,00
9,00
10,00
Gesamt
380
30
129
202
159
145
74
43
32
17
10
1221
31,1
2,5
10,6
16,5
13,0
11,9
6,1
3,5
2,6
1,4
,8
100,0
31,1
2,5
10,6
16,5
13,0
11,9
6,1
3,5
2,6
1,4
,8
100,0
31,1
33,6
44,1
60,7
73,7
85,6
91,6
95,2
97,8
99,2
100,0
Tabelle 9: Deskriptivstatistik des Impact-Scores in der Klinikstichprobe
47
Um zu einer ersten Einschätzung der Prävalenz des HKS in der Pretest-Stichprobe zu
gelangen, sind folgende Analyse-Schritte erforderlich:
1.) Berechnung des Anteils auffälliger Kinder und Jugendliche (SDQ-Score HKS >=7) im
Pretest = 8,5%.
2.) Davon HKS mit hinreichender Auswirkung auf das psychosoziale Funktionsniveau
(Impact >= 2; Maximalwert geschätzt durch den Anteil in der Klinikstichprobe):
100% -33,6% = 66,4%.
3.) Davon erfüllen in der Klinikstichprobe 96,7% der Probanden auch die geforderte
Symptomdauer von mind. 6 Monaten.
4.) Davon geschätzter Anteil mit tatsächlicher Diagnose (Positver Prädiktiver Wert nach
Goodman et al. 2000): 63,5%.
5.) Hinzu kommen die HKS-Fälle, die in dem SDQ nicht erfasst wurden. Dieser Anteil
lässt sich durch 1 – Sensitivität bestimmen. Goodman et al. (2000) haben für die HKSSensitivität (Anteil der HKS-Fälle, die der Test erkennt) einen Wert von 86,1%
berechnet. Entsprechend ist davon auszugehen, dass 13,9% der HKS-Fälle nicht
erkannt werden.
Unter Berücksichtigung der drei oben genannten Analyseschritte ergibt sich folgende
Prävalenzschätzung auf der Grundlage der verfügbaren Pretest- und Klinik-Daten:
Geschätzte Prävalenz = 8,5% * 0,664 * 0,967 * 0,635 * 1,139 = 3,9 %
Da in diese Prävalenzschätzung der Impact-Anteil der Klinikstichprobe eingeht, von dem
anzunehmen ist, dass er den Maximalwert des Anteils in der Feldstichprobe repräsentiert,
liegt der wahre Prävalenzwert vermutlich unter den berechneten 3,9%. Des weiteren wird die
Zeitdauer der Symptome durch die Klinikstichprobe geschätzt, was abermals als
Maximalwert zu interpretieren ist. Dieser Umstand bedingt, dass auch unter dem
Gesichtspunkt der Symptomdauer die wahre Prävalenz unter dem errechneten Wert liegen
wird. Als dritte Fehlerquelle der aktuellen Schätzung ist auf die Anzahl der Informanten
hinzuweisen. Der positive prädiktive Wert nach Goodman et al. (2000) bezieht sich auf die
Kombination von Eltern, Lehrer und Schülerurteil (letztere ab dem Alter von 11 Jahren). In
unserem Fall wurde die Schätzung nur auf der Grundlage der Elternurteile gefällt. Nach
Goodman et al. (2000) fällt die Sensitivität wie auch der positive prädiktive Wert niedriger
48
aus, wenn weniger Informanten einbezogen werden. In unserem Modell müsste dann der
Anteil der nicht erkannten HKS-Fälle proportional steigen.
Dies bedeutet nicht, dass die Prävalenz insgesamt steigt, da diese von dem Außenkriterium
‚Diagnose’ abhängt. Die Diagnosekriterien sind im logischen Sinne ‚und’-Verknüpfungen
(Auffälligkeiten in der Schule + zuhause + in der Untersuchung + Zeitstabilität +
Ausschlusskriterien nicht erfüllt) so dass sich in der Regel der Anteil der als auffällig
klassifizierten Kinder unter Einbeziehung mehrerer Informanten deutlich reduziert.
Ähnliches erwarten wir, wenn das hier vorgestellte diagnostische Schema im Hauptsurvey
angewandt wird. Wenn die von uns eingesetzte Methode auch weniger psychiatrisch
untermauert ist, als dies in dem britischen Survey der Fall war, so handelt es sich doch in
beiden Vorgehensweisen um eklektisch Prozesse, die aus einer Fülle von Einzelinformationen
auf verschiedenen Aggregations-Ebenen nach einem vorgegebenen Schema die klinische
Diagnostik simulieren.
Wie bereits erwähnt, ist die aktuelle Schätzung von 3,9% als Obergrenze anzusehen. Wie
hoch die Reduktion des Prävalenzwertes in dem Hauptsurvey ausfallen wird, ist nicht
vorhersagbar. Eine Orientierung kann allerdings der schon abgeschlossene britische Survey
darstellen, in dem bei einer Stichprobe von 7.984 Kindern und Jugendlichen 115 mal die
Diagnose HKS und 195 mal die Diagnose ADHD vergeben wurde. Damit liegen die
britischen Prävalenzwerte bei 1,4% für HKS und bei 2,4% für ADHD.
Schließlich sei auf ein weiteres methodisches Detail verwiesen, das mit den unterschiedlichen
Stichproben in dem britischen und deutschen Survey zusammenhängt. Der Altersbereich in
der britischen Stichprobe betrug 5 bis 15 Jahre. In dem deutschen Survey wird das
Altersspektrum von 3 bis 17 Jahre abgebildet. Wie der Graphik über die Altersverteilung in
diesem Forschungsbericht zu entnehmen ist, fallen die Rohwerte in der Feldstichprobe sowohl
im unteren als auch im oberen Altersspektrum niedriger aus, was auch den klinischen
Erfahrungen entspricht. Bezieht man – wie im Falle des deutschen Surveys – diese
Altersspektren mit ein, so ist von niedrigeren Prävalenzen auszugehen. Dieser Effekt wurde in
den hier vorgenommenen Analysen bereits berücksichtig. Dies ist möglicherweise auch eine
Erklärung dafür, dass der Ausgangswert der Analyse von 8,5% um 1,5 Prozentpunkte
unterhalb der 10%-Marke liegt, die nach der Definition des Cut-off auf der Grundlage der 90.
Perzentile zu erwarten gewesen wäre.
49
11
Zusammenfassende Wertung und Ausblick
Das Forschungsprojekt wurde unter folgenden Rahmenbedingungen bzw. Fragestellungen
durchgeführt:
-
Die bisherige Datenlage in Deutschland über die Prävalenz des ADHS/HKS ist
äußerst unbefriedigend. In gesundheitspolitischer Hinsicht (z.B. Einschätzung von
Über-, Unter- oder Fehlversorgung; ökonomische Auswirkungen der Störung) ergibt
sich ein dringender Forschungsbedarf.
-
Der Kinder- und Jugendsurvey bietet aufgrund seiner Stichprobe, die nach strengen
wissenschaftlichen Kriterien der Repräsentativität in hinreichender Größe (n=17.100)
gezogen
wird,
ideale
Voraussetzungen
für
nationale
Prävalenzschätzungen
psychischer Störungen.
-
Um die optimalen Bedingungen der Stichprobe nutzbar zu machen, sollten für die
Prävalenzbestimmungen in erster Linie Daten des Hauptsurveys und erst in zweiter
Linie Daten aus Substichproben, wie beispielsweise aus dem Zusatzmodul
‚Psychische Gesundheit’ herangezogen werden.
-
Für eine optimale Prävalenzschätzung des ADHS/HKS wären Diagnosen i.e.S.
erforderlich. Dies würde aber die Durchführung eines umfassenden, strukturierten
oder
semi-strukturierten
Interviews
einschließlich
einer
kinder-
und
jugendpsychiatrischen Evaluation sowie eine ausführliche Eigen- und Fremdanamnese
unter Einbeziehung des Lehrerurteils erforderlich machen. Diese ‚Maximalvariante’
würde den zeitlichen, finanziellen und inhaltlichen Rahmen des Hauptsurveys
sprengen.
-
Ziel des Projekts ist es, anhand der vorliegenden Pretest-Daten im Vergleich mit
Klinikdaten zu prüfen, ob und mit welcher Aussagekraft trotz fehlender
‚Maximalvariante’ eine Prävalenzschätzung des ADHS/HKS für Deutschland
durchgeführt werden kann.
-
Ziel des Projekts ist es weiterhin, Vorschläge zu unterbreiten, welche zeitökonomisch
vertretbaren Zusatzerhebungen gegebenenfalls erforderlich sind und wie eine
Prävalenzschätzung mit den dann verfügbaren Daten durchgeführt werden kann.
50
-
Ein weiteres Ziel des Projekts ist es, zu überprüfen, ob und in welchem Umfang es
Diskrepanzen zwischen dem Gebrauch von Psychostimulanzien (Methylphenidat,
Amphetamin) und dem Vorliegen eines ADHS/HKS gibt.
Das Projekt hat folgende Ergebnisse erbracht:
-
Trotz methodischer Abstriche gegenüber der oben erwähnten ‚Maximalvariante’ ist
auf der Grundlage der verfügbaren bzw. der im Rahmen des Projekts ergänzten Daten
mit einer hinreichend stabilen Prävalenzschätzung des ADHS/HKS zu rechnen.
-
Die Zusatzuntersuchungen umfassen einerseits die qualifizierte Einschätzung der drei
Hauptsymptome (Aufmerksamkeitsstörung, Impulskontrollstörung und motorische
Unruhe) durch die Untersucher und andererseits der Einsatz objektiver Messmethoden
für die Bestimmung der motorischen Unruhe (Radar-Aktographie).
-
Fehlende Angaben (beispielsweise über den Zeitverlauf der Störung und über die
Auswirkungen auf verschiedene Lebensbereiche) müssen über parallel erhobene
Klinikstichproben geschätzt werden.
-
Dabei erfolgt die Schätzung konservativ: Der ermittelte Wert ist ein oberer Grenzwert,
d.h. wenn die Analyse beispielsweise eine Prävalenz von 4% ergibt, so liegt der wahre
Wert bei 4% oder darunter, sicher aber nicht darüber.
-
Das Training der Interviewer wurde evaluiert und hat gute Übereinstimmungen (InterRater-Reliabilitäten) zwischen den Untersuchern wie auch zwischen InterviewerUrteil und Experten-Urteil erbracht.
-
Auf der Grundlage des Pretests und einer Vergleichsanalyse mit einer klinischen
Stichprobe ergab sich eine Prävalenzschätzung von 3,9% (oberer Grenzwert).
-
Der Pretest wurde ausschließlich im Sinne einer Machbarkeitsstudie durchgeführt und
erhebt keinen Anspruch auf Repräsentativität. Somit kann die bislang durchgeführte
Analyse auch nicht die Auswertung im Hauptsurvey ersetzen. Auf vorläufige
Auswertungen bezüglich des Medikamentengebrauchs wurde daher verzichtet.
-
Die
avisierten
Analysen
über
den
zum
Befragungszeitpunkt
aktuellen
Medikamentengebrauch werden im Rahmen des Hauptsurveys realisierbar sein.
51
12 Literatur
Barkley, R. A. (2002). "Major life activity and health outcomes associated with attention-deficit/hyperactivity
disorder." J Clin Psychiatry 63 Suppl 12: 10-5.
Brown, R. T., W. S. Freeman, et al. (2001). "Prevalence and assessment of attention-deficit/hyperactivity
disorder in primary care settings." Pediatrics 107(3): E43.
Bortz, J, G.A. Lienert, K. Boehnke. (1997). Verteilungsfreie Methoden in der Biostatistik. Heidelberg: SpringerVerlag.
Bortz, J. and N. Döring (1995). Forschungsmethoden und Evaluation. Heidelberg, Springer-Verlag.
Conners, C. Conners-Rating Scales - Manual. New York: Multi Health Systems.
Cohen, J. (1960). "Coefficient of Agreement for Nominal Scales." Education and Psychological Measures 20:
37-46.
Cohen, J. (1968). "Weighted Kappa. Nominal Scale Agreement with Provision for Scaled Disagreement or
Partial Credit." Psychological Bulletin 70: 213-220.
Dilling, H., W. Mombour, et al. (2000). Internationale Klassifikation psychischer Störungen: Diagnostische
Kriterien für Forschung und Praxis. Bern, Huber Verlag.
Ding, Y. C., H. C. Chi, et al. (2002). "Evidence of positive selection acting at the human dopamine receptor D4
gene locus." Proc Natl Acad Sci U S A 99(1): 309-14.
Fleiss, J.L. (1971). "Measuring Nominal Scale Agreement among many Raters." Psychol Bulletin 76:378-382.
Goodman, R. (1997). "The Strengths and Difficulties Questionnaire: a research note". J Child Psychol
Psychiatry. 38:581-586.
Goodman, R., T. Ford, et al. (2000). "Using the Strengths and Difficulties Questionnaire (SDQ) to screen for
child psychiatric disorders in a community sample." Br J Psychiatry 177: 534-539.
Goodman, R. (2001). "Psychometric Properties of the Strengths and Difficulties Questionnaire". J Am Acad
Child Adolesc Psychiatry 40(11): 1337-1345.
Huss, M., A. Iseler, et al. (2001). "Interkultureller Vergleich der Conners-Skalen: Läßt sich die USamerikanische Faktorenstruktur an einer deutschen Stichprobe replizieren?" Z Kinder Jugendpsychiatr
Psychother 29(1): 16-24.
Huss, M., C. Stadler, et al. (2002). "ADHS im Lehrerurteil. Ein Vergleich von Klinik- und Normstichprobe
anhand der Conners-Skalen." Kindheit und Entwicklung 11(2): 90-97.
Huss, M. "Medikamente und ADS". Berlin, Urania-Verlag.
Kurth, B., K.E. Bergmann et al. (2002). "die Gesundheit von Kindern und Jugendlichen in Deutschland: Was wir
wissen, was wir nicht wissen, was wir wissen werden". Bundesgesundheitsblatt - Gesundheitsforschung
- Gesundheitsschutz 45: 852-858.
Newcorn, J. H., J. M. Halperin, et al. (1994). "Parent and teacher ratings of attention-deficit hyperactivity
disorder symptoms: implications for case identification." J Dev Behav Pediatr 15(2): 86-91.
Pelham, W. E., Jr., E. M. Gnagy, et al. (1992). "Teacher ratings of DSM-III-R symptoms for the disruptive
behavior disorders." J Am Acad Child Adolesc Psychiatry 31(2): 210-8.
Roberts, M. A. (1990). "A behavioral observation method for differentiating hyperactive and aggressive boys." J
Abnorm Child Psychol 18(2): 131-42.
Schmeck, K., Poustka, F. et al. (2001)."Discriminant validity of the child behaviour checklist CBCL-4/18 in
German
samples." Eur Child Adolesc Psychiatry 10(4):240-7.
Swanson, J. (1992). School-based assessment and interventions for ADD students. Irvine CA, K.C. Publishing.
Swanson, J. (persönliche Kommunikation). Diskussion im Rahmen des Global ADHD-Meeting in Porto,
Portugal, März 2003.
Swanson, J., S. Schuck, et al. (submitted). "Categorial and Dimensional Definitions and Evaluations of
Symtpoms of ADHD: The SNAP and the SWAN Rating Scales. J Clin Psychiatry.
Ullmann R.K., E.K. Sleator et al. (1985). "A change of mind: the Conners abbreviated rating scales
reconsidered". J Abnorm Child Psychol.13(4):553-365.
Wender, E. H. (2002). "Attention-deficit/hyperactivity disorder: is it common? Is it overtreated?" Arch Pediatr
Adolesc Med 156(3): 209-10.
Woerner, W., A. Becker et al. (2002). "Normierung und Evaluation der deutschen Elternversion des Strengths
and Difficulties Questionnaire (SDQ): Ergebnisse einer repräsentativen Felderhebung." Z Kinder- und
Jugendpsychiatrie Psychotherapie 30(2), 105-112.
Wolraich, M. L., J. N. Hannah, et al. (1998). "Examination of DSM-IV criteria for attention deficit/hyperactivity
disorder in a county-wide sample." J Dev Behav Pediatr 19(3): 162-8.
52
13 Anhang
13.1
Beschreibung des Doppler-Radar-Aktometer
Klin ik fü r Psych ia trie , Psyc h o so m a tik u n d Psych o th e ra p ie d e s Kin d e s- u n d
Ju g e n d a lte rs
D ire kto rin : Pro f. D r. m e d . U. Le h m ku h l
Un iv ersitä tsk lin ik u m • m ed izin isch e fa k u ltä t d er h um b o ld t-un iv ersitä t zu b erlin
Screening for Attention Deficit Hyperactivity Disorder (ADHD) by
Dopper-radar assessment of global motor hyperactivity
M. Huss, E. Jenetzky
Charité, CV K, Humbold t Univers ität zu Berlin
Introduction
Application
Global m otor hype ractivity is a co re sy mpto m in c hildre n with Atte ntion Deficit Hype ractivity
Disorder (ADHD). Early awa reness by objective a nd pr ecise meas ure is esse ntial, since
The n ext pict ure s hows a n ap plication in co mbinati on with an electr oence phalog ram. In the
hyperactivity is th e mos t pow erful pre dictor of a dult o utcom e of ADHD. Objective scree ning
last track th e rect angle global moto r impuls e of a ny body move ment c an be seen.
tools are nee ded with the following cha racte ristic: They sho uld be exzellen t for scree ning
purpos es ( high sp ecificity), reliable, not har mful f or child ren, rob ust, e asy to use, and
inexpensive.
Until now, mecha nic, op tic or elect romyo grap hic devic es coul d no t fulfill t hese nee ds. They
interfe red wit h the child‘s behavi or a nd we re restrict ed t o single muscl e gr oups. Already by
constructio n, th ey did not sim ulate t he ‚clinical ey e‘, which has p roven to b e the bes t
assessment tool.
A newly develo ped d evice b ased o n Dop pler- rada r cov ers all needs me ntionn ed a bove and
shows so fa r the best test c har acteristics ev er ass essed with objective meth ods.
Doppler-radar Actomet er
Accumulating the i mpulses ove r 10 minu tes r esults in an glob al m otor activity sc ore, which
The Dop pler- effect r efers t o the fr eque ncy shift of wav es, which a re caus ed by m oving
can be co mpa red with nor m dat a fro m 20. 000 child ren of a r epr esentativ e Ger man s ample.
objects. In com binatio n with high fre quency r adar wav es, this techniq ue ope ns the
As demonstr ated in t he nex t figur e, the in dividual co mpa rison is do ne ag e and gend e r
opport unity to registe r all mov ements of a b ody simult aniously in direct imit ation of the
stratified, si nce b oth fact ors have a significa nt influ ence on th e level of gl obal motor activity .
clinical eye. The f requ ency shift is regist ere d by a receiv er a nd tr ansfo rmed by a n elect ronic
The g rap h of t he 95% confid ence interv al hel ps to estimat e, h ow muc h th e individ ual sco re
circuit into a recta ngle sig nal indica ting th e mov ement .
differs fr om th e no rm.
The r ectangl e signal is read via the par allel po rt fr om a comm on PC an d an alyzed by a r ealtime 32 -bit softwa re with an accu racy less t han 1 millisecon d.
The followi ng figu re sh ows the d evice, which is a little la rger than a cigar ette p acket.
The device is not c onfir mative for the diagn osis of ADHD. As was demo nstrat ed in mo re
than 3. 000 patients, its stre ngth l ays in th e scre ening pro perty to co rrectly classify h ealthy
children as healty (high specificity ). With othe r wo rds: I f a child sc ores low o n t he rada rassessment of glo bal mo tor ac tivity, ADHD in the st rict definiti on of the WHO (hype rkientic
The act omet er is plac ed 1. 5 met er in f ront of th e child with out h aving a ny physic al contac t to
the pr oban d. Th eref ore n o inte rfer ence with t he child‘s behavi or is to be exp ected. The rad a r
transmitt er has a CE-certifica te a nd radiat es less t han 0.1% of the ad mitted leack radi ation
of conven tional microwaves . Th erefo re it is n ot ha rmful f or child ren.
syndrom e acco rding ICD -10) can b e rule d out.
Children with high lev els of m otor activity shoul d be f urth er assess ed.
To ou r kn owledge, this is t he fi rst obj ective d evice with optimize d scre ening pro perti es, in
a field, w here subjec tive m ethods ar e the basis f or f ar reachin g decisi ons suc h as
medicatio n or psychologic al and educa tional int erve ntions.
53
13.2
SPSS-Steuerfile SDQ-Auswertung
* Klinikdatensatz um neue Daten aus der ACCESS-Datenbank SDQ erweitern.
GET
FILE='C:\RKI\SDQ_Vergleich\gesamt_KLINIK_Eltern_03_07_03.sav'.
* hinzugefuegte Daten mit sample = x (in diesem Fall sample=3) gekennzeichnet.
do if (sample = 3).
compute wob1_el = i1.
compute wob2_el = i2.
compute wob3_el = i3.
compute wob4_el = i4.
compute wob5_el = i5.
compute wob6_el = i6.
compute wob7_el = i7.
compute wob8_el = i8.
compute wob9_el = i9.
compute wob10_el = i10.
compute wob11_el = i11.
compute wob12_el = i12.
compute wob13_el = i13.
compute wob14_el = i14.
compute wob15_el = i15.
compute wob16_el = i16.
compute wob17_el = i17.
compute wob18_el = i18.
compute wob19_el = i19.
compute wob20_el = i20.
compute wob21_el = i21.
compute wob22_el = i22.
compute wob23_el = i23.
compute wob24_el = i24.
compute wob25_el = i25.
end if.
exe.
do if (sample = 3).
compute kj_sex = geschlec.
end if.
exe.
* Dezimale Altersberechung an der Klinik-Stichprobe.
COMPUTE jahr = XDATE.YEAR(u_datum).
COMPUTE mon = XDATE.MONTH(u_datum).
COMPUTE tag = XDATE.MDAY(u_datum).
COMPUTE endtage = YRMODA(jahr,mon,tag).
COMPUTE year = XDATE.YEAR(kj_gd).
COMPUTE month = XDATE.MONTH(kj_gd).
COMPUTE day = XDATE.MDAY(kj_gd).
COMPUTE anftage = YRMODA(year,month,day).
COMPUTE agetage = endtage - anftage .
COMPUTE KJ_ALTX = agetage / 365.25 .
cache.
EXECUTE .
fre var kj_altx /sta min max mean.
exe.
* RKI-Datensatz oeffnen.
* RKI-Datensatz.
*.
* urspruenglicher Datensatz vom RKI n=1626.
* abzueglich n=9 ohne eingegebene Daten.
54
* abzueglich n=198 ohne Fragebogen.
* abzueglich n=55 mit mehr als einem missing.
* es resultiert ein verfuegbarer RKI-Datensatz von n=1364.
*.
* Achtung: Item 1 bis 25 wurde im RKI mit 1-2-3 (entgegen der Goodman-Konvention) kodiert.
* werden einheitlich in dem Gesamtdatensatz nach den Goodman-Konventionen mit 0-1-2 kodiert.
GET
FILE='C:\RKI\SDQ_Vergleich\RKI_Daten.sav'.
* Umkodierung der Itemwerte in der RKI-Stichprobe.
do if (sample = 1).
recode wob1_el wob2_el wob3_el wob4_el wob5_el wob6_el wob7_el wob8_el wob9_el
wob10_el wob11_el wob12_el wob13_el wob14_el wob15_el wob16_el wob17_el
wob18_el wob19_el wob20_el wob21_el wob22_el wob23_el wob24_el wob25_el (1=0) (2=1) (3=2).
end if.
exe.
SAVE OUTFILE='C:\RKI\SDQ_Vergleich\RKI_Daten_Items_umkodiert.sav'
/COMPRESSED.
* Umkodierten RKI-DAtensatz einlesen.
GET
FILE='C:\RKI\SDQ_Vergleich\RKI_Daten_Items_umkodiert.sav'.
* mit Klinikdatensatz zusammenfuegen.
ADD FILES /FILE=*
/FILE='C:\RKI\SDQ_Vergleich\gesamt_KLINIK_Eltern_03_07_03.sav'.
EXECUTE.
recode sample (3=2).
exe.
val lab wob1_el wob2_el wob3_el wob4_el wob5_el wob6_el wob7_el wob8_el wob9_el
wob10_el wob11_el wob12_el wob13_el wob14_el wob15_el wob16_el wob17_el
wob18_el wob19_el wob20_el wob21_el wob22_el wob23_el wob24_el wob25_el
0 'nicht zutreffend' 1 'teilweise zutreffend' 2 'eindeutig zutreffend' .
exe.
RECODE
wob1_el wob2_el wob3_el wob4_el wob5_el wob6_el wob7_el wob8_el wob9_el
wob10_el wob11_el wob12_el wob13_el wob14_el wob15_el wob16_el wob17_el
wob18_el wob19_el wob20_el wob21_el wob22_el wob23_el wob24_el wob25_el
(9=SYSMIS) .
EXECUTE .
* Skalenbildung.
* SDQ-Auswertung.
* Grundlage: Scoring_instructions Stand 2.4.02 aus www.sdqinfo.com.
* Skala: Emotionale Probleme.
* (kein Item invers).
*-----------------------.
compute emotion = sum(wob3_el,wob8_el,wob13_el,wob16_el,wob24_el).
exe.
if (emotion <=3) emot_jn = 0.
if (emotion = 4) emot_jn = 1.
if (emotion >=5) emot_jn = 2.
val lab emot_jn 0 'normal' 1 'grenzw.' 2 'auff.'.
exe.
* Skala: Verhaltensprobleme.
* (Item 7 ist invers).
*-----------------------.
recode wob7_el (2 = 0) (1 = 1) (0=2) into wob7r_el.
compute beha = sum(wob5_el,wob7r_el,wob12_el,wob18_el,wob22_el).
exe.
if (beha <=2) beha_jn = 0.
if (beha = 3) beha_jn = 1.
if (beha >=4) beha_jn = 2.
55
val lab beha_jn 0 'normal' 1 'grenzw.' 2 'auff.'.
exe.
* Skala: Hyperaktivität.
* (Item 21 und Item 25 sind invers).
*-----------------------.
recode wob21_el wob25_el (2 = 0) (1 = 1) (0=2) into wob21r_e wob25r_e.
compute hks = sum(wob2_el,wob10_el,wob15_el,wob21r_e,wob25r_e).
exe.
if (hks <=5) hks_jn = 0.
if (hks = 6) hks_jn = 1.
if (hks >=7) hks_jn = 2.
val lab hks_jn 0 'normal' 1 'grenzw.' 2 'auff.'.
exe.
* Skala: Verhaltensprobleme mit Gleichaltrigen.
* (Item 11 und Item 14 sind invers).
*-----------------------.
recode wob11_el wob14_el (2 = 0) (1 = 1) (0=2) into wob11r_e wob14r_e.
compute peer = sum(wob6_el,wob11r_e,wob14r_e,wob19_el,wob23_el).
exe.
if (peer <=2) peer_jn = 0.
if (peer = 3) peer_jn = 1.
if (peer >=4) peer_jn = 2.
val lab peer_jn 0 'normal' 1 'grenzw.' 2 'auff.'.
exe.
* Skala: Prosoziales Verhalten.
* (kein Item ist invers).
*-----------------------.
compute pros = sum(wob1_el,wob4_el,wob9_el,wob17_el,wob20_el).
exe.
if (pros <=4) pros_jn = 2.
if (pros = 5) pros_jn = 1.
if (pros >=6) pros_jn = 0.
val lab pros_jn 0 'normal' 1 'grenzw.' 2 'auff.'.
exe.
compute total = emotion + peer + beha + hks.
exe.
* Impact-Skala.
* Berechnet nach den Scoring-instructions english version unter sdqinfo.com .
RECODE
problems
(0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_prob .
VARIABLE LABELS imp_prob 'Problems Scoring Variable'.
EXECUTE .
fre var imp_prob.
exe.
RECODE
haus_m
(0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_haus .
VARIABLE LABELS imp_prob 'Haus Scoring Variable'.
EXECUTE .
fre var imp_haus.
exe.
RECODE
freunde_
(0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_freu .
VARIABLE LABELS imp_prob 'Freunde Scoring Variable'.
EXECUTE .
fre var imp_freu.
exe.
RECODE
schule_m
(0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_schu .
VARIABLE LABELS imp_prob 'Schule Scoring Variable'.
EXECUTE .
fre var imp_schu.
56
exe.
RECODE
freizeit
(0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_frei .
VARIABLE LABELS imp_prob 'Freizeit Scoring Variable'.
EXECUTE .
fre var imp_frei.
exe.
* wenn keine Probleme benannt sind bzw wenn die erste Frage mit 'nein' beantwortet wird,
* alle anderen Impact-Items auf Null setzen.
if (sysmis(imp_prob)
if (sysmis(imp_prob)
if (sysmis(imp_prob)
if (sysmis(imp_prob)
if (sysmis(imp_prob)
exe.
or
or
or
or
or
imp_prob
imp_prob
imp_prob
imp_prob
imp_prob
=
=
=
=
=
0)
0)
0)
0)
0)
imp_prob
imp_haus
imp_freu
imp_schu
imp_frei
=
=
=
=
= 0.
0.
0.
0.
0.
* Impact-Score berechnen.
compute impact = sum(imp_prob,imp_haus,imp_freu,imp_schu,imp_frei).
exe.
fre var impact.
exe.
* Zeitkriterium >= 6 Monate berechnen.
* seitwann = 2 entspricht 6 - 12 Monate.
fre var seitwann.
exe.
RECODE
seitwann
(0=0) (1=0) (2=1) (3=1) (9=0) (SYSMIS=0) INTO hks_zeit.
VARIABLE LABELS hks_zeit 'Zeitkriterium >= halbes Jahr'.
EXECUTE .
val lab hks_zeit 0 '< 6 Monate' 1 '>= 6 Monate'.
exe.
fre var hks_zeit.
exe.
*
*
*
*
Berechnung der HKS-Kriterien.
1 = nur Skala positiv.
2 = Skala und Impact positiv.
3 = Skala, Impact und Zeitkriterium erfuellt.
if (hks_jn = 2) hks_crit = 1.
if (hks_jn = 2 & impact >=2) hks_crit = 2.
if (hks_jn = 2 & impact >=2 & hks_zeit=1) hks_crit = 3.
exe.
fre var hks_crit.
exe.
SAVE OUTFILE='C:\RKI\SDQ_Vergleich\total_sample.sav'
/COMPRESSED.
Get file = 'C:\RKI\SDQ_Vergleich\total_sample.sav'.
GRAPH
/ERRORBAR( CI 95 )= emotion beha hks peer pros total BY sample
/MISSING=LISTWISE REPORT.
MEANS
TABLES=emotion beha hks peer pros
/CELLS MEAN COUNT STDDEV
/STATISTICS ANOVA .
total BY sample
CROSSTABS
/TABLES=sample BY emot_jn beha_jn hks_jn peer_jn pros_jn
/FORMAT= AVALUE TABLES
/CELLS= COUNT ROW .
57
* Altersmittelwerte zwischen Klinik und RKI vergleichen.
MEANS
TABLES=kj_altx BY sample
/CELLS MEAN COUNT STDDEV
/STATISTICS ANOVA .
* Mittelwerte vergleichen fuer ROC-Analysen.
MEANS
TABLES=emotion beha peer hks
/CELLS MEAN COUNT STDDEV .
BY sample
ROC
hks beha peer emotion BY sample (2)
/PLOT = CURVE
/PRINT = SE COORDINATES
/CRITERIA = CUTOFF(INCLUDE) TESTPOS(LARGE) DISTRIBUTION(FREE) CI(95)
/MISSING = EXCLUDE .
if (hks >=4) hks_cut = 1.
if (hks < 4) hks_cut = 0.
exe.
fre var hks_cut.
exe.
58
SDQ-Fragebogen für Eltern (Klinikversion im Original; Layout formatierungsbedingt abweichend)
ELTERN-FRAGEBOGEN
(Fragebogen zu Stärken und Schwächen SDQ-DEU)
Name, Vorname des Kindes
Geschlecht:
weiblich
männlich
Fragebogen ausgefüllt am:  . . 200 
durch:
Mutter
Geburtsdatum:  . .   
Vater
Andere Bezugsperson
Bitte markieren Sie zu jedem Punkt “Nicht zutreffend“, “Teilweise zutreffend“ oder “Eindeutig zutreffend“.
Beantworten Sie bitte alle Fragen so gut Sie können, selbst wenn Sie sich nicht ganz sicher sind oder Ihnen eine
Frage merkwürdig vorkommt. Bitte berücksichtigen Sie bei der Antwort das Verhalten Ihres Kindes in den
letzten sechs Monaten.
Teilweise
Eindeutig
Nicht
zutreffend
zutreffend
zutreffend
Rücksichtsvoll
Unruhig, überaktiv, kann nicht lange stillsitzen
Klagt häufig über Kopfschmerzen, Bauchschmerzen oder Übelkeit
Teilt gerne mit anderen Kindern (Süßigkeiten, Spielzeug, Buntstifte usw.)
Hat oft Wutanfälle, ist aufbrausend
Einzelgänger; spielt meist alleine
Im allgemeinen folgsam; macht meist, was Erwachsene verlangen
Hat viele Sorgen; erscheint häufig bedrückt
Hilfsbereit, wenn andere verletzt, krank oder betrübt sind
Ständig zappelig
Hat wenigstens einen guten Freund oder eine gute Freundin
Streitet sich oft mit anderen Kindern oder schikaniert sie
Oft unglücklich oder niedergeschlagen; weint häufig
Im allgemeinen bei anderen Kindern beliebt
Leicht ablenkbar, unkonzentriert
Nervös oder anklammernd in neuen Situationen; verliert leicht das Selbstvertrauen
Lieb zu jüngeren Kindern
Lügt oder mogelt häufig
Wird von anderen gehänselt oder schikaniert
Hilft anderen oft freiwillig (Eltern, Lehrern oder anderen Kindern)
Denkt nach, bevor er/sie handelt
Stiehlt zu Hause, in der Schule oder anderswo
Kommt besser mit Erwachsenen aus als mit anderen Kindern
Hat viele Ängste; fürchtet sich leicht
Führt Aufgaben zu Ende; gute Konzentrationsspanne
Gibt es noch etwas, das Sie erwähnen möchten?
59
Würden Sie sagen, dass Ihr Kind insgesamt gesehen in einem oder mehreren der folgenden
Bereiche Schwierigkeiten hat: Stimmung, Konzentration, Verhalten, Umgang mit
Anderen?
Nein
Ja, leichte
Ja, deutliche
Ja, massive
Schwierigkeiten Schwierigkeiten Schwierigkeiten
Falls Sie diese Frage mit “Ja“ beantwortet haben, beantworten Sie bitte auch die folgenden
Punkte:
•
Seit wann gibt es diese Schwierigkeiten?
Weniger als
einen Monat
•
6-12
Monate
Über
ein Jahr
Kaum
Deutlich
Massiv
Leidet Ihr Kind unter diesen Schwierigkeiten?
Gar nicht
•
1-5
Monate
Wird Ihr Kind durch diese Schwierigkeiten in einem der folgenden Bereiche des
Alltagslebens
beeinträchtigt?
Gar nicht
Kaum
Deutlich
Schwer
Zu Hause
Mit Freunden
Im Unterricht
In der Freizeit
•
Stellen die Schwierigkeiten eine Belastung für Sie oder die gesamte Familie dar?
Keine
Belastung
Leichte
Belastung
Deutliche
Belastung
Schwere
Belastung
Vielen Dank für Ihre Hilfe
60