Abschlussbericht an das Bundesministerium für Gesundheit und Soziale Sicherung (BMGS) Am Probsthof 78a; 53121 Bonn Vorbereitung der Erhebung und Auswertung zur Prävalenz des Aufmerksamkeits-DefizitHyperaktivitäts-Syndroms (ADHS) in Deutschland im Rahmen des Kinder- und Jugendsurveys des Robert-Koch-Instituts Dr. med. Dipl.-Psych. Michael Huss Facharzt für Kinder- und Jugendpsychiatrie Oberarzt an der Klinik für Psychiatrie, Psychosomatik und Psychotherapie des Kindes- und Jugendalters Charité Universitätsmedizin Berlin Campus Virchow-Klinikum Augustenburger Platz 1; 13353 Berlin 1. Verzeichnisse 1.1 Inhaltsverzeichnis 1. VERZEICHNISSE......................................................................................................................... 2 1.1 Inhaltsverzeichnis...................................................................................................................................... 2 1.2 Tabellenverzeichnis................................................................................................................................... 3 1.3 Abbildungsverzeichnis.............................................................................................................................. 3 2. ZUSAMMENFASSUNG ............................................................................................................... 4 3. THEORETISCHER HINTERGRUND: DER BEDARF AN NATIONALEN PRÄVALENZDATEN5 4. WAS IST BEKANNT? .................................................................................................................. 8 5. DER GESUNDHEITS-SURVEY DES ROBERT-KOCH-INSTIUTS ALS GRUNDLAGE EINER DEUTSCHEN PRÄVALENZSCHÄTZUNG................................................................................ 12 6. HOHE PRÄVALENZDATEN IN DER FORSCHUNGSLITERATUR: EIN METHODISCHES ARTEFAKT? .............................................................................................................................. 14 7. OPERATIONALISIERUNG DER FORSCHUNGSFRAGE IM HAUPTSURVEY....................... 17 7.1 Forschungskriterien................................................................................................................................ 17 7.2 Im Hauptsurvey bereits implementierte Items..................................................................................... 19 7.2.1 Strengths and Difficulties Questionnaire (SDQ) ............................................................................... 19 7.2.2 Rating trainierter Beobachter ............................................................................................................ 20 7.2.3 Objektive Verfahren.......................................................................................................................... 23 7.2.4 Diagnosealgorithmus auf der Grundlage der im Hauptsurvey implementierten Informationen........ 24 8 SDQ-ERGEBNISSE AUS DEM PRETEST ................................................................................... 35 9 ERGEBNISSE DES RELIABILITÄTS-TRAINING FÜR DEN HAUPTSURVEY ........................... 43 10 WELCHE VORLÄUFIGEN PRÄVALENZSCHÄTZUNGEN ERGEBEN SICH AUS DEN BISHER VERFÜGBAREN DATEN DES PRETESTS? ............................................................. 46 11 ZUSAMMENFASSENDE WERTUNG UND AUSBLICK ........................................................... 50 12 LITERATUR ............................................................................................................................... 52 13 ANHANG .................................................................................................................................... 53 13.1 Beschreibung des Doppler-Radar-Aktometer ....................................................................................... 53 13.2 SPSS-Steuerfile SDQ-Auswertung ....................................................................................................... 54 2 1.2 Tabellenverzeichnis Tabelle 1: Original-Items, mit denen das Verhalten während der Untersuchung eingeschätzt wird (nach Conners adaptiert) ....................................................................................................................................................... 21 Tabelle 2: HKS-Diagnosealgorithmus .................................................................................................................. 25 Tabelle 3: Schwellenwerte der SDQ-Skalen nach Goodman (www.sdqinfo.com)............................................... 36 Tabelle 4: Deskritpivstatistik der SDQ-Skalen gegliedert nach Stichprobe.......................................................... 40 Tabelle 5: Varianzanalytischer Vergleich der Skalenwerte zwischen den Stichproben........................................ 42 Tabelle 6: Kappa-Gewichte für die Berechnung der ordinalen Urteilsübereinstimmung ..................................... 43 Tabelle 7: Kappa-Ergebnisse des Reliabilitätstests gegliedert nach Items, Skalen und Gesamt-Mittelwert......... 45 Tabelle 8: Anteil auffälliger HKS-Scores (Schwellenwertmodell) gegliedert nach Stichprobe ........................... 47 Tabelle 9: Deskriptivstatistik des Impact-Scores in der Klinikstichprobe ............................................................ 47 1.3 Abbildungsverzeichnis Abbildung 1: Altersverteilung der HKS-Rohwerte gegliedert nach Geschlecht und Stichprobe.......................... 38 Abbildung 2: Skalenmittelwerte mit 95%igem Konfidenzintervall gegliedert nach Stichprobe .......................... 41 3 2. Zusammenfassung Das Hyperkinetische Syndrom (HKS) bzw. das Aufmerkamkeits-Defizit-HyperaktivitätsSyndrom (ADHS) gilt als die häufigste psychiatrische Störung im Kindes- und Jugendalters. Prävalenzschätzungen gehen von etwa 5% betroffener Schulkinder aus. Trotz der erheblichen gesundheitspolitischen Bedeutung der Prävalenz des ADHS/HKS liegen keine hinreichend wissenschaftlich abgesicherten Daten für die Bundesrepublik Deutschland vor. Studien insbesondere aus dem anglo-amerikanischen Sprachraum weisen erhebliche Schwankungen bezüglich der Prävalenzen auf (4% bis 26%). In dem Forschungsbericht wird die Notwendigkeit nationaler Prävalenzdaten erläutert. Weiterhin werden Gründe für die erhebliche Schwankungsbreite bisheriger internationaler Studien angeführt. In diesem Zusammenhang wird auf ein methodisches Artefakt verwiesen, das bei dem Einsatz der klassischen dimensionalen Verfahren (SDQ, CBCL, Conners-Skalen) zu einer Überschätzung der Prävalenz führt (Verletzung der Normalverteilungsannahme). Vorschläge werden unterbreitet, dieser Überschätzung zu begegnen. Als aktuell größte repräsentative bundesdeutsche Querschnittserhebung bietet sich im Kinderund Jugend Gesundheitssurvey, der unter Leitung von Frau Dr. Kurth am Robert-KochInstitut durchgeführt wird, die Gelegenheit, nationale Prävalenzdaten zu bestimmen. In diesem Zusammenhang war es möglich, neben den bereits verfügbaren Fragebogenverfahren ein Untersuchertraining sowie eine objektive Messung der motorischen Unruhe mittels RadarAktometrie in dem Kernsurvey zu verankern. In einem Vergleich der Survey-Vorstudie (sog. Pretest mit n = 1.364 Kindern und Jugendlichen) mit einer parallel gezogenen Inanspruchnahme-Stichprobe in der Klinik für Kinder- und Jugendpsychiatrie (Leitung: Frau Prof. Lehmkuhl) an der Charité Berlin (n = 1.221) werden orientierende SDQ-Analysen zu Alters- und Geschlechtseffekten, sowie zur Schätzung der ADHS/HKS-Prävalenz durchgeführt. Es wird ein Algorithmus vorgestellt, nach dem nationale Prävalenzdaten berechnet werden können. Methodische Stärken und Schwächen des Algorithmus werden diskutiert. Schließlich erfolgt eine theoriegeleitete Schätzung der Prävalenz von ADHS/HKS. Es resultiert ein oberer Schätzwert der Prävalenz von 3,9%. 4 3. Theoretischer Hintergrund: Der Bedarf an nationalen Prävalenzdaten Das Hyperkinetische Syndrom (HKS) bzw. die Aufmerksamkeits-Hyperaktivitäts-Störung (ADHS) gilt als die häufigste psychische Auffälligkeit im Kindes- und Jugendalters. In einer Vielzahl von Studien konnte gezeigt werden, dass insbesondere Kinder mit nicht behandeltem ADHS/HKS eine ungünstige Prognose hinsichtlich ihrer persönlichen und beruflichen Entwicklung haben. Erste Studien über die ökonomischen Auswirkungen der Störung lassen die hohen Kosten erahnen, die dem Gesundheitssystem mittel- und langfristig durch ADHS/HKS-Betroffene entstehen (Barkley 2002). In den öffentlichen Medien ist ADHS/HKS seit Jahren ein kontroverses Thema. Dabei werden die Symptome der Störung meist verkürzt dargestellt (z.B. ‚wirkt verträumt’; ‚hat Wutausbrüche’; ‚bleibt nicht bei der Sache’), so dass bei verunsicherten Eltern schnell der Eindruck entsteht, das eigene Kind sei ebenfalls betroffen. Merkmale, aus denen man ableiten kann, dass das eigene Kind nicht betroffen ist, finden sich in den Beiträgen öffentlicher Medien nur sehr selten. Aus gesundheitspolitischer Sicht ist es von zentraler Bedeutung, eine intensive Aufklärung über die tatsächlichen – und in der Regel wesentlich strengeren - Kriterien der Störung anzustreben. Darüber hinaus gilt es zu klären, ob und wenn ja wo in Deutschland von Über-, Unter- und Fehlversorgung des ADHS/HKS auszugehen ist. Für nahezu alle gesundheitspolitischen Ansätze ist die Kenntnis über die zu erwartende Häufigkeit der Störung (Prävalenz) maßgeblich. Über Definition, Diagnose und Behandlung des ADHS/HKS konnte in Deutschland in Abstimmung mit den internationalen Fachgesellschaften und der verfügbaren wissenschaftlichen Evidenz ein breiter Konsens gefunden werden. Über die Prävalenz der Störung liegen allerdings für die Bundesrepublik Deutschland bislang keine repräsentativen Daten vor. Alle bisherigen Angaben beruhen auf Studien, die in anderen Ländern – meist in den USA – durchgeführt wurden. Verfügbare deutsche Daten stammen entweder nicht aus repräsentativen Stichproben bzw. legen Instrumente zugrunde, aus denen das Vorliegen eines ADHS/HKS nicht abgeleitet werden kann (Schmeck et al. 2001). 5 Die Bedeutung nationaler Prävalenzdaten ist in mehrer Hinsicht erheblich: A) Wie den Angaben des Statistischen Bundesamtes (www.destatis.de/basis/d/bevoe/bevoetab5.htm) zu entnehmen ist, lebten im Jahr 2002 in der Bundesrepublik Deutschland 7.791.100 Kinder im Alter zwischen 6 und 15 Jahren. Weichen die Prävalenzschätzungen um einen Prozentpunkt nach oben ab, so entspricht dies bereits rund 80.000 Kindern, von denen zusätzlich angenommen wird, dass sie psychisch erkrankt seien. Umgekehrt bedeutet eine Unterschätzung der tatsächlichen Störung um einen Prozentpunkt, dass für die gleiche Anzahl an Kindern dringend benötigte Therapieangebote möglicherweise nicht vorgehalten werden und so dem ungünstigen Verlauf der Störung Vorschub geleistet wird. B) Ist die Prävalenz der Störung bekannt, so lassen sich bei derzeit jährlich steigenden Verordnungen von Methylphenidat frühe Rückschlüsse auf Arzneimittel-Missbrauch bzw. nicht leitlinien-konforme Verordnungen ziehen (hierzu ist die Kenntnis zusätzlicher Parameter erforderlich wie beispielsweise der zu erwartende Anteil der ADHS/HKS-Kinder, die nach den therapeutischen Leitlinien eine pharmakologische Behandlung benötigen). C) Angesichts steigender Verordnungen von Stimulanzien bei Kindern stellt sich die Frage, ob wir es mit einer realen Zunahme an ADHS/HKS im Sinne einer erhöhten Inzidenz zu tun haben. Auf der Basis mehrerer Prävalenzbestimmungen lassen sich epidemiologische Aussagen zu einem möglichen Anstieg der Erkrankungshäufigkeit machen. D) Die Prävalenz ist ein basaler Parameter der Versorgungsforschung. Nur auf der Grundlage von zuverlässigen Prävalenzdaten lassen sich jeweils an den wirtschaftlichen und gesellschaftlichen Verhältnissen optimierte Kosten-Nutzen-Modelle im Gesundheitswesen realisieren. E) Die Kenntnis der Prävalenz ist auch wichtig für die Evaluation von diagnostischen Tests in der Medizin. Will man beispielsweise die positiven oder negativen Vorhersagewerte eines Tests bewerten, so ist dazu die Kenntnis der Prävalenz der jeweiligen Störung erforderlich. Was ist derzeit über die Prävalenz von ADHS/HKS in Deutschland bekannt? In Lehrbüchern und populärwissenschaftlichen Arbeiten finden sich diesbezüglich erhebliche Schwankungen. Unterschiede von bis zu 10 Prozentpunkte sind keine Seltenheit und hängen angesichts fehlender nationaler Daten in erster Linie davon ab, welche internationale Studienergebnisse auf Deutschland übertragen wurden. Wir hatten oben bereits auf den nachhaltigen Effekt solcher ungenauer Prävalenzdaten hingewiesen: In Absolutzahlen bedeutet für Deutschland ein Anstieg der Prävalenz um einen 6 Prozentpunkt, dass bei zusätzlichen 80.000 Kindern davon ausgegangen wird, dass sie an einem ‚ADHS/HKS’ erkrankt sind. Da wissenschaftlich hochwertige Erhebungen von nationalen Prävalenzdaten mit einem erheblichen Forschungsaufwand verbunden sind, sei aus forschungsökonomischer Sicht zunächst die Frage aufgeworfen, welcher Erkenntnisgewinn aus einem solchen Projekt zu erwarten ist. Ein wesentlicher Nutzen besteht darin, in Zukunft nicht mehr auf Daten anderer Länder insbesondere den USA - angewiesen zu sein und damit Fehleinschätzungen in Kauf nehmen zu müssen. Damit ließen sich einer Reihe von Fehlerquellen ausschließen, die in Kapitel 4 noch genauer erläutert werden: - Kulturelle Einflüsse (je nach Kulturkreis werden unterschiedliche Verhaltensweisen in unterschiedlichem Ausmaß als auffällig eingeschätzt) - Genetische Einflüsse (nationale Unterschiede hinsichtlich der genetischen Belastung; beispielsweise wird durch die sog. Gen-shift-Hypothese eine höhere Prävalenz von ADHS/HKS in den USA postuliert) - Einflüsse unterschiedlicher Klassifikationssysteme (in den USA wird nach DSM-IV, in den meisten europäischen Ländern nach ICD-10 klassifiziert) Der unter Leitung von Frau Dr. Kurth am Robert-Koch-Institut durchgeführte Kinder- und Jugend Gesundheitssurvey (nachfolgend auch als Hauptsurvey bezeichnet) bietet eine einzigartige Möglichkeit, nationale Prävalenzdaten zu bestimmen. Gegenstand des vorgelegten Forschungsberichts ist es, Möglichkeiten und Grenzen aufzuzeigen, wie anhand der Daten aus dem Gesundheits-Survey möglichst valide ADHDPrävalenzschätzungen für Deutschland vorgenommen werden können. Darüber hinaus werden Ergebnisse des Pretests im Vergleich zu einer Klinikstichprobe sowie Ergebnisse des Untersucher-Trainings im Hauptsurvey mitgeteilt. 7 4. Was ist bekannt? Auf den mittlerweile zahlreichen Konsensuskonferenzen über ADHS/HKS werden einheitlich Prävalenzen von ca. 5% angenommen. Die Forschungsliteratur zeigt im Gegensatz zu diesen Schätzwerten allerdings ein sehr heterogenes Bild. Eine gründliche Sichtung der verfügbaren US-amerikanischen Originalarbeiten aus dem Publikationszeitraum von 1980 bis 1997 haben Brown und Mitarbeiter (2001) vorgelegt. Wie die Autoren betonen, variieren die empirisch ermittelten Prävalenzdaten für ADHS erheblich. Sie reichen von 4% (Pelham et al. 1992) bis 26% (Newcorn et al. 1994). Erwartungsgemäß werden die Ergebnisse von dem zu Grunde gelegten Diagnose-Schema (DSM III, DSM-IIIR oder DSM-IV) beeinflusst. Auch die Erhebungsmethoden (Interview vs. Fragebogen) und die Art der Informationsquellen (Eltern-, Lehrer-, Selbst-, Klinikerurteil bzw. entsprechende Kombinationen) wirken sich auf die Prävalenz aus. Weiterhin sind demographische Einflüsse (Stadt vs. Land), kulturelle, ethnische, sozioökonomische und insbesondere geschlechtsbezogene Effekte bekannt (Wender 2002). Bislang liegt nur eine Arbeit vor, die auf Interview-Daten nach dem 1994 veröffentlichten, aktuellen amerikanischen Klassifikationssystem (DSM-IV) beruht. Es handelt sich dabei um die Studie von Wolraich und Mitarbeitern (1998), die an 4.323 Kindergarten- und Schulkindern bis zur fünften Klasse durchgeführt wurde. Ein wesentliches Qualitätsmerkmal der Studie ist es, dass - in Übereinstimmung mit den aktuellen diagnostischen Kriterien - die Beeinträchtigung des psychosozialen Funktionsniveaus berücksichtigt wurde. Wolraich et al. (1998) ermittelten eine Prävalenz für alle Subtypen von ADHS von insgesamt 6,8%. Ist dieser Wert auch für Deutschland zu erwarten? Wie eingangs erwähnt, sollten transkulturelle Verallgemeinerungen insbesondere bei kinderpsychiatrischen Störungsbildern nur mit großer methodischer Zurückhaltung oder gar nicht erfolgen, da mit einer Vielzahl von Fehlerquellen zu rechnen ist. Diese seien nachfolgende im Detail erläutert: A) Wie in einer kulturvergleichenden Studie (Huss et al. 2002) gezeigt werden konnte, weisen beispielsweise die Conners-Skalen (Conners 1989), die bis heute als ‚Klassiker’ in der ADHS/HKS-Forschung gelten, deutliche Unterschiede im Urteilsverhalten deutscher und US-amerikanischer Eltern auf. Die Unterschiede beruhen nicht auf einfachen ‚Sollwertverschiebungen’, die aus methodischer Sicht ohne großen Aufwand durch eine Lineartransformation korrigiert werden könnten. 8 Vielmehr zeigte sich, dass die drei Hauptsymptome des ADHS (Aufmerksamkeitsprobleme, mangelnde Impulskontrolle und gesteigerte motorische Unruhe) unterschiedlich anfällig für Kultureffekte sind. Während für die Aufmerksamkeitsstörungen nahezu keine Unterschiede zwischen den Kulturen nachweisbar waren, fanden wir bei der Einschätzung der motorischen Unruhe mittelgradige Unterschiede. Die stärksten Abweichungen waren für die Störungen der Impulskontrolle (impulsives und aggressives Verhalten) zu verzeichnen. Ohne differenzierte Kenntnis dieser Effekte lassen sich deutsche Daten nicht mit hinreichender Sicherheit als auffällig oder unauffällig einschätzen. Darüber hinaus konnte unsere Arbeitsgruppe zeigen, dass es bei international eingesetzten Fragebogen möglicherweise kulturgebundene semantische Effekte gibt, die sich bis in die Faktorenstruktur hinein nachweisen lassen (Huss et al. 2001). Auch unter diesem Gesichtspunkt ist eine nationale Validierung internationaler Verfahren geboten. B) US-amerikanische Studien beruhen auf dem Klassifikationssystem der Amerikanischen Psychiatrischen Gesellschaft (APA), dem sog. DSM-IV. In Deutschland sind die Ärzte jedoch verpflichtet, nach dem Klassifikationssystem der WHO, der sog. ICD-10 zu diagnostizieren. Hinsichtlich der Items unterscheiden sich beide Systeme nicht, so dass eine Transformation auf Itemebene möglich ist. Unterschiede ergeben sich allerdings in dem Algorithmus, nach dem die Diagnose auf der Grundlage der Items gestellt wird. So fasst das DSM-IV die beiden Hauptkategorien ‚Impulsivität’ und ‚Hyperaktivität’ zu einer Klasse zusammen. Das ICD-10 trennt diese. Andererseits müssen nach DSM-IV die Symptome nur in zwei von drei Settings (Familie, Schule, Praxis/Klinik) auftreten. Nach Lesart des ICD-10 müssen dagegen die Probleme in allen drei Settings nachweisbar sein. Die DSM-IV Kriterien sind damit insgesamt als ‚weicher’ einzuschätzen, was mit einer höheren Prävalenz der Störung einhergeht. C) Die bisherige Forschung über die Ursachen der Störung weist auf starke genetische Einflussfaktoren hin. Berechnungen auf der Grundlage von Zwillingsstudien ergaben einen genetischen Anteil von bis zu 80% (Ding et al. 2002). Man geht heute von einem polygenetischen Erbgang mit variabler Genexpression aus. Als maßgebliche 9 genetische Einflussgrößen haben sich Allele des DRD4 Gens und des DAT1 Gens erwiesen. International vergleichende Genanalysen, wie sie beispielsweise von Prof. Swanson (persönliche Kommunikation, 2002; (Ding et al. 2002)) vorgestellt wurden, legen für das 7bp-repeat Allel des D4-Rezeptors eine Wanderbewegung nach Nordamerika nahe (Teil der sog. Gen-Shift-Hypothese). Auf der Grundlage dieser Befunde muss zwischen den Kontinenten eine unterschiedliche genetische Disposition in Betracht gezogen werden. Dies müsst sich auch in den jeweiligen Prävalenzdaten niederschlagen. In der wegweisenden Studie von Wolraich et al. (1998) findet sich ein weiteres wichtiges Detail: Die ermittelte Prävalenz von 6,8% kommt nur dann zustande, wenn neben den Symptomausprägungen auch die Auswirkungen auf das sog. psychosoziale Funktionsniveau des Kindes berücksichtigt werden. Wird nur aufgrund der Symptome, nicht aber aufgrund der damit verbundenen Einschränkung des Funktionsniveaus bewertet, so steigt die Prävalenz auf 16% an. Wie kommt es zu diesem erheblichen Anstieg? Bekanntermaßen lässt sich kein psychiatrisches Krankheitsbild ausschließlich nach der Quantität von Symptomen definieren. Maßgeblich ist immer die Auswirkung auf die Person bzw. das psychosoziale Umfeld. Man spricht in diesem Zusammenhang von dem sog. Leidensdruck, den ein bestimmtes Symptom oder ein Symptomkomplex bewirkt. Psychometrisch erfasst werden die Auswirkungen der Störung in der Regel durch das bereits erwähnte psychosoziale Funktionsniveau. Dies gilt auch für ADHS/HKS. Als Spezifikum kommt jedoch hinzu, dass die drei Hauptsymptome des ADHS – mangelnde Aufmerksamkeit, Impulsivität und motorische Unruhe – jeweils ein Kontinuum darstellen. Jungen sind insgesamt über alle Altersstufen hinweg stärker betroffen als Mädchen. Damit wird auch verständlich, warum in der Studie von Wolraich et al. (1998) unter Missachtung des psychosozialen Funktionsniveaus überproportional viele Jungen zusätzlich in die diagnostische Kategorie ‚ADHS’ fallen. Aus biologischer Sicht muss angenommen werden, dass u.a. das dopaminerge System bei Jungen quantitativ und möglicherweise auch qualitativ anderen Entwicklungsprozessen unterworfen ist. Das gruppenstatistisch über alle Bevölkerungen und Kulturen hinweg bei Jungen vermehrt nachweisbare Symptom der motorischen Unruhe darf - auch in Kombination mit einer geringeren Aufmerksamkeitsleistung und einer geringeren Impulskontrolle – nicht mit einer 10 kinderpsychiatrischen Störung gleichgesetzt werden, allenfalls mit einem Risikofaktor für ADHS/HKS. Der Vorgang, wie aus einem Symptom eine Störung wird, ist wesentlich komplexer: ADHS/HKS generiert sich erst in einem Wechselverhältnis zwischen den biologischen und kognitiven Möglichkeiten des Kindes und den Anforderungen, die an das Kind gestellt werden (sog. Stress-Diathese-Modell). Unter günstigen psychosozialen und pädagogischen Förderbedingungen kann ein genetisch belastetes Kind seine Anlage zu einem gewissen Grade kompensieren. Eine medikamentöse Behandlung lässt sich möglicherweise vermeiden (Huss 2002). Umgekehrt werden Kinder trotz eines geringeren genetischen Risikos psychiatrisch auffällig, wenn sie unter sehr ungünstigen Bedingungen leben. Wie die Studie von Wolraich et al. (1998) eindrücklich zeigt, müssen stärkere Symptomausprägungen bei Jungen nicht mit einer Störung im Sinne einer kinderpsychiatrischen Erkrankung einhergehen. Es ist davon auszugehen, dass das psychosoziale Umfeld die stärker ausgeprägte Unruhe- und Impulsivität bei Jungen zum Teil kompensiert. Bei der Bestimmung von ADHS/HKS-Prävalenzdaten spielt daher das psychosoziale Funktionsniveau eine maßgebliche moderierende Rolle. Die Arbeit von Wolraich wurde in diesem Forschungsbericht exemplarisch herausgegriffen, weil es sich dabei um eine der wenigen Studien handelt, in der mit strukturierten Interviews diagnostiziert wurde. Dieses Verfahren ist aus zeitökonomischen Gründen im Rahmen des Gesundheitssurveys nicht realisierbar. Die Prävalenzschätzung muss daher auf der Basis von Fragebogen- und Beobachtungs- und Messverfahren erfolgen. 11 5. Der Gesundheits-Survey des Robert-Koch-Instiuts als Grundlage einer deutschen Prävalenzschätzung Bei dem Kinder- und Jugend-Gesundheitssurvey handelt es sich um die erste umfassende und bundesweit repräsentative Untersuchung zur gesundheitlichen Lage von Kindern und Jugendlichen in Deutschland (www.kiggs.de). Die Studie ist als Querschnittsdesign konzipiert. Die Grundgesamtheit umfasst alle Kinder und Jugendlichen im Alter zwischen 0 und 18 Jahren. Die Stichprobenziehung erfolgt nach festgelegten Repräsentativitätskriterien anhand des Einwohnermeldeamt-Registers. Angestrebt wird eine Stichprobe von 17.100 Kindern und Jugendlichen, die in 150 Erhebungszentren bundesweit untersucht werden. Die Studie durchlief eine Reihe von wissenschaftlichen Begutachtungen. Im Rahmen des sog. Pretests an 1.630 Kindern und Jugendlichen konnte die Durchführbarkeit der Studie erprobt und die potentielle Umsetzung der wissenschaftlichen Fragestellungen überprüft werden. Eine ausführliche Beschreibung des Pretests findet sich bei Kurth und Mitarbeitern (2002). Der Kinder- und Jugend-Gesundheitssurvey deckt folgende Themengebiete ab (siehe Kurzbeschreibung des Projekts im PDF-Format unter www.kiggs.de). Körperliche Beschwerden und Befindlichkeit Akute und chronische Krankheiten Behinderungen Gesundheitsrisiken, Unfälle Psychische Gesundheit und Verhaltensauffälligkeiten Subjektive Gesundheit (Lebensqualität) Soziale Kontakte, soziales Netz, Unterstützungsprogramme Personale Ressourcen (Schutzfaktoren für eine gesunde psychische Entwicklung) Ernährung, Essstörungen, Adipositas Gesundheitsverhalten und Freizeitaktivitäten Medikamentenkonsum, Impfstatus Inanspruchnahme medizinischer Leistungen 12 Der Kinder- und Jugend-Gesundheitssurvey bietet hinsichtlich der Repräsentativität und des Stichprobenumfangs nahezu optimale Bedingungen für eine Prävalenzbestimmung des ADHS/HKS, die auf absehbare Zeit nicht mehr in dieser Form gegeben sein werden. Angesichts des fortgeschrittenen Stadiums der Studienplanung (die Fragebogen für den Hauptsurvey waren bereits in der Drucklegung; der Pretest war bereits abgeschlossen) sowie des damit verbundenen hohen Zeitaufwandes, war die Durchführung eines strukturierten kinderpsychiatrischen Interviews aus zeitlichen und organisatorischen Gründen nicht realisierbar. Das NIMH-DISC als das bekannteste strukturierte Interview benötigt je nach Komorbidität zwischen 1,5 bis 2,5 Stunden Untersuchungszeit. Für die Durchführung des KSADS als dem am häufigsten verwendeten semistrukturierten Interview sind ähnliche Untersuchungszeiten zu veranschlagen. Nach den heutigen international anerkannten Leitlinien für die Diagnose und Therapie des ADHS/HKS kann eine Diagnose nur auf der Grundlage eines klinisch fundierten Interviews gestellt werden. Mittels Fragebogen, Verhaltenseinschätzungen durch die Eltern, Angaben über Probleme in der Schule, systematische Beobachtungen trainierter Untersucher, sowie objektive Befunde (Aktometrie) lässt sich jedoch mit hinreichender Sicherheit eine Aussage über das wahrscheinliche Vorliegen der Störung und somit über die Prävalenz machen. Dieses Vorgehen wird instrumentenbezogen durch vergleichende Analysen untermauert, die an über 1.200 Patienten unserer Klinik mit dem gleichen Verfahren (SDQ) durchgeführt wurden. Der Gesundheitssurvey beinhaltet ein reichhaltiges Instrumentarium, das auf der Grundlage eines a-priori zu erstellenden Algorithmus als Approximation einer Diagnose genutzt werden kann. Eine wünschenswerte Ergänzung um eine 18 Items umfassende Diagnose-Checkliste (SWAN) musste aus forschungsökonomischen Gründen und aus den bereits genannten Gründen der nahezu abgeschlossenen Studienplanung fallengelassen werden. Der Vorteil des SWAN hätte in seiner spezifischen Ausrichtung auf die ADHS-Kriterien und seiner Verteilungseigenschaften gelegen, die den Erfordernissen epidemiologischer Studien angepasst sind. Der SWAN ist das derzeit einzige international etablierte Verfahren, das die Voraussetzungen einer Normalverteilung hinreichend erfüllt. Wie Swanson und Mitarbeiter (submitted) zeigen konnten, fallen Prävalenzbestimmungen auf der Grundlage dimensionaler Verfahren mit Likert-Antwortskalen (z.B. SDQ, CBCL, Conners-Skalen) aufgrund der Verletzung der Normalverteilungsannahme zu hoch aus. Diese 13 Verzerrung muss bei der Interpretation der Ergebnisse des Gesundheitssurveys berücksichtigt werden. Ein Schwerpunkt des vorgelegten Forschungsberichts ist es, auf der Grundlage der internationalen ADHS/HKS-Forschungskriterien einen Auswertungsalgorithmus für das verfügbare Datenmaterial zu erstellen und Erweiterungsmöglichkeiten aufzuzeigen und ggf. zu implementieren, mit denen das angestrebte Ziel einer validen Prävalenzschätzung verbessert werden kann. Mit dem beschriebenen Algorithmus lässt sich in einem weiteren Analyseschritt unter Hinzuziehung von Daten über die Einnahme von Stimulanzien abschätzen, ob diejenigen Kinder medikamentös behandelt wurden, die aufgrund der Symptomausprägung ihres ADHS/HKS ein solches Vorgehen nahe legen. Da die Angaben über den Medikamentengebrauch in dem Pretest nur aus Gründen der Studiendurchführbarkeit, nicht aber zur Beantwortung der Frage einer leitlinien-orientierten Behandlung von ADHS/HKS erhoben wurden und keinen Anspruch auf Repräsentativität haben, wurden Medikamenten-bezogene Auswertungen von Seiten des RKI im Sinne guter wissenschaftlicher Praxis nicht durchgeführt. Darüber hinaus wurden im Pretest auch nur die Medikamente der vergangenen 7 Tage erfasst. Kinder, die jemals im Rahmen ihres ADHS/HKS mit Stimulanzien behandelt wurden, wären nicht berücksichtigt worden. Die große Stichprobe des Hauptsurveys sowie deren Repräsentativität stellt hingegen sicher, dass ein valides Abbild des zum Befragungszeitpunkt aktuellen Medikamentengebrauchs für Psychostimulanzien bei Kindern erstellt werden kann. 6. Hohe Prävalenzdaten in der Forschungsliteratur: Ein methodisches Artefakt? Bisherige Prävalenzdaten auf der Grundlage von dimensionalen Fragebogenverfahren – wie etwa der Conners Rating Scale (CRS), der Child Behavior Checklist (CBCL) oder des Strengths and Difficulties Questionnaires (SDQ) – erwiesen sich in der Vergangenheit als erstaunlich hoch. Prävalenzwerte von über 10% der Schulkinder sind dabei nicht unüblich. Dabei stellt sich die Frage, ob bei solch hohen Prävalenzwerten noch sinnvollerweise von 14 einer Krankheit im engeren Sinn gesprochen werden kann. Würden alle anderen Störungsbilder zusätzlich einbezogen, so wäre jedes zweite bis dritte Kind psychiatrisch krank. Das dimensionale Störungskonzept, das den genannten Instrumentarien (CRS, CBCL, SDQ) zugrunde liegt, geht davon aus, dass Merkmale wie eine kurze Aufmerksamkeitsspanne, Impulsivität und motorische Unruhe in der Bevölkerung normalverteilt sind. Die Berechnung der jeweiligen Cut-off Werte erfolgt daher immer an bevölkerungsbezogenen Normstichproben. Üblicherweise werden mehr als zwei Standardabweichungen von der Norm oder Werte oberhalb der 95. Perzentile als auffällig eingeschätzt. Je nach Fragestellung (einseitig/zweiseitig) sind demnach extreme Werte in etwa 2,5% bzw. 5% der Fälle zu erwarten. Robert Goodman (2001) hat abweichend von diesem Konzept für die SDQ die 90. Perzentile als Cut-off für auffälliges Verhalten als und die 80. Perzentile als grenzwertig definiert. Obwohl das zugrunde gelegte Störungskonzept (und vermutlich auch die reale Verteilung in der Bevölkerung) am besten durch eine Normalverteilung beschrieben werden kann, führen die Itemformulierungen und die vorgegebenen Antwortmuster (z.B. 0 = überhaupt nicht, 1 = ein wenig, 2 = ziemlich, 3 = sehr stark) in epidemiologischen Stichproben zu extrem schiefen, J-förmigen Verteilungen, in denen die erste Antwortkategorie (0 = überhaupt nicht) dominiert. Dies konnte durch Ullmann und Mitarbeiter (1985) für die Conners-Skalen gezeigt werden. Für die CBCL, die SDQ wie auch für die ADHD-Checkliste SNAP sind die J-förmigen Verteilungen in epidemiologischen Studien hinlänglich bekannt. Swanson und Mitarbeiter (Swanson et al. submitted) berechneten, dass die Verletzung der Normalverteilungsannahme die Prävalenz der Störung um absolut 3% bis 4% überschätzt. Dieser Effekt ist darauf zurückzuführen, dass die Verteilung der Merkmale im unteren Bereich abgeschnitten ist. Swanson und Mitarbeiter (submitted) adaptierten daher die nach den bisherigen Likert-Skalen konstruierte SNAP, indem die Itemformulierungen neutraler bzw. positiver wurden (z.B. SNAP-Item 9: ‚Ist bei alltäglichen Aufgaben häufig vergesslich’; SWAN-Item 9: ‚Denkt an alltägliche Aufgaben’). Die daraus resultierende SWAN vermeidet J-förmige Verteilungen und kommt dem Desiderat normalverteilter Skalen in epidemiologischen Studien sehr nahe. Um die Normalverteilung der Merkmale besser abbilden zu können, wurde auch die negativ formulierte Antwortskala in 15 eine 7stufige symmetrische Skala verändert, deren Ausprägungen auf den (neutralen) Durchschnitt bezogen werden (-3 = deutlich unterhalb des Durchschnitts, -2 = unterhalb des Durchschnitts, -1 = geringfügig unterhalb des Durchschnitts, 0 = Durchschnitt, 1 = geringfügig oberhalb des Durchschnitts, 2 = oberhalb des Durchschnitts, 3 = deutlich oberhalb des Durchschnitts). In einer Studie mit 847 Schülern (Swanson et al. submitted) konnte nachgewiesen werden, dass mit der neuen Formulierung keine Verletzungen der Normalverteilung mehr auftraten. Damit eignet sich die SWAN für Prävalenzbestimmungen in epidemiologischen Studien. Verteilungsbedingte Überschätzungen der Prävalenz von ADHS/HKS sind mit der SWAN nicht mehr zu erwarten. Aufgrund des weit fortgeschrittenen Planungsstadiums des Hauptsurveys sowie aus forschungsökonomischen Gründen bei bereits als maximal einzuschätzender Belastung der Probanden musste auf die Ergänzung des SWAN verzichtet werden. Da der Survey sehr breit angelegt ist und die psychische Gesundheit in dem Fragen- und Untersuchungsspektrum bereits einen sehr großen Raum einnimmt, hätte die zusätzliche Einführung des SWAN eine Überfrachtung des Untersuchungsablaufs bedeutet und wäre möglicherweise mit einer höheren Verweigerungsrate und damit verbundenen Einbußen bei der Repräsentativität einhergegangen. Die Repräsentativität und die Stichprobengröße sind wesentliche Qualitätsmerkmale des Survey, die nicht beeinträchtigt werden sollten. Der vorgelegte Algorithmus greift daher auf verfügbare Daten zu, ordnet diese gemäß den internationalen Forschungskriterien einem Bewertungs-Schema zu und ergänzt dieses durch A) trainierte Beobachtungsdaten und B) objektive Daten. Die Schlussfolgerungen werden durch vergleichende Analysen an einer parallel erhobenen Klinikstichprobe validiert. 16 7. Operationalisierung der Forschungsfrage im Hauptsurvey 7.1 Forschungskriterien Die Operationalisierung der Forschungsfrage erfolgt nach den ICD-10 Forschungskriterien, die nachfolgend in Originalformulierung aufgelistet sind. Erstes ICD-10 Hauptkriterium G1 ‚Unaufmerksamkeit’ Mind. 6 Monate bestanden mind. 6 der folgenden Kriterien: (cave: Entwicklungsstand berücksichtigen!) Die Kinder 1. 2. 3. 4. 5. 6. 7. 8. 9. sind häufig unaufmerksam gegenüber Details oder machen Flüchtigkeitsfehler bei den Schularbeiten und sonstigen Arbeiten und Aktivitäten sind häufig nicht in der Lage, die Aufmerksamkeit bei Aufgaben und beim Spielen aufrechtzuerhalten hören häufig scheinbar nicht, was ihnen gesagt wird können oft Erklärungen nicht folgen oder ihre Schularbeiten, Aufgaben oder Pflichten am Arbeitsplatz nicht erfüllen (nicht wegen oppositionellem Verhalten oder weil die Erklärungen nicht verstanden werden können) sind häufig beeinträchtigt, Aufgaben und Aktivitäten zu organisieren vermeiden ungeliebte Arbeiten, wie Hausaufgaben, die geistiges Durchhaltevermögen erfordern verlieren häufig Gegenstände, die für bestimmte Aufgaben oder Tätigkeiten wichtig sind, z.B. Unterrichtsmaterialien, Bleistifte, Bücher, Spielsachen und Werkzeuge werden häufig von externen Stimuli abgelenkt sind im Verlauf der alltäglichen Aktivitäten oft vergesslich. Zweites ICD-10 Hauptkriterium G2 ‚Überaktivität’ Mind. 6 Monate bestanden mind. 3 der folgenden Kriterien (cave: Entwicklungsstand berücksichtigen!) Die Kinder 1. 2. zappeln häufig mit Händen und Füßen oder winden sich auf den Sitzen verlassen ihren Platz im Klassenraum oder in anderen Situationen, in denen Sitzenbleiben erwartet wird 17 3. 4. 5. laufen häufig herum oder klettern exzessiv in Situationen, in denen dies unpassend ist (bei Jugendlichen oder Erwachsenen entspricht dem möglicherweise nur ein Unruhegefühl) sind häufig unnötig laut beim Spielen oder haben Schwierigkeiten, sich ruhig mit Freizeitbeschäftigungen zu befassen zeigen ein anhaltendes Muster exzessiver motorischer Aktivitäten, die durch die soziale Umgebung oder Vorschriften nicht durchgreifend beeinflussbar sind. Drittes ICD-10 Hauptkriterium G3 ‚Impulsivität’ Mind. 6 Monate bestanden mind. eines der folgenden Kriterien (cave: Entwicklungsstand berücksichtigen!) Die Kinder 1. 2. 3. 4. platzen häufig mit der Antwort heraus, bevor die Fragen beendet sind können häufig nicht in einer Reihe warten oder warten, bis sie bei Spielen oder in Gruppensituationen an die Reihe kommen unterbrechen und stören andere häufig (z.B. mischen sie sich ins Gespräch oder Spiel anderer ein) reden häufig exzessiv, ohne angemessen auf soziale Beschränkungen zu reagieren. Zusatzkriterium: ‚Erstmaliges Auftreten’ Die Störung muss vor dem siebten Lebensjahr erstmalig aufgetreten sein Zusatzkriterium: ‚Setting-Kriterium’ Die Störung muss situationsübergreifend d.h. in mehr als einem Setting (Familie, Schule, Untersuchungssituation) auftreten. Zusatzkriterium: ‚Zeitstabilität’ Die Störung muss über mind. 6 Monate bestehen. Angesichts der genetischen bzw. neurobiologischen Einflussfaktoren muss allerdings eine lebenslange Disposition angenommen werden, was viele Expertengremien dazu veranlasst hat, das 6-MonatsKriterium als methodische Untergrenze insbesondere bei jüngeren Kindern anzusehen, die in der Praxis hinsichtlich der Dauer der Symptomausprägungen weit übertroffen werden sollte. 18 7.2 Im Hauptsurvey bereits implementierte Items 7.2.1 Strengths and Difficulties Questionnaire (SDQ) Ein zentraler Baustein für Einschätzung psychischer Auffälligkeiten im Kinder- und Jugend Gesundheitssurvey stellt der 25 Items umfassende Screening-Fragebogen Strengths and Difficulties Questionnaire (SDQ) von Robert Goodman (1997) dar. Für das Instrument liegen umfassende Daten des British Child Mental Health Survey aus dem Jahr 1999 vor. Der britische Survey wurde an 10.438 Kindern und Jugendlichen im Alter von 5 bis 15 Jahren durchgeführt und stellt eine ideale Vergleichsmöglichkeit für den deutschen Survey dar. Goodman und Mitarbeiter (Goodman et al. 2000) haben zusätzlich eine Analyse über die Prädiktion kinderpsychiatrischer Störungen mittels des SDQ auf der Grundlage der britischen Surveys vorgelegt, die für unsere Forschungsfrage eine wichtige Bezugsgröße darstellt. Der britische Survey unterscheidet sich jedoch in wesentlichen Punkten von dem deutschen Survey, die für die Güte der ADHD-Prävalenzschätzung relevant sind. Im Gegensatz zu dem deutschen Survey wurden in der britischen Studie neben den ElternSDQ auch die korrespondierenden Lehrer-SDQ sowie die Schüler-SDQ (ab 11 Jahren) erhoben. Zusätzlich wurde ein Interview auf der Basis einer Batterie von Fragebogen, Tests und strukturierten Interview-Items durchgeführt. Das Datenmaterial wurde von Klinikern gesichtet und sowohl dem ICD-10 als auch dem DSM-IV Schlüssel zugeordnet. Die klinischen Rater waren blind gegenüber den SDQ-Daten. Die Spezifität des SDQ für eine psychiatrische Diagnose lag insgesamt bei 94,6% mit einem 95%igen Konfidenzintervall zwischen 94,1% und 95,1%. Die Sensitivität wurde mit 63,3% (KI 59,7 – 66,9%) berechnet. In dem deutschen Survey werden diese Werte etwas schlechter ausfallen, da sich die Zahl der Informanten unterscheidet: Der britische Survey bezieht Eltern-SDQ, Lehrer-SDQ und auch das Selbsturteil in Form des Schüler-SDQ (ab 11 Jahren) ein. Der deutsche Survey beschränkt sich auf das Elternurteil. Des Weiteren fehlt in dem deutschen Survey die Impact Skala des SDQ, was eine Einschätzung des psychosozialen Funktionsniveaus erschwert. Wie bereits in den ersten Kapiteln des Berichts erläutert, ist nicht nur die Symptomausprägung, sondern auch der daraus resultierende Leidensdruck für die diagnostische Einschätzung von Bedeutung. 19 In dem hier vorgelegten Abschlussbericht wird mittels einer parallel gezogenen Klinikstichprobe eine Grundlage geschaffen, den Impact-Score auf konservativem Wege zu schätzen. Insgesamt ist in dem deutschen Survey von einer geringeren Prädiktionskraft für die ADHS/HKS-Prävalenz auf der Grundlage der SDQ- und begleitenden Daten auszugehen. In Abwägung der methodischen Einschränkungen bezogen auf die Bestimmung des ADHS/HKS und der ansonsten optimalen Survey-Bedingungen (Repräsentativität, Stichprobengröße) sollten jedoch die avisierten Analysen zur Bestimmung der Prävalenz und Behandlung von Kindern mit ADHS/HKS vorangetrieben werden, da sie die auf absehbare Zeit einzigen und aussagekräftigsten Ergebnisse darstellen werden und somit von erheblichen gesundheitspolitischen Nutzen sind. 7.2.2 Rating trainierter Beobachter Die Interviewer des Gesundheitssurvey wurden anhand von Videomaterial der Klinik geschult. Das Videomaterial rekrutierte sich aus 130 Filmen aus der BfArM-Langzeitstudie von Kindern und Jugendlichen, die multiaxial mittels strukturierten kinderpsychiatrischen Interviews diagnostiziert wurden. Ergänzt wurde das Videomaterial durch exemplarische Bänder von Patienten unserer Klinik. Für die forschungsbezogene Verwendung der Bänder für Trainingszwecke liegt ein schriftliches Einverständnis vor. Das Training wurde am 9. Mai 2003 in Berlin durchgeführt. Zunächst erfolgte eine umfassende theoretische Schulung bezüglich der diagnostischen Kriterien, insbesondere bezüglich der drei Hauptsymptome Aufmerksamkeitsstörung, Impulskontrollstörung und motorische Unruhe. In der sich anschließenden Trainingsphase wurden die Untersucher an Videobeispielen unterrichtet, die drei Hauptsymptome einzuschätzen. Am Ende der Schulung erfolgte die Überprüfung der Interrater-Reliabilität an 5 ausgewählten Videobändern. Ziel des Trainings war eine möglichst hohe Urteils-Übereinstimmung (Inter-Rater Reliabilität) der Untersucher auf 6 Items mit vierfach gestuften Likert-Skalen. Die Items, deren Wortlaut in Tabelle 1 wiedergeben ist, sind den Conners-Skalen entnommen. Den drei Hauptsymptomen des ADHS/HKS sind jeweils zwei Items zugeordnet. 20 Bitte beschreiben Sie das Kind / den Jugendlichen während der Untersuchung überhaupt ein wenig ziemlich sehr stark □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ □ nicht War unruhig, zappelig Konnte sich schlecht auf die Aufgaben konzentrieren War erregbar, impulsiv War leicht ablenkbar Redete dazwischen Konnte nicht lange stillsitzen Tabelle 1: Original-Items, mit denen das Verhalten während der Untersuchung eingeschätzt wird (nach Conners adaptiert) Die Interviewer benötigten für das Training keine fachspezifischen Vorkenntnisse. Angestrebt wurde ein Kappa-Wert von über .80, was einer exzellenten Urteilsübereinstimmung entspricht. Cohen (1960, 1968) hatte den Kappa-Koeffizienten ursprünglich für die Übereinstimmung zweier Beurteiler konzipiert, die mehrere Probanden einschätzen. Für nominale Daten wird der klassische Kappa-Koeffizient angewendet, für ordinale Daten erfolgt die Berechnung der Urteilsübereinstimmung nach dem gewichteten Kappa (sog. weighted Kappa). Der klassische Kappa-Koeffizient berechnet sich nach po – pe / 1 – pe, wobei po für die beobachtete Häufigkeit der jeweiligen Urteilskategorie und pe für die aus den Randverteilungen geschätzte zufällige Urteilsübereinstimmung steht. Wie der Formel zu entnehmen ist, gibt der KappaKoeffizient darüber Auskunft, wie gut zwei Beurteiler über die zufällige Übereinstimmung hinaus in ihrem Urteil übereinstimmen. Damit ist der Kappa-Koeffizient ein überaus konservatives Mass. Wie bereits erwähnt, gelten Kappa-Werte von über .80 in der sozialwissenschaftlichen Forschung als exzellente Übereinstimmung. Der gewichtete KappaKoeffizient berücksichtigt nicht nur die Urteile, die exakt übereinstimmen, sondern im Falle unterschiedlicher Einschätzungen auch das Ausmaß der jeweiligen Abweichung. Bei der von 21 uns eingesetzten 4fach gestuften Likert-Skala handelt es sich um ein ordinales Skalenniveau. Somit ist der gewichtete Kappa-Koeffizient als das angemessene Verfahren für die Berechnung der Urteilsübereinstimmung anzusehen. Cohen (1960, 1968) hatte den Kappa-Koeffizienten für die Übereinstimmung von zwei Beurteilern entwickelt, und bereits auf Möglichkeiten hingewiesen, diesen für mehrere Urteiler zu erweitern. Der Kappa-Koeffizient für mehrere Urteiler wurde dann von Fleiss (1971) realisiert. Konsistente Kennwerte des Fleiss’schen Kappa-Koeffizienten sind erst bei hinreichend vielen Urteilen zu erwarten (z.B. erwartete Zellhäufigkeit von pe >= 5). Im Rahmen des Untersuchertrainings lagen jedoch Urteile von 8 Untersuchern über 5 exemplarische Videobänder vor. Viele der über die Randverteilungen geschätzten erwarteten Zellhäufigkeiten hätten in unserem Falle den von Fleiss (1971) vorausgesetzten Kriterien nicht genügt. Daher entschieden wir uns für ein von Bortz und Koautoren (1997) favorisiertes, konservatives Vorgehen und berechneten Mittelwerte der klassischen KappaWerte, die sich aus allen möglichen Urteiler-Paaren ergaben. Die Anzahl möglicher Urteilerpaare bei 8 Untersuchern berechnet sich nach der Formel: 8! / 2! x 6!. Somit ergeben sich bei 8 Untersuchern 23 Möglichkeiten des Paarvergleichs. Die Auswahl der Rating-Items und deren Formulierung orientierte sich an bereits für standardisierte Testsituationen etablierte Beobachtungsverfahren (Swanson 1992), die sich als reliabel und valide erwiesen haben (Roberts 1990). Die Antwort-Skala ist in Anlehnung an die beiden ‚Klassiker’ der ADHS-Forschung (Conners-Skala und die SNAP-IV) vierfach gestuft ( 0 = überhaupt nicht; 1 = ein wenig; 2 = ziemlich; 3 = sehr stark). Die vierfache Stufung hat auch den Vorteil, einer Antwort-Tendenz zur Mitte, wie sie bei ungeübten Ratern häufig anzutreffen ist, entgegenzuwirken (Bortz et al. 1995; S.167). Die Itemformulierungen wurden den international evaluierten Übersetzungen (Huss et al. 2001) der Conners-Skalen entnommen. Die Zuordnung von jeweils 2 Items zu den drei Hauptsymptomen ist klinisch in höchstem Maße evident. Erwartungsgemäß fiel eine probeweise Rückzuordnung durch Fachärzte unserer Klinik zu 100% übereinstimmend aus (leicht ablenkbar; konnte sich schlecht konzentrieren = Aufmerksamkeitsproblem; zappelig; konnte nicht lange stillsitzen = motorische Unruhe; redet dazwischen; impulsiv = Impulskontrollstörung). 22 7.2.3 Objektive Verfahren Mangels hinreichend reliabler und valider objektiver Messverfahren werden in der ADHS/HKS-Forschung überwiegend subjektive Testverfahren wie Fragebogen oder Interviews eingesetzt. Dennoch gab es in den vergangenen Jahren erhebliche Forschungsanstrengungen, auch objektive Messverfahren in der Diagnostik des ADHS zu etablieren. Dabei hat sich gezeigt, dass sich die drei Hauptsymptome des ADHS/HKS unterschiedlich gut messen lassen. Bei den Aufmerksamkeits- und Impulskontrollstörungen haben sich neuropsychologische Verfahren durchgesetzt, die meist auf der Grundlage sog. gono-go Paradigmen beruhen. Gemessen werden Fehlerraten und Reaktionszeiten. Dabei haben sich sog. Auslassungsfehler (omission errors) als indikativ für Aufmerksamkeitsprobleme und sog. Inhibitionsfehler (comission errors) als indikativ für Impulsivitätsprobleme erwiesen. Beide Fehler lassen sich mit dem sog. Continuous Performance Test messen. Aufgrund fehlender Normwerte sowie aufgrund des erheblichen technischen und zeitlichen Aufwandes konnten diese Verfahren nicht im Hauptsurvey verankert werden. Bei der objektiven Messung der motorischen Unruhe waren in den vergangenen Jahren ebenfalls Neuerungen zu verzeichnen. Unsere Arbeitsgruppe (Huss 2003 siehe Anhang) hat in diesem Zusammenhang ein Doppler-Radar Gerät entwickelt, das sich im klinischen Alltag bereits seit mehreren Jahren bewährt hat. Mittlerweile wurde von der Charité Berlin in Zusammenarbeit mit der Investitionsbank Berlin ein internationales Patentverfahren auf den Weg gebracht. Das Verfahren wurde für den europäischen Innovationspreis der AltranStiftung nominiert und erhielt im Juni 2003 vor der UNESCO in Paris einen der sechs Finalistenpreise. Im Anhang ist eine Projektskizze wiedergegeben, die das Verfahren und das Gerät beschreibt. Für den Einsatz im Rahmen des Gesundheitssurveys bot sich das Radar-Gerät an, da es keine zusätzliche Untersuchungszeit erforderlich macht, das kindliche Verhalten nicht beeinflusst und einfach zu bedienen ist. Das Gerät misst – ähnlich wie der ‚klinische Blick’ - die globalmotorische Unruhe, d.h. alle Bewegungen der Körperoberfläche werden aufgezeichnet, unabhängig von der Körperpartie und den dabei beteiligten Muskelgruppen. Um eine möglichst standardisierte Untersuchungssituation unter gleichen Anforderungsbedingungen zu gewährleisten, entschieden wir uns, die motorische Unruhe während des Sehtests im Rahmen des Gesundheitssurveys aufzuzeichnen. 23 Es wurden dafür eigens drei Prototypen bereitgestellt und eine Software (ActoTrace Version 1.0.3) entwickelt, welche die motorische Unruhe mit einer Genauigkeit von 1 ms auf den im Survey verwendeten Laptops in Echtzeit unter einem 32bit-Betriebssystem aufzeichnet. Im Rahmen des Trainings am 9. Mai 2003 wurden die Untersucher mit dem Gerät und der Software vertraut gemacht. Die Rohdaten werden in anonymisierter Form per e-mail an Herrn Huss geschickt und von diesem statistisch ausgewertet. Bislang konnten auf diesem Wege bereits 600 Probanden des Hauptsurveys ausgewertet werden. Somit werden in Zukunft objektive Daten über die motorische Unruhe der Probanden in standardisierten Testsituationen zur Verfügung stehen. Wir erhoffen uns davon einen Zugewinn an Genauigkeit hinsichtlich der Prävalenzbestimmung des ADHS/HKS. 7.2.4 Diagnosealgorithmus auf der Grundlage der im Hauptsurvey implementierten Informationen Aufmerksamkeit Eltern-/Selbsturteil Lehrerurteil Untersuchung (Familie) (Schule) (Survey) 1) 2) 3) SDQ: Aufmerksamkeits- nur indirekt über: Rating trainierter Probleme Schulnoten Beobachter Itemblock Wohlbefinden Item 2 + 4 in der Schule (insb. Item über Schulaufgaben) Impulsivität 4) 5) 6) SDQ: Störungen der nicht verfügbar Rating trainierter Impulskontrolle Beobachter Item 3 + 5 motorische Unruhe 7) 8) 9) SDQ: Hyperaktivität nicht verfügbar Rating trainierter Beobachter Item 1 + 6 Aktometrie 24 Psychosoziales Funktionsniveau (Impact / bzw. Setting-Kriterium) 10) 11) 12) Inanspruchnahme von indirekt: keine Angaben Hilfe Schulnoten Wohlbefinden Klassenwiederholungen (Eltern/Kinder/ Eltern/Kinder/ Jugendliche) Jugendliche: Wohlbefinden in der Schule (insb. Schulaufgaben) Zeitkriterium 13) 14) 15) Elternangaben über keine Angaben keine Angaben Zeitdauer Tabelle 2: HKS-Diagnosealgorithmus Für die einzelnen Zellen (siehe Tabelle 2) sind folgende Items verfügbar: Zelle 1) Elternfragebogen 3-6 Jahre Skala Hyperaktivität (Aufmerksamkeits-Items): • Item 53_15: Leicht ablenkbar (positive Kodierung: 0-1-2) • Item 53_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne (negative Kodierung: 2-1-0) Elternfragebogen 7-10 Jahre Skala Hyperaktivität (Aufmerksamkeits-Items): • Item 54_15: Leicht ablenkbar (positive Kodierung: 0-1-2) • Item 54_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne (negative Kodierung: 2-1-0) Elternfragebogen 11-13 Jahre Skala Hyperaktivität (Aufmerksamkeits-Items): • Item 46_15: Leicht ablenkbar (positive Kodierung: 0-1-2) 25 • Item 46_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne (negative Kodierung: 2-1-0) Kinderfragebogen 11-13 Jahre Skala Hyperaktivität (Aufmerksamkeits-Items): • Item 16_15: Leicht ablenkbar (positive Kodierung: 0-1-2) • Item 16_25: Was ich angefangen habe, macht ich zu Ende, ich kann mich lange genug konzentrieren (negative Kodierung: 2-1-0) CAVE: in der uns vorliegenden Fragebogenversion für Kinder 11-13 Jahre wurde fälschlicherweise die Reihenfolge der SDQ-Items 24 und 25 vertauscht. Elternfragebogen 14-17 Jahre Skala Hyperaktivität (Aufmerksamkeits-Items): • Item 46_15: Leicht ablenkbar (positive Kodierung: 0-1-2) • Item 46_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne (negative Kodierung: 2-1-0) Jugendfragebogen 14-17 Jahre Skala Hyperaktivität (Aufmerksamkeits-Items): • Item 37_15: Leicht ablenkbar (positive Kodierung: 0-1-2) • Item 37_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne (negative Kodierung: 2-1-0) CAVE: in der uns vorliegenden Fragebogenversion für Jugendliche 14-17 Jahre wurde fälschlicherweise die Reihenfolge der SDQ-Items 24 und 25 vertauscht. Zelle 2) Es liegen keine direkten Lehrerurteile über das Verhalten der Schüler vor. Indirekt kann eine orientierende Aussage über Aufmerksamkeitsprobleme mittels der Schulnoten (Mathematik- und Deutschnote) getroffen werden: Wenn sich in den Schulnoten keine Leistungsprobleme abzeichnen, liegt keine schwerwiegende Aufmerksamkeitsstörung vor. Umgekehrt kann allerdings aus dem Vorliegen von Schulleistungsproblemen nicht auf Aufmerksamkeitsstörungen geschlossen werden, da diese vielfältige Ursachen haben können. 26 Orientierend können auch die Angaben der Eltern über das Wohlbefinden der Kinder und Jugendliche in der Schule herangezogen werden. Hierbei ist insbesondere das Item ‚In der letzten Woche hat mein Kind die Schulaufgaben gut geschafft (nie – selten – manchmal – oft – immer)’ von Bedeutung. Zelle 3) Hinweise auf Aufmerksamkeitsprobleme während der Untersuchung werden von den trainierten Untersuchern auf der in Kapitel 7.2.2 beschriebenen adaptierten Conners-Skala eingeschätzt. Folgende Items beziehen sich auf Aufmerksamkeitsprobleme: Item 2: Konnte sich auf die Aufgaben schlecht konzentrieren 0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark Item 4: War leicht ablenkbar 0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark Wie dem Kapitel über die Ergebnisse des Untersuchertrainings (Kapitel 10) zu entnehmen ist, wurden bei dem Reliabilitätstest für die Aufmerksamkeits-Items mit Kappa = .62 bzw. weigthed Kappa = .91 sehr gute Urteilsübereinstimmungen erzielt. Zelle 4) Elternfragebogen 3-6 Jahre Skala Hyperaktivität (Impulsivitäts-Item): • Item 53_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0) Elternfragebogen 7-10 Jahre Skala Hyperaktivität (Impulsivitäts-Item): • Item 54_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0) Elternfragebogen 11-13 Jahre Skala Hyperaktivität (Impulsivitäts-Item): 27 • Item 46_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0) Kinderfragebogen 11-13 Jahre Skala Hyperaktivität (Impulsivitäts-Item): • Item 16_21: Ich denke nach, bevor ich handle (negative Kodierung: 2-1-0) Elternfragebogen 14-17 Jahre Skala Hyperaktivität (Impulsivitäts-Item): • Item 46_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0) Jugendfragebogen 14-17 Jahre Skala Hyperaktivität (Impulsivitäts-Item): • Item 37_21: Ich denke nach, bevor ich handle (negative Kodierung: 2-1-0) Zelle 5) Es liegen keine Lehrerinformationen über impulsives Verhalten in der Schule/ dem Kinderhort vor. Darüber hinaus ergeben sich aus dem vorliegenden Datenmaterial keine Möglichkeiten, impulsives Verhalten in der Schule /dem Hort abzuschätzen. Zelle 6) Hinweise auf Probleme der Impulskontrolle während der Untersuchung werden von den trainierten Untersuchern auf der in Kapitel 7.2.2 beschriebenen adaptierten Conners-Skala eingeschätzt. Folgende Items beziehen sich auf Probleme der Impulskontrolle: Item 3: War erregbar, impulsiv 0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark Item 5: Redete dazwischen 0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark 28 Wie dem Kapitel über die Ergebnisse des Untersuchertrainings (Kapitel 10) zu entnehmen ist, wurden bei dem Reliabilitätstest für die Impulsivitäts-Items mit Kappa = .63 bzw. weigthed Kappa = .93 sehr gute Urteilsübereinstimmungen erzielt. Zelle 7) Elternfragebogen 3-6 Jahre Skala Hyperaktivität: • Item 53_2: Unruhig, überaktiv, kann nicht lange stillsitzen (positive Kodierung: 0-1-2) • Item 53_10: Ständig zappelig (positive Kodierung: 0-1-2) Elternfragebogen 7-10 Jahre Skala Hyperaktivität: • Item 54_2: Unruhig, überaktiv, kann nicht lange stillsitzen (positive Kodierung: 0-1-2) • Item 54_10: Ständig zappelig (positive Kodierung: 0-1-2) Elternfragebogen 11-13 Jahre Skala Hyperaktivität: • Item 46_2: Unruhig, überaktiv, kann nicht lange stillsitzen (positive Kodierung: 0-1-2) • Item 46_10: Ständig zappelig (positive Kodierung: 0-1-2) Kinderfragebogen 11-13 Jahre Skala Hyperaktivität: • Item 16_2: Ich bin oft unruhig, ich kann nicht lange stillsitzen (positive Kodierung: 0-1-2) • Item 16_10: Ich bin dauernd in Bewegung und zappelig (positive Kodierung: 0-1-2) Elternfragebogen 14-17 Jahre Skala Hyperaktivität: • Item 46_2: Unruhig, überaktiv, kann nicht lange stillsitzen 29 (positive Kodierung: 0-1-2) • Item 46_10: Ständig zappelig (positive Kodierung: 0-1-2) Jugendfragebogen 14-17 Jahre Skala Hyperaktivität: • Item 37_2: Ich bin oft unruhig, ich kann nicht lange stillsitzen (positive Kodierung: 0-1-2) • Item 37_10: Ich bin dauernd in Bewegung und zappelig (positive Kodierung: 0-1-2) Zelle 8) Es liegen keine Lehrerinformationen über motorische Unruhe in der Schule/ dem Kinderhort vor. Darüber hinaus ergeben sich aus dem vorliegenden Datenmaterial keine Möglichkeiten, die motorische Unruhe in der Schule /dem Hort abzuschätzen. Zelle 9) Hinweise auf motorische Unruhe während der Untersuchung werden von den trainierten Untersuchern auf der in Kapitel 7.3 beschriebenen adaptierten Conners-Skala eingeschätzt. Folgende Items beziehen sich auf die motorische Unruhe: Item 1: War unruhig, zappelig 0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark Item 6: Konnte nicht lange stillsitzen 0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark Wie dem Kapitel über die Ergebnisse des Untersuchertrainings (Kapitel 10) zu entnehmen ist, wurden bei dem Reliabilitätstest für die Hyperaktivitäts-Items mit Kappa = .54 bzw. weigthed Kappa = .88 gute Urteilsübereinstimmungen erzielt. Zusätzlich wird die motorische Unruhe objektiv mittels Radar-Aktometrie während einer standardisierten Untersuchungssituation (Sehtest) erfasst. Da bislang zu dem im Survey eingesetzten Untersuchungs-Setting keine Normwerte vorliegen, wird die Extremgruppe mit 30 überdurchschnittlich hohen Hyperaktivitätswerten anhand der Verteilung der Gesamtstichprobe (>= 95. Perzentile) ermittelt. Zelle 10) Elternfragebogen 3-6 Jahre: Frage 27_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein Fragenblock zum Wohlbefinden: Block 47 ‚Seelisches Wohlbefinden’; Block 48 ‚Selbstwert’; Block 49 ‚Familie’; Block 50 ‚Freunde’ Elternfragebogen 7-10 Jahre: Frage 28_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein Fragenblock zum Wohlbefinden: Block 48 ‚Seelisches Wohlbefinden’; Block 49 ‚Selbstwert’; Block 50 ‚Familie’; Block 51 ‚Freunde’ Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens Elternfragebogen 11-13 Jahre: Frage 28_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein Fragenblock zum Wohlbefinden: Block 40 ‚Seelisches Wohlbefinden’; Block 41 ‚Selbstwert’; Block 42 ‚Familie’; Block 43 ‚Freunde’ Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens Kinderfragebogen 11-13 Jahre: Fragenblock zum Wohlbefinden: Block 10 ‚Seelisches Wohlbefinden’; Block 11 ‚Selbstwert’; Block 12 ‚Familie’; Block 13 ‚Freunde’ Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens Elternfragebogen 14-17 Jahre: Frage 28_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein 31 Fragenblock zum Wohlbefinden: Block 40 ‚Seelisches Wohlbefinden’; Block 41 ‚Selbstwert’; Block 42 ‚Familie’; Block 43 ‚Freunde’ Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens Jugendlichenfragebogen 14-17 Jahre: Fragenblock zum Wohlbefinden: Block 31 ‚Seelisches Wohlbefinden’; Block 32 ‚Selbstwert’; Block 33 ‚Familie’; Block 34 ‚Freunde’ Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens Zelle 11) Es liegen keine direkten Lehrerurteile über Auswirkungen des ADHS auf die Schulleistung bzw. das Verhalten der Schüler und deren sozialer Integration vor. Ähnlich wie bereits für die Aufmerksamkeitsstörungen, kann eine indirekte Einschätzung des Leistungsniveaus durch die Schulnoten (Mathematik- und Deutschnote) vorgenommen werden. Zusätzlich ergeben sich Indikatoren aus Klassenwiederholungen. Die Interpretation muss erneut sehr zurückhaltend erfolgen. Wenn sich in den Schulnoten keine Leistungsprobleme abzeichnen bzw. keine Klassenwiederholungen erfolgt sind, liegen keine schwerwiegenden Einschränkungen des Funktionsniveaus im schulischen Bereich vor. In der Regel gehen schwere ADHS/HKS-Verhaltensauffälligkeiten mit Einschränkungen der schulischen Leistungsfähigkeit – häufig auch mit Klassenwiederholungen - einher. Orientierend können auch die Angaben der Eltern über das Wohlbefinden der Kinder und Jugendliche in der Schule herangezogen werden. Hierbei ist insbesondere das Item ‚In der letzten Woche hat mein Kind die Schulaufgaben gut geschafft (nie – selten – manchmal – oft – immer)’ von Bedeutung. Elternfragebogen 7-10 Jahre • Frage 61: Seit dem Schuleintritt hat mein Kind eine/mehrere Klassen wiederholt. • Frage 62: Falls noch keine Noten vergeben werden -> Einschätzung der Schulleistungen durch die Eltern in ungenügend – unterdurchschnittlich – durchschnittlich - überdurchschnittlich • Frage 62: Falls Noten vergeben wurden: Welche Note bzw. welche Punktzahl hat Ihr Kind auf dem letzten Zeugnis in..? 32 … Mathematik … Deutsch Elternfragebogen 11-13 Jahre • Frage 53: Seit dem Schuleintritt hat mein Kind eine/mehrere Klassen wiederholt. • Frage 54: Welche Note bzw. welche Punktzahl hat Ihr Kind auf dem letzten Zeugnis in..? … Mathematik … Deutsch Elternfragebogen 14-17 Jahre • Frage 53: Seit dem Schuleintritt hat mein Kind eine/mehrere Klassen wiederholt. • Frage 54: Welche Note bzw. welche Punktzahl hat Ihr Kind auf dem letzten Zeugnis in..? … Mathematik … Deutsch Die indirekten Informationen über die Schule (Schulnoten; Klassenwiederholungen; Wohlbefinden bezogen auf die Schule) sind zu unspezifisch als dass sie mit hinreichender Sicherheit einer der Zellen 2, 5, 8, 11 oder 14 zugeordnet werden könnten. Die beste Zuordnung ist für die Zellen 2 und 11 zu erwarten. Für den Diagnosealgorithmus schlagen wir daher eine Zuordnung zu beiden Zellen mit entsprechend niedriger Gewichtung vor. Zelle 12) Die Untersucher erheben keine Daten über das psychosoziale Funktionsniveau im schulischen Bereich. Zelle 13) Elternfragebogen 3-6 Jahre • Frage 27_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von mindestens 12 Monaten zu erwarten? ja/nein 33 (Bezug: Frage 29_13: Hat Ihr Kind emotionale, Entwicklungs- oder Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?) Elternfragebogen 7-10 Jahre • Frage 28_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von mindestens 12 Monaten zu erwarten? ja/nein (Bezug: Frage 29_13: Hat Ihr Kind emotionale, Entwicklungs- oder Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?) Elternfragebogen 11-13 Jahre • Frage 28_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von mindestens 12 Monaten zu erwarten? ja/nein (Bezug: Frage 29_13: Hat Ihr Kind emotionale, Entwicklungs- oder Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?) Elternfragebogen 14-17 Jahre • Frage 28_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von mindestens 12 Monaten zu erwarten? ja/nein (Bezug: Frage 29_13: Hat Ihr Kind emotionale, Entwicklungs- oder Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?) Zelle 14) Es liegen keine Angaben der Lehrer über den Zeitverlauf von keine Daten über den Zeitverlauf einer Lern- und Verhaltensauffälligkeiten vor. Zelle 15) Die Untersucher erheben eventuellen Verhaltensauffälligkeit. 34 8 SDQ-Ergebnisse aus dem Pretest Für die hier vorgelegte Auswertung der Pretest-Daten erhielten wir vom Robert-Koch-Institut einen SDQ-Datensatz von ursprünglich n = 1.626 Kindern und Jugendlichen. 207 Fälle enthielten keine Daten (als missing data deklariert). Bei 55 Fällen fehlten die Angaben zu mehr als einem Item und wurden daher aus Gründen eines konservativen Vorgehens von der Analyse ausgeschlossen. Es resultiert somit ein verwertbarer Datensatz von n = 1.364 Fällen. Die Geschlechtsverteilung beträgt 685 (50,2%) Jungen zu 679 (49,8%) Mädchen. Der Altersmittelwert liegt bei 11,31 Jahren mit einer Standardabweichung von 3,94 Jahren. Parallel dazu wurden in unserer Klinik im Zeitraum vom 16. Januar 2001 bis zum 16. Juli 2003 eine Stichprobe von n = 1.221 Kindern und Jugendlichen mittels des SDQ erhoben. Bei der Geschlechtsverteilung überwiegen – wie in kinderpsychiatrischen Inanspruchnahmepopulationen üblich - die Jungen mit n = 827 (67,7%) gegenüber den Mädchen mit n = 394 (32,3%). Der Altersmittelwert der Klinikstichprobe liegt bei 10,56 Jahren mit einer Standardabweichung von 3,42 Jahren. Die Auswertung der SDQ-Daten erfolgt nach den Vorgaben von Prof. Robert Goodman (www.sdqinfo.com). Wie der SPSS-Steuerdatei im Anhang zu entnehmen ist, werden 5 Skalen gebildet, in die jeweils 5 Items eingehen. Die 5 Skalen sind inhaltlich charakterisiert als: 1) Emotionale Probleme, 2) AufmerksamkeitsDefizit-Hyperaktivitäts Probleme, 3) Betragensprobleme, 4) Probleme mit Peers und 5) Prosoziales Verhalten. Die Summe der vier erstgenannten Skalen bildet den sog. ProblemScore, der als allgemeiner Index für psychische Auffälligkeiten gewertet wird. Die Skala ‚Prosoziales Verhalten’ erfragt explizit positive Ressourcen der Kinder und geht damit nicht in die Berechnung psychischer Auffälligkeiten ein. Üblicherweise fallen die Werte für prosoziales Verhalten in Klinikstichproben gegenüber einer Feldstichprobe niedriger aus. Bei der Konstruktion des Fragebogens ging Robert Goodman auch bei manchen ProblemItems ressourcen-orientiert vor. Dies bedeutet, dass manche Fragen positiv umformuliert wurden und bei der Auswertung der Problem-Skalen gegensinnig kodiert werden müssen. Beispielsweise wird in der Skala der Aufmerksamkeitsstörungen mit Item 25 erfragt, ob das Kind Aufgaben zu Ende führen kann. Wird die Frage von den Eltern verneint, so wird diese Angabe mit positivem Itemwert in der Skala verrechnet. Die genaue Konstruktion der Skalen und ihrer Umkodierungen sind dem Steuerfile im Anhang zu entnehmen. 35 In der Einleitung des Forschungsberichts wurde bereits darauf hingewiesen, dass die Ausprägung von Symptomen noch keine hinreichende Aussage über das Vorliegen einer Erkrankung bzw. psychischen Störung erlaubt. Insbesondere bei dem hier zu untersuchenden ADHS/HKS muss zusätzlich eine Beeinträchtigung des psychosozialen Funktionsniveaus vorliegen. Wie in Kapitel 7 erläutert, muss darüber hinaus noch die Dauer der Symptome mindestens 6 Monate betragen. In der Klinikstichprobe lassen sich die Beeinträchtigung des psychosozialen Funktionsniveau wie auch die Zeitdauer der Probleme sehr gut aus dem Impact-Teil ableiten. Wie dem Original-Fragebogen im Anhang zu entnehmen ist, wird erfragt, ob sich aus den beschriebenen Symptomen Probleme im Alltagsleben – gegliedert nach Familie, Schule, Freizeit und Umgang mit Gleichaltrigen – ergeben. Die Zeitdauer wird stratifiziert erfasst (0 = weniger als 1 Monat; 1 = 1 bis 5 Monate; 2 = 6 – 12 Monate; 3 = über ein Jahr). Die genaue Berechnung des sog. Impact-Scores, der Zeitangaben sowie der Auswirkungen auf das Alltagsleben können dem SPSS-Steuerfile im Anhang entnommen werden. Goodman und Mitarbeiter (2000) haben auf der Grundlage des britischen Surveys Schwellenwerte (cut-off-values) gebildet, die sich an den Perzentilen der repräsentativen britischen Stichprobe orientieren. Die Schwellenwerte wurden so gewählt, dass etwa 80% der Kinder als unauffällig, 10% der Kinder als grenzwertig auffällig und 10% der Kinder als auffällig klassifiziert werden. Wörner et al. (2002) hat diese Schwellenwerte für Deutschland weitgehend replizieren können. Die von Goodman (www.sdqinfo.com) ermittelten Schwellenwerte sind nachfolgender Tabelle zu entnehmen. Normal Grenzwertig Auffällig Gesamtproblemwert 0-13 14-16 17-40 Emotionale Probleme 0-3 4 5-10 Verhaltensprobleme 0-2 3 4-10 Hyperaktivität 0-5 6 7-10 Probleme mit Peers 0-2 3 4-10 Prosoziales Verhalten 6-10 5 0-4 Impact-Skala 0 1 2-10 Tabelle 3: Schwellenwerte der SDQ-Skalen nach Goodman (www.sdqinfo.com) 36 Da die Rohwerte (z.B. für Zappeln, Dazwischenreden etc.) alters- und geschlechtsabhängig sind, wurde bei der T-Wert-Berechnung bekannter internationaler Screening-Instrumente (z.B. Child Behavior Checklist, Conners-Skalen) eine Alters- und Geschlechtsstratifizierung vorgenommen. Umso verwunderlicher ist es, dass bei den cut-off-values von Robert Goodman weder Geschlechts- noch Alterseffekte berücksichtigt wurden. Gemäß dieser Vorgabe gilt ein dreijähriger Junge als ebenso auffällig, wenn er Rohwertpunkte über 6 auf der Hyperaktivitätsskala aufweist, wie ein 17jähriges Mädchen. Wir gehen davon aus, dass die SDQ-Daten des Hauptsurveys die Schwächen dieses Verfahrens aufweisen und als Grundlage dienen werden, alters- und geschlechtsstratifizierte cut-off-values für die Bundesrepublik zu erstellen. Die nachfolgende Graphik einer orientierenden Analyse (Ordinate = Mittelwert mit 95%igem Konfidenzintervall der Rohwerte aus der Hyperaktivitätsskala; Abzisse = Alter der Kinder) der uns vorliegenden SDQ-Daten aus der Klinik und aus dem Pretest des RKI bestätigt, dass mit Alters- und insbesondere mit Geschlechtseffekten zu rechnen ist. 37 HKS-Skalenwert mit 95% Konfidenzintervall 10 8 6 RKI Jungen 4 RKI Mädchen Charite Jungen 2 Charite Mädchen 0 4 6 5 8 7 10 9 12 11 14 13 16 15 17 Alter Abbildung 1: Altersverteilung der HKS-Rohwerte gegliedert nach Geschlecht und Stichprobe Da die Repräsentativität der Pretest-Daten nicht belegt ist, verzichten wir auf eine deutsche Adaptation der cut-off-values und übernehmen die von Goodman veröffentlichten Werte. Im Rahmen der Prävalenzschätzung mit den Daten des Hauptsurveys sollte allerdings eine entsprechende Adjustierung insbesondere für das Geschlecht durchgeführt werden. Wie bereits erwähnt, wurde der SDQ im Pretest wie auch im Hauptsurvey aus zeitökonomischen Gründen ohne Impact-Teil eingesetzt. Damit entfällt die Möglichkeit, den 38 Impact-Score und das Zeitkriterium in die Analysen direkt einzubeziehen. Für die hier vorzunehmende Prävalenzbestimmung sind wir daher auf konservative Schätzverfahren angewiesen. Für den Umgang mit fehlenden SDQ-Daten über das psychosoziale Funktionsniveau sowie der Zeitdauer der Symptome wurden folgend methodische Vorüberlegungen angestellt: A) Ein erster methodischer Zugang zu dem Problem fehlender Impact-Daten im Pretest und Hauptsurvey besteht darin, das psychosoziale Funktionsniveau und die Zeitdauer der Symptome bei der Prävalenzbestimmung nicht zu berücksichtigen. Die SDQ-Analysen müssten sich dann auf die Symptomausprägung beschränken. Wie bereits ausgeführt, definiert sich ADHS/HKS aber nicht nur auf der Grundlage von Symptomen, sondern auch aus deren Dauer und ihren Auswirkungen auf das Alltagsleben des Kindes. Wie bei Wolraich et al. (1998) gezeigt werden konnte, ist bei einer Analyse, die sich nur auf Symptome bezieht, mit einer deutlichen Überschätzung der Prävalenz zu rechnen. Wir entschieden uns daher, nicht auf das psychosoziale Funktionsniveau und die Zeitdauer zu verzichten, sondern diese aus der parallel erhobenen Klinikstichprobe zu schätzen. B) Patienten einer kinderpsychiatrischen Klinik zeigen erwartungsgemäß höhere Symptomausprägungen als Kinder einer unausgelesenen Feldstichprobe. Die genauen Werte werden nachfolgend aufgeführt. Die zu ewartende Prävalenz von ADHS/HKS ist in der Klinik um ein Vielfaches (Faktor 10 bis 15) höher als in einer unausgelesenen Feldstichprobe. Dennoch finden sich in der Klinik eine Reihe von Kinder, die hohe Symptomausprägungen haben, ohne jedoch das Kriterium der Zeitdauer (mind. 6 Monate) oder das Kriterium ‚Leidensdruck’ zu erfüllen. Eine ADHS-Diagnose wäre somit bei diesen Kindern nicht gerechtfertigt. Da die Klinikpatienten aufgrund meist schwerwiegender Probleme bei uns vorgestellt werden, ist davon auszugehen, dass der Anteil der hohen Symptomträger mit niedrigem Leidensdruck bzw. kurzzeitiger Symptomausprägung gering ausfällt. Nimmt man diese Rate als Schätzwert für eine Feldstichprobe, unterschätzt man die Anzahl der Symptomträger ohne 39 Leidensdruck im Feld. Mit anderen Worten: bezogen auf unsere Forschungsfrage wird ein konservativer Fehler begangen. Die Rohwertevergleiche für alle SDQ-Skalen einschließlich des sog. Total-ProblemScore sind Tabelle 4 zu entnehmen. Deskriptivstatistik Pretest(RKI)- und Klinik(Charite)- Skalen des SDQ Emotionale VerhaltensProbleme probleme Mittelwert N Standardabweichung Mittelwert Charite N Standardabweichung Mittelwert Insgesamt N Standardabweichung RKI 1,85 1364 1,82 3,72 1221 2,56 2,74 2585 2,39 2,06 1364 1,63 3,32 1221 2,34 2,66 2585 2,09 ADHS/ HKS Probleme mit Peers 3,22 1364 2,27 5,89 1221 2,86 4,48 2585 2,89 1,57 1364 1,66 3,06 1221 2,42 2,27 2585 2,18 Prosoziales Verhalten TOTAL 7,68 1364 1,70 6,89 1221 2,21 7,31 2585 2,00 8,69 1364 5,30 16,00 1221 6,78 12,14 2585 7,06 Tabelle 4: Deskritpivstatistik der SDQ-Skalen gegliedert nach Stichprobe Die graphische Darstellung des Gruppenvergleichs mit Skalenmittelwerten und 95%igem Konfidenzintervall ist nachfolgend wiedergegeben. Erwartungsgemäß finden sich in allen Problem-Skalen und dem Total-Score signifikant höhere Rohwerte in der Klinikstichprobe. Die Skala für prosoziales Verhalten fällt für die Klinikstichprobe – ebenfalls erwartungskonform – signifikant niedriger aus. 40 20 Emotionale Skalenwert mit 95% Konfidenzintervall Probleme Verhaltensprobleme ADHS/HKS 10 Probleme mit Peers Prosoziales Verhalten total 0 RKI Charite Abbildung 2: Skalenmittelwerte mit 95%igem Konfidenzintervall gegliedert nach Stichprobe Wie dem F-Wert von 702,3 in der nachfolgenden Tabelle zu entnehmen ist, fällt der Stichprobeneffekt für den Bereich der hyperkinetischen Störungen (ADHS/HKS) besonders deutlich aus. 41 Varianzanalytischer Vergleich (ANOVA) zwischen Pretest- und Klinik-Daten bezogen auf die SDQ-Skalen Quadratsumme Emotionale Probleme Zwischen den (Kombiniert) Gruppen Innerhalb der Gruppen Insgesamt Betragensprobleme Zwischen den (Kombiniert) Gruppen Innerhalb der Gruppen Insgesamt Zwischen den (Kombiniert) Hyperkinetische Gruppen Innerhalb der Gruppen Störung Insgesamt Probleme mit Gleichaltrigen Zwischen den (Kombiniert) Gruppen Innerhalb der Gruppen Insgesamt Prosoziales Verhalten Gesamtwert psychischer Auffälligkeiten Zwischen den (Kombiniert) Gruppen 2244,807 Mittel der Quadrate Df 1 12515,733 2583 14760,540 2584 1034,331 1 10311,869 2583 11346,200 2584 4612,000 1 16963,143 2583 21575,143 2584 1447,137 1 10880,950 2583 12328,087 2584 410,218 1 Insgesamt 9901,126 2583 10311,345 2584 Zwischen den (Kombiniert) Gruppen 34407,792 Innerhalb der Gruppen Innerhalb der Gruppen Insgesamt 1 94360,674 2583 128768,467 2584 F Signifikanz 2244,807 463,284 ,000 4,845 1034,331 259,088 ,000 3,992 4612,000 702,275 ,000 6,567 1447,137 343,532 ,000 4,213 410,218 107,017 ,000 3,833 34407,792 941,868 ,000 36,531 Tabelle 5: Varianzanalytischer Vergleich der Skalenwerte zwischen den Stichproben Da das Geschlechtsverhältnis in den beiden Stichproben unterschiedlich ist und sowohl die Prävalenz als auch die Symptomausprägung zwischen Jungen und Mädchen unterschiedlich ist, muss bei den oben dargestellten Ergebnissen noch kontrolliert werden, ob der Stichprobeneffekt mit dem Geschlechtseffekten konfundiert ist. Zu diesem Zweck wurde ein linares Modell gerechnet, in dem als abhängige Variable die Rohdaten der SDQ-Skala ‚HKS’ und als Prädiktoren sowohl die Stichprobenzugehörigkeit als auch das Geschlecht eingegangen sind. Dabei zeigte sich, dass die Stichprobenzugehörigkeit auch nach der Kontrolle des Geschlechtseffektes weiterhin der Prädiktor mit der höchsten Vorhersagekraft bleibt (partielles Eta-Quadrat als Mass für die von dem Prädiktor erklärte Varianz = 0,176). Als zweiter Haupteffekt erwies sich erwartungskonform das Geschlecht (partielles Eta-Quadrat = 0,075). Der Interaktioneffekt zwischen Stichprobe und Geschlecht war zu vernachlässigen (partielles Eta-Quadrat = 0,004). Somit lässt sich der Gesamteffekt nicht auf unterschiedliche Geschlechtsverteilungen zwischen der RKI- und der Klinikstichprobe zurückführen. 42 9 Ergebnisse des Reliabilitäts-Training für den Hauptsurvey Wie in Kapitel 7.2.2 erläutert, wurden die 8 Untersucher des Hauptsurveys einem Videotraining mit anschließender Reliabilitätsprüfung unterzogen. Die Reliabilität wurde für 5 exemplarisch ausgewählte Fälle berechnet. Jeder Untersucher musste sich pro Kind bei 6 Items jeweils auf einer 4fach gestuften Likert-Skala festlegen. Somit stehen für die Reliabilitätsprüfung insgesamt 240 Urteile (8 Untersucher x 6 Items x 5 Kinder) zur Verfügung. Wie in Kapitel 7.2.2 weiterhin ausgeführt, erfolgte die Berechnung sowohl nach dem ungewichteten als auch nach dem gewichteten Kappa. Angestrebt wurde ein Kappa-Wert von über .80. Die Antwortmuster - 0 = überhaupt nicht; 1 = ein wenig; 2 = ziemlich; 3 = sehr stark – werden als Ordinalskala aufgefasst (0<1<2<3). Wie bereits erläutert, muss bei dem gewichteten Kappa a priori eine Gewichtung festgelegt werden, die das jeweils abweichende Urteilsverhalten eines Untersuchers in Relation zu den anderen Urteilern ‚bestraft’. Da die vorgegebene Likert-Skala häufig in der sozialwissenschaftlichen Forschung als quasimetrisch verstanden wird, erschien eine lineare Gewichtung als angemessen. Dabei wird der exakten Übereinstimmung zwischen zwei Urteilern das Gewicht Null (keine Bestrafung) und der maximalen Abweichung der Wert Eins (maximale Bestrafung) zugeordnet. Die beiden Zwischenwerte erhalten das Gewicht 1/3 bzw. 2/3. Tabelle 6 stellt die Gewichtung im Überblick dar. ein wenig ziemlich sehr stark überhaupt nicht ein wenig ziemlich sehr stark überhaupt nicht Urteiler Y Urteiler X 0,00 0,33 0,67 1,00 0,33 0,00 0,33 0,67 0,67 0,33 0,00 0,33 1,00 0,67 0,33 0,00 Tabelle 6: Kappa-Gewichte für die Berechnung der ordinalen Urteilsübereinstimmung 43 Da SPSS nur eine sehr unflexible Routine der klassischen Kappa-Berechnung zur Verfügung stellt und weder eine Gewichtung zulässt noch die Erweiterung nach Fleiss beinhaltet, entschlossen wir uns, eine eigene Routine unter Excel zu programmieren, die alle erforderlichen Erweiterungen der Kappa-Berechnung auf nominalem und ordinalen Datenniveau beinhaltet. Die hier mitgeteilten Werte wurden mit dieser Excel-Routine berechnet. Als Gesamtergebnis ergab sich bei der Berechnung auf nominalem Datenniveau ein KappaWert nach Fleiss von 0,60. Berücksichtigt man, dass es sich dabei um einen von zufälligen Übereinstimmungen bereinigten Wert handelt, so kann von einer akzeptablen Übereinstimmung ausgegangen werden. Dennoch wurde das Ziel des Trainings (Kappa >= .80) für die nominale Berechnung nicht erreicht. Wie bereits in den theoretischen Ausführungen über das Kappa-Maß erläutert, erscheint der gewichtete Kappa-Koeffizient für unsere Forschungsfrage als angemessener. Mit der oben genannten Gewichtungsmatrix erzielten die Untersucher ein Gesamt-Kappa von .90, was als exzellentes Ergebnis anzusehen ist. Der deutliche Zugewinn an Übereinstimmung bei der Berechung auf ordinalen Datenniveau resultiert im Wesentlichen aus der Tatsache, dass in keinem Paarvergleich mehr als zwei Antwortkategorien abgewichen wurde. Mit anderen Worten: in keinem der 23 Paarvergleiche über 6 Items hinweg wurde jemals die maximale Abweichung von 3 Antwortkategorien realisiert. Da das Ausmaß der Abweichung bei dem nominalen Kappa nicht berücksichtigt wird, kommt es formal zu erheblich schlechteren Übereinstimmungsmaßen, die jedoch die faktisch hohe Übereinstimmung nur unzureichend spiegelt. Die Urteilskategorien decken mit den 6 Items die drei Hauptsymptome von ADHS/HKS ab. Damit ist es möglich, die Übereinstimmungen auf Symptom-Ebene zu überprüfen. Tabelle 7 zeigt beide Kappa-Koeffizienten differenziert nach den Items, den drei Hauptsymptomen und den Gesamt-Koeffizienten. 44 Kappa nach Fleiss Weighted Kappa 1) War unruhig, zappelig 0,55 0,88 2) Konnte sich schlecht auf die Aufgaben konzentrieren 0,57 0,89 3) War erregt, impulsiv 0,60 0,92 4) War leicht ablenkbar 0,67 0,92 5) Redete dazwischen 0,65 0,93 6) Konnte nicht lange stillsitzen 0,53 0,87 Mittelwert Aufmerksamkeitsprobleme 2) + 4) 0,62 0,91 Mittelwert Impulskontrollstörung 3) + 5) 0,63 0,93 Mittelwert Motorische Unruhe 1) + 6) 0,54 0,88 Gesamt-Mittelwert: 0,60 0,90 Es werden jeweils nur die ersten beiden Stellen hinter dem Komma dargestellt Tabelle 7: Kappa-Ergebnisse des Reliabilitätstests gegliedert nach Items, Skalen und Gesamt-Mittelwert Die Daten überraschen zunächst, da die motorische Unruhe, von der häufig angenommen wird, dass sie am einfachsten ohne fachliche Vorkenntnisse zu beurteilen sei, die schlechtesten Übereinstimmungen aufweist. Diese Ergebnisse decken sich jedoch mit der klinischen Erfahrung, der zu Folge auch versierte Therapeuten besondere Schwierigkeiten haben, die motorische Unruhe reliabel zu quantifizieren. Diese Erfahrung hat uns vor Jahren dazu bewogen, eine reliable und valide Methode zur objektiven Quantifizierung motorischer Unruhe zu entwickeln. Durch den Einsatz des Radar-Aktometers kann diese Lücke nun geschlossen werden. 45 10 Welche vorläufigen Prävalenzschätzungen ergeben sich aus den bisher verfügbaren Daten des Pretests? Die hier vorgenommene, vorläufige Prävalenzschätzung für ADHS beruht auf den verfügbaren SDQ-Daten des Pretests und der Klinikstichprobe. Unter Berücksichtigung der Vorläufigkeit der Ergebnisse werden folgende (überwiegend nicht belegte, bzw. aus der Literatur oder der Klinikstichprobe approximierte) Annahmen gemacht: A) Der Pretest stellt eine grobe Näherung der zu erwartenden repräsentativen SurveyDaten dar (nicht belegte Annahme). B) Die Eltern-Einschätzungen auf der SDQ-Skala für Hyperaktivität stellen eine Näherung des ADHS-Diagnose dar (Positiver prädikativer Wert für Hyperkinetische Störungen nach ICD-10 = 63,5% gemäß Goodman et al. 2000). C) Das Elternurteil approximiert die im Rahmen der ADHS-Diagnostik geforderte Urteilskonvergenz zwischen Eltern, Lehrer und Untersucher (Goodman et al. 2000). D) Die von Robert Goodman veröffentlichten Schwellenwerte lassen sich auf deutsche Verhältnisse übertragen (Wörner et al. 2002). E) Das Verhältnis von Symptomausprägung und daraus resultierendem Leidensdruck ist in der Pretest-Stichprobe maximal so groß wie in der Klinikstichprobe (theoretische Überlegung). F) Die Symptomdauer ist in der Feldstichprobe maximal so lang wie in der Klinikstichprobe (theoretische Überlegung). Bei der Analyse der Klinikdaten ergab sich, dass nach den Goodman-Kriterien 551 von 1.221 (45,1%) Patienten auffällige HKS-Scores hatten. Dieser Anteil lag in der Feldstichprobe mit 116 von 1.364 (8,4%) deutlich niedriger. Die genauen Daten einschliesslich der grenzwertigen und unauffälligen Probanden sind Tabelle 8 zu entnehmen. 46 SAMPLE RKI vs CVK * HKS_JN Kreuztabelle SAMPLE RKI vs CVK 1 RKI 2 Charite Gesamt Anzahl % von SAMPLE RKI vs CVK Anzahl % von SAMPLE RKI vs CVK Anzahl % von SAMPLE RKI vs CVK ,00 normal 1151 HKS_JN 1,00 grenzw. 97 2,00 auff. 116 Gesamt 1364 84,4% 7,1% 8,5% 100,0% 530 140 551 1221 43,4% 11,5% 45,1% 100,0% 1681 237 667 2585 65,0% 9,2% 25,8% 100,0% Tabelle 8: Anteil auffälliger HKS-Scores (Schwellenwertmodell) gegliedert nach Stichprobe Die Verteilung der Impact-Rohwerte in der Klinikstichprobe, die für die nachfolgenden Analysen als Approximation herangezogen wird, findet sich in Tabelle 9. Deskriptiv-Statistik Impact Scores in der Klinikstichprobe Häufigkeit Prozent Gültige Prozente Kumulierte Prozente ,00 1,00 2,00 3,00 4,00 5,00 Gültig 6,00 7,00 8,00 9,00 10,00 Gesamt 380 30 129 202 159 145 74 43 32 17 10 1221 31,1 2,5 10,6 16,5 13,0 11,9 6,1 3,5 2,6 1,4 ,8 100,0 31,1 2,5 10,6 16,5 13,0 11,9 6,1 3,5 2,6 1,4 ,8 100,0 31,1 33,6 44,1 60,7 73,7 85,6 91,6 95,2 97,8 99,2 100,0 Tabelle 9: Deskriptivstatistik des Impact-Scores in der Klinikstichprobe 47 Um zu einer ersten Einschätzung der Prävalenz des HKS in der Pretest-Stichprobe zu gelangen, sind folgende Analyse-Schritte erforderlich: 1.) Berechnung des Anteils auffälliger Kinder und Jugendliche (SDQ-Score HKS >=7) im Pretest = 8,5%. 2.) Davon HKS mit hinreichender Auswirkung auf das psychosoziale Funktionsniveau (Impact >= 2; Maximalwert geschätzt durch den Anteil in der Klinikstichprobe): 100% -33,6% = 66,4%. 3.) Davon erfüllen in der Klinikstichprobe 96,7% der Probanden auch die geforderte Symptomdauer von mind. 6 Monaten. 4.) Davon geschätzter Anteil mit tatsächlicher Diagnose (Positver Prädiktiver Wert nach Goodman et al. 2000): 63,5%. 5.) Hinzu kommen die HKS-Fälle, die in dem SDQ nicht erfasst wurden. Dieser Anteil lässt sich durch 1 – Sensitivität bestimmen. Goodman et al. (2000) haben für die HKSSensitivität (Anteil der HKS-Fälle, die der Test erkennt) einen Wert von 86,1% berechnet. Entsprechend ist davon auszugehen, dass 13,9% der HKS-Fälle nicht erkannt werden. Unter Berücksichtigung der drei oben genannten Analyseschritte ergibt sich folgende Prävalenzschätzung auf der Grundlage der verfügbaren Pretest- und Klinik-Daten: Geschätzte Prävalenz = 8,5% * 0,664 * 0,967 * 0,635 * 1,139 = 3,9 % Da in diese Prävalenzschätzung der Impact-Anteil der Klinikstichprobe eingeht, von dem anzunehmen ist, dass er den Maximalwert des Anteils in der Feldstichprobe repräsentiert, liegt der wahre Prävalenzwert vermutlich unter den berechneten 3,9%. Des weiteren wird die Zeitdauer der Symptome durch die Klinikstichprobe geschätzt, was abermals als Maximalwert zu interpretieren ist. Dieser Umstand bedingt, dass auch unter dem Gesichtspunkt der Symptomdauer die wahre Prävalenz unter dem errechneten Wert liegen wird. Als dritte Fehlerquelle der aktuellen Schätzung ist auf die Anzahl der Informanten hinzuweisen. Der positive prädiktive Wert nach Goodman et al. (2000) bezieht sich auf die Kombination von Eltern, Lehrer und Schülerurteil (letztere ab dem Alter von 11 Jahren). In unserem Fall wurde die Schätzung nur auf der Grundlage der Elternurteile gefällt. Nach Goodman et al. (2000) fällt die Sensitivität wie auch der positive prädiktive Wert niedriger 48 aus, wenn weniger Informanten einbezogen werden. In unserem Modell müsste dann der Anteil der nicht erkannten HKS-Fälle proportional steigen. Dies bedeutet nicht, dass die Prävalenz insgesamt steigt, da diese von dem Außenkriterium ‚Diagnose’ abhängt. Die Diagnosekriterien sind im logischen Sinne ‚und’-Verknüpfungen (Auffälligkeiten in der Schule + zuhause + in der Untersuchung + Zeitstabilität + Ausschlusskriterien nicht erfüllt) so dass sich in der Regel der Anteil der als auffällig klassifizierten Kinder unter Einbeziehung mehrerer Informanten deutlich reduziert. Ähnliches erwarten wir, wenn das hier vorgestellte diagnostische Schema im Hauptsurvey angewandt wird. Wenn die von uns eingesetzte Methode auch weniger psychiatrisch untermauert ist, als dies in dem britischen Survey der Fall war, so handelt es sich doch in beiden Vorgehensweisen um eklektisch Prozesse, die aus einer Fülle von Einzelinformationen auf verschiedenen Aggregations-Ebenen nach einem vorgegebenen Schema die klinische Diagnostik simulieren. Wie bereits erwähnt, ist die aktuelle Schätzung von 3,9% als Obergrenze anzusehen. Wie hoch die Reduktion des Prävalenzwertes in dem Hauptsurvey ausfallen wird, ist nicht vorhersagbar. Eine Orientierung kann allerdings der schon abgeschlossene britische Survey darstellen, in dem bei einer Stichprobe von 7.984 Kindern und Jugendlichen 115 mal die Diagnose HKS und 195 mal die Diagnose ADHD vergeben wurde. Damit liegen die britischen Prävalenzwerte bei 1,4% für HKS und bei 2,4% für ADHD. Schließlich sei auf ein weiteres methodisches Detail verwiesen, das mit den unterschiedlichen Stichproben in dem britischen und deutschen Survey zusammenhängt. Der Altersbereich in der britischen Stichprobe betrug 5 bis 15 Jahre. In dem deutschen Survey wird das Altersspektrum von 3 bis 17 Jahre abgebildet. Wie der Graphik über die Altersverteilung in diesem Forschungsbericht zu entnehmen ist, fallen die Rohwerte in der Feldstichprobe sowohl im unteren als auch im oberen Altersspektrum niedriger aus, was auch den klinischen Erfahrungen entspricht. Bezieht man – wie im Falle des deutschen Surveys – diese Altersspektren mit ein, so ist von niedrigeren Prävalenzen auszugehen. Dieser Effekt wurde in den hier vorgenommenen Analysen bereits berücksichtig. Dies ist möglicherweise auch eine Erklärung dafür, dass der Ausgangswert der Analyse von 8,5% um 1,5 Prozentpunkte unterhalb der 10%-Marke liegt, die nach der Definition des Cut-off auf der Grundlage der 90. Perzentile zu erwarten gewesen wäre. 49 11 Zusammenfassende Wertung und Ausblick Das Forschungsprojekt wurde unter folgenden Rahmenbedingungen bzw. Fragestellungen durchgeführt: - Die bisherige Datenlage in Deutschland über die Prävalenz des ADHS/HKS ist äußerst unbefriedigend. In gesundheitspolitischer Hinsicht (z.B. Einschätzung von Über-, Unter- oder Fehlversorgung; ökonomische Auswirkungen der Störung) ergibt sich ein dringender Forschungsbedarf. - Der Kinder- und Jugendsurvey bietet aufgrund seiner Stichprobe, die nach strengen wissenschaftlichen Kriterien der Repräsentativität in hinreichender Größe (n=17.100) gezogen wird, ideale Voraussetzungen für nationale Prävalenzschätzungen psychischer Störungen. - Um die optimalen Bedingungen der Stichprobe nutzbar zu machen, sollten für die Prävalenzbestimmungen in erster Linie Daten des Hauptsurveys und erst in zweiter Linie Daten aus Substichproben, wie beispielsweise aus dem Zusatzmodul ‚Psychische Gesundheit’ herangezogen werden. - Für eine optimale Prävalenzschätzung des ADHS/HKS wären Diagnosen i.e.S. erforderlich. Dies würde aber die Durchführung eines umfassenden, strukturierten oder semi-strukturierten Interviews einschließlich einer kinder- und jugendpsychiatrischen Evaluation sowie eine ausführliche Eigen- und Fremdanamnese unter Einbeziehung des Lehrerurteils erforderlich machen. Diese ‚Maximalvariante’ würde den zeitlichen, finanziellen und inhaltlichen Rahmen des Hauptsurveys sprengen. - Ziel des Projekts ist es, anhand der vorliegenden Pretest-Daten im Vergleich mit Klinikdaten zu prüfen, ob und mit welcher Aussagekraft trotz fehlender ‚Maximalvariante’ eine Prävalenzschätzung des ADHS/HKS für Deutschland durchgeführt werden kann. - Ziel des Projekts ist es weiterhin, Vorschläge zu unterbreiten, welche zeitökonomisch vertretbaren Zusatzerhebungen gegebenenfalls erforderlich sind und wie eine Prävalenzschätzung mit den dann verfügbaren Daten durchgeführt werden kann. 50 - Ein weiteres Ziel des Projekts ist es, zu überprüfen, ob und in welchem Umfang es Diskrepanzen zwischen dem Gebrauch von Psychostimulanzien (Methylphenidat, Amphetamin) und dem Vorliegen eines ADHS/HKS gibt. Das Projekt hat folgende Ergebnisse erbracht: - Trotz methodischer Abstriche gegenüber der oben erwähnten ‚Maximalvariante’ ist auf der Grundlage der verfügbaren bzw. der im Rahmen des Projekts ergänzten Daten mit einer hinreichend stabilen Prävalenzschätzung des ADHS/HKS zu rechnen. - Die Zusatzuntersuchungen umfassen einerseits die qualifizierte Einschätzung der drei Hauptsymptome (Aufmerksamkeitsstörung, Impulskontrollstörung und motorische Unruhe) durch die Untersucher und andererseits der Einsatz objektiver Messmethoden für die Bestimmung der motorischen Unruhe (Radar-Aktographie). - Fehlende Angaben (beispielsweise über den Zeitverlauf der Störung und über die Auswirkungen auf verschiedene Lebensbereiche) müssen über parallel erhobene Klinikstichproben geschätzt werden. - Dabei erfolgt die Schätzung konservativ: Der ermittelte Wert ist ein oberer Grenzwert, d.h. wenn die Analyse beispielsweise eine Prävalenz von 4% ergibt, so liegt der wahre Wert bei 4% oder darunter, sicher aber nicht darüber. - Das Training der Interviewer wurde evaluiert und hat gute Übereinstimmungen (InterRater-Reliabilitäten) zwischen den Untersuchern wie auch zwischen InterviewerUrteil und Experten-Urteil erbracht. - Auf der Grundlage des Pretests und einer Vergleichsanalyse mit einer klinischen Stichprobe ergab sich eine Prävalenzschätzung von 3,9% (oberer Grenzwert). - Der Pretest wurde ausschließlich im Sinne einer Machbarkeitsstudie durchgeführt und erhebt keinen Anspruch auf Repräsentativität. Somit kann die bislang durchgeführte Analyse auch nicht die Auswertung im Hauptsurvey ersetzen. Auf vorläufige Auswertungen bezüglich des Medikamentengebrauchs wurde daher verzichtet. - Die avisierten Analysen über den zum Befragungszeitpunkt aktuellen Medikamentengebrauch werden im Rahmen des Hauptsurveys realisierbar sein. 51 12 Literatur Barkley, R. A. (2002). "Major life activity and health outcomes associated with attention-deficit/hyperactivity disorder." J Clin Psychiatry 63 Suppl 12: 10-5. Brown, R. T., W. S. Freeman, et al. (2001). "Prevalence and assessment of attention-deficit/hyperactivity disorder in primary care settings." Pediatrics 107(3): E43. Bortz, J, G.A. Lienert, K. Boehnke. (1997). Verteilungsfreie Methoden in der Biostatistik. Heidelberg: SpringerVerlag. Bortz, J. and N. Döring (1995). Forschungsmethoden und Evaluation. Heidelberg, Springer-Verlag. Conners, C. Conners-Rating Scales - Manual. New York: Multi Health Systems. Cohen, J. (1960). "Coefficient of Agreement for Nominal Scales." Education and Psychological Measures 20: 37-46. Cohen, J. (1968). "Weighted Kappa. Nominal Scale Agreement with Provision for Scaled Disagreement or Partial Credit." Psychological Bulletin 70: 213-220. Dilling, H., W. Mombour, et al. (2000). Internationale Klassifikation psychischer Störungen: Diagnostische Kriterien für Forschung und Praxis. Bern, Huber Verlag. Ding, Y. C., H. C. Chi, et al. (2002). "Evidence of positive selection acting at the human dopamine receptor D4 gene locus." Proc Natl Acad Sci U S A 99(1): 309-14. Fleiss, J.L. (1971). "Measuring Nominal Scale Agreement among many Raters." Psychol Bulletin 76:378-382. Goodman, R. (1997). "The Strengths and Difficulties Questionnaire: a research note". J Child Psychol Psychiatry. 38:581-586. Goodman, R., T. Ford, et al. (2000). "Using the Strengths and Difficulties Questionnaire (SDQ) to screen for child psychiatric disorders in a community sample." Br J Psychiatry 177: 534-539. Goodman, R. (2001). "Psychometric Properties of the Strengths and Difficulties Questionnaire". J Am Acad Child Adolesc Psychiatry 40(11): 1337-1345. Huss, M., A. Iseler, et al. (2001). "Interkultureller Vergleich der Conners-Skalen: Läßt sich die USamerikanische Faktorenstruktur an einer deutschen Stichprobe replizieren?" Z Kinder Jugendpsychiatr Psychother 29(1): 16-24. Huss, M., C. Stadler, et al. (2002). "ADHS im Lehrerurteil. Ein Vergleich von Klinik- und Normstichprobe anhand der Conners-Skalen." Kindheit und Entwicklung 11(2): 90-97. Huss, M. "Medikamente und ADS". Berlin, Urania-Verlag. Kurth, B., K.E. Bergmann et al. (2002). "die Gesundheit von Kindern und Jugendlichen in Deutschland: Was wir wissen, was wir nicht wissen, was wir wissen werden". Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz 45: 852-858. Newcorn, J. H., J. M. Halperin, et al. (1994). "Parent and teacher ratings of attention-deficit hyperactivity disorder symptoms: implications for case identification." J Dev Behav Pediatr 15(2): 86-91. Pelham, W. E., Jr., E. M. Gnagy, et al. (1992). "Teacher ratings of DSM-III-R symptoms for the disruptive behavior disorders." J Am Acad Child Adolesc Psychiatry 31(2): 210-8. Roberts, M. A. (1990). "A behavioral observation method for differentiating hyperactive and aggressive boys." J Abnorm Child Psychol 18(2): 131-42. Schmeck, K., Poustka, F. et al. (2001)."Discriminant validity of the child behaviour checklist CBCL-4/18 in German samples." Eur Child Adolesc Psychiatry 10(4):240-7. Swanson, J. (1992). School-based assessment and interventions for ADD students. Irvine CA, K.C. Publishing. Swanson, J. (persönliche Kommunikation). Diskussion im Rahmen des Global ADHD-Meeting in Porto, Portugal, März 2003. Swanson, J., S. Schuck, et al. (submitted). "Categorial and Dimensional Definitions and Evaluations of Symtpoms of ADHD: The SNAP and the SWAN Rating Scales. J Clin Psychiatry. Ullmann R.K., E.K. Sleator et al. (1985). "A change of mind: the Conners abbreviated rating scales reconsidered". J Abnorm Child Psychol.13(4):553-365. Wender, E. H. (2002). "Attention-deficit/hyperactivity disorder: is it common? Is it overtreated?" Arch Pediatr Adolesc Med 156(3): 209-10. Woerner, W., A. Becker et al. (2002). "Normierung und Evaluation der deutschen Elternversion des Strengths and Difficulties Questionnaire (SDQ): Ergebnisse einer repräsentativen Felderhebung." Z Kinder- und Jugendpsychiatrie Psychotherapie 30(2), 105-112. Wolraich, M. L., J. N. Hannah, et al. (1998). "Examination of DSM-IV criteria for attention deficit/hyperactivity disorder in a county-wide sample." J Dev Behav Pediatr 19(3): 162-8. 52 13 Anhang 13.1 Beschreibung des Doppler-Radar-Aktometer Klin ik fü r Psych ia trie , Psyc h o so m a tik u n d Psych o th e ra p ie d e s Kin d e s- u n d Ju g e n d a lte rs D ire kto rin : Pro f. D r. m e d . U. Le h m ku h l Un iv ersitä tsk lin ik u m • m ed izin isch e fa k u ltä t d er h um b o ld t-un iv ersitä t zu b erlin Screening for Attention Deficit Hyperactivity Disorder (ADHD) by Dopper-radar assessment of global motor hyperactivity M. Huss, E. Jenetzky Charité, CV K, Humbold t Univers ität zu Berlin Introduction Application Global m otor hype ractivity is a co re sy mpto m in c hildre n with Atte ntion Deficit Hype ractivity Disorder (ADHD). Early awa reness by objective a nd pr ecise meas ure is esse ntial, since The n ext pict ure s hows a n ap plication in co mbinati on with an electr oence phalog ram. In the hyperactivity is th e mos t pow erful pre dictor of a dult o utcom e of ADHD. Objective scree ning last track th e rect angle global moto r impuls e of a ny body move ment c an be seen. tools are nee ded with the following cha racte ristic: They sho uld be exzellen t for scree ning purpos es ( high sp ecificity), reliable, not har mful f or child ren, rob ust, e asy to use, and inexpensive. Until now, mecha nic, op tic or elect romyo grap hic devic es coul d no t fulfill t hese nee ds. They interfe red wit h the child‘s behavi or a nd we re restrict ed t o single muscl e gr oups. Already by constructio n, th ey did not sim ulate t he ‚clinical ey e‘, which has p roven to b e the bes t assessment tool. A newly develo ped d evice b ased o n Dop pler- rada r cov ers all needs me ntionn ed a bove and shows so fa r the best test c har acteristics ev er ass essed with objective meth ods. Doppler-radar Actomet er Accumulating the i mpulses ove r 10 minu tes r esults in an glob al m otor activity sc ore, which The Dop pler- effect r efers t o the fr eque ncy shift of wav es, which a re caus ed by m oving can be co mpa red with nor m dat a fro m 20. 000 child ren of a r epr esentativ e Ger man s ample. objects. In com binatio n with high fre quency r adar wav es, this techniq ue ope ns the As demonstr ated in t he nex t figur e, the in dividual co mpa rison is do ne ag e and gend e r opport unity to registe r all mov ements of a b ody simult aniously in direct imit ation of the stratified, si nce b oth fact ors have a significa nt influ ence on th e level of gl obal motor activity . clinical eye. The f requ ency shift is regist ere d by a receiv er a nd tr ansfo rmed by a n elect ronic The g rap h of t he 95% confid ence interv al hel ps to estimat e, h ow muc h th e individ ual sco re circuit into a recta ngle sig nal indica ting th e mov ement . differs fr om th e no rm. The r ectangl e signal is read via the par allel po rt fr om a comm on PC an d an alyzed by a r ealtime 32 -bit softwa re with an accu racy less t han 1 millisecon d. The followi ng figu re sh ows the d evice, which is a little la rger than a cigar ette p acket. The device is not c onfir mative for the diagn osis of ADHD. As was demo nstrat ed in mo re than 3. 000 patients, its stre ngth l ays in th e scre ening pro perty to co rrectly classify h ealthy children as healty (high specificity ). With othe r wo rds: I f a child sc ores low o n t he rada rassessment of glo bal mo tor ac tivity, ADHD in the st rict definiti on of the WHO (hype rkientic The act omet er is plac ed 1. 5 met er in f ront of th e child with out h aving a ny physic al contac t to the pr oban d. Th eref ore n o inte rfer ence with t he child‘s behavi or is to be exp ected. The rad a r transmitt er has a CE-certifica te a nd radiat es less t han 0.1% of the ad mitted leack radi ation of conven tional microwaves . Th erefo re it is n ot ha rmful f or child ren. syndrom e acco rding ICD -10) can b e rule d out. Children with high lev els of m otor activity shoul d be f urth er assess ed. To ou r kn owledge, this is t he fi rst obj ective d evice with optimize d scre ening pro perti es, in a field, w here subjec tive m ethods ar e the basis f or f ar reachin g decisi ons suc h as medicatio n or psychologic al and educa tional int erve ntions. 53 13.2 SPSS-Steuerfile SDQ-Auswertung * Klinikdatensatz um neue Daten aus der ACCESS-Datenbank SDQ erweitern. GET FILE='C:\RKI\SDQ_Vergleich\gesamt_KLINIK_Eltern_03_07_03.sav'. * hinzugefuegte Daten mit sample = x (in diesem Fall sample=3) gekennzeichnet. do if (sample = 3). compute wob1_el = i1. compute wob2_el = i2. compute wob3_el = i3. compute wob4_el = i4. compute wob5_el = i5. compute wob6_el = i6. compute wob7_el = i7. compute wob8_el = i8. compute wob9_el = i9. compute wob10_el = i10. compute wob11_el = i11. compute wob12_el = i12. compute wob13_el = i13. compute wob14_el = i14. compute wob15_el = i15. compute wob16_el = i16. compute wob17_el = i17. compute wob18_el = i18. compute wob19_el = i19. compute wob20_el = i20. compute wob21_el = i21. compute wob22_el = i22. compute wob23_el = i23. compute wob24_el = i24. compute wob25_el = i25. end if. exe. do if (sample = 3). compute kj_sex = geschlec. end if. exe. * Dezimale Altersberechung an der Klinik-Stichprobe. COMPUTE jahr = XDATE.YEAR(u_datum). COMPUTE mon = XDATE.MONTH(u_datum). COMPUTE tag = XDATE.MDAY(u_datum). COMPUTE endtage = YRMODA(jahr,mon,tag). COMPUTE year = XDATE.YEAR(kj_gd). COMPUTE month = XDATE.MONTH(kj_gd). COMPUTE day = XDATE.MDAY(kj_gd). COMPUTE anftage = YRMODA(year,month,day). COMPUTE agetage = endtage - anftage . COMPUTE KJ_ALTX = agetage / 365.25 . cache. EXECUTE . fre var kj_altx /sta min max mean. exe. * RKI-Datensatz oeffnen. * RKI-Datensatz. *. * urspruenglicher Datensatz vom RKI n=1626. * abzueglich n=9 ohne eingegebene Daten. 54 * abzueglich n=198 ohne Fragebogen. * abzueglich n=55 mit mehr als einem missing. * es resultiert ein verfuegbarer RKI-Datensatz von n=1364. *. * Achtung: Item 1 bis 25 wurde im RKI mit 1-2-3 (entgegen der Goodman-Konvention) kodiert. * werden einheitlich in dem Gesamtdatensatz nach den Goodman-Konventionen mit 0-1-2 kodiert. GET FILE='C:\RKI\SDQ_Vergleich\RKI_Daten.sav'. * Umkodierung der Itemwerte in der RKI-Stichprobe. do if (sample = 1). recode wob1_el wob2_el wob3_el wob4_el wob5_el wob6_el wob7_el wob8_el wob9_el wob10_el wob11_el wob12_el wob13_el wob14_el wob15_el wob16_el wob17_el wob18_el wob19_el wob20_el wob21_el wob22_el wob23_el wob24_el wob25_el (1=0) (2=1) (3=2). end if. exe. SAVE OUTFILE='C:\RKI\SDQ_Vergleich\RKI_Daten_Items_umkodiert.sav' /COMPRESSED. * Umkodierten RKI-DAtensatz einlesen. GET FILE='C:\RKI\SDQ_Vergleich\RKI_Daten_Items_umkodiert.sav'. * mit Klinikdatensatz zusammenfuegen. ADD FILES /FILE=* /FILE='C:\RKI\SDQ_Vergleich\gesamt_KLINIK_Eltern_03_07_03.sav'. EXECUTE. recode sample (3=2). exe. val lab wob1_el wob2_el wob3_el wob4_el wob5_el wob6_el wob7_el wob8_el wob9_el wob10_el wob11_el wob12_el wob13_el wob14_el wob15_el wob16_el wob17_el wob18_el wob19_el wob20_el wob21_el wob22_el wob23_el wob24_el wob25_el 0 'nicht zutreffend' 1 'teilweise zutreffend' 2 'eindeutig zutreffend' . exe. RECODE wob1_el wob2_el wob3_el wob4_el wob5_el wob6_el wob7_el wob8_el wob9_el wob10_el wob11_el wob12_el wob13_el wob14_el wob15_el wob16_el wob17_el wob18_el wob19_el wob20_el wob21_el wob22_el wob23_el wob24_el wob25_el (9=SYSMIS) . EXECUTE . * Skalenbildung. * SDQ-Auswertung. * Grundlage: Scoring_instructions Stand 2.4.02 aus www.sdqinfo.com. * Skala: Emotionale Probleme. * (kein Item invers). *-----------------------. compute emotion = sum(wob3_el,wob8_el,wob13_el,wob16_el,wob24_el). exe. if (emotion <=3) emot_jn = 0. if (emotion = 4) emot_jn = 1. if (emotion >=5) emot_jn = 2. val lab emot_jn 0 'normal' 1 'grenzw.' 2 'auff.'. exe. * Skala: Verhaltensprobleme. * (Item 7 ist invers). *-----------------------. recode wob7_el (2 = 0) (1 = 1) (0=2) into wob7r_el. compute beha = sum(wob5_el,wob7r_el,wob12_el,wob18_el,wob22_el). exe. if (beha <=2) beha_jn = 0. if (beha = 3) beha_jn = 1. if (beha >=4) beha_jn = 2. 55 val lab beha_jn 0 'normal' 1 'grenzw.' 2 'auff.'. exe. * Skala: Hyperaktivität. * (Item 21 und Item 25 sind invers). *-----------------------. recode wob21_el wob25_el (2 = 0) (1 = 1) (0=2) into wob21r_e wob25r_e. compute hks = sum(wob2_el,wob10_el,wob15_el,wob21r_e,wob25r_e). exe. if (hks <=5) hks_jn = 0. if (hks = 6) hks_jn = 1. if (hks >=7) hks_jn = 2. val lab hks_jn 0 'normal' 1 'grenzw.' 2 'auff.'. exe. * Skala: Verhaltensprobleme mit Gleichaltrigen. * (Item 11 und Item 14 sind invers). *-----------------------. recode wob11_el wob14_el (2 = 0) (1 = 1) (0=2) into wob11r_e wob14r_e. compute peer = sum(wob6_el,wob11r_e,wob14r_e,wob19_el,wob23_el). exe. if (peer <=2) peer_jn = 0. if (peer = 3) peer_jn = 1. if (peer >=4) peer_jn = 2. val lab peer_jn 0 'normal' 1 'grenzw.' 2 'auff.'. exe. * Skala: Prosoziales Verhalten. * (kein Item ist invers). *-----------------------. compute pros = sum(wob1_el,wob4_el,wob9_el,wob17_el,wob20_el). exe. if (pros <=4) pros_jn = 2. if (pros = 5) pros_jn = 1. if (pros >=6) pros_jn = 0. val lab pros_jn 0 'normal' 1 'grenzw.' 2 'auff.'. exe. compute total = emotion + peer + beha + hks. exe. * Impact-Skala. * Berechnet nach den Scoring-instructions english version unter sdqinfo.com . RECODE problems (0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_prob . VARIABLE LABELS imp_prob 'Problems Scoring Variable'. EXECUTE . fre var imp_prob. exe. RECODE haus_m (0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_haus . VARIABLE LABELS imp_prob 'Haus Scoring Variable'. EXECUTE . fre var imp_haus. exe. RECODE freunde_ (0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_freu . VARIABLE LABELS imp_prob 'Freunde Scoring Variable'. EXECUTE . fre var imp_freu. exe. RECODE schule_m (0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_schu . VARIABLE LABELS imp_prob 'Schule Scoring Variable'. EXECUTE . fre var imp_schu. 56 exe. RECODE freizeit (0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_frei . VARIABLE LABELS imp_prob 'Freizeit Scoring Variable'. EXECUTE . fre var imp_frei. exe. * wenn keine Probleme benannt sind bzw wenn die erste Frage mit 'nein' beantwortet wird, * alle anderen Impact-Items auf Null setzen. if (sysmis(imp_prob) if (sysmis(imp_prob) if (sysmis(imp_prob) if (sysmis(imp_prob) if (sysmis(imp_prob) exe. or or or or or imp_prob imp_prob imp_prob imp_prob imp_prob = = = = = 0) 0) 0) 0) 0) imp_prob imp_haus imp_freu imp_schu imp_frei = = = = = 0. 0. 0. 0. 0. * Impact-Score berechnen. compute impact = sum(imp_prob,imp_haus,imp_freu,imp_schu,imp_frei). exe. fre var impact. exe. * Zeitkriterium >= 6 Monate berechnen. * seitwann = 2 entspricht 6 - 12 Monate. fre var seitwann. exe. RECODE seitwann (0=0) (1=0) (2=1) (3=1) (9=0) (SYSMIS=0) INTO hks_zeit. VARIABLE LABELS hks_zeit 'Zeitkriterium >= halbes Jahr'. EXECUTE . val lab hks_zeit 0 '< 6 Monate' 1 '>= 6 Monate'. exe. fre var hks_zeit. exe. * * * * Berechnung der HKS-Kriterien. 1 = nur Skala positiv. 2 = Skala und Impact positiv. 3 = Skala, Impact und Zeitkriterium erfuellt. if (hks_jn = 2) hks_crit = 1. if (hks_jn = 2 & impact >=2) hks_crit = 2. if (hks_jn = 2 & impact >=2 & hks_zeit=1) hks_crit = 3. exe. fre var hks_crit. exe. SAVE OUTFILE='C:\RKI\SDQ_Vergleich\total_sample.sav' /COMPRESSED. Get file = 'C:\RKI\SDQ_Vergleich\total_sample.sav'. GRAPH /ERRORBAR( CI 95 )= emotion beha hks peer pros total BY sample /MISSING=LISTWISE REPORT. MEANS TABLES=emotion beha hks peer pros /CELLS MEAN COUNT STDDEV /STATISTICS ANOVA . total BY sample CROSSTABS /TABLES=sample BY emot_jn beha_jn hks_jn peer_jn pros_jn /FORMAT= AVALUE TABLES /CELLS= COUNT ROW . 57 * Altersmittelwerte zwischen Klinik und RKI vergleichen. MEANS TABLES=kj_altx BY sample /CELLS MEAN COUNT STDDEV /STATISTICS ANOVA . * Mittelwerte vergleichen fuer ROC-Analysen. MEANS TABLES=emotion beha peer hks /CELLS MEAN COUNT STDDEV . BY sample ROC hks beha peer emotion BY sample (2) /PLOT = CURVE /PRINT = SE COORDINATES /CRITERIA = CUTOFF(INCLUDE) TESTPOS(LARGE) DISTRIBUTION(FREE) CI(95) /MISSING = EXCLUDE . if (hks >=4) hks_cut = 1. if (hks < 4) hks_cut = 0. exe. fre var hks_cut. exe. 58 SDQ-Fragebogen für Eltern (Klinikversion im Original; Layout formatierungsbedingt abweichend) ELTERN-FRAGEBOGEN (Fragebogen zu Stärken und Schwächen SDQ-DEU) Name, Vorname des Kindes Geschlecht: weiblich männlich Fragebogen ausgefüllt am: . . 200 durch: Mutter Geburtsdatum: . . Vater Andere Bezugsperson Bitte markieren Sie zu jedem Punkt “Nicht zutreffend“, “Teilweise zutreffend“ oder “Eindeutig zutreffend“. Beantworten Sie bitte alle Fragen so gut Sie können, selbst wenn Sie sich nicht ganz sicher sind oder Ihnen eine Frage merkwürdig vorkommt. Bitte berücksichtigen Sie bei der Antwort das Verhalten Ihres Kindes in den letzten sechs Monaten. Teilweise Eindeutig Nicht zutreffend zutreffend zutreffend Rücksichtsvoll Unruhig, überaktiv, kann nicht lange stillsitzen Klagt häufig über Kopfschmerzen, Bauchschmerzen oder Übelkeit Teilt gerne mit anderen Kindern (Süßigkeiten, Spielzeug, Buntstifte usw.) Hat oft Wutanfälle, ist aufbrausend Einzelgänger; spielt meist alleine Im allgemeinen folgsam; macht meist, was Erwachsene verlangen Hat viele Sorgen; erscheint häufig bedrückt Hilfsbereit, wenn andere verletzt, krank oder betrübt sind Ständig zappelig Hat wenigstens einen guten Freund oder eine gute Freundin Streitet sich oft mit anderen Kindern oder schikaniert sie Oft unglücklich oder niedergeschlagen; weint häufig Im allgemeinen bei anderen Kindern beliebt Leicht ablenkbar, unkonzentriert Nervös oder anklammernd in neuen Situationen; verliert leicht das Selbstvertrauen Lieb zu jüngeren Kindern Lügt oder mogelt häufig Wird von anderen gehänselt oder schikaniert Hilft anderen oft freiwillig (Eltern, Lehrern oder anderen Kindern) Denkt nach, bevor er/sie handelt Stiehlt zu Hause, in der Schule oder anderswo Kommt besser mit Erwachsenen aus als mit anderen Kindern Hat viele Ängste; fürchtet sich leicht Führt Aufgaben zu Ende; gute Konzentrationsspanne Gibt es noch etwas, das Sie erwähnen möchten? 59 Würden Sie sagen, dass Ihr Kind insgesamt gesehen in einem oder mehreren der folgenden Bereiche Schwierigkeiten hat: Stimmung, Konzentration, Verhalten, Umgang mit Anderen? Nein Ja, leichte Ja, deutliche Ja, massive Schwierigkeiten Schwierigkeiten Schwierigkeiten Falls Sie diese Frage mit “Ja“ beantwortet haben, beantworten Sie bitte auch die folgenden Punkte: • Seit wann gibt es diese Schwierigkeiten? Weniger als einen Monat • 6-12 Monate Über ein Jahr Kaum Deutlich Massiv Leidet Ihr Kind unter diesen Schwierigkeiten? Gar nicht • 1-5 Monate Wird Ihr Kind durch diese Schwierigkeiten in einem der folgenden Bereiche des Alltagslebens beeinträchtigt? Gar nicht Kaum Deutlich Schwer Zu Hause Mit Freunden Im Unterricht In der Freizeit • Stellen die Schwierigkeiten eine Belastung für Sie oder die gesamte Familie dar? Keine Belastung Leichte Belastung Deutliche Belastung Schwere Belastung Vielen Dank für Ihre Hilfe 60