Universität Ulm Zentrum für Innere Medizin Klinik für Innere Medizin I Ärztlicher Direktor: Prof. Dr. Thomas Seufferlein Vergleich verschiedener elastografischer Verfahren bei der Beurteilung fokaler Schilddrüsenläsionen Dissertation zur Erlangung des Doktorgrades der Medizin der Medizinischen Fakultät der Universität Ulm Caroline Hanna Schreiner Geboren in Ulm 2015 Amtierender Dekan: Prof. Dr. rer. nat. Thomas Wirth 1. Berichterstatter: Prof. Dr. med. Wolfgang Kratzer 2. Berichterstatter: Prof. Dr. med. Martin Wabitsch Tag der Promotion: 16.Juni 2016 Die Widmung wurde aus Gründen des Datenschutzes entfernt. II Inhaltsverzeichnis Abkürzungsverzeichnis 1 Einleitung ........................................................................................................1 1.1 Der Schilddrüsenknoten ........................................................................................ 1 1.2 Die Ultraschallelastografie ..................................................................................... 4 1.3 Unterschiedliche Arten der Elastografie ................................................................. 6 1.4 Aktuelle Studien zur Schilddrüsenelastografie ....................................................... 7 1.5 Fragestellung......................................................................................................... 8 2 Material und Methoden ..................................................................................9 2.1 Studienpopulation, Ablauf der Datenerhebung und der Untersuchung................... 9 2.2 Fragebogen ..........................................................................................................10 2.3 Ultraschalluntersuchung .......................................................................................11 2.4 Elastografische Untersuchung ..............................................................................14 2.5 Pathologisches Gutachten ....................................................................................22 2.6 Statistische Methoden ..........................................................................................22 2.7 Ethikvotum ...........................................................................................................23 2.8 Multicenter-Studie ................................................................................................24 3 Ergebnisse ....................................................................................................25 3.1 Geschlechts-, Alters- und Dignitätsverteilung im Gesamt- und Endkollektiv .........25 3.2 B-Bild-Kriterien der Schilddrüse deskriptiv und bivariat .........................................28 3.3 B-Bild Kriterien der Läsion deskriptiv und bivariat .................................................31 3.4 Grafische Darstellung der Kompressions- und Scherwellenelastografie ...............36 3.5 Semiquantitative Kompressionselastografie und numerische Darstellung der Scherwellenelastografie .......................................................................................42 III Inhaltsverzeichnis 4 Diskussion ....................................................................................................57 4.1 B-Bild-Parameter der Schilddrüse ........................................................................57 4.2 B-Bild-Kriterien, Durchblutungsmuster und TIRADS-Klassifikation der Läsion ......59 4.3 Geräteübergreifende Diskussionspunkte der Elastografie ....................................64 4.4 Vergleich der Arten der Elastografie .....................................................................70 4.5 Weitere Vergleichsmessungen der numerischen Scherwellenelastografie ...........93 4.6 Stärken und Schwächen der Studie......................................................................98 4.7 Schlussfolgerung ................................................................................................100 5 Zusammenfassung ....................................................................................101 6 Literaturverzeichnis ...................................................................................103 IV Abkürzungsverzeichnis A. Arteria Abb. Abbildung ARFI Acoustic Radiation Force Impulse AUROC area under the curve ASQ Acoustic Structure Quantification B-Bild Brightness-Bild BIRADS Breast Imaging Reporting and Data System BMI body mass index bzgl. bezüglich bzw. beziehungsweise ca. circa CAT chronisch autoimmune Thyreoiditis cm Zentimeter DEGUM Deutsche Gesellschaft für Ultraschall in der Medizin d.h. das heißt EFSUMB European Federation of Societies for Ultrasound in Medicine and Biology ES Elastografiescore FNAB Feinnadelaspirationsbiopsie GCP Good Clinical Practice Inc. Incorporated kg Kilogramm Kn Knoten kPa Kilopascal m Meter M. Musculus ml Milliliter mm Millimeter MNSR muscle-to-nodule strain ratio m/s Meter pro Sekunde OR odds ratio PNSR parenchyma-to-nodule strain ratio ROC receiver operating characteristic ROI region of interest V Abkürzungsverzeichnis RTE Realtime-Elastografie s. siehe SD Schilddrüse sog. sogenannte STD Standarddeviation Tab. Tabelle TSH Thyreotropin TIRADS Thyroid Imaging Reporting and Data System u.a. unter anderem US Ultraschall vgl. vergleiche vs. versus VTI Virtual Touch™ Imaging VTQ Virtual Touch™ Quantification VTIQ Virtual Touch™ IQ z.B. zum Beispiel 1 Einleitung 1 Einleitung 1.1 Der Schilddrüsenknoten 1.1.1 Epidemiologie und Einteilung Je nach angewandter Untersuchungsmethode sind existente Schilddrüsenknoten in der untersuchten Population unterschiedlich gut zu finden: in 4-7% bei der Palpation, in 20-76% bei der Ultraschalluntersuchung der Schilddrüse und in 5065% bei einer Autopsie [64]. In einer von Reiners et al. publizierten Studie wurde die Schilddrüse von 96278 Berufstätigen auf mögliche Schilddrüsenpathologien sonografisch untersucht, wobei die Daten Schilddrüsenbehandlung von aus Patienten den mit Analysen kürzlich stattgefundener ausgeschlossen wurden. Schilddrüsenknoten, die größer als 0,5 cm waren, fanden sich in 21,9% der Fälle. Mit steigendem Alter nahm in beiden Geschlechtern die Prävalenz von Knoten zu, Frauen waren in allen Altersklassen häufiger betroffen als Männer [67]. Von diesen Knoten stellen 4-6,5% maligne Veränderungen dar, der viel größere Anteil ist jedoch benignen Ursprungs: Ursachen für gutartige Knoten sind die unterschiedlichen Arten von Thyreoiditiden, einfache oder hämorrhagische Zysten, Kolloidzysten, follikuläre (autonome) oder Hürthle-Zell Adenome und adenomatöse Knoten [34, 62, 64]. Wird bei der palpatorischen oder sonografischen Untersuchung der Schilddrüse ein sog. Inzidentalom (=der zufällig entdeckte Schilddrüsenknoten) entdeckt, wird eine Differenzierung zwischen benignem und malignem Befund unumgänglich [64]. 1.1.2 Der maligne Schilddrüsenknoten Die Gruppe der Karzinome stellt mit mehr als 95% der Schilddrüsenmalignome die größte Entität dar. Die häufigsten histologischen Typen des malignen Schilddrüsenknotens sind die differenzierten Karzinome, das papilläre und das follikuläre Schilddrüsenkarzinom (85% bzw. 5-15% der Schilddrüsen-karzinome), gefolgt von medullärem (5%) und anaplastischem (weniger als 5%) Karzinom, selten sind 2 Einleitung maligne Hämangioendotheliome, Sarkome und primäre Lymphome, sowie Metastasen eines in einem anderen Gebiet lokalisierten Primärtumors [50, 52]. 4220 Frauen und 1670 Männer erkrankten in Deutschland im Jahr 2010 neu an einer malignen Neoplasie der Schilddrüse. Nach einer Prognose des Robert KochInstituts steigt die Inzidenz 2014 deutschlandweit auf 5100 Frauen und 2100 Männer, das sind 12,4 bzw. 5,2 neue Fälle pro 100000 Einwohner. Dieser kontrovers diskutierte Inzidenzanstieg ist seit 1980 zu beobachten, wohingegen sich die Mortalitätsraten gegensätzlich entwickelten und kontinuierlich abfallen. Das Robert Koch-Institut nimmt in seinem Bericht allerdings weniger einen tatsächlichen als vielmehr einen anscheinenden Inzidenzanstieg an. Dieser sei durch die stetige Verbesserung der technischen Untersuchungsmethoden begründet [5, 40]. Auch Pellegriti et al. führen diesen Grund für den Inzidenzanstieg in ihrer Arbeit an, gehen darüber hinaus jedoch auch von einem tatsächlichen Anstieg, möglicherweise bedingt durch eine erhöhte Strahlenbelastung der Bevölkerung und anderen, bisher nicht identifizierten Einflussfaktoren, aus [63]. Ebenfalls gelangen Brito et al. in ihrer Arbeit zu diesem Ergebnis [11]. Unabhängig von einem tatsächlichen Anstieg sieht sich die Klinik mit einer höheren Patientenanzahl und der erforderlichen Diagnostik und Therapie konfrontiert. Da das anaplastische Schilddrüsenkarzinom gehäuft bei Patienten mit positiver Anamnese eines differenzierten Karzinoms auftritt, wird vermutet, dass es sich pathogenetisch um ein aus den differenzierten Karzinomen genetisch weiterverändertes (insbesondere durch Verlust des p53-Tumorsuppressorgens)= „dedifferenziertes“ Karzinom handelt. Es zählt deswegen mit zu den aggressivsten Neoplasien des Menschen und führt durch unaufhaltsames lokales Wachstum und Kompression von vital wichtigen Strukturen im Halsbereich innerhalb von einem Jahr zum Tod. Die 10-Jahresüberlebensraten bei Patienten mit differenzierten Schilddrüsenkarzinomen sind dagegen sehr gut und betragen über 90% für das papilläre und 75-80% für das follikuläre Karzinom [50, 52]. So wie in der Ätiologie vieler anderer Tumoren auch, stehen Genmutationen von Onkogenen und Tumorsuppressorgenen oder strukturelle Chromosomen- aberrationen am Beginn der Pathogenese eines Schilddrüsenkarzinoms. Für die histologisch unterschiedlichen Genmutationen identifiziert. Tumortypen wurden bereits verschiedene 3 Einleitung Die chromosomalen Aberrationen werden entweder vererbt oder ereignen sich im Laufe des Patientenlebens sporadisch, wobei sie zum Teil durch Umwelteinflüsse oder endogene Faktoren begünstigt werden können. Einige Risikofaktoren werden hierbei im Zusammenhang mit der Entstehung von Schilddrüsenkarzinomen diskutiert, nur ein einziger gilt allerdings bisher als gesichert: die Exposition gegenüber ionisierender Strahlung (z.B. im Rahmen einer Radiotherapie) vor allem im Kindesalter. Zudem finden sich in der Anamnese der Patienten gehäuft Jodmangel und benigne Schilddrüsenerkrankungen, wie Strumae und Adenome, wobei die Jodversorgung sich wohl eher in der histologischen Verteilung der Karzinome zeigt. So nehmen bei einer erhöhten Jodzufuhr die papillären Karzinome anteilig zu. Weitere untersuchte Risikofaktoren sind große Körpergröße, hohes Körpergewicht und hormonelle Einflüsse, wie TSH-Stimulation der Schilddrüse und Östrogene, letztere vor allem deshalb, da Frauen in etwa doppelt so häufig betroffen sind [40, 50, 52]. 1.1.3 Diagnostik und Therapie Wird ein Schilddrüsenknoten entdeckt, erfolgen zunächst die Anamnese, die körperliche Untersuchung und die Bestimmung der schilddrüsenspezifischen Laborparameter. Anschließend finden die bildgebenden gerätegestützten und eventuell invasiven Untersuchungen statt. Heutiger Goldstandard für die zytologische Untersuchung von Schilddrüsenknoten ist die Feinnadelaspirationsbiopsie (FNAB) [34, 62]. Doch auch wenn die FNAB der Goldstandard der zytologischen Diagnostik ist, weist sie Schwächen auf: Zum einen birgt sie als invasive Untersuchungsmethode Risiken für die Patienten wie Infektion, Blutung und Beschädigung von Strukturen und zum anderen liefert sie in 10-20% der Fälle keine diagnostischen Ergebnisse [50, 62]. Die Sonografie wird in der Untersuchung von Schilddrüsenknoten eingesetzt, um eventuell vorhandene morphologische Hinweise für Malignität zu detektieren. In Nachfolgeuntersuchungen ist sie zudem aussagekräftig in Bezug auf das relative Knotenwachstum und kann somit zur Risikobewertung beitragen. Sie hat gegenüber der FNAB zwei wichtige Vorteile: Sie ist nicht invasiv und die Diagnostik kann zeitlich sofort erfolgen. 4 Einleitung Die Ergebnisse zweier großer Metaanalysen konnten sonografische Risikofaktoren für maligne Knoten identifizieren, jedoch gibt es außer dem invasiven Knotenwachstum keinen zuverlässig Knotenparameter [12, 16]. Die Therapie des Schilddrüsenknotens richtet sich nach den Diagnostikergebnissen: Bei malignen Knoten wird abhängig vom histologischen Typ und vorhandenen Metastasen eine Hemi- oder totale Thyreoidektomie mit oder ohne Lymphknotendissektionen durchgeführt. Die Therapie eines benignen Knotens besteht in der Verlaufskontrolle bzw. einer (subtotalen) Lappenresektion, Hemi- oder totalen Thyreoidektomie bei lokalen Symptomen oder anders nicht beherrschbarer Schilddrüsenüberfunktion [1, 20]. 1.2 Die Ultraschallelastografie Das Abtasten von Gewebe, die Palpation, gehört seit jeher zur ärztlichen Tätigkeit. Sie findet im Rahmen der körperlichen Untersuchung eines Patienten statt, um so eventuell vorhandene Pathologien des Gewebes oder der Organe zu detektieren, die sich aufgrund ihrer veränderten Gewebsstruktur vom normalen, gesunden Gewebe unterscheiden. Die Palpation ist limitiert durch die Subjektivität und Erfahrung des Arztes zum einen und zum anderen durch die Lage und Größe des zu untersuchenden Gewebes. Verändern sich mit der Entstehung einer Pathologie des Gewebes seine physikalischen und strukturellen Eigenschaften, findet häufig eine Zunahme der Steifigkeit mit resultierender Abnahme der Elastizität dieses Gewebes statt. Vor allem maligne Neoplasien sind verbunden mit einer Härtezunahme. Um nun die Elastizität eines Gewebes im Gegensatz zur Palpation objektiv sichtbar und messbar zu machen, wurde Anfang der neunziger Jahre zum ersten Mal Elastografie auf Basis der Sonografie erprobt. Wenige Jahre später wurde die Elastografie in der Magnetresonanztomografie vorgestellt. Die Elastografie ist eine dynamische Technik, die auf der physikalischen Tatsache beruht, dass sich weiches Gewebe unter Druckeinwirkung leichter deformieren lässt als hartes Gewebe. Diese Unterschiede in der Deformierung werden visualisiert. Die Idee, benigne Gewebeeigenschaften Knoten anders würden sich darstellen als aufgrund maligne ihrer Knoten, elastografische Untersuchung von Schilddrüsenknoten ein [48, 54, 58]. weicheren führte die 5 Einleitung In den letzten 20 Jahren wurden dann die beiden unterschiedlichen Elastografieverfahren weiterentwickelt, wobei vor allem die Ultraschallelastografie aufgrund ihres kostengünstigeren und weniger zeitintensiven Aufwands enormen Zuspruch und Fortschritt erfahren hat. Lyshchik et al. publizierten 2005 die erste Veröffentlichung zur elastografischen Untersuchung von Schilddrüsenknoten [49]. 2008 sprach sich die Deutsche Gesellschaft für Ultraschall in der Medizin e.V. (DEGUM) für den Einsatz der Elastografie in der Krebsdiagnostik aus: Tumorherde würden sich genauer lokalisieren lassen, eine Biopsie zur Untersuchung des Gewebes könne mit einer um 20% gesteigerten Genauigkeit im Vergleich zum konventionellen Ultraschall durchgeführt und Fehldiagnosen vermieden werden [21]. Die meisten marktführenden Hersteller von sog. „High-End-Ultraschallgeräten“ bieten eine Elastografieapplikation in ihren neueren Ultraschallgeräten an. Auch finden sich in aktuellen Lehrbüchern zur Schilddrüsenultraschalldiagnostik bereits ganze Kapitel zum Thema Elastografie von Schilddrüsenknoten [6, 36, 45, 72, 78]. Die Elastosonografie der Schilddrüse ist durch die oberflächliche Lage der Schilddrüse und ihre Komprimierbarkeit gegen die darunterliegenden anatomischen Strukturen gut anzuwenden und bietet die Vorteile einer Ultraschalluntersuchung: nicht-invasive Untersuchungsmethode, keine Risiken für den Patienten, keine Kontraindikationen und aufgrund der apparativen Möglichkeiten schnell durchführbar. Unsicherheit besteht darüber, ob alle Arten von Schilddrüsenmalignomen elastografisch beurteilbar sind und welchen Einfluss zystische Anteile und Kalzifizierungen auf die Messung haben [6]. Neben der Schilddrüse gibt es inzwischen weitere zahlreiche klinische Anwendungsmöglichkeiten für die Elastografie: Zu den häufigsten Fragestellungen zählen die Knotendiagnostik der Mamma, die Prostatakarzinomabklärung, sowie die Diagnostik der Leberzirrhose. Des Weiteren werden der Hoden oder auch Achillessehnenerkrankungen elastosonografisch geprüft. Neuere Publikationen beschäftigen sich zudem mit der endosonografisch durchgeführten Elastografie von mediastinal gelegenen Gastrointestinaltraktes [22]. Lymphknoten, dem Pankreas und des 6 Einleitung 1.3 Unterschiedliche Arten der Elastografie Je nach Hersteller und Gerät werden unterschiedliche Techniken und Bewertungen dieser für die elastografische Untersuchung verwendet. Basierend auf der Technik gibt es Ultraschallgeräte, bei welchen die Gewebskompression manuell vom Untersucher durch den Schallkopf auf das Gewebe aufgebracht wird. Wird das so entstandene Elastogramm vom Untersucher einer Farbklassifikation zugeordnet, spricht man von der sog. qualitativen Kompressions- oder Realtime-Elastografie (RTE). Die verschiedenen Farbklassifikationen unterscheiden drei bis sechs unterschiedliche Elastogrammfarbzusammensetzungen. Da die qualitative Kompressionselastografie jedoch aufgrund variierender Kompressionsstärke und subjektiver Klassifikationseinteilung untersucherabhängig ist, wurde von den Geräteherstellern die Kompressionselastografie in Form der sog. Strain-Ratio weiter entwickelt. Die Strain-Ratio bildet das Belastungsverhältnis von zwei vom Untersucher definierten Geweben oder Gewebsanteilen ab. Da sich durch die Division der beiden Belastungswerte Einflüsse auf beiden Seiten ausgleichen und absolute Zahlenwerte für das Verhältnis angegeben werden, spricht man von der semiquantitativen Elastografie. Auf der anderen Seite gibt es Ultraschallgeräte, die sich nicht einer manuellen Kompression durch den Untersucher bedienen, sondern bei welchen der Schallkopf selbstständig in der Lage ist, durch die Generierung von akustischen Druckimpulsen das Gewebe untersucherunabhängig zu komprimieren. Diese akustischen Druckimpulse bewirken im Gewebe die Entstehung von sog. Scherwellen, deren Geschwindigkeiten wiederum vom Ultraschallgerät mittels Detektionswellen gemessen werden können. Diese Ultraschallgeräte arbeiten mit Hilfe der Acoustic Radiation Force Impulse (ARFI) Technologie oder der Supersonic Shearwave Technologie, welche beide auch als quantitative Elastografie bezeichnet werden. Der Untersucher hat die Möglichkeit sich die gemessenen Geschwindigkeiten farblich als Elastogramm oder an von ihm festgesetzten Punkten als absolute Zahlen in m/s oder in kPa für die gemessene Elastizität anzeigen zu lassen. In ursprünglicheren Arbeiten findet sich vor allem die früher entwickelte, qualitative Elastografie. Doch aufgrund des Versuches die Messungen objektiver und Studien und Ergebnisse vergleichbarer zu machen, entwickelten sich die semiquantitative und die quantitative Elastografie, die sich immer stärker etablieren [6, 17]. 7 Einleitung 1.4 Aktuelle Studien zur Schilddrüsenelastografie Zahlreiche Studien zur Bestimmung der diagnostischen Wertigkeit der Schilddrüsenelastografie mit unterschiedlichen Versuchsaufbauten und Variablen sind bisher veröffentlicht. Bojunga et al. und Sun et al. fassten 2010 bzw. 2014 daher die bis dato publizierten Arbeiten und Ergebnisse in Metaanalysen zusammen. Während Bojunga et al. in ihrer Arbeit mit acht Studien noch eine sehr gute Sensitivität von 92% und Spezifität von 90% für die qualitative Elastografie in der Differenzierung zwischen benignen und malignen Knoten fanden, konnten Sun et al. diese hohen diagnostischen Werte in ihrer Arbeit mit 31 Studien nicht mehr bestätigen: für die qualitative Elastografie betrug die Sensitivität 79% und die Spezifität 77%, für die semiquantitative Elastografie die Sensitivität 85% und Spezifität 80% [10, 77]. Doch nur drei Studien haben bisher Schilddrüsenknoten an zwei unterschiedlichen Ultraschallgeräten untersucht: Friedrich-Rust et al., Bojunga et al. und Slapa et al. Friedrich-Rust et al. untersuchten 2011 Schilddrüsenknoten mittels ARFITechnologie und mittels Kompressionselastofgrafie. Den Schwerpunkt legten die Autoren weniger auf den direkten Vergleich der Methoden als vielmehr auf die Frage, ob Schilddrüsenknoten überhaupt für die ARFI-Technologie zugänglich seien und berechneten daher außer dem signifikanten Spearman Korrelationskoeffizienten von 0,31 zwischen den beiden Methoden keine weiteren diagnostischen Werte [27]. Die nachfolgende Studie dieser Arbeitsgruppe, publiziert von Bojunga et al., beinhaltete 158 Knoten, die zum einen mit der Realtime-Elastografie (RTE) eines Hitachi Ultraschallgerätes und zum anderen mit der ARFI-Bildgebung der Virtual Touch™ Quantification (VTQ) Software eines Siemens Acuson S2000 untersucht wurden. Zur statistischen Auswertung wurde im Rahmen der „receiver operating characteristics“ die Fläche unter der Kurve für beide Verfahren berechnet: Die RTE zeigte mit 0,74 die bessere Diskriminationsfähigkeit von benignen und malignen Knoten im Vergleich zur ARFI-Schwellengrenze von 2,57 m/s mit 0,69. Bei der Berechnung der einzelnen diagnostischen Werte wies die RTE mit 76% die höhere Sensitivität, die ARFI-VTQ die höhere Spezifität mit 85% auf. Es gab keinen signifikanten Unterschied zwischen beiden Untersuchungsmethoden [9]. 8 Einleitung Eine letzte vergleichende Arbeit mit sechs Knoten (eine maligne Histopathologie) wurde publiziert von Slapa et al. Die Kompressionselastografie wurde an einem Toshiba Ultraschallgerät, die Scherwellenelastografie an einem Supersonic Image Ultraschallgerät untersucht: die Scherwellenelastografie wies ein richtig positives und fünf richtig negative Ergebnisse auf, die Kompressionselastografie fünf falsch positive und ein falsch negatives Ergebnis. Diagnostische Werte wurden aufgrund der kleinen Fallzahl nicht berechnet. Die falsch positiven Knoten wiesen mindestens eines der folgenden Kriterien auf: flüssiger oder degenerativer Inhalt, fokal erhöhte Steifigkeit durch Mikrokalzifikationen, die im B-Bild teilweise nicht sichtbar waren. Die Autoren folgerten, dass die Scherwellenelastografie im Gegensatz zur Kompressionselastografie auch bei Knoten mit diesen Charakteristika effektiv für eine Differenzierung eingesetzt werden könne [74]. Bisher gibt es keine Arbeiten, die die drei Ultraschallgeräte dieser Studie und ihrer Techniken miteinander verglichen haben. 1.5 Fragestellung Ziel dieser Arbeit ist es, die unterschiedlichen Elastografiemodalitäten der drei „High-End-Ultraschallgeräte“, des Hitachi HI VISION Ascendus, des Toshiba Aplio 500 und des Siemens Acuson S3000 Ultraschallgerätes für die Differenzierung zwischen benignen und malignen Schilddrüsenknoten zu untersuchen. Hierzu sollen ihre diagnostischen Wertigkeiten ermittelt und miteinander verglichen werden. 9 Material und Methoden 2 Material und Methoden 2.1 Studienpopulation, Ablauf der Datenerhebung und der Untersuchung Die Auswahl der Patienten erfolgte konsekutiv. Patienten, die in den folgenden Tagen in der Viszeralchirurgie der Universität Ulm an der Schilddrüse operiert werden sollten, wurden mündlich und schriftlich über die Studie aufgeklärt und das schriftliche Einverständnis der Patienten wurde eingeholt. Patienten, die folgende Einschlusskriterien erfüllten, wurden in die Studie aufgenommen: 1. Alter >18 Jahre 2. Ein oder mehrere Schilddrüsenknoten, die sonografisch untersucht werden konnten 3. Operation der Schilddrüse innerhalb von fünf Tagen nach der sonografischen Diagnostik 4. Histopathologische Diagnostik des bei der Operation entnommenen Schilddrüsengewebes 5. Schriftliche Einverständniserklärung des Patienten nach Aufklärung Bei Vorliegen eines der folgenden Ausschlusskriterien wurde der Patient von der Studie ausgeschlossen: 1. Alter <18 Jahre 2. Instabile medizinische Verfassung, welche die Untersuchungen beeinträchtigte 3. Jegliche Kontraindikation gegen eine Ultraschalluntersuchung 4. Kürzlich stattgefundene Schilddrüsenoperation 5. Schilddrüsenknoten mit folgenden Eigenschaften: Rein zystische Knoten Kalzifizierte Umhüllung des Knotens 6. Unzureichende Datensätze Insgesamt wurden 52 Patienten im Zeitraum von Dezember 2012 bis Juni 2013 untersucht, von welchen nach Ausschluss aufgrund unzureichender Datensätze noch 41 in die endgültige statistische Auswertung einbezogen wurden. 10 Material und Methoden Pro Patient wurden ein, zwei oder drei Knoten untersucht. Als Gesamtzahl der untersuchten Knoten ergab sich 69, in das Endkollektiv wurden noch 53 Knoten eingeschlossen. Am Beginn der Datenerhebung wurde zunächst gemeinsam mit den Patienten ein standardisierter Fragebogen ausgefüllt. Nachfolgend wurde die Ultraschalluntersuchung durchgeführt, bei welcher zunächst die B-Bild-Kriterien und anschließend die Elastografieparameter erhoben wurden. Das pathologische Gutachten als Referenz wurde postoperativ eingeholt. 2.2 Fragebogen Folgende Daten wurden mit den Patienten in einem Fragebogen erfasst: 1. Angaben zur Person: Name, Alter, Geschlecht; 2. Anamnese zur Schilddrüse allgemein: Erkrankungen (Hypo-/Hyperthyreose, Morbus Basedow, Hashimoto-Thyreoiditis) und deren Erstdiagnose, stattgefundene Operationen im Schilddrüsen- und Halsbereich; 3. Anamnese der aktuell im Fokus stehenden Schilddrüsenläsion: Erstdiagnose, aktuelle Beschwerden (Schmerzen, Globusgefühl, Heiserkeit, Stridor, Druck, Atembeschwerden, Dysphagie), vorangegangene Eingriffe (Biopsie, Operation), stattgefundene Radiojodtherapie, Gewichtsverlust; 4. Familienanamnese (Schilddrüsenerkrankungen, Schilddrüsenkrebs) Die Angaben zu Größe, Gewicht und Medikamenteneinnahme der Patienten wurden aus dem anästhesiologischen Narkoseprotokoll postoperativ erhoben. Der Body-Mass-Index (BMI) wurde anhand der Formel BMI berechnet. Gewicht kg Körpergröße ² m² 11 Material und Methoden 2.3 Ultraschalluntersuchung 2.3.1 Geräte, Einstellungen und Ablauf Die Ultraschalluntersuchung erfolgte an drei unterschiedlichen Ultraschallgeräten, dem HI VISION Ascendus (Schallkopf: L74M13-5), dem Toshiba Aplio 500 (Schallkopf: PLT-805AT 8MHz) und dem Siemens Acuson S3000 (Schallkopf: 9L4). Hierbei erfolgte die Erhebung der B-Bild-Kriterien in der Regel am HI VISION Ascendus, die Erhebung der Elastografiewerte an allen drei Geräten. Vor jeder Untersuchung wurden an allen drei Geräten identische Einstellungen vorgenommen und im Hinblick auf die bestmögliche Darstellung der Schilddrüse und der Läsion leichtgradig modifiziert. Jede Untersuchung erfolgte durch einen sehr erfahrenen Ultraschalldiagnostiker (mehr als 3000 Schalls pro Jahr) und zwei mehrere Monate in der Ultraschalldiagnostik ausgebildete Doktorandinnen. 2.3.2 B-Bild-Parameter Für die Untersuchung wurden die Patienten in Rückenlage mit überstrecktem Hals gelagert, sodass die Schilddrüse gut zugänglich war.Folgende B-Bild-Kriterien der Schilddrüse wurden im Rahmen der Untersuchung erhoben: 1. Volumina des rechten und linken Schilddrüsenlappens, Breite des Isthmus 2. Echogenität, Homogenität, zystische Anteile der Schilddrüse in Prozent 3. Anzahl der vorhandenen Läsionen Folgende Parameter wurden von der Läsion erhoben: 1. Größe, Form, Lage in der Schilddrüse 2. Volumen, V= nach folgender 4 𝐿ä𝑛𝑔𝑒+𝐵𝑟𝑒𝑖𝑡𝑒+𝑇𝑖𝑒𝑓𝑒 3 𝜋∗( ) 3 6 1000 Formel (Volumen einer Kugel): (ml) 3. Verhältnis von anteroposteriorem zu transversalem Durchmesser 4. Echogenität, Homogenität, zystische Anteile der Läsion in Prozent 5. Randbeschaffenheit (regelmäßig/unregelmäßig) 6. Vorhandensein des Halo-Zeichens (=echoarmer Randsaum) 7. Vorhandensein von Mikro- (<1 mm) und/oder Makrokalzifizierungen (≥1 mm) 12 Material und Methoden 2.3.3 Durchblutung der Läsion im Color-Doppler-Modus Die Durchblutung wurde mit Hilfe des Color-Doppler-Modus der Geräte dargestellt und einem der folgenden fünf Vaskularisationsmuster nach Ivanac et al. zugeordnet (Abbildung 1) [39]: Muster 0: keine sichtbare Durchblutung Muster 1: minimaler zentraler Blutfluss ohne peripheren Ring Muster 2: peripherer ringförmiger Blutfluss ohne oder mit minimalem zentralem Blutfluss Muster 3: peripherer ringförmiger Blutfluss und geringer bis mäßig ausgeprägter Blutfluss innerhalb des Knotens Muster 4: ausgeprägter zentraler Blutfluss mit oder ohne peripheren Ring Abbildung 1: Schematische Darstellung des allgemeinen Erscheinungsbildes Schilddrüsenknoten für die Vaskularisationsmuster 1 bis 4 nach Ivanac et al. [39] der 2.3.4 TIRADS-Klassifikation Abschließend erfolgte die Einteilung des Knotens anhand seiner sonografischen Charakteristika entsprechend der Thyroid Imaging Reporting and Data System (TIRADS) Klassifikation. Diese ist in Tabelle 1 gezeigt und wurde von Horvath et al. entwickelt [37]. Die Zuteilung des Knotens erfolgte hier neben dem Hauptuntersucher zusätzlich durch zwei weitere sehr erfahrene Ultraschalldiagnostiker (mehr als 3000 Ultraschalls pro Jahr), wobei bei Uneinigkeit der Mehrheitskonsens entschied. 13 Material und Methoden Tabelle 1: Thyroid Imaging Reporting and Data System (=TIRADS) nach Horvath et al. [37] Aufgeführt sind die TIRADS-Kategorien mit ihrem jeweiligen Risiko für Malignität, ihren Ultraschall-Mustern (=US-Muster) und der Beschreibung dieses Ultraschall-Musters. TIRADSKategorie 1 stellt die unauffällige, normale Schilddrüse dar. In der TIRADS-Kategorie 6 wurde mittels Biopsie die Malignität des Gewebes nachgewiesen. Thyroid Imaging Reporting and Data System (TIRADS) TIRADS-Kategorie TIRADS 1 TIRADS 2 TIRADS 3 Malignitätsrisiko US-Muster Beschreibung des US-Musters Kolloidtyp 1 anechogen mit hyperechogenen Punkten; nicht vaskularisiert Normale Schilddrüse Kolloidtyp 2 Gutartig Wahrscheinlich gutartig TIRADS Unbe- 4A stimmt TIRADS 4B Suspekt 0% < 5% 5-10% 10-80% Kolloidtyp 3 Hashimoto Pseudoknoten Hyper-, iso-, oder hypoechogen; unvollständige Kapsel mit peripherer Vaskularisation; bei Hashimoto-Thyreoiditis Einfaches neoplastisches Muster Solide oder gemischt hyper-, iso-, oder hypoechogen; mit dünner Kapsel De QuervainMuster Hypoechogene Läsion mit unscharfer Begrenzung; ohne Kalzifizierungen Suspektneoplastisch Hyper-,iso-, oder hypoechogen; hypervaskularisiert; vollständige, dicke Kapsel; mit (Makro- oder Mikro-) Kalzifizierungen Malignes Muster A Hypoechogen; keine Kapsel; mit unregelmäßiger, unscharfer Begrenzung; einwachsende Gefäße; mit oder ohne Kalzifizierung 5 mit Malignität 6 Bioptisch gesicherte Malignität 100% 8 Malignes Muster 0 B % Iso- oder Hypoechogen; keine Kapsel; mit multiplen peripheren Mikrokalzifizierungen und Hypervaskularisierung Malignes Muster Keine Kapsel; isoechogen; gemischt hypervaskularisiert mit oder ohne Kalzifi- C TIRADS Punkten; vaskularisiert; spongiforme Struktur keine Kapsel; gemischte Echogenität mit solidem Anteil; isoechogen; verdrängend; vaskularisierter Knoten mit hyperechogenen Punkten Vereinbar TIRADS keine Kapsel; gemischte Echogenität; nicht verdrängend; mit hyperechogenen zierungen; ohne hyperechogene Punkte 14 Material und Methoden 2.4 Elastografische Untersuchung Im Anschluss an die B-Bild-Diagnostik wurde die elastografische Untersuchung der Läsion an allen drei Ultraschallgeräten durchgeführt. 2.4.1 HI VISION Ascendus Im Elastografiemodus „Real-time Tissue Elastography“ des Gerätes wurden zunächst zwei Bilder nebeneinander im sog. Split-Screen-Modus dargestellt: ein farbiges Elastogramm neben dem herkömmlichen B-Bild. Auf dem Elastogramm wurde eine sog. region of interest (ROI) vom Untersucher festgelegt, welche den Knoten möglichst vollständig und Anteile der gesunden Schilddrüse mit einschloss. Anschließend wurde vom Untersucher manuell mit der Ultraschallsonde leichter Druck periodisch auf die Schilddrüse aufgebracht und dieser auf einer numerischen Skala am linken Bildrand überprüft: Befand sich der Druck zwischen 3 und 5 auf dieser Skala, wurde laut Hersteller der optimale Druck appliziert und der Untersucher konnte das Elastogramm für die Datenerhebung heranziehen. Sowohl im Quer- als auch im Längsschnitt wurde ein qualitatives Elastogramm erhoben. Auf diesen wurden die Farbkompositionen des Knotens und des umgebenden Parenchyms beurteilt und einem der folgenden und in Abbildung 2 schematisch dargestellten vier Elastografiescores (ES) nach Asteria et al. zugeordnet [2]: ES 1: homogen grüner Knoten ES 2: überwiegend grüner Knoten mit peripheren und/oder zentralen blauen Anteilen ES 3: überwiegend blauer Knoten mit grünen und roten Anteilen oder Punkten ES 4: homogen blauer Knoten Abbildung 2: Schematische Darstellung des allgemeinen Erscheinungsbildes Schilddrüsenknoten für die Elastografiescores (ES) 1 bis 4 nach Asteria et al. [2] der 15 Material und Methoden Es wurde vom Untersucher bewertet, wie eindeutig das Elastogramm einem der vier Elastografiescores zuzuordnen war und, ob die Läsion mit Hilfe der Elastografie zum restlichen Gewebe besser abgrenzbar war als im B-Bild. Zudem wurde beurteilt wie gut die Elastogrammqualität war. Diese Qualität wurde in der vorliegenden Arbeit definiert als der Flächenanteil der Elastogramm-ROI, der vom Ultraschallgerät auch tatsächlich farblich überlegt wurde. Gute Qualität bedeutete einen farbigen Flächenanteil von 80-100% und nur Elastogramme, die dieses Kriterium erfüllten, wurden ausgewertet. Lag der farbige Anteil darunter, wurde ein neues Elastogramm generiert. Im Anschluss an die Beurteilung des qualitativen Elastogramms erfolgte die Erhebung des semiquantitativen Elastogramms, die Ermittlung der Strain-RatioWerte. Dazu wurden vom Untersucher in der großen, anfangs gesetzten Elastogramm-ROI eine ROI A in der Läsion und eine ROI B im umgebenden Schilddrüsengewebe festgesetzt. Wie in Abbildung 3 zu sehen ist, gab das Ultraschallgerät die Durchschnittsdehnung der ROI A als Prozentangabe an und setzte sie ins Verhältnis zur Prozentangabe der Durchschnittsbelastung von ROI B. So erhielt man das Dehnungsverhältnis der beiden ROIs, die Strain-Ratio, wobei der Wert des Schilddrüsengewebes durch den Wert des Knotens dividiert wurde (B/A). Die Prozentangabe von ROI A und ROI B kommt durch die Dehnungsdifferenz im Verhältnis zur Objektgröße der ausgewählten ROI zustande. Beträgt die Objektgröße beispielsweise 100 mm und die Verkürzung durch Belastung im Durchschnitt 2 mm, würde die Dehnung mit 2% wiedergegeben. Je elastischer eine Läsion im Vergleich zum angrenzenden Schilddrüsenparenchym ist, desto größer wird der Wert in A, also im Nenner des Verhältnisses und desto kleiner wird das Verhältnis insgesamt. Umgekehrt wird das Verhältnis größer, je kleiner der Wert im Nenner ist, d.h. je unelastischer die Läsion ist [36]. Zunächst wurden vier verschiedene, ca. 1 cm² große ROIs A in der Läsion jeweils ins Verhältnis zur selben, ebenfalls 1 cm² großen ROI B im Schilddrüsengewebe gesetzt. So wurden vier Strain-Ratio-Werte ermittelt, aus welchen dann der Mittelwert errechnet wurde. 16 Material und Methoden Abbildung 3: Arbeitsoberfläche des Hitachi Ascendus Ultraschallgerätes bei der Erhebung der Strain-Ratio des Schilddrüsenknotens im Querschnitt. Links ist das Elastogramm, rechts das herkömmliche B-Bild abgebildet, in welchem die Ausmaße des hier untersuchten Knotens nachträglich eingezeichnet wurden (gelbe Linien). Das Gerät gibt die berechnete Strain-Ratio der durch den Untersucher gesetzten Regions of Interest A (Läsion) und B (Schilddrüse) an. Universitätsklinikum Ulm, 06/2013. Im Verlauf der Datenerhebung wurde dieses erste Schema um zwei Messungen erweitert: Ein ROI-Paar wurde auf gleicher Höhe gesetzt und der Strain-Ratio-Wert für dieses ermittelt. Zudem wurde eine Messung durchgeführt, bei welcher die ROI A so adjustiert wurde, dass sie die komplette Läsion umschloss, und ROI B im umgebenden Schilddrüsengewebe möglichst groß gewählt wurde (s. Abbildung 4). 17 Material und Methoden Abbildung 4: Arbeitsoberfläche am Hitachi Ascendus Ultraschallgerät bei der Erhebung der Strain-Ratio, bei welcher der komplette Knoten eingeschlossen wurde. Links ist das Elastogramm, rechts das herkömmliche B-Bild abgebildet, in welches nachträglich die Ausmaße des untersuchten Knotens eingetragen wurden (gelbe Linien). Das Gerät gibt die berechnete Strain-Ratio der durch den Untersucher gesetzten Regions of Interest A (Läsion) und B (Schilddrüse) an. Universitätsklinikum Ulm, 06/2013. 2.4.2 Toshiba Aplio 500 Die Elastografieuntersuchung am Toshiba Aplio 500 erfolgte analog zu der Untersuchung am HI VISION Ascendus im Programm „Elastografie“ (qualitative Elastografie) bzw. „Elasto-Q“ (semiquantitative Elastografie): Zur qualitativen Auswertung wurde im Programm „Elastografie“ des Gerätes ein Elastogramm im Querschnitt und eines im Längsschnitt erhoben. Im Unterschied zum HI VISION Ascendus wurde hier der periodisch applizierte Druck jedoch nicht in einer numerischen Skala angegeben, sondern dem Untersucher in einer „Zeit-relative Druckstärke-Kurve“ angezeigt. Um zwischen den untersuchten Patienten vergleichbare Bedingungen herzustellen, wurde bei der Auswahl der zur Auswertung herangezogenen Elastogramme darauf geachtet, den Zeitpunkt „im Tal“ der Kompressionskurve zu betrachten (s. Abbildung 5). 18 Material und Methoden Vom Untersucher wurde wiederum bewertet, wie eindeutig das Elastogramm einem der vier Elastografiescores zuzuordnen war, ob die Läsion mit Hilfe der Elastografie zum restlichen Gewebe besser abgrenzbar war als im B-Bild und wie gut die Elastogrammqualität war. Die semiquantitative Erhebung der Strain-Ratio-Werte erfolgte mit dem Programm „Elasto-Q“ ebenfalls wie beim HI VISION Ascendus im Querschnitt. Es wurden jeweils vier ROIs T in der Läsion ins Verhältnis zu einer ROI R im umgebenden Schilddrüsengewebe gesetzt und die Strain-Ratio-Werte aus dem Verhältnis R/T ermittelt. Im Verlauf der Datenerhebung kamen auch bei diesem Ultraschallgerät die beiden zusätzlichen Messungen wie beim Hitachi Ultraschallgerät hinzu. Abbildung 5: Arbeitsoberfläche am Toshiba Aplio 500 Ultraschallgerät bei der Erhebung der Strain-Ratio eines Schilddrüsenknotens im Querschnitt. Links ist das Elastogramm, rechts das herkömmliche B-Bild dargestellt, auf welchem nachträglich das Knotenausmaß eingezeichnet wurde (gelbe Linien). Die senkrechte weiße Linie zeigt den Messzeitpunkt im Zeit-Druck-Verlauf „im Tal“ an (weißer Pfeil). Das Gerät gibt die berechnete Strain-Ratio der durch den Untersucher gesetzten Regions of Interest T (Läsion) und R (Schilddrüse) an. Universitätsklinikum Ulm, 06/2013. 19 Material und Methoden 2.4.3 Siemens ACUSON S3000 Das Ultraschallgerät verwendet das Programm „Virtual Touch™ IQ“, um ein Elastogramm basierend auf der Acoustic Radiation Force Impulse (ARFI) Technologie zu erstellen. Bei dieser werden von der Ultraschallsonde durch einen akustischen Impuls Scherwellen generiert, die sich im Gewebe ausbreiten. Gleichzeitig werden sich kontinuierlich ausbreitende Detektionswellen in das Gewebe eingebracht, um die Lokalisation der Scherwellenfront festzustellen und durch die Zeitdifferenz zwischen der Aussendung der Scherwellen und ihrer Detektion die Ausbreitungsgeschwindigkeit der Scherwellen zu berechnen. Diese Scherwellengeschwindigkeiten werden vom Gerät zum einen als Farboverlay über dem B-Bild visualisiert und zum anderen in vom Untersucher festgesetzten ROIs in Meter pro Sekunde (m/s) angegeben. Sowohl die minimal als auch die maximal detektierbare Geschwindigkeit Scherwellengeschwindigkeitsskala kann vom eingestellt Untersucher werden. Liegen auf der gemessene Geschwindigkeitswerte ober- oder unterhalb des eingestellten Skalenbereiches, wird vom Gerät in den Messergebnissen Vs=HOCH bzw. Vs=TIEF angegeben. Die Ausbreitungsgeschwindigkeit der Scherwellen ist von der Gewebselastizität der Läsion abhängig: In weichem Gewebe breiten sich die Scherwellen langsamer, in hartem Gewebe schneller aus [72, 73]. Für die Datenerhebung wurde vom Untersucher zunächst eine große ROI definiert, die Anteile der Läsion und Anteile der Schilddrüse enthielt. Für diese ROI wurden vom Gerät nun mittels ARFI die Scherwellengeschwindigkeiten ermittelt und als Farboverlay präsentiert (s. Abbildung 6). 20 Material und Methoden Abbildung 6: Arbeitsoberfläche des Siemens Acuson S3000 Ultraschallgerätes bei der elastografischen Untersuchung eines Schilddrüsenknotens. Die Datenerhebung erfolgt im Querschnitt und einer Skalenkalibrierung von 0,5-6,5 Meter pro Sekunde (m/s). Die ersten acht ROIs erfassen die Scherwellengeschwindigkeit im Knoten, die anschließenden vier die Scherwellengeschwindigkeit im umgebenden Schilddrüsenparenchym. Universitätsklinikum Ulm, 06/2013. Für die Auswertung der grafischen Darstellung der Scherwellenelastografie teilte der Untersucher die Knoten anhand ihrer Darstellung im Elastogramm in vier Gruppen mit den dazugehörigen vier Elastografiescores (ES 1-4) ein, die für die vorliegende Arbeit von uns zuvor definiert worden waren. Die Farbskala am Siemens Gerät wurde so festgesetzt, dass langsame Scherwellengeschwindigkeiten und somit weiche Gewebe blau, mittlere Geschwindigkeiten und somit mittelharte Gewebe grün und gelb und schnelle Geschwindigkeiten und damit harte Gewebe rot dargestellt wurden. Diese Einteilung ist in Tabelle 2 und Abbildung 7 dargestellt. Tabelle 2: Einteilung der vier Elastografiegruppen, ihres mittleren Scherwellengeschwindigkeitsbereichs und ihrer Gewebebeschaffenheit für die Klassifikation der grafischen Darstellung der Scherwellengeschwindigkeit am Siemens Acuson S3000; Universitätsklinikum Ulm, 12/2012 - 06/2013. Mittlerer Gruppe Gewebebeschaffenheit Scherwellengeschwindigkeitsbereich (m/s) 1 0,5-2,0 Weich 2 2,0-3,5 Eher weich 3 3,5-5,0 Eher hart 4 5,0-6,5 Hart 21 Material und Methoden Abbildung 7: Schematische Darstellung des allgemeinen Erscheinungsbildes der Schilddrüsenknoten für die Elastografiescores (ES) 1 bis 4 am Siemens Acuson S3000. ES 1 stellt sich überwiegend blau, ES 2 gemischt blau-grün, ES 3 gemischt grün-gelb und ES 4 überwiegend rot dar. Universitätsklinikum Ulm, 12/2012 - 06/2013. Die grafische Darstellung ist beim Siemens Ultraschallgerät demnach anders als bei den Hitachi und Toshiba Ultraschallgeräten, bei welchen hartes Gewebe blau präsentiert wird. Die grafische Darstellung der Scherwellengeschwindigkeit wurde im Quer- und im Längsschnitt jeweils bei einer Skaleneinstellung von 0,5-6,5 m/s erhoben. Anschließend wurden vom Untersucher zwölf kleine ROIs, die bei diesem Verfahren eine vom Hersteller festgesetzte Größe von ca. 0,5 cm² haben, in die anfangs gesetzte, große ROI platziert: acht ROIs beliebig in die Läsion und vier ROIs beliebig in das umliegende Schilddrüsengewebe. Dies wurde im Längsschnitt für eine Skalenkalibrierung von 0,5-6,5 m/s und im Querschnitt für die Skalenkalibrierungen von 0,5-3,0 m/s, 0,5-6,5 m/s und 0,5-9,0 m/s durchgeführt. Hierfür wurde im Querschnitt kein neues Elastogramm generiert, sondern die Skaleneinstellung verändert und dann die insgesamt zwölf ROIs neu gesetzt. Das Siemens Ultraschallgerät gibt die ermittelte Scherwellengeschwindigkeit zusammen mit der Messtiefe in cm wie in Abbildung 6 gezeigt an. Zur Qualitätskontrolle der generierten Elastogramme wurde die geräteinterne Einstellung „Scherwellenqualität“ Ultraschallgerät in Abhängigkeit herangezogen. von Hierbei werden Scherwellenverschiebungshöhe vom und Rauschabstandsstufe unterschiedliche Bereiche des Elastogramms grün (gute Qualität), gelb (mittlere Qualität) und orange (schlechte Qualität) dargestellt [72]. Nur Elastogramme, deren grüner Flächenanteil mindestens 95% betrug, wurden in die Auswertung aufgenommen. 22 Material und Methoden 2.5 Pathologisches Gutachten Postoperativ wurden die vom Institut für Pathologie des Universitätsklinikums Ulm erstellten Gutachten eingeholt und die dort aufgeführte Diagnose der Läsion als Referenzkriterium übernommen. Die Diagnosen „Strumaknoten“, „follikuläres Adenom“ und „mikrofollikuläres Adenom“ wurden als benigne, das „papilläre Karzinom“ als maligner Knoten klassifiziert. Zusätzlich wurden aus diesen Gutachten entzündliche Veränderungen des umgebenden Schilddrüsenparenchyms ausgewertet. Hierbei wurde untersucht, ob eine Entzündung im umliegenden Gewebe vorlag und wenn ja, ob es sich bei dieser um eine chronische Entzündung oder um eine Entzündung im Rahmen einer Hashimoto-Thyreoiditis handelte. 2.6 Statistische Methoden Die erhobenen Daten wurden im Tabellenkalkulationsprogramm Microsoft Excel 14.0 und 15.0 (Microsoft Corporation, Redmond, Washington, USA) in eine Tabelle eingepflegt und die statistischen Berechnungen mit Hilfe der Statistiksoftware SAS 9.2 (SAS Institute Inc., Cary, North Carolina, USA) durchgeführt. Für stetige Merkmale wurden der Mittelwert, die Standardabweichung, der Median und der Wertebereich berechnet. Kategoriale Merkmale wurden mit absoluten und relativen Häufigkeiten dargestellt. Um Unterschiede hinsichtlich der Echogenität zwischen gesundem Schilddrüsengewebe, chronischer Thyreoiditis und Hashimoto-Thyreoiditis zu zeigen, wurde der Chi-Quadrat-Test angewendet. Um zwischen benignen und malignen Knoten Unterschiede aufzuzeigen wurde für stetige Variablen der Wilcoxon-Rangsummen-Test und für kategoriale Variablen der Chi-Quadrat-Test bzw. der Exakte Test nach Fisher bei zu kleinen Fallzahlen angewendet. Die grafischen Elastogramme wurden entsprechend ihrer farblichen Zusammensetzung in vier Gruppen eingeteilt. Die absoluten Häufigkeiten der einzelnen Gruppen wurden angegeben. Die Gruppen wurden in die Kategorien „benigne Knoten“ und „maligne Knoten“ unterteilt. Für den Vergleich der grafischen 23 Material und Methoden Elastografieuntersuchung der drei Geräte wurden anschließend die Sensitivitäten, Spezifitäten, positiven und negativen Vorhersagewerte bestimmt. Für die Strain-Ratio-Werte des Hitachi und Toshiba Ultraschallgerätes und für die Scherwellengeschwindigkeiten des Siemens Ultraschallgerätes wurden der Mittelwert, die Standardabweichung, der Median und der Wertebereich bestimmt. Um die elastografische Untersuchung mit Hilfe der Strain-Ratio-Werte und Scherwellengeschwindigkeiten der drei Ultraschallgeräte miteinander zu vergleichen, wurden die Cut-off-Punkte mittels der ROC-Analyse ermittelt. Anschließend wurden auch hier jeweils Sensitivität, Spezifität, positiver und negativer Vorhersagewert kalkuliert. Für einen Vergleich der Werte in Abhängigkeit von den einzelnen histologischen Befunden erfolgte die Berechnung mit Hilfe des Kruskal-Wallis-Tests. Bei den Scherwellengeschwindigkeitsmessungen Schilddrüsengewebes wurden Unterschiede im zwischen Bereich den des einzelnen Histopathologien der Schilddrüse ebenfalls mit Hilfe des Kruskal-Wallis-Tests untersucht. Zusätzlich wurden für die Scherwellengeschwindigkeiten in den unterschiedlichen Geweben bzw. Histopathologien jeweils die 95%-Intervalle der gemessenen Werte angegeben. Für alle statistischen Auswertungen wurden p-Werte kleiner 0,05 aus zweiseitigen Tests als signifikant angesehen. 2.7 Ethikvotum Die Studie wurde nach den Richtlinien der Deklaration von Helsinki und den GCPEmpfehlungen durchgeführt. Die Ethikkommission der Universität Ulm unter dem Vorsitz von Herrn Prof. Dr. H. Fangerau gab ein positives Votum für das Forschungsvorhaben (Zeichen 139/13 vom 10.06.2013) ab. Alle Studienteilnehmer willigten mündlich und schriftlich in die Studienteilnahme ein. 24 Material und Methoden 2.8 Multicenter-Studie Gleichzeitig mit der Datenerhebung für diese Arbeit wurden Daten für die Multicenter-Studie der Johann Wolfgang Goethe-Universität Frankfurt mit dem Titel „Multicenterstudie zur Evaluation der Realtime-Elastographie für die Differenzierung von Schilddrüsen-Knoten“ unter der Leitung von Privatdozent Dr. med. Jörg Bojunga der Medizinischen Klinik I erhoben und in eine Online-Maske eingepflegt. Insgesamt konnten für diese Studie 45 Patienten mit 55 Knoten rekrutiert und eingeschleust werden. 25 Ergebnisse 3 Ergebnisse 3.1 Geschlechts-, Alters- und Dignitätsverteilung im Gesamtund Endkollektiv 3.1.1 Deskriptive Analyse Im Gesamtkollektiv mit 52 Patienten befinden sich 17 Männer und 35 Frauen mit 𝑘𝑔 einem durchschnittlichen Alter von 52,1 Jahren und mittleren BMI-Wert von 27,1𝑚². Von den 69 insgesamt untersuchten Knoten weisen 63 eine als benigne und sechs eine als maligne klassifizierte Histopathologie auf. Das ausgewertete Endkollektiv mit 41 Patienten setzt sich aus 15 Männer und 26 Frauen zusammen. Das durchschnittliche Alter beträgt 51,5 Jahre, wobei die untere und die obere Grenze jeweils von einer Frau mit 22 bzw. 75 Jahren gebildet werden. 𝑘𝑔 Der durchschnittliche BMI-Wert beträgt 27,4𝑚². Von den 53 ins Endkollektiv eingebrachten Knoten sind 47 benigne und sechs maligne. Zwei der malignen Läsionen befinden sich in derselben Schilddrüse, sodass sich für die Anzahl der Patienten mit benigner Läsion n=36 und für die Anzahl der Patienten mit maligner Läsion n=5 ergeben. Die 47 benignen Knoten sind weiter untergliedert in 30 Knoten mit der Diagnose „Strumaknoten“, zehn Knoten mit der Diagnose „mikrofollikuläres Adenom“ und sieben Knoten mit der Diagnose „follikuläres Adenom“. Die sechs malignen Knoten sind papilläre Schilddrüsenkarzinome. Von den 41 sich im Endkollektiv befindenden Patienten weisen 26 eine Schilddrüse ohne entzündliche Veränderung, elf eine Schilddrüse mit chronischer Thyreoiditis und vier Patienten eine Hashimoto-Thyreoiditis auf. Abbildung 8 zeigt die Zusammensetzung der verschiedenen Kollektive. 26 Ergebnisse Abbildung 8: Gesamtkollektiv und Geschlecht der untersuchten Patienten, Gesamtanzahl und Dignität der untersuchten Schilddrüsenknoten. Nach Ausschluss unvollständiger Datensätze ausgewertetes Endkollektiv und Geschlecht der Patienten, Histologie der ausgewerteten Schilddrüsen, sowie Dignität und Histologie der ausgewerteten Schilddrüsenknoten. Universitätsklinikum Ulm, 12/2012 - 06/2013. 27 Ergebnisse 3.1.2 Bivariate Analyse der Läsionsdignitäten in Abhängigkeit von Patientenalter und -geschlecht Die Läsionsdignitäten in Abhängigkeit vom Patientenalter sind in Abbildung 9 gezeigt: Das Alter der Patienten mit diagnostizierter maligner Läsion liegt zwischen 23 und 52 Jahren. Es entfällt somit vollständig auf die jüngeren 3/5 des Endkollektivs. Abbildung 9: Absolute Anzahl der benignen (blau) und malignen Knoten (grau) in den unterschiedlichen Altersgruppen der Patienten im Endkollektiv. Universitätsklinikum Ulm, 12/2012 - 06/2013. Abbildung 10 stellt die Dignität der Läsion in Abhängigkeit vom Patientengeschlecht dar. Es zeigt sich folgende Verteilung: Fünf der insgesamt 38 bei Frauen untersuchten Knoten waren maligne, was einem Prozentanteil von 13,2% entspricht. Bei den Männern war einer der 15 untersuchten Knoten maligne, was einem Prozentanteil von 6,7% entspricht. In dieser Stichprobe sind Frauen etwa doppelt so häufig von einem papillären Schilddrüsenkarzinom betroffen wie Männer. Abbildung 10: Absolute Anzahl der benignen (blau) und malignen Knoten (grau) getrennt für weibliche und männliche Patienten im Endkollektiv. Universitätsklinikum Ulm, 12/2012 06/2013. 28 Ergebnisse 3.2 B-Bild-Kriterien der Schilddrüse deskriptiv und bivariat 3.2.1 Schilddrüsenvolumen Das mittlere Volumen der kompletten Schilddrüse beträgt im untersuchten Kollektiv 50,8 ml, wobei das Volumen des rechten Lappens durchschnittlich bei 25,8 ml und das des linken Schilddrüsenlappens durchschnittlich bei 24,9 ml liegen. Abbildung 11 zeigt die Auffälligkeit der Schilddrüsenvolumina: Das mittlere Volumen der Schilddrüsen mit malignen Läsionen (n=5) ist im Vergleich zum mittleren Volumen der Schilddrüsen mit benignen Läsionen (n=36) deutlich kleiner. So beträgt der Mittelwert der Schilddrüsenvolumina mit benigner Läsion 54,5 ml (100%), der Mittelwert der Schilddrüsenvolumina mit maligner Läsion 23,6 ml (43,3%). Dies entspricht einem Unterschied von 56,7%. Der p-Wert beträgt p=0,1202 und ist damit nicht signifikant, d.h. dass in dieser Arbeit zwar ein deutlicher Volumenunterschied festgestellt wird, dieser jedoch nicht ausreicht, um die in den Schilddrüsen liegenden Läsionen einer Dignität zuzuordnen (s. Tab. 17 im Anhang). Abbildung 11: Boxplot der Gesamtvolumina der Schilddrüsen in Milliliter (ml) für die Gruppe der Schilddrüsen mit mindestens einer benignen Läsion, mit mindestens einer malignen Läsion und die Gesamtanzahl der Schilddrüsen mit Angabe der jeweiligen Fallzahl (n). Ausreißer sind oberhalb der Volumenskala als Punkt mit der entsprechenden Volumenangabe dargestellt. Ausgewertet ist das Endkollektiv. ӿ markiert den jeweiligen Mittelwert, ‒ den jeweiligen Median. Universitätsklinikum Ulm, 12/2012 - 06/2013. 29 Ergebnisse 3.2.2 Echogenität und Echotextur der Schilddrüse Die Echogenität der Schilddrüse ist in 38 Schilddrüsen echonormal, in zwei Schilddrüsen echoarm und in einer Schilddrüse echoreich. Alle Schilddrüsen mit maligner Läsion sind echonormal. Die Verteilung der Schilddrüse nach Echogenität und histopathologischer Diagnose ist in Tabelle 3 gezeigt. Tabelle 3: Verteilung der absoluten Anzahlen der Schilddrüsen entsprechend ihrer Histopathologie und ihrer im B-Bild ermittelten Echogenität im Endkollektiv. Der p-Wert zur Differenzierung der Histopathologie anhand der Echogenität ist aufgeführt. In Klammern steht die Fallzahl der jeweiligen Gruppe (n). Universitätsklinikum Ulm, 12/2012 - 06/2013. Histopathologie der Schilddrüse Echogenität der Schilddrüse Gesundes Chronische Hashimoto- Schilddrüsengewebe Thyreoiditis Thyreoiditis (n=26) (n=11) (n=4) 25 10 3 Echoreich (n=1) 0 0 1 Echoarm (n=2) 1 1 0 Echonormal (n=38) pWert 0,2908 Die Echotextur ist in 32 der Schilddrüsen homogen, in neun Schilddrüsen inhomogen. Alle Schilddrüsen mit maligner Läsion weisen eine homogene Echotextur auf. Die neun inhomogenen Schilddrüsen gliedern sich bezüglich ihrer Pathologie der Schilddrüse wie folgt auf: Sechs haben keine entzündliche Veränderung, in zwei Schilddrüsen liegt eine Hashimoto-Thyreoiditis vor und in einer Schilddrüse eine chronische Thyreoiditis. Alle malignen Läsionen finden sich folglich in morphologisch unauffälligen, da homogenen und echonormalen Schilddrüsen. 30 Ergebnisse 3.2.3 Knotenanzahl in der Schilddrüse Für jeden Patienten wird die Gesamtanzahl der Knoten in der Schilddrüse ermittelt. In der Betrachtung wird zum einen die Gruppe der Patienten mit ausschließlich benignen Läsionen und zum anderen die Gruppe der Patienten, die mindestens eine maligne Läsion in ihrer Schilddrüse aufweisen, unterschieden. Die Verteilung ist in Abbildung 12 dargestellt: Alle Patienten, die eine maligne Läsion in ihrer Schilddrüse aufweisen, haben zusätzlich zu dieser noch mindestens eine benigne Läsion, d.h. dass keiner der malignen Knoten solitär in der Schilddrüse auftritt. Abbildung 12: Verteilung der absoluten Patientenanzahl nach der Gesamtanzahl der im B-Bild in ihrer Schilddrüse festgestellten Knoten. Ausgewertet ist das Endkollektiv. Patienten mit ausschließlich benignen Knoten sind blau, Patienten mit mindestens einer malignen Läsion sind grau dargestellt. Universitätsklinikum Ulm, 12/2012 - 06/2013. 31 Ergebnisse 3.3 B-Bild Kriterien der Läsion deskriptiv und bivariat 3.3.1 Maße, Lage und sonografische Merkmale der Läsion Die B-Bild-Kriterien der Läsionen (n=53) werden in Tabelle 4 und 5 getrennt für Läsionen mit benigner und maligner Histopathologie, sowie für die Gesamtanzahl dargestellt. Hier zeigt sich für kein Kriterium ein signifikanter Unterschied zwischen benignen und malignen Knoten. Tabelle 4: Mittelwert, Standardabweichung (STD), Median und Wertebereich der im B-Bild erhobenen Knotenmaße in Millimeter (mm) beziehungsweise Milliliter (ml) aufgeführt nach benigner Histopathologie, maligner Histopathologie und der Gesamtanzahl der Knoten im Endkollektiv. Die Fallzahl der jeweiligen Gruppe ist in Klammern (n) angegeben. Für jedes BBild-Kriterium ist der p-Wert für die Differenzierung der Histopathologien angegeben. Universitätsklinikum Ulm, 12/2012 - 06/2013. Benigne Maligne Gesamtanzahl Knoten (n=47) Knoten (n=6) (n=53) Mittelwert ± STD; Median (Wertebereich) Länge (mm) Breite (mm) Knotenmaße Tiefe (mm) Volumen (ml) Verhältnis Tiefe Breite zu 31,1 ± 16,5 31,2 ± 18,7 31,1 ± 16,5 26,6 (10,9-78,1) 26,7 (14,9-66,2) 26,6 (10,9-78,1) 26,0 ± 15,5 20,5 ± 9,4 25,4 ± 15,0 24,6 (7,0-88,8) 17,1 (13,5-38,6) 22,7 (7,0-88,8) 20,0 ± 10,5 14,7 ± 5,1 19,4 ± 10,2 18,8 (6,9-54,3) 13,5 (8,6-21,0) 17,4 (6,9-54,3) 20,4 ± 35,7 9,4 ± 14,3 19,2 ± 34,0 7,9 (0,4-209,9) 4,6 (1,2-38,2) 7,6 (0,4-209,9) 0,8 ± 0,2 0,8 ± 0,3 0,8 ± 0,2 0,8 (0,5-1,3) 0,7 (0,5-1,3) 0,8 (0,5-1,3) p-Wert 1,0 0,5841 0,3258 0,4569 0,3470 32 Ergebnisse Tabelle 5: Absolute Anzahl und relativer Anteil der Knoten bezüglich der folgenden im B-Bild erhobenen Charakteristika: Form, Lage, Echogenität, Homogenität, Vorhandensein von Mikro- und Makrokalzifizierungen, Randbeschaffenheit und Vorhandensein des HaloZeichens des Knotens, aufgeführt für die Knoten mit benigner und maligner Histopathologie, sowie die Gesamtanzahl der Knoten. Ausgewertet ist das Endkollektiv mit Angabe der Fallzahl der einzelnen Gruppen in Klammern (n). Für jedes Charakteristikum ist der p-Wert für die Differenzierung der Histopathologien angegeben. Universitätsklinikum Ulm, 12/2012 06/2013. Benigne Knoten Maligne Knoten Gesamtanzahl (n=47) (n=6) (n=53) Absolute Anzahl (relativer Anteil) Knotenform rund p-Wert 5 (10,6%) 28 (59,6%) 14 (29,8) 0 (0%) 3 (50,0%) 3 (50,0%) 5 (9,4%) 31 (58,5%) 17 (32,1%) 0,8136 24 (51,1%) 17 (36,2%) 5 (10,6%) 0 (0%) 1 (2,1%) 3 (50,0%) 2 (33,3%) 0 (0%) 1 (16,7%) 0 (0%) 27 (50,9%) 19 (35,9%) 5 (9,4%) 1 (1,9%) 1 (1,9%) 0,2910 25 (53,2%) 4 (8,5%) 14 (29,8%) 1 (16,7%) 2 (33,3%) 3 (50,0%) 26 (49,1%) 6 (11,3%) 17 (32,1%) 4 (8,5%) 0 (0%) 4 (4,5%) 1 (2,1%) 46 (97,9%) 1 (16,7%) 5 (83,3%) 2 (3,8%) 51 (96,2%) 0,2155 23 (48,9%) 24 (51,1%) 4 (66,7%) 2 (33,3%) 27 (50,9%) 26 (49,1%) 0,6687 Vorhanden 12 (25,5%) 35 (74,5%) 4 (66,7%) 2 (33,3%) 16 (30,2%) 37 (69,8%) 0,0602 Rand regelmäßig 23 (48,9%) 3 (50,0%) 26 (49,1%) unregelmäßig 24 (51,1%) 3 (50,0%) 27 (50,9%) 6 (12,8%) 21 (44,7%) 20 (42,6%) 0 (0%) 4 (66,7%) 2 (33,3%) 6 (11,3%) 25 (47,2%) 22(41,5%) oval polyzyklisch Lage des Knotens Re vorwiegend Li vorwiegend Isthmus Re + Isthmus Li + Isthmus Knoten Echogenität echokomplex echonormal echoarm echoreich 0,2302 Knoten Homogenität homogen inhomogen Makrokalzifizierung Nicht vorhanden Vorhanden Mikrokalzifizierung Nicht vorhanden 1,0 Halo-Zeichen nein ja unvollständig 0,7069 33 Ergebnisse 3.3.2 Durchblutung der Läsion im Color-Doppler-Modus In allen Läsionen konnte eine Durchblutung festgestellt werden, daher fällt das Muster 0 (keine Durchblutung) aus der Darstellung heraus. Bei der Zuordnung der Läsion zu einem der vier Durchblutungsmuster ergibt sich die in Abbildung 13 gezeigte Verteilung. Es zeigt sich, dass Muster 3 am häufigsten beobachtet wird, dass das Muster 1 und somit die geringste intranoduläre Durchblutung nie einer malignen Läsion zugeordnet ist und, dass der größte Anteil der malignen Läsionen das Muster 4 und somit eine starke intranoduläre Durchblutung aufweist. Untersuchung die Mit zunehmender Wahrscheinlichkeit Durchblutung für eine steigt maligne in dieser Läsion. Durchblutungsmuster Typ 3, was einer eher stärkeren Durchblutung entspricht, wird bei benignen Knoten insgesamt am häufigsten beobachtet. Der p-Wert für die Unterscheidung zwischen benignen und malignen Knoten anhand ihres Durchblutungsmusters ist mit 0,5930 nicht signifikant. Abbildung 13: Absolute Knotenanzahl der im Color-Doppler-Modus ermittelten Durchblutungsmuster 1 bis 4, aufgeführt für benigne (blau) und maligne (grau) Knoten des Endkollektivs. Die graue Linie stellt die lineare Trendlinie der malignen Knoten dar. Universitätsklinikum Ulm, 12/2012 - 06/2013. Untergliedert man nur die Gruppe der benignen Läsionen weiter in die drei Histopathologien „Strumaknoten“, „follikuläres Adenom“ und „mikrofollikuläres Adenom“ und teilt sie den Durchblutungsmustern zu, zeigt sich die in Abbildung 14 dargestellte Verteilung. 34 Ergebnisse Abbildung 14: Prozentualer Anteil der Vaskularisationsmuster 1 bis 4 an den drei benignen Histopathologien der Läsionen: Strumaknoten, Follikuläres Adenom und Mikrofollikuläres Adenom. Dunkelblau repräsentiert das Vaskularisationsmuster 1, hellblau das Vaskularisationsmuster 2, grau das Vaskularisationsmuster 3 und weiß das Vaskularisationsmuster 4. In den Balken der drei histopathlogischen Diagnosen sind die absoluten Anzahlen der Knoten mit dieser Histopathologie und dem entsprechenden Vaskularisationsmuster aufgeführt, ausgewertet ist das Endkollektiv. Universitätsklinikum Ulm, 12/2012 - 06/2013. Es zeigt sich in dieser Untergliederung der benignen Knoten keine besondere Verteilung der Durchblutungsmuster, was bedeutet, dass sich die Knoten aufgrund ihrer Durchblutung nicht genauer einer Histopathologie zuordnen lassen. Der p-Wert für die Durchblutungsmuster der Gesamtzahl der benignen Läsionen beträgt 0,1934 und ist somit nicht signifikant. 35 Ergebnisse 3.3.3 Einteilung der Läsion nach TIRADS-Klassifikation Alle Läsionen werden entsprechend ihrer Morphologie im B-Bild einer Thyroid Imaging Reporting and Data System (TIRADS) Kategorie zugeteilt. Diese Verteilung ist in Abbildung 15 getrennt für benigne und maligne Knoten dargestellt. Abbildung 15: Absolute Knotenanzahl in den Thyroid Imaging Reporting and Data System (TIRADS) Kategorien 2, 3, 4a und 4b, 5A, B und 5C aufgeführt für benigne (blau) und maligne (grau) Knoten des Endkollektivs. Kategorie 3 und 5B enthält keine malignen Knoten, Kategorie 5A und 5B sind keine Knoten zugeteilt. Universitätsklinikum Ulm, 12/2012 - 06/2013. Den TIRADS-Kategorien 5A und 5C werden in dieser Arbeit keine Läsionen zugeteilt. Für die Malignitätswahrscheinlichkeiten der Knoten in den einzelnen Kategorien ergeben sich in dieser Arbeit die in Tabelle 6 aufgeführten Werte. Tabelle 6: Darstellung der in dieser Arbeit berechneten Malignitätswahrscheinlichkeiten in Prozent (%) in den einzelnen Thyroid Imaging Reporting and Data System (TIRADS) Kategorien des Endkollektivs. Da Kategorie 5A und 5C keine Knoten zugeteilt wurden, entfällt die Berechnung der Malignitätswahrscheinlichkeit für diese Kategorien. Universitätsklinikum Ulm, 12/2012 - 06/2013. TIRADS-Kategorie Berechnete Malignitätswahrscheinlichkeit (%) 2 7,7 3 0,0 4a 28,6 4b 16,7 5A Entfällt 5B 0,0 5C Entfällt 36 Ergebnisse 3.4 Grafische Darstellung der Kompressions- und Scherwellenelastografie Zunächst wird die Verteilung der Läsionen nach Elastografiefarbklassifikation für jedes der drei Ultraschallgeräte aufgeführt. Im Anschluss daran werden die erreichten Sensitivitäten, Spezifitäten, positiven und negativen Vorhersagewerte und p-Werte der Geräte miteinander verglichen. 3.4.1 Hitachi HI VISION Ascendus Mit Hilfe der Elastografie sind nur 6,7% der benignen Läsionen und keine (0%) der malignen Läsionen subjektiv besser vom umgebenden Schilddrüsengewebe abgrenzbar als das im B-Bild möglich ist (Gesamt 5,7%). Gleich gut abgrenzbar sind 29,8% der benignen und 66,7% der malignen Läsionen (Gesamt 34,0%). Schlechter abgrenzbar sind 63,8% der benignen und 33,3% der malignen Läsionen (Gesamt 60,4%). Der Elastografiemodus des Ultraschallgerätes ist in der überwiegenden Anzahl der Fälle nicht geeignet, um die Läsion besser vom umgebenden Gewebe abzugrenzen. Die Knoten werden im Querschnitt und im Längsschnitt anhand ihrer Farbzusammensetzung einem der vier Elastografiescores (ES) zugewiesen. Diese Einteilung ist in Abbildung 16 gezeigt. Abbildung 16: Absolute Knotenanzahl in den 4 Elastografiescores (ES) bei der Erhebung der farblichen Elastogramme am Hitachi HI VISION Ascendus Ultraschallgerät für das Endkollektiv. Die Einteilung der Knoten zu den Elastografiescores ist getrennt für benigne und maligne Knoten (dunkelblau und grau) im Querschnitt (QS) und für benigne und maligne Knoten (hellblau und weiß) im Längsschnitt (LS) aufgeführt. Universitätsklinikum Ulm, 12/2012 - 06/2013. 37 Ergebnisse Die Wahrscheinlichkeit für eine maligne Läsion nimmt mit dem Anteil ihrer blau abgebildeten Fläche zu. Fast man Querschnitt und Längsschnitt zusammen, so beträgt die Wahrscheinlichkeit für Malignität in der homogen grünen Gruppe (ES 1) 0%, in der Gruppe mit überwiegend grüner Fläche (ES 2) 6,8 %, in der Gruppe mit überwiegend blauer Fläche (ES 3) 11,1 % und in der Gruppe mit homogen blauer Fläche (ES 4) 42,9%. Im Vergleich sind alle Läsionen im Längsschnittelastogramm durchschnittlich mit einem höheren Anteil an blauer Fläche abgebildet als im Querschnitt. 38 Ergebnisse 3.4.2 Toshiba Aplio 500 Die Abgrenzung der Läsion gegenüber dem umliegenden Schilddrüsenparenchym ist im Elastografiemodus bei keiner Läsion besser als im B-Bild, in 27,7% der benignen und 16,7% der malignen Läsionen gleich gut (Gesamt 26,4%) und in 72,3% der benignen und 83,3% der malignen Läsionen schlechter (Gesamt 73,6%). Der Elastografiemodus des Ultraschallgerätes kommt somit nicht für eine Differenzierung zwischen Läsion und umgebenden Parenchym in Betracht. Abbildung 17 zeigt die Anzahl der Läsionen in den vier Elastografiescores getrennt für Läsionen mit benigner und maligner Histopathologie für die Datenerhebung im Querschnitt und im Längsschnitt. Als homogen grün (ES 1) stellt sich keine Läsion in der Elastografie dar. Durchschnittlich sind die Läsionen im Längsschnitt mit einem höheren Anteil an blauer Fläche im Elastogramm abgebildet. Die Wahrscheinlichkeit, dass eine Läsion in der entsprechenden Kategorie maligne ist, ist in der Gruppe mit homogen blauer Fläche (Elastografiescore 4) mit 22,2% am größten, die Wahrscheinlichkeit in der Gruppe mit Elastografiescore 2 (überwiegend grün mit blauen Anteilen) beträgt 10,0% und in der Gruppe mit Elastografiescore 3 (überwiegend blau mit grünen Anteilen) 8,3%. Die Wahrscheinlichkeit steigt dementsprechend nicht kontinuierlich mit der Zunahme des blauen Flächenanteils an, ist jedoch bei vollständig blauer Fläche am größten. Abbildung 17: Absolute Knotenanzahl in den 4 Elastografiescores (ES) bei der Erhebung der farblichen Elastogramme am Toshiba Aplio 500 Ultraschallgerät für das Endkollektiv. Die Einteilung der Knoten zu den Elastografiescores ist getrennt für benigne und maligne Knoten (dunkelblau und grau) im Querschnitt (QS) und für benigne und maligne Knoten (hellblau und weiß) im Längsschnitt (LS) aufgeführt. Universitätsklinikum Ulm, 12/2012 - 06/2013. 39 Ergebnisse 3.4.3 Siemens Acuson S3000 Alle Werte für die grafische Darstellung der Scherwellenelastografie werden für das Siemens Acuson S3000 im Quer- bzw. Längsschnitt bei einer Skalenkalibrierung von 0,5-6,5 m/s erfasst. Die Abgrenzbarkeit der Läsion vom restlichen Schilddrüsengewebe ist im Elastografiemodus deutlich schlechter als im herkömmlichen B-Bild: Lediglich eine Läsion, die histopathologisch maligne ist, lässt sich besser abgrenzen (Gesamt 1,9%), gleich gut abgrenzen lassen sich 19,2% der benignen und 33,3% der malignen Läsionen (Gesamt 20,8%) und schlechter abgrenzen lassen sich 80,9% der benignen und 50,0% der malignen Läsionen (Gesamt 77,3%). Die Verteilung der grafischen Elastogrammauswertung ist in Abbildung 18 für die Erhebung im Quer- und Längsschnitt gezeigt. 86,1 % der gutartigen Knoten weisen eine gemischt blau-grüne oder grün-gelbe (ES 2 und 3) Farbkomposition auf. Die Wahrscheinlichkeit, dass eine Läsion in einer bestimmten Farbgruppe maligne ist, ist in der Gruppe mit überwiegend roter Fläche (ES 4) mit 40% am größten, beträgt jedoch auch in der der Gruppe mit Elastografiescore 1 beachtliche 23,1%. Abbildung 18: Absolute Knotenanzahl in den 4 Elastografiescores (ES) bei der Erhebung der farblichen Elastogramme am Siemens Acuson S3000 Ultraschallgerät für das Endkollektiv. Die Einteilung der Knoten zu den Elastografiescores ist getrennt für benigne und maligne Knoten (dunkelblau und grau) im Querschnitt (QS) und für benigne und maligne Knoten (hellblau und weiß) im Längsschnitt (LS) aufgeführt. Universitätsklinikum Ulm, 12/2012 06/2013. 40 Ergebnisse 3.4.4 Vergleich der grafischen Darstellung der Elastografie der drei Ultraschallgeräte Im Vergleich der Abgrenzbarkeit von Knoten zu umliegendem Schilddrüsengewebe ist der Elastografiemodus an allen drei Ultraschallgeräten in der Mehrheit der Fälle schlechter geeignet als das normale B-Bild. Am ehesten trägt hier noch der Elastografiemodus des Hitachi HI VISION Ascendus zu einer besseren Abgrenzung bei, jedoch auch nur in 5,7% der Fälle. Um die Vorhersagekraft der qualitativen Elastografie zu testen, erfolgt am Hitachi HI VISION Ascendus und am Toshiba Aplio 500 eine Zuordnung der Knoten der Farbklassifikation „homogen grün“ und „überwiegend grün mit blauen Anteilen“ zur Kategorie benigne und Knoten der Farbklassifikation „homogen blau“ und „überwiegend blau mit grünen Anteilen“ zur Kategorie maligne. Analog dazu erfolgt beim Siemens Acuson S3000 die Einteilung der Knoten der Kategorie „überwiegend blau“ und „gemischt blau-grün“ zur Gruppe benigne und die Knoten der Kategorie „gemischt grün-gelb“ sowie „überwiegend rot“ zur Gruppe maligne. Die so berechneten Sensitivitäten, Spezifitäten, positiver und negativer Vorhersagewert, sowie die p-Werte sind in Tabelle 7 gegenübergestellt. Tabelle 7: Diagnostische Werte (Sensitivität, Spezifität, Positiver Vorhersagewert, Negativer Vorhersagewert) der grafischen Darstellung der Elastografie der drei Ultraschallgeräte: Hitachi HI VISION Ascendus, Toshiba Aplio 500, Siemens Acuson S3000 für die Differenzierung zwischen benignen und malignen Knoten in Prozent. Ausgewertet ist das Endkollektiv. Aufgeführt sind die Werte für die Elastogrammerhebung im Querschnitt (QS) und Längsschnitt (LS). In der letzten Zeile findet sich der p-Wert des entsprechenden Gerätes und der Schnittebene für die Differenzierung zwischen benignen und malignen Knoten. Universitätsklinikum Ulm, 12/2012 - 06/2013. Ultraschallgerät Hitachi Toshiba Siemens Schnittebene QS LS QS LS QS LS Sensitivität (%) 66,7 83,3 66,7 66,7 66,7 50 Spezifität (%) 48,9 40,4 44,7 31,9 68,1 70,2 14,3 15,2 13,3 11,1 21,1 17,7 92,0 95,0 91,3 88,2 94,1 91,7 0,6718 0,3904 0,6868 1,0 0,1717 0,3717 Positiver Vorhersagewert (%) Negativer Vorhersagewert (%) p-Wert 41 Ergebnisse Die mit Abstand höchste Sensitivität erreicht das Hitachi HI VISION Ascendus im Längsschnitt mit 83,3 %. Die beste Kombination aus Sensitivität und Spezifität ergibt sich für die Erhebung im Querschnitt beim Siemens Acuson S3000 mit 66,7% und 68,1%. Keines der drei Geräte erreicht einen signifikanten p-Wert, was bedeutet, dass kein Gerät in diesem Setting in der grafischen Darstellung der Elastografie geeignet ist, um zwischen benignen und malignen Knoten zu unterscheiden. 42 Ergebnisse 3.5 Semiquantitative Kompressionselastografie und numerische Darstellung der Scherwellenelastografie 3.5.1 Hitachi HI VISION Ascendus Das durchschnittliche Dehnungsverhältnis von benignen Läsionen beträgt 10,7 mit einer Standardabweichung von ±15,2, von malignen Läsionen 6,5 mit einer Standardabweichung von ±7,0. Der p-Wert zur Unterscheidung zwischen benigner und maligner Läsion beträgt p=0,8552 und ist somit nicht signifikant. In diese Berechnungen geht nun jeweils der Mittelwert der vier erhobenen Strain-RatioWerte eines Knoten ein. Beim Vergleich der Strain-Ratio-Werte getrennt für die histopathologischen Befunde ergibt sich ein nicht signifikanter p-Wert von 0,7153 (s. Tabelle 8). Erstaunlicherweise findet sich in der Gruppe der papillären Schilddrüsenkarzinome der zweitkleinste Mittelwert. Niedrige Werte sprechen für eine elastische und somit tendenziell benigne Läsion. Tabelle 8: Mittelwert, Standardabweichung (STD), Median und Wertebereich der am Hitachi HI VISION Ascendus Ultraschallgerät erhobenen Strain-Ratio-Werte für das Endkollektiv, aufgeführt nach den unterschiedlichen histopathologischen Knotenbefunden, sowie für die Gruppe der benignen Knoten zusammen. In Klammern ist die jeweilige Fallzahl der Gruppe aufgeführt (n). In der letzten Spalte sind die p-Werte für die Differenzierung der Histopathologien anhand ihrer Strain-Ratio-Werte aufgeführt. Universitätsklinikum Ulm, 12/2012 - 06/2013. Histopathologie des Knotens Strain-Ratio Mittelwert ± STD Median (Wertebereich) Strumaknoten (n=30) Follikuläres Adenom (n=7) Mikrofollikuläres Adenom (n=10) 12,1 ± 16,8 4,2 (0,1-75,8) 12,1 ± 16,2 2,9 (1,7-39,6) 5,8 ± 8,0 2,2 (0,9-27,0) 10,7 ± 15,2 3,2 (0,1-75,8) Papilläres Karzinom (n=6) p-Wert 0,7153 6,5 ± 7,0 3,1 (0,6-18,1) 0,8552 Da im Laufe der Studie eine zusätzliche Erhebung der Strain-Ratio auf gleicher Höhe des Knotens und des Schilddrüsenparenchyms mit in das Studienprotokoll aufgenommen wurde, schließt sich hier eine Berechnung mit ausschließlich diesen Strain-Ratio-Werten an. 43 Ergebnisse Die Verteilung der Strain-Ratio-Werte der benignen und malignen Knoten ist in Abbildung 19 gezeigt. Es erfolgt ein Ausschluss von Werten, die größer als zehn (n=8) waren. Abbildung 19: Strain-Ratio-Werte der benignen und malignen Knoten, die auf gleicher Höhe wie das umgebende Schilddrüsenparenchym gemessen sind, am Hitachi HI VISION Ultraschallgerät. Die gepunktete graue Linie markiert den Strain-Ratio-Wert von zehn. Für Werte oberhalb dieser Linie ist der Strain-Ratio-Wert mitangegeben. Sie wurden aus der Analyse ausgeschlossen. Drei Werte oberhalb des maximalen Skalenwertes von 45 wurden außerhalb des Diagrammbereichs übereinander dargestellt. Universitätsklinikum Ulm, 12/2012 - 06/2013. Für die Fallzahl der benignen Knoten ergibt sich n=36 und für die der malignen Knoten n=5. Aufgrund der relativ kleinen Fallzahl wird nunmehr nur die Gesamtzahl der benignen Knoten betrachtet. Die berechneten Werte für diese Subgruppe sind in Tabelle 9 aufgeführt. Es zeigt sich, dass der berechnete p-Wert für diese Subanalyse signifikant ist. 44 Ergebnisse Tabelle 9: Mittelwert, Standardabweichung (STD), Median und Wertebereich der am Hitachi HI VISION Ascendus Ultraschallgerät auf gleicher Höhe erhobenen Strain-Ratio-Werte, aufgeführt nach benigner und maligner Dignität des Knotens. In Klammern ist die jeweilige Fallzahl der Gruppe aufgeführt (n). In der letzten Spalte steht der für die Differenzierung der Dignität anhand der Strain-Ratio ermittelte signifikante p-Wert. Universitätsklinikum Ulm, 12/2012 - 06/2013. Dignität des Knotens Benigne Knoten Maligne Knoten (n= 36) (n=5) 2,5 ± 1,8 4,1 ± 1,8 2,0 (0,04-7,7) 3,6 (2,2-6,6) p-Wert Strain-Ratio Mittelwert ± STD; Median 0,0462 (Wertebereich) Letztendlich wurde im Verlauf der Erhebung noch der Einschluss des kompletten Knotens mit in das Studienprotokoll aufgenommen. Dies erfolgte nur bei benignen Knoten (n=21). Mittelwert, Standardabweichung, Median und Wertebereich der Strain-Ratio dieser Knoten sind: 2,5 ± 1,6, 2,0 (0,2-5,8). Ein Strain-Ratio-Wert, der größer als zehn war, wurde aus der Berechnung ausgeschlossen. 45 Ergebnisse 3.5.2 Toshiba Aplio 500 Die durchschnittliche Strain-Ratio beträgt in benignen Läsionen 6,4 mit einer Standardabweichung von ±7,3, in malignen Läsionen 2,7 mit einer Standardabweichung von ±1,5. In diese Berechnung geht nun jeweils der Mittelwert der vier erhobenen Strain-Ratio-Werte eines Knoten ein. Der p-Wert zur Unterscheidung benigner und maligner Läsionen beträgt p=0,1909 und ist somit nicht signifikant. Ebenfalls ist der p-Wert für die Unterscheidung der einzelnen histopathologischen Diagnosen der Läsionen mit p=0,5557 nicht signifikant (s.Tab. 10). Den kleinsten Mittelwert für die Strain-Ratio erhält man in der Gruppe der Karzinome. Dies bedeutet, dass bei diesen die höchste Elastizität gemessen wird. Tabelle 10: Mittelwert, Standardabweichung (STD), Median und Wertebereich der am Toshiba Aplio 500 Ultraschallgerät erhobenen Strain-Ratio-Werte für das Endkollektiv, aufgeführt nach den unterschiedlichen histopathologischen Knotenbefunden, sowie für die Gruppe der benignen Knoten zusammen. In Klammern ist die jeweilige Fallzahl der Gruppe aufgeführt (n). In der letzten Spalte sind die p-Werte für die Differenzierung der Histopathologien anhand ihrer Strain-Ratio-Werte aufgeführt. Universitätsklinikum Ulm, 12/2012 - 06/2013. Histopathologie des Knotens Strain-Ratio Mittelwert ± STD; Median (Wertebereich) Strumaknoten Follikuläres Mikrofollikuläres Papilläres (n=30) Adenom (n=7) Adenom (n=10) Karzinom (n=6) 5,2 ± 10,4 1,8 (0,1-34,7) 2,7 ± 1,5 6,9 ± 7,4 3,4 (0,2-30,1) 6,1 ± 6,2 2,3 (1,9-17,9) 6,4 ± 7,8 2,8 (0,1-34,7) p-Wert 0,3617 2,9 (0,9-4,6) 0,5276 Auch bei der Erhebung der Daten am Toshiba Ultraschallgerät wurde im Verlauf der Studie eine zusätzliche Erhebung mit in das Untersuchungsprotokoll aufgenommen: Die Messung der Strain-Ratio auf gleicher Höhe von Knoten und Schilddrüse. Es folgt daher eine Berechnung der statistischen Maßzahlen mit diesen Strain-RatioWerten unter Ausschluss von Werten, die größer als zehn (n=5) sind. Die Verteilung der Strain-Ratio-Werte der benignen und malignen Knoten ist in Abbildung 20 gezeigt. 46 Ergebnisse Abbildung 20: Strain-Ratio-Werte der benignen und malignen Knoten, die auf gleicher Höhe wie das umgebende Schilddrüsenparenchym gemessen sind, am Toshiba Aplio 500 Ultraschallgerät. Die gepunktete graue Linie markiert den Strain-Ratio-Wert von zehn. Für Werte oberhalb dieser Linie ist der Strain-Ratio-Wert angegeben. Sie wurden aus der Analyse ausgeschlossen. Zwei Werte oberhalb des maximalen Skalenwertes von 25 wurden außerhalb des Diagrammbereichs übereinander dargestellt. Universitätsklinikum Ulm, 12/2012 - 06/2013. Für die Fallzahl der benignen Knoten ergibt sich n=33 und für die der malignen Knoten n=5. Aufgrund der relativ kleinen Fallzahl wird nunmehr nur die Gesamtzahl der benignen Knoten betrachtet. In Tabelle 11 finden sich die berechneten Werte. Tabelle 11: Mittelwert, Standardabweichung (STD), Median und Wertebereich der am Toshiba Aplio 500 Ultraschallgerät auf gleicher Höhe erhobenen Strain-Ratio-Werte, aufgeführt nach benigner und maligner Dignität des Knotens. In Klammern ist die jeweilige Fallzahl der Gruppe aufgeführt (n). In der letzten Spalte steht der für die Differenzierung der Dignität anhand der Strain-Ratio ermittelte p-Wert. Universitätsklinikum Ulm, 12/2012 - 06/2013. Dignität des Knotens Strain-Ratio Mittelwert ± STD; Median (Wertebereich) Benigne Knoten (n=33) Maligne Knoten (n=5) 3,2 ± 2,3 3,2 ± 1,9 2,7 (0,03-8,86) 2,5 (1,12-5,62) p-Wert 0,8342 47 Ergebnisse Letztendlich wurde im Verlauf der Datenerhebung am Toshiba Ultraschallgerät ebenfalls der Einschluss des kompletten Knotens mit in die Erhebung aufgenommen. Dies erfolgte nur bei benignen Knoten (n=19). Mittelwert, Standardabweichung, Median und Wertebereich der Strain-Ratio-Werte dieser Knoten sind: 3,2 ± 2,5, 2,6 (0,14-8,32). Ein Strain-Ratio-Wert größer als zehn wurde ausgeschlossen. 48 Ergebnisse 3.5.3 Siemens Acuson S3000 Die Auswertung für das Siemens Ultraschallgerät erfolgt für die drei Einstellungen Querschnitt 0,5-6,5 m/s, Querschnitt 0,5-9,0 m/s und Längsschnitt 0,5-6,5 m/s. Zusätzlich sind die Messungen für die Einstellung Querschnitt 0,5-3,0 m/s erhoben, da hierbei jedoch zu viele Messwerte oberhalb der Grenze von 3,0 m/s liegen und daher vom Gerät in dieser Einstellung nicht erfasst werden, kann die Auswertung dieser Messreihe nicht erfolgen. Für alle drei Untersuchungseinstellungen sind die Messwerte für die unterschiedlichen Histopathologien sowie für die Gruppe der benignen und malignen Läsionen in Tabelle 12 dargestellt. Die Scherwellengeschwindigkeit im Bereich des papillären Schilddrüsenkarzinoms weist durchschnittlich in beiden Querschnitteinstellungen die größten Werte mit 3,6 m/s und 4,0 m/s auf. Im Längsschnitt weisen die Scherwellen des Strumaknotens durchschnittlich die größte Geschwindigkeit mit 3,4 m/s auf, wobei die ermittelte Geschwindigkeit im papillären Schilddrüsenkarzinom mit 3,3 m/s nur knapp darunter liegt. Gemessene hohe Scherwellengeschwindigkeiten entsprechen hartem, unelastischem und somit malignitätssuspektem Gewebe. Insgesamt bilden das papilläre Schilddrüsenkarzinom und der Strumaknoten die Gruppe mit den schnelleren Geschwindigkeiten, follikuläres und mikrofollikuläres Adenom die Gruppe mit den langsameren Geschwindigkeiten. In malignen Läsionen werden in allen drei Einstellungen durchschnittlich höhere Geschwindigkeiten gemessen als in den benignen Läsionen. Der größte und damit am leichtesten feststellbare Unterschied zwischen den mittleren Werten der benignen und malignen Knoten findet sich im Querschnitt in der Skaleneinstellung 0,5-9,0 m/s. Jedoch ergeben sich weder für diese noch für die beiden anderen Einstellungen signifikante Unterschiede zwischen den Geschwindigkeiten. Die pWerte liegen hier zwischen 0,5095 und 0,6035. Auch in einer weiteren Untergliederung der benignen Knoten in ihre Histopathologien ergeben sich für keine der drei Einstellungen signifikante Unterschiede. Die p-Werte liegen zwischen 0,2322 und 0,4798. 49 Ergebnisse Tabelle 12: Mittelwert, Standardabweichung (STD), Median und Wertebereich der am Siemens Acuson S3000 Ultraschallgerät erhobenen Scherwellengeschwindigkeiten des Endkollektives für die drei Schnittebenen und Skaleneinstellungen: Querschnitt 0,5-6,5 m/s und 0,5-9,0 m/s und Längsschnitt 0,5-6,5 m/s, aufgeführt nach den unterschiedlichen histopathologischen Knotenbefunden, sowie für die Gruppe der benignen Knoten zusammen. In Klammern ist die jeweilige Fallzahl der Gruppe aufgeführt (n). In der letzten Zeile sind die p-Werte für die Differenzierung der Histopathologien anhand ihrer Scherwellengeschwindigkeiten aufgeführt. Universitätsklinikum Ulm, 12/2012 - 06/2013. Querschnitt Querschnitt Längsschnitt 0,5- 6,5 m/s 0,5- 9,0 m/s 0,5- 6,5 m/s Mittelwert ± Standardabweichung; Median (Wertebereich) Strumaknoten (n=30) Follikuläres Knoten- Adenom (n=7) 3,1 (1,6-6,0) 2,9 ± 0,7 2,7 (2,0-4,2) histologie Mikrofollikuläres Adenom (n=10) Papilläres Karzinom (n=6) p-Wert 3,6 ± 1,3 3,1 (1,5- 3,3 ± 0,9 7,5) 3,1 ± 0,8 2,9 (1,66,0) 2,8 ± 0,4 2,8 (2,1-3,6) 3,6 ± 1,5 3,6 (1,8-6,1) 0,4798 3,4 ± 1,1 3,1 (1,2-6,3) 0,5095 3,0 ± 1,0 3,0 (1,94,8) 2,8 ± 0,5 2,8 (2,13,8) 3,3 ± 1,1 3,0 (1,57,5) 2,9 ± 1,0 2,8 (1,8-5,6) 4,0 ± 2,4 3,7 (1,8-8,4) 0,2322 2,6 ± 0,8 2,9 (1,1-3,2) 3,2 ± 1,1 2,9 (1,16,3) 0,5841 3,3 ± 1,9 2,5 (1,6-6,1) 0,2839 0,6035 Untersucht man die Scherwellengeschwindigkeiten der benignen und malignen Knoten differenziert nach den verschiedenen Histopathologien des Schilddrüsengewebes, ergeben sich die in Tabelle 20 im Anhang gezeigten Ergebnisse. 50 Ergebnisse 3.5.4 Vergleich der drei Ultraschallgeräte Für einen Vergleich der drei Ultraschallgeräte in der semiquantitativen Elastografie bzw. numerischen Darstellung der Scherwellenelastografie werden die bestmöglichen Cut-off-Punkte zur Unterscheidung von benignen und malignen Läsionen mit den jeweiligen diagnostischen Werte berechnet. Sowohl beim Hitachi als auch beim Toshiba Ultraschallgerät erfolgt diese Berechnung für die Werte der Subanalyse mit Strain-Ratio-Werten, die auf gleicher Höhe gemessen wurden, da nur bei dieser die benignen Knoten einen kleineren Strain-Ratio-Wert aufwiesen als die malignen Knoten. Tabelle 13 zeigt die Ergebnisse. Für den gewählten Cut-off-Punkt am Hitachi Ultraschallgerät ergibt sich ein signifikanter p-Wert, was bedeutet, dass der berechnete Cut-off-Punkt in der vorliegenden Arbeit geeignet ist, um maligne von benignen Knoten zu differenzieren. Tabelle 13: Berechnete Cut-off-Punkte der Strain-Ratio-Werte der semiquantitativen Kompressionselastografie des Hitachi HI VISION Ascendus und Toshiba Aplio 500 Ultraschallgerätes und die Cut-off-Punkte der Scherwellengeschwindigkeiten in Meter pro Sekunde (m/s) der numerischen Darstellung der scherwellenbasierten Elastografie des Siemens Acuson S3000 Ultraschallgeräts unter Angabe der jeweiligen Fallzahl (n). Aufgeführt sind die diagnostischen Werte (Sensitivität, Spezifität, Positiver und Negativer Vorhersagewert) bei den gewählten Cut-off-Punkten für die Datenerhebung im Querschnitt (QS) bzw. Längsschnitt (LS). Am Siemens Ultraschallgerät wurde eine Skaleneinstellung von 0,5-6,5 m/s gewählt. In der letzten Zeile findet sich der p-Wert für die Differenzierung der Kategorien benigne und maligne Knoten. Universitätsklinikum Ulm, 12/2012 - 06/2013. Hitachi Toshiba Siemens (n=41) (n=38) (n=53) Schnittebene (Skaleneinstellung) QS QS QS (0,5-6,5m/s) LS (0,5-6,5 m/s) Cut-off-Punkt 2,97 2,48 3,29 m/s 2,90 m/s Sensitivität (%) 80,0 60,0 66,7 50,0 Spezifität (%) 72,2 48,5 68,1 46,8 Positiver Vorhersagewert (%) 28,6 15,0 21,1 10,7 96,3 88,9 94,1 88,0 0,0387 1,0 0,1717 1,0 Ultraschallgerät Negativer Vorhersagewert (%) p-Wert 51 Ergebnisse 3.5.5 Weitere Vergleichsmessungen der numerischen Scherwellenelastografie Neben der Unterscheidung zwischen benignen und malignen Läsionen werden beim Siemens Ultraschallgerät weitere folgende Vergleichsmessungen in den drei bereits oben genannten Einstellungen ausgewertet: Vergleich der Scherwellengeschwindigkeiten von Läsion und Schilddrüsengewebe und Vergleich der Scherwellengeschwindigkeiten innerhalb der unterschiedlichen Schilddrüsengewebe. 3.5.5.1 Vergleich der Scherwellengeschwindigkeiten von Läsion und Schilddrüsenparenchym In Abbildung 21 werden die gemessenen Scherwellengeschwindigkeiten der Läsion und des Schilddrüsengewebes getrennt für die drei Einstellungen am Siemens Acuson S3000 gegenübergestellt. Hierbei werden auch die Schilddrüsengewebe mit entzündlicher Veränderung miteinbezogen. In allen drei Einstellungen zeigen sich für die Läsion höhere Mittelwerte als für das umliegende Schilddrüsengewebe. Die mittlere Scherwellengeschwindigkeit und Standardabweichung der Läsion beträgt im Querschnitt (0,5-6,5 m/s) 3,2 ± 0,9 m/s und des Schilddrüsenparenchyms 2,8 ± 0,7 m/s. Für die Unterscheidung der beiden Parenchyme ergeben sich für alle drei Einstellungen signifikante p-Werte von p=0,0101 (Querschnitt 0,5-6,5 m/s), p=0,0280 (Querschnitt 0,5-9,0 m/s) und p=0,0010 (Längsschnitt 0,5-6,5 m/s). Die weiteren statistischen Daten sind der Tabelle 18 im Anhang zu entnehmen. Auch bei einer Unterteilung der Läsionen in ihre histopathologischen Diagnosen zeigen sich für die Läsionen, mit Ausnahme des Mikrofollikulären Adenoms im Querschnitt mit einer Skalenkalibrierung von 0,5-6,5 m/s, höhere mittlere Scherwellengeschwindigkeiten (Tabelle 18 im Anhang). Folglich können die gemessenen Scherwellengeschwindigkeiten für die Unterscheidung zwischen Läsions- und Schilddrüsengewebe herangezogen werden. 52 Ergebnisse Abbildung 21: Boxplot der Scherwellengeschwindigkeiten in Meter pro Sekunde (m/s) im Bereich von Läsion und umgebenden Schilddrüsenparenchym (Schilddrüse) im Querschnitt bei einer Skalenkalibrierung von 0,5-6,5 m/s und 0,5-9,0 m/s und im Längsschnitt bei einer Skalenkalibrierung von 0,5-6,5 m/s. Datenerhebung am Siemens Acuson S3000 und Auswertung des Endkollektives. ӿ markiert den jeweiligen Mittelwert, ‒ den jeweiligen Median. Universitätsklinikum Ulm, 12/2012 - 06/2013. Um zukünftig erhobene Messwerte bei einer ARFI-Untersuchung zu Läsions- oder zu Schilddrüsengewebe zuordnen zu können, sind die 95%-Intervalle der beiden Scherwellengeschwindigkeitsbereiche dieser Arbeit in Tabelle 14 angegeben. Tabelle 14: 95%-Intervalle der Scherwellengeschwindigkeiten für Läsions- und Schilddrüsengewebe in Meter pro Sekunde (m/s) in den drei Einstellungen Querschnitt 0,56,5 m/s und 0,5-9,0 m/s sowie Längsschnitt 0,5-6,5 m/s für die Erhebung am Siemens Acuson S3000 Ultraschallgerät mit Auswertung des Endkollektivs. Universitätsklinikum Ulm, 12/2012 - 06/2013. Schnittebene und Skaleneinstellung 95%-Intervall der Scherwellengeschwindigkeiten Querschnitt Querschnitt Längsschnitt 0,5-6,5 m/s 0,5-9,0 m/s 0,5-6,5 m/s Im Bereich der Läsion (m/s) 2,9 – 3,4 3,1 – 3,8 2,9 – 3,5 Im Bereich des Schilddrüsengewebes (m/s) 2,6 – 3,0 2,6 – 3,2 2,4 – 2,7 53 Ergebnisse Nimmt man aus dieser Gesamtanzahl der Schilddrüsen die Schilddrüsen, die eine unauffälligen Histologie (n=34) aufweisen, heraus und vergleicht die darin gemessenen Scherwellengeschwindigkeiten mit den Geschwindigkeiten der sich darin befindenden Knoten, zeigen sich auch hier durchgehend höhere Mittelwerte bei den Läsionen als bei dem Schilddrüsengewebe (s. Abbildung 22). Wiederum ergeben sich für alle drei Einstellungen signifikante p-Werte (Tabelle 19 im Anhang). Abbildung 22: Boxplot der Scherwellengeschwindigkeiten in Meter pro Sekunde (m/s) im Bereich des Schilddrüsenparenchyms und der sich ausschließlich in diesem gesunden Gewebe befindenden Läsionen im Querschnitt bei einer Skalenkalibrierung von 0,5-6,5 m/s und 0,5-9,0 m/s sowie im Längsschnitt bei einer Skalenkalibrierung von 0,5-6,5 m/s. Datenerhebung am Siemens Acuson S3000 und Auswertung einer Subanalyse des Endkollektivs mit ausschließlich gesundem Schilddrüsengewebe. ӿ markiert den jeweiligen Mittelwert, ‒ den jeweiligen Median. Universitätsklinikum Ulm, 12/2012 - 06/2013. Auch in dieser Subanalyse zeigt sich, dass die Scherwellengeschwindigkeit eine Differenzierung zwischen Läsion und umgebenden Schilddrüsenparenchym zulässt. Daher werden die für diese Erhebung geltenden 95%-Intervalle der Messwerte in Tabelle 15 angegeben. 54 Ergebnisse Tabelle 15: 95%-Intervalle der Scherwellengeschwindigkeiten im Bereich des gesunden Schilddrüsengewebes und der sich darin befindenden Läsionen in Meter pro Sekunde (m/s) in den Einstellungen Querschnitt 0,5-6,5 m/s und 0,5-9,0 m/s, Längsschnitt 0,5-6,5 m/s für die Erhebung am Siemens Acuson S3000 mit Auswertung einer Subanalyse des Endkollektivs. Universitätsklinikum Ulm, 12/2012 - 06/2013. Schnittebene und Skaleneinstellung 95%-Intervall der Scherwellengeschwindigkeiten Querschnitt Querschnitt Längsschnitt 0,5-6,5 m/s 0,5-9,0 m/s 0,5-6,5 m/s Im Bereich der Läsion (m/s) 2,7 – 3,4 2,8 – 3,8 2,6 – 3,4 Im Bereich des gesunden Schilddrüsengewebes (m/s) 2,6 – 3,1 2,6 – 3,4 2,4 – 2,8 55 Ergebnisse 3.5.5.2 Vergleich der Scherwellengeschwindigkeiten des Schilddrüsenparenchyms Im ersten Teil dieses Kapitels erfolgt der Vergleich der Scherwellengeschwindigkeiten zwischen den unterschiedlichen Histopathologien der Schilddrüsengewebe. Dies erfolgt für die drei Einstellungen am Siemens Ultraschallgerät: Querschnitt 0,5-6,5 m/s und 0,5-9,0 m/s sowie für den Längsschnitt 0,5-6,5 m/s. Für die erste dieser Einstellungen zeigt sich ein signifikanter Unterschied zwischen den einzelnen Histopathologien. Dabei weist das gesunde Schilddrüsengewebe durchschnittlich die geringste Scherwellengeschwindigkeit auf, gefolgt von der Hashimoto-Thyreoiditis und abschließend von der chronischen Thyreoiditis wie Tabelle 16 zeigt. Tabelle 16: Diagnostische Werte (Mittelwert, Standardabweichung (STD) , Median und Wertebereich) der Scherwellengeschwindigkeiten in Meter pro Sekunde (m/s) der Schilddrüsengewebe mit unterschiedlicher Histopathologie unter Angabe der jeweiligen Fallzahl in Klammern (n). Ausgewertet ist das Endkollektiv für die drei Schnittebenen und Skaleneinstellungen: Querschnitt 0,5-6,5 m/s und 0,5-9,0 m/s und Längsschnitt 0,5-6,5 m/s am Siemens Acuson S3000 Ultraschallgerät. In der letzten Zeile steht der für die Differenzierung der einzelnen Histopathologien anhand der Scherwellengeschwindigkeit ermittelte p-Wert. Universitätsklinikum Ulm, 12/2012 - 06/2013. Schnittebene und Skaleneinstellung Querschnitt Querschnitt Längsschnitt 0,5-6,5 m/s 0,5-9,0 m/s 0,5-6,5 m/s Mittelwert ± STD, Median, Wertebereich Gesundes SchilddrüsenHistopathologie des Schilddrüsengewebes gewebe (n= 26) Chronische Thyreoiditis (n= 11) HashimotoThyreoiditis (n= 4) p- Wert 3,1± 1,0 2,8 (1,6 - 6,1) 3,3 ± 1,5 2,8 (1,5-8,4) 3,0 ± 1,2 2,8 (1,1-6,3) 3,5 ± 0,8 3,5 (2,1 – 4,6) 3,6 ± 0,9 3,7 (2,1-5,2) 3,7 ± 1,3 3,1 (2,0-5,6) 3,3 ± 0,7 3,1 (2,7 – 4,4) 3,6 ± 1,1 3,1 (3,0-5,6) 3,2 ± 0,6 3,3 (2,4-4,0) 0,0322 0,2052 0,1636 56 Ergebnisse Im zweiten Abschnitt dieses Kapitels wird die durchschnittliche Scherwellengeschwindigkeit von Schilddrüsengewebe mit benigner Läsion dem Schilddrüsengewebe mit maligner Läsion gegenübergestellt. Da für jeden Knoten eigene Messwerte im Schilddrüsenparenchym erhoben werden, ergibt sich für die Anzahl der ausgewerteten Schilddrüsengewebe die Knotenanzahl des Endkollektivs mit n=53. In allen drei Einstellungen ergeben sich durchschnittlich deutlich größere Geschwindigkeitswerte bei den Schilddrüsengeweben mit maligner Läsion als bei den Schilddrüsengeweben mit benigner Läsion (s. Abbildung 23). In den beiden Querschnittserhebungen ergeben sich hierfür signifikante Unterschiede mit pWerten von 0,0365 für die Skalenkalibrierung 0,5-6,5 m/s bzw. 0,0306 für die Skalenkalibrierung von 0,5-9,0 m/s. Auch werden für eine künftige Einordnung der absoluten Zahlenwerte die Intervalle angegeben, in denen sich 95% der Zahlenwerte der Schilddrüsengewebe mit benigner bzw. maligner Läsion befinden (s. Tabelle 21 im Anhang). Abbildung 23: Boxplot der Scherwellengeschwindigkeiten in Meter pro Sekunde (m/s) im Bereich des Schilddrüsenparenchym, das mindestens eine benigne Läsionen enthält, und im Bereich des Schilddrüsenparenchyms, das mindestens eine maligne Läsion enthält in den drei unterschiedlichen Schnittebenen und Einstellungen: Querschnitt bei einer Skalenkalibrierung von 0,5-6,5 m/s und 0,5-9,0 m/s sowie Längsschnitt bei einer Skalenkalibrierung von 0,5-6,5 m/s. Datenerhebung am Siemens Acuson S3000 und Auswertung des Endkollektivs. ӿ markiert den jeweiligen Mittelwert, ‒ den jeweiligen Median. Universitätsklinikum Ulm, 12/2012 - 06/2013. 57 Diskussion 4 Diskussion Die im vorherigen Kapitel aufgeführten Ergebnisse werden im Folgenden nun in die aktuelle Literatur eingeordnet und diskutiert. Auch werden die Stärken und Schwächen der vorliegenden Arbeit aufgeführt und abschließend ein Resümee abgeleitet. 4.1 B-Bild-Parameter der Schilddrüse 4.1.1 Schilddrüsenvolumen Das durchschnittliche Schilddrüsenvolumen von 50,8 ml überschritt die in der Literatur angegebenen Grenzwerte von maximal 18 ml für Frauen bzw. maximal 25 ml für Männer. Morphologisch wird die gleichmäßige Vergrößerung der Schilddrüse, die Struma diffusa, von der in dieser Studie ausschließlich vorkommenden Struma nodosa, einer Vergrößerung der Schilddrüse mit existentem Knoten, unterschieden. Zum einen war daher die Vergrößerung des Schilddrüsenvolumens auf die Knoten, von denen in 85,4% der Fälle mindestens zwei in jeder Schilddrüse zu finden waren, zurückzuführen. Weitere Gründe könnten zum anderen die Volumenzunahme durch eine Hashimoto-Thyreoiditis, die in dieser Arbeit in vier Fällen beschrieben wurde, oder auch eine Jodunterversorgung dieser Population sein [53]. Zwar wurde in der vorliegenden Arbeit ein eventuell vorhandener Jodmangel der Patienten nicht untersucht, aber Hampel et al. konnten in ihrem Bericht über die Jodversorgung in Deutschland einen regional unabhängigen Jodmangel bei 36% der Bevölkerung zeigen [33]. Daher ist auch für einen Teil des Patientenkollektives in der vorliegenden Arbeit ein Jodmangel anzunehmen. Die zudem beobachtete Diskrepanz zwischen den Volumina der Schilddrüsen mit benigner und maligner Läsion ist nun zu diskutieren. Die Volumina der Schilddrüsen, die ausschließlich benigne Läsionen enthielten, waren durchschnittlich mehr als doppelt so groß wie die Volumina der Schilddrüsen mit mindestens einer malignen Läsion. Diese Beobachtung bestätigte auch die Arbeit von Erbil et al., die in ihrer Arbeit ein signifikant kleineres Volumen bei Schilddrüsen, die eine maligne Läsion enthielten, nachweisen konnten. Mögliche Ursachen für dieses Ergebnis wurden jedoch von den Autoren nicht diskutiert [24]. 58 Diskussion Analog zu der oben aufgeführten Überlegung, dass Knoten wesentlich zu einer Schilddrüsenvergrößerung beitragen können, war auch ein Unterschied zwischen den Volumina von benignen und malignen Läsionen festzustellen: Das durchschnittliche Volumen der benignen Läsionen war mehr als doppelt so groß als das durchschnittliche Volumen der malignen Läsionen. Mögliche Gründe für diesen Unterschied werden später in der Diskussion zur Knotengröße aufgeführt. 4.1.2 Echogenität und Echotextur Alle malignen Läsionen fanden sich in sonografisch unauffälligen Schilddrüsen, d.h. die Schilddrüsengewebe stellten sich echonormal und homogen dar. Die Karzinome nahmen daher zum Zeitpunkt der Untersuchung keinen Einfluss auf das sonomorphologische Aussehen des umliegenden Parenchyms. Auch die aktuelle Literatur zur Ultraschalldiagnostik von Schilddrüsenknoten legt den Schwerpunkt der Diagnostik nicht auf das Aussehen des Schilddrüsenparenchyms, sondern auf die B-Bild-Kriterien des Knotens selbst [1, 34, 37, 50]. Diese sind im nachfolgenden Kapitel 4.2.1 diskutiert. 4.1.3 Knotenanzahl 85,4% der untersuchten Patienten wiesen mehr als einen Knoten in ihrer Schilddrüse auf. Papilläre Karzinome, die in dieser Arbeit die einzige maligne Entität darstellten, traten in vier Fällen solitär und in einem Fall multifokal, d.h. zwei maligne Knoten befanden sich in derselben Schilddrüse, auf. Dieses Verhältnis bestätigte die aktuelle Literatur, die davon ausgeht, dass papilläre Karzinome zumeist allein und in 10-20% der Fälle multifokal vorkommen [52, 86]. Viele Arbeiten beschäftigten sich seit den 1990er-Jahren mit der Frage, ob die Inzidenz für ein Schilddrüsenkarzinom in einem einzeln auftretenden Knoten oder in einer multinodulär vergrößerten Schilddrüse, also im Rahmen einer Struma multinodosa, größer sei. Erschwert wird ein direkter Vergleich zwischen den Arbeiten allerdings durch die unterschiedliche Definition der Autoren von „Multinodularität“. Eine große Metaanalyse von Brito et al. mit 18288 Schilddrüsenknoten aus den Vereinigten Staaten konnte ein höheres Risiko für Malignität bei solitären Knoten zeigen (OR= 4,45) [12]. Auch Campanella et al., die in ihrer Metaanalyse 29678 Knoten untersuchten, errechneten ein erhöhtes Karzinomrisiko 59 Diskussion für solitäre Knoten, jedoch war die Odds-Ratio in ihrer Arbeit mit 1,43 kleiner als die von Brito et al. berechnete [16]. Frates et al. fanden in ihrer Studie mit 3483 Knoten das Krebsrisiko für Patienten mit solitärem Knoten in etwa gleich groß wie das Risiko für Patienten mit multinodöser Struma. Das Malignitätsrisiko eines einzelnen Knotens sank mit Zunahme der Gesamtknotenanzahl in der Schilddrüse [25]. In dieser Arbeit wurde eine Schilddrüse als multinodulär definiert, wenn sie mindestens zwei Knoten aufwies. Keiner der untersuchten sechs solitären Knoten war in dieser Studie maligne, d.h. dass sich alle malignen Knoten in einer multinodulären Schilddrüse befanden. Dieses Ergebnis weicht zwar von den Ergebnissen der Metaanalysen ab, diese geben allerdings nur das Malignitätsrisiko an, das ein solitärer Knoten zusätzlich aufweist. Ihre Aussage besteht nicht darin, dass ein maligner Knoten in jedem Fall allein auftritt. Diese Diskrepanz und die Tatsache, dass sich in dieser Arbeit neben jedem malignen Knoten mindestens ein benigner Knoten fand, unterstreicht die Bedeutung der sorgfältigen Ultraschalluntersuchung eines jeden einzelnen Knotens in einer multinodulären Schilddrüse. 4.2 B-Bild-Kriterien, Durchblutungsmuster und TIRADS- Klassifikation der Läsion 4.2.1 B-Bild-Kriterien 4.2.1.1 Sonografische Parameter Keiner der in dieser Arbeit erhobenen B-Bild-Parameter zeigt einen signifikanten Unterschied zwischen benignen und malignen Läsionen. In der Vergangenheit wurden unterschiedliche B-Bild-Parameter für eine Differenzierung zwischen benignen und maligen Knoten diskutiert. Beispielsweise waren dies das Halo-Zeichen, eine unscharfe Randbegrenzung, Mikro- und Makrokalzifizierungen, Hypoechogenität oder eine „Tiefer-als-Breit“-Form des Knotens. Kein Parameter konnte jedoch für sich alleine genommen eine ausreichende Sensitivität und Spezifität aufzeigen, lediglich konnten sogenannte Risikofaktoren identifiziert werden, die in ihrer Summe die Vorhersagekraft für Malignität erhöhen können. Die einzigen verlässlichen Anzeichen für Malignität sind 60 Diskussion das invasive Knotenwachstum in das Schilddrüsengewebe oder in Halsstrukturen und zervikale Lymphknotenmetastasen [6, 50, 55, 64]. Die bereits im vorherigen Kapitel aufgeführte, im April 2014 publizierte Metaanalyse von Brito et al. konnte in der Auswertung von über 31 Studien mit 18288 Knoten und 14 unterschiedlichen B-Bild- Parametern den stärksten Zusammenhang zwischen Malignität und „Tiefer-als-Breit“-Form des Knotens aufzeigen (OR=11,14), die Autoren rieten jedoch ebenfalls von einer Verwendung als alleiniges Malignitätskriterium ab. Eine weitere, ebenfalls im vorherigen Kapitel bereits aufgeführte, 2014 publizierte Metaanalyse von Campanella et al. evaluierte die klinischen und sonografischen Parameter von 29678 Schilddüsenknoten und fand ebenfalls das größte Malignitätsrisiko bei Knoten, die eine Tiefer-als-Breit-Form aufwiesen (OR=10,15) [16]. In meiner Arbeit zeigte sich bezüglich dieses Merkmals kein Unterschied, die Mittelwerte der Verhältnisse von Tiefe zu Breite waren mit 0,8 sogar identisch. Brito et al. schlugen statt der Verwendung eines einzelnen Malignitätskriteriums vor, die Kriterien „zystischer Knoten“ und „schwammförmiges Aussehen“ als zuverlässige Kriterien für Benignität heranzuziehen [12]. Rein zystische Knoten wurden in meiner Arbeit als Ausschlusskriterium definiert und kamen daher in der Auswertung nicht vor. Das schwammartige Aussehen, das als TIRADS-Kategorie 2 eingestuft wird, zeigten in meiner Arbeit allerdings zwei der sechs malignen Knoten. Die Aussage von Brito et al. konnte somit nicht bestätigt werden. Brito et al. und Campanella et al. berechneten u.a. für folgende sonografischen Kriterien ebenfalls ein erhöhtes Malignitätsrisiko: (Mikro-) Kalzifikationen, fehlendes Halo-Zeichen, irregulärer Rand und Hypoechogenität des Knotens [12, 16]. In der vorliegenden Arbeit fand sich außer bei letztgenanntem Charakteristikum ein höherer relativer Anteil jedoch in der Gruppe der benignen Knoten. Hypoechogenität wurde in 50% der malignen Knoten beobachtet. Zweifellos lässt sich keines dieser Kriterien als alleiniges Unterscheidungsmerkmal zwischen Benignität und Malignität heranziehen, auch die vorliegende Untersuchung bestätigt diese Aussage. Eine fortführende Diskussion unterschiedlicher Kombinationen sonografischer Merkmale übersteigt den Rahmen dieser Dissertation und könnte Bestandteil zukünftiger Arbeiten sein. 61 Diskussion 4.2.1.2 Knotengröße Ausführlicher soll der in der vorliegenden Arbeit beobachtete Unterschied der Knotengröße zwischen benignen und malignen Knoten diskutiert werden. Zwar wurde in dieser Arbeit kein signifikanter Unterschied zwischen den Knotenvolumina festgestellt, es ist jedoch auffällig, dass das Volumen gutartiger Knoten durchschnittlich mehr als doppelt so groß ist als das Volumen bösartiger Knoten. Auch wenn die folgenden Arbeiten teilweise den größtmöglichen Diameter diskutierten, der in dieser Arbeit nicht erhoben wurde, lassen sich daraus Aussagen über die Knotengröße ableiten. Die folgenden zwei Studien beobachteten diese Diskrepanz in der Knotengröße zwischen benignen und malignen Knoten ebenfalls: Moon et al. zeigten in ihrer retrospektiven Arbeit mit 849 Knoten einen signifikanten Unterschied zwischen den maximalen Durchmessern von malignen und benignen Knoten, wobei der der malignen signifikant kleiner war als der der benignen [55]. In der von Rossi et al. publizierten Arbeit waren von 233 malignen Knoten 144 (61,8%) kleiner als ein Zentimeter im maximalen Durchmesser [68]. Genauso gibt es jedoch auch Studien, die keinen Unterschied in der Größe zwischen gut- und bösartigen Knoten feststellen konnten [42, 59]. Campanella et al. publizierten in ihrer Metaanalyse ein erhöhtes Krebsrisiko (OR=1,63) für Knoten, die mindestens vier Zentimeter groß waren [16]. Der Gedanke, dass Malignität ein schnelles Wachstum und somit eine gewisse Knotengröße zum Zeitpunkt der Diagnostik impliziert, zeigte sich demnach in dieser Datenerhebung. Zusammenfassend sind die verschiedenen Ergebnisse so zu bewerten, dass der Untersucher sehr vorsichtig sein muss, wenn er basierend auf der Knotengröße Empfehlungen für oder gegen weitere diagnostische Schritte veranlasst. 4.2.2 Durchblutungsmuster Die Ergebnisse der vorliegenden Arbeit wiesen zwar keinen signifikanten Unterschied zwischen der Durchblutung von benignen und malignen Läsionen auf, jedoch zeigte sich, dass mit Zunahme der intranodulären Durchblutung auch das Risiko für Malignität stieg. Dieses Ergebnis entspricht der aktuellen Lehrmeinung, 62 Diskussion in welcher die erhöhte intranoduläre Durchblutung als unabhängiger Risikofaktor für Malignität angesehen wird [1, 16, 64]. In einer gegenwärtigen Metaanalyse von Woliński et al. berechneten die Autoren jedoch nur eine nicht zufriedenstellende Sensitivität von 44,2% und Spezifität von 81,5% für diesen Parameter und blieben damit hinter den Erwartungen zurück [85]. Da es unterschiedliche Einteilungen bezüglich des Vaskularisationsmusters gibt, wird ein direkter Vergleich zwischen verschiedenen Studien erschwert. Daher wird im Folgenden nur eine Arbeit aufgeführt, in der bzgl. der Vaskularisation die gleiche Einteilung wie in dieser Arbeit vorgenommen wurde: Bojunga et al. fassten in ihrer Arbeit die Muster 3 und 4 zusammen. Sie fanden so in der Gruppe der malignen Läsionen 52,3% Knoten und in der Gruppe der benignen Läsionen 27,0% Knoten mit diesen Vaskularisationsmustern [9]. In der vorliegenden Arbeit fielen die Anteile der Muster 3 und 4 sowohl an den malignen Läsionen mit 83,3% als auch an den benignen Läsionen mit 66,0% deutlich größer aus. Da beide Studien an einem Hitachi Ultraschallgerät durchgeführt wurden, könnten für diese Diskrepanz noch eine untersucherabhängige Einstellung des Ultraschallgerätes, wie zum Beispiel die Intensität des Color-Doppler-Modus oder andere Untersuchungsparameter, wie der vom Untersucher applizierte Druck, ursächlich sein. Es bleibt jedoch festzustellen, dass die Zuteilung zu einem Vaskularisationsmuster allein in diesen beiden Studien stark variiert und als alleiniger Parameter zunächst ungeeignet für eine Differenzierung zwischen benignen und malignen Knoten erscheint. 4.2.3 TIRADS-Klassifikation Um dem Untersucher eine Hilfestellung bei der Unterscheidung zwischen benignen und malignen Knoten bzw. bei der Indikationsstellung für oder gegen eine Feinnadelbiopsie bei der Fülle der identifizierten Risikofaktoren zu geben, wurde das Thyroid Imaging Reporting and Data System (TIRADS) von Horvath et al. 2009 eingeführt [37]. Jüngst wurde eine Metaanalyse mit über 10400 Schilddrüsenknoten veröffentlicht, die die Zuverlässigkeit dieses Systems überprüfte und zu einer bestätigenden Sensitivität von 79% und einer Spezifität von 71% kam [83]. Eine Arbeit von Friedrich-Rust et al. befasste sich mit der Interobserver-Variabilität der TIRADS-Klassifikation nach Horvath et al.: 114 Schilddrüsenknoten wurden von drei Untersuchern unabhängig voneinander zu einer TIRADS-Kategorie zugeteilt. 63 Diskussion Die Ergebnisse waren jedoch nicht zufriedenstellend, denn die drei Werte des Spearmans Korrelationskoeffizienten lagen zwischen 0,257 und 0,407 und somit alle in einem Bereich, der nur eine schwache bis mäßige Übereinstimmung zwischen den gewählten TIRADS-Kategorien der Untersucher aufzeigte [26]. In der vorliegenden Arbeit wurde die TIRADS-Klassifikation insgesamt durch drei sehr erfahrene Untersucher vorgenommen, wobei bei Uneinigkeit der Mehrheitskonsens entschied. Ein Vergleich zwischen den in der vorliegenden Arbeit ermittelten Malignitätswahrscheinlichkeiten und den von Horvath et al. angegebenen Wahrscheinlichkeiten zeigte, dass diese nur in zwei der sieben Kategorien miteinander übereinstimmten: in Kategorie 3 und 4b (s. Tabelle 1 und Tabelle 6). Ein Grund hierfür ist sicherlich die relativ kleine Fallzahl der vorliegenden Arbeit und dadurch mitbedingt, wurden zwei Kategorien keine einzige Läsion zugeordnet. Doch ungeachtet der kleinen Fallzahl, muss im klinischen Alltag für jede einzelne Läsion eine zuverlässige Einteilung zu einer Kategorie unter Angabe der Malignitätswahrscheinlichkeit gemacht werden können. Dies gelang für die vorliegende Arbeit mit Hilfe der TIRADS-Klassifikation nach Horvath et al. nicht. Eine auffällige Verteilung der Karzinome zu einer bestimmten Kategorie konnte in der vorliegenden Arbeit nicht beobachtet werden. Neben dieser TIRADS-Klassifikation gibt es jedoch noch weitere Klassifikationen, die in dieser Arbeit nicht berücksichtigt wurden [43, 60, 70]. Horvath et al. gründeten damals ihre Arbeit auf den etablierten Malignitätswahrscheinlichkeitsangaben ihres Vorbildes, dem Breast Imaging Reporting and Data System (BIRADS). Zukünftig muss evaluiert werden, ob diese Wahrscheinlichkeitswerte für die Schilddrüse adjustiert werden können bzw. müssen, ob es Vor- und Nachteile der einzelnen Klassifikationen gibt und vor allem, ob sie sich hinsichtlich ihrer diagnostischen Aussagekraft unterscheiden. Folgernd aus den Ergebnissen von Friedrich-Rust et al. muss nach einer Möglichkeit gesucht werden, die Interobserver-Variabilität für die TIRADS-Klassifizierung Zuordnungsalgorithmus im zu senken. Sinne eines Es wäre denkbar, Flussdiagramms, das einen einzelne Knotencharakteristika der Reihe nach abfragt, zu etablieren. In Bezug auf den Schwerpunkt dieser Arbeit, soll auf die Ergebnisse von Russ et al. eingegangen werden, die in ihrer Arbeit die von ihnen entwickelte TIRADSKlassifikation mit der semiquantitativen Kompressionselastografie an einem 64 Diskussion Toshiba Ultraschallgerät kombinierten. Sie erhielten eine sehr gute Sensitivität von 98,5% [71]. Für zukünftige Untersuchungen muss überlegt werden, ob die Aufnahme der Elastografie in die TIRADS-Klassifikation als zusätzliches Kriterium sinnvoll ist und so die statistischen Werte der TIRADS-Klassifikation verbessert werden können. Auch für den Gebrauch der Elastografie in der Evaluation von Schilddrüsenknoten als additionales Diagnostikum spricht sich die European Federation of Societies for Ultrasound in Medicine and Biology (EFSUMB) in ihrer aktuellen Leitlinie aus [19]. Eine Integration der Elastografie in die TIRADSKlassifikation scheint daher folgerichtig und praktikabel. 4.3 Geräteübergreifende Diskussionspunkte der Elastografie Während der Auswertung und Recherche für diese Arbeit, präsentierten sich mehrere Diskussionspunkte, die alle drei Ultraschallgeräte betreffen. Diese sind aufgrund der besseren Übersichtlichkeit in diesem Kapitel zusammengefasst und werden nicht für jedes Ultraschallgerät einzeln aufgeführt. 4.3.1 Schnittebene der elastografischen Untersuchung In diesem Kapitel soll kurz auf den Unterschied der elastografischen Untersuchung zwischen Quer- und Längsschnitt eingegangen werden. Vor allem in der Kompressionselastografie muss der verwendeten Schnittebene Beachtung geschenkt werden, da die Elastografie im Längsschnitt vermutlich bessere Ergebnisse als im Querschnitt erzielen kann. Diese These gründet sich auf Beobachtungen während der Datenerhebung für diese Arbeit und der Leitlinie der European Federation of Societies for Ultrasound in Medicine and Biology (EFSUMB): Im Längsschnitt treten erstens weniger Artefakte durch die A. carotis und die Trachea auf. Zweitens kann der Druck, da er im Längsschnitt parallel zu Trachea und Ösophagus, die als unterliegende Strukturen der Schilddrüse als Widerstand fungieren, aufgebracht wird, gleichmäßiger auf die Schilddrüse verteilt werden. Drittens nennt Elastografieuntersuchung die aktuelle Fehlerquellen, die Leitlinie sich der ohne EFSUMB weiteres auf zur die Schnittebene der Untersuchung übertragen lassen: ein im Verhältnis zum untersuchten Objekt zu kleiner Schallkopf oder umliegende Strukturen, die die 65 Diskussion Ausbreitung des Knotens bei Kompression und somit die gemessene Elastizität beeinflussen [4]. Erstaunlicherweise werden in den meisten Studien keine Angaben darüber gemacht, ob der Schallkopf für die Erhebung der Elastografiedaten im Quer- oder im Längsschnitt aufgesetzt wurde, was einen Vergleich der diagnostischen Werte erschwert, wenn nicht gar unsinnig macht. Auch liegt nach derzeitigem Wissensstand keine Studie vor, die diesen Unterschied in der Schnittebene explizit untersucht hätte. In der Erhebung am Hitachi Ultraschallgerät zeigte die qualitative Elastografie im Längsschnitt mit 83,3% eine höhere Sensitivität als im Querschnitt mit 66,7%. Dieser Wert war innerhalb der vorliegenden Arbeit der höchste Prozentwert für die Sensitivität. Die semiquantitative Elastografie wurde nur im Querschnitt erhoben, hätte aber auf obigen Argumenten gründend im Längsschnitt vermutlich noch bessere diagnostische Werte erzielen können. Die Auswertung am Toshiba Ultraschallgerät konnte diesen Zusammenhang nicht zeigen. Cakir et al. erhoben in ihrer Arbeit die Daten der semiquantitativen Elastogafie sowohl im Quer- als auch im Längsschnitt. Auch sie erhielten höhere diagnostische Werte für die Messungen im Längsschnitt und bestätigten somit das Ergebnis am Hitachi Ultraschallgerät [14]. Zukünftige Arbeiten müssen diese Fragestellung berücksichtigen, bzw. zumindest eine Angabe über die verwendete Schnittebene machen. Nur so wird ein guter und standardisierter Vergleich zwischen den Arbeiten möglich und zulässig. Anders muss in dieser Diskussion die Elastografieuntersuchung am Siemens Ultraschallgerät bewertet werden, da dieses eine andere Technologie für die Datenerhebung benutzt: Hitachi und Toshiba verwenden das Verfahren der Kompressionselastografie, die für eine gleichmäßige Druckverteilung in der Tiefe einen gleichförmigen Widerstand benötigt, wohingegen das Siemens Gerät sich der Scherwellentechnologie bedient. Hierbei werden die Geschwindigkeiten der vom Schallkopf ins Gewebe gebrachten Scherwellen gemessen und daher wird kein gleichförmiger Widerstand benötigt. Folglich ist ein Unterschied zwischen den beiden Schnittebenen aufgrund der Technologie bei diesem Gerät zunächst nicht zu erwarten. Widersprüchliche Aussagen fanden sich in der Arbeit von Calvete et al., die als einzige Angaben und Überlegungen zu den von ihnen gewählten Schnitt- 66 Diskussion ebenen am Siemens Ultraschallgerät machten: Das Elastogramm in der grafischen Darstellung der Scherwellenelastografie erhoben sie im Längsschnitt, um die Karotiden und die Trachea als Störfaktoren aus dem Bild auszuschließen, die Erhebung der numerischen Darstellung der Scherwellengeschwindigkeiten als absolute Zahlen führten sie dagegen anschließend im Querschnitt und im Längsschnitt durch und bildeten aus den Werten beider Schnittebenen den Mittelwert [15]. In der vorliegenden Arbeit lagen die Summen aus Sensitivitäten und Spezifitäten der Messreihe am Siemens Gerät sowohl in der grafischen als auch in der numerischen Darstellung der Scherwellenelastografie im Querschnitt (beides Mal eine Sensitivität von 66,7% und Spezifität von 68,1%) über denen des Längsschnitts (grafisch: 50,0% bzw. 70,2% und numerisch 50,0% bzw. 46,8%). Wodurch diese Diskrepanz entstand, konnte nicht abschließend geklärt werden. Denkbar wären neben einem tatsächlichen Unterschied der Schnittebenen, Messfehler oder Zufall, letztgenannter bedingt durch die relativ kleine Fallzahl. Abschließend bleibt festzuhalten, dass auch im Bereich der scherwellenbasierten Elastografie bzgl. der Schnittebene noch Uneinigkeit besteht. Nur durch die Angaben und Vergleiche zukünftiger Autoren kann Klarheit entstehen. 4.3.2 Einteilung der Elastografiescores Die Entscheidung, die qualitativen Elastogramme des Hitachi und Toshiba Ultraschallgerätes und die grafische Darstellung der Scherwellengeschwindigkeiten des Siemens Ultraschallgerätes in vier Gruppen einzuteilen, liegt in dem Umstand begründet, dass teilweise Daten, die am Hitachi Gerät erhoben wurden, in die Multicenterstudie der Universität Frankfurt einflossen und das Studienprotokoll dies dort so vorsah [8]. Für die anderen beiden Ultraschallgeräte wurde für einen geeigneten Vergleich die gleiche Einteilung gewählt. Die Einteilung der elastischeren Elastografiescores 1 und 2 als benigne Knoten und der härteren Elastografiescores 3 und 4 als maligne Knoten erfolgte auf Grundlage der Einteilung und Validierung in vorangegangenen Arbeiten. Zudem ermöglichte diese Einteilung einen guten Vergleich zwischen den Arbeiten [2, 3, 9, 28, 47, 69, 79, 87, 90]. Die Untersucher in dieser Studie fanden gewählte Einteilung in die vier Gruppen sehr übersichtlich und leicht verständlich, was eine schnelle Zuordnung ermöglichte 67 Diskussion und daher als Methode geeignet scheint, um zukünftig im klinischen Alltag gut und regelmäßig Anwendung zu finden. Es wurden jedoch auch Studien mit 3, 5 oder 6 unterschiedlichen Elastografiegruppen veröffentlicht [77]. Diesbezügliche fehlt eine Metaanalyse, die evaluiert, ob Arbeiten, die eine Einteilung der qualitativen Elastografie in mehr als vier Gruppen vornehmen, möglicherweise bessere diagnostische Werte erzielen können. Denkbar wäre, dass sie aufgrund von mehr Wahlmöglichkeiten eine genauere Einteilung der Knoten vornehmen können. 4.3.3 Knotengröße Eine Fragestellung, die im Rahmen der Elastografieuntersuchung auftaucht, ist die nach der für diese Untersuchung geeigneten Knotengröße. Da der Knotendurchmesser von einem Zentimeter häufig als Grenzwert für eine Szintigrafie der Schilddrüse angesehen wird und auch eine Punktionszytologie bei kleinen Knoten schwieriger als bei großen Knoten durchzuführen ist, scheiden diese beiden Verfahren bei kleinen Knoten als weiterführende diagnostische Maßnahme aus [50]. Die Bedeutung des Ultraschalls und der Elastografie als alternative diagnostische Option steigt. Dass sich die Elastografie sehr gut gerade für die Diagnostik kleiner Knoten eignet, stellten Ünlütürk et al. in ihrer Studie mit 237 Knoten fest: Sie zeigten eine inverse Korrelation zwischen Knotengröße und richtiger Elastografieklassifizierung, d.h. dass die kleinsten Knoten am besten zugeordnet wurden. Der kleinste Knoten in ihrer Arbeit maß 0,5 cm im maximalem Durchmesser [80]. Weiterhin gibt es Arbeiten, die sich speziell mit der elastografischen Untersuchung von Knoten, die kleiner als 10 mm sind, beschäftigen. Wang et al. publizierten eine Studie mit einer Population von 51 Knoten, die im maximalen Durchmesser kleiner als 10 mm waren, und fanden für die Kompressionselastografie basierend auf einer Einteilung in fünf Gruppen eine Sensitivität und Spezifität von 90,6% und 89,5%. Der kleinste Knoten in ihrer Studie wies 3 mm auf [82]. Eine weitere Arbeit in dieser Reihe ist die von Dighe et al.: Die Autoren ermittelten den semiquantitativen Schilddrüsensteifigkeitsindex in Knoten, die kleiner als ein Zentimeter waren, und erreichten eine Sensitivität von 100% und Spezifität von 60% [23]. Folglich kann die 68 Diskussion Elastografieuntersuchung auch für kleine Knoten mit guten Resultaten durchgeführt werden. Das kleinste Maß eines Knotens in dieser Arbeit betrug 6,9 mm. Ob ein Zusammenhang zwischen Knotengröße und richtiger Elastogafieeinteilung bestand, wurde in dieser Arbeit nicht untersucht. Aufgrund der Ergebnisse in der Differenzierung zwischen Knoten und Schilddrüsenparenchym in der farbigen Elastografiedarstellung, nämlich das die Elastografie in den meisten Fällen keine bessere Differenzierung zwischen Knoten und Schilddrüsenparenchym zuließ, muss über eine Knotenmindestgröße für eine Untersuchung mittels Kompressionselastografie diskutiert werden. Für Knoten, die diese Mindestgröße nicht erfüllen, wäre alternativ eine Untersuchung mittels der numerischen Darstellung der Scherwellenelastogafie denkbar. Diese Untersuchungsmethode hätte den Vorteil, dass sie als quantitative Methode die Scherwellengeschwindigkeit in einem kleinen Knoten exakt messen kann, aber der Untersucher aufgrund der geringen Knotengröße nur wenige der vom Gerät vorgegebenen ROIs von 0,5 cm x 0,5 cm setzen muss, um den kompletten Knoten abzudecken. 4.3.4 Metaanalysen Da bereits viele Arbeiten zur Kompressions- und Scherwellenelastografie erschienen sind, wächst die Bedeutung von Metaanalysen, die die Ergebnisse zusammenfassend beurteilen und dadurch eine gewisse Übersichtlichkeit gewähren. Inzwischen wurden bereits zwei Metaanalysen zum Nutzen der Elastografie veröffentlicht: Die erste, 2010 von Bojunga et al. veröffentlichte Arbeit mit acht Studien und insgesamt 639 Knoten, errechnete eine beachtliche Sensitivität und Spezifität von 92% bzw. 90%. In diese Analyse gingen ausschließlich Ergebnisse der Kompressionselastografie ein [10]. Eine zweite Metaanalyse mit dem Titel „Real-time Ultrasound Elastography for Differentiation of Benign and Malignant Thyroid Nodules“ wurde 2014 von Sun et al. publiziert, in welche die bemerkenswerte Anzahl von 31 Arbeiten mit 5481 Knoten einbezogen wurde. Der Titel dieser Arbeit ist jedoch nicht korrekt, da die Autoren mindestens zwei Arbeiten in ihre Berechnungen mit einbezogen, welche die 69 Diskussion Elastografie auf Basis der Scherwellentechnologie und nicht in „real time“ mittels Kompression untersuchten. Die Werte dieser Arbeiten führten sie zudem unter der Kategorie „qualitative Elastografie“ auf. Dies ist allerdings nicht die richtige Bezeichnung für die grafische Darstellung mittels Scherwellentechnologie, da das Siemens Ultraschallgerät die zugrunde liegenden Zahlenmesswerte der Scherwellengeschwindigkeiten misst und für die farbige Darstellung verwendet. Es werden folglich quantitative Ergebnisse, da durch die Scherwellentechnologie ermittelt, angezeigt. Lässt man diesen Diskussionspunkt außer Acht und präsentiert die diagnostischen Werte aus dieser Metaanalyse unter der von den Autoren gewählten Bezeichnung, zeigen sich Sensitivitäten und Spezifitäten von 79% und 77% für die qualitative Elastografie bzw. 85% und 80% für die semiquantitative Elastografie. Die semiquantitative Methode wies in ihrer Arbeit in der Summe demnach die höhere diagnostische Genauigkeit auf [77]. In der vorliegenden Arbeit lagen die Werte der qualitativen Elastografie zusammen mit denen der grafischen Darstellung der Scherwellenelastografie durchschnittlich noch weitere 10% unter den Ergebnissen der Metaanalyse von Sun et al., die Ergebnisse der semiquantitativen und der numerischen Darstellung der Scherwellenelastografie zwar auch unter den Ergebnissen der Metaanalyse, die Diskrepanz war jedoch kleiner. Ein Hinweis darauf, dass die semiquantitative und die numerische Darstellung der quantitativen Scherwellenelastografie weniger untersucherabhängig und reproduzierbarer sind. Im Vergleich der Studien von Bojunga et al. und Sun et al. bestätigte sich allerdings auch der Verdacht, dass sich die anfangs publizierten, extrem guten diagnostischen Werte für die Realtime-Elastografie von über 90% nicht auf größere Fallzahlen und inhomogenere Populationen übertragen lassen. Eine inzwischen schön häufig aufgezeigte Möglichkeit, die statistischen Werte der Elastografie zu erhöhen, zeigten unter anderem Trimboli et al. in ihrer MulticenterStudie, indem sie Malignitätskriterien der Elastografie mit Kriterien des herkömmlichen B-Bild-Ultraschallbildes kombinierten. Ihre Untersuchungs- durchführung, die Erhebung und Einteilung der Messwerte an einem Hitachi HI VISION Gerät entsprachen den Bedingungen dieser Arbeit und wären daher ohne Weiteres auf sie anwendbar. Trimboli et al. erhielten für die Elastografiescores 3 und 4 eine Sensitivität und Spezifität von 81% bzw. 62% und konnten die Sensitivität 70 Diskussion auf 97% erhöhen, indem sie einen Knoten als maligne klassifizierten, wenn dieser eines der folgenden Charakteristika aufwies: Hypoechogenität, Mikrokalzifizierungen, irreguläre Grenzen, intranoduläre Vaskularisation, TallerThan-Wide-Shape, Elastografiescore 3 oder 4. Sie schlugen vor, Knoten mit mindestens einem dieser Charakteristika zu punktieren [79]. Kwak et al. stellten in ihrem Bericht eine tabellarische Übersicht der Arbeiten vor, die sich in den letzten Jahren mit der Nützlichkeit von B-Mode-Ultraschall in Kombination mit Elastografie befassten: Sechs der neun dort aufgelisteten Arbeiten konnten durch eine Kombination der beiden Methoden ihre Sensitivität erhöhen. Die Sensitivitäten erlangten bei fünf dieser Arbeiten sogar Werte von mehr als 92%. Dieser Prozentsatz würde einen guten Suchtest mit der Aufgabenstellung, alle malignen Knoten zu erkennen, auszeichnen [44]. In diesem Zusammenhang sei auch noch einmal auf die Möglichkeit hingewiesen, die Elastografie zukünftig als festen Bestandteil in die TIRADS-Klassifikation mitaufzunehmen. 4.4 Vergleich der Arten der Elastografie Bei einem Vergleich der Elastografie zwischen den Geräten müssen die verschiedenen Aussagewerte der Geräte beachtet werden: die Interpretation eines Farbbildes, sowohl bei der qualitativen Kompressionselastografie (Hitachi, Toshiba) als auch bei der quantitativen Scherwellenelastografie (Siemens), die Erhebung eines Verhältniswertes von Schilddrüsengewebe zu Knotengewebe durch manuelle Kompression des Untersuchers, die semiquantitative Elastografie (Hitachi und Toshiba), und letztendlich die kompressionsfreie numerische Scherwellengeschwindigkeitsmessung, die quantitative Elastografie (Siemens). Zielsetzung dieser Arbeit war es, diese in ihrer Leistung und Untersucherfreundlichkeit zu untersuchen und miteinander zu vergleichen. Ein Vergleich zwischen Studien, die jeweils nur ein Gerät getestet haben, ist bei dieser Fragestellung nachteilig, da die Fallzahlen, Populationen und die Testdurchführung zwischen den Studien sehr unterschiedlich sein können. Daher muss als Stärke dieser Arbeit betont werden, dass die Knoten an allen drei Geräten untersucht wurden und somit ein unmittelbarer Vergleich der Geräte und Technologien ohne diese Störgrößen ermöglicht wird. 71 Diskussion Vorteile eines semi- bzw. quantitativen Verfahrens können eine bessere Reproduzierbarkeit und ein untersucherunabhängigeres Ergebnis sein. Bei einer Gegenüberstellung verschiedener Arbeiten zu Belastungs- (qualitativ), Belastungsverhältnis- (semiquantitativ) und Scherwellenelastografie (quantitativ) fanden Kwak et al. die höchste Reproduzierbarkeit bei den semiquantitativen und quantitativen Verfahren. Für die beiden letztgenannten wurden bisher jedoch keine Cut-off-Punkte etabliert und festgelegt, sodass der mögliche Vorteil der höheren Objektivität zum jetzigen Zeitpunkt hinten angestellt werden muss, da die erhobenen Zahlenwerte nicht eingeordnet und interpretiert werden können [44]. Nach derzeitigem Wissensstand gibt es keine Studie, welche die drei Ultraschallgeräte dieser Arbeit miteinander verglichen hat. Es existieren jedoch Arbeiten, die an jeweils einem der drei Geräte die zwei unterschiedlichen Elastografiemodalitäten untersucht haben und Arbeiten, die jeweils zwei der Geräte miteinander verglichen haben. Diese Arbeiten folgen in den letzten beiden Unterpunkten dieses Kapitels, zunächst erfolgt ein Vergleich der grafischen Interpretation der Kompressions- und Scherwellenelastografie, sowie ein Vergleich zwischen der semiquantitativen Kompressionselastografie und der numerischen Darstellung der Scherwellenelastografie. 4.4.1 Vergleich der grafischen Darstellung der Kompressions- und der Scherwellenelastografie Bei keinem der drei Ultraschallgeräte trug die Elastografie im Vergleich zum B-Bild zu einer besseren oder gleich guten Abgrenzbarkeit des Knotens vom umliegenden Schilddrüsenparenchym bei. Beim Hitachi Ultraschallgerät gelang dies mit 39,7% der Fälle noch am besten. Die Auflösung der Elastografie ist daher nicht so gut wie die Auflösung des B-Bildes und scheint auch zwischen den drei Ultraschallgeräten nicht gleich gut zu sein. Dies wirft zwangsläufig die Frage nach der Mindestgröße des Knotens für eine elastogafische Untersuchung auf und verdeutlicht die Wichtigkeit der bereits oben aufgeführten Diskussion. Durch dieses Ergebnis wird außerdem verdeutlicht, dass es für eine gute Untersuchung unerlässlich ist, das Elastogramm im sogenannten Split-ScreenModus neben dem herkömmlichen B-Bild darzustellen, damit der Untersucher für 72 Diskussion das exakte Setzen der ROIs im Elastogramm den genauen Verlauf der Knotengrenze nachvollziehen kann. Bei der Verteilung der Elastografiescores zeigte sich, dass bei allen drei Ultraschallgeräten die Wahrscheinlichkeit für eine maligne Läsion in der Gruppe, die das härteste Gewebe abbildete, am größten war. Die Wahrscheinlichkeit einer malignen Läsion in dieser Gruppe war beim Hitachi Ultraschallgerät mit 42,9% der Wahrscheinlichkeit des Siemens Ultraschallgerätes mit 40,0% sehr ähnlich, das Toshiba Gerät unterschied sich mit nur 22,2% Malignitätswahrscheinlichkeit für einen Knoten in dieser Gruppe deutlich von diesen beiden. Zwar zeigten die Ultraschallgeräte diese Diskrepanz in der Härtemessung dieser einzelnen Gruppe, fügte man jedoch für die Ermittlung von diagnostischen Werten die Gruppen mit Elastografiescore 3 und 4 zusammen, also die beiden Gruppen mit den am härtesten gemessenen Knoten, erhielt man interessanterweise für alle drei Ultraschallgeräte vergleichbare diagnostische Werte und der beobachtete Unterschied verkleinerte sich. In diesem Zusammenhang kann daher angenommen werden, dass die Einteilung der Elastografiescores 3 und 4 als maligne geräteübergreifend in etwa dieselben diagnostischen Werte liefert, auch wenn es Unterschiede zwischen den Messgenauigkeiten für einzelne Elastografiegruppen zwischen den Geräten zu geben scheint. Außerdem stellt sich ein Vergleich zwischen den Arbeiten an unterschiedlichen Ultraschallgeräten mit dieser Elastografiescoreeinteilung als legitim dar. 4.4.2 Vergleich der semiquantitativen Kompressionselastografie und der numerischen Darstellung der Scherwellenelastografie Die semiquantitative Kompressionselastografie am Hitachi und Toshiba Ultraschallgerät zeigte für den Einschluss aller Knoten ernüchternde Ergebnisse, da die gemessenen Strain-Ratio-Werte der benignen Knoten jeweils größer waren als die Werte der papillären Karzinome. Die benignen Knoten wurden folglich härter gemessen. Dies steht im Widerspruch zur aktuellen wissenschaftlichen Lehr- 73 Diskussion meinung, nach welcher die papillären Karzinome strukturell härtere Gewebeeigenschaften aufweisen als gutartige Knoten [4, 54]. Erst bei der Betrachtung der Subanalyse, in welche ausschließlich Strain-RatioWerte, die auf gleicher Höhe von Knoten und Schilddrüse erhoben wurden, einflossen, drehte sich das Größenverhältnis der Werte von benignen und malignen Knoten auf Seite des Hitachi Ultraschallgeräts um: Der Mittelwert der Strain-RatioWerte der benignen Knoten am Hitachi Ultraschallgerät betrug 2,5 und war somit kleiner als der Mittelwert der papillären Karzinome mit 4,1. Ableitend aus diesen Werten war das Gewebe der benignen Knoten elastischer einzustufen als das der malignen Knoten, was das bei dieser Untersuchung zu erwartende Ergebnis war. Diese Beobachtung zeigt deutlich, dass die Strain-Ratio-Werte stark von der gewählten Messtiefe abhängig sind und unterstreicht dabei die Bedeutung der ROIAuswahl für Knoten und Schilddrüse auf gleicher Höhe. Die Auswertung der Subanalyse am Toshiba Ultraschallgerät zeigte diese Umkehr des Größenverhältnisses von benignen und malignen Knoten nicht. Die Mittelwerte von benignen und malignen Knoten nahmen jedoch den gleichen Wert an, sie verschoben sich folglich in Richtung des erwarteten Verhältnisses. Dies bedeutete auf jeden Fall eine Verbesserung gegenüber den ersten Ergebnissen. Auch am Toshiba Ultraschallgerät wurde durch diese Ergebnisauswertung die Wichtigkeit einer Messung auf gleicher Höhe deutlich. Zusammenfassend lieferte das Hitachi Ultraschallgerät im direkten Vergleich der beiden Geräte die zufriedenstellenderen Ergebnisse. Bei der Messung der Scherwellengeschwindigkeit am Siemens Ultraschallgerät zeigten sich höhere mittlere Geschwindigkeiten für das papilläre Karzinom als für die benignen Knoten in den beiden Querschnittseinstellungen. Da Scherwellen sich schneller in festem als in lockerem Gewebe fortbewegen, stellten sich die papillären Karzinome in dieser Untersuchung folglich als härter und unelastischer als die benignen Knoten dar. Im Gegensatz zu den beiden anderen Ultraschallgeräten lieferte die Untersuchung am Siemens Gerät bereits für die Gesamtheit der Knoten und nicht erst für eine Subanalyse das zu erwartende Ergebnis. Der Hauptgrund hierfür ist höchstwahrscheinlich in der Abhängigkeit der am Hitachi und Toshiba Gerät erhobenen Strain-Ratio-Werte von der Messtiefe zu sehen: Unterschiede in der Messtiefe von Läsion und Schilddrüse führten hier zu falschen Ergebnissen. 74 Diskussion Nach Behebung dieser Störgröße konnten in dieser Arbeit die theoretisch überlegten Ergebnisse erzielt werden. Bei der Scherwellengeschwindigkeitsmessung des Siemens Gerätes werden dagegen keine Verhältnisse, sondern absolute Zahlen erfasst. Daher müssen keine zwei ROIs auf gleicher Höhe gesetzt werden. In Zusammenhang mit der gewählten Messtiefe soll an diesem Punkt auf das Ergebnis einer weiteren Studie dieser Arbeitsgruppe eingegangen werden: In dieser Studie konnte gezeigt werden, dass die Messungen der Scherwellen- geschwindigkeiten dennoch tiefenabhängig sind. So gab es einen signifikanten Unterschied zwischen den Messwerten der ventralen und der dorsalen Schilddrüsenhälfte [56]. Da in der vorliegenden Arbeit acht ROIs auf unterschiedlicher Höhe in der Läsion gesetzt wurden, ist jedoch davon auszugehen, dass die Unterschiede in der Messtiefe sich gegenseitig aufhoben und sich daher trotzdem das erwartete Ergebnis zeigte. Neben der gemessenen Scherwellengeschwindigkeit wird vom Siemens Ultraschallgerät auch die Messtiefe als Zahlenwert in cm angegeben. In der vorliegenden Arbeit wurde die Messtiefe bei der Erhebung am Siemens Gerät nicht berücksichtigt. Aufgrund der Ergebnisse der Arbeitsgruppe scheint dies jedoch zukünftig unabdingbar zu sein. Um eine gute Integration in den klinischen Alltag zu ermöglichen, muss die Frage nach einer direkten, geräteinternen Verrechnung der Messtiefe mit der Scherwellengeschwindigkeit gestellt werden. 4.4.3 Vergleich innerhalb der einzelnen Ultraschallgeräte 4.4.3.1 Vergleich der qualitativen und der semiquantitativen Kompressionselastografie am Hitachi Ultraschallgerät Insgesamt liegen sieben Arbeiten über einen Vergleich der qualitativen und semiquantitativen Elastografie an einem Hitachi Ultraschallgerät vor [13, 14, 41, 57, 66, 80, 87]. Diese sind in Tabelle 22 im Anhang aufgeführt. Aus folgenden Gründen wurde sich in der vorliegenden Arbeit dafür entschieden, die Werte für die semiquantitative Elastografie aus der Subanalyse mit Werten in gleicher Tiefe und nicht aus der ursprünglichen Erhebung mit den Mittelwerten zu berechnen. Erstens ist die Messung der Elastizität abhängig von der Messtiefe: 75 Diskussion Tiefer gelegenere Strukturen werden bei Kompression weniger stark belastet und verformt als oberflächlichere Strukturen, d.h. ein Vergleich zwischen der Härte von Strukturen ist nur in derselben Tiefe zu treffen, da dort die Gewebe die gleiche Belastung erfahren [4]. Zweitens erhoben viele Arbeiten, mit denen diese Studie verglichen werden soll, ihre Werte von Knoten und Schilddrüsenparenchym für die Berechnung der Strain-Ratio ebenfalls auf gleicher Höhe [57, 80, 87]. Als dritter Grund sind die im vorherigen Kapitel 4.4.2 aufgeführten Ergebnisse zu nennen. Leider gaben nicht alle Autoren ihre Messtiefe oder die Berücksichtigung dieser an, sodass ein standardisierter Vergleich zwischen den Arbeiten erschwert wurde [13]. Aus den Arbeiten von Refaat et al. war sogar ersichtlich, dass die Messungen nicht auf gleicher Höhe durchgeführt wurden [66]. In Tabelle 22 im Anhang ist daher jeweils die Angabe zur Messtiefe der einzelnen Arbeiten aufgeführt. Zudem wurden Strain-Ratio-Werte, die größer als 10 (n=8) waren, aus der Auswertung ausgeschlossen. Der Wert von 10 wurde basierend auf der Abbildung 19 im Ergebnisteil gewählt. Diese veranschaulicht, wie die Werte größer 10 aus der Anzahl der übrigen Strain-Ratio-Werte für Knoten ausreißen. In drei Studien fand sich eine Angabe, welche Bandbreiten die Strain-Ratio-Werte in den Messungen annahmen: Benigne Knoten lagen zwischen 0,3-54,5 und maligne Knoten zwischen 0,3-20,9 in der Arbeit von Ünlütürk et al., zwischen 0,39-151,0 lag die Gesamtheit der Knoten in der Arbeit von Cakir et al. und zwischen 0,4-5,4 befanden sich die benignen bzw. zwischen 1,47-3,61 die malignen Knoten in der Arbeit von Ciledag et al. [14, 18, 80]. Der Bereich, in dem Strain-Ratio-Werte aufgrund der physikalischen Gewebeeigenschaften von Knoten und Schilddrüse liegen sollten, muss diskutiert werden, denn ein Wert größer als 10 bedeutet, dass die Schilddrüse mehr als zehnmal so elastisch gemessen wurde als das Knotenparenchym [36]. Dies wirft die Frage nach der Validität der Messung auf. Da in der vorliegenden Arbeit jedoch nur jeweils eine Messung pro Knoten auf gleicher Höhe gemacht wurde, lässt sich diese Aussage nicht verifizieren. Andere Einflussgrößen, die eine hohe Strain-Ratio begünstigen könnten, wie die Pathologie des Knotens, zystische Knotenanteile, die Vaskularisation des Knotens, Mikro- und Makrokalzifizierungen, die TIRADSKlassifikation, die Lokalisation (rechter/ linker Schilddrüsenlappen, Isthmus), die Knotengröße, die Schilddrüsenhistopathologie und die unterschiedlichen 76 Diskussion Untersucher konnten in dieser Arbeit ausgeschlossen werden. Zukünftige Studien müssen der Frage nach einem gültigen Strain-Ratio-Bereich nachgehen. Beim unmittelbaren Vergleich der diagnostischen Werte dieser Arbeit lagen die Werte der semiquantitativen Elastografie insgesamt mit einer Sensitivität und Spezifität von 80,0% bzw. 72,2% über den Werten der qualitativen Elastografie mit einer Sensitivität von 66,7% im Querschnitt bzw. 83,3% im Längsschnitt und Spezifität von 48,5% im Quer- und 40,4% im Längsschnitt. Der ermittelte Cut-offPunkt von 2,97 für die semiquantitative Elastografie lieferte sogar einen signifikanten Unterschied zwischen den Gruppen der benignen und der malignen Knoten. Die Überlegenheit der semiquantitativen Elastografie zeigte sich bereits in der Mehrzahl der bisher publizierten Arbeiten [14, 41, 57, 87]. Die am besten mit dieser vergleichbare Arbeit, da sie die gleiche ElastografiescoreEinteilung vornahm, einen ähnlichen Cut-off-Punkt von 3,79 errechnete und die Messungen ebenfalls standardisiert in gleicher Tiefe durchgeführt wurden, wurde publiziert von Xing et al. mit 98 Knoten, von welchen 45 (45,6%) maligne waren. Xing et al. berechneten für beide Verfahren höhere diagnostische Werte als die vorliegende Arbeit (s. Tabelle 22 im Anhang). Diese sind zum einen erklärbar durch den Ausschluss von (teilweise) zystischen Knoten und Knoten mit verkalkter Schale, wodurch eine homogenere Untersuchungspopulation entstand. Zum anderen bedingt der wesentlich größere Anteil der malignen Knoten an der Gesamtknotenzahl eine höhere diagnostische Genauigkeit [6, 87]. Aktuelle Leitartikel zur Schilddrüsenelastografie schlagen aufgrund der Tatsache, dass Messungen durch entstehende Artefakte in zystischen und kalzifizierten Knoten fehlerhaft sein können, vor, diese von einer elastografischen Untersuchung auszunehmen [17, 44]. Eine verkalkte Schale war ein Ausschlusskriterium der vorliegenden Arbeit, jedoch wurde ein wenn auch meist kleiner zystischer Anteil bei mehr als 64% aller Knoten und speziell in 50% der papillären Karzinome beobachtet. Letztere wiesen allerdings durchgehend nur einen kleinen zystischen Anteil von ca. 5% auf. Einen größeren zystischen Anteil in Schilddrüsenkarzinomen fanden Henrichsen et al. in ihrer Arbeit mit 360 Schilddrüsenkarzinomen. Sie kamen zu dem Ergebnis, dass in 11,7% der Karzinome der zystische Anteil mehr als 5% betrug [35]. 77 Diskussion Die sich anschließende Frage ist, wieviel zystischen Knotenanteil man für eine elastografische Untersuchung zu Lasten der diagnostischen Genauigkeit tolerieren kann. Doch unabhängig davon bei welchem Anteil man eine Grenze zieht, für einen Teil der malignen Knoten wird die Elastografie als zusätzliche Untersuchungsoption ausfallen. Als weiterführende Diagnostik kommen dann invasiven Methoden, wie die Feinnadelpunktion oder die operative Entfernung der Läsion, in Frage. Folgt man den Leitartikeln und schließt nur Knoten ohne zystische Veränderung in elastografische Untersuchungen ein, muss evaluiert werden, ob sich weitere Geldund Zeitinvestitionen in diese Technik lohnen, da die Gruppe der Menschen, die davon profitieren kann, eventuell zu klein wird. Ein Vorteil der vorliegenden Studie gegenüber der von Xing et al. war, dass die Population, für die eine elastografische Untersuchung generell in Betracht kommt nämlich alle Menschen mit einem Schilddrüsenknoten - besser abgebildet und erfasst wurde, da sie näher an der tatsächlichen Prävalenz von 4,0-6,5% von Schilddrüsenkrebs an der Gesamtzahl der Schilddrüsenknoten in der Bevölkerung lag und zudem Knoten mit zystischem Anteil nicht von vorneherein ausgeschlossen wurden [64]. In diesem Punkt besser mit der vorliegenden Arbeit vergleichbar war die Arbeit von Cakal et al., die von 601 Knoten in Knotenstrumen keine Knoten im Vorfeld ausschloss und einen die tatsächliche Prävalenz abbildenden Anteil von 4,8% malignen Knoten hatte. Cakal et al. erhielten für beide elastografischen Verfahren beachtliche diagnostische und wesentlich höhere Werte als die vorliegende Arbeit (vgl. Tabelle 22). Die semiquantitative Elastografie zeigte sich der qualitativen Elastografie leicht überlegen und die Autoren schlugen diese als zukünftiges diagnostisches Tool vor. Jedoch äußerten sie auch, dass mit Hilfe der Scherwellentechnologie vermutlich noch bessere Resultate erzielt werden könnten, da sie weniger untersucherabhängig sei. Cakal et al. machten keine Angabe zur Schnittebene [13]. Für das oft hervorgebrachte Argument die Elastografie sei nicht reproduzierbar, entwickelte die Firma Hitachi eine Lösung: Sie integrierte eine Druckmessung im Sinne einer numerischen Skala, auf welcher der Untersucher in Echtzeit seinen aufgebrachten Druck überprüfen und gegebenenfalls anpassen kann. Dem Untersucher wird so zum einen eine größere Sicherheit während der Untersuchung 78 Diskussion gegeben und zum andern sind die Ergebnisse zwischen Untersuchungen besser vergleichbar. Bei einem Vergleich der bisher publizierten Arbeiten fiel auf, dass nicht alle Autoren eine Angabe über den von ihnen gewählten Druck machten. Dies erschwerte wie gesagt einen Vergleich zwischen den Studien und sollte zukünftig standardisiert werden. Der berechnete Cut-off-Punkt der Strain-Ratio in der vorliegenden Arbeit betrug 2,97 und befand sich somit im Bereich der bisher publizierten Werte von 2,1 bis 16,7. Die obere Grenze stellt vermutlich einen Ausreißer dar, da die Werte der übrigen fünf Arbeiten inklusive der vorliegenden Arbeit zwischen einer relativ kleinen Spannbreite von 2,1 und 3,79 lagen [13, 14, 66, 80, 87]. Der von Ning et al. berechnete Cut-off-Punkt von 4,225 fiel aus der Betrachtung raus, da die Autoren die Berechnung der Strain-Ratio als Verhältnis von Knoten zu Parenchym und nicht wie sonst üblich als das Verhältnis von Parenchym zu Knoten angaben [57]. Auch hier muss zukünftig eine einheitliche Definition erfolgen. Weitere Fallzahlen sowie eine Metaanalyse könnten helfen, den Bereich der Strain-Ratio weiter einzugrenzen. Außerdem ist mit Spannung das Ergebnis der großen MulticenterStudie zur Leistung der qualitativen und semiquantitativen Elastografie des Hitachi Ultraschallgerätes unter der Leitung der Goethe-Universität in Frankfurt am Main zu erwarten, zu welcher im Rahmen der vorliegenden Studie Daten von 45 Patienten beigetragen werden konnten. 4.4.3.2 Vergleich der qualitativen und semiquantitativen Kompressionselastografie am Toshiba Ultraschallgerät Mit einem Vergleich zwischen qualitativer und semiquantitativer Elastografie an einem Toshiba Ultraschallgerät befassten sich bisher deutlich weniger Studien mit einer insgesamt geringeren Knotenanzahl als das für ein Hitachi Ultraschallgerät der Fall war. Dies ist wichtig im Hinblick auf die Reliabilität mit der die Ergebnisse miteinander verglichen werden. Für einen Vergleich liegen drei Arbeiten, wie in Tabelle 23 im Anhang gezeigt, vor [3, 18, 81]. Beim Vergleich der qualitativen und der semiquantitativen Elastografie wurde sich in der vorliegenden Arbeit aus denselben Gründen wie beim Hitachi Ultraschallgerät für die Subanalyse mit den Messungen der Strain-Ratios aus Werten, die auf gleicher Höhe lagen, entschieden. Im Gegensatz zu den Arbeiten am Hitachi 79 Diskussion Ultraschallsystem, gaben beim Toshiba Gerät alle Autoren an, dass die ROIs für die Berechnung der Strain-Ratio auf gleicher Höhe gewählt wurden. Dies ermöglichte einen guten Vergleich der Arbeiten. Entgegengesetzt zu den Ergebnissen am Hitachi Ultraschallgerät lagen die diagnostischen Werte der qualitativen Elastografie beim Toshiba Gerät über den Werten der semiquantitativen Elastografie. Diese waren im Gegensatz zum Hitachi Gerät jedoch eher ernüchternd und zeigten wie bereits erwähnt keinen wesentlichen Unterschied zwischen Quer- und Längsschnitt. Für einen Vergleich mit der Arbeit von Ciledag et al. wurden in der vorliegenden Arbeit nachträglich die diagnostischen Werte für erstgenannte berechnet: Die qualitative Elastografie wies die diagnostisch höhere Sensitivität und Spezifität als die semiquantitative Elastografie auf (vgl. Tabelle 23 im Anhang). Insgesamt zeigten beide Elastografiearten in der Arbeit von Ciledag et al. wesentlich höhere Werte als die vorliegende Arbeit. Dabei zu beachten ist, dass die Autoren bei der semiquantitativen Elastografie das Verhältnis von Knoten zu Muskelgewebe und nicht von Knoten zu Schilddrüsengewebe maßen [18]. Im Gegensatz zu der Arbeit von Ciledag et al. und der vorliegenden Arbeit berechneten die beiden anderen Arbeiten von Aydin et al. und Wang et al. die diagnostische Wertigkeit für den Bereich der semiquantitativen Elastografie höher [3, 81]. Interessanterweise maßen Aydin et al. zum einen das Verhältnis zwischen Schilddrüsenparenchym und Knoten (PNSR) und zum anderen das Verhältnis zwischen Muskelgewebe und Knoten (MNSR). Sie fanden einen к-Wert von 0,87, was bedeutete, dass es eine fast vollständige Übereinstimmung zwischen diesen beiden Methoden hinsichtlich ihrer Testgenauigkeit gab [3]. Klinisch relevant ist dieses Ergebnis, da es im Rahmen von Erkrankungen Schilddrüsen mit strukturellen Veränderungen gibt, die die herkömmliche Messung von Knoten und Schilddrüsenparenchym schwierig bzw. unmöglich machen: Denkbar wären beispielsweise ein das umgebende Schilddrüsenparenchym verdrängender Knoten oder ein durch eine Thyreoiditis geschädigtes Schilddrüsenparenchym. Bisher veranlassten diese Veränderungen einige Autoren zu der Aussage, dass die semiquantitative Elastografie in dem Moment wertlos sei, in dem kein gesundes Schilddrüsenparenchym für einen Vergleich mehr zur Verfügung stehe [6, 54]. Als Antwort wäre für diese Fälle folglich eine Modifikation der Mes- 80 Diskussion sung, ein Vergleich von Knoten zu Muskelgewebe, denkbar. Voraussetzung wäre, dass die Patienten nicht an einer Erkrankung des Skelettmuskelgewebes leiden. Die Verhältniswerte von Muskel- zu Knotengewebe scheinen kleiner zu sein als die von Schilddrüsenparenchym zu Knotengewebe, Aydin et al. fanden den Verhältniswert von 1,85 und Ciledag et al. den Wert von 2,31 als besten Cut-offPunkt für diese Strain-Ratio zur Unterscheidung zwischen benignen und malignen Knoten. Kagoya et al., die diesen Vergleich an einem Hitachi Ultraschallgerät durchführten, fanden den optimalen Cut-off-Punkt bei 1,5, der auch unter den für das Hitachi Gerät ermittelten Cut-off-Punkten für den Vergleich zwischen Schilddrüsengewebe und Knoten lag [41]. Beim Vergleich der berechneten Cut-off-Punkte für die Strain-Ratios von Knoten und Schilddrüsenparenchym am Toshiba Gerät zeigte sich, dass die Werte sich nah beieinander und inklusive der vorliegenden Arbeit im Bereich von 2,48 und 3,85 befanden. Der dem wahren Wert vermutlich am nächsten liegende Wert von 3,14, wurde von Aydin et al. publiziert. Aydin et al. führten zum einen sehr standardisierte Messungen durch und erhielten zum anderen sehr hohe diagnostische Sensitivitäten und Spezifitäten für diesen Cut-off-Wert [3, 81]. Für eine bessere Reproduzierbarkeit der Messungen findet sich am Toshiba Ultraschallgerät die Darstellung eines Zeit-Druck-Kurvenverlaufs, die dem Untersucher die Option bietet, die Messungen auf gleicher Höhe der Kurve und somit mit ähnlichem Druck durchzuführen. Abschließend bleibt für den Vergleich der qualitativen und der semiquantitativen Elastografie an einem Hitachi bzw. einem Toshiba Ultraschallgerät zusammenfassend zu sagen, dass die qualitative Elastografie einfacher und schneller in eine Ultraschalluntersuchung integrierbar ist als die semiquantitative Elastografie, bei welcher für eine Messung zunächst vom Untersucher ROIs festgelegt werden müssen und die Messungen für eine Validierung eventuell wiederholt werden müssen. Zudem ist eine Bewertung des erhobenen Messwertes zum gegenwärtigen Zeitpunkt aufgrund fehlender Normwerte schwer praktikabel und es bleibt fraglich, ob diese Normwerte innerhalb der nächsten Jahre so genau festgesetzt werden können, dass es für eine zuverlässige Unterscheidung zwischen benignen und malignen Knoten reicht. Schneller und einfacher könnte wahrscheinlich ein Intervall für einen kritischen Übergangsbereich bestimmt 81 Diskussion werden: Werte unterhalb dieses Bereiches sprechen für Gutartigkeit, Werte oberhalb dieses Bereichs sprechen für Bösartigkeit und Knoten mit Werten innerhalb dieses Intervalls müssen verlaufskontrolliert und gegebenenfalls punktiert oder operiert werden. Erschwert wird der Findungsprozess des passenden Cut-off-Punktes durch eine bisher fehlende Standardisierung der elastografischen Untersuchung, die einen Vergleich der Studien und ihrer Messwerte quasi nicht zulässt. Für eine Standardisierung sind folgende Messangaben unerlässlich und sollten in der Datenerhebung künftiger Studien an Hitachi und Toshiba Ultraschallgeräten beachtet werden: 1. Schnittebene der Bildgebung (Längs- oder Querschnitt) 2. Druckintensität (numerische Skala (Hitachi), Zeit-Druck-Kurve (Toshiba)) 3. Tiefe, in der die Messwerte erhoben werden (bestenfalls in gleicher Tiefe) Auch wenn die semiquantitative Elastografie die höheren diagnostischen Werte aufwies, ist zum jetzigen Zeitpunkt für den klinischen Alltag der größere Nutzen in der qualitativen Elastografie aufgrund der oben aufgeführten Gründe zu sehen. 4.4.3.3 Vergleich der grafischen und numerischen Darstellung der Scherwellenelastografie am Siemens Ultraschallgerät 4.4.3.3.1 Vergleich der diagnostischen Performance der grafischen und numerischen Darstellung Bisher gibt es keine Veröffentlichungen von Arbeiten, die sich mit der Elastografiedarstellung von Schilddrüsenknoten mittels des Programms Virtual Touch™ IQ (VTIQ) des Siemens Acuson S3000 Ultraschallgerät befasst haben. Daher beschäftigt sich der erste Teil dieses Kapitel mit einem Vergleich von Arbeiten, die mit den Vorgänger-Programmen gearbeitet haben, und der zweite Teil dieses Kapitels mit einer Arbeit, die das Programm Virtual Touch™ IQ für die Untersuchung von Brustknoten verwendet hat. Vier Arbeiten mit dem Vergleich der Vorgängerprogramme Virtual Touch™ Imaging (VTI) und Virtual Touch™ Quantification (VTQ) am Siemens Acuson S2000, die in der nächsten Generation im Siemens Acuson S3000 zum Programm Virtual Touch™ IQ zusammengefasst wurden, wurden publiziert [15, 46, 88, 90]. Diese sind in Tabelle 24 im Anhang aufgeführt. In dieser Arbeit wird die Farbklassifikation des 82 Diskussion Programms Virtual Touch™ IQ als grafische Darstellung der quantitativen Elastografie bezeichnet. Einige Autoren publizierten diese Methode als qualitative Darstellung der Scherwellenelastografie [15, 31, 38]. Diese Bezeichnung ist sicherlich nicht ganz exakt, da auch die Farbgebung des Elastogramms nicht durch manuelle Kompression wie bei Hitachi und Toshiba, sondern mittels Scherwellen generiert wird und somit nicht als rein qualitatives Verfahren zu werten ist. Die Bezeichnung „qualitativ“ in diesem Kontext bleibt also diskussionswürdig. Die Messung der Scherwellengeschwindigkeit wird als numerische Angabe der quantitativen Methode bezeichnet, da hier absolute Zahlenwerte vom Gerät gemessen und angegeben werden und durch diese zusätzliche Bezeichnung eine deutlichere Abgrenzung zwischen den beiden Anteilen der Scherwellenelastografie erfolgt. Im Vergleich der grafischen und der numerischen Aussage des Programms fanden sich in dieser Arbeit für den Querschnitt interessanterweise die gleichen diagnostischen Werte für beide Methoden. In den Arbeiten von Calvete et al., Liang et al., Xu et al. und Zhang et al. lieferte die grafische VTI jeweils die höheren diagnostischen Werte [15, 46, 88, 90]. Zu beachten in der Arbeit von Calvete et al. war, dass die Autoren zwei unterschiedliche Cut-off-Punkte wählten: Für den Cutoff-Punkt von 2,5 m/s erhielten sie für die VTQ minimal höhere diagnostische Werte als für die VTI. Dass die VTI in der überwiegenden Anzahl der Fälle die besseren diagnostischen Werte liefert, ist nicht verwunderlich, da die für die Messung der Scherwellengeschwindigkeiten gesetzten ROIs bereits vom Programm VTQ in den Maßen 0,5 mm x 0,5 mm unveränderlich fest eingestellt sind und so, mit Zunahme der Knotengröße, ein immer kleiner werdender Anteil des Knotens repräsentiert und gemessen wird. Im Gegensatz dazu bildet die grafische Elastografie in der Bildgebung den ganzen Knoten ab. Zwar versuchen alle fünf Arbeiten inklusive der vorliegenden durch das Setzen mehrerer ROIs innerhalb des Knotens diesen in seiner Gesamtheit besser abzubilden und dadurch die Genauigkeit der Messung zu erhöhen, doch scheint dies nur mäßig erfolgreich gewesen zu sein, da diese Methode hinsichtlich der diagnostischen Werte unterlegen blieb. Zhang et al. beschrieben in ihrer Arbeit sehr anschaulich, wie die Bandbreite der Messwerte mit zunehmender Knotengröße immer größer wurde und sie große Knoten in kleinere 83 Diskussion Flächen unterteilten, um diese dann einzeln zu messen und so den Knoten in seiner Gesamtheit besser zu erfassen [90]. Eine weitere Arbeit, die zwar keinen Vergleich der beiden Programme VTI und VTQ durchführte, sondern die Interobserver-Übereinstimmung des Programms VTQ bei der Untersuchung von Schilddrüsenknoten prüfte, wurde publiziert von Grazhdani et al. Zwei Untersucher wählten jeweils unabhängig voneinander fünf ROIs pro Knoten aus, aus welchen der Mittelwert für den Vergleich erhoben wurde. Cohens Kappa für die Interobserver-Übereinstimmung wies einen Wert von к=0,755 auf [31]. Ein Wert, der zwar eine beachtliche Übereinstimmung der Ergebnisse der beiden Untersucher anzeigte, jedoch dafür dass es sich um eine rein quantitative - bis auf das subjektive Setzen der ROIs - Untersuchung handelt, unerwartet niedrig war. Das Setzen mehrerer ROIs konnte bzw. kann dieser Subjektivität wohl entgegenwirken, wohl aber nicht in ausreichender Weise. Dieses Ergebnis verdeutlicht, wie untersucherabhängig dieses vermeintlich „objektivere“ Untersuchungsverfahren trotzdem ist. Ein weiterer Einflussfaktor, der in dieser Arbeitsgruppe zur Generierung von Normwerten mittels ARFI-VTIQ für unterschiedliche Organe von Neuwirt et al. für das gesunde Schilddrüsengewebe gezeigt werde konnte, ist, dass sich die Messwerte je nach Messtiefe unterscheiden: Die Scherwellengeschwindigkeiten, die in der ventralen Schilddrüsenhälfte gemessen wurden, waren signifikant größer als die Scherwellengeschwindigkeiten der dorsal gelegenen Hälfte [56]. Übertragen auf die Messungen von Geschwindigkeiten an Schilddrüsenknoten bedeutet dies, dass die Cut-off-Punkte in Abhängigkeit von der Messtiefe betrachtet werden müssen, da diese offensichtlich ein Störfaktor ist. Bisher wurde in den veröffentlichten Arbeiten dieser Umstand nicht berücksichtigt, was eine weitere Erklärung für die schlechteren Ergebnisse der numerischen Elastografie sein könnte [15, 46, 88, 90]. Alle vier publizierten Arbeiten wiesen in den beiden Untersuchungsmethoden VTI und VTQ höhere diagnostische Werte als die vorliegende Arbeit auf. Zur Qualitätssicherung wurden in der vorliegenden Arbeit zum einen für jedes erhobene Elastogramm die geräteinterne Qualitätsüberprüfung durchgeführt und nur die Elastogramme akzeptiert, bei welchen mindestens 95% der Fläche als „gute Qualität“ erkannt wurden, zum anderen wurden für jeden Knoten acht 84 Diskussion Scherwellengeschwindigkeitsmessungen vorgenommen, sodass ein repräsentativer Mittelwert gebildet werden konnte. Zhang et al. führten für ihre größeren Knoten ebenfalls acht Messungen durch, schlossen von vornherein allerdings alle Knoten, die größer als 2 cm waren oder mehr als 20% zystischen Inhalt hatten, aus [90]. Ähnlich verfuhren Liang et al., die nur Knoten in ihre Studie mitaufnahmen, deren solider Anteil größer als 75% war [46]. So entstanden in beiden Arbeiten homogenere Gruppen als das in der vorliegenden Arbeit der Fall war und könnte die höhere Sensitivität und Spezifität erklären. Calvete et al. wiesen zwar eine größere Fallzahl auf als die vorliegende Arbeit, führten jedoch nur eine Messung pro Knoten und Schnittebene in der VTQ, von einem einzigen Untersucher ausgewählt, durch. Diese Verfahrensweise erscheint aufgrund des einzelnen Untersuchers sehr subjektiv und begünstigt durch eine homogenere Auswahl der ROIs auf diese Weise höhere diagnostische Werte. Die Arbeit von Xu et al. wies mit 441 Knoten die größte Fallzahl der Vergleichsarbeiten auf. Es erfolgte kein Ausschluss von Knoten aufgrund ihrer Morphologie, jedoch wurden die ROIs im Programm VTQ von den Untersuchern nicht zufällig wie in der vorliegenden Arbeit in der Läsion platziert, sondern es wurden gezielt zystische oder kalzifizierte Knotenanteile ausgespart. Xu et al. führten sieben Messungen pro Knoten durch, von denen sie jeweils den niedrigsten und höchsten Wert ausschlossen. Dagegen gingen in der vorliegenden Arbeit alle Messwerte ohne Ausschluss in die Berechnung mit ein. Durch diese beiden Anwendungsverfahren erhielten Xu et al. ein homogeneres Kollektiv für die Auswertung des Programms VTQ. Für die Klassifikation der grafischen Scherwellenelastografie der Knoten mittels des Programms VTI wählten Xu et al. die Einteilung in sechs Elastografiescores. Durch diese Einteilung wurden mehr Möglichkeiten der Elastogrammzusammensetzung abgebildet und die Knoten konnten differenzierter zugeordnet werden. Wie bereits im Kapitel 4.3.2 in der Diskussion zur Elastografiescore-Einteilung aufgeführt, werden so womöglich höhere diagnostische Werte bedingt, auf der anderen Seite entsteht für den Untersucher ein höherer Zeitaufwand, da mehr Optionen von ihm in Betracht gezogen werden müssen. Bei einem Vergleich der publizierten Cut-off-Punkte für die Scherwellengeschwindigkeit von benignen und malignen Knoten fand sich, dass die Werte von Xu et al. von 2,87 m/s und Zhang et al. von 2,90 m/s dem in der 85 Diskussion vorliegenden Arbeit im Längsschnitt berechneten von Wert von 2,90 m/s entsprachen. Die Autoren machten jedoch keine validen Angaben zu den von ihnen gewählten Schnittebenen [88, 90]. Calvete et al. berechneten für ihre Erhebung im Längsschnitt einen Cut-off-Punkt von 2,5 m/s [15]. Liang et al. wählten in der Angabe der Cut-off-Punkte eine andere Vorgehensweise: Sie berechneten einen Cut-off-Punkt für benigne Knoten (2,01 m/s) und einen für maligne Knoten (3,65 m/s): Knoten mit benigner Histologie und unter 2,01 m/s wurden als richtig negativ, benigne Knoten über 3,65 m/s als falsch positiv gewertet. Knoten mit maligner Histologie und kleiner 2,01 m/s wurden als falsch negativ angesehen [46]. Diese Vorgehensweise scheint in der klinischen Praxis nicht umsetzbar zu sein, da der Untersucher in der Regel zum Zeitpunkt der elastografischen Untersuchung die Dignität des Knotens nicht kennt und daher nicht weiß, welchen Grenzwert er für die Unterscheidung anwenden soll. In der Zusammenschau ist zum jetzigen Zeitpunkt aus folgenden Gründen der größere klinische Nutzen in der grafischen Darstellung der Scherwellenelastografie zu sehen: Die Messungen der numerischen Elastografie sind durch das Setzen mehrere ROIs zeitintensiv und daher schlecht in den klinischen Alltag integrierbar. Die Beurteilung der grafischen Darstellung benötigt dagegen nur die Erhebung eines einzelnen Elastogramms. Das Problem des hohen Zeitaufwandes der numerischen Elastografie wäre zukünftig zum einen dadurch zu lösen, dass nur kleine Knoten, die eine Fläche von beispielsweise einem Quadratzentimeter nicht überschreiten und daher mit drei bis vier ROIs vollständig abgebildet werden könnten, mittels der numerischen Scherwellenmessungen evaluiert werden. Dass kleine Knoten mindestens genauso häufig wie große Knoten Malignität aufweisen, wurde bereits im Kapitel 4.2.1.2 der vorliegenden Arbeit diskutiert und lässt die Überlegung, die kleinen Knoten mittels der numerischen Scherwellenelastografie zu untersuchen, lohnenswert erscheinen. Zum anderen wäre denkbar, dass in der nächsten Generation der Siemens Ultraschallgeräte das Programm VTIQ dahingehend weiterentwickelt würde, dass die Größe der ROI an die Knotengröße manuell adjustiert werden könnte. Auch dort könnten dann vom Gerät innerhalb dieser ROI mehrere Messungen durchgeführt und ein Mittelwert gebildet werden, aber der Untersucher wäre durch das Setzen von nur einer ROI zeitlich entlastet und zusätzlich würde die Objektivität der 86 Diskussion Messung steigen, da die subjektive Auswahl der ROIs durch den Untersucher wegfallen würde. Des Weiteren muss der Aspekt beachtet werden, dass die Messungen der Scherwellen tiefenabhängig sind. Dies muss zukünftig entweder durch den Untersucher in der Betrachtung von Cut-off-Punkten getrennt für ventrale und dorsale Messungen Berücksichtigung finden - was die Untersuchung verkomplizieren würde - oder wiederum durch den Ultraschallhersteller in einer Weiterentwicklung des Programms bedacht werden. Als letzter und sehr wichtiger Punkt muss als weiterer Nachteil des Programms VTQ aufgeführt werden, dass zum jetzigen Zeitpunkt keine Cut-off-Werte der Scherwellengeschwindigkeiten zur Differenzierung benigner von malignen Knoten etabliert sind, sodass dem Untersucher derzeit keine valide Einordnung seiner Messergebnisse möglich ist. Der zweite Teil dieses Kapitels beschäftigt sich abschließend noch mit einer Arbeit von Ianculescu et al., die 110 Brustknoten sowohl mit der grafischen als auch mit der numerischen Elastografiekomponente des Programms Virtual Touch™ IQ untersuchten [38]. Knoten in Brust- und in Schilddrüsengewebe weisen viele Gemeinsamkeiten, wie beispielsweise die Verhärtung des Knotengewebes im Vergleich zum umgebenden Gewebe und die oberflächliche und damit gut zugängliche Lage, auf [49, 89]. Auch wurden bereits Klassifikationen für die Schilddrüse aus dem Bereich der Brustdrüse übernommen: So leitete sich die TIRADS-Klassifikation beispielsweise von der BIRADS-Klassifikation (Breast Imaging Reporting and Data System) ab und die Farbklassifikation des Elastogramms für die Schilddrüse ging in einigen Arbeiten auf die Klassifikationen von Ueno et al., die diese ursprünglich für Brustknoten entwickelt hatten, zurück [30, 37, 65, 70, 82]. Daher erscheint die Betrachtung und Diskussion der Arbeit von Ianculescu et al. an dieser Stelle als angebracht und sinnvoll: Die Autoren gaben für die grafische Darstellung der Scherwellenelastografie eine Sensitivität und Spezifität von 92% bzw. 64,6% und für die numerische Darstellung bei einem Cut-off-Punkt von 3,31 m/s eine Sensitivität und Spezifität von 80,4% bzw. 73% an. Allerdings strebten sie weniger einen direkten Vergleich der beiden Komponenten an, als dass sie den möglichen zusätzlichen diagnostischen Nutzen der Scherwellentechnologie zur BIRADS-Klassifikation feststellen wollten. Tatsächlich konnten sie durch eine Anwendung des Schwellenwertes von 3,31 m/s auf alle Knoten, die zuvor in die BIRADS-Kategorie 87 Diskussion 4a eingestuft worden waren, die Sensitivität auf 92% erhöhen, die Spezifität blieb mit 72,9% in etwa konstant [38]. Zwei Aussagen sind in Zusammenhang mit dieser Arbeit wichtig: Zum einen zeigten Ianculescu et al., dass die grafische Darstellung des Programms VTIQ besser zwischen gut- und bösartigen Knoten unterscheiden konnte als die numerische Darstellung. Dies hatten auch Calvete et al. und Zhang et al. bei der Untersuchung mit den Vorgängerprogrammen festgestellt. Zum anderen verstanden Ianculescu et al. die Elastografie weniger als isoliert anzuwendende Untersuchungsmethode, sondern unterstrichen den Nutzen der Elastografie für die Kombination mit anderen diagnostischen Methoden bzw. für eine vorausgewählte und dadurch homogenere Population (Analyse der Knoten in BIRADS-Kategorie 4a). Analog zur letztgenannten Vorgehensweise könnte bei den Schilddrüsenknoten eine Vorauswahl mittels der TIRADS-Klassifikation erfolgen. 4.4.3.3.2 Vergleich der unterschiedlichen Skaleneinstellungen Am Kapitelende der Scherwellenelastografie des Siemens Ultraschallgerätes sollen die verwendeten, unterschiedlichen Skaleneinstellungen diskutiert werden. Aufgrund fehlender Erfahrungswerte seitens des Geräteherstellers und der klinischen Praxis wurden die Messwerte für die Skaleneinstellung von 0,5-3,0 m/s, 0,5-6,5 m/s, 0,5-9,0 m/s im Querschnitt und 0,5-6,5 m/s im Längsschnitt erhoben [84]. Liegt eine gemessene Scherwellengeschwindigkeit außerhalb dieses Bereiches wird der Wert mit Vs=HOCH bzw. Vs=TIEF und in der Farbgebung mit dunkelrot präsentiert [73]. Der Vorteil eines kleineren Skalenintervalls ist eine bessere Farbdifferenzierung zwischen sich gering unterscheidenden Geschwindigkeiten. Der Nachteil ist, dass Messgeschwindigkeiten, die außerhalb des Wertebereichs der Skala liegen, nicht erfasst werden können. Andersherum werden bei einem großen Skalenintervall alle Geschwindigkeiten erfasst, die optische Unterscheidung zwischen kleinen Geschwindigkeitsunterschieden aber erschwert. Die Arbeit von Monpeyssen et al. griff bisher als einzige die Frage nach der korrekten Skaleneinstellung für eine Scherwellenuntersuchung der Schilddrüse auf. War der obere Grenzwert laut den Autoren zu hoch angesetzt, unterschied sich das härtere Knotengewebe farblich nicht mehr vom umgebenden Schilddrüsenparenchym und die beiden Gewebe wurden einheitlich als weich dargestellt [54] . 88 Diskussion Da in der vorliegenden Ergebnisauswertung zu viele Ergebnisse in der Skaleneinstellung 0,5-3,0 m/s außerhalb des Messbereichs lagen, wurde diese Datenreihe nicht mit in die vorliegende Arbeit aufgenommen und ist auch für zukünftige Untersuchungen nicht empfehlenswert. Um nun die anderen Skaleneinstellungen zu bewerten, wurden die einzelnen Ergebnisse der numerischen Scherwellenelastografie gegenübergestellt: In der numerischen Darstellung der Scherwellengeschwindigkeiten zeigte die Skaleneistellung 0,5-9,0 m/s im Querschnitt das beste Ergebnis, da hier der größte Unterschied zwischen den mittleren Scherwellengeschwindigkeiten von benignen Knoten auf der einen Seite und malignen Knoten auf der anderen Seite zu beobachten war. Ein großer Unterschied zwischen den Messwerten ermöglichte eine gute Differenzierung zwischen den beiden Gruppen. Dieser Unterschied war jedoch nicht signifikant. Die gemessenen Scherwellengeschwindigkeiten in dieser Einstellung bewegten sich für benigne Knoten zwischen 1,5 und 7,5 m/s und für maligne Knoten zwischen 1,8 und 8,4 m/s. Eine Erhebung der grafischen Scherwellenelastografie fand nur für eine Skaleneinstellung von 0,5-6,5 m/s im Quer- und Längsschnitt statt. Möchte man aus diesen Ergebnissen und den Vor- bzw. Nachteilen ableitend zum einen ein möglichst kleines Skalenintervall für eine gute farbliche Differenzierung einstellen, zum anderen aber trotzdem alle Knoten in der Einstellung erfassen, wäre eine optimale Skaleneinstellung für den Querschnitt folglich 1,5-8,4 m/s bzw. 1,5-8,5 m/s, da vom Ultraschallgerät nur Intervallsprünge von 0,5 m/s eingestellt werden können. Mit einem Toleranzbereich für die Messwerte und einer möglichst untersucherfreundlichen Einstellung könnte sich das Intervall auf 1,0-9,0 m/s erweitern. Anzunehmen ist jedoch, dass dieses relativ große Intervall wiederum in der Abgrenzung der grafischen Scherwellendarstellung Schwierigkeiten bereitet, wie in der Arbeit von Monpeyssen et al. beschrieben. Zukünftige Arbeiten müssen die Reliabilität dieses Bereiches in der klinischen Anwendung prüfen. 89 Diskussion 4.4.4 Vergleich der verschiedenen Arten der Elastografie zwischen den Geräten 4.4.4.1 Vergleich der Ergebnisse bisher publizierten Arbeiten Wie bereits erwähnt, wurden zudem Arbeiten publiziert, die nicht einen Vergleich zwischen Elastografiemodalitäten an einem Gerät, sondern zwischen verschiedenen Geräten durchführten [9, 27, 74]. Dadurch konnten gezielt die Vorund Nachteile der einzelnen Technologien, die der Elastografie zugrunde liegen, verglichen werden. Zunächst wird in diesem Kapitel kurz auf die drei vergleichenden Arbeiten eingegangen und anschließend erläutert, welches der drei Ultraschallgeräte nach den Ergebnissen der vorliegenden Arbeit unter welchen Gesichtspunkten vorteilig ist. Friedrich-Rust et al. untersuchten 2011 als erste die ARFI-Technologie an Schilddrüsenknoten und untersuchten diese Knoten gleichzeitig auch mittels Kompressionselastografie. Den Schwerpunkt legten die Autoren weniger auf den direkten Vergleich der Methoden als vielmehr auf die Frage, ob Schilddrüsenknoten überhaupt für die ARFI-Technologie zugänglich seien und ob diese Technik vergleichbare Ergebnisse in der Beurteilung erzielen könne. Daher wurden außer dem signifikanten Spearman Korrelationskoeffizienten von 0,31 zwischen den beiden Methoden keine weiteren diagnostischen Werte für einen Vergleich angegeben. Dieser Wert des Korrelationskoeffizienten zeigte jedoch nur einen schwachen Zusammenhang zwischen den beiden Methoden an [27]. Die Nachfolgestudie dieser Arbeitsgruppe, publiziert von Bojunga et al., beinhaltete 158 Knoten, die zum einen mit der Realtime-Elastografie (RTE) eines Hitachi Ultraschallgerätes und zum anderen mit der ARFI-Bildgebung des Programms Virtual-Touch™ Quantification (VTQ) eines Siemens Acuson S2000 untersucht wurden. Die Einteilung der farblichen Elastogramme erfolgte in vier Elastografiescores (ES) und ES 3 und 4 wurden als maligne definiert. Die gemessenen Scherwellengeschwindigkeiten wurden in m/s angegeben und ein optimaler Cut-off-Wert von 2,57 m/s bestimmt. Zur statistischen Auswertung wurde im Rahmen der ROC-Analyse die Fläche unter der Kurve für beide Verfahren berechnet: Die RTE wies mit 0,74 die bessere Diskriminierungsfähigkeit von benignen und malignen Knoten im Vergleich zur ARFI-Schwellengrenze von 2,57 90 Diskussion m/s mit 0,69 auf. Die einzelnen diagnostischen Werte der beiden Verfahren sind in Tabelle 25 im Anhang aufgeführt: Die RTE hatte mit 76% die höhere Sensitivität, die ARFI-VTQ die höhere Spezifität mit 85%. Es gab jedoch keinen signifikanten Unterschied zwischen beiden Untersuchungsmethoden. Auch durch eine Kombination der beiden Elastografiearten RTE und ARFI konnten Bojunga et al. die diagnostische Genauigkeit nicht erhöhen [9]. Die letzte vergleichende Arbeit mit sechs Knoten (eine maligne Histopathologie) wurde publiziert von Slapa et al. Die Kompressionselastografie wurde an einem Toshiba Ultraschallgerät, die Scherwellenelastografie an einem Supersonic Image Ultraschallgerät untersucht. Letzteres wurde in der vorliegenden Arbeit nicht benutzt. Zudem war es eine sehr kleine Fallzahl. Dennoch fanden Slapa et al. diskussionswürdige Ergebnisse: Die Scherwellenelastografie wies ein richtig positives und fünf richtig negative Ergebnisse auf, die Kompressionselastografie fünf falsch positive und ein falsch negatives Ergebnis. Die falsch positiven Knoten wiesen mindestens eins der folgenden Kriterien auf: flüssiger oder degenerativer Inhalt, fokal erhöhte Steifigkeit durch Mikrokalzifizierungen, die im B-Bild teilweise nicht sichtbar waren. Die Autoren folgerten, dass die Scherwellenelastografie im Gegensatz zur Kompressionselastografie auch bei Knoten mit diesen Charakteristika effektiv für eine Differenzierung eingesetzt werden konnte [74]. Eine derartige Diskrepanz in der diagnostischen Performance konnte in der vorliegenden Arbeit nicht beobachtet werden, obwohl auch diese teilweise zystische Knoten und Knoten mit Mikrokalzifizierungen enthielt: Zwar lagen die Messung der Scherwellengeschwindigkeit beim Siemens Ultraschallgerät im Querschnitt mit 66,7% Sensitivität und 68,1% Spezifität über den Werten der semiquantitativen Elastografie des Toshiba mit 60,0% bzw. 48,5%, jedoch übertrafen sie nicht die ebenfalls mit Kompressionselastografie ermittelten semiquantitativen Werte des Hitachi Ultraschallgerätes von 80,0% bzw. 72,2%. Die Ergebnisse von Slapa et al. zeigten sich in der vorliegenden Arbeit folglich nicht und dürfen aufgrund der geringen Fallzahl auch zunächst nicht im Allgemeinen gelten. 91 Diskussion 4.4.4.2 Zusammenfassender Vergleich der drei Ultraschallgeräte Im Folgenden sollen die Ergebnisse der vorliegenden Arbeit zusammengefasst dargestellt werden: Betrachtete man bei der Frage, welches der Ultraschallgeräte das beste Gerät sei, allein die diagnostischen Werte für die qualitative, semiquantitative und quantitative Elastografie der drei Ultraschallgeräte, fand man die höchste Sensitivität mit 83,3% bei der qualitativen Elastografie im Längsschnitt am Hitachi HI VISION Ascendus. Die höchste Spezifität mit 72,2% erreichte ebenfalls das Hitachi Ultraschallgerät jedoch in der semiquantitativen Elastografie. Ebenso erhielt man die größte Summe aus Sensitivität und Spezifität beim Hitachi Gerät in der semiquantitativen Elastografie, gefolgt vom Siemens Ultraschallgerät, das im Querschnitt in der grafischen und in der numerischen Darstellung der Scherwellenelastografie die gleichen diagnostischen Werte aufwies. In der Summe die schlechtesten Werte erzielten das Toshiba Gerät im Längsschnitt in der qualitativen Elastografie und das Siemens Gerät im Längsschnitt in der numerischen Messung der Scherwellengeschwindigkeit. Den einzigen signifikanten p-Wert für die Differenzierung zwischen benignen und malignen Knoten erhielt man bei der semiquantitativen Elastografie am Hitachi Ultraschallgerät bei der Erhebung von Strain-Ratio-Werten für die Subanalyse. Dieses Ergebnis ist jedoch aufgrund der geringen Fallzahl mit Zurückhaltung zu betrachten. Keines der Geräte war aufgrund seiner diagnostischen Wertigkeit in dem Maße überlegen, als dass zukünftig die elastografische Untersuchung von Schilddrüsenknoten nur an einem dieser Geräte durchgeführt werden sollte. Da zudem oft nur eines der Geräte vor allem in kleineren Krankenhäusern oder Praxen vorhanden ist, kann der Knoten an diesem elastografisch untersucht werden. Knoten mit zystischen Anteilen sollten jedoch ausgeschlossen werden, da ihr Einfluss auf die Messung zum jetzigen Zeitpunkt nicht klar abgeschätzt werden kann. Die Elastografie sollte immer in Kombination mit der Untersuchung des Knotens im herkömmlichen B-Bild erfolgen und muss als additionale Untersuchungsmethode verstanden werden. Nur durch eine Darstellung im B-Bild können die sicheren Malignitätskriterien wie infiltratives Wachstum oder Lymphknotenmetastasten erkannt bzw. ausgeschlossen werden. Ein Vorteil des Hitachi Ultraschallgerätes im Vergleich zum Toshiba Ultraschallgerät ist die Messung der applizierten Druckstärke in Form einer Zahlenskala. Zwischen 92 Diskussion unterschiedlichen Untersuchern kann für die Reproduzierbarkeit der Messung eine Zahl als Standarduntersuchungsdruck festgelegt werden. Das Toshiba Gerät zeigt dem Untersucher den applizierten Druck in Form einer „Zeit-relative Druckstärke“Kurve an. Auch wenn hier beispielsweise der Messzeitpunkt „im Tal“ standardmäßig gewählt wird, ist diese Angabe nur relativ, da das Tal bei dem einen Untersucher trotzdem tiefer liegen kann als bei einem anderen Untersucher. Deshalb liegt die größere Objektivität bzw. Reproduzierbarkeit der beiden Ultraschallgeräte, die sich der Kompressionselastografie bedienen, auf Seiten des Hitachi Gerätes. Bei der Generierung von Cut-off-Punkten für die Strain-Ratio der beiden Geräte stellt sich die Frage, ob nicht ein geräteübergreifender Wert ermittelt werden kann. Zwar kann es Unterschiede zwischen den Messungen der Geräte geben, aber durch die Berechnung eines Quotienten sollten diese sich ausgleichen. Zukünftige Metaanalysen mit großen Fallzahlen könnten die Ermittlung eines gemeinsamen Cut-off-Punktes für die Stain-Ratio für eine Vereinheitlichung der Geräte als Aufgabe haben. In der Zusammenschau aller Ergebnisse erscheint die elastografische Untersuchung von Schilddrüsenknoten am Siemens Acuson Ultraschallgerät in der grafischen Darstellung der Scherwellenelastografie mit Hilfe der Software VTI oder VTIQ aufgrund folgender Aspekte am sinnvollsten: Bei der Scherwellenelastografie handelt es sich zum einen um die objektivste Untersuchungstechnologie. Die grafische Darstellung hat gegenüber der numerischen Messung den Vorteil, dass der komplette Knoten als Ganzes sofort abgebildet und dem Untersucher das zeitintensive Setzen der einzelnen Mess-ROIs erspart wird. Dies wiederum ermöglicht eine gute Integration in den klinischen Alltag im Anschluss an die herkömmliche B-Bild-Untersuchung. Ein weiterer Grund für diese Untersuchung am Siemens Gerät ist, dass sie in der vorliegenden Arbeit die zweitbesten diagnostischen Werte aufweist und auch die Ergebnisse der übrigen Publikationen sehr zufriedenstellend sind mit Sensitivitäten und Spezifitäten über 95% bzw. 82% [15, 90]. Zukünftig überlegenswert erscheint, ob die numerische Darstellung der Scherwellenelastografie des Siemens Ultraschallgerätes für eine Gruppe von vorausgewählte Knoten, die beispielsweise in eine bestimmte TIRADS-Kategorie fallen oder eine bestimmte Größe nicht überschreiten, Anwendung finden kann. 93 Diskussion Bisher war das Setzen mehrerer ROIs in diesem Verfahren zeitintensiv, doch könnte eine Zeitersparnis durch eine Vorauswahl der Knoten oder durch die Festlegung einer maximal zulässigen Knotengröße erwirkt werden. Die zugrunde liegende Scherwellentechnologie liefert wie bereits aufgeführt vielversprechende Ergebnisse und besitzt daher großes Potential für zukünftige elastografische Forschung. 4.5 Weitere Vergleichsmessungen der numerischen Scherwellenelastografie Während der Untersuchung wurden Scherwellengeschwindigkeiten in dem den Knoten umgebenden Schilddrüsenparenchym erhoben. Dieses wurde ebenso wie der Knoten anschließend histopathologisch untersucht. Dies lässt im Folgenden zum einen den Vergleich der Messwerte von Knoten und Schilddrüsengewebe und zum anderen den Vergleich der Schilddrüsengewebe mit unterschiedlicher Histopathologie zu. Der Unterschied zwischen den Messwerten von benignen und malignen Knoten wurde bereits in einem vorangehenden Kapitel diskutiert. 4.5.1 Vergleich der Scherwellengeschwindigkeiten von Läsion und Schilddrüsenparenchym Die gemessenen mittleren Scherwellengeschwindigkeiten der Läsionen waren in der vorliegenden Arbeit signifikant größer als die mittleren Geschwindigkeiten des umgebenden Schilddrüsenparenchyms. Dabei ist zu beachten, dass dies für die Gesamtheit der Läsionen gilt, die benignen und malignen Knoten folglich zu einer Gruppe zusammengefasst wurden. Bisher veröffentlichte Werte entsprechen dem in dieser Arbeit beobachteten Verhältnis: Die Scherwellengeschwindigkeiten der Läsionen waren größer als die Scherwellengeschwindigkeiten des umgebenden Schilddrüsenparenchyms, wobei von den Autoren immer die Werte getrennt für benigne und maligne Knoten und nicht für die Gesamtheit angegeben wurden [9, 27, 29, 31, 32]. Die einzige davon abweichende Arbeit wurde 2014 von Calvete et al. veröffentlicht: Sie fanden die kleinsten Scherwellengeschwindigkeiten in der Gruppe der benignen Knoten, gefolgt vom Schilddrüsenparenchym und den malignen Knoten [15]. Die Ergebnisse dieser Studien sind in Tabelle 26 im Anhang aufgeführt. 94 Diskussion Es zeigte sich, dass die Gewebeveränderungen, die im Rahmen einer fokalen Läsion unabhängig von ihrer Dignität entstehen, zu einer Erhöhung der Scherwellengeschwindigkeiten und somit einer Gewebeverhärtung führen. Diese Erkenntnis könnte klinisch hilfreich bei der Untersuchung echonormaler Läsionen, die schwer vom umliegenden Gewebe abgrenzbar sind, sein. Die Messung der Scherwellengeschwindigkeit würde es ermöglichen, dieses Gewebe als Läsion zu identifizieren bzw. ihre genaue Ausdehnung zu beurteilen. Da die Patienten neben ihren fokalen Knoten teilweise auch Erkrankungen des gesamten Schilddrüsenparenchyms aufwiesen und diese durch strukturelle Gewebeveränderungen möglicherweise Einfluss auf die gemessenen Scherwellengeschwindigkeiten nahmen, wurde diese Störgröße in einer folgenden Berechnung der Scherwellengeschwindigkeiten für histopathologisch bestätigtes, gesundes Schilddrüsenparenchym und der sich darin befindenden Läsion ausgeschlossen. Wie Tabelle 19 im Anhang verdeutlicht, zeigten sich auch hier trotz der kleinen Fallzahl (n=34) signifikante Unterschiede zwischen den beiden Geweben. Zukünftige Studien müssen evaluieren, wie diese Ergebnisse in der klinischen Diagnostik eingesetzt werden können. 4.5.2 Vergleich der Scherwellengeschwindigkeiten des Schilddrüsenparenchyms Die Messung der Scherwellengeschwindigkeiten in nicht fokal verändertem Schilddrüsenparenchym ist bisher nicht in dem Maße untersucht worden, wie die Messung von Scherwellengeschwindigkeiten in fokalen Läsionen. Auch die aktuellen Leitlinien zur Elastografie der European Federation of Societies for Ultrasound in Medicine Elastografieuntersuchung nicht and auf Biology [19]. (EFSUMB) Da aber führen Erkrankungen diese des Schilddrüsenparenchyms Veränderungen der Strukturbeschaffenheit in diesem hervorrufen können, ist eine Anwendung der Scherwellentechnologie durchaus für diese Fragestellungen denkbar [52]. In der vorliegenden Arbeit wurden daher zum einen ein Vergleich der Scherwellengeschwindigkeiten der unterschiedlichen Histopathologien der Schilddrüse und zum anderen ein Vergleich zwischen Schilddrüsenparenchym mit benignen und malignen Knoten durchgeführt. 95 Diskussion 4.5.2.1 Vergleich der Scherwellengeschwindigkeiten von Schilddrüsenparenchym mit unterschiedlicher Histopathologie Die in der vorliegenden Arbeit gemessenen Scherwellengeschwindigkeiten waren durchschnittlich für das gesunde Schilddrüsenparenchym in allen drei Einstellungen am Siemens Ultraschallgerät am kleinsten, gefolgt von den Messwerten des Schilddrüsenparenchyms mit Hashimoto-Thyreoiditis und Schilddrüsenparenchym mit chronischer Thyreoiditis. In unserer Arbeitsgruppe wurden die Scherwellengeschwindigkeiten des Schilddrüsengewebes von 194 Probanden ohne bekannte Schilddrüsenerkrankung gemessen. Die mittleren Geschwindigkeiten waren tiefenabhängig und betrugen im rechten Schilddrüsenlappen für die ventrale Hälfte 2,52 m/s bzw. 2,43 m/s für die dorsale Hälfte und im linken Schilddrüsenlappen 2,56 m/s für die ventrale Hälfte bzw. 2,48 m/s für die dorsale Hälfte [56]. Die durchschnittlichen Scherwellengeschwindigkeiten der vorliegenden Arbeit bewegten sich für die drei Einstellungen Querschnitt 0,5-6,5 m/s und 0,5-9,0 m/s bzw. Längsschnitt 0,5-6,5 m/s zwischen 3,0 m/s und 3,3 m/s und lagen somit über den Messwerten der Arbeitsgruppe. Die Messtiefe wurde in der vorliegenden Arbeit nicht berücksichtigt. Sporea et al. untersuchten in ihrer Arbeit 74 Patienten mit unterschiedlicher Histopathologie der Schilddrüse: Das gesunde Schilddrüsenparenchym wies mit 2,07 m/s eine geringere durchschnittliche Scherwellengeschwindigkeit auf als Schilddrüsenparenchym bei Patienten mit Autoimmunerkrankung, wobei zum einen Patienten mit Morbus Basedow und zum anderen Patienten mit chronischer autoimmuner Thyreoiditis (CAT) untersucht wurden [76]. Eine weitere Arbeit von Sporea et al. mit einer größeren Patientenanzahl (n=136) bestätigte dieses Ergebnis. Zusätzlich untersuchten Sporea et al. in der letztgenannten Arbeit den Einfluss des Serum TSH-Levels auf die Scherwellengeschwindigkeit: Die mittlere Scherwellengeschwindigkeit bei Patienten mit einer Schilddrüsenerkrankung und pathologischen TSH-Werten war signifikant höher als bei Patienten mit Schilddrüsenerkrankung und normwertigen TSH-Werten [75]. Die TSH-Level der Patienten wurden in der vorliegenden Arbeit nicht berücksichtigt, sollten allerdings aufgrund der Ergebnisse von Sporea et al. in zukünftigen Arbeiten über Scherwellengeschwindigkeitsmessung ein zu beachtender Aspekt sein. 96 Diskussion Die Arbeitsgruppe von Magri et al. ermittelte die Steifigkeitswerte von Schilddrüsenparenchym bei Patienten, die einen Schilddrüsenknoten aufwiesen. Die eine Gruppe bildeten Patienten, die außer dem Knoten keine pathologische Veränderung des Schilddrüsenparenchyms hatten, und die andere Gruppe die Patienten, die neben ihrem Knoten eine koexistierende Hashimoto-Thyreoiditis aufwiesen. Die Steifigkeit wurde in Kilopascal (kPa) gemessen und anschließend die mittleren Werte der beiden Gruppen miteinander verglichen. Die höheren Steifigkeitswerte fanden sich in den Schilddrüsengeweben bei Patienten mit Hashimoto-Thyreoiditis [51]. Zusammenfassend sind die Ergebnisse der beiden Arbeiten von Sporea et al. und der Arbeit von Magri et al. mit den Ergebnissen der vorliegenden Arbeit vergleichbar, da auch in dieser im gesunden Schilddrüsenparenchym niedrigere Scherwellengeschwindigkeitswerte als das pathologisch veränderte Schilddrüsengewebe gemessen wurden. Ein gültiger Vergleich wird jedoch aufgrund folgender Gesichtspunkte erschwert: Magri et al. verwendeten für ihre Arbeit eine von einem anderen Ultraschallhersteller entwickelte scherwellentechnologiebasierte Messmethode als die vorliegende Arbeit. Sowohl die Arbeiten von Sporea et al. als auch die vorliegende Arbeit gaben die Scherwellengeschwindigkeiten nicht in Abhängigkeit von der Messtiefe an. Unsere Arbeitsgruppe konnte bei der Erhebung der Scherwellengeschwindigkeiten im gesunden Schilddrüsengewebe jedoch einen signifikanten Unterschied zwischen Messwerten in der ventralen und der dorsalen Schilddrüsenhälfte beobachten, d.h. dass die Scherwellengeschwindigkeiten messtiefenabhängig sind [56]. Außerdem fanden sich in den Arbeiten von Sporea et al. keine Angaben über die verwendete Skaleneinstellung. Wir erhielten jeweils für die drei Skaleneinstellungen leicht differierende mittlere Scherwellengeschwindigkeiten. Als letzter Diskussionspunkt ist des Weiteren die Frage anzuführen, ob das Schilddrüsengewebe in der Arbeit von Magri et al. und in der vorliegenden Arbeit überhaupt als „gesund“ zu werten war, da sich in diesem zum Zeitpunkt der Messung mindestens ein Schilddrüsenknoten befand. Dass die Knoten und ihre Histopathologie jedoch anscheinend Einfluss auf die gemessene Scherwellengeschwindigkeit des Schilddrüsenparenchyms nehmen, zeigt das folgende Kapitel. 97 Diskussion 4.5.2.2 Vergleich der Scherwellengeschwindigkeit von Schilddrüsenparenchym mit benignen und malignen Knoten Überleitend aus dem vorausgehenden Kapitel ergab sich in der vorliegenden Arbeit interessanterweise ein signifikanter Unterschied der Scherwellengeschwindigkeiten zwischen Schilddrüsenparenchym, das benigne Knoten enthielt, und Schilddrüsenparenchym, das maligne Knoten enthielt, wobei die mittlere Scherwellengeschwindigkeit in Schilddrüsengeweben mit malignen Knoten für die beiden Einstellungen im Querschnitt signifikant höher war als in Schilddrüsengeweben mit benignen Knoten. Wenn die These stimmt, dass maligne Knoten die Scherwellengeschwindigkeit des umgebenden Schilddrüsenparenchyms auf eine andere Weise beeinflussen als benigne Knoten, muss folgender Aspekt in der Betrachtung der Werte beachtet werden: Maligne Knoten traten in dieser Arbeit nie solitär auf, d.h. dass die Messwerte der Scherwellengeschwindigkeiten des Schilddrüsenparenchym mit malignen Knoten zum einen in die Gruppe der Schilddrüsenparenchyme mit malignen und zusätzlich in die Gruppe der Schilddrüsenparenchyme mit benignen Knoten einflossen. Daher wurden die mittleren Messwerte der letztgenannten Gruppe eventuell noch zu hoch berechnet. Grazhdani et al. und Gu et al. veröffentlichten in ihren Arbeiten 2,04 m/s bzw. 1,97 m/s als mittlere Scherwellengeschwindigkeiten von Schilddrüsenparenchym, das benigne Knoten enthält, und 2,11 m/s bzw. 2,01 m/s für Schilddrüsenparenchym, das maligne Knoten enthält. Wie in der vorliegenden Arbeit zeigten sich auch hier höhere mittlere Geschwindigkeiten in Schilddrüsenparenchym mit malignen Knoten. Ob es einen signifikanten Unterschied zwischen diesen beiden Werten gab, berechneten die Autoren jedoch nicht [31, 32]. 98 Diskussion 4.6 Stärken und Schwächen der Studie Zusammenfassend hat die vorliegende Arbeit folgende Limitationen: Es wurde ein relativ kleines Kollektiv untersucht. Da die Datenerhebung für jeden Knoten in etwa 1,5 Stunden beanspruchte, war jedoch die Untersuchung eines größeren Kollektivs im Rahmen dieser Studie nicht realisierbar und auch nicht angedacht. Die Ergebnisse sollen weiteren Studien zur Schilddrüsenelastografie zur Orientierung, Planung und Durchführung dienen. Des Weiteren wurde die Intra- und Interobserver-Variabilität nicht getestet. Park et al. untersuchten diese in ihrer Studie mit drei Radiologen an 52 Knoten und kamen zu dem ernüchternden Ergebnis, dass es keine statistisch signifikante Konkordanz zwischen den Untersuchern bezüglich der qualitativen und semiquantitativen Elastografie gab [61]. Sicher ist dieses Ergebnis nicht ohne Weiteres auf die vorliegende Studie übertragbar, zumal bei den Untersuchungen dieser Studie immer mindestens zwei Untersucher anwesend waren und bei Unstimmigkeit ein Konsens gebildet wurde, aber es zeigt, dass die Variabilität nicht unterschätzt werden darf und in künftigen Studien mit erhoben werden sollte. Da der mögliche Vorteil des Längsschnitts zu Beginn der Erhebung nicht abzusehen war, wurden die Strain-Ratio-Werte nur im Querschnitt erfasst und folglich wurde ein Vergleich zwischen den beiden Schnittebenen nicht durchführbar. Knoten, die einen zystischen Anteil aufwiesen, wurden in meiner Arbeit nicht ausgeschlossen. Bhatia et al. konnten in ihrer Arbeit jedoch zeigen, dass zystische Veränderungen eine Störgröße für die Realtime-Elastografie darstellten und die zystisch veränderten Knoten im Elastogramm härter erschienen. Als mögliche Gründe nannten die Autoren einen tatsächlichen Anstieg der Knotenhärte oder entstandene Artefakte [7]. Leider konnten im Rahmen dieser Studie keine Daten an einem Supersonic Ultraschallgerät erhoben werden. Dieses benutzt wie das Siemens Ultraschallgerät die Scherwellentechnologie für die elastografische Untersuchung. Es ist daher vermutlich genauso objektiv wie das Siemens Ultraschallgerät und könnte dieses in der Untersuchungsdurchführung und den diagnostischen Werten möglicherweise überbieten. Zukünftig wären Studien denkbar, die die Untersuchung von Schilddrüsenknoten mit Hilfe der beiden unterschiedlichen scherwellenbasierten Technologien vergleichen. 99 Diskussion Die Stärken dieser Arbeit gründen sich auf folgenden Punkten: Die Patienten wurden an allen drei Ultraschallgeräten untersucht. Einflüsse, die durch verschiedene Charakteristika der Knoten und Schilddrüsen in unterschiedlichen Populationen entstehen, können im Vergleich verschiedener Studien sonst nicht ausgeschlossen werden. Diese Störgröße trat in der vorliegenden Arbeit nicht auf. Dadurch wurde ein unmittelbarer Vergleich der Elastografiearten und der zugrundliegenden Techniken ermöglicht. Als zweiter wichtiger Punkt ist aufzuführen, dass für jeden Knoten die histopathologische Referenz in die Auswertung aufgenommen wurde. In der Mehrheit der übrigen Studien wird die weniger zuverlässige, zytopathologische Diagnose aus einer Feinnadelbiopsie als Referenz herangezogen. Die FNAB liefert in 10-20% der Fälle jedoch fehlerhafte bzw. keine diagnostischen Ergebnisse [50, 62]. Eine weitere Stärke dieser Arbeit liegt darin, dass mit dem Verhältnis von benignen zu malignen Knoten die tatsächliche Prävalenz von Schilddrüsenkarzinomen in der Bevölkerung abgebildet werden konnte. Liegt der Anteil der malignen Knoten wie in vielen Arbeiten deutlich über der tatsächlichen Prävalenz, werden die diagnostischen Werte unter Umständen falsch hoch gemessen [34, 62, 64]. Als limitierender Faktor der Elastografie wird in der Literatur inzwischen immer häufiger das follikuläre Schilddrüsenkarzinom angeführt, weil sich sein Gewebewachstum im Vergleich zum papillären Schilddrüsenkarzinom nicht durch Härtezunahme auszeichnet [6, 54]. Da in dieser Arbeit alle malignen Knoten ausschließlich papilläre Schilddrüsenkarzinome waren, konnte die Elastografie an der für diese Untersuchung zulässigen Karzinomart untersucht werden. Leider löst sich dadurch jedoch nicht das Problem, dass die elastografische Untersuchung nicht für alle Schilddrüsenkarzinomarten gleich gut geeignet ist. 100 Diskussion 4.7 Schlussfolgerung Die elastografische Untersuchung eines Schilddrüsenknotens kann im Anschluss an jede herkömmliche Ultraschalluntersuchung im B-Mode erfolgen. Sie ist in der Regel nicht zeitaufwendig und kann dem Untersucher wertvolle Informationen bezüglich der Gewebeelastizität des Knotens liefern, wodurch sich ein zusätzliches Kriterium für die Unterscheidung zwischen benignen und malignen Knoten ergibt. Die drei Ultraschallgeräte lieferten in der Erhebung der vorliegenden Arbeit vergleichbare Ergebnisse. Folgende Punkte gilt es jedoch in Zusammenhang mit der verwendeten Elastografietechnik für eine valide elastografische Untersuchung zu beachten: Bei der Ermittlung der Strain-Ratio mit Hilfe der Kompressionselastografie müssen die beiden ROIs von Knoten und Schilddrüse unbedingt auf gleicher Höhe gesetzt werden. Bei der elastografischen Untersuchung mittels der Scherwellentechnologie müssen sowohl die Skaleneinstellungen als auch die Messtiefe beachtet werden. Auch wenn die Geräte und die Technologien wie gesagt in dieser Arbeit vergleichbare Ergebnisse lieferten, ist für die Zukunft zu erwarten, dass sich die quantitative Scherwellentechnologie durchsetzen wird. Diese liefert schon heute viel versprechende Ergebnisse und ist aufgrund ihrer Technologie objektiver und reproduzierbarer. Dennoch gibt es für sie Verbesserungspotential: Die Hersteller sollten zum einen die Größe der ROI an die Größe des Knotens adaptierbar machen. Zum anderen sollte die Messtiefe direkt in die Messung der Scherwellengeschwindigkeiten integriert werden. Des Weiteren müssen hier Cutoff-Punkte für zukünftige Messungen etabliert werden. Ein weiterer Ansatzpunkt für die Verwendung der Scherwellentechnologie ist sicherlich die Anwendung in der Diagnostik von generalisierten Schilddrüsenparenchymerkrankungen. Die vorliegende Arbeit konnte hier signifikante Unterschiede zwischen gesundem und krankem Parenchym in den Messwerten zeigen. Für künftige Forschung bietet die Untersuchung von Schilddrüsenknoten mit Hilfe der Elastografie viel Potential, die in Anbetracht der steigenden Inzidenz von Schilddrüsenkarzinomen lohnenswert scheint. 101 Zusammenfassung 5 Zusammenfassung Ziel dieser Arbeit war es, die unterschiedlichen Elastografietechniken der drei Ultraschallgeräte Hitachi HI VISION Ascendus, Toshiba Aplio 500 und Siemens Acuson S3000 in der Differenzierung zwischen benignen und malignen Schilddrüsenknoten zu untersuchen und hinsichtlich ihrer diagnostischen Werte miteinander zu vergleichen. Während sich das Hitachi und das Toshiba Gerät der Kompressionselastografie in der Erstellung eines farblichen Elastogramms und einer Strain-Ratio bedienen, verwendet das Siemens Gerät die sogenannte Acoustic Radiation Force Imaging (ARFI) Technologie und misst die Geschwindigkeit der generierten Scherwellen. In dieser Arbeit wurden 41 Patienten mit 53 Schilddrüsenknoten an diesen drei Geräten untersucht. Anschließend wurden diese Patienten an der Schilddrüse operiert und das histopathologische Gutachten als Referenz übernommen. Neben den Elastografiewerten wurden folgende Parameter erhoben: Patienten- charakteristika, B-Bild Kriterien der Schilddrüse und der Läsion mit Zuteilung zu einer Thyroid Imaging Reporting and Data System (TIRADS) Kategorie, Vaskularisation der Läsion. Für die elastografische Untersuchung wurden am Hitachi und am Toshiba Ultraschallgerät zum einen ein qualitatives farbliches Elastogramm, das entsprechend seiner Farbzusammensetzung in eine Klassifikation eingeordnet wurde, und zum anderen die semiquantitative StrainRatio von Schilddrüsen- zu Knotenparenchym erhoben. Am Siemens Gerät wurde die elastografische Untersuchung mittels des Programms Virtual Touch™ IQ (VTIQ) durchgeführt. Hierbei wurde die grafische Darstellung der Scherwellen- geschwindigkeiten interpretiert und anhand der Farbzusammensetzung einer Klassifikation zugeordnet. Außerdem wurden die Scherwellengeschwindigkeiten innerhalb der Läsion und innerhalb des umgebenden Schilddrüsenparenchyms in vom Untersucher platzierten ROIs ermittelt. Die Erhebung der qualitativen und der scherwellenbasierten Elastografiedaten erfolgte im Quer- und im Längsschnitt, die Daten der semiquantitativen Strain-Ratio wurden nur im Querschnitt erhoben. Für die Klassifikation der farblichen Elastogramme wurden vier Elastografiescores (ES) unterschieden: ES 1 und ES 2 wurden als Vorhersage für Benignität, ES 3 und ES 4 als Vorhersage für Malignität definiert. Für die Strain-Ratio-Werte und die 102 Zusammenfassung numerische Darstellung der Scherwellengeschwindigkeiten wurden jeweils die bestmöglichen Cut-off-Punkte ermittelt. Anschließend wurden für alle elastografischen Verfahren die entsprechenden diagnostischen Werte berechnet. Im Vergleich der B-Bild-Kriterien, der Vaskularisation und der TIRADS-Klassifikation zwischen benignen und malignen Knoten zeigten sich keine signifikanten Unterschiede. Im Vergleich der Werte der farblichen Elastogramme erreichte das Hitachi Gerät im Längsschnitt die höchste Sensitivität mit 83,3%, die höchste Summe aus Sensitivität und Spezifität das Siemens Gerät im Querschnitt mit 66,7% bzw. 68,1%. Im Vergleich der Strain-Ratio-Werte und der numerischen Darstellung der Scherwellengeschwindigkeitsmessung konnte sowohl die höchste Sensitivität als auch die höchste Spezifität am Hitachi Gerät mit 80,0% bzw. 72,2% im Querschnitt errechnet werden. In einer weiterführenden Betrachtung der Scherwellengeschwindigkeitswerte zwischen Knoten- und Schilddrüsengewebe konnten signifikant höhere Geschwindigkeiten im Knoten gemessen werden. Zudem zeigte sich ein signifikanter Unterschied der Geschwindigkeiten zwischen den verschiedenen Histopathologien der Schilddrüse. Zusammenfassend ist zu sagen, dass keines der drei Ultraschallgeräte in dem Maße überlegen war, als dass zukünftig elastografische Untersuchungen von Schilddrüsenknoten ausschließlich an diesem Gerät erfolgen sollten. Die Elastografie kann dem Untersucher wichtige Hinweise bezüglich des Härtegrades einer Läsion liefern, muss aber in diesem Kontext als additionale Untersuchungsmethode zur herkömmlichen B-Bild-Sonografie verstanden werden. Zukünftig wird sich höchstwahrscheinlich die Elastografie basierend auf der Messung der Scherwellengeschwindigkeiten durchsetzen, da diese Methode aufgrund ihrer Technologie als die objektivste und damit vergleichbarste gilt. Sie lieferte bereits in anderen Arbeiten ausgezeichnete diagnostische Werte und weist auch in der vorliegenden Arbeit zufriedenstellende Werte auf. 103 Literaturverzeichnis 6 Literaturverzeichnis [1] Arbeitsgemeinschaft Fachgesellschaften der (AWMF): Wissenschaftlichen Leitlinie “Operative Medizinischen Therapie maligner Schilddrüsenerkrankungen”:http://www.awmf.org/uploads/tx_szleitlinien/088002l_S2k_Maligne_Schilddr?senerkrankungen_Operative_Therapie_201211.pdf.(10.01.2013) [2] Asteria C, Giovanardi A, Pizzocaro A, Cozzaglio L, Morabito A, Somalvico F and Zoppo A: US-elastography in the differential diagnosis of benign and malignant thyroid nodules. Thyroid : official journal of the American Thyroid Association. 18, 523–531 (2008). [3] Aydin R, Elmali M, Polat AV, Danaci M and Akpolat I: Comparison of muscleto-nodule and parenchyma-to-nodule strain ratios in the differentiation of benign and malignant thyroid nodules: which one should we use? European journal of radiology. 83, e131–e136 (2014). [4] Bamber J, Cosgrove D, Dietrich CF, Fromageau J, Bojunga J, Calliada F, Cantisani V, Correas J-M, D’Onofrio M, Drakonaki EE, Fink M, Friedrich-Rust M, Gilja OH, Havre RF, Jenssen C, Klauser AS, Ohlinger R, Saftoiu A, Schaefer F, Sporea I and Piscaglia F: EFSUMB guidelines and recommendations on the clinical use of ultrasound elastography. Part 1: Basic principles and technology. Ultraschall in der Medizin (Stuttgart, Germany : 1980). 34, 169–184 (2013). [5] Bertz J, Dahm S, Haberland J, Kraywinkel K, Kurth B-M and Wolf U: Ergebnisse zur Prävalenz nach ICD-10: Schilddrüse. Verbreitung von Krebserkrankungen in Deutschland. Entwicklung der Prävalenzen zwischen 1990 und 2010. Beiträge zur Gesundheitsberichterstattung des Bundes. Robert Koch- Institut, ed. Robert Koch- Institut Berlin. 124–131 (2010). 104 Literaturverzeichnis [6] Bhatia KSS, Rasalkar DD and Ahuja AT: Thyroid Elastography. Ultrasound of the Thyroid and Parathyroid Glands. R.A. Sofferman and A.T. Ahuja, eds. Springer. 263–281 (2012). [7] Bhatia KSS, Rasalkar DP, Lee YP, Wong KT, King AD, Yuen HY and Ahuja AT: Cystic change in thyroid nodules: a confounding factor for real-time qualitative thyroid ultrasound elastography. Clinical radiology. 66, 799–807 (2011). [8] Bojunga J: Multicenterstudie zur Evaluation der Realtime-Elastographie für die Differenzierung von Schilddrüsenknoten. Studienprotokoll. Unveröffentlichte Befunde. [9] Bojunga J, Dauth N, Berner C, Meyer G, Holzer K, Voelkl L, Herrmann E, Schroeter H, Zeuzem S and Friedrich-Rust M: Acoustic radiation force impulse imaging for differentiation of thyroid nodules. PloS one. 7, e42735 (2012). [10] Bojunga J, Herrmann E, Meyer G, Weber S, Zeuzem S and Friedrich-Rust M: Real-time elastography for the differentiation of benign and malignant thyroid nodules: a meta-analysis. Thyroid : official journal of the American Thyroid Association. 20, 1145–1150 (2010). [11] Brito JP and Davies L: Is there really an increased incidence of thyroid cancer? Current opinion in endocrinology, diabetes, and obesity. 21, 405–408 (2014). [12] Brito JP, Gionfriddo MR, Al Nofal A, Boehmer KR, Leppin AL, Reading C, Callstrom M, Elraiyah TA, Prokop LJ, Stan MN, Murad MH, Morris JC and Montori VM: The accuracy of thyroid nodule ultrasound to predict thyroid cancer: systematic review and meta-analysis. The Journal of clinical endocrinology and metabolism. 99, 1253–1263 (2014). [13] Cakal E, Sahin M, Öztürk Ünsal I, Güngünes A, Akkaymak E, Özkaya EC, Bozkurt NC, Özbek M and Delibasi T: Elastography in the Differential 105 Literaturverzeichnis Diagnosis of Thyroid Nodules. Ultrasonic Imaging: http://uix.sagepub.com/content/early/2014/09/01/0161734614547542. (27.10.2014) [14] Cakir B, Aydin C, Korukluoğlu B, Ozdemir D, Sisman IC, Tüzün D, Oguz A, Güler G, Güney G, Kuşdemir A, Sanisoglu SY and Ersoy R: Diagnostic value of elastosonographically determined strain index in the differential diagnosis of benign and malignant thyroid nodules. Endocrine. 39, 89–98 (2011). [15] Calvete AC, Mestre JDB, Gonzalez JMR, Martinez ES, Sala BT and Zambudio AR: Acoustic radiation force impulse imaging for evaluation of the thyroid gland. Journal of ultrasound in medicine : official journal of the American Institute of Ultrasound in Medicine. 33, 1031–1040 (2014). [16] Campanella P, Ianni F, Rota CA, Corsello SM and Pontecorvi A: Quantification of cancer risk of each clinical and ultrasonographic suspicious feature of thyroid nodules: a systematic review and meta-analysis. European journal of endocrinology / European Federation of Endocrine Societies. 170, R203–R211 (2014). [17] Cantisani V, Lodise P, Grazhdani H, Mancuso E, Maggini E, Di Rocco G, D’Ambrosio F, Calliada F, Redler A, Ricci P and Catalano C: Ultrasound elastography in the evaluation of thyroid pathology. Current status. European Journal of Radiology. 83, 420–428 (2014). [18] Ciledag N, Arda K, Aribas BK, Aktas E and Köse SK: The utility of ultrasound elastography and MicroPure imaging in the differentiation of benign and malignant thyroid nodules. AJR. American journal of roentgenology. 198, W244–W249 (2012). [19] Cosgrove D, Piscaglia F, Bamber J, Bojunga J, Correas J-M, Gilja OH, Klauser AS, Sporea I, Calliada F, Cantisani V, D’Onofrio M, Drakonaki EE, Fink M, Friedrich-Rust M, Fromageau J, Havre RF, Jenssen C, Ohlinger R, Săftoiu A, Schaefer F and Dietrich CF: EFSUMB guidelines and recommendations on the clinical use of ultrasound elastography. Part 2: 106 Literaturverzeichnis Clinical applications. Ultraschall in der Medizin (Stuttgart, Germany : 1980). 34, 238–253 (2013). [20] Deutsche Gesellschaft für Allgemein- und Viszeralchirurgie- Chirurgische Arbeitsgemeinschaft Endokrinologie: Leitlinie “Operative Therapie benigner Schilddrüsenerkrankungen”:http://www.awmf.org/uploads/tx_szleitlinien/003002l_01.pdf. (10.01.2013) [21] Deutsche Gesellschaft für Ultraschall in der Medizin e.V.: http://www.degum.de/fileadmin/dokumente/presse/pressemitteilungen/PM_E lastografie_Dietrich.pdf. (27.03.2015) [22] Dietrich CF: Elastography, the new dimension in ultrasonography. Praxis. 100, 1533–1542 (2011). [23] Dighe M, Luo S, Cuevas C and Kim Y: Efficacy of thyroid ultrasound elastography in differential diagnosis of small thyroid nodules. European journal of radiology. 82, e274–e280 (2013). [24] Erbil Y, Barbaros U, Salmaslioglu A, Mete O, Issever H, Ozarmagan S, Yilmazbayhan D and Tezelman S: Effect of thyroid gland volume in preoperative detection of suspected malignant thyroid nodules in a multinodular goiter. Archives of surgery. 143, 558–563 (2008). [25] Frates MC, Benson CB, Doubilet PM, Kunreuther E, Contreras M, Cibas ES, Orcutt J, Moore FD, Larsen PR, Marqusee E and Alexander EK: Prevalence and distribution of carcinoma in patients with solitary and multiple thyroid nodules on sonography. The Journal of clinical endocrinology and metabolism. 91, 3411–3417 (2006). [26] Friedrich-Rust M, Meyer G, Dauth N, Berner C, Bogdanou D, Herrmann E, Zeuzem S and Bojunga J: Interobserver agreement of Thyroid Imaging Reporting and Data System (TIRADS) and strain elastography for the assessment of thyroid nodules. PloS one. 8, e77927 (2013). 107 Literaturverzeichnis [27] Friedrich-Rust M, Romenski O, Meyer G, Dauth N, Holzer K, Grünwald F, Kriener S, Herrmann E, Zeuzem S and Bojunga J: Acoustic Radiation Force Impulse-Imaging for the evaluation of the thyroid gland: a limited patient feasibility study. Ultrasonics. 52, 69–74 (2012). [28] Friedrich-Rust M, Sperber A, Holzer K, Diener J, Grünwald F, Badenhoop K, Weber S, Kriener S, Herrmann E, Bechstein WO, Zeuzem S and Bojunga J: Real-time elastography and contrast-enhanced ultrasound for the assessment of thyroid nodules. Experimental and clinical endocrinology & diabetes : official journal, German Society of Endocrinology [and] German Diabetes Association. 118, 602–609 (2010). [29] Fukuhara T, Matsuda E, Fujiwara K, Tanimura C, Izawa S, Kataoka H and Kitano H: Phantom experiment and clinical utility of quantitative shear wave elastography for differentiating thyroid nodules. Endocrine journal. 61, 615– 621 (2014). [30] Gietka-Czernel M, Kochman M, Bujalska K, Stachlewska-Nasfeter E and Zgliczyński W: Real-time ultrasound elastography - a new tool for diagnosing thyroid nodules. Endokrynologia Polska. 61, 652–657 (2010). [31] Grazhdani H, Cantisani V, Lodise P, Di Rocco G, Proietto MC, Fioravanti E, Rubini A and Redler A: Prospective evaluation of acoustic radiation force impulse technology in the differentiation of thyroid nodules: accuracy and interobserver variability assessment. Journal of ultrasound. 17, 13–20 (2014). [32] Gu J, Du L, Bai M, Chen H, Jia X, Zhao J and Zhang X: Preliminary study on the diagnostic value of acoustic radiation force impulse technology for differentiating between benign and malignant thyroid nodules. Journal of Ultrasound in Medicine: Official Journal of the American Institute of Ultrasound in Medicine. 31, 763–771 (2012). [33] Hampel R, Bennöhr G, Gordalla A and Below H: [Urinary iodine excretion in German adults in 2005 meets WHO target]. Medizinische Klinik (Munich, Germany : 1983). 104, 425–428 (2009). 108 Literaturverzeichnis [34] Hegedüs L: Clinical practice. The thyroid nodule. The New England journal of medicine. 351, 1764–1771 (2004). [35] Henrichsen TL, Reading CC, Charboneau JW, Donovan DJ, Sebo TJ and Hay ID: Cystic change in thyroid carcinoma: Prevalence and estimated volume in 360 carcinomas. Journal of clinical ultrasound : JCU. 38, 361–366 (2010). [36] Hitachi Medical Corperation: Real-Time Tissue Elastography. Benutzerhandbuch HI Vision Ascendus. Hitachi Medical Corporation. 14–16 (2010). [37] Horvath E, Majlis S, Rossi R, Franco C, Niedmann JP, Castro A and Dominguez M: An ultrasonogram reporting system for thyroid nodules stratifying cancer risk for clinical management. The Journal of clinical endocrinology and metabolism. 94, 1748–1751 (2009). [38] Ianculescu V, Ciolovan LM, Dunant A, Vielh P, Mazouni C, Delaloge S, Dromain C, Blidaru A and Balleyguier C: Added value of Virtual Touch IQ shear wave elastography in the ultrasound assessment of breast lesions. European journal of radiology. 83, 773–777 (2014). [39] Ivanac G, Brkljacic B, Ivanac K, Huzjan R, Skreb F and Cikara I: Vascularisation of benign and malignant thyroid nodules: CD US evaluation. Ultraschall in der Medizin. 28, 502–506 (2007). [40] Kaatsch P, Spix C, Hentschel S, Katalinic A, Luttmann S and Stegmaier C: Ergebnisse nach ICD-10. Krebs in Deutschland 2009/2010. Robert KochInstitut and Gesellschaft der epidemiologischen Krebsregister in Deutschland. e.V., eds. Robert Koch-Institut Berlin. 16–111 (2013). [41] Kagoya R, Monobe H and Tojima H: Utility of elastography for differential diagnosis of benign and malignant thyroid nodules. Otolaryngology--head and neck surgery : official journal of American Academy of Otolaryngology-Head and Neck Surgery. 143, 230–234 (2010). 109 Literaturverzeichnis [42] Kim E-K, Park CS, Chung WY, Oh KK, Kim DI, Lee JT and Yoo HS: New sonographic criteria for recommending fine-needle aspiration biopsy of nonpalpable solid nodules of the thyroid. AJR. American journal of roentgenology. 178, 687–691 (2002). [43] Kwak JY, Han KH, Yoon JH, Moon HJ, Son EJ, Park SH, Jung HK, Choi JS, Kim BM and Kim E-K: Thyroid Imaging Reporting and Data System for US Features of Nodules: A Step in Establishing Better Stratification of Cancer Risk. Radiology. 260, 892–899 (2011). [44] Kwak JY and Kim E: Ultrasound elastography for thyroid nodules: recent advances. Ultrasonography (Seoul, Korea). 33, 75–82 (2014). [45] Levine RA: Ultrasound Elastography of the Thyroid. Thyroid Ultrasound and Ultrasound-Guided FNA. H.J. Baskin, D.S. Duick, and R.A. Levine, eds. Springer New York. 355–363 (2013). [46] Liang X-N, Guo R-J, Li S, Zheng Z-M and Liang H-D: Binary logistic regression analysis of solid thyroid nodules imaged by high-frequency ultrasonography, acoustic radiation force impulse, and contrast-enhanced ultrasonography. European review for medical and pharmacological sciences. 18, 3601–3610 (2014). [47] Lippolis P V., Tognini S, Materazzi G, Polini A, Mancini R, Ambrosini CE, Dardano A, Basolo F, Seccia M, Miccoli P and Monzani F: Is elastography actually useful in the presurgical selection of thyroid nodules with indeterminate cytology? The Journal of clinical endocrinology and metabolism. 96, E1826–E1830 (2011). [48] Lorenzen J, Sinkus R and Adam G: Elastography: Quantitative imaging modality of the elastic tissue properties. RoFo : Fortschritte auf dem Gebiete der Rontgenstrahlen und der Nuklearmedizin. 175, 623–630 (2003). 110 Literaturverzeichnis [49] Lyshchik A, Higashi T, Asato R, Tanaka S, Ito J, Mai JJ, Pellot-Barakat C, Insana MF, Brill AB, Saga T, Hiraoka M and Togashi K: Thyroid gland tumor diagnosis at US elastography. Radiology. 237, 202–211 (2005). [50] Mäder U, Reiners C, Schmid K-W and Verburg FA: Grundlagen, Klinik, Diagnose. Diagnostik, Therapie und Nachsorge des Schilddrüsenkarzinoms. C. Reiners, ed. Uni-Med Verlag Ag. 11–52 (2010). [51] Magri F, Chytiris S, Capelli V, Alessi S, Nalon E, Rotondi M, Cassibba S, Calliada F and Chiovato L: Shear wave elastography in the diagnosis of thyroid nodules: Feasibility in the case of coexistent chronic autoimmune Hashimoto’s thyroiditis. Clinical Endocrinology. 76, 137–141 (2012). [52] Maitra A: Endocrine System. Robbins Basic Pathology. V. Kumar, A.K. Abbas, and J.C. Aster, eds. Elsevier Saunders. 715–763 (2012). [53] Michels G and Jaspers N: Schilddrüse. Sonographie, organ- und leitsymptomorientiert: Grundlagen, Diagnostik, Differentialdiagnostik, Befundung, Dokumentation. G. Michels and N. Jaspers, eds. Springer Berlin Heidelberg. 197–207 (2011). [54] Monpeyssen H, Tramalloni J, Poirée S, Hélénon O and Correas J-M: Elastography of the thyroid. Diagnostic and interventional imaging. 94, 535– 544 (2013). [55] Moon W-J, Jung SL, Lee JH, Na DG, Baek J-H, Lee YH, Kim J, Kim HS, Byun JS and Lee DH: Benign and malignant thyroid nodules: US differentiation-multicenter retrospective study. Radiology. 247, 762–770 (2008). [56] Neuwirt C: Acoustic Radiation Force Imaging der Schilddrüse - Generierung von Normwerten mittels Virtual Touch Imaging Quantification. (Unveröffentlichte Befunde). [57] Ning C-P, Jiang S-Q, Zhang T, Sun L, Liu Y-J and Tian J-W: The value of strain ratio in differential diagnosis of thyroid solid nodules. European journal of radiology. 81, 286–291 (2012). 111 Literaturverzeichnis [58] Ophir J, Céspedes I, Ponnekanti H, Yazdi Y and Li X: Elastography: a quantitative method for imaging the elasticity of biological tissues. Ultrasonic imaging. 13, 111–134 (1991). [59] Papini E, Guglielmi R, Bianchini A, Crescenzi A, Taccogna S, Nardi F, Panunzi C, Rinaldi R, Toscano V and Pacella CM: Risk of malignancy in nonpalpable thyroid nodules: predictive value of ultrasound and color-Doppler features. The Journal of clinical endocrinology and metabolism. 87, 1941– 1946 (2002). [60] Park J-Y, Lee HJ, Jang HW, Kim HK, Yi JH, Lee W and Kim SH: A proposal for a thyroid imaging reporting and data system for ultrasound features of thyroid carcinoma. Thyroid : official journal of the American Thyroid Association. 19, 1257–1264 (2009). [61] Park SH, Kim SJ, Kim E-K, Kim MJ, Son EJ and Kwak JY: Interobserver agreement in assessing the sonographic and elastographic features of malignant thyroid nodules. AJR. American journal of roentgenology. 193, W416–W423 (2009). [62] Paschke R, Schmid KW, Gärtner R, Mann K, Dralle H and Reiners C: Epidemiology, pathophysiology, guideline-adjusted diagnostics, and treatment of thyroid nodules. Medizinische Klinik (Munich, Germany : 1983). 105, 80–87 (2010). [63] Pellegriti G, Frasca F, Regalbuto C, Squatrito S and Vigneri R: Worldwide increasing incidence of thyroid cancer: Update on epidemiology and risk factors. Journal of Cancer Epidemiology. 2013, 1–10 (2013). [64] Popoveniuc G and Jonklaas J: Thyroid nodules. The Medical clinics of North America. 96, 329–349 (2012). [65] Rago T, Santini F, Scutari M, Pinchera A and Vitti P: Elastography : New Developments in Ultrasound for Predicting Malignancy in Thyroid Nodules. J Clin Endocrinol Metab. 92, 2917–2922 (2007). 112 Literaturverzeichnis [66] Refaat R, Kamel A, Elganzory M and Awad NM: Can real-time ultrasound elastography using the color score and strain ratio differentiate between benign and malignant solitary thyroid nodules? The Egyptian Journal of Radiology and Nuclear Medicine. 45, 75–87 (2014). [67] Reiners C, Wegscheider K, Schicha H, Theissen P, Vaupel R, Wrbitzky R and Schumm-Draeger P-M: Prevalence of thyroid disorders in the working population of Germany: ultrasonography screening in 96,278 unselected employees. Thyroid : official journal of the American Thyroid Association. 14, 926–932 (2004). [68] Rossi M, Buratto M, Bruni S, Filieri C, Tagliati F, Trasforini G, Rossi R, Beccati MD, Degli Uberti EC and Zatelli MC: Role of ultrasonographic/clinical profile, cytology, and BRAF V600E mutation evaluation in thyroid nodule screening for malignancy: a prospective study. The Journal of clinical endocrinology and metabolism. 97, 2354–2361 (2012). [69] Rubaltelli L, Corradin S, Dorigo A, Stabilito M, Tregnaghi A, Borsato S and Stramare R: Differential diagnosis of benign and malignant thyroid nodules at elastosonography. Ultraschall in Der Medizin (Stuttgart, Germany: 1980). 30, 175–179 (2009). [70] Russ G, Bigorgne C, Royer B, Rouxel A and Bienvenu-Perrard M: The Thyroid Imaging Reporting and Data System (TIRADS) for ultrasound of the thyroid (Abstract). Journal de Radiologie. 92, 701–713 (2011). [71] Russ G, Royer B, Bigorgne C, Rouxel A, Bienvenu-Perrard M and Leenhardt L: Prospective evaluation of thyroid imaging reporting and data system on 4550 nodules with and without elastography. European Journal of Endocrinology. 168, 649–655 (2013). [72] Siemens Medical Solutions USA I: Anhang A Technische Beschreibung. Acuson S1000 Acuson S2000 Acuson S3000 Diagnose-Ultraschallsystem Gebrauchsanweisung. Siemens Medical Solutions USA Inc. A–15 (2012). 113 Literaturverzeichnis [73] Siemens Medical Solutions USA I: Anhang D Erweiterte Funktionsregler. Acuson S1000 Acuson S2000 Acuson S3000 Diagnose-Ultraschallsystem Gebrauchsanweisung. Siemens Medical Solutions USA, Inc. D 5–D 6 (2012). [74] Slapa RZ, Piwowonski A, Jakubowski WS, Bierca J, Szopinski KT, SlowinskaSrzednicka J, Migda B and Mlosek RK: Shear wave elastography may add a new dimension to ultrasound evaluation of thyroid nodules: case series with comparative evaluation. Journal of Thyroid Research. 2012, 1–6 (2012). [75] Sporea I: ARFI elastography for the evaluation of diffuse thyroid gland pathology: Preliminary results. World Journal of Radiology. 4, 174–178 (2012). [76] Sporea I, Vlad M, Bota S, Sirli RL, Popescu A, Danila M, Sendroiu M and Zosin I: Thyroid stiffness assessment by acoustic radiation force impulse elastography (ARFI). Ultraschall in der Medizin (Stuttgart, Germany : 1980). 32, 281–285 (2011). [77] Sun J, Cai J and Wang X: Real-time ultrasound elastography for differentiation of benign and malignant thyroid nodules: a meta-analysis. Journal of ultrasound in medicine : official journal of the American Institute of Ultrasound in Medicine. 33, 495–502 (2014). [78] Toshiba Medical Systems GmbH: http://www.toshiba- medical.de/ultraschall/aplio-500. (25.05.2012) [79] Trimboli P, Guglielmi R, Monti S, Misischi I, Graziano F, Nasrollah N, Amendola S, Morgante SN, Deiana MG, Valabrega S, Toscano V and Papini E: Ultrasound sensitivity for thyroid malignancy is increased by real-time elastography: a prospective multicenter study. The Journal of clinical endocrinology and metabolism. 97, 4524–4530 (2012). [80] Unlütürk U, Erdoğan MF, Demir O, Güllü S and Başkal N: Ultrasound elastography is not superior to grayscale ultrasound in predicting malignancy 114 Literaturverzeichnis in thyroid nodules. Thyroid : official journal of the American Thyroid Association. 22, 1031–1038 (2012). [81] Wang H, Brylka D, Sun L-N, Lin Y-Q, Sui G-Q and Gao J: Comparison of strain ratio with elastography score system in differentiating malignant from benign thyroid nodules. Clinical imaging. 37, 50–55 (2013). [82] Wang Y, Dan H-J, Dan H-Y, Li T and Hu B: Differential diagnosis of small single solid thyroid nodules using real-time ultrasound elastography. The Journal of international medical research. 38, 466–472 (2010). [83] Wei X, Li Y, Zhang S and Gao M: A Meta-analysis of thyroid imaging reporting and data system in the ultrasonographic diagnosis of 10,437 thyroid nodules. Head & Neck. 38, 309-315 (2016). [84] Wieczorek P: Applikationsspezialistin Ultraschalldiagnostik Siemens Healthcare (2012 persönliche Mitteilung). [85] Woliński K, Szkudlarek M, Szczepanek-Parulska E and Ruchała M: Usefulness of different ultrasound features of malignancy in predicting the type of thyroid lesions: a meta-analysis of prospective studies. Polskie Archiwum Medycyny Wewnętrznej. 124, 97–104 (2014). [86] Wong KT and Ahuja AT: Ultrasound of thyroid cancer. Cancer imaging : the official publication of the International Cancer Imaging Society. 5, 157–166 (2005). [87] Xing P, Wu L, Zhang C, Li S, Liu C and Wu C: Differentiation of benign from malignant thyroid lesions: calculation of the strain ratio on thyroid sonoelastography. Journal of ultrasound in medicine : official journal of the American Institute of Ultrasound in Medicine. 30, 663–669 (2011). [88] Xu J-M, Xu X-H, Xu H-X, Zhang Y-F, Zhang J, Guo L-H, Liu L-N, Liu C and Zheng S-G: Conventional US, US elasticity imaging, and acoustic radiation force impulse imaging for prediction of malignancy in thyroid nodules. Radiology. 272, 577–586 (2014). 115 Literaturverzeichnis [89] Zaleska-Dorobisz U, Kaczorowski K, Pawluś A, Puchalska A and Inglot M: Ultrasound elastography - review of techniques and its clinical applications. Advances in clinical and experimental medicine : official organ Wroclaw Medical University. 23, 645–655 (2014). [90] Zhang F-J, Han R-L and Zhao X-M: The value of virtual touch tissue image (VTI) and virtual touch tissue quantification (VTQ) in the differential diagnosis of thyroid nodules. European journal of radiology. 83, 2033–2040 (2014). 116 Anhang Volumen der Schilddrüse Tabelle 17: Diagnostische Werte (Mittelwert, Standardabweichung (STD), Median, Wertebereich) der Schilddrüsenvolumina von rechten und linken Schilddrüsenlappen (SDLappen), sowie das Gesamtvolumen der Schilddrüsen in Milliliter (ml). Aufgeführt für die Gruppe der Schilddrüsen mit benigner Läsion, Schilddrüsen mit maligner Läsion, sowie für die Gesamtanzahl der Schilddrüsen. In Klammern ist die jeweilige Fallzahl der Gruppe angegeben (n). In der letzten Zeile steht der errechnete p-Wert für die Differenzierung der Schilddrüsen mit benignen und malignen Läsionen anhand ihrer Volumina. Ausgewertet ist das Endkollektiv. Universitätsklinikum Ulm, 12/2012 - 06/2013. Schilddrüsen mit Schilddrüsen mit Gesamtanzahl der benigner Läsion maligner Läsion Schilddrüsen (n= 36) (n=5) (n=41) p-Wert Mittelwert ± STD; Median (Wertebereich) Volumen rechter SD- 27,2 ± 28,7 16,2 ± 14,9 25,8 ± 27,5 18,2 (0,2-127,2) 9,0 (5,9-42,0) 15,4 (0,2-127,2) 27,4 ± 38,2 7,4 ± 2,8 24,9 ± 36,3 13,4 (1,4-178,7) 7,9 (3,5-10,7) 10,7 (1,4-178,7) 54,5 ± 60,3 23,6 ± 16,0 50,8 ± 57,6 37,2 (1,6-305,9) 19,7 (9,4-50,9) 35,0 (1,6-305,9) 0,4372 Lappen (ml) Volumen linker SD- 0,0558 Lappen (ml) Volumen der SD gesamt (ml) 0,1202 117 Anhang Scherwellengeschwindigkeitsmessungen Tabelle 18: Diagnostische Werte (Mittelwert, Standardabweichung (STD), Median, Wertebereich) der Scherwellengeschwindigkeiten in Meter pro Sekunde (m/s) von Läsion und Schilddrüsenparenchym in den drei unterschiedlichen Schnittebenen und Skaleneinstellungen: Querschnitt 0,5-6,5 m/s und 0,5-9,0 m/s und Längsschnitt 0,5-6,5 m/s, aufgeführt für die unterschiedlichen histopathologischen Diagnosen der Läsion, sowie die für Gesamtanzahl. In Klammern ist die jeweilige Fallzahl der Histopathologien (n) angegeben. Für die Differenzierung von Läsion und Schilddrüsengewebe anhand der Scherwellengeschwindigkeiten sind in den einzelnen Histopathologien die p-Werte angegeben. Fettgedruckte p-Werte stellen signifikante Werte dar. Datenerhebung am Siemens Acuson S3000 Ultraschallgerät und Auswertung des Endkollektivs. Universitätsklinikum Ulm, 12/2012 - 06/2013. MikrofolliStrumaFollikulärPapilläres kuläres Gesamtanzahl knoten es Adenom Karzinom Adenom (n=53) (n= 30) (n=7) (n=6) (n=10) Mittelwert ± STD; Median (Wertebereich) Quer- Läsion 3,3 ± 0,9 2,9 ± 0,7 2,8 ± 0,4 3,6 ± 1,5 3,2 ± 0,9 (m/s) 3,1 (1,6-6,0) 2,7 (2,0-4,2) 2,8 (2,1-3,6) 3,6 (1,8-6,1) 2,9 (1,6-6,1) 2,7 ± 0,7 2,5 ± 0,6 2,9 ± 0,8 3,3 ± 0,6 2,8 ± 0,7 2,5 (1,5-4,2) 2,4 (1,6-3,6) 2,7 (2,0-4,1) 3,3 (2,6-4,0) 2,6 (1,5-4,2) p- Wert 0,0046 0,3506 0,8709 0,7313 0,0101 Läsion 3,6 ± 1,3 3,0 ± 1,0 2,8 ± 0,5 4,0 ± 2,4 3,4 ± 1,3 3,1 (1,5-7,5) 3,0 (1,9-4,8) 2,8 (2,1-3,8) 3,7 (1,8-8,4) 3,0 (1,5-8,4) 2,9 ± 1,0 2,4 ± 0,5 2,7 ± 0,7 3,7 ± 1,1 2,9 ± 1,0 2,7 (1,7-7,0) 2,3 (1,8-3,5) 2,6 (2,0-4,6) 3,3 (2,7-5,5) 2,7 (1,7-7,0) p- Wert 0,0320 0,2661 0,7171 0,7865 0,0280 Läsion 3,4 ± 1,1 2,6 ± 0,8 2,9 ± 1,0 3,3 ± 1,9 3,2 ± 1,2 3,1 (1,2-6,3) 2,9 (1,1-3,2) 2,8 (1,8-5,6) 2,5 (1,6-6,1) 2,9 (1,1-6,6) 2,5 ± 0,5 2,4 ± 0,4 2,6 ± 0,6 2,9 ± 0,5 2,6 ± 0,5 2,5 (1,7-3,6) 2,3 (1,8-3,0) 2,6 (1,8-3,7) 2,7 (2,4-3,5) 2,6 (1,7-3,7) 0,0010 0,6288 0,4815 0,5660 0,0010 schnitt Schild- 0,5-6,5 drüse m/s (m/s) Quer- (m/s) schnitt Schild- 0,5-9,0 drüse m/s (m/s) Längs- (m/s) schnitt Schild- 0,5-6,5 drüse m/s (m/s) p- Wert 118 Anhang Tabelle 19: Diagnostische Werte (Mittelwert, Standardabweichung (STD), Median, Wertebereich) der Scherwellengeschwindigkeiten in Meter pro Sekunde (m/s) im gesunden Schilddrüsengewebe und in den Läsionen, die sich im gesunden Schilddrüsengewebe befinden, aufgeführt nach Schnittebene und Skaleneinstellung: Querschnitt 0,5-6,5 m/s und 0,5-9,0 m/s und Längsschnitt 0,5-6,5 m/s. Die Fallzahl ist in den Gruppen in Klammern (n) angegeben. Die letzte Spalte gibt den berechneten p-Wert für die Differenzierung des Schilddrüsengewebes und der Läsion anhand der Scherwellengeschwindigkeit an. Fettgedruckte p-Werte sind signifikante Werte. Datenerhebung am Siemens Acuson S3000 Ultraschallgerät und Auswertung der Subanalyse des Endkollektivs mit ausschließlich gesundem Schilddrüsenparenchym. Universitätsklinikum Ulm, 12/2012 - 06/2013. Gesundes SchilddrüsenKnoten (n=34) gewebe (n= 34) Mittelwert ± STD, Median (Wertebereich) Querschnitt 2,9 ± 0,7 3,1 ± 1,0 0,5-6,5 m/s 2,7 (1,9-4,1) 2,8 (1,6-6,1) Querschnitt 3,0 ± 1,1 3,3 ± 1,5 0,5- 9,0 m/s 2,7 (2,0-7,0) 2,8 (1,5-8,4) Längsschnitt 2,6± 0,5 3,0 ± 1,2 0,5-6,5 m/s 2,6 (1,7-3,7) 2,8 (1,1-6,3) p-Wert 0,0101 0,0280 0,0010 119 Anhang Tabelle 20: Diagnostische Werte (Fallzahl (n), Mittelwert, Standardabweichung (STD), Median, Wertebereich) der Scherwellengeschwindigkeiten in Meter pro Sekunde (m/s) der benignen und malignen Läsionen, sowie der Gesamtanzahl der Läsionen aufgeführt nach den unterschiedlichen Histologien des Schilddrüsengewebes: Gesundes Gewebe, Chronische Thyreoiditis und Hashimoto-Thyreoiditis. Die Scherwellengeschwindigkeiten wurden in den drei Schnittebenen und Skaleneinstellungen Querschnitt 0,5-6,5 m/s und 0,5-9,0 m/s und Längsschnitt 0,5-6,5 m/s am Siemens Acuson S3000 Ultraschallgeräte für das Endkollektiv erhoben. Die letzte Spalte gibt die errechneten p-Werte für eine Differenzierung der benignen und malignen Läsionen anhand ihrer Scherwellengeschwindigkeiten an. Universitätsklinikum Ulm, 12/2012 - 06/2013. Benigne Maligne Gesamt- Histologie Schilddrüse Gesund (m/s) Querschnitt Chronische 0,5-6,5 (m/s) m/s Thyreoiditis (n=6) (n=53) Knotenanzahl n, Mittelwert ± STD, Median (Wertebereich) p-Wert n=31 3,0 ± 0,9 2,8 (1,6-6,0) n=3 3,4 ± 2,3 2,3 (1,8-6,1) n=34 3,1 ± 1,0 2,8 (1,6-6,1) 0,5848 n=11 3,4 ± 0,8 3,3 (2,1-4,6) n=3 3,8 ± 0,4 3,9 (3,3-4,1) n=14 3,5 ± 0,8 3,5 (2,1-4,6) 0,5334 n=0 Gesund (m/s) n=31 3,2 ± 1,2 2,9 (1,5-7,5) n=3 4,2 ± 3,7 2,3 (1,8-8,4) n=34 3,3 ± 1,5 2,8 (1,5-8,4) 0,5848 n= 11 3,6 ± 1,0 3,3 (2,1-5,2) n=3 3,9 ± 0,4 4,0 (3,4-4,3) n=14 3,6 ± 0,9 3,7 (2,1-5,2) 0,5334 0,5-9,0 (m/s) Thyreoiditis Hashimoto-Thyreoiditis (m/s) n= 5 3,6 ± 1,1 3,1 (3,0-5,6) n=0 n=5 3,6 ± 1,1 3,1 (3,0-5,6) Gesund (m/s) n=31 2,9 ± 1,0 2,8(1,1-6,3) n=3 3,2 ± 2,5 2,0 (1,6-6,1) n=34 3,0 ± 1,2 2,8 (1,1-6,3) Längs- m/s (n=47) n=5 3,3 ± 0,7 3,1 (2,7-4,4) Chronische 0,5-6,5 anzahl n=5 3,3 ± 0,7 3,1 (2,7-4,4) schnitt schnitt Läsion Hashimoto-Thyreoiditis (m/s) Quer- m/s Läsion n=11 n=3 n=14 (m/s) 3,8 ± 1,3 3,1 (2,0-5,6) 3,4 ± 1,7 2,9 (2,0-5,4) 3,7 ± 1,3 3,1 (2,0-5,6) Hashimoto-Thyreoiditis (m/s) n=5 3,2 ± 0,6 3,3 (2,4-4,0) n=0 n=5 3,2 ± 0,6 3,3 (2,4-4,0) Chronische Thyreoiditis 0,5042 0,7552 120 Anhang Tabelle 21: Diagnostische Werte (Mittelwert, Standardabweichung (STD), Median, Wertebereich und 95%–Intervalle) der Scherwellengeschwindigkeiten in Meter pro Sekunde (m/s) für Schilddrüsengewebe mit benignen und Schilddrüsengeweben mit einer malignen Läsion, sowie für die Gesamtanzahl der Schilddrüsengewebe. Angegeben in Klammern ist die jeweilige Fallzahl der Gruppe (n): Erhoben sind die Daten in den drei unterschiedlichen Schnittebenen und Skaleneinstellungen: Querschnitt 0,5-6,5 m/s und 0,5-9,0 m/s und Längsschnitt 0,5-6,5 m/s am Siemens Acuson S3000 Ultraschallgerät für das Endkollektiv. In der letzten Spalte sind die p-Werte für die Differenzierung zwischen den Schilddrüsengeweben anhand der Scherwellengeschwindigkeiten angegeben. Fettgedruckte p-Werte stellen signifikante Werte dar. Universitätsklinikum Ulm, 12/2012 - 06/2013. Schilddrüsengewebe Schilddrüsengewebe Gesamt mit benigner Läsion mit maligner Läsion (n=53) (n=47) m/s (n= 6) m/s m/s Mean ± STD; Median (Wertebereich); 95%-Intervall Querschnitt 2,7 ± 0,7 3,3 ± 0,6 0,5-6,5 m/s 2,5 (1,5-4,2) 3,3 (2,6-4,0) (m/s) 2,5-2,9 2,7-4,0 Querschnitt 2,8 ± 0,9 3,7 ± 1,1 0,5-9,0 m/s 2,6 (1,7-7,0) 3,3 (2,7-5,5) (m/s) 2,5-3,1 2,5-5,0 Längsschnitt 2,5 ± 0,5 2,9 ± 0,5 0,5-6,5 m/s 2,5 (1,7-3,7) 2,7 (2,4-3,5) (m/s) 2,4-2,7 2,3-3,4 2,8 ± 0,7 2,6 (1,5-4,2) 2,9 ± 1,0 2,7 (1,7-7,0) 2,6 ± 0,5 2,6 (1,7-3,7) p-Wert 0,0365 0,0306 0,1089 121 Anhang Vergleichsstudien Tabelle 22: Studien, deren Material und Methodik und Ergebnis, die einen Vergleich der Realtime-Elastografie (RTE) und der Strain-Ratio (SR) an einem Hitachi Ultraschallgerät durchführten. Aufgeführt sind Studienerstautor, Publikationsjahr, Studientitel, Gesamtknotenanzahl, Anzahl der malignen Knoten, das verwendete Einteilungsschema der RTE, die gewählte Berechnung der SR und wenn angegeben, gewählte Schnittebene, Druck und Messtiefe. Im Ergebnisteil stehen die diagnostischen Werte Sensitivität (Sen) und Spezifität (Spe) der RTE und der SR mit berechnetem Cut-off-Punkt. (TA=Transverse Axis; LA=Longitudinal Axis; SCM= M. sternocleidomastoideus; SD=Schilddrüse) Studie Kagoya et al. (2010) Utility of elastography for differential diagnosis of benign and malignant thyroid nodules.[41] Cakir et al. (2011) Diagnostic value of elastosonographically determined strain index in the differential diagnosis of benign and malignant thyroid nodules.[14] Xing et al. (2011) Differentiation of benign from malignant thyroid lesions: calculation of the strain ratio on thyroid sonoelastography.[87] Ning et al. (2012) The value of strain ratio in differential diagnosis of thyroid solid nodules. [57] Material und Methodik Knotenanzahl gesamt: 47 Maligne Knoten: 11 RTE: 1,2/3,4 SR= Knoten/SCM RTE: Sen=73% Spe=64% SR: Cut-off-Punkt=1,5 Sen=90% Spe= 50% Knotenanzahl gesamt: 391 Maligne Knoten: 125 Druck: 3-4 RTE: 1,2,3/4,5 SR= SD-Parenchym/Knoten RTE: Sen=58,4% Spe=71,0% SR: LA Cut-off-Punkt=16,709 Sen=73,4% Spe= 70,0% TA Cut-off-Punkt= 8,817 Sen=61,3% Spe=63,5% Knotenanzahl gesamt: 98 Maligne Knoten: 45 Druck: 2-3 RTE: 1,2/3,4 SR= SD-Parenchym/ Knoten (auf gleicher Höhe gemessen) Knotenanzahl gesamt: 99 Maligne Knoten: 32 Druck: 2-4 SR= Knoten/SD-Parenchym (auf gleicher Höhe gemessen) Ünlütürk et al. (2012) Ultrasound elastography is not superior to grayscale ultrasound in predicting malignancy in thyroid nodules.[80] Knotenanzahl gesamt: 194 Maligne Knoten: 58 LA, Druck: 3-4 RTE: 1/2,3 (1. Subgruppe) 1,2/3 (2. Subgruppe) SR= SD-Parenchym/Knoten (keine Angabe zur Messtiefe) Cakal et al. (2014) Elastography in the Differential Diagnosis of Thyroid Nodules.[13] Refaat et al. (2014) Can real-time ultrasound elastography using the color score and strain ratio differentiate between benign and malignant solitary thyroid nodules?[66] Ergebnis RTE: Sen=88,8% Spe=81,1% SR: Cut-off-Punkt=3,79 Sen=97,8% Spe= 85,7% RTE: Cut-off-Punkt=3,5 Sen=82,4% Spe=71,6% SR: Cut-off-Punkt=4,225 Sen= 81,8% Spe= 82,9% RTE: 1. Subgruppe: Sen=78% Spe=44% 2. Subgruppe: Sen=67% Spe=78% SR: Cut-off-Punkt=2,1 Sen=69% Spe=67% Knotenanzahl gesamt: 601 Maligne Knoten: 29 RTE: 1,2,3/4,5 SR= SD-Parenchym/Knoten (keine Angabe zur Messtiefe) RTE: Sen=76% Spe=96% SR: Cut-off-Punkt=3,75 Sen= 83% Spe= 95% Knotenanzahl gesamt: 35 Maligne Knoten: 14 Druck: 3 RTE: 1,2,3/4,5 SR= SD-Parenchym/Knoten (Messung nicht auf gleicher Höhe) RTE: Sen=78,6% Spe=78,9% SR: Cut-off-Punkt: 2,20 Sen=85,7% Spe=90,5% 122 Anhang Tabelle 23: Studien, deren Material und Methodik und Ergebnis, die einen Vergleich der Realtime-Elastografie (RTE) und der Strain-Ratio (SR) an einem Toshiba Ultraschallgerät durchführten. Aufgeführt sind Erstautor, Publikationsjahr, Studientitel, die Gesamtknotenanzahl, die Anzahl der malignen Knoten, das verwendete Einteilungsschema der RTE, Berechnung der SR und wenn angegeben, die gewählte Messtiefe und Schnittebene. Im Ergebnisteil stehen die diagnostischen Werte Sensitivität (Sen) und Spezifität (Spe) der RTE und der SR mit berechnetem Cut-off-Punkt. (Kn=Knoten; TA=Transverse Axis) (*Nachträgliche Berechnung der Werte aus den Angaben in der Arbeit) Studie Ciledag et al. (2012) The utility of ultrasound elastography and MicroPure imaging in the differentiation of benign and malignant thyroid nodules. [18] Material und Methodik Knotenanzahl gesamt: 74 Maligne Knoten: 9 RTE: 1,2,3/4,5 SR= Kn/Muskel Knotenanzahl gesamt: 168 Comparison of strain ratio with elastography score system in differentiating malignant from benign thyroid nodules. [81] Maligne Knoten: 52 RTE: 1,2,3/4,5 SR= SD-Parenchym/Kn (in gleicher Tiefe gemessen) Comparison of muscle-to-nodule and parenchyma-to-nodule strain ratios in the differentiation of benign and malignant thyroid nodules: which one should we use? [3] RTE*: Sen 88,9% Spe 95,4% SR: Cut-off-Punkt= 2,31 Sen=85,7% Spe=82,1% (in gleicher Tiefe gemessen) Wang et al. (2013) Aydin et al. (2014) Ergebnis Knotenanzahl gesamt: 106 Maligne Knoten: 23 TA RTE: 1,2/3,4 SR 1= SD-Parenchym/Kn SR 2= Muskel/Kn (in gleicher Tiefe gemessen) RTE: Sen 84,6% Spe 78,5% SR: Cut-off-Punkt= 3,86 Sen=80,8% Spe=91,4% RTE: Sen=95,6%, Spe=50,6% SR 1: Cut-off-Punkt= 3,14 Sen=95,6% Spe=93,4% SR 2: Cut-off-Punkt= 1,85 Sen=95,6% Spe=92,8% 123 Anhang Tabelle 24: Studien, deren Material und Methodik und Ergebnis, die einen Vergleich der Programme Virtual Touch™ Imaging (VTI) und Virtual Touch™ Quantification (VTQ) durchführen. Aufgeführt sind Erstautor, Publikationsjahr, Studientitel, die Gesamtknotenanzahl, die Anzahl der malignen Knoten (mal. Kn), das verwendete Einteilungsschema und die Farbgebung der VTI, die gewählten Cut-off-Punkte der VTQ und die diagnostischen Werte Sensitivität (Sen) und Spezifität (Spe) von VTI und VTQ. Studie Calvete et al. (2014) Acoustic radiation force impulse imaging for evaluation of the thyroid gland. [15] Liang et al. (2014) Binary logistic regression anlysis of solid thyroid nodules imaged by highfrequency ultrasonography, acousitc radiation force impulse, and contrastenhanced ultrasonography. [46] Material und Methodik Knotenanzahl gesamt: 157 Maligne Knoten: 28 VTI: 1,2,3/4,5 (lila-rot) VTQ Knotenanzahl gesamt: 80 Maligne Knoten: 22 VTI: 1,2,3/4,5 (schwarz-weiß) VTQ: 1. Cut-off-Punkt für maligne Knoten 2. Cut-off-Punkt für benigne Ergebnis VTI: Sen=97,67% Spe=82,14% VTQ: 1. Cut-off-Punkt=2 m/s Sen=89,3% Spe=79,0% 2. Cut-off-Punkt=2,5 m/s Sen=85,7%, Spe=96,0% VTI: Sen=81,8%% Spe=82,8%% VTQ: 1. Cut-off-Punkt= 3,65 m/s 2. Cut-off-Punkt= 2,01 m/s Sen=77,3% Spe=55,5%% Knoten Xu et al. (2014) Conventional US, US elasticity imaging, and acoustic radiation force impulse imaging for prediction of malignancy in thyroid nodules. [88] Zhang et al. (2014) The value of virtual touch tissue image (VTI) and virtual touch tissue quantification (VTQ) in the differential diagnosis of thyroid nodules.[90] Knotenanzahl gesamt:441 Maligne Knoten: 116 VTI: 1,2,3/4,5,6 (schwarz-weiß) VTQ VTI: Sen=80,0% Spe=93,8% VTQ: Cut-off-Punkt=2,87 m/s Sen=71,6% Spe= 83,4% Knotenanzahl gesamt: 113 Maligne Knoten: 46 VTI: 1,2/3,4 (schwarz-weiß) VTQ VTI: Sen=95,6% Spe=89,6% VTQ: Cut-off-Punkt=2,9 m/s Sen=91,3% Spe= 85,1% Tabelle 25: Diagnostische Werte (Sensitivität, Spezifität, Positiver Vorhersagewert, Negativer Vorhersagewert) in Prozent der Arbeit von Bojunga et al. für die Realtime-Elastografie (RTE) und die ARFI basierte Scherwellenelastografie (ARFI= Acoustic Radiation Force Impulse). Bei der RTE wurden die Elastografiescores 1 und 2 als benigne und 3 und 4 als maligne definiert (1,2/3,4). Der gewählte Cut-off-Punkt der ARFI-Scherwellengeschwindigkeit beträgt 2,57 Meter pro Sekunde (m/s). Bojunga et al. (2012) Acoustic radiation force impulse imaging for differentiation of thyroid nodules. [9] RTE ARFI 1,2/3,4 Cut-off-Punkt=2,57 m/s Sensitivität (%) 76 57 Spezifität (%) 72 85 Positiver Vorhersagewert (%) 30 38 Negativer Vorhersagewert (%) 95 93 Diagnostische Werte 124 Anhang Tabelle 26: Studien, die die Scherwellengeschwindigkeit von Schilddrüsenparenchym, benignen und malignen Knoten untersucht haben. Genannt sind der Erstautor, das Publikationsjahr in Klammern und der Titel der Studie. Die mittleren Scherwellengeschwindigkeiten sind in Meter pro Sekunde (m/s) für das Schilddrüsenparenchym, benigne und maligne Knoten angegeben. Gu et al. und Grazhdani et al. führen für das Schilddrüsenparenchym zwei Geschwindigkeiten auf: die erste steht für das Schilddrüsenparenchym, das benigne Knoten enthält (benigne Kn), die zweite für Schilddrüsenparenchym mit malignen Knoten (maligne Kn). Studie Schilddrüsenparenchym Benigne Knoten Maligne Knoten Mittlere Scherwellengeschwindigkeit (m/s) Bojunga et al. (2012) Acoustic radiation force impulse imaging for differentiation of thyroid nodules. [9] 1,76 1,90 2,69 2,01 3,94 2,04 1,70 3,39 1,98 2,02 4,3 1,64 1,88 2,69 2,14 3,75 Gu et al. (2012) Preliminary study on the diagnostic value of acoustic radiation force impulse technology for differentiating between benign and malignant thyroid nodules. [32] 1,97 (benigne Kn)/ 2,07 (maligne Kn) Calvete et al. (2014) Acoustic radiation force impulse imaging for evaluation of the thyroid gland. [15] Friedrich-Rust et al. (2011) Acoustic Radiation Force Impulse-Imaging for the evaluation of the thyroid gland: a limited patient feasibility study. [27] Fukuhara et al. (2014) Phantom experiment and clinical utility of quantitative shear wave elastography for differentiating thyroid nodules. [29] Grazhdani et al. (2014) Prospective evaluation of acoustic radiation force impulse technology in the differentiation of thyroid nodules: accuracy and interobserver variability assessment. [31] 2,04 (benigne Kn)/ 2,10 (maligne Kn) 125 Danksagung Die Danksagung wurde aus Gründen des Datenschutzes entfernt. Lebenslauf Der Lebenslauf wurde aus Gründen des Datenschutzes entfernt.