Aus der Klinik für Nuklearmedizin (Ehemaliger Direktor der Klinik für Nuklearmedizin: Prof. Dr. Dr. Carl-Martin Kirsch) Universitätsklinikum des Saarlandes Lymphknoten-Staging des Lungenkarzinoms mit 18F-FDG-PET/CT: Diagnostische Testleistung von SUV-Schwellenwerten mit modernen PETRekonstruktionsalgorithmen bei normal großen und vergrößerten Lymphknoten Dissertation zur Erlangung des Grades eines Doktors der Medizin der HOHEN MEDIZINISCHEN FAKULTÄT DER UNIVERSITÄT DES SAARLANDES 2016 vorgelegt von Matthias Weissinger Geboren am 03.02.1989 in Laichingen Inhalt Inhalt 1 Zusammenfassung ................................................................................................. 1 2 Einführung .............................................................................................................. 5 2.1 Das Bronchialkarzinom ..................................................................................... 5 2.1.1 Epidemiologie ............................................................................................. 5 2.1.2 Risikofaktoren ............................................................................................. 5 2.1.3 Karzinogenese............................................................................................ 6 2.1.4 Klinik ........................................................................................................... 6 2.1.5 Diagnostik und Stellenwerte des 18F-FDG-PET/CT .................................... 7 2.1.5.1 Basisdiagnostik und weitere Therapieplanung ..................................... 7 2.1.5.2 T-Staging ........................................................................................... 10 2.1.5.3 N-Staging ........................................................................................... 11 2.1.5.4 M-Staging........................................................................................... 11 2.1.6 Diagnosesicherung ................................................................................... 12 2.1.7 Therapie und Prognose ............................................................................ 14 2.2 18F-FDG-PET/CT ............................................................................................ 17 2.2.1 Radiopharmakon ...................................................................................... 17 2.2.1.1 18F-FDG ............................................................................................. 17 2.2.1.2 Biologische Grundlage ....................................................................... 17 2.2.1.3 Pharmakologische Eigenschaften ...................................................... 17 2.2.1.4 Physikalische Eigenschaften.............................................................. 19 2.2.1.5 Wechselwirkungen ............................................................................. 19 2.2.2 Positronen-Emissions-Tomographie......................................................... 20 2.2.3 Bildrekonstruktion ..................................................................................... 22 2.2.3.1 Iterative Rekonstruktion ..................................................................... 23 2.2.3.2 OSEM-Rekonstruktion ....................................................................... 25 2.2.3.3 HD-PET-Rekonstruktion .................................................................... 27 I Inhalt 2.2.4 SUV-Quantifizierung ................................................................................. 29 2.3 Fragestellung .................................................................................................. 31 3 Methodik ............................................................................................................... 33 3.1 Patientenselektion ........................................................................................... 33 3.2 Patientencharakteristika .................................................................................. 33 3.3 18F-FDG-PET/CT-Untersuchung ..................................................................... 34 3.4 Bildrekonstruktion............................................................................................ 37 3.5 Bildanalyse ...................................................................................................... 38 3.5.1 SUV-Analyse Primarius ............................................................................ 39 3.5.2 SUV-Analyse Lymphknoten ...................................................................... 39 3.6 Diagnosesicherung ......................................................................................... 40 3.7 Visuelle Auswertung........................................................................................ 42 3.8 Statistische Auswertung .................................................................................. 42 4 Auswertung........................................................................................................... 45 4.1 Patientenkollektiv und Zusammensetzung der Daten ..................................... 45 4.1.1 18F-FDG-Uptake-Charakteristika .............................................................. 46 4.1.2 Bereinigter SUV-Uptake ........................................................................... 49 4.1.3 Test auf (log)Normalverteilung und Varianz ............................................. 49 4.2 SUV-Konkordanzanalyse ................................................................................ 50 4.2.1 Einführung ................................................................................................ 50 4.2.2 Analyse auf signifikante Unterschiede in der SUV-Quantifizierung aufgrund der Anwendung unterschiedlicher Rekonstruktionsprotokolle ........................... 51 4.2.2.1 Uptake-Verhalten in Abhängigkeit der Rekonstruktion....................... 51 4.2.2.2 Uptake-Verhalten in Abhängigkeit der Dignität .................................. 51 4.2.2.3 Uptake-Verhalten in Abhängigkeit der Objektgröße ........................... 52 4.2.3 Korrelation der SUV-Quantifizierung unterschiedlicher ............................ 52 Rekonstruktionsprotkolle ................................................................................... 52 II Inhalt 4.2.4 SUV-Quantifizierungs-Verhalten in Abhängigkeit der Objektgröße, ......... 55 Dignität und des Rekonstruktionsalgorithmus ................................................... 55 4.2.4.1 SUV-Uptakte in Abhängigkeit der LK-Größe und Dignität .................. 56 4.2.4.2 Einfluss der Objektgröße auf die SUV-Quantifizierung ...................... 58 4.2.5 Analyse auf Übereinstimmungen durch Bland-Altman-Plots .................... 60 4.2.5.1 Einführung.......................................................................................... 60 4.2.5.2 Einfluss der Iterationsäquivalente ...................................................... 60 4.2.5.3 Einfluss der Quantifizierungsmethoden ............................................. 61 4.2.5.4 Einfluss der HD-PET-Rekonstruktion unter SUVmax ......................... 62 4.2.5.5 Einfluss der HD-PET-Rekonstruktion unter SUVpeak ........................ 63 4.2.5.6 Einfluss der Rekonstruktions- und Quantifizierungsmethode bei LK.. 66 4.2.5.7 Einfluss der Rekonstruktions- und Quantifizierungsmethoden bei ..... 68 Primarien ....................................................................................................... 68 4.3. Patienten- und LK-bezogene Analyse ............................................................ 72 4.3.1 ROC-Analyse mediastinaler LK-Metastasen ............................................ 73 4.3.2 ROC-Analyse mit Quotientenbildung ........................................................ 75 4.3.3 Ermittlung des optimalen SUV Cut-offs .................................................... 78 4.3.3.1 HD-PET: SUVmax ............................................................................. 78 4.3.3.2 HD-PET: Quotient aus SUVmax LK/SUVmax Primarius .................... 80 4.3.3.3 OSEM 3i24s: SUVmax ....................................................................... 82 4.3.3.4 OSEM 2i8s: SUVmax ......................................................................... 84 4.4 Störfaktoren .................................................................................................... 84 4.4.1 Analyse auf signifikante Störfaktoren des SUV-Uptakes .......................... 84 4.4.2 Einfluss auf die SUV-Quantifizierung........................................................ 85 4.4.3 Einfluss auf die Trennschärfe ................................................................... 87 4.4.3.1 ROC- und AUC-Analyse bei initialem Glukosespiegel ≥150 mg/dl .... 87 4.4.3.2 ROC- und AUC-Analyse bei initialem Glukosespiegel <150mg/dl ..... 90 4.5 Validierung des Cut-offs durch patientenorientierte Analyse........................... 93 III Inhalt 4.5.1 HD-PET: SUVmax Cut-off von 3,2............................................................ 93 4.5.2 HD-PET: SUVmax Cut-off von 4,7............................................................ 94 4.5.3 HD-PET: SUVmax Quotient LK/Primarius von 0,23 ................................. 94 4.5.4 OSEM 3i24s: SUVmax Cut-off von 4,0 ..................................................... 94 4.5.5 CT-morphometrisch ergänzter Cut-off der HD-PET von 3,2 SUVmax ...... 94 4.6 Veränderung des N-Stadiums gegenüber visueller Auswertung ..................... 95 4.7 Testqualität der Referenzmethoden ................................................................ 97 5 Diskussion ............................................................................................................ 98 5.1 Zusammenfassung der Hauptergebnisse ....................................................... 98 5.2 Diskussion des Patientenkollektivs und der Methoden ................................. 100 5.3 Diskussion der Ergebnisse............................................................................ 104 6 Schlussfolgerung ................................................................................................ 128 7 Literaturverzeichnis................................................................................................. V 8 Abkürzungesverzeichnis ..................................................................................... XVII 9 Abbildungsverzeichnis .......................................................................................... XX 10 Tabellenverzeichnis ......................................................................................... XXIII 11 Publikationen im Zusammenhang mit dieser Dissertation .............................. XXIV 12 Danksagung .................................................................................................... XXV Anhang ....................................................................................................................... V IV 1 Zusammenfassung 1 Zusammenfassung Ziel: Die Positronen-Emissions-Tomographie mit 18F-Fluorodesoxyglukose (18F-FDG) in Kombination mit der Computer-Tomographie (18F-FDG-PET/CT) stellt derzeit die aussagefähigste nicht-invasive Methode zur Detektion von Lymphknotenmetastasen bei nicht-kleinzelligen Bronchialkarzinomen dar. Die Semiquantifizierung der 18 F- FDG-Aktivität im Gewebe durch den „standardized uptake value“ (SUV) ist hierbei ein leistungsfähiges und etabliertes Instrument zur Beurteilung der Dignität von Lymphknoten (LK). Neue Rekonstruktionsalgorithmen mit Auflösungsrückgewinnung wie TrueX und neue Quantifizierungsmethoden wie SUVpeak können die Bewertung des 18 F-FDG-Uptakes im Tumor jedoch beeinflussen. Ziel dieser Arbeit ist daher die Analyse der diagnostischen Treffsicherheit der SUV-Quantifizierung verschiedener PET-Rekonstruktionsalgorithmen mit unterschiedlichen Quantifizierungsmethoden sowie die Ermittlung eines optimalen SUV-Schwellenwertes (Cut-off) und dessen Validierung an einem Patientenkollektiv mit Lungenkarzinomen. Darüberhinaus soll der Einfluss der LK-Größe auf die SUV-Quantifizierung analysiert werden. Methodik: Die retrospektive Analyse umfasste 72 Patienten mit vermuteten oder gesicherten Bronchialkarzinomen, die innerhalb von 6 Wochen nach 18 F-FDG- PET/CT einer thorakoskopischen, mediastinoskopischen oder transbronchialen Lymphknoten (LK)-Biopsie zugeführt wurden. PET-Daten wurden mit drei verschiedenen Bildrekonstruktionsalgorithmen (OSEM-3D mit 2 Iterationen und 8 Subsets (OSEM 2i8s), OSEM-3D mit 3 Iterationen und 24 Subsets (OSEM 3i24s) sowie dem TrueX-Algorithmus mit 3 Iterationen und 24 Subsets und integriertem 2 mm Gauß-Filter (HD-PET)) rekonstruiert und anschließend die semiquantitativen Parameter SUVmax und SUVpeak in LK und Primärtumoren bestimmt. Die verschiedenen Messwerte wurden anhand der Bland-Altman-Plots verglichen. Die diagnostische Genauigkeit wurde anhand von Receiver-Operating-Characteristic (ROC)-Analysen ermittelt. Ergebnisse: Insgesamt konnten SUV-Werte in 556 histo-/zytologisch aufgearbeiteten Lymphknoten aus 274 anatomischen LK-Regionen analysiert werden. Die Prävalenz maligner LK betrug 19,7%. In der HD-PET-Rekonstuktion wiesen SUVmax und SUVpeak in identischen LK eine signifikante Streuung der Messwerte auf (Mittelwert der Differenz: 52±24%; p<0,0001). 1 1 Zusammenfassung Der Vergleich der Rekonstruktionsalgorithmen HD-PET und OSEM 3i24s ergab ebenfalls eine signifikante Streuung der SUVmax-Werte (Mittelwert der Differenz: 9±15%; p<0,0001). Hohe Streuungen in beiden SUV-Bestimmungen traten insbesondere bei niedriger 18 F-FDG-Aktivität sowie in kleinen Lymphknoten auf, wobei SUVpeak die geringsten Messschwankungen zeigte. Die Uptake-Werte SUVmax und SUVpeak waren bei HD-PET im Vergleich zu OSEM signifikant höher (p<0,001). In der ROC-Analyse zeigten OSEM 3i24s und HD-PET mit der SUVmaxQuantifizierung die gleiche Treffsicherheit (AUC: 0,866±0,035 und 0,867 ±0,033; p=0,9189). Die niedrigste Summe aus falsch negativ Rate (FNR) und falsch positiv Raten (FPR) konnten für die HD-PET bei einem ein Cut-off von 3,2 SUVmax, für die OSEM 3i24s bei einem SUVmax von 4,0 ermittelt werden (Sensitivität: 89%/76%; Spezifität: 66%/94%; FNR.: 11%/24%; FPR.: 34%/6%; positiver prädiktiver Wert: 39%/75%; negativer prädiktiver Wert: 97%/94%; diagnostische Treffsicherheit: 71%/90%). Bei Wahl dieses Schwellenwertes trat bei der HD-PET kein großer Sensitivitätsverlust bei CT-morphologisch normal großen Lymphknotenmetastasen auf (Sensitivität: alle LK: 89% ; LK<10 mm: 81%). In der patientenorientierten Analyse mit Differenzierung zwischen N0/1- und N2/3Stadium übertraf die HD-PET die Sensitivität der visuellen Auswertung (HD-PET bei SUVmax 3,2: 94%; OSEM 3i24s bei SUVmax 4,0: 72%; visuell: 67%). OSEM 3i24s zeigte insgesamt die höchste Gesamtgenauigkeit (HD-PET bei SUVmax 3,2: 67%; OSEM 3i24s bei SUVmax 4,0: 87%; visuell: 78%). Ein nüchtern-Blutglukosespiegel von ≥150 mg/dl, (auch nach Normalisierung vor FDG-Applikation) führte zu einem signifikant geringeren 18 F- 18 F-FDG-Uptake (p≤0,038) sowie zu einer deutlichen Verschlechterung der diagnostischen Testleistung. Schlussfolgerung: Die HD-PET-Rekonstruktion kann mit einem Schwellenwert von 3,2 SUVmax eine mediastinale Lymphknotenmetastasierung - auch in CTmorphometrisch unauffälligen LK - mit einer sehr hohen Sensitivität detektieren und bei negativem Befund mit sehr hohem negativen prädiktiven Wert ausschließen. Positive Befunde bedürfen aufgrund der hohen FPR jedoch einer kritischen Bewertung und einer feingeweblichen Sicherung. Der Einsatz der HD-Rekonstruktion führt zu keiner Verbesserung der Trennschärfe oder Gesamtgenauigkeit. SUV-Werte variieren je nach Rekonstruktionsprotokoll sehr stark, so dass Schwellenwerte bei Wechsel der Bildrekonstruktion nicht übertragbar sind. 2 1 Zusammenfassung Aim: The combination of 18 F-Fluorodesoxyglucose (18F-FDG) positron emission tomography and computer tomography (CT) is the most informative non-invasive method to detect lymph node metastasis in patients suffering from non-small cell lung cancer. The semi-quantification of 18 F-FDG uptake in the tissue by means of the standardized uptake value (SUV) is an efficient and well-established way to evaluate the lymph node (LN) involvement. New reconstruction algorithms with resolution recovery like the TrueX-algorithm and new quantification methods such as SUVpeak are likely to have an influence on the evaluation of the 18 F-FDG uptake. The aim of this study was to evaluate the impact of different PET reconstruction algrorithms on available SUV-quantification methods for the detection of lymph node metastases. Furthermore we aimed to identify and validate the best SUV cut-off value for patients suffering from lung cancer. In addition, the influence of the size of LN on the SUVquantification was analyzed. Methods: Overall 72 patients with assumed or verified lung cancer who had a thoracoscopic, mediastinoscopic or transbrochial lymph node biopsy within 6 weeks after 18 F-FDG-PET/CT were included in this retrospective analysis. Different image reconstructions were performed including the OSEM algorithm with 2 iterations and 8 subsets (OSEM2i8s), 3 iterations and 24 subsets (OSEM 3i24s) and the TrueXalgorithm with 3 iterations, 24 subsets with an additional 2 mm Gaussian filter (HDPET). SUVmax and SUVpeak measurments were performed for all reconstructions in both primary tumor as well as in LN. Bland-Altman-Plots were used for the comparision of the assessed semiquantitative values. Test performances of the different algorithms and quantification methods were compared by a receiver operating characteristic (ROC) analysis. Results: A total of 556 histo-/zytological well-defined LN out of 274 lymph node regions were quantified. The prevalence of malignant LN was 19.7%. Bland-Altman-Plots analysis revealed significant deviations of SUVmax and SUVpeak values in identical LN (mean difference: 52 ±24%; p<0.0001) when HDPET reconstruction was used. The mean difference between SUVmax values according to the HD-PET and OSEM 3i24s was also shown to differ significantly (mean difference: 9 ±15%; p<0.0001). Highest variance was found in small LN and objects with low 18 F-FDG uptake, whereas lowest variance was found for SUVpeak. ROC-analysis demonstrated an almost identical accuracy of SUVmax for LN3 1 Zusammenfassung metastasis detection when OSEM 3i24s and HD-PET reconstruction were used (AUC: 0.866 ±0.035 und 0.867 ±0.033; p=0.9189). The smaller sum of false negative rate (FNR) and false positive rate (FPR) was verified for the HD-PET algorithm with a SUVmax cut-off 3.2 as well as for the OSEM 3i24s algorithm with a SUVmax cut off value of 4.0 (sensitivity: 89%/76%; specificity: 66%/94%; FNR.: 11%/24%; FPR.: 34%/6%; positive predictive value: 39%/75%; negative predictive value: 97%/94%; accuracy: 71%/90%). Using the SUVmax cut-off value of 3,2 for the HD-PET, no significant loss of sensitivity in CT-morphological normally sized LN when compared to enlarged LN (sensitivity all LN: 89%; LN < 10 mm: 81%) was found. In a patient-based analysis, the HD-PET algorithm showed the highest sensitivity for the discrimination between the N0/1-stage and the N2/3-stage and thus also outperformed the only visual evaluation performed by board certified nuclear medicine specialists (HD-PET with SUVmax 3.2: 94%; OSEM 3i24s with SUVmax 4.0: 72%; visual interpretation 67%). On the other hand the highest accuracy was found for the OSEM 3i24s algorithm (HD-PET with SUVmax 3.2: 67%; OSEM 3i24s with SUVmax 4.0: 87%; visual: 78%). A further subanalysis showed a significantly lower SUV-uptake (p≤0,038) and a corresponding decreased diagnostic accuracy in patients presenting with high fasting blood glucose levels (≥150 mg/dl) at the day of the examination, despite insulin premedication prior to the tracer application. Conclusion: The HD-PET-algorithm can detect mediastinal lymph node metastasis via an SUVmax cut-off of 3.2 - even in CT- morphometrically inconspicuous LN -with a very high sensitivity. Moreover, it can exclude malignancy of LN with a high negative predictive value when the SUVmax uptake is below 3.2. However positive findings must be interpreted critically and verified histologically because of the high rate of false positive results. Compared to OSEM 3i24s, the HD-PET algorithm does not show a significant improvement in both discrimination power or accuracy. Finally the standardized uptake values vary highly among different reconstruction algorithms and quantification methods. Consequently, SUV cut-off values cannot be transferred between different PET reconstruction protocols. 4 2 Einführung 2 Einführung 2.1 Das Bronchialkarzinom 2.1.1 Epidemiologie Lungenkrebs ist in Deutschland mit einer Inzidenz von 64/100.000 und insgesamt 52.070 Neuerkrankungen im Jahr 2010 bei Männern das zweit- und bei Frauen das dritthäufigste Malignom [1]. Mit über 40.000 Sterbefällen pro Jahr stellt er die häufigste Krebstodesursache und vierthäufigste Todesursache insgesamt dar [1]. Die altersstandardisierte Erkrankungs- bzw. Sterberate entwickelte sich bei beiden Geschlechtern zwischen Ende der 1990er Jahre und 2010 gegenläufig [1]. Bei Männern sanken diese um rund 20% auf 60,7 bzw. 49,9/100.000 Einwohner [1]. Bei Frauen zeigte sich ein Anstieg um etwa 30% auf 26,5 Erkrankungs- und 19,8 Sterbefälle auf 100.000 nach Europastandard altersstandardisierten Personen pro Jahr [1]. Erstmals traten 2010 bei Frauen unter 45 Jahren mehr Neuerkrankungen auf als unter gleichaltrigen Männern [1]. Diese Entwicklung lässt sich laut RobertKoch-Institut [1] auf die seit länger bestehenden veränderten Rauchgewohnheiten der beiden Geschlechter zurückführen und wird sich in Zukunft vermutlich fortsetzen. 2.1.2 Risikofaktoren Für die Entstehung von Lungenkrebs zählt das Rauchen von Zigaretten und anderen Tabakerzeugnissen als höchster Risikofaktor und sorgt in der EU für ca. 85% der jährlichen Lungenkrebstodesfälle [2]. Ein männlicher Zigarettenraucher hat derzeit ein durchschnittlich 24-fach höheres Risiko an Lungenkrebs zu erkranken als ein lebenslanger Nichtraucher [2]. Für Konsumenten von Zigarren und Zigarillos bzw. Pfeifentabak erhöht sich das Risiko um den Faktor 8 bzw. 9 [3]. Die Dauer des Rauchens stellt dabei den wichtigsten Einflussfakor dar, das Risiko einer Karzinogenese steigt proportional zur Anzahl gerauchter Zigaretten [4]. Der karzinogene Effekt ist für Männer und Frauen vergleichbar und wirkt sich auf alle histologischen Zelltypen aus [4]. Die relative Erhöhung des Lungenkrebsrisikos durch Passivrauchen wird auf 24-37% geschätzt [5]. Die Exposition mit Kanzerogenen wie Asbestfasern oder Metallstäube am Arbeitsplatz wird für 9-15% [6], eine erhöhte Radonkonzentrationen in Wohnräumen für 5 % der Lungenkrebsfälle verantwortlich gemacht [7]. Luftverunreinigungen, 5 2 Einführung Feinstäube, und Fasern spielen eine untergeordnete Rolle [4]. Dem Humanen Papilloma Virus (HPV) wird ebenfalls eine wichtige Stellung als Kanzerogen zugeschrieben; valide Daten hierfür stehen jedoch noch aus [8]. In der Vergangenheit zeigte sich eine Häufung von Lungenkrebserkrankungen in Großstädten und Industrieregionen sowie eine inverse Korrelation zu dem sozioökonomischen Status [9]. Die genaue Nachforschung ergab jedoch einen Konfundierungseffekt durch die höhere Prävalenz des Rauchens und der beruflichen Exposition gegenüber Kanzerogenen in diesen Populationen [10] [11]. 2.1.3 Karzinogenese Das Bronchialkarzinom entsteht auf Grundlage einer durch chronisch-entzündliche Reizungen und kanzerogenen Noxen verursachte Hyperplasie pluripotenter Basalzellen [12]. Diese führen zu Plattenepithelmetaplasien, Becherzellhyperplasien und zu einer Vermehrung neuroendokriner Zellen [12]. Eine schrittweise Entdifferenzierung über Zellatypien und –dysplasien führt schließlich zur Entstehung der verschiedenen Karzinomsubtypen [12]. Histologisch und klinisch wird aufgrund des hochmalignen Wachstums, differenzierter Therapie und schlechterer Prognose das kleinzellige- vom nicht kleinzelligen Bronchialkarzinom unterschieden [12]. Das sich aus neuroendokrinen Zellen entwickelnde hochmaligne kleinzellige Bronchialkarzinom macht ca. 25-30% der Lungenkrebsfälle aus [12]. Die Klasse des nicht-kleinzelligen Bronchialkarzinoms setzt sich zu 45% aus Plattenepithel- und zu 15% aus Adenokarzinomen zusammen [12]. Die restlichen 10% werden als großzellige Karzinome zusammengefasst [12]. 2.1.4 Klinik Rund 90% der Patienten weisen bei Erstdiagnose Krankheitssymptome auf [13] [14]. Dabei werden lediglich rund ein Drittel der Symptome durch den Primärtumor direkt verursacht, wobei eine zentrale Lokalisation häufig früher zu einer Symptomatik führt als eine periphere [14]. Tabelle 1 zeigt die häufigsten Initialsymptome. Ein Drittel der Symptome lässt sich auf bereits vorhandene definierte Fernmetastasen zurückführen und ein weiteres Drittel stellen systemische Symptome dar [13] [14]. Bei rund 10% der Patienten treten im Krankheitsverlauf durch das Lungenkarzinom verursachte paraneoplastische Syndrome auf [4] [15]. 6 2 Einführung Tabelle 1: Klinische Initialsymptome von Lungenkarzinomen Symptome Häufigkeiten Primärtumor Husten 8-75% Brustschmerz 20-49% Hämoptysen 6-35% Intrathorakale Tumorausbreitung Luftnot 3-60% Brustwandschmerzen 20- 49% Heiserkeit - Läsionen Plexus branchialis - Horner-Syndrom - Extrathorakale Ausbreitung Gewichtsverlust 0-68% Knochenschmerzen 6-25% Schwächegefühl 0-10% Quelle: modifiziert nach Spiro et al.: Chest 132 (2007) [14] 2.1.5 Diagnostik und Stellenwerte des 18F-FDG-PET/CT 2.1.5.1 Basisdiagnostik und weitere Therapieplanung Durch die oft unspezifische Klinik und relativ späte Vorstellung der Patienten sind mehrwöchige oder gar mehrmonatige Verzögerungen der Diagnostikeinleitung häufig [16]. Zur Basisdiagnostik gehören laut aktueller S3-Leitlinien [4] folgende Untersuchungen: • Anamnese mit klinischer Untersuchung, insbesondere mit Erfassung der Rauchgewohnheiten in packyears, die berufliche Schadstoffexposition und Familienanamnese sowie physikalische Untersuchung von thorakalen Organen, Lymphknotenstationen und die Evaluation der in Tabelle 1 aufgeführten klinischen Syndrome und paraneoplastische Syndrome [4]. 7 2 Einführung • Laboruntersuchung mit Differenzialblutbild, Serumchemie mit Elektrolyten, Leber- und Nierenparameter sowie Gerinnungswerten [4]. Die initiale Bestimmung von Tumormarkern wird nicht empfohlen [17]. • Röntgen-Thorax in 2 Ebenen als initiatives bildgebendes Verfahren mit hoher Verfügbarkeit und geringer Strahlenexposition [4]. Im Falle einer Diskrepanz zwischen Klinik und Befund, sollte eine weitergehende Diagnostik folgen [4]. • Spiral-Computertomographie mit Kontrastmittel von Thorax und Oberbauch inkl. Leber und Nebennieren, sollte immer vor weiterer invasiver Diagnostik erfolgen [18]. • Bronchoskopie • Sonografie des Abdomens Für eine adäquate Therapieplanung und Einschätzung der Prognose ist eine exakte Ausbreitungsdiagnostik mit Einteilung in das TNM-System essentiell [4]. So hängt die 5-Jahres-Überlebenswahrscheinlichkeit sehr stark von dem Tumorstadium bei Erstdiagnose ab [19]. Ein lokaler Befund kann meist mit kurativer Zielsetzung behandelt werden, wobei jedoch eine Fernmetastasierung in den meisten Fällen mit einer infausten Prognose einhergeht [4]. Eine falsche Stadieneinteilung und somit inadäquate Therapie kann folglicherweise die Morbidität und Mortalität erheblich steigern [20]. Die Stadieneinteilung des nicht kleinzelligen Bronchialkarzinoms (NSCLC) erfolgt nach der TNM-Klassifikation der Union internationale contre le cancer (UICC) in der 7. Auflage [21] [22]. Das kleinzellige Bronchialkarzinom wird in der Regel nach der von der International Association for the Study of Lung Cancer (IASLC) festgelegten Einteilung von limited und extended disease unterschieden [21]. Für die Ausbreitungsdiagnostik werden, wie in Abbildung 1 dargestellt, bildgebende und (minimal)invasive Methoden kombiniert [4]. Die Diagnosesicherung erfolgt in der Regel mikroskopisch-morphologisch aus einer Histologie oder Zytologie [4]. 8 2 Einführung Abbildung 1: Diagnostischer Algorithmus des NSCLC nach der aktuellen S3-Leitlinie zur Prävention, Diagnostik, Therapie und Nachsorge des Lungenkarzinoms. Quelle: Goeckenjan et al.: Pneumologie 64 (2010).[4] Die Einteilung des Tumorstadiums (Staging) erfolgt international anhand der TNMKlassifikation nach der 7. Auflage der UICC [21]. Die für bildgebenden Verfahren wichtigsten Kategorien hierbei sind das Stadium des Primärtumors (T), von Lymphknotenmetatasen (N) sowie Fernmetastasen (M). Eine Übersichtstabelle der TNM-Klassifikation nicht kleinzelliger Bronchialkarzinome findet sich im Anhang 1. 9 2 Einführung 2.1.5.2 T-Staging Bei vermutetem oder nachgewiesenem Primärtumor soll laut den aktuellen S3Leitlinien [4] als wichtigste Untersuchung zum Staging des Primärtumors eine kontrastmittelverstärkte Computertomographie (KM-CT) von Thorax und Oberbauch durchgeführt werden [4] [18]. Mithilfe dieser Untersuchungsmethode ist eine Differenzierung zwischen T1- und T2-Stadium möglich sowie die für die Operabilität wichtige Differenzierung zwischen T3 und T4 [4]. Bei Nachweis von extensiven Infiltrationen des Mediastinums kann auf zusätzliche invasive Bestätigungen verzichtet werden [4]. Zur Beurteilung von Brustwand- und Plexusinfiltrationen insbesondere bei Tumoren der Lungenspitze und der oberen Thoraxapertur sowie bei eingeschränkter Aussagekraft der Computertomographie bei Infiltration in mediastinale Organe, kann eine Magnetresonanztomographie (MRT) oder Thoraxsonographie mit höherem Weichteilkontrast durchgeführt werden [4] [23]. Mittels der Computertomographie (CT) alleine können thorakale Läsionen mit hoher Sensitivität, jedoch mit zu geringer Spezifität festgestellt werden [4]. Durch offensichtliche Zeichen von Infiltrationen oder Metastasierungen sowie Kontrastmittelaufnahme oder Wachstumsnachweise in Verlaufsuntersuchungen können sich klare Hinweise auf einen malignen Tumor ergeben [4] [24]. Die CTmorphologischen Zeichen eines solchen Rundherdes sind jedoch in der Regel für die Diagnose eines Malignoms nicht ausreichend [4] [24]. Eine anschließende Methode zur Diagnosesicherung ist somit nötig [4] [24]. Eine weitere etablierte Methode zur Detektion und T-Staging von Lungenrundherden stellt die 18F-FDG-Positronen-Emissions-Tomographie (18F-FDG-PET) dar [4]. Für die 18 F-FDG-PET zeigte Hellwig et al.[25] bereits 2001 in einer Metaanalyse für die Beurteilung von Lungenrundherden unklarer Dignität hohe Sensitivitäten bei hohen Spezifitäten von 96% (94 – 97%) bzw. 80% (76 – 85%). Fischer et al.[26] bestätigte die hohe Sensitivität bei Rundherden größer 10 mm. Bei kleineren Läsionen nimmt die Sensitivität abhängig vom räumlichen Auflösungsvermögen des PET/CT ab und ist geräteabhängig bei Durchmessern unter 8-10 mm für das T-Staging nicht mehr indiziert [4] [27]. Die Höhe des standardized uptake value (SUV) als Indikator der tumoralen 18 F-FDG-Aufnahme stellt hierbei ein wichtiges Maß für die Genauigkeit bei der Charakterisierung des Lungenherdes dar [28]. 10 2 Einführung 2.1.5.3 N-Staging Die PET bzw. PET/CT mit 18 F-FDG als Tracer besitzt mit Sensitivitäten von 83% (65- 89%) und Spezifitäten von 89% (81-95%) eine signifikant bessere diagnostische Genauigkeit bei der Detektion mediastinaler Lymphknotenmetastasen als die Computertomographie alleine [29]. Die alleinige Bestimmung der Lymphknotengröße als Zeichen der Dignität ist für das Staging mediastinaler Lymphknotenmetastasen durch die CT oder andere bildgebende Verfahren mit Sensitivitäten und Spezifitäten von ca. 62% unzureichend [30] [31]. Insbesondere bei normal großen und somit CT-morphologisch benigne gewerteten LK zeigt die 18F-FDG-PET bei der Unterscheidung zwischen N0/1- und N2/3-Stadium eine Sensitivität von 70% und eine Spezifität von 94% gegenüber der Mediastinoskopie (MSK) (42% und 100%) und der endoskopischen UltraschallNadelaspiration (EBUS) mit (66% und 100%) [29] [32]. Im Fall vergrößerter mediastinaler LK über 10 mm in der kurzen Achse empfehlen Göerkerjan et al.[4] eine weitergehende Abklärung vor der Behandlung des Primarius sowie eine definitive Evaluation bei angestrebter kurativer Therapie soweit keine Fernmetastasierung besteht [4]. Die 18 F-FDG-PET wurde 2010 in die S3- Leitlinien aufgenommen und kann bei kurativem Behandlungsziel im Stadium 1A bzw. soll ebenfalls bei kurativer Behandlungsintention im Stadium IB-IIIB zum mediastinalen und extrathorakalen Staging eingesetzt werden [4]. Die 18 F-FDG-PET/CT erlaubt es, bei unauffälligem Glukosestoffwechsel und CT- morphologisch nicht vergrößerten LK auf eine invasive Mediastinoskopie verzichten zu können. Vergrößerte LK sollen jedoch auch bei unauffälligen abgeklärt werden [4] [31]. Integrierte fusionierten 18 F-FDG PET weiter 18 F-FDG-PET/CT-Aufnahmen sind nachträglich 18 F-FDG- und CT-Aufnahmen bei der Beurteilung des N- und T- Stadiums überlegen [33] [34]. Dies ist durch eine bessere räumliche Zuordnung, CTbasierte Schwächungskorrektur sowie eine bessere Differenzierung von Unregelmäßigkeiten wie z.B. Atelektasen erklärbar [33] [34]. 2.1.5.4 M-Staging Laut den Empfehlungen aktueller Leitlinien soll bei einem auffälligen klinischen Befund eine Untersuchung auf extrathorakale Metastasen erfolgen [4]. Bei klinischem Stadium IB-IIB sowie bei kurativem Behandlungsziel soll auch bei negativem 11 2 Einführung klinischen Untersuchungsbefund eine Abklärung extrathorakaler Metastasen erfolgen [4]. Für die Detektion von Metastasen wird ein MRT-Schädel sowie ein Ganzkörper 18 F-FDG-PET empfohlen [4]. Lediglich in Ausnahmefällen kann auf die Ganzkörper- Knochenszintigraphie + CT-Abdomen oder Abdomensonographie ausgewichen werden [4]. Eine kraniale CT-Untersuchung ist nur bei Kontraindikationen gegen eine MRT akzeptabel [4]. Mit der 18F-FDG-PET als Ganzkörperdiagnostik können hierbei T-, N- und M-Stadium durch nur eine einzige Untersuchung nachgewiesen werden [4]. Die 18 F-FDG-PET kann Fernmetastasen sicher detektieren und zeigt im Mittel in 15% der Fälle eine unerwartete Fernmetastasierung [28] [35]. Die 18 F-FDG-PET-Untersuchung leistet somit neben dem Lymphknoten-Staging auch einen wesentlichen Beitrag zur Erkennung unerwarteter Fernmetastasen, die der herkömmlichen Diagnostik entgehen könnten [4]. So belegt eine prospektive multizentrische Studie von Van Tinteren et al. [20] dass in der präoperativen Abklärung von Patienten mit Lungenkarzinomen mittels 18 F-FDG- PET die Rate an nutzlosen Operationen um die Hälfte gesenkt werden kann, hauptsächlich wegen des genaueren mediastinalen Lymphknoten-Stagings und des Nachweises unerwarteter Fernmetastasen [4] [20]. Herder et al.[36] weist in einer weiteren prospektiven randomisierten Studie nach, dass durch den Einsatz der FDGPET die Anzahl invasiver Tests, insbesondere der Mediastinoskopien, signifikant reduziert werden kann. Im Vergleich zum CT-basierten T-Staging zeigte Weber et al.[37] eine Veränderung des Tumorstadiums in 20% der Fälle, wobei in nur 2% der Fälle eine falsche Einschätzung durch das 18F-FDG PET vorlag [37]. Ein suspekter Befund sollte durch die Pathologie bestätigt werden und nur in Ausnahmefällen - durch eine eindeutige Klinik und aufgrund von radiologischen Zeichen - mit der Konsequenz des Ausschlusses einer potenziell kurativen Behandlung als Metastase festgelegt werden [4]. 2.1.6 Diagnosesicherung Für die Diagnosesicherung stellt die Bronchoskopie die wichtigste Methode insbesondere bei zentral gelegenen Tumoren dar [38]. Bei peripherer Lokalisation kann die Erfolgsrate durch den Einsatz von Instrumenten wie Bürsten, Nadeln, Kathetern oder Zangen sowie unter Durchleuchtung gesteigert werden [39] [40] [41] 12 2 Einführung [42]. Bei CT-morphologisch vergrößerten und/oder 18 F-FDG-PET positiven Lymphknoten kann eine ergänzende transbronchiale Nadelaspiration, ggf. mit Hilfe von endoskopischen Ultraschallverfahren gesteuert (EBUS), zur Probengewinnung des LK eingesetzt werden [4]. Die Trefferquote einer Probengewinnung beträgt hier rund 70% bzw. bis zu 90% bei der EBUS-gesteuerten Punktion nicht subcarinaler Lymphknotenstationen [43] [44] [45]. Diese Methoden sollten nur zur Bestätigung, jedoch nicht zum Ausschluss mediastinaler Lymphknotenmetastasierungen eingesetzt werden [4]. Mehrere Studien bestätigten eine geringe Komplikationsrate von nur wenigen Prozentpunkten und eine Letalität im Promillebereich [39] [42] [46] [47]. Eine weitere Möglichkeit zur histologischen Sicherung vergrößerter mediastinaler Lymphknoten bildet die Mediastinoskopie (MSK) mit einer Sensitivität von 80-90% [48] [49]. Hierbei können die Lymphknoten der Positionen 2r, 2l, 4r, 4l und 7 routinemäßig erfasst werden [49]. Die Mortalität liegt mit 1% und die Morbidität mit rund 5-10% etwas höher als bei den endo/-tranbronchialen Biopsien [50] [51]. Die Differenzierung zwischen kleinzelligen- und nicht kleinzelligen Bronchialkarzinomen ist nach einem systematischen Review von Schreiber und McCrory [52] auch mithilfe der Zytologie im Vergleich zur Histologie als Goldstandard mit einer sehr hohen Treffsicherheit von 98% möglich [53]. Bei Diskrepanz zum radiologisch-klinischen Bild eines zytologisch diagnostizierten kleinzelligen Karzinoms soll jedoch weiterhin eine Gewinnung von histologisch aufarbeitbarem Material angestrebt werden [53]. Eine perkutane Nadelaspiration kann bei pleuraständigen Prozessen mit Hilfe des Ultraschalls, bei nicht pleuraständigen Raumforderungen meist gut unter CTKontrolle, punktiert werden [54] [55] [56]. Insbesondere bei kleinen pulmonalen Läsionen kann so eine höhere Sensitivität im Vergleich zur Bronchoskopie erreicht werden [4]. Der Schwellenwert liegt hier bei 3 cm [56] [57] [58] [59]. Die Komplikationsrate eines Pneumothorax beträgt jedoch 10-30% [60]. Die Sputumzytologie ist nach Augusti et al.[61] aufgrund der niedrigen Sensitivität von 31-43% und einer Spezifität von 94% nur bei Patienten mit hohem Komorbiditätsindex sinnvoll [4] [61]. Bei unklarem Pleuraerguss mit unauffälliger 13 2 Einführung Zytologie im Pleurapunktat kann vor kurativer Lokaltherapie eine Thorakoskopie zum Ausschluss einer pleuralen Aussaat durchgeführt werden [62] [63]. 2.1.7 Therapie und Prognose In Deutschland lag die relative 5-Jahres-Überlebensrate 2010 für Männer bei 16% und für Frauen bei 21% [1]. Hierbei ist die Prognose für asymptomatische Patienten geringfügig besser als die von symptomatischen Patienten [13] [14]. Die Überlebenswahrscheinlichkeit hängt jedoch am stärksten vom Tumorstadium zum Zeitpunkt der Diagnose ab [19]. Bei ausschließlich lokalem Befund überleben z.B. in den USA 49% der Patienten die nächsten 5 Jahre, bei regionalen Lymphknotenmetastasen sind es 16%, bei Fernmetastasen sinkt die Rate auf 2% [19]. Die verbleibende Lebenszeit beträgt im Stadium IIIB/V im Median 8-12 Monate [4]. Mit den Informationen des TNM-Stagings werden Tumorstadien wie in Tabelle 2 dargestellt von 0-IV festgelegt [21]. Für jedes Tumorstadium steht wiederum ein komplexer Therapiealgorithmus zur Verfügung, welcher interdisziplinär auf den Patienten angepasst werden sollte [4]. Bei lokalisiertem Stadium I und II sowie IIIA wird eine radikale Resektion des Tumors mit ausreichendem Sicherheitsabstand und wenn möglich als Lappenresektion mit ipsilateraler Lymphadenektomie angestrebt [4]. Bei eingeschränkter karidopulmonaler Funktion kann auf eine parenchymsparende atypische Resektion oder auf eine definitive Strahlentherapie ausgewichen werden [4]. Bei einer R1Resektion wird eine Nachresektion oder ausweichend eine Nachbestrahlung mit 60 Gy angestrebt [4]. Im Stadium II bzw. IIIA sollte bei Patienten in gutem Allgemeinzustand eine adjuvante Chemotherapie innerhalb von 60 Tagen nach der Operation durchgeführt werden [4]. Eine neoadjuvante Chemotherapie hat hingegen keinen Einfluss auf die Rezidivfreiheit und das Gesamtüberleben [4]. 14 2 Einführung Tabelle 2: Stadieneinteilung des NSCLC nach Vorschlag der UICC in der 7. Auflage Quelle: Goeckenjan et al.: Pneumologie 64 (2010) [4] nach der Stadieneinteilung von Sobin et al. : TNM Classification of Malignant Tumours, 7th ed. Wiley Blackwell (2009) [21] Das Tumorstadium IIIA nach der UICC [21] wird aufgrund des großen Einflusses auf Therapie und Prognose in der Klassifikation von Robinson [4] [64] [65] in folgende 4 Subkategorien aufgegliedert: • IIIA1- mediastinale Lymphknotenmetastasen bei der postoperativen histologischen Aufarbeitung in einem Lymphknotenlevel [4] [64] [65] • IIIA2- intraoperative Feststellung des Befalles eines Lymphknotenlevels [4] [64] [65] • IIIA3 -Befall einer oder mehrerer Positionen, präoperativ festgestellt durch Mediastinoskopie, Feinnadelbiopsie oder PET [4] [64] [65] • IIIA4 „bulky“ oder fixierte Lymphknoten [4] [64] [65] 15 2 Einführung Patienten in den Stadien IIIA1 bis IIIIA3 sollen einer Operation mit systematischer mediastinaler Lymphknotendissektion unterzogen werden, Stadium IIIA4 wird nur in Ausnahmefällen operativ therapiert [4]. Adjuvant werden bei den Stadien IIIA1 und IIIA2 cisplatinhaltige Chemotherapien in einem Zeitraum von 60 Tagen nach erfolgreicher Resektion durchgeführt, bei mediastinalem Lymphknotenbefall in Kombination mit einer Radiotherapie [4]. Patienten in den Stadien IIIA4 /IIIB werden mit einer simultanen Radio-Chemotherapie behandelt, eine Operation wird hier nur in Studien und in erfahrenen Zentren bei technisch möglicher Resektion durchgeführt [4]. Im Stadium IIIB/IV stehen eine palliative Chemotherapie sowie ein stabiler Betreuungskontext mit Möglichkeiten zur Rehabilitation und psychoonkologischer Unterstützung im Vordergrund [4]. Bei noch gutem Allgemeinzustand kann eine cisplatinbasierte Kombinationschemotherapie mit 4-6 Zyklen die Überlebenszeit, Krankheitskontrolle und Lebensqualität verbessern [4]. Bei Komorbidität kann auf Carboplatin oder eine platinfreie Kombination zurückgegriffen werden [4]. Bei günstigem Krankheitsverlauf kann auch eine Zweit- und Knochenmetastasen im Drittlinientherapie durchgeführt werden [4]. Im palliativen Setting können Rahmen einer Schmerztherapie bestrahlt und bei drohender Instabilität des Knochens operativ stabilisiert werden [4]. Bei drohender metastatischer Myelonkompression kann eine sofortige Strahlenterapie unter Kortisongabe oder eine neurochirurgische/orthopädische Operation eine Querschnittslähmung abwenden [4]. Bei Fernmetastasen ohne mediastinale Lymphknotenbeteiligung und resektablem Primarius ist eine operative Entfernung von singulären Hirn- und Nebennierenmetastasen mit anschließender Ganzhirnbestrahlung im Einzelfall möglich [4]. Bei kleinzelligen Bronchialkarzinomen kann im Stadium des limited disease eine kurative Therapie angestrebt werden [12]. Im lokalen Tumorstadium ohne Lymphknoten- oder Fernmetastasen wird der Tumor reseziert und eine adjuvante Polychemo- und Strahlentherapie angeschlossen, ansonsten Radiochemotherapie mit prophylaktischer Schädelbestrahlung bei Erreichen einer Vollremission [4]. Die extensive disease wird mit einer palliativen Polychemotherapie behandelt [4] [12]. Lokale Bestrahlungen können zur Prävention von Komplikationen ebenfalls eingesetzt werden [12]. 16 2 Einführung 2.2 18F-FDG-PET/CT 2.2.1 Radiopharmakon 2.2.1.1 18F-FDG Die 18 F-2-Fluoro-2-desoxy-D-glukose ist zurzeit das am häufigsten eingesetzte Radiopharmakon der neurologischen und PET und kann in inflammatorischen Glukosemetabolismus simulieren [66]. onkologischen, kardiologischen, Fragestellungen den lokalen 18 F-FDG gilt, abgesehen von den potentiellen Folgen der ionisierenden Strahlung, als nebenwirkungsfreier Tracer [67]. Selbst bei 1000-facher Überdosierung zeigen sich in Tiermodellen keine akuten substanztoxischen Veränderungen [67]. 2.2.1.2 Biologische Grundlage Die maligne Transformation führt zu grundlegenden Veränderungen in der Biochemie von Tumorzellen [68]. Insbesondere die Kohlenhydratstoffwechsels sind hierbei für den Einsatz des Veränderungen des 18 F-FDG als Tracer von besonderer Bedeutung [68]. In schnell wachsenden Tumorzellen findet sich so eine stark erhöhte Hexokinaseaktivität mit einer Bindung von bis zu 80% an die äußere mitochondriale Membran [69]. Desweiteren stellten mehrere Arbeitsgruppen im Rahmen der malignen Transformation eine Überexpression glykolyseassoziierter Gene mit Aktivierung der Glukosetransporter Isoformen GLUT1 und GLUT3 fest [69] [70]. Diese erleichtern die Diffusion von Glukose durch die Zellmembranen und stellen somit einen wichtigen Faktor für eine erhöhte 18 F-FDG-Akkumulation dar [69] [70]. Die in Tierstudien histologisch nachgewiesene erhöhte GLUT1 bzw. Hexokinaseexpression korreliert dabei mit einer erhöhten 18 F-FDG-Aufnahme, welche letztendlich mit der PET zuverlässig gemessen werden kann [69]. 2.2.1.3 Pharmakologische Eigenschaften Nach intravenöser Injektion des 18 F-FDG erfolgt eine rasche Verteilung und Elimination aus der Blutbahn [67]. Die Verteilungszeit liegt bei ca. 1 Minute, die Eliminationszeit aus dem Blutkompartiment beträgt rund 12 Minuten [67]. 18 F-FDG wird wie 2-Desoxyglukose bidirektional über Glukosetransporter in die Zellen aufgenommen und dort durch das Enzym Hexokinase phosphoryliert [69]. 18 F-FDG17 2 Einführung 6-Phosphat kann nun im Gegensatz zu Glukose-6-Phosphat nicht in signifikantem Maße von der Glukose-6-Phosphat-Dehydrogenase verstoffwechselt und nicht zu Fructose-6-Phosphat metabolisiert werden [69]. Auch der weitere Einbau in Glykogen, Glykolipide, Glykoproteine oder in andere Makromoleküle läuft in Säugetiergeweben nur sehr langsam ab und ist somit Untersuchungszeitraum unerheblich [69]. Durch die negative Ladung des für den 18 F-FDG-6- Phosphats kann das Molekül darüber hinaus die Plasmamembran nicht mehr verlassen [69]. Dies führt zu einer Anhäufung von 18 F-FDG - dem sogenannten metabolic trapping - insbesondere in malignen Zellen mit den oben geschilderten Veränderungen des Glukosemetabolismus [69]. Abbildung 2 veranschaulicht die Reaktionsgleichung durch zusätzliche Darstellung des 18 F-FDG-6-Phosphats in der Haworth-Formel [69]. Abbildung 2: Metabolic trapping von 18F-FDG durch intrazelluläre Phosphorylierung Quelle: Schicha H, Schober O. Nuklearmedizin 7. Aufl. Stuttgart: Schattauer (2013); 38. [66] (Mit freundlicher Genehmigung durch den Schattauer Verlag) 18 2 Einführung Nicht aufgenommenes 18 F-FDG wird in den Nierentubuli mit hoher Clearance glomerulär filtriert und im Gegensatz zu Glukose nicht durch den tubulären NatriumGlukose-Symporter rückresorbiert [69]. So werden ca. 20% der Aktivität innerhalb der ersten zwei Stunden über den Urin ausgeschieden [67]. 2.2.1.4 Physikalische Eigenschaften Die für die Nuklearmedizin relevanten physikalischen Eigenschaften des werden durch das radioaktive physikalische Halbwertszeit von Fluor(F)-18-Isotop bestimmt [67] 18 F-FDG [66]. Die 18 F beträgt 109,8 Minuten und wird üblicherweise als Tracer mit einer spezifischen Aktivität von mindestens 20 GBq/µmol verabreicht [67]. 18 F ist ein sogenannter β+-Strahler und zerfällt unter Positronenemission mit einer maximalen Energie von 633 keV [67]. Während des β+-Zerfalls wird ein Proton des Fluor-18-Kerns in ein Neutron umgewandelt [71]. Dabei entsteht neben dem bereits beschriebenen Positron e+ ein Elektron-Neutrino νe. In der unten stehenden Formel wird deutlich, dass sich hierbei die Kernladungszahl um 1 verringert, die Massenzahl bleibt unverändert [72]. [73] Das ausgesandte Positron interagiert, je nach enthaltener kinetischer Energie, innerhalb weniger Millimeter mit Elektronen der umgebenden Materie [66]. In der Positronen/Elektronen-Paarvernichtung wird deren Ruheenergie in Form zweier Gammaquanten mit der Energie E von jeweils 511 keV, in der Regel in einem Winkel von 180°, emittiert [74]. 2.2.1.5 Wechselwirkungen Da die 18 F-FDG den selben Transportmechanismen wie natürliche Glukose unterliegt, beeinträchtigt ein hoher Blutzuckerspiegel durch Verdrängung die Aufnahme des Radiopharmakons [67]. So kann eine diabetische Stoffwechsellage sowie alle Arzneimittel, die den Blutzuckerspiegel beeinflussen, auch die Aufnahme und Verteilung von Kortikosteroide, 18 F-FDG verändern [75]. Insbesondere Medikamente wie z.B. Katecholamine, Valproat, Carbamazepin, Phenytoin und Phenobarbital können hierdurch die Sensitivität der Untersuchung beeinträchtigen [67]. Laut 18 F-FDG Fachinformationen soll deshalb die Untersuchung optimalerweise nur bei Blutzuckerwerten unterhalb 120 mg/dl durchgeführt werden [67]. US19 2 Einführung amerikanische Leitlinien empfehlen einen Einsatz bis maximal 150 mg/dl [76]. Eine forcierte Blutzuckersenkung durch Insulingabe führt jedoch bei Nicht-Diabetikern zu einer Anreicherung des 18 F-FDG in der Muskulatur, so dass sich die Bildqualität ebenfalls verschlechtert [67]. Um den Glukosespiegel auf natürliche Weise zu senken, wird insbesondere für Typ-2 Diabetiker empfohlen 6 Stunden vor der Untersuchung auf Nahrung zu verzichten [67]. Bei fehlender Insulinsekretion wie bei Diabetes mellitus Typ-1 darf eine Mahlzeit inkl. entsprechender Insulindosis wenige Stunden vor der Untersuchung eingenommen werden [67]. Auch degenerative, infektiöse und entzündliche Prozesse können durch die erhöhte 18 F-FDG-Aufnahme zu falsch positiven Befunden führen [67]. Ebenfalls können 2-4 Monate nach einer Strahlentherapie solche Effekte durch den Einfluss auf den Glukosestoffwechsel nicht ausgeschlossen werden [67]. Nach einer Chemotherapie sollte nach den 18 F-FDG Fachinformationen deshalb ein Abstand von 4-6 Wochen zur PET-Untersuchung eingehalten werden [67]. 2.2.2 Positronen-Emissions-Tomographie Ein Positronen-Emissions-Tomograph besitzt im Gegensatz zu einer Gammakamera stationäre ringförmige Detektoren ohne Kollimatoren und wird deshalb im folgenden als PET-Scanner bezeichnet [66]. Die Detektorkristalle bestehen meist aus szintillationsfähigem Bismutgermanat oder Lutetium-Oxyorthosilicat (LSO) und werden in neuen hochauflösenden PET-Scannern in einer Größe von 4,0x4,0 mm eingesetzt [77]. Siemens verbaut z.B. in seinen LSO HI-REZ PET 624 solcher LSODetektorkristalle in einem Dektorring. Bei 39 Dektorringen in aktuellen Scannern ergibt sich so beispielsweise eine Gesamtzahl von 24.336 Detektorkristallen pro Scanner [78]. Trifft ein Photon mit ausreichender Energie E auf einen solchen Detektor oder Szintillationskristall, so wird durch den Compton-Effekt und/oder photoelektrische Absorption ein energiereiches Elektron freigesetzt, welches wiederum weitere Elektronen in einen angeregten Zustand versetzen [79]. Diese Elektronen fallen innerhalb weniger Millisekunden in Ihren Grundzustand zurück und geben diese Energie wiederum in Form von messbaren Lichtstrahlen ab [79]. Um die Lichtstrahlen elektronisch registrieren zu können, müssen diese zuvor mithilfe eines sogenannten Photomultipliers (PM) verstärkt werden [79]. In der Praxis können meist mehrere 20 2 Einführung Detektorelemente auf einen PM geschaltet werden, um so den elektronischen Aufwand zu reduzieren [66] Wie bereits beschrieben, entstehen in der Paarvernichtung zwei Gammastrahlen der Energie E = 511 keV mit exakt entgegengesetzter Flugrichtung [66] [74]. Werden beide γ-Quanten aus einem Zerfallsprozess innerhalb eines kleinen definierten Zeitfensters in entgegensetzten Detektoren registriert (=Koinzidenz), so kann der Ort der Paarvernichtung und somit auch der Ort der Tracerakkumulation auf einer sogenannten line of response (LOR) zwischen den beiden entgegengesetzten Detektorkristallen mit relativ hoher Auflösung zurückverfolgt werden [66]. Moderne ultraHD-PET-Scanner können darüberhinaus die Laufzeitunterschiede beider Gammaquanten im Pikosekundenbereich berechnen und mithilfe dieser time of flight (TOF)-Technik den Ursprung der Quanten auf ihrer Flugbahn (= line of flight) eingrenzen [66] [77]. Da bei der Applikation von diagnostischen Aktivitäten meist mehrere tausend Zerfallsprozesse pro Sekunde stattfinden, können, wie in Abb.3 skizziert, neben echten Koinzidenzen (=trues) auch durch Zufall zweis γ-Quanten aus zwei unterschiedlichen Annihilationen innerhalb des definierten Koinzidenzzeitfensters registriert werden (=randoms) und so eine falsche Koinzidenz vortäuschen [66]. Wird eines der Gammaquanten oder beide aus einem Zerfallsprozess auf dem Weg zu dem Detektor abgelenkt, entstehen sogenannte scatter events, welche die Rekonstruktion der wahren line of flight verzerren können [66] [80]. Darüberhinaus stellt der zurückverfolgbare Ort der Annihilation meist nicht den exakten Ort des Tracerzerfalls dar, sondern kannn wie oben erwähnt, abhängig von der kinetischen Energie des Positrons, wenige Millimeter vom Ort des β+-Zerfalls entfernt liegen [66]. Infolgedessen entsteht eine tracerabhängige und somit physikalisch nicht vermeidbare geringe Ortsunschärfe [66]. Diese Effekte führen insbesondere zu einem erhöhten Rauschen und einer Verschlechterung der Auflösung [66] [81]. Durch komplexe messtechnische und computerbasierte Verfahren sowie durch Berücksichtigung dieser Effekte in den Rekonstruktionsalgorithmen wird versucht, diese Fehlerquellen so gut wie möglich zu kompensieren [66] [80] [81]. 21 2 Einführung Abbildung 3: Beispiele für Koinzidenzen des PET-Scanns mit a) true- b) randomund c) scatter effects Quelle: Rankin L..The Effects of PET Reconstruction Parameters on Radiotherapy Response Assessment and an Investigation of SUVpeak Sampling Parameters (2013) [80] Die Kombination von Positronen-Emissions- und Computer-Tomographie in einem Gerät ermöglicht die beinah simultane Registrierung von physiologischen und morphologischen Informationen sowie deren Darstellung in dreidimensionalen Fusionsbildern [66]. Darüberhinaus kann aus den Informationen der CT, welche simplifiziert dargestellt auf der Abschwächung von Röntgenstahlen durch unterschiedliche Gewebedichten entstehen, auf präzise Art und Weise eine CTbasierte Schwächungskorrektur für die Abschwächung von 511keV Vernichtungsstrahlung für die PET berechnet werden [66] [81]. 2.2.3 Bildrekonstruktion Um die registrierten Aktivitäten visuell auswerten zu können, müssen die entstandenen Datensätze unter Berücksichtigung der beschriebenen Störfaktoren in dreidimensionale Modelle rekonstruiert werden. Die Rekonstruktion beschreibt hierbei in der Tomographie den Prozess, transaxiale Schnittbilder aus Projektionsansichten zu erstellen [82]. Für die nuklearmedizinischen Anwendungen stehen hierfür zwei grundsätzliche Ansätze zur Verfügung [82]. Dies sind die gefilterte Rückprojektion und die iterative Rekonstruktion [82]. Die gefilterte Rückprojektion stellte hierbei in der Vergangenheit die vorherrschende Methode in der nuklearmedizinischen tomographischen Rekonstruktion dar. In den letzten Jahren wurde diese jedoch zunehmend in der Single-Photon-Emissions22 2 Einführung Tomogprahie (SPECT) und Positronen-Emissions-Tomographie (PET) durch die ca. 10fach rechenintensivere iterative Rekonstruktion ersetzt [82] [83]. Die iterative Rekonstruktion stellt vorherrschenden heutzutage im Bereich Rekonstruktionsalgorithmus der dar und SPECT und gewinnt PET auch in den der Computertomographie zunehmend an Bedeutung [82]. 2.2.3.1 Iterative Rekonstruktion Der Prozess der Rekonstruktion beginnt, sobald der Scan abgeschlossen ist und alle originalen Projektionsansichten vorliegen. Für die iterative Rekonstruktion startet der Computer mit einer initialen Anfangsschätzung x(0) des Objektes um einen ersten Datensatz transaxialer Schnitte zu erstellen [82]. Diese Schnitte werden dann genutzt um eine zweite Reihe von vorwärtsgerichteten Projektionsansichten b(n),forward anzufertigen, welche mit den originalen gemessenen Projektionsansichten b des Patienten verglichen werden [82] [84]. b(n),forward = A1x(n) [84] A1 beschreibt hierbei die sogenannte Systemmatrix. Die transaxialen Schnitte der Anfangsschätzung werden dann modifiziert, indem die Differenzen zwischen bzw. die Verhältnisse aus den beiden Projektionsansichten gebildet und auf den transaxialen Schnitt zurückprojiziert werden [82]. x(n),backward = A1T · b(n),correct [84] Dieser modifizierte Datensatz von transaxialen Schnitten (die 2. Schätzung) wird dann wiederum genutzt um eine neue Reihe von verbesserten Projektionsansichten zu erstellen, welche dann auch wieder mit den originalen Projektionsansichten abgeglichen werden [82]. x(n+1) = x(n) · x(n),backward [84] Immer wieder können so die aus den transaxialen Schnittbildern erstellten Projektionsansichten mit den originalen Projektionsansichten verglichen und mit dessen Resultat wiederum die transaxialen Schnittbilder modifiziert werden [82]. 23 2 Einführung Wenn der Vorgang effizient verläuft, erzeugt jede Iteration einen neuen Satz an Projektionsansichten, der sich immer mehr an die originale Projektionsansicht annähert [82]. Der Prozess ist abgeschlossen sobald die Differenz zwischen der geschätzten und der originalen Projektionsansicht einen festgelegten Schwellenwert unterschreitet [82]. In der Praxis werden die meisten iterativen Rekonstruktionen jedoch nach einer vorgegebenen Anzahl von Iterationen beendet [82]. Ein wichtiger Vorteil der iterativen Rekonstruktion stellt das signifikant geringere Ausmaß an Rückprojektionsartefakten dar, welche insbesondere im Bereich sehr hoher und sehr niedriger Aktivitäten die Beurteilbarkeit der Aufnahmen stark beeinträchtigen können (siehe Abbildung 4) [82]. Abbildung 4: SPECT-Aufnahme von Becken und Blase. Aktivitätsdarstellung mit einer a) gefilterten Rückprojektion und b) iterativen Rekonstruktion. Quelle: Modifizierte Abbildung nach Katua A. et al.: World Jorunal of Nuclear Medicine 2011.[85] Ein weiterer Vorteil der iterativen Rekonstruktion, im Vergleich zur gefilterten Rückprojektion ist, dass die Schwächungskorrektur, die Korrektur von Streuungen und sogar die räumliche Auflösung von Kollimator und Detektor direkt in den Rekonstruktionsprozess eingebunden werden können [82]. Der Einsatz der iterativen Rekonstruktionstechnik war in der Vergangenheit aufgrund der komplexen mathematischen Berechnungen und den damit verbundenen langen Rechenzeiten begrenzt. Schnelle Computer und mathematische Techniken wie die ordered subsets expecation maximization (OSEM)-Rekonstruktion konnten dieses Problem jedoch weitgehend kompensieren [66] [84]. 24 2 Einführung 2.2.3.2 OSEM-Rekonstruktion Eine weitverbreitete iterative Rekonstruktionsmethode ist der OSEM-Algorithmus, welcher den Rechenaufwand vermindert, indem einzelne Projektionsansichten bzw. Winkelprojektionen bei der Berechnung der axialen Bilder übersprungen werden [82] [86]. Um die Rechenzeit zu verkürzen, werden die gemessenen Projektionen zuerst in Untergruppen, Subsets genannt, aufgeteilt [82] [84]. Jedes Subset besteht dabei aus Winkelprojektionen, die nahezu den gesamten Bogen der Aufnahme von 180° bzw. 360° enthalten [82] [84]. Zum Beispiel könnte das erste Subset jede 12. Winkelprojektion enthalten, beginnend mit der 2. Projektionsansicht. Das zweite Subset würde dann wieder jede 12. Winkelprojektion enthalten, beginnend jedoch mit der 6. Projektionsansicht und so weiter [82]. Für die Berechnung jedes Subsets wird so in jeder Iteration nur eine kleine Teilmenge von nach Rotationswinkeln geordneten Projektionsansichten der geschätzten und originalen Datensätze genutzt [82] [84]. Trotz der geringen Anzahl an verwendeten Messwerten erhält man daher bereits nach einem Durchgang eine relativ gute Schätzung der Aktivitätsverteilung [84]. Abbildung 5: Einfluss der Anzahl an Iterationen und der Größe des Gauß-Filters auf die Abbildungsqualität OSEM-Rekonstruktionen (4 Subsets) eines PET-Phantoms mit 40 cm x 20 cm, 8 Tumore mit 3 cm Durchmesser und 4-facher Hintergrundaktivität. Die Zunahme an Iterationen führt zu einer Erhöhung des Kontrastes sowie des Bildrauschens. Quelle: Modifizierte Abbildung nach Rankin L.: The Effects of PET Reconstruction Parameters on Radiotherapy Response Assessment and an Investigation of SUVpeak Sampling Parameters (2013) [80] 25 2 Einführung Sobald alle Subsets nacheinander berechnet wurden, ist eine komplette OSEMIteration abgeschlossen [84]. Für jede weitere Iteration wird dabei ein anderes Subset genutzt [82]. Wie in Abb. 5 demonstriert, verbessert sich die Bildqualität hierbei in der Regel mit einer ansteigenden Anzahl von Iterationen [82]. Der OSEM-Algorithmus basiert dabei auf der mathematischen Grundlage der maximum-likelihood-expectation-maximization (MLEM), welche wie folgt beschrieben werden kann [82]: [84] M stellt hierbei das Produkt aus R parallelen Projektionsstrahlen der Breite ∆ p und der Anzahl aus Θ Winkelprojektionen dar [84]. (M= Θ R), aji beschreibt den Anteil der Pixel x1 die zum Projektionsstrahl k(j) beitragen [84]. Wird der MLEM-Algorithmus um das ordered-subset-Verfahren modifiziert lautet die Rekonstruktionsformel eines Subsets wie folgt. [84] Da hier nur das Grundprinzip der OSEM–Rekonstruktion veranschaulicht werden soll und eine weitere Aufarbeitung den Rahmen dieses Kapitels sprengen würde, wird an dieser Stelle für eine deutschsprachige und ausführliche mathematische Herleitung auf die Dissertation von Herrn Kehren aus dem Jahr 2001 verwiesen [84]. 26 2 Einführung 2.2.3.3 HD-PET- Rekonstruktion Ab einer gewissen Anzahl von Iterationen kann mit den iterativen Rekonstruktionsverfahren eine weitere Verbesserung der Auflösung nur auf Kosten eines erhöhten Bildrauschens erbracht werden (siehe Abb.5) [82]. Um u.a. die Auflösung sowie das Signal-Rausch-Verhältnis zu verbessern, wurden in den letzten Jahren dreidimensionale iterative Rekonstruktionsverfahren mit Auflösungsrückgewinnung wie der TrueX-Algorithmus der Siemens AG entwickelt [77]. Der von der Firma Siemens implementierte TrueX-Algorithmus der TruePoint HD PET/CT-Scanner basiert dabei auf der sogenannten point spread function (PSF) und stellt eine Weiterentwicklung der OSEM-Rekonstruktion dar [77]. Die PSF wird dazu verwendet, Photonen, die in einem flachen Winkel den eigentlichen Detektorkristall durchstoßen und Ihre Energie an den benachbarten abgeben, auf die richtige line of flight zuzuordnen [77]. Dies geschieht umso häufiger, je weiter sich das zu detektierende Objekt außerhalb des Zentrums des field of views befindet (siehe Abb. 6) [77]. Die Folge wäre eine Detektion der Koinzidenzen auf benachbarten Detektorkristallen mit konsekutiv falsch zugeordneter line of flight [77] [83]. Dieser Effekt führt in den konventionellen Rekonstruktionsalgorithmen zu Verzerrungen und einer verminderten Auflösung bei Objekten peripher der Detektormitte (siehe Abb. 7) [77] [78]. Die PSF soll vor allem bei kleinen, außerhalb des Scanner-Zentrums liegenden Objekten so den Kontrast und das Signal-Rauschen-Verhältnis um bis zu den Faktor 2 verbessern sowie unter Laborbedingungen Auflösungen von bis zu 2 mm ermöglichen [78] [83]. Das Grundprinzip der iterativen 3D-Rekonstruktionsverfahren gleicht denen der iterativen 2D-Verfahren, so dass auf weitere Details des Algorithmus hier nicht weiter eingegangen werden soll. 27 2 Einführung Abbildung 6: Funktionsweise der point spread function (PSF) Links: In konventionellen PET-Scannern führen Gammaquanten aus Zerfällen außerhalb des Detektorzentrums zu Durchstoßungen benachbarter Szintillationskristalle und somit zu einer Detektion mit falscher Ortsinformation. Rechts: Mithilfe der PSF sollen Verzerrungen durch nicht senkrecht in den Detektorkristall eintreffenden Gammaquanten korrigiert werden [77]. Quelle: Siemens Medical Solutions USA, Inc.: Biograph mCT The world´s first molecular CT [77]. Abbildung 7: Verändertes Signalprofil bei Detektion von Photonen außerhalb des Detektorzentrums a) Mithilfe der PSF werden verzerrte Signalprofile erkannt und die ursprüngliche Form des Objektes zurückberechnet [77]. b) Unschärfen durch nicht auf den Detektor senkrecht einfallende Gammaquanten sollen insbesondere bei Objekten außerhalb des Detekorzentrums durch die PSF minimiert werden [77]. Quelle: modifiziert nach Siemens Medical Solutions USA, Inc.: Inside Biograph TruePoint PET CT (2009) [78] 28 2 Einführung 2.2.4 SUV-Quantifizierung Die Positronen-Emissions-Tomographie bietet die Möglichkeit einer absoluten biologischen Quantifizierung von Stoffwechselvorgängen z.B. des regionalen Glukosemetabolismus mittels 18 F-FDG [87]. Patlak et al. [87] stellten hierfür 1983 ein vereinfachtes Linearisierungsverfahren vor, mit welchem der Glukoseverbrauch in jedem Voxel bestimmt werden kann. Die hierfür erforderlichen dynamischen PETAufnahmesequenzen und Aktivitätsmessungen arterieller Blutproben sowie die organabhängigen und nur unzureichend bekannten Lumped Konstanten (LC) zur Equalisation von Enzymaffinitäten machen diese Form der absoluten Quantifizierung insbesondere für Ganzkörperuntersuchungen in der onkologischen Routine unpraktikabel [87] [88]. In der klinischen Praxis hat sich stattdessen die physikalische Quantifizierung von regionalen Radioaktivitätsverteilungen mittels des standardized uptake value (SUV) etabliert. Durch die Formel: SUV(t) = ( ) ( ) lässt sich der SUV zu einem bestimmten Zeitpunkt t durch die vom PET-Scanner gemessenen physikalischen Aktivitätskonzentrationen C in Bq/g, des Körpergewichts KG in g und der injizierten Aktivität A in Bq unter Berücksichtigung des Zerfalls zwischen Injektion und Aufnahmezeitpunkt berechnen [89] [90]. Insbesondere für kleine Läsionen mit zunehmenden Einfluss durch den Partialvolumeneffekt lässt sich mithilfe eines Recovery-Koeffizienten RC durch individuelle Berücksichtigung von Scanner- und Softwareparameter die tatsächliche Aktivität A2 von der gemessenen Aktivität A1 mit der folgenden Formel herleiten [91]: RC = Der Partialvolumeneffekt quantifizierenden führt, Läsionen in ä ä wie ä in Abb. Abhängigkeit 8 der illustriert, bei Objektgröße kleinen zu und des Auflösungsvermögens des Scanners zu einer Unterschätzung der wahren Aktivität [92]. 29 2 Einführung Abbildung 8: Einfluss Aktivitätsverteilung des Partialvolumeneffekts auf die rekonstruierte Die Aktivität einer Punktquelle (Aktivität 100%, Durchmesser 10 mm, nichtradioaktiver Hintergrund) wird durch den Partialvolumeneffekt auf die Umgebung verteilt und außerhalb des eigentlichen Objektes mit verminderter maximalen Aktivität dargestellt [92]. Quelle: Soret M.et al J. Nuc Med. 48 (2007) [92] Um den SUV in einer regional umschriebenen Lokalisation zu bestimmen, wird mithilfe eines Auswertungsprogramms manuell eine dreidimensionale Region, auch volume of interest (VOI) genannt, festgelegt. Zur Bestimmung des SUV in dem VOI werden häufig folgende Methoden angewandt (zur graphischen Veranschaulichung siehe Abbildung 9): • SUVmean: Bestimmt den Mittelwert des SUV aller Voxel in dem VOI. • SUVaverage: Kann als Synonym zu SUVmean verwendet werden [92]. • SUVmax: Berechnet den SUV in einem Voxel mit der höchsten Aktivität innerhalb des VOI [92]; zeigt mathematisch bedingt die höchsten UptakeWerte. • SUVpeak: Kombination aus SUVmax und SUVmean; Positioniert in dem VOI eine Kugel mit definiertem Volumen, z.B. 1 ml, im Bereich der höchsten Aktivität und berechnet den gemittelten SUV aus allen Voxeln dieser Kugel [93] [94] [95]. 30 2 Einführung Abbildung 9: Methoden zur SUV-Quantifizierung Innerhalb des rot umrandeten VOI bestimmen die grün eingezeichneten Voxel die SUV-Quantifzierung für a) SUVmax, b) SUVmean und c) SUVpeak. Quelle: Rankin L.: The Effects of PET Reconstruction Parameters on Radiotherapy Response Assessment and an Investigation of SUVpeak Sampling Parameters (2013) [80] 2.3 Fragestellung In den aktuellen S3-Leitlinien zur Prävention, Diagnostik, Therapie und Nachsorge des Lungenkarzinoms wurde die 18 F-FDG-PET/CT als Therapie der Wahl zur Ausbreitungsdiagnostik des Lungenkarzinoms etabliert und spielt mittlerweile eine Schlüsselrolle für die weitere Therapieplanung und Kontrolle [96]. Durch die hohe Sensitivität kann bei unauffälligem PET/CT sogar auf eine weitere invasive Diagnostik verzichtet werden [96]. Hellwig et al.[97] beschrieb 2007 die SUV-Quantifizierung als geeignetes Instrument zur Dignitätsbeurteilung, in der Dissertation von Hülsewede [98] wurde der hierfür geeignete SUV Cut-off von 2,5 bestätigt. Mit einem validierten Schwellenwert nimmt die SUV-Quantifizierung einen immer wichtigeren Stellenwert ein und stellt ein wichtiges Zusatzinstrument, insbesondere für unerfahrene Untersucher, zur visuellen Analyse dar [97]. Speziell die Detektion von Metastasen in CT-negativ gewerteten LK <10 mm in der kurzen Achse führt das PET aufgrund des Sensitivitätsverlustes und der zunehmenden Bedeutung des Partialvolumeneffektes an die Grenzen seiner Leistungsfähigkeit [29] [69]. Neue Techniken und Rekonstruktionsalgorithmen mit Auflösungsrückgewinnung, wie der TrueX-Algorithmus der TruePoint HD Serie, versprechen höhere Auflösungen 31 2 Einführung von bis zu 2mm und verbesserte Signal-Rausch-Verhältnisse [77] [78]. Physikalische Arbeiten stehen jedoch der Quantifizierung per TrueX-Algorithmus kritisch entgegen [99]. Die vorliegende Arbeit soll deshalb anhand 274 retrospektiv SUV-Quantifizierten und histologisch gesicherten Lymphknotenzonen aus einem Kollektiv von 72 Patienten folgende Fragen beantworten: • Zeigt sich eine Korrelation der SUVs zwischen unterschiedlichen Rekonstruktionsalgorithmen und den Quantifizierungsmethoden? • Wie verhält sich die Höhe der SUV-Messungen zwischen verschiedenen Rekonstruktionsalgorithmen unterschiedlich hohen • Wie verhält sich die und Quantifizierungsmethoden bei 18 F-FDG-Aufnahmen und Objektgrößen? 18 F-FDG-Aufnahme in vergrößerten zu normal großen LK sowie zwischen benignen und malignen LK? • Lässt sich ein SUV-Schwellenwert für die Differenzierung zwischen benignen und malignen LK definieren? • Welcher Rekonstruktionsalgorithmus zeigt mit welcher Quantifizierungsmethode mittels SUV-Analyse die höchste Trennschärfe zwischen malignen und benignen LK? • Wie hoch ist die Leistungsfähigkeit der SUV-Quantifizierung bei CTmorphometrisch unauffälligen LK kleiner 10mm? • Wie leistungsfähig ist ein solcher SUV-Cut off in Bezug auf das patientenangewandte Staging mediastinaler LK mit der Differenzierung zwischen N0/1- und N2/3-Status (wichtiges Kriterium für die Frage operabel oder nicht operabel)? • Gibt es Störfaktoren für eine regelrechte 18 F-FDG-Aufnahme in LK- Metastasen und thorakalen Primärtumoren? 32 3 Methodik 3 Methodik 3.1 Patientenselektion In die retrospektive Auswertung wurden Patienten der Nuklearmedizinischen Fakultät des Universitätsklinikums des Saarlandes aufgenommen, welche folgende Einschlusskriterien erfüllten: • Vermutetes oder gesichertes Bronchialkarzinom • 18 • Transbronchiales, mediastinoskopisches oder operatives Lymphknotenstaging F-FDG-PET/CT-Untersuchung im Zeitraum Februar bis Dezember 2011 innerhalb von 6 Wochen nach, bzw. transbronchiale Lymphknotenpunktion frühestens 2 Wochen vor 18F-FDG-PET/CT Bildgebung Folgende Punkte führten zu einem Ausschluss aus der Kohorte: • Frustranes invasives Lymphknotenstaging ohne histologisch oder zytologisch verwertbares Material • Kein eindeutiger histologischer oder zytologischer Befund durch die Pathologie • Pathologische Blutglukosekonzentration von ≥160mg/dl im Kapillarblut zum Zeitpunkt der 18F-FDG-Applikation 3.2 Patientencharakteristika Das analysierte Patientenkollektiv umfasste 72 Patienten, davon 50 Männer und 22 Frauen mit einem mittleren Gewicht von 75,6 ±15,0 kg und einem BMI von 26,0 ±5,1 kg/m² im Alter von 59,1 ±10,5 Jahren zum Untersuchungszeitpunkt, welche mit vermutetem oder gesicherten Bronchialkarzinom zur 18 F-FDG-PET/CT überwiesen wurden. Außerdem wurden die Patienten in einem Zeitraum von maximal 6 Wochen (im Betrag 12,0 ±11,5 Tage) einem ersten invasiven Lymphknotenstaging unterzogen. Der durchschnittliche Blutglukosespiegel zur 18 F-FDG-Injektionszeit betrug 117 ±36 mg/dl. Die Population enthielt 15 Diabetiker und 9 Patienten mit einem initialen Glukosespiegel von über 150 mg/dl vor Insulingabe. Die Indikation für eine Mediastinoskopie oder für ein invasives transbronchiales Lymphknotenstaging ergab sich aus dem klinischen Verdacht, auffälliger radiologischer oder nuklearmedizinischer Diagnostik sowie suspekter Bronchoskopie. 33 3 Methodik Die operative Lymphknotengewinnung erfolgte im Rahmen der Lymphknotenexstirpation bei onkologischer Pneu-, oder Lobektomie sowie im Rahmen einer Neck-Dissection oder Lymphknotenentnahme durch die Hals-NasenOhrenheilkunde. Aus der Kohorte von 72 Patienten wurden somit an 46 Patienten Lymphadenektomien, an 33 transbronchiale Punktionen und an drei Mediastinoskopien durchgeführt. Auf drei transbronchiale LK-Punktionen folgte eine operative Lymphadenektomie (Intervall: 45,5 ±25,7 Tage), auf zwei transbronchiale Punktionen folgte eine Mediastinoskopie (Intervall: 16 und 22 Tage). Insgesamt lagen somit 274 exstirpierte/biopsierte Lymphknotenregionen bzw. aus 231 nach der International Association for the Study of Lung Cancer (IASLC)- lymph node map [100] definierten LK-Zonen mit eindeutig feingeweblichem oder zytologischem Befund vor. Diese wurden anschließend mittels SUVmax und SUVpeak in verschiedenen Rekonstruktionsalgorithmen durch das PET/CT quantifiziert. Auserdem wurde die morphologische Größe der LK in der kurzen und langen Achse durch die CT-Komponente vermessen. Für die Konkordanzanalyse der reinen SUV-Quantifizierungen konnten auch vermessene Lymphknotenregionen ohne eindeutiges histomorphologisches Korrelat eingeschlosse werden, so dass hier eine Analyse an 293 Lymphknotenregionen möglich war. 3.3 18F-FDG-PET/CT-Untersuchung Vor der eigentlichen 18 F-FDG-PET/CT Untersuchung wurde folgendes Vorbereitungsschema durchgeführt: • Absetzen von Metformin und anderen Medikamenten mit potentieller Interaktion mit Röntgenkontrastmitteln mindestens 2 Tage im Voraus • Bestimmung von TSH, fT3, fT4 und Kreatinin zur Vermeidung einer thyreotoxischen Krise oder eines akuten Nierenversagens in Zusammenhang mit jodhaltigem Röntgenkontrastmittel • Mindestens 6 stündige Nahrungskarenz und Verzicht auf zuckerhaltige Getränke • Ausführliche Anamnese, Glukosetoleranzstörungen insbesondere und Diabetes im mellitus, Hinblick Risiken auf und 34 3 Methodik Kontraindikationen auf jodhaltige Röntgenkontrastmittel, Gastrografin, Butylscopalamin und Furosemid • Kontrolle des Blutglukosespiegels im Kapillarblut, ggf. Applikation von Insulin i.V. mit dem Ziel einer Normoglykämie. Zielwert < 160mg/dl Glukose im Kapillarblut • Exakte Gewichtsbestimmung am Aufnahmetag • Lagerung der Patienten in einer entspannten halbliegenden Position mit Wärmekissen im Schulter-Nacken-Bereich und erhöhter Raumtemperatur zur Senkung der Glukoseaufnahme im braunem Fettgewebe • Legen eines großlumigen Zugangs per Venenverweilkatheters • Gewichtsadaptierte Applikation 18 F-2-Fluoro-2-desoxy-D-glukose mit einer angestrebten Aktivität von 3 Megabecquerel pro kg Körpergewicht als Bolus und anschließender Spülung der Infusionskanüle sowie Bestimmung der verbleibenden Restaktivtät der Spritze • Gabe von 20 mg Furosemid und 500 ml 0,9% NaCl-Lösung zur forcierten Diurese mit dem Ziel einer Verringerung der Strahlenexposition und Bildartefakten im Nierenbecken und ableitenden Harnwegen • Bolusgabe von 20 mg Buthylscopalamin, wenn keine Kontraindikationen, zur Senkung der Darmperistaltik, wodurch dessen physiologische 18 F-FDG Aufnahme gesenkt werden kann • Bei zu vermutendem pathologischen Befund im Magen-Darm-Trakt: Orale Gabe von 1000 ml Gastrografinlösung (3 ml Gastrografin/100 ml Wasser) • Unmittelbar vor der Bildgebung erfolgte die Entleerung der Blase und Lagerung des Patienten in Rückenlage mit über den Kopf gestreckten Armen und leicht angewinkelten Knien Die Bildgebung erfolgte 90 min nach Injektion des 18 F-FDG Radiopharmakons an einem Siemens Biograph mCT 40 PET/CT Scanner. Primär wurde mittels CT ein Topogramm erstellt und ein Aufnahmefenster von Schädeldach bis zur Femurmitte eingestellt. Bei ausgedehnter Fragestellung konnte das Fenster auf den Ganzkörper erweitert werden. Für den CT-Scan wurde in der Regel die Low-Dose-Technik angewandt, da diese für die Untersuchung und Schwächungskorrektur bei geringerer Strahlenexposition, 35 3 Methodik jedoch mit zufriedenstellender Auflösung, in der Regel ausreichend war. Bei Verdacht auf kleinste Rundherde wurde auf ein diagnostisches CT mit höherer Auflösung und höherer Strahlenexposition erweitert. Das Routineprotokoll umfasste eine Aufnahme des Schädels, Schulter-Hals-Bereiches, Thorax, Abdomen, Becken und des proximalen Femurs. Die 40-Zeilen-Low-Dose-Computertomographie mit einem Pitch Index von 0,8 wurde folgendermaßen konfiguriert: 120 KV Spannung bei gewichtsadaptierten maximalen 80mAs. Durch das von der Siemens AG entwickelte CARE-Dose-Verfahren konnte das mAs-Produkt auf das zu durchstrahlende Gewebe angepasst werden, wodurch die Strahlenexposition patienten- und gewebeadaptiert weiter gesenkt werden konnte [77]. Die Rotationszeit der Gantry betrug minimal 0,33 s, als Schichtdicke wurden 3 mm gewählt. Durch die 40-Zeilen-Technik des Siemens Biograph mCT 40 konnte ein Scan von 1300 mm in weniger als 30 Sekunden und somit innerhalb einer Atempause durchgeführt werden. Somit konnten Bewegungsartefakte durch Atemexkursionen deutlich verringert werden, was zu einer verbesserten Darstellung vor allem zwerchfellnaher pulmonaler Raumforderungen führte. Abbildung 10: Siemens mCT40 PET/CT Abbildung entsprechend des in an der Universitätsklinik Homburg(Saar) eingesetzten Siemens mCT 40 PET/CT. Quelle: Siemens Medical Solutions USA, Inc.: Biograph mCT The world´s first molecular CT [77] 36 3 Methodik Die PET-Untersuchung erfolgte unmittelbar nach der CT-Aufnahme in unveränderter Patientenposition. Die Schwächungskorrektur erfolgte CT-basiert mit einer Umrechnung der Houndsfieldeinheiten auf den linearen Schwächungskorrekturfaktor µ der 511keV 18 F-Positronen Vernichtungsstrahlung [66] [83]. Der 4-Ring-PET- Scanner verfügte über LSO-Detekorkristalle mit einer Größe von 4x4x20 mm, und welches mit einer 200x200 Pixelmatrix die Pixelgröße von 4,07x4,07 mm² ergab [77]. Für die iterative OSEM-Rekonstruktion betrug die zentrale Auflösung des verwendeten PET/CT laut Hersteller 4 mm [77] [78]. Für den von Siemens entwickelten und auf der point spread function basierenden dreidimensionalen iterativen Rekonstruktionsalgorithmus TrueX konnten unter Laborbedingungen laut Herstellerangaben Auflösungen von bis zu 2 mm erreicht werden [78] [101]. Für die Schichtdicke wurden 3 mm gewählt. Das axiale FOV betrug 216 mm, so dass ein Scan mit nur 6-8 Bettpositionen (abhängig von der Patientengröße und dem zu scannenden Bereich) à 2 Minuten Akquisitionszeit gefahren werden konnte. Bei 11 Patienten mit Verdacht auf einen zwerchfellnahen pulmonalen Rundeherd wurde eine atemgetriggerte Aufnahme zur Verringerung des Partialvolumeneffektes durchgeführt. Eine Atemtriggerung selektiert die detektierten Koinzidenzen auf die Atemphase des Patienten in definierter Thoraxekursion, um die registrierte Aktivität auf einen sich bewegenden Herd fokussieren zu können und den wahren Uptake eines Herdes zu bestimmen [102]. Die Atembewegung wurde mittels eines vor der Untersuchung angelegten Brustgurtes aufgezeichnet und in Echtzeit in die Messdaten eingebunden. 3.4 Bildrekonstruktion Die Messdaten wurden unter Berücksichtigung der beschriebenen Störfaktoren mit einem iterativen Rekonstruktionsverfahren nach dem OSEM-Algorithmus in dreidimensionale Datensätze rekonstruiert und anschließend mit dem Datensatz der Computertomographie fusioniert [86]. Es wurden mit dem zweidimensionalen OSEMRekonstruktionsverfahren PET-Datensätze mit 2 Iterationen und 8 Subsets (im Folgenden als OSEM 2i8s beschrieben) sowie mit 3 Iterationen und 24 Subsets (OSEM 3i24s) rekonstruiert. Als dreidimensionales Rekonstruktionsverfahren mit Auflösungsrückgewinnung wurde der von der Siemens AG implementierte TrueX37 3 Methodik Algorithmus der TruePoint HD-Scanner mit point spread function sowie 3 Iterationen und 24 Subsets und 2 mm Gauß-Filter angewandt (HD-PET) [77]. 3.5 Bildanalyse Die erhobenen Low-Dose-CT-Schnittbilder wurden mit 2 mm Schichtdicke im Weichteilfenster rekonstruiert und mit jeweils einem der in OSEM 2 Iterationen 8 Subsets, OSEM 3 Iterationen 24 Subsets oder mit den TrueX rekonstruierten PETDatensätzen fusioniert und auf einer Syngo Multimodality Workplace (Siemens Healthcare AG, Erlangen, Germany) mit dem Programm True D ausgewertet. Um eine optimale Übersicht über die erhobenen Bilder zu bekommen, konnten mit der Multimodality Workplace auf 2 Bildschirmen mit je 4 Fenstern die axialen, sagittalen und frontalen Schnittebenen von CT und PET separat dargestellt werden. Zusätzlich wurden eine axiale PET/CT Fusion und eine dreidimensionale um 360 Grad frei drehbare MIP (maximum intensity projektion) der PET-Aufnahme erstellt. Für die Vermessung der Lymphknotenzonen wurden für jede Rekonstruktionsmethode der SUVmax und SUVpeak gemessen. Das VOI, in dem die SUVs bestimmt wurden, betrug mindestens 1 cm³ für SUVmax und definitionsgemäß 1 cm³ für SUVpeak [94]. Begonnen wurde mit der HD-PET-Rekonstruktion, da sich hier aufgrund des verbesserten Signal-Rausch-Verhältnisses der visuelle Kontrast am stärksten darstellte, so dass auch LK mit leicht erhöhtem SUV Uptake gut erkennbar waren [99]. War die Position bekannt oder markiert, ließ sich die Position in den anderen Rekonstruktionen auch bei geringerem Kontrast einfacher wiederfinden. Bei unauffälligem Befund ohne visuell eindeutiger Aktivitätsanreicherung wurde das VOI in HD-PET definiert und mittels dieser anatomischen Koordinaten der x-y-z Ebene mittels der Funktion „copy VOI for comparison“ automatisch per True D auf die weiteren Rekonstruktionen übertragen. Auch bei stark anreichernden Strukturen in unmittelbarer Nähe konnte hiermit die richtige Region exakt, mit dem Ziel, den Uptake nicht zu verfälschen, definiert werden. Hierzu wurden alle 3 genannten Rekonstruktionsdatensätze simultan in das Programm eingelesen, das VOI in einer Rekonstruktion markiert und der zu messende Bereich ebenfalls mittels der Funktion 38 3 Methodik „copy VOI for comparison“ auf die weiteren Rekonstruktionen übertragen. Abschließend wurde die Größe der quantifizierten Objekte mit den Daten der Computertomographie in axialer Schnittebene in ihrer kurzen und langen Achse bestimmt. 3.5.1 SUV-Analyse Primarius Anhand von Operationsprotokollen, radiologisch-nuklearmedizinischer Befunde sowie anhand visueller Verfahren konnte der thorakale Rundherd lokalisiert, identifiziert und anschließend quantifiziert werden. Die SUV-Quantifizierung erfolgte mit einem in allen 3 Dimensionen frei modulierbaren Ellipsoids. Dadurch konnte das VOI so gewählt werden, dass der Primarius komplett umschlossen wurde, ohne jedoch 18 F-FDG Tracer anreichernde Nachbarstrukturen (wie Lymphknoten, Myokard, Knochenmark, etc.) zu tangieren. Bei kleinen Raumforderungen wurde das VOI so groß gewählt, dass eine SUVpeakKugel von 1 ml Volumen darin angezeigt werden konnte. Es wurden jeweils SUVmax und SUVpeak bestimmt. Zur Referenzmessung wurde ein VOI von > 300 ml (MW: 457 ±70 ml) in der Leber platziert. In diesem Volumen wurde zusätzlich die gemittelte detektierte Aktivität SUVavg bestimmt. 3.5.2 SUV-Analyse Lymphknoten Die Zuordnung der LK erfolgte nach der International Association for the Study of Lung Cancer (IASLC) - lymph node map [100] in 22 anatomisch exakt definierte Zonen [103]. Es wurden sämtliche Zonen mit bekanntem histo- und zytologischem Status aufgesucht. Diese Regionen konnten daraufhin gezielt mit den rekonstruierten Daten der PET/CT-Untersuchung aufgesucht, zugeordnet, vermessen und quantifiziert werden. Wurden innerhalb einer LK-Zone mehrere LK mit separater anatomischer Lagebezeichnung (=LK-Region) exstirpiert oder biopsiert, wurden diese ebenfalls bei ausreichender Darstellbarkeit im PET/CT getrennt voneinander quantifiziert. Die SUVmax- und SUVpeak-Quantifizierung erfolgte analog zur PrimariusQuantifizierung mittels eines in 3 Dimensionen modulierbaren VOI Ellipsoids, welches den zu messenden LK komplett einschließen musste, ohne jedoch 39 3 Methodik Nachbarstrukturen zu tangieren. Mit Hilfe des CTs war es möglich, die bei der Biopsie bzw. OP beschriebenen Nachbarstrukturen als Leitstruktur in einer LKRegion aufzufinden. Somit gelang es selbst innerhalb einer wenige Zentimeter großen LK-Region zwischen verschiedenen LK zu differenzieren, diese bei Bedarf unabhängig voneinander zu quantifizieren sowie diese nach einer Plausibilitätsprüfung den Befunden der Pathologie zuzuordnen. Die Fusion aus PETund CT- Bildern ermöglichte es, die von der IASLC definierten anatomischen Grenzen der einzelnen LK-Regionen mit hoher Genauigkeit einzuhalten und Überschneidungen mit anderen LK-Zonen zu vermeiden [100]. Konnte keine erhöhte Aktivität im PET oder kein prominenter LK im CT einer Region lokalisiert werden, wurde ein möglichst großes VOI in die zu untersuchende Zone platziert ohne deren Grenzen zu tangieren. 3.6 Diagnosesicherung Für die Diagnosesicherung wurden die histo- und zytologischen Befunde des pathologischen Instituts des Universitätsklinikums des Saarlandes als Referenzwerte definiert. Das entnommene Gewebe wurde mit Hilfe der Ortsangaben aus dem Pathologischen Institut sowie aus Operations- und Biopsieprotokollen unter Berücksichtigung von Plausibilität und Erreichbarkeit des beschriebenen Biopsieverfahrens einer von 22 LK-Regionen der IASLC lymph node map [100] zugeordnet. Auf 8 transbronchiale LK-Punktionen folgte eine operative Lymphadenektomie, auf zwei eine Mediastinoskopie. Bei Diskrepanzen eines sowohl punktierten, als auch daraufhin biopsierten oder exstirpierten LK, im definierten Zeitraum von 6 Wochen, wurden aufgrund der höheren Sensitivität und Spezifität die histopathologischen Befunde der invasiveren OP bzw. MSK verwertet. Eindeutig positive Zytologien aus einer definierten LK-Zone wurden im Zweifelsfall auch ohne histologische Bestätigung akzeptiert. Konnte per transbronchialer Punktion kein LK-Gewebe aus einer Region gewonnen werden, wurde diese als nicht biopsiert gewertet. Da die transbronchiale Punktion nur als Bestätigungsverfahren positiver Befunde und nicht als Ausschlussmethode von negativen Befunden empfohlen wird [4], wurden für die Verifizierung des Cut-offs in der patientenorientierten Analyse des N-Stagings nur 40 3 Methodik histologisch und/oder zytologisch eindeutig maligne Befunde aus transbronchialen Proben gewertet; unauffällige und benigne Befunde mussten als nicht eindeutig gewertet werden. Das entnommene Gewebe wurde in die in Tabelle 3 aufgeführten Kategorien klassifiziert: Tabelle 3: Codierung der LK-Histo/Zytologie LK-Kategorie 0 Histo/Zytologie aus spezifischer LK-Region Nicht eindeutig benigner oder maligner LK 0,1 Kein LK-Gewebe in Biopsie 0,2 Kein repräsentatives Material 0,3 Zweifelhaft benigne, bzw. maligne 0,4 Nicht eindeutig benigne bzw. maligne 0,5 Verdächtig auf/ wahrscheinlich maligne 1 normaler LK 2 benigne veränderter LK 2,1 Lymphknoten mit Anthrakose 2,2 Lymphknoten mit Sinushistiozytose und Anthrakose 2,3 Lymphnoten mit Anthrakosilikose 2,4 Lymphknoten mit Infektion oder lymphofollikulärer Hyperplasie 3 3,5 Mikrometastase in LK Nicht explizit als Mikro- oder Makrometastase in LK beschrieben oder positive Zytopathologie aus LK-Region 4 Makrometastase in LK Quelle: Eigene Darstellung. Nicht eindeutige Biopsate der Kategorien „0,2; 0,3; 0,4; 0,5“ wurden aus der Auswertung ausgeschlossen, zusätzlich auch die Kategorie 0,1, wenn diese aus einer Feinnadelpunktion stammte und somit nicht sichergestellt werden konnte, dass 41 3 Methodik die komplette LK-Zone erfasst wurde. Als entzündlich verändert galten LK der Gruppe „2,4“. Kategorie „0,1“ (bei Ausräumung der kompletten LK-Zone), „1“ und „2“ wurden als benigne definiert, Kategorie „3“ bis „4“ als maligne. Da durch die transbronchialen Biopsien keine komplette LK-Zone histologisch aufgearbeitet werden kann, wurden aus diesem Punktionsverfahren für das abschließende NStaging auf Patientenebene nur die eindeutig malignen Proben der Kategorie „3“ bis „4“ statistisch verwertet. 3.7 Visuelle Auswertung Die visuelle Lymphknoten-Stadieneinteilung durch die erfahrenen Nuklearmediziner des UKS wurde aus den endgültigen Befunden der PET/CT-Untersuchungen entnommen. Die Befundung erfolgte durch den Konsensus erfahrener Nuklearmediziner nach visuellen Kriterien und mit Hilfe der SUV-Quantifizierung. Bei einem ausführlichen cTNM-Staging wurde das N-Stadium direkt aus dem Befund übernommen. Wurde kein N-Stadium in der Beurteilung beschrieben, konnte aus den niedergeschriebenen pathologischen Befunden das N-Stadium nach der 7. Version der UICC TNM-Klassifikation für die statistische Auswertung gefolgert werden [21]. 3.8 Statistische Auswertung Mittelwerte (MW) wurden mit ihrer Standardabweichung (SD) angegeben. Die Prüfung auf Normalverteilung erfolgte durch den Shapiro-Wilk-Test [104], die Prüfung auf die Varianzhomogenität durch den Lavene-Test [105]. Der Lavene-Test wurde jeweils auf dem Median und Mittelwert basierend durchgeführt [105]. Zur Berechnung des SUV-Mittelwertes, bei bekannten Ausreißern, wurde der Maximum-Likelihood(M)-Schätzer nach Huber angewandt [106]. Durch diese iterative Schätzung konnte die Lokalisation des Messwertes innherhalb der Verteilung aller Messdaten berücksichtigt werden, indem jedem Wert in Abhängigkeit dessen Entfernung vom mathematischen Verteilungszentrum eine Gewichtung zugeordnet wurde [107]. 42 3 Methodik Zur graphischen Darstellung der Verteilungen von SUV- und LK-Größen wurde der Boxplot nach Turkey gewählt [108]. Hierbei umschließt die eigentliche „Box“ die Messdaten zwischen dem 25% und dem 75% Quartil, der Median wurde innerhalb der Box markiert. Die Antennen markieren nach der Definition von Turkey den 1,5fachen Interquartilsabstand (IQR) [108]. Milde Ausreißer bis zum dreifachen IQR wurden durch Kreise, extreme Ausreißer darüberhinaus durch Sternchen markiert [108]. Für die Signifikanzprüfung einer zentralen Tendenz von nicht normalverteilten Stichproben wurde bei verbundenen Stichproben der Wilcoxon-Vorzeichen-RangTest [109], bei unabhängigen Stichproben der Mann-Whitney-U-Test [110], bei >2 unabhängigen Stichproben der Kruskal-Wallis-Test [111] angewandt. Ergebnisse mit p<0,05 wurden als signifikant gewertet. Für die Überprüfung von Rekonstruktionsprotokolle sowie mit Korrelationen der SUV-quantifizierten CT-morphologisch bestimmten durch die unterschiedlichen 18 F-FDG-Uptakes untereinander, Lymphknotengrößen, wurde der Korrelationskoeffizient nach Pearson [112] und die Rangkorrelation nach KendalTaub-b berechnet [113]. Für die weitere Konkordanzanalyse wurden Bland-Altman-Diagramme [114] erstellt. Hierfür wurden Differenzen der Messwerte der verschiedenen Rekonstruktionsprotokolle gegen den Mittelwert ihrer SUVs aufgetragen [114]. In weiteren abgewandelten Bland-Altman-Diagrammen wurde die prozentuale Abweichung der Differenz beider Messwerte vom Mittelwert deren Messwerte [ (Messung 1 - Messung 2) / ((Messung 1 + Messung 2) /2) ] bzw. der Quotient beider Messwerte [ ( Messung 1 / Messung 2) ]in der Ordinate, jeweils gegen den Mittelwert der Messwerte [ (Messwert 1 – Messwert 2)/2 ] in der Abszisse aufgetragen [115]. Der Mittelwert der Differenzen sowie der Übereinstimmungsbereich aus Mittelwert ±1,96 SD wurden als horizontale Hilfslinien eingezeichnet [114] [115]. Sensitivität (Sens.) und Spezifität (Spez,), positiver prädiktiver Wert (PPV) und negativer prädiktiver Wert (NPV), falsch positiv Rate (FPR) und falsch negativ Rate (FNR) sowie die Prävalenz wurden mithilfe der Vierfeldertafel berechnet. Die diagnostische Gesamtgenauigkeit wurde durch die Summe richtig positiver + richtig negativer Befunde im Verhältniss zu der Gesamtzahl an Befunden defininiert. 43 3 Methodik Für die Definition der SUV-Schwellenwerte ( SUV Cut-off) wurden für jeden SUV die hypothetische Sensitivität und 1-Spezifität berechnet und in einem Receiver Operating Characteristic (ROC)-Diagramm gegeneinander aufgetragen [116] [117]. Für die Analyse der Trennschärfe der unterschiedlichen Rekonstukstionsprotokolle wurden die jeweiligen Flächen unter den ROC-Kurven (area under curve = AUC) berechnet. Die Unterschiede in den Größen der AUCs wurden nach der Methode von Delong et al. [118] unter Berücksichtigung der Standardabweichung und AUCDifferenz auf Ihre Signifikanz überprüft. Zur Festlegung der Cut-off-Werte in Bezug auf eine hohe Gesamtgenauigkeit bzw. niedrige falsch positive und falsch negative Fehlerraten wurde ein Fehlerratendiagramm nach Vorlage von Hellwig et al.[97] erstellt. Hierfür wurden die Prozentwerte der Gesamtgenauigkeit (Accuracy), FNR, FPR sowie die Summe aus der FNR und FPR gegen den SUV aufgetragen [97]. Für die Validierung der Cut-off-Werte wurden diese auf ein patientenorientiertes NStaging angewandt. Unter Betrachtung aller entnommenen LK erfolgte eine individuelle Stadieneinteilung - für die Indikationsstellung einer potentiell kurativen Operation - in einen N0/N1- oder einen N2/N3-Status nach den Kriterien des NStagings der UICC in der 7. Auflage [21]. Diese Stadien wurden mit der Stadieneinteilung durch die Pathologie und den schriftlichen PET/CT-Befunden aus dem Konsensus von erfahrenen Nuklearmedizinern verglichen. Bei unterschiedlicher N-Stadieneinteilung wurde eine Up- und Downstagingrate berechnet. Als Testparameter wurden hierfür die Sensitivität, Spezifität, PPV, NPV sowie die diagnostische Gesamtgenauigkeit berechnet. Die aus OP, MSK oder EBUS gewonnene LK-Histologie/Zytologie wurde als Referenzmethode definiert. Für die Signifikanzprüfung wurde ein Wahrscheinlichkeitsniveau (p-Wert) von p < 0,05 festgelegt. Die Zahlenwerte der SUV-Quantifizierung wurden mit zwei Nachkommastellen angegeben. Ergebnisse aus Berechnungen mit SUVs wurden nach der Regel der geltenden Ziffern auf zwei Nachkommastellen gerundet wiedergegeben. Die Statistische Auswertung erfolgte mittels Programmpaket SPSS Version 20.0.0 (SPSS Inc., Chicago, Illinois, USA), MedCalc v.14.12.0 (MedCalc© Software bvba, Ostende, Belgien) und Microsoft® Office Excel® 2007 (Microsoft, Redmond, Washington, USA). 44 4 Auswertung 4 Auswertung 4.1 Patientenkollektiv und Zusammensetzung der Daten In der untersuchten Population von 72 Patienten zeigten sich bei 68 Patienten intrathorakale Primärtumoren mit den in Tabelle 4 aufgeführten histologischen Befunden. 4 Patienten waren tumorfrei. Tabelle 4: Zusammensetzung der pulmonalen Tumoren Malignom NSCLC Anzahl Anteil 62 91,2% Adenokarzinom 29 42,6% Plattenepithelkarzinom 26 38,2% Adenosquamöses Karzinom 2 2,9% Riesenzellkarzinom 1 1,5% Undifferenziertes Karzinom 1 1,5% Nicht näher bezeichnet 3 4,5% SCLC 1 1,5% Sonstigea 5 7,3% a Angiosarkom, Askin-Tumor, Glomustumor, Karzinoid, Pleuramesotheliom Quelle: Eigene Darstellung. Durch die operativen transthorakalen LK-Exstirpationen konnten 556 LK aus 236 anatomischen LK-Regionen gewonnen werden (42/236 maligne; Prävalenz 17,8%). Die Mediastinoskopie förderte 37 Lymphknoten aus 14 LK-Regionen (0/14 maligne; Prävalenz 0%). Durch transbronchiale Punktionen konnten 46 LK-Biopsien aus 30 LK-Regionen der Histologie und/oder Zytologie zugeführt werden (13/30 maligne; Prävalenz 43,3%). 6 LK-Regionen mit jeweils einem LK wurden vor einer operativen Exstirpation erfolgreich transbronchial biopsiert. In 43 Fällen erfolgte die Aufteilung einer nach der IASLC lymph node map [100] definierten LK-Zone in kleinere, anatomisch zugeordnete LK-Regionen mit korrespondierender Aufteilung und mehrfacher Quantifizierung dieser LK-Zonen mittels 18F-FDG-PET. 45 4 Auswertung Insgesamt wurden somit 633 Lymphknoten aus 274 anatomischen LK-Regionen mit nach der IASLC lymph node map [100] korrespondierenden 231 LK-Zonen histologisch und/oder zytologisch überprüft sowie die korrespondierenden 274 LKRegionen durch das PET/CT quantifiziert. Hiervon konnten in 54 Regionen LKMetastasen eindeutig histologisch/zytologisch nachgewiesen werden. Dies entsprach einer Prävalenz maligner LK-Regionen von 19,7% (54/274). Abbildung 11 zeigt exemplarisch die verschiedenen Stadien einer mediastinalen Lymphknotenmetastasierung. Da teilweise auch multiple ausschließlich mikroskopisch separierbare LK mittels 18 F- FDG-PET nur durch eine einzelne VOI gemessen werden konnten, werden in der folgenden Arbeit LK-Regionen nur noch als Lymphknoten bezeichnet. Abbildung 11: Darstellung intrathorakaler Primarien und hilärer sowie mediastinaler LK-Metastasen durch das 18F-FDG-PET in der MIP-Darstellung Quelle: Hellwig D, Weissinger M. et al.: Lymphknoten-Staging des Lungenkarzinoms mit FDG-PET/CT und HD-Rekonstruktion: SUV-Schwellen für die Charakterisierung normal großer und vergrößerter Lymphknoten [119] 4.1.1 18F-FDG-Uptake-Charakteristika Zur Darstellung der Glukoseaufnahme benigner und maligner LK, der Primarien sowie die - durch den im folgenden definierten Cut-off Wert von 3,2 - berechneten FP, FN, RP und RN Befunde, wurden diese in der unten stehenden Abbildung 12 in Form eines Boxplots für die HD-PET-Rekonstruktion dargestellt. Die dazugehörigen SUVs sind in Tabelle 5 aufgeführt. Lymphknotenmetastasen und ihre Primarien 46 4 Auswertung zeigten eine hohe Spannbreite des SUVs sowie ein im Median deutlich höheren Uptake gegenüber benignen LK. Die Box der 25-75% SUVmax Quartile maligner LK demonstrierte einen insgesamt höheren SUV-Uptake mit deutlich größerer Spannbreite im Vergleich zu der Box benigner LK. Ein nahtloser Übergang der Boxen mit Überschneidung der Whiskers wurde jedoch in diesen Boxen ebenfalls sichtbar. Hervorzuheben waren die Überschneidungen der SUV-Uptakes - der durch den Cut-off definierten - falsch negativer LK mit dem unteren Quartilbereich von SUVs richtig negativer Lymphknoten. Abbildung 12: Verteilung des SUVmax-Uptakes der quantifizierten Lymphknoten sowie deren Primärtumoren in Bezug auf die histo-/zytologische Referenz FN: falsch negativ, FP: falsch positiv, RP: richtig positiv, RN: richtig negativ; ° milde und *extreme Ausreiser außerhalb des 3-fachen IQR Quelle: Eigene Darstellung. 47 4 Auswertung Tabelle 5: Verteilung des SUVmax-Uptakes in der HD-PET-Rekonstruktion Benigne LK Mittelwert ± SD 3,15 ±1,53 Maligne LK 9,50 ±7,34 6,93 3,64 6,93 14,73 54 Falsch negative LK 2,36 ±0,60 2,59 1,80 2,59 2,82 6 Falsch positive LK 4,34 ±2,04 3,80 3,46 3,80 4,31 77 Richtig positive LK 10,39 ±7,31 8,49 5,05 8,49 14,74 48 Richtig negative LK 2,51 ±0,44 2,58 2,28 2,58 2,85 143 Primärtumor 16,92 ±9,19 16,44 8,72 16,44 23,90 70 Typ 2,86 25 Perzentile 2,43 50 Perzentile 2,86 75 Perzentile 3,50 Median Anzahl 220 Quelle: Eigene Darstellung. Im Mann-Whitney-U-Test stellte sich ein signifikanter Unterschied zwischen der Höhe des SUVmax, bzw. SUVpeak und der Dignität eines mediastinalen LK in allen verglichenen Rekonstruktionen dar. Es konnte für alle verwendeten Rekonstruktionsalgorithmen und Quantifizierungsmethoden ein signifikant höherer 18 F-FDG-Uptake in malignen gegenüber benignen LK nachgewiesen werden. Das Signifikanzniveau betrug hierbei p< 0,001. Auch unter Berücksichtigung der LK-Größe zeigte sich im Kruskal-Wallis-Test ein signifikanter Unterschied im 18 F-FDG-Uptake. So wiesen die CT-morphologisch vergrößerten LK mit einer kurzen Achse von ≥1 cm in allen angewandten Rekonstruktionsprotokollen einen signifikant höheren SUV auf als nicht vergrößerte LK (p< 0,001; n=274; LK ≥1 cm: n=84; LK <1 cm: n=190). Anthrakotisch- und anthrakosilikotisch veränderte LK unterschieden sich in der SUVQuantifizierung der 18 F-FDG-Aktivität in allen Rekonstruktionsverfahren sowie Quantifizierungsmethoden im Mann-Whitney-U-Test nicht signifikant von unveränderten Lymphknoten (für HD-PET SUVmax: Mittelwert 3,10±1,07 SUV; 95% Konfidenzintervall [95%CI]: 2,75-3,01 SUV; n=162; p=0,376). Ebenfalls zeigte sich im Mann-Whitney-U-Test kein signifikanter Unterschied in der Traceraufnahme zwischen akut entzündlichen LK und dem restlichen benignen Kollektiv aus unveränderten, anthrakotischen sowie anthrakosilikotischen LK, auch wenn diese Subgruppe nur wenige Proben enthielt (entzündliche LK in HD-PET SUVmax: Mittelwert 2,95±0,38 SUV; 95%CI: 2,34-3,56 SUV; n=4; p=0,915). 48 4 Auswertung 4.1.2 Bereinigter SUV-Uptake Methodenbedingt konnte aufgrund der für die SUVpeak-Messung geforderten VOIKugeln >1ml eine Überschneidung der LK-VOI mit den angrenzenden Primarien nicht vollständig ausgeschlossen werden. Hieraus entstehende Extremwerte konnten den Mittelwert potentiell verzerren. Zur Bereinigung dieses Effektes wurde für die LKSUV-Messungen separat der M-Schätzer nach Huber[106] angewandt. Tabelle 6 18 zeigt die extremwertbereinigten Mittelwerte des F-FDG-Uptakes maligner und benigner LK für die angewandten Rekonstruktionsprotokolle sowie die LK-Größe in cm. Tabelle 6: M-Schätzer nach Huber des 18F-FDG-Uptakes SUVmax quantifizierter Lymphknoten maligne LKa benigne LKb Gesamt c OSEM 3i24s SUVmax 6,49 2,77 2,98 OSEM 3i24s SUVpeak 3,96 1,72 1,87 OSEM 2i8s SUVmax 4,34 1,94 2,04 OSEM 2i8s SUVpeak 2,99 1,48 1,58 HD-PET SUVmax 7,82 2,91 3,14 HD-PET SUVpeak 4,46 1,77 1,95 CT kurze Achse (cm) 1,91 1,18 0,84 CT lange Achse (cm) 1,23 0,78 1,30 Algorithmen a n=54, b n=220, c n=274. Quelle: Eigene Darstellung. 4.1.3 Test auf (log)Normalverteilung und Varianz Als Vortest für die weitere Testauswahl wurde die Normalverteilung und Homogenität der Varianz der SUVmax und SUVpeak von Lymphknoten, Primarien und der Leber analysiert. Aufgrund der hohen Teststärke und niedrigen Standardfehler bei relativ kleinem Stichprobenumfang wurde der Test auf Normalverteilung nach ShapiroWilk[104] angewandt [120]. Hier zeigte sich in allen verwendeten Rekonstruktionen für die erweiterte LKGesamtheit von n=293, dass die Annahme einer Normalverteilung des SUVs auf einem Signifikanzniveau von p<0,001 abgelehnt werden musste. Ebenfalls bestand 49 4 Auswertung keine Normalverteilung der CT-morphologisch gemessenen LK-Größe in der kurzen sowie langen Achse (p<0,001; n=293). Auch bei den Primarien, als Beispiel größere Objekte, konnte keine Normalverteilung im SUVmax- sowie SUVpeak–Uptake nachgewiesen werden (p<0,014; n=70). Durch eine Auftragung der Messwerte in QQ- und Boxplots konnte eine Verzerrung der Normalverteilung durch eine Häufung kleiner SUV-Werte der LK und Primarien nachgewiesen werden (siehe Anhang 2 und 3). Eine logarithmische Normalverteilung des SUV-Uptakes konnte ebenfalls für die LK (n=293; p<0,001) und deren Primarien (n=70, p≤0,026) in allen verwendeten Rekonstruktionsprotokollen mit an Sicherheit grenzender Wahrscheinlichkeit ausgeschlossen werden. Für die Quantifizierung des Leber-SUVs zeigte sich hingegen eine Normalverteilung in OSEM 2i8s für SUVmax (p=0,078) sowie für die SUVavg-Quantifizierung in OSEM 2i8s, OSEM 3i24s und der HD-PET-Rekonstruktion (p=0,125/0,070/0,172; n=73). Eine logarithmische Normalverteilung auf signifikantem Niveau bestand für den FDG-Uptake des Leberparenchyms für alle verwendeten 18 F- Rekonstruktionen einschließlich. SUVavg der HD-PET-Rekonstruktion (p=0,193-0,751; n=73). Für die Analyse der Varianzhomogenität wurde der Lavene-Test [105] - sowohl auf dem Mittelwert, als auch auf dem Median basierend - angewandt. Der Lavene-Test [105] ergab, dass sich die Varianz des SUVs in allen angewandten Quantifizierungsmethoden und Rekonstruktionsverfahren für die Gruppen maligner und benigner LK auf einem Niveau von p< 0,001 unterschied. Somit musste die Annahme einer homogenen Varianz in den Gruppen benigner und maligner LK ebenfalls abgelehnt werden. 4.2 SUV-Konkordanzanalyse 4.2.1 Einführung Im folgenden verschiedener Abschnitt wurden die Messwerte Rekonstruktionsalgorithmen und der SUV-Quantifizierungen Quantifizierungsverfahren untereinander, in Abhängigkeit ansteigender SUV sowie deren Verhalten bei variierenden Objektgrößen analysiert. Als kleine Objekte wurden hierbei LK, (CTmorphologische Größe: 0,92 ±0,43 cm in der kurzen Achse; 1,40 ±0,64 cm in der 50 4 Auswertung langen Achse), als mittlere Objekte Primarien (CT-morphologisch 3,28 ±1,81 cm x 4,17 ±2,28 cm) und als große Objekte das Leber-VOI (456,75 ±69,48 ml) definiert und deren Uptake-Verhalten in den verschiedenen Rekonstruktionsprotokollen betrachtet. 4.2.2 Analyse auf signifikante Unterschiede in der SUV-Quantifizierung aufgrund der Anwendung unterschiedlicher Rekonstruktionsprotokolle Die Analyse auf signifikante Unterschiede im SUV-Uptake-Verhalten wurde an der erweiterten LK-Population mit n=293 LK mittels Wilcoxon-Vorzeichen-Rang-Test durchgeführt [109]. 4.2.2.1 Uptake-Verhalten in Abhängigkeit der Rekonstruktion Es zeigte sich, dass in fast allen Paarungen aus iterativen- sowie HD-PETRekonstruktionen und den unterschiedlichen Quantifizierungsmethoden SUVmax und SUVpeak, sich die Höhe des SUVs aufgrund des verwendeten Rekonstruktionsprotokolls auf einem hohen Signifikanzniveau unterschied (p< 0,001; Z: -5,92 - -14,84; n= 293). Eine Ausnahme bildete die Paarung zwischen der SUVpeak-Quantifizierung in HDPET und SUVmax der OSEM 2i8s-Rekonstruktion. Hier wurde das Signifikanzniveau von p=0,05 knapp überschritten, so dass sich hier kein signifikanter Unterschied in der Höhe des SUVs darstellte (p= 0,08, Z:-1,75; negative Ränge 164, Mittlerer Rang 146,81; positive Ränge 129, Mittlerer Rang 147,24; n= 293). 4.2.2.2 Uptake-Verhalten in Abhängigkeit der Dignität In der Subpopulation maligner LK konnten signifikante Unterschiede im SUV-Uptake aufgrund der Anwendung der verschiedenen Rekonstruktionsprotokolle nachgewiesen werden (n=084; p<0,001; Z-0,57 bis -6,39). Eine Ausnahme bildete hier die Kombination aus HD-PET SUVpeak gegen OSEM 2i82 SUVmax (p=0,163; Z: -1,395) sowie OSEM 2i8s SUVmax gegen OSEM 3i24s SUVpeak (p=0,087; Z: 1,71). Ebenfalls unterschieden sich die Höhe der SUV-Berechnungen benigner LK in Abhängigkeit des angewandten Rekonstruktionsverfahrens auf seinem sehr hohen Signifikanzniveau (n= 220; p<0,01; Z: -3,41 - -12,86). 51 4 Auswertung 4.2.2.3 Uptake-Verhalten in Abhängigkeit der Objektgröße In der Subpopulation aus CT-morphologisch vergrößerten LK konnten bei der Anwendung verschiedener Rekonstruktionsprotokolle ebenfalls zwischen fast allen Kombinationen aus Rekonstruktionsalgorithmen und Quantifizierungsmethoden hochsignifikante Unterschiede in der Höhe des SUVs beobachtet werden (n=80; p< 0,001; Z: -4,47 - -7,96). Die Paarung aus OSEM 3i24s SUVpeak und OSEM 2i8s SUVmax bildete hierbei eine Ausnahme (p=0,13; Z: -1,50). LK galten mit einem Durchmesser von ≥10 mm als CT-morphometrisch vergrößert und somit malignitätssupekt. Ebenso zeigten sich in den LK unter 1 cm Durchmesser für alle angewandten Rekonstruktionsprotokolle signifikante Unterschiede in der Höhe des SUVs (n=190; p< 0,001; Z:-4,084 - -11,954). Für die SUVs der Primarien ergaben sich ebenfalls hochsignifikante Unterschiede in der Höhe der Uptake-Berechnung aufgrund der Anwendung der unterschiedlichen Rekonstruktionsprotokolle (n= 68; p<0,001; Z: -3,34 - -7,22). Das SUV der Leber VOI unterschied sich – mit Ausnahme der Kombination der Kombination aus SUVmax der HD-PET und SUVmax der OSEM 3i24s (p=0,341) signifikant durch den Einsatz der angewandten Rekonstruktionsprotokolle (n=72, p<0,001, Z: -3,46- -7,37). 4.2.3 Korrelation der SUV-Quantifizierung unterschiedlicher Rekonstruktionsprotkolle Um den linearen Zusammenhang der quantifizierten Lymphknoten-SUVs der verschiedenen Rekonstruktionsprotokolle zu überprüfen und visuell aufzuzeigen, wurde in Abb. 13 und 14 eine Scatterplot-Matrix erstellt. Zusätzlich wurde die dazugehörige lineare Regression und der Determinationskoeffizienten R² eingezeichnet. Bei Kombination identischer Rekonstruktionen wurde ein Histogramm mit der Häufigkeitsverteilung in Abhängigkeit des SUV aufgetragen. Die Scatterplots der Abb.13 und 14 zeigen einen staken linearen Zusammenhang der SUV-Berechnungen unterschiedlicher Rekonstruktionsprotokolle mit einem hohen linearen Determinationskoeffizienten von R²= 0,787-0,982 bei einer Anzahl von n= 293 LK. 52 4 Auswertung Die SUVs aller verwendeten Rekonstruktionsprotokolle wiesen hierbei sehr hohe und signifikante Korrelationen mit Korrelationskoeffizienten nach Pearson von r= 0,7870,991 auf einem Signifikanzniveau von p <0,001 auf. Anhang 4 zeigt die bivariate Korrelationen nach Pearson. Es bestand ein etwas höherer Zusammenhang innerhalb der jeweils mit SUVmax und SUVpeak gemessenen VOIs einer Rekonstruktionsmethode. Unter Annahme einer Verletzung der Normalverteilung wurde zusätzlich die Rangkorrelation nach Kendall-Tau-b [113] berechnet (siehe Anhang 5). Hier bestätigte sich ebenfalls ein starker Zusammenhang der SUVQuantifizierungen aus den verschiedenen Rekonstruktionsalgorithmen. Die Unterschiede zwischen den Uptake-Berechnungen SUVmax und SUVpeak waren jedoch deutlich höher ausgeprägt (r: 0,582-0,899; n= 293; p<0,01). Desweiteren zeigte sich eine gute bivariate Korrelation nach Pearson zwischen der CT-morphologisch gemessenen LK-Größe in der kurzen bzw. langen Achse und dem quantifizierten 18 F-FDG-Uptake (r: 0,53-0,66; n=293, p:<0,01). Der Rangkorrelationskoeffizent nach Kendal-Tau-b ergab lediglich eine kleine bis mittlere Korrelation (r: 0,297- 0,435; n=293; p<0,01). Das VOI der Primarien stellte ein Beispiel für die Analyse größerer Objekte dar. Auch hier konnte durch die bivariate Korrelation nach Pearson und Rangkorrelation nach Kendal-Tau-b eine sehr hohe Korrelation unter den SUVs der beobachteten Quantifizierungs-und Rekonstruktionsverfahren nachgewiesen werden (Pearson: r: 0,928-0,991; p<0,01; n=70 /Kendal-Tau-b: r: 0,818-0,94; p<0,01, n=70). Siehe Anhang 4 und 5. 53 4 Auswertung Abbildung 13: Scatterplotmatrix mit linearer Regressionsanalyse Häufigkeitsverteilung der Lymphknoten-SUV (n=293). Teil 1/2 OSEM 3i24s SUVpeak OSEM 2i8s SUVmax SUVpeak SUVmax SUVpeak HD-PET SUVmax SUVpeak OSEM 2i8s OSEM 3i24s SUVmax OSEM 3i24s SUVmax und Quelle: Eigene Darstellung 54 4 Auswertung Abbildung 14: Scatterplotmatrix mit linearer Regressionsanalyse und Häufigkeitsverteilung der Lymphknoten SUV (n=293). Teil 2/2 HD-PET SUVmax HD-PET SUVpeak SUVmax SUVpeak OSEM 2i8sSUVmax SUVpeak HD-PET SUVmax OSEM 2i8s SUVpeak SUVmax OSEM 3i24s SUVpeak HD-PET OSEM 2i8s OSEM 3i24s SUVmax OSEM 2i8s SUVpeak SUVpeak Quelle: Eigene Darstellung. 4.2.4 SUV-Quantifizierungs-Verhalten in Abhängigkeit der Objektgröße, Dignität und des Rekonstruktionsalgorithmus Quelle: Eigene Darstellung. 55 4 Auswertung 4.2.4.1 SUV-Uptakte in Abhängigkeit der LK-Größe und Dignität LK ≥1 cm in der kurzen Achse wiesen in allen Rekonstruktionen für SUVmax und SUVpeak signifikant höhere 18 F-FDG-Aktivitäten als LK kleiner 1 cm auf (p<0,001; (SUVmax ≥1 cm bzw. <1 cm in HD-PET SUVmax: 6,96 ±5,51 bzw. 3,33 ±3,18). Von 274 LK waren hierbei 220 LK histo-/zytologisch als benigne (176 LK <1 cm; 44 LK ≥1 cm) und 54 als maligne klassifiziert (17 LK <1 cm; 37 LK ≥1 cm). Abbildung 15: Höhe des durch den SUVmax quantifizierten 18F-FDG-Uptake von LK der HD-PET Rekonstruktion in Abhängigkeit der CT-morphologisch bestimmten LK Größe in der kurzen Achse Quelle: Eigene Darstellung. Die in Abb.15 dargestellten 18 F-FDG-Uptake-Werte kleiner LK zeigten bei zunehmendem Durchmesser bis 1 cm gleichbleibende SUVs mit geringen Schwankungen um den Mittelwert von 3,33 ±3,18. Bei zunehmender Größe der LK über 1cm bildete sich ein sprunghafter Anstieg der durch 18 F-FDG simulierten Glukoseaufnahme mit starker Streuung und ohne erkennbaren Trend. Der Korrelationskoeffizient r nach Pearson zwischen der LK-Größe in der kurzen Achse und dem SUVmax in HD-PET betrug 0,474 und die Korrelation war auf einem Niveau von p <0,01 signifikant. 56 4 Auswertung Für benigne LK (Abb.16 links) konnte eine Häufung der quantifizierten 18 F-FDG- Aktivitäten um einen SUVmax-Mittelwert von 3,15 ±1,53 mit nur leicht ansteigendem SUV bei zunehmender LK-Größe beobachtet werden. Desweiteren bestand eine signifikante Korrelation aus der LK-Größe in der kurzen Achse und dem SUVmax (HD-PET) mit einem Korrelationskoeffizienten nach Pearson von r=0,665 (p<0,01; R² linear 0,442; R² quadratisch: 0,564). Bei malignen LK (Abb.16 rechts) führte ein Anstieg der Größe bis rund 15 mm im Durchmesser ebenfalls zu einem Anstieg der 18 F-FDG-Aufnahme, darüber hinaus jedoch zu einem Abfall. Kleine LK-Metastasen unter 1 cm wiesen auch hier bereits einen erhöhten SUV von 7,77 ±9,43 auf und zeigten somit eine höhere 18 F-FDG- Aktivtät als vergrößerte benigne LK. Insgesamt konnten für maligne LK eine hohe Streuung und bei einem niedrigen Korrelationskoeffizient von r=0,204 (p=0,139) keine signifikante lineare Korrelation nachgewiesen werden. Der lineare bzw. quadratische Determinationskoeffizient R² betrug 0,042 bzw. 0,071. Der Kurvenverlauf der SUVpeak-Quantifizierung (Anhang 6) entsprach dem der SUVmax-Quantifizierung bei etwas höherem Determinationskoeffizienten (R²: 0,149 bzw. 0,207). Abbildung 16: Höhe des durch den SUVmax quantifizierten 18F-FDG-Uptake von LK der HD-PET-Rekonstruktion in Abhängigkeit der CT-morphologisch bestimmten Größe in der kurzen Achse sowie der histologisch bestimmten Dignität (links: benigne LK, rechts: maligne LK) Quelle: Eigene Darstellung. 57 4 Auswertung 4.2.4.2 Einfluss der Objektgröße auf die SUV-Quantifizierung In Abb. 17 und 18 wurden die Quotienten zwischen den Messwerten der SUVmaxQuantifizierungen der OSEM 3i24s- und der HD-PET-Rekonstruktion gebildet und gegen die CT-morphologisch bestimmte LK- bzw. Primariusgröße aufgetragen. In der LK-Analyse zeigte sich zwischen der OSEM 3i24s- und HD-PET SUVmaxQuantifizierung eine mit abnehmender LK-Größe progrediente Divergenz der SUVMesswerte. Der HD-PET-Algorithmus quantifizierte in LK kleiner 15 mm, wie in Abb.19 erkennbar, gegenüber des OSEM 3i24s-Algorithmus regelmäßig sowohl höhere, als auch niedrigere SUVs (Mittelwert: 0,92 ±0,14; Übereinstimmungsbereich (MW ±1,96SD): 0,64-1,20; n=293). In der Auftragung der SUVs von Primärtumoren konnte hingegen eine gleichförmigere Streuung mit geringerer Standardabweichung und ein um 24,4% geringerer Übereinstimmungsbereich beobachtet werden. Mittels HD-PET wurden hierbei mit wenigen Ausreißern höhere SUVs als durch den OSEM 3i24s-Algorithmus quantifiziert (Mittelwert 0,79 ±0,12 SUV; Übereinstimmungsbereich (MW ±1,96SD): 0,57-1,02; n=70). Abbildung 17: Quantifizierungsverhalten von OSEM 3i24s gegenüber HD-PET in Abhängigkeit der Lymphknotengröße Quelle: Eigene Darstellung. 58 4 Auswertung Abbildung 18: Quantifizierungsverhalten von OSEM 3i24s gegenüber HD-PET in Abhängigkeit der Primariusgröße Quelle: Eigene Darstellung. Quelle: Eigene Darstellung Abbildung 19: SUVmax-Quantifizierung eines malignen 10,4 x 23,9 mm großen infracarinalen Lymphknotens per a) HD-PET- und b) OSEM 3i24s-Rekonstruktion Fallbeispiel eines 63-jährigen Patienten mit multifokalem Adenokarzinom im rechten Oberlappen mit Beteiligung infracarinaler und ipsilateral paratrachealer Lymphknoten (Stadium T3,N2,M0). Hervorzuheben ist hierbei die im Verhältnis zur OSEM 3i24s-Rekonstruktion niedrigere SUV-Quantifizierung durch die HD-PET (PET WB). Quelle: Eigene Darstellung. 59 4 Auswertung 4.2.5 Analyse auf Übereinstimmungen durch Bland-Altman-Plots 4.2.5.1 Einführung Die Scatterplots, Determinationskoeffizienten und die Korrelationskoeffizienten zeigten einen starken linearen Zusammenhang der SUV-Messungen untereinander, jedoch befanden sich die Regressionsgeraden meist außerhalb der Winkelhalbierenden. Aus diesem Grund mussten, nach der Überprüfung der Korrelation, in einer nachfolgenden Analyse die Übereinstimmungen der durch die 18 F-FDG-Uptake-Quantifizierung Rekonstruktionsprotokolle berechneten betrachtet werden. SUVs Um der verschiedenen Schwankungsbreiten, systematische Messunterschiede und die Abweichung der SUV-Berechnung in Abhängigkeit der Uptake-Höhe festzustellen, wurden für verschiedene Gruppierungen von Rekonstruktionsprotokollen Bland-Altman-Diagramme [114] [115] [121] erstellt. Die allgemeinen Analysen bezogen sich hierbei streng auf die SUVs ohne Berücksichtigung der Dignität der vermessenen LK und Primarien, so dass hier auf das erweiterte LK-Kollektiv mit n= 293 zurückgegriffen werden konnte. 4.2.5.2 Einfluss der Iterationsäquivalente Abbildung 20: Bland-Altman-Plot von LK: OSEM 3i24s und OSEM 2i8s für SUVmax (links) und SUVpeak (rechts) Quelle: Eigene Darstellung. Im direkten Vergleich zwischen den OSEM-Rekonstruktionen (Abb.20) ergab sich durch die Zunahme der Anzahl an Iterationen und Subsets - und somit der effektiv rekonstruierten Auflösung - eine signifikante Höherschätzung der SUVs in den Mittelwerten der Differenzen (Mean) sowohl für die SUVmax- als auch der SUVpeak60 4 Auswertung Quantifizierung (SUVmax: Mean: 1,15 ±0,98; 95%CI: 1,04 - 1,26, p<0,0001 // SUVpeak: Mean: 0,43 ±0,61; 95%CI: 0,36 - 0,50, p<0,0001; n=293). Die Differenzen der Messwerte sowie deren Streuungen um den gemeinsamen Mittelwert aller Differenzen (Mean) waren bei zunehmenden SUVs progredient und bildeten jeweils einen positiven Trend. Die hohen Übereinstimmungsbereiche (=Mean ±1,96SD) belegten insbesondere für SUVmax eine hohe systematische Verzerrung. Es waren bereits in dem für die Dignitätsbeurteilung von LK klinisch besonders relevanten Bereich niedriger SUVs hohe Differenzen der Messwerte bei einer Steigerung der Anzahl iterativen Berechnungen von 2i8s auf 3i24s zu beobachten (SUVmax: Mean ±1,96SD: -0,78 – 3,08; n=293 // SUVpeak: Mean ±1,96SD: -0,76 – 1,61; n=293). 4.2.5.3 Einfluss der Quantifizierungsmethoden Abbildung 21: Bland-Altman-Plot von LK: SUVmax und SUVpeak für HD-PET (links) und OSEM 3i24s (rechts) Quelle: Eigene Darstellung. Im direkten Vergleich zwischen den Quantifizierungsmethoden SUVmax und SUVpeak (Abb.21) ergaben sich, sowohl für die HD-PET- als auch die OSEM 3i24sRekonstruktionen, höhere Uptake-Werte für SUVmax gegenüber der SUVpeakQuantifizierung. Der Mittelwert der Differenzen, als Maß für die systematische Abweichung, belegte jeweils eine signifikante Abweichung von 0 und betrug 1,95 ±2,37 SUV in HD-PET bzw. 1,47 ±1,30 SUV in OSEM 3i24s (HD-PET: 95%CI: 1,67 – 2,22; p<0,0001; n=293 // OSEM 3i24s: 95%CI: 1,32 – 1,62; p< 0,001; n=293). Der Übereinstimmungsbereich wies für beide Rekonstruktionen eine hohe Streuung der Differenzen ihrer Messwerte nach (HD-PET: Mean±1,96SD: -2,70 – 6,59; n=293// OSEM 3i24s: Mean±1,96SD: -1,07 – 4,01; n=293). Die Streuungen um den 61 4 Auswertung Mittelwert der Differenzen (Mean) nahmen jeweils mit steigendem SUV zu und bildeten in beiden Rekonstruktionen einen positiven Trend mit Tendenz zu höheren SUVmax-Uptake-Werten. In der OSEM-Rekonstruktion kam es bereits im Bereich von SUV-Mittelwerten >5 zu Differenzen der Messwerte außerhalb des Übereinstimmungsbereichs. In der HD-Rekonstruktion war dies erst ab SUVMittelwerten >9 zu beobachten, jedoch umfasst hier der Übereinstimmungsbereich aufgrund der höheren SD initial bereits einen größeren Bereich. Wurden die Differenzen der Messwerte aus SUVmax- und SUVpeak- Quantifizierungen der HD-PET-Rekonstruktion als Prozentzahl ihrer Mittelwerte aufgetragen (Anhang 7), konnten die quantifizierungsbedingten Messschwankungen auf bis zu 138% ihrer Mittelwerte beziffert werden. Die gemittelte prozentuale Differenz (Mean) betrug 52,2% ±23,5% (p<0,0001). Die Streuung fokussierte sich bei prozentualer Auftragung auf einen Übereinstimmungsbereich von 6,05% - 98,34% (95%CI: 49,49% bis 54,90%; n=293). 4.2.5.4 Einfluss der HD-PET-Rekonstruktion unter SUVmax Abbildung 22: Bland-Altman-Plot von LK: SUVmax zwischen HD-PET und OSEM 3i24s (links) bzw. OSEM 2i8s (rechts) Quelle: Eigene Darstellung. Abb.22 zeigt eine Gegenüberstellung der SUVmax-Quantifizierung in HD-PET und dem etablierten OSEM mit 3i24s bzw. 2i8s. Der Mittelwert der Differenzen demonstrierte mit einem SUV von 0,70 ±1,78 bzw. 1,86 ±2,43 eine signifikante systematische Abweichung in den positiven Bereich für die HD-PET Rekonstruktion (95%CI: 0,50 – 0,91 bzw. 1,58 – 2,13; p < 0,001; n= 293). Besonders ausgeprägt war 62 4 Auswertung dies gegenüber OSEM 2i8s mit niedrigem Produkt aus Iterationen und Subsets. Die breiten Übereinstimmungsbereiche belegten jeweils eine hohe Streuung der Differenzen der Messwerte (OSEM 3i24s: -2,82 - 4,23 // OSEM 2i8s: -2,91 – 6,62). Wurden die Differenzen der Messwerte als Prozentzahl ihrer Mittelwerte aufgetragen (siehe Anhang 8) konnte eine Streuung der SUV-Uptake-Werte zwischen SUVmaxquantifizierter LK der HD-PET und OSEM 3i24s-Rekonstruktion mit einer Differenz von bis zu 67% um den Mittelwert ihrer Differenzen festgestellt werden (Mittelwert der Differenz: 9 ±15%; p<0,0001; n=293). Im Bereich niedriger SUV-Mittelwerte von < 8 bildete sich eine Verdichtung der einzelnen Differenzen der Messwerte um den Mittelwert aller Differenzen (Mean) ohne Überschreitung des Übereinstimmungsbereichs. Hier zeigte sich jedoch eine Abweichung der Differenzen sowohl in den positiven als auch in den negativen Bereich. In der Rekonstruktion mit geringerer Anzahl von Iterationen (Abb. 22 rechts) zeigte sich darüberhinaus eine Zunahme der einzelnen Differenzen der Messwerte bei steigenden SUV-Mittelwerten sowie ein eindeutiger Trend für systematisch steigende Differenzen der Messwerte bei steigenden SUV-Mittelwerten. Bei zunehmendem SUV über 8 zeigten sich die Streuungen der Differenzen progredient. Die Differenzen aller Mittelwerte (Mean) demonstrierten eine systematische Verzerrung, desweiteren zeigte sich der Trend für HD-PET gegenüber OSEM 3i24s und OSEM 2i8s bei steigenden SUV-Mittelwerten den SUV höher zu quantifizieren. 4.2.5.5 Einfluss der HD-PET-Rekonstruktion unter SUVpeak Abbildung 23: Bland-Altman-Plot von LK: SUVpeak zwischen HD-PET und OSEM 3i24s (links) und OSEM 2i8s (rechts) Quelle: Eigene Darstellung. 63 4 Auswertung In der Gegenüberstellung zwischen HD-PET und OSEM 3i24s mit SUVpeak (Abb.23 links) ließ sich eine signifikante, jedoch vom Betrag geringe und somit klinisch kaum relevante systemische Abweichung der Differenz der Mittelwerte von 0,23 ±0,58 SUV nachweisen. (95%CI: 0,17 - 0,30; p< 0,0001). Der Übereinstimmungsbereich war mit einem Intervall von -0,91 bis 1,27 SUV, im Gegensatz zu den in Kapitel 4.2.5.2 und 4.2.5.4 beschriebenen SUVmax-Analysen, deutlich schmäler ausgeprägt und wies für SUVpeak eine deutlich geringere systematische Verzerrung über die unterschiedlichen Rekonstruktionsalgorithmen nach. In dem für die LK-Analyse klinisch besonders relevanten SUV-Bereich <5, zeigte sich eine Verdichtung der Differenzen der Messwerte um den Mittelwert aller Differenzen. Bei höheren SUVpeak-Mittelwerten bildete sich eine mit der oben beschriebenen SUVmaxAnalyse vergleichbare Zunahme der Streuungen der einzelnen Differenzen der Messwerte um den Mittelwert aller Differenzen. Zusätzlich zeigte sich ein Trend zu höher quantifizierten SUV-Werten für HD-PET gegenüber den OSEM- Rekonstruktionen. Abbildung 24: Bland-Altman-Plot von LK: HD-PET SUVpeak und OSEM 3i24s SUVpeak. Ordinaten als prozentuale Abweichung der Differenz der Messwerte von ihrem Mittelwert (links) und Quotient der Messwerte gegen den Mittelwert der Messwerte aufgetragen (rechts). Quelle: Eigene Darstellung. Wurden die Differenzen der Messwerte als Prozentzahl ihrer Mittelwerte aufgetragen (Abb. 24 links), zeigte sich mit der SUVpeak-Quantifizierung die insgesamt geringste prozentuale Differenz unter den analysierten Rekonstruktionsprotokollen. Die gemittelte prozentuale Differenz (Mean) betrug hier im Vergleich relativ geringe 4,32 ±11,16% (p<0,0001). Die Streuung fokussierte sich auf einen 64 4 Auswertung Übereinstimmungsbereich von -17,56% - 26,19% bei einem 95%CI von 3,03% bis 5,60%. Die in Abb. 23 links abgebildeten relativ konstanten Differenzen der Messwerte im niedrigen SUV-Bereich spiegelten sich in Abb. 24 links mit relativ hohen prozentualen Differenzen von bis zu -30% wieder. Die oben beschriebenen hohen absoluten Differenzen der Messwerte im Bereich hoher SUVs >5 relativierten sich bei prozentualer Skalierung der Ordinate. So zeigte sich hier eine Streuung der Differenzen der einzelnen Messwerte im Bereich relativ konstanter -5% bis +25% um den Mittelwert aller Differenzen (Mean). Ebenso konnte der Trend zu progredienten Differenzen auf eine annähernd konstante prozentuale Abweichung überführt werden. Bei Auftragung des Quotienten aus HD-PET und OSEM 3i24s in der SUVpeakQuantifizierung gegen ihren Mittelwert (Abb. 24 rechts) stellte sich eine entsprechende Verteilung dar (Mittelwert der Quotienten: 1,05; Mean ±1,96SD: 0,801,28; 95%CI: 1,04-1,06; p<0,0001). In der Differenzenbildung mit SUVpeak zwischen HD-PET und OSEM 2i8s (Anhang 9) zeigte sich eine der OSEM 3i24s-Analyse (Abb. 23 links) vergleichbare Trendbildung ab einem SUV von >5. Der Mittelwert aus den Differenzen aller Messwerte (Mean) war mit 0,66 ±1,01 SUV (95%CI: 0,54 - 0,78; p<0,0001) im Vergleich zu dem Plot aus HD-PET gegen OSEM 3i24s etwas höher, jedoch geringer als in der SUVmax-Quantifizierung zwischen den Rekonstruktionsalgorithmen HDPET und OSEM 2i8s (Abb.22 rechts). Auch wies der Übereinstimmungsbereich von −1,31 - 2,63 SUV eine etwas höhere systematische Verzerrung als bei der Verwendung von OSEM 3i24s nach, jedoch mit deutlich geringerer Verzerrung als in der vergleichbaren SUVmax-Quantifizierung. Insgesamt konnten somit durch die SUVpeak-Quantifizierung geringere Differenzen der Messwerte und kleinere Standardabweichungen sowie ein konsekutiv engerer Übereinstimmungsbereich und eine geringere systematische Verzerrung der Messwerte erreicht werden. Der Trend zu höheren Werten durch die HD-PETRekonstruktion war sowohl für SUVmax als auch SUVpeak nachzuweisen, jedoch für letztere mit deutlich geringeren Differenzen zwischen den SUV-Messungen durch die unterschiedlichen Algorithmen. SUVpeak demonstrierte somit eine deutlich höhere Persistenz zwischen den Rekonstruktionsalgorithmen als SUVmax. 65 4 Auswertung 4.2.5.6 Einfluss der Rekonstruktions- und Quantifizierungsmethode bei LK Abbildung 25: Bland-Altman-Plot von LK: HD-PET SUVpeak gegen OSEM 3i24s SUVmax. Die Ordinate zeigt die Differenz der Messwerte (links) bzw. die Differenzen der Messwerte als Prozentzahl ihrer Mittelwerte (rechts) Quelle: Eigene Darstellung. Die Gegenüberstellung von HD-PET SUVpeak und OSEM 3i42s SUVmax (Abb. 25 links) demonstrierte bei einen Mittelwert der Differenzen von -1,24 ±1,04 SUV eine systematische Abweichung zu höheren SUV-Quantifizierungen unter OSEM 3i24s SUVmax. Die geringen Uptake-Werte der HD-PET-Rekonstruktion entstanden hierbei durch die bereits oben beschriebenen Einflüsse, insbesondere jedoch durch die SUVpeak-Quantifizierung. Die systematisch höher gemessenen SUVs durch den TrueX-Algorithmus wurden durch die gemittelten und somit mathematisch bedingt niedrigeren SUV-Uptake Werte in SUVpeak überlagert. Dies führte insgesamt zu einer signifikanten und klinisch relevanten systematischen Abweichung von niedriger quantifizierten SUVs in der HD-PET Rekonstruktion (95%CI: -1,36 bis -1,12; p<0,0001). Bereits im Bereich niedriger SUV-Mittelwerte war eine Streuung der Differenzen der Messwerte außerhalb des Übereinstimmungsbereiches von -3,27 – 0,79 SUV nachzuweisen. Im weiteren Verlauf steigender SUV-Mittelwerte zeichnete sich eine starke Zunahme der absoluten Streuungen um den Mittelwert der Differenzen ohne eindeutigen Trend ab. Die visuell erkennbare Fokussierung der SUV-Differenzen um den Mittelwert aller Differenzen (Mean) von -1,24 SUV im niedrigen Uptake-Bereich sowie die geringe Standardabweichung von ±1,04 SUV ließen in diesem Plot eine geringe Streuung vermuten. Eine Auftragung der Differenzen der Messwerte als Prozentzahl ihrer 66 4 Auswertung Mittelwerte in Abbildung 25 rechts demaskierte jedoch die hohen Schwankungen in der SUV-Quantifizierung zwischen den beiden Rekonstruktionsprotokollen. Streuungen der Differenzen über einen Bereich von rund 140% Ihrer Messwerte sowie einen sehr breiten Übereinstimmungsbereich von −96,82 - 10,32 SUV demonstrierten eine sehr hohe Streuung der Messwerte insbesondere in niedrigen SUV-Bereichen unter 5 (Mittelwert der Differenzen: -43,25%; 95%CI: -46,39 - -40,11 SUV, p<0,0001). Abbildung 26: Bland-Altman-Plot von LK für HD-PET SUVmax gegen OSEM 3i24s SUVpeak mit den Differenzen der Messwerte (links) und der prozentualen Abweichung der Differenz der Messwerte vom Mittelwert aller Differenzen (rechts) Quelle: Eigene Darstellung. In Abbildung 26 links wurde die SUVmax-Quantifizierung in HD-PET gegenüber SUVpeak in OSEM 3i24s aufgetragen. Der Mittelwert der Differenzen (Mean) belegte mit 2,18 ±2,84 SUV (95%CI 1,85 – 2,50, p<0,001, n= 293) eine signifikante und systematische Abweichung in den positiven Bereich für HD-PET. Der hohe Übereinstimmungsbereich zeigte eine sehr starke und somit klinisch relevante Streuung (−3,9446 – 7,7424 SUV). Dieser breite Übereinstimmungsbereich wurde bereits ab einem SUV von 7 durch Streuungen um den Mittelwert der Differenzen überschritten. Insgesamt nahm die Streuung der Differenzen der Messwerte bei steigenden SUV-Mittelwerten zu, jedoch gruppierten sich diese um eine positive Trendlinie. Insgesamt bildete sich somit der Trend für HD-PET SUVmax, gegenüber OSEM 3i24s SUVpeak, höhere Uptake-Werte zu quantifizieren. Die starke Ausprägung dieses Trends ließ sich auf die oben beschriebenen Effekte der rekonstruierten Auflösung und Art der Bestimmung der maximalen Aktivität der VOI zurückführen, die hier im Gegensatz zur Abb. 25 synergistisch wirken. Wurden die Differenzen der Messwerte als Prozentzahl ihrer Mittelwerte aufgetragen (Abb. 26 67 4 Auswertung rechts), konnte die Trendlinie auf eine im Mittel 56,2 prozentige Überschätzung der HD-PET SUVmax- gegenüber der OSEM 3i24s SUVpeak-Quantifizierung überführt werden. Die stark ausgeprägten Messschwankungen verhindern jedoch den klinischen Einsatz eines Korrekturfaktors. 4.2.5.7 Einfluss der Rekonstruktions- und Quantifizierungsmethoden bei Primarien Abbildung 27: Bland-Altman-Plots für die Differenz der SUV-Messwerte von Primarien 68 4 Auswertung Quelle: Eigene Darstellung. Betrachtete man die SUV-Quantifizierungen der Primarien in den Bland-AltmanDiagrammen in Abbildung 27 und Tabelle 7, so zeigten sich im Vergleich zu den LK progrediente Divergenzen zwischen den SUV-Quantifizierungen der analysierten Rekonstruktionsprotokolle bei zunehmender VOI Größe und Höhe der SUV (Mittelwerte: Primarius Größe: 3,26 x 4,13 cm; SUVmax in OSEM3i24s: 13,23; LKGröße: 0,95 x 1,44 cm; SUVmax in OSEM 3i24S: 4,10). Der direkte Vergleich zu den LK-Analysen in Kapitel 4.2.5 demonstrierte eine deutliche Erhöhung der Mittelwerte der Differenzen (Mean) mit systematischen Abweichungen bei vergleichbarer Trendbildung. Desweiteren wurde gegenüber den LK, durch größere Standardabweichungen und somit konsekutive Verbreiterungen der Übereinstimmungsbereiche, eine zunehmende systematische Verzerrung deutlich. Ebenfalls nahmen die Differenzen der SUV-Quantifizierungen verschiedener Rekonstruktionsprotokolle bei steigenden SUV-Mittelwerten deutlich zu und es zeigte 69 4 Auswertung sich eine - mit den LK-Analysen vergleichbare - progrediente Streuung um die angedeutete Trendlinie bei zunehmenden SUV-Mittelwerten. Der in der LK-Analyse gefundene Trend zu einem linearen Anstieg der Differenzen der SUV-Messung in eine positive bzw. negative Richtung wurde auch für Primarien beibehalten. Ausnahmen bildeten hierbei die Vergleiche innerhalb der OSEM-Rekonstruktionen bei gleicher SUVmax- oder SUVpeak-Quantifizierung (Abb. 27 oberste Reihe links und rechts). Bei den Vergleichen zwischen OSEM 3i24s SUVmax und OSEM 2i8s SUVmax (Abb. 27 oberste Reihe links) sowie OSEM 3i24s SUVpeak und OSEM 2i8s SUVpeak (Abb. 27 oberste Reihe rechts) zeigte sich im Gegensatz zu den LKAnalysen (Abb.20 rechts) keine eindeutige Trendbildung bei Zunahme der SUVMittelwerte, sondern eine gleichförmig hohe Streuung der Differenzen der SUVs um den Mittelwert der Differenzen (Mean) über die gesamte SUV-Bandbreite. Im Vergleich zwischen dem neuen HD-PET- und dem etablierten OSEMRekonstruktionsalgorithmus zeigte sich für die Primarien zwischen HD-PET SUVpeak und OSEM3i24s SUVmax die größte Persistenz der SUV-Quantifizierung ohne deutliche Zeichen einer progredienten systematischen Verzerrung bei zunehmenden SUVs. Durch die SUVpeak-Quantifizierung in HD-PET wurde der 18 F- FDG-Uptake im Vergleich zu SUVmax im OSEM 3i24s-Algorithmus jedoch systematisch um ca. einen SUV-Wert niedriger gemessen. Eine SD von ±1,08 (Mittelwert der Differenz -1,09; 95%CI -1,35 - −0,84, p<0,0001) sowie ein Übereinstimmungsbereich von −3,22 bis 1,03 belegten jedoch eine für den klinischen Einsatz relativ hohe Streuung um den Mittelwert der Differenzen. Wurden die Messunterschiede bezüglich der SUVmax/peak-Quantifizierungen betrachtet, ergaben sich für die Messungen per SUVpeak gegenüber SUVmax eine höhere Persistenz zwischen den verschiedenen Rekonstruktionsprotokollen. Zwischen den Rekonstruktionsalgorithmen HD-PET und OSEM konnte für die SUVpeak-Quantifizierung eine niedrigere Abweichung der Mittelwerte der Differenzen mit kleinerer Standardabweichung, niedrigeren 95%-Konfidenzintervallen und einen engeren Übereinstimmungsbereich mit geringeren Streuungen der Differenzen nachgewiesen werden. Ähnliches galt im direkten Vergleich zwischen hoher und niedriger Anzahl an Iterationen und Subsets der OSEM-Algorithmen. Innerhalb der OSEM-Rekonstruktionen mit 2i8s und 3i24s streuten die einzelnen SUVpeak-Differenzen der Messwerte gleichmäßig um den Mittelwert aller 70 4 Auswertung Differenzen (Mean). Zwischen OSEM und HD-PET zeigte sich jedoch auch für die SUVpeak-Quantifizierung eine Trendbildung für die HD-Rekonstruktion bei zunehmenden SUV-Mittelwerten die einzelnen SUVs höher zu messen als die OSEM-Rekonstruktionen. Abbildung 28: Bland-Altman Plot von Primarien. In der Ordinate sind die Differenzen der Messwerte als Prozentzahl ihrer Mittelwerte des SUVpeak von HDPET und OSEM 3i24s (links) bzw. HD-PET SUVpeak und OSEM 3i24s SUVmax (rechts) aufgetragen Quelle: Eigene Darstellung. In Abbildung 28 wurden die Differenzen der Messwerte als Prozentzahl ihrer Mittelwerte in der Ordinate aufgetragen. Für HD-PET SUVpeak gegenüber OSEM 3i24s SUVpeak (Abb. 28 links) zeigte sich die geringste SD und ein relativ schmaler Übereinstimmungsbereich. Die Differenzen betrugen hier durchschnittlich 13,6% ±9,88% der Mittelwerte (Mean) und die Streuung zentrierte sich mit zunehmenden SUV-Werten auf diesen Prozentwert, so dass keine Trendbildung zu beobachten war (95%CI: 11,27-15,98; Mean ±1,96 SD: -5,74 bis 32,98; p<0,0001). Wurde die SUVpeak-Quantifizierung in HD-PET gegenüber OSEM 3i24s aus SUVmax auf diese Weise aufgetragen (Abb. 28 rechts), betrugen die Differenzen ebenfalls im Mittel relativ konstante -12,1% ±13,34% der einzelnen Mittelwerte (Mean ±1,96SD: -38,23 - 14,08; 95%CI: -15,26 - -8,89; p< 0,0001). 71 4 Auswertung Tabelle 7: Kennzahlen der Bland-Altman-Plots für die SUV-Uptakes von Primarien SUV-Vergleich Mittelwert der Differenz Übereinstimmungsbereich SD 95%CI OSEM 3i24s SUVmax OSEM 2i8s SUVmax 1,93* -0,50 - 4,36 ±1,24 1,63 - 2,22 OSEM 3i24s SUVpeak OSEM 2i8s SUVpeak 0,99* -1,05 - 2,68 ±0,86 0,78 - 1,19 HD-PET SUVmax HD-PET SUV peak 4,78* -0,86 - 10,421 ±2,88 4,10 - 5,47 OSEM 3i24s SUVmax OSEM 3i24s SUVpeak 2,57* -0,02 - 5,16 ±1,32 2,26 - 2,89 HD-PET SUVmax OSEM 3i24s SUVmax 3,69* -2,10 - 9,47 ±2,95 2,99 - 4,39 HD-PET SUVmax OSEM 2i8s SUVmax 5,61* -0,37 - 11,60 ±3,05 4,89 - 6,34 HD-PET SUVpeak OSEM 3i24s SUVpeak 1,48* -0,73 - 3,69 ±1,13 1,21 -1,75 HD-PET SUVpeak OSEM 3i24s SUVmax -1,09* -3,22 - 1,03 ±1,08 -1,35 - -0,84 HD-PET SUV max OSEM 3i24s SUVpeak 6,26* -1,29 - 13,81 ±3,85 5,34 - 7,18 Hoch vs. niedrige Iteration SUVmax vs. SUVpeak OSEM vs. HD-PET Rekon.übergreifend * signifikante Abweichung von 0 (H0: Mean=0) auf einem Niveau von p < 0,0001; n=70. Quelle: Eigene Darstellung. 4.3. Patienten- und LK-bezogene Analyse Als Qualitätsmaß für die verschiedenen Rekonstruktionsalgorithmen und Methoden zur SUV-Quantifizierung wurden ROC-Analysen durchgeführt und die individuellen AUCs berechnet. Aus den Koordinaten der ROC-Analysen wurden die SUV abhängigen Fehlerraten berechnet. Diese wurden in der anschließenden Festlegung eines 18F-FDG-Uptake Cut-off Wertes für Lymphknotenmetastasen in einem Fehlerratendiagramm gegeneinander aufgetragen. Die Analysen wurden an dem unselektierten LK-Kollektiv mit eindeutigen Histologien der LK-Regionen durchgeführt (n=274; Prävalenz maligner LK: 19,7%; maligne LK: 54; benigne LK: 220). 72 4 Auswertung 4.3.1 ROC-Analyse mediastinaler LK-Metastasen In den ROC-Kurven der Abbildung 29 zeigten sich für alle Rekonstruktionen starke Abweichungen von der diagonalen Bezugslinie. Die Flächen unter den Kurven (AUC) in Tabelle 8 wichen alle signifikant von der Wahrheitsfläche 0,5 ab, so dass ein Zufallsprozess der SUV-Analyse ausgeschlossen werden konnte. Alle Kurven wiesen zudem einen annähernd vertikalen Anstieg bis auf ein Sensitivitätsniveau von 50% mit anschließend weiterem individuellem Verlauf bei zunehmender 1-Spezifität, bzw. falsch positiven Rate auf. Abbildung 29: ROC-Analyse der LK-SUVs (Diagonale Segmente ergeben sich aus Bindungen) Quelle: Eigene Darstellung Tabelle 8: AUC-Analyse der LK-SUVs Variable(n) für AUC Standardfehlera Asymptotische 95%CI b Testergebnis Signifikanz OSEM 3s24s SUVmax 0,866 0,035 0,000 0,797-0,936 OSEM 3i24s SUVpeak 0,836 0,036 0,000 0,765-0906 OSEM 2i8s SUVmax 0,821 0,038 0,000 0,747-0,896 OSEM 2i8s SUVpeak 0,819 0,039 0,000 0,743-0,895 HD-PET SUVmax 0,867 0,033 0,000 0,803-0,932 HD-PET SUVpeak 0,841 0,036 0,000 0,771-0,911 CT (kurze Achse) 0,814 0,031 0,000 0,754-0,874 CT (lange Achse) 0,817 0,030 0,000 0,758-0,875 a b Unter der nichtparametrischen Annahme Nullhypothese: Wahrheitsfläche = 0.5 Quelle: Eigene Darstellung. 73 4 Auswertung Durch die Berechnung der AUC als Qualitätsmaß für die LK-Differenzierung durch die verschiedenen Algorithmen, zeigten sich die Rekonstruktionen HD-PET SUVmax und OSEM 3i24s SUVmax mit einer AUC von 0,867 ±0,033 und 0,866 ±0,035 am leistungsfähigsten und ohne signifikante Unterschiede im AUC-Vergleich nach DeLong et al. [118] nahezu gleichwertig (Differenz der AUC: 0,001 ±0,011, ;p=0,9189). Bei vergleichbaren AUC-Werten von HD-PET SUVmax und OSEM 3i24s SUVmax differenzierte sich in der ROC-Analyse die OSEM-Rekonstruktion mit einem stärkeren Anstieg der Sensitivität mit Schulterpunkt im Bereich hoher Spezifität gegenüber der HD-PET mit höheren Sensitivitäten im Bereich niedriger Spezifitätsraten. Innerhalb der verwendeten Algorithmen HD-PET und OSEM konnten im direkten Vergleich höhere AUC-Werte für SUVmax gegenüber der SUVpeak-Quantifizierung nachgewiesen werden (signifikant mit p<0,05 für OSEM 2i8s SUVpeak gegenüber HD-PET SUVmax: Differenz der AUC: 0,048 ±0,023; p=0,0328). Innerhalb des OSEM-Algorithmus führte sowohl für SUVmax als auch für SUVpeak eine Erhöhung der Iterationen und Subsets von 2i8s auf 3i24s zu einer Steigerung der durch die AUC gemessenen Trennschärfe (signifikant mit p<0,05 für OSEM 2i8s SUVmax zu OSEM 3i24s SUVmax: Differenz der AUC: 0,045 ±0,020; p=0,0210). Ebenfalls ergab sich für die HD-Rekonstruktion mit SUVmax gegenüber OSEM2i8s SUVmax eine auf einem Niveau von p<0,01 signifikant höhere AUC (Differenzen der AUCs: 0,046 ±0,018; p= 0,0094). In der ROC-Analyse wiesen die SUV-Quantifizierungen in allen verwendeten Rekonstruktionen eine höhere AUC als die mittels Low-Dose-CT morphometrisch ausgeführte Dignitätsbestimmung der LK auf. Im AUC-Vergleich zeigte sich dieser Unterschied mit einer maximalen Differenz der AUC von 0,055 ±0,033 für HD-PET SUVmax gegenüber der CT-Messung der kurzen LK-Achse mit p =0,1068 jedoch als nicht signifikant. Im direkten Vergleich wies die Größenmessung in der kurzen gegenüber der langen LK-Achse einen um 0,003 nicht signifikant höheren AUC auf (Differenz der AOCs: 0,00295 ±0,0275; p= 0,9139). 74 4 Auswertung 4.3.2 ROC-Analyse mit Quotientenbildung Um die Leistungsfähigkeit der SUV-Quantifizierung zu steigern wurde der SUVUptake mediastinaler LK in Bezug zu dem Uptake des Primarius bzw. der Leber gesetzt. Ziel war es bei niedrig speichernden Primarien die Sensitivität bei ebenso niedrig speichernden potentiellen LK-Metastasen zu erhöhen sowie bei stark speichernden Primarien die FP-Rate nicht befallener mediastinaler LK zu senken. Der Quotient zu dem SUV-Uptake der Leber sollte den individuellen Glukosestoffwechsel berücksichtigen. Das Leber-Uptake zeigte jedoch für alle Rekonstruktionsprotokolle eine signifikante Korrelation mit dem Körpergewicht der Patienten (p<0,001, r: 0,543- 0,985). Abbildung 30: Rekonstruktion ROC-Analyse von SUV-Quotienten für LK der HD-PET- Quelle: Eigene Darstellung. 75 4 Auswertung Abbildung 31: ROC-Analyse von SUV-Quotienten für LK der OSEM 3i24sRekonstruktion (überlagernde ROC-Kurven wurden gestrichelt dargestellt) Quelle: Eigene Darstellung. Die Ergebnisse der AUC-Berechnung belegten, dass keine Steigerung der Testqualität durch die Bildung von den in Tabelle 9 aufgeführten Verhältnisse aus LK-Uptake und Primarien bzw. Leber-Uptake für den SUVmax in den OSEM 3i24sund HD-PET-Rekonstruktionen erreicht werden konnte. Bei visueller Analyse der ROC-Kurven in Abbildung 30 und 31 zeigte sich jedoch für die SUVmax-Quantifizierung des HD-PET-Algorithmus gegenüber der alleinigen SUVmax Messung des LK eine potentielle Erhöhung der Spezifität im Bereich hoher Sensitivitäten bei Bildung eines Quotienten aus dem SUVmax-Uptake von LK und Primarius. Für die OSEM 3i24s-Rekonstruktion konnte sowohl bei Betrachtung der ROCKurven, als auch bei der Berechnung der AUCs keine Erhöhung der Testqualität durch die Quotientenbildung erreicht werden. Sollte diese trotzdem durchgeführt 76 4 Auswertung werden, zeigte sich für das Verhältnis aus LK-SUV zu dem gemittelten SUV eines größer 300 ml großen Leber-VOI eine um 0,048 höhere AUC als bei Verwendung des Primarius SUVmax als Divisor. Tabelle 9: AUC-Analyse der Quotientenbildung mit LK-SUVs Variable(n) für Testergebnis LK HD-PET SUVmax Fläche Standard- Asymptotische fehlera Signifikanzb 95%CI 0,859 0,034 0,000 0,792 - 0,927 LK-HD-PET SUVmax/ Primarius HD-PET SUVmax 0,834 0,030 0,000 0,775 - 0,892 LK HD-PET SUVmax / Primarius HD-PET SUVpeak 0,811 0,031 0,000 0,750 - 0,872 LK HD-PET SUVmax/ Leber HD-PET SUVmax 0,774 0,047 0,000 0,681 - 0,867 LK HD-PET SUVmax/ Leber HD-PET SUVpeak 0,779 0,046 0,000 0,688 - 0,869 LK HD-PET SUVmax/ Leber HD-PET SUVavg 0,802 0,042 0,000 0,719 - 0,885 LK OSEM 3i24s SUVmax 0,858 0,037 0,000 0,785 - 0,931 LK OSEM3i24s SUVmax / Primarius OSEM 3i24s SUVmax 0,764 0,048 0,000 0,671 - 0,857 LK OSEM 3i24s SUVmax / Primarius OSEM 3i24s SUVpeak 0,784 0,046 0,000 0,695 - 0,874 LK OSEM 3i24S SUV max / Leber OSEM 3i24s SUVmax 0,764 0,048 0,000 0,671 - 0,857 LK OSEM 3i24s SUVmax / Leber OSEM 3i24s SUVpeak 0,784 0,046 0,000 0,695 - 0,874 0,041 0,000 0,731 - 0,893 LK OSEM 3i24s SUVmax / 0,812 Leber OSEM 3i24s SUVavg a Unter der nichtparametrischen Annahme. Quelle: Eigene Darstellung. b Nullhypothese: Wahrheitsfläche = 0.5 77 4 Auswertung 4.3.3 Ermittlung des optimalen SUV Cut-offs Da sich in den ROC-Analysen keine eindeutigen Scheitelpunkte der Kurven darstellten sowie neben der theoretisch höchsten diagnostischen Trefferrate auch ein klinisch orientierter optimierter Schwellenwert von Interesse war, wurde für jede ROC-Kurve ein individuelles Fehlerdiagramm mit der FPR, FNR, FNR+FPR sowie der Gesamtgenauigkeit (Accuracy) in Bezug zum SUV erstellt. Ziel war die Definition eines SUV-Schwellenwertes, mit welchem eine SUV-basierte dichotome Unterscheidung in tumorfreie oder metastasierte Lymphknoten möglich ist. In allen Fehlerratendiagrammen zeigten sich bei progredientem SUV steigende FNR sowie abnehmende FPR mit einem streben gegen Null. Die Accuracy zeigte jeweils einen sigmoidalen Kurvenverlauf mit Plateaubildung bei hohen SUVs und anschließendem leichten Abfall. Der Beginn der Plateaubildung wurde als Cut-off der maximalen diagnostischen Gesamtgenauigkeit herangezogen. Für den klinisch orientierten Cut-off wurde die FPR und FNR addiert und unter Berücksichtigung einer vertretbaren falsch positiv Rate definiert. Eine Zusammenfassung der Testparameter findet sich in Tabelle 18 der Diskussion. 4.3.3.1 HD-PET: SUVmax Abbildung 32: Fehlerratendiagramm für HD-PET SUVmax Quelle: Eigene Darstellung 78 4 Auswertung Für die Quantifizierung mittels SUVmax in HD-PET zeigte das Fehlerratendiagramm (Abb.32) für das LK-Gesamtkollektiv zwei negative peaks der summierten Fehlerraten FNR+FPR bei einem SUVmax von 3,5 sowie 4,7. Die FNR bildete einen starken Anstieg ab einem SUV von 3,2. Für den Kurvenverlauf der Gesamtgenauigkeit konnte eine Plateaubildung ab 4,7 nachgewiesen werden. Im Bereich niedriger FNR (und niedriger FNR+FPR) ergab sich somit ein optimaler SUV Cut-off im Intervall von 3,2 - 3,5 (Sensitivität: 88,9% - 83,3%; Spezifität: 66,4% 75,5%; FNR: 11,1% - 16,7%; FPR: 33,6% - 24,5%; PPV: 39,3%-45,5%; NPV: 96,6%94,9%; Accuracy: 70,8% -77,0%; Prävalenz: 19,7%; n=274). Durch einen SUV-Schwellenwert von 4,7 konnte die höchste diagnostische Gesamtgenauigkeit erreicht werden (Sensitivität: 68,5%; Spezifität: 94,5%, FNR: 31,4%; FPR: 5,5%; PPV: 75,5%; NPV: 92,4%; Accuracy: 89,4%; Prävalenz: 19,7%; n=274). Um den SUV-Bereich zwischen 3,2 - 3,5 auf einen exakten Schwellenwert zu spezifizieren, wurde das LK-Gesamtkollektiv in Bezug auf deren CT-morphologische Größe in 2 Subkollektive aufgespalten und in zwei weiteren Fehlerratendiagrammen erneut differenziert betrachtet (Abb.33). Trennwert war hierbei der CT- morphologischen Grenzwert für LK von 1cm in der kurzen Achse. In der Subpopulation nicht vergrößerter LK < 1 cm zeigten die Fehlerraten FNR+FPR bei einem SUV von 3,2 einen negativen Peak, die Kurve der FNR zeigte ab einem SUV von ≥3,3 einen sehr starken Anstieg. Ab einem SUV von 4,7 konnte eine Plateaubildung der Accuracy beobachtet werden (LK <1 cm @ SUVmax 3,2: Sensitivität: 81,3%; Spezifität 69,5%; FNR 18,8%; FPR 30,5 %; Accuracy 70,5%; Prävalenz: 9,2%; n= 190; maligne n=16, benigne n=174). In der Subpopulation CT-morphologisch vergrößerter und somit CT-morphometrisch malignitätssuspekter LK ≥1 cm bildete sich der negative Peak der Fehlerraten FNR+FPR im Bereich von 3,6 SUV. Die Plateaubildung der Acurracy begann ab einem SUV von 4,7 (LK ≥1 cm @ SUVmax 3,2: Sensitivität: 92,1%; Spezifität 47,8%; FNR 7,9%; FPR 52,2%; Accuracy 67,9%; Prävalenz 45,2%; n=84; maligne n=38; benigne n=46). 79 4 Auswertung Abbildung 33: Fehlerratendiagramm für HD-PET SUVmax; optimaler Schwellenwert für CT-morphologisch vergrößerte und nicht vergrößerte LK Quelle: Eigene Darstellung. 4.3.3.2 HD-PET: Quotient aus SUVmax LK/SUVmax Primarius In der ROC-Kurve der HD-PET in Abbildung 31 zeigte sich visuell eine potentielle Steigerung der Spezifität im Bereich hoher Sensitivität durch eine Quotientenbildung 80 4 Auswertung aus den SUVs von LK und Primarien. Für die Verifizierung dieser Beobachtung wurden für das LK-Kollektiv die Fehlerraten berechnet und in Abbildung 34 dargestellt. Hier zeigte sich ein negativer Peak der FNR+FPR bei einem SUVQuotienten von 0,23 (@ SUV-Quotient 0,23: Sensitivität 94,1%; Spezifität 59,8%, FNR: 5,9%; FPR: 40,2%; NPV 97,8%; PPV 35,3%; Accuracy 66,3%; Prävalenz: 18,9%; n=270). Bei 4 LK- Regionen bestand ein Zustand nach Lobektomie, so dass kein quantifizierbarer Primarius vorhanden war. Die Quotientenbildung aus dem SUVmax der LK und Primarien zeigte sich im Vergleich zu dem SUVmax in HD-PET - als Rekonstruktionsverfahren mit der höchsten AUC - im Bereich sehr hoher Sensitivitäten von 94% eine Steigerung der Spezifität um 70,3% bzw. 25 Prozentpunkte und eine Erhöhung der Accuracy um 43,2% bzw. 20 Prozentpunkten (HD-PET SUVmax vergleichbarer Sensitivität @ SUV 2,6 : Sensitivität: 94%; Spezifität: 35,1%; FNR: 5,88%; FPR: 64,8%; NPV: 96,3%; PPV 25,3%; Accuracy 46,3%; Prävalenz:18,9%; n=270). Abbildung 34: Fehlerratendiagramm HD-PET SUVmax; Quotientenbildung aus LKund Primarius-Uptake Quelle: Eigene Darstellung. 81 4 Auswertung 4.3.3.3 OSEM 3i24s: SUVmax Im Fehlerratendiagramm der OSEM 3i24s-Rekonstruktion mit der SUVmaxQuantifizierung (Abb.35) bildete sich für das LK-Kollektiv ein ausgeprägter negativer Peak der FNR+FPR bei einem SUV von 4,0. Die Plateaubildung der Gesamtgenauigkeit begann ebenfalls bei einem SUV von 4 mit anschließend leichter Abnahme bei weiter zunehmendem SUV. Somit konnte für diese Rekonstruktion bei einem SUV von 4,0 die höchste diagnostische Gesamtgenauigkeit verbunden mit der niedrigsten Summe aus falsch positiver und falsch negativer Ergebnisse erreicht werden (@ SUV 4,0: Sensitivität: 75,9%; Spezifität: 93,6%; FNR: 24,1%; FPR: 6,4%; NPV: 94,0%; PPV: 74,5%; Accuracy: 90,1%; Prävalenz: 19,7%; n=274). Abbildung 35: Fehlerratendiagramm für OSEM 3i24s SUVmax Quelle: Eigene Darstellung Der SUV Cut-off von 4,0 markierte, wie in Abbildung 36 zu sehen, sowohl für CTmorphologisch vergrößerte, als auch für normal große LK den Beginn der Plateauphase der Gesamtgenauigkeit sowie den negativen Peak der FNR+FPR. Die FNR normal großer LK zeigte gegenüber den vergrößerten LK einen sprunghaften Anstieg auf 50% innerhalb eines schmalen SUV-Intervalls von 2,4. Im Vergleich zu der HD-Rekonstruktion fand sich in diesem Intervall ein stärkerer Anstieg der FNR 82 4 Auswertung und rascherer Abfall der Sensitivität (@ SUV 4,0 normale/vergrößerte LK: Sensitivität: 56,3%/84,2%; Spezifität: 97,1%/80,0%, FNR: 43,8%/15,8%; FPR: 2,9%/19,6%; NPV: 96,0%/86,0%; PPV: 64,3%/78,0%; Accuracy: 93,7%/82,1%; Prävalenz: 8,4%/45,2%; n=190/84). Abbildung 36: Fehlerratendiagram für HD-PET SUVmax; optimaler Schwellenwert für CT-morphologisch vergrößerte und nicht vergrößerte LK Quelle: Eigene Darstellung 83 4 Auswertung 4.3.3.4 OSEM 2i8s: SUVmax Für das OSEM 2i8s SUVmax-Rekonstruktionsprotokoll fand sich ein optimaler SUVCut-off-Wert mit minimaler FPR+FNR bei 2,7 SUV (SUV Cut-off: @2,5 – 2,7: Sensitivität: 68,5% - 66,7%; Spezifität: 87,3% - 91,8%; FNR: 31,5%- 33,3%; FPR: 12,7% - 66,7%; Accuracy: 83,6% - 86,9%; Prävalenz: 19,7%; n: 274). Das entsprechende Fehlerratendiagramm findet sich in Anhang 10. 4.4 Störfaktoren Während der manuellen SUV-Vermessung der LK und dem daraufhin folgenden Abgleich mit den Ergebnissen der Histologiebefunde waren immer wieder Patienten aufgefallen, deren mediastinalen LK-Metastasen weder visuell noch mit der SUVQuantifizierung im PET sicher beurteilbar waren. In dem nachfolgenden Kapitel wurden deshalb Störfaktoren für eine regelrechte Glukoseverteilung sowie deren Bedeutung für die SUV-Quantifizierung gesucht und analysiert. 4.4.1 Analyse auf signifikante Störfaktoren des SUV-Uptakes Zur Eingrenzung der Störfaktoren wurden die für den Glukosestoffwechsel relevanten Patienteneigenschaften auf ihren signifikanten Einfluss auf die Höhe des SUVUptakes von LK und Primarien mittels Mann-Whitney-U-Test untersucht. Wie in Tabelle 10 und 11 aufgeführt, konnten signifikante Unterschiede (p≤ 0,038) im SUV-Uptake von LK und Primarien zwischen initialen Glukosespiegeln von ≥150 mg/dl und <150 mg/dl im kapillarvenösen Blut vor Insulingabe, sowie einer daraus konsekutiven Insulingabe gefunden werden (Ausnahme: Insulingabe LK SUVmax OSEM 3i24s mit p=0,094). 84 4 Auswertung Tabelle 10: Signifikanzanalyse von potentiellen Störfaktoren auf einen regelrechten SUV-Uptake von LK mit Darstellung des Signifikanzniveaus p des Mann-Whitney-U-Tests für alle analysierten Rekonstruktionsprotokolle, n= 272/274 LK Faktor OSEM 3i24s SUVmax OSEM 3i24s SUVpeak OSEM 2i8s SUVmax OSEM 2i8s SUVpeak HD-PET SUVmax HD-PET SUVpeak Glukose >150mg/dla 0,038* 0,011* 0,008* 0,005* 0,025* 0,009* Diabetesb 0,313 0,085 0,014* 0,042* 0,069 0,039* BMI größer 35/30a 0,095/ 0,001* 0,806/ 0,923 0,926/ 0,934 0,430/ 0,729 0,064/ 0,106 0,810/ 0,990 Insulingabea 0,094 0,017* 0,026* 0,009* 0,068* 0,016* *signifikant mit p<0,05; an=274; bn=272 Quelle: Eigene Darstellung. Tabelle 11: Signifikanzanalyse von potentiellen Störfaktoren auf einen regelrechten SUV-Uptake von Primarien mit Darstellung des Signifikanzniveaus p des Mann-Whitney-U-Tests für alle analysierten Rekonstruktionsprotokolle OSEM 3i24s SUVmax OSEM 3i24s SUVpeak OSEM 2i8s SUVmax OSEM 2i8s SUVpeak HD-PET SUVmax HD-PET SUVpeak Glukose >150mg/dl 0,003* 0,003* 0,003* 0,003* 0,004* 0,005* Diabetes 0,848 0,725 0,854 0,979 0,982 0,860 BMI größer 35/30 0,327/ 0,923 0,159/ 0,945 0,132/ 0,814 0,123/ 0,814 0,354/ 0,989 0,206/ 1,000 Insulingabe 0,029* 0,031* 0,027* 0,031* 0,043* 0,054* Faktor *signifikant mit p<0,05 ;. n=69 Primarien Quelle: Eigene Darstellung. 4.4.2 Einfluss auf die SUV-Quantifizierung Die Boxplots der Abbildung 37 und 38 veranschaulichen die Auswirkungen eines signifikant geringeren 18 F-FDG-Uptakes in malignen LK bzw. Primarien bei initial hohen Glukosespiegeln von ≥150 mg/dl vor Insulingabe. Im normoglykämen Subkollektiv (Abb.37 links: blaue Box) zeigte sich die Box des 50% Quartil incl. des oberen 1,5 Interquartilabstands des SUV-Uptakes benigner LK überlagerungsfrei unterhalb des unteren 25% Quartils maligner LK (SUV benigner 85 4 Auswertung LK: 25-75%-Quartil: 2,50-3,52; Median: 2,93; MW: 3,15 // SUV maligner LK: 25-75%Quartil: 5,80-14,82; Median: 9,13; MW: 10,93). Im Subkollektiv mit initialen Glukosespiegeln ≥150 mg/dl (Abb. 37 links: grüne Box) konnten hingegen deutlich geringere Spannweiten des SUV-Uptakes maligner LK und eine Überschneidung mit den SUVs benigner LK nachgewiesen werden. Der obere Whisker benigner LK überragte mit einem SUV von 3,84 sogar das 50% Quartil maligner LK. Somit überlagerten sich mehr als 50% der SUV-Werte maligner LK mit den SUVs benigner LK. Der Abstand der 50% Quartil-Boxen benigner und maligner LK-SUVs betrug lediglich 0,05 SUV, so dass ein fließender Übergang der SUVs benigner und maligner LK zu beobachten war (SUV benigner LK: 25-75% Quartil: 1,94-2,74; Median: 2,43; MW: 3,14 // SUV maligne LK: 25-75% Quartil: 2,794,7; Median: 3,63; MW: 3,90). Abbildung 37: SUV-Uptake von LK in Abhängigkeit der Dignität und des initialen Glukosespiegels Quelle: Eigene Darstellung. Der gleiche Effekt ließ sich in der 18F-FDG-Aufnahme von Primarien bei Patienten mit initialen Glukosespiegeln ≥150 mg/dl in Abbildung 38 darstellen. Auch hier zeigte sich im initial hyperglykämen Subkollektiv eine geringere Spannweite des SUV-Uptakes mit insgesamt niedrigeren Uptake-Werten. Der SUV-Uptake von Primarien hyperglykämer Patienten lag hierbei im Bereich des unteren Quartils des SUV- 86 4 Auswertung Uptakes der Primarien initial normoglykämer Patienten (< / ≥ 150mg/dl: 25-75%Quartil: 10,21-26,265 / 6,155-12,25; Median: 18,61 / 7,58; MW:18,10 / 8,86; n= 61/9). Abbildung 38: SUV-Uptake von pulmonalen Primärtumoren in Abhängigkeit des initialen Glukosespiegels Quelle: Eigene Darstellung. Der initiale Glukosespiegel hatte keinen signifikanten Einfluss auf die CTmorphologisch bestimmte Größe der LK in ihrer kurzen/langen Achse. Dies unterstützt die Annahme einer homogenen Verteilung der LK-Eigenschaften innerhalb der normo- und hyperglykämen Subpopulationen (p=0,831/0,936). Auch der in Abbildung 37 rechts aufgetragen Boxplot bildete nahezu konstante Quartile bezüglich der Größe maligner bzw. benigner LK in Abhängigkeit des initialen Glukosespiegels ab. Ein optimaler Cut-off von ≥1 cm in der kurzen Achse wurde in diesem LK-Kollektiv auch für das Low-Dose-CT ohne Kontrastmittel bestätigt (@ 1 cm: Sensitivität: 68,5%; Spezifität: 80,0%, FNR: 31,5%; FPR: 20,0%; NPV: 91,2%; PPV: 45,7%; Accuracy: 77,7%; Prävalenz: 19,7%; n=274). 4.4.3 Einfluss auf die Trennschärfe 4.4.3.1 ROC- und AUC-Analyse bei initialem Glukosespiegel ≥150 mg/dl In der ROC-Analyse der SUV-Quantifizierungen konnten in allen Rekonstruktionsprotokollen für die Subpopulation mit initialen Glukosespiegeln ≥150 mg/dl ein Abfall der AUC unter das Niveau der CT-morphologischen Größenmessung 87 4 Auswertung in der kurzen Achse nachgewiesen werden (signifikant für OSEM 2i8s SUVmax und SUVpeak: p=0,0378 und p=0,0091; Prävalenz maligner LK: 36,7%; n=30) (siehe Abbildung 39 und Tabelle 12). Die AUC der OSEM 2i8s-Rekonstruktion sowie die AUC der beschriebenen Quotienten aus LK und Primarien wiesen keine signifikante Abweichung von der Fläche 0,5 auf (p=0,107 bis 0,983). Innerhalb der OSEM 3i24sund der HD-PET-Rekonstruktionen bildete sich ein Abfall der AUC um bis zu 16,7% bzw. 0,155, jedoch war dieser nicht signifikant (p>0,05). Innerhalb des hyperglykämen Patientenkollektivs wies SUVmax in HD-PET die höchste AUC sowie den geringsten Verlust der Trennschärfe von 3,58% gegenüber dem Gesamtkollektiv auf. Die in Tabelle 12 durchgeführten Quotientenbildungen aus SUVmax (HD-PET) von LK und Primarien führten zu einem signifikanten Abfall der AUC gegenüber der alleinigen LK-Quantifizierung (Differenz der AUC: 0,158 ±0,077; p=0,0413; n=30). Abbildung 39: ROC-Analyse für LK bei initialen Glukosespiegeln ≥150 mg/dl Diagonale Segmente ergeben sich aus Bindungen. Quelle: Eigene Darstellung. 88 4 Auswertung Tabelle 12: AUC-Analyse für LK bei initialen Glukosespiegeln ≥150 mg/dl Variable(n) für Testergebnis AUC Standard- Asymptotische fehlerb Signifikanzc 95%CI OSEM 3i24s SUVmaxa 0,756 0,096 0,021 0,567 -0,945 OSEM 3i24s SUVpeaka 0,754 0,103 0,023 0,552 - 0,955 OSEM 2i8s SUVmaxa 0,670 0,106 0,127 0,462 - 0,878 OSEM 2i8s SUVpeaka 0,612 0,106 0,312 0,405 - 0,819 HD-PET SUVmaxa 0,837 0,082 0,002 0,676 - 0,998 0,751 0,100 0,024 0,556 - 0,947 CT (kurze Achse)a 0,844 0,074 0,002 0,698 - 0,991 LK HD-PET SUVmax / Primarius HD-PET SUVmaxa 0,679 0,102 0,107 0,480 - 0,879 LK HD-PET SUVpeak / 0,502 Primarius HD-PET SUVpeaka 0,114 0,983 0,280 - 0,725 LK HD-PET SUVmax / Leber HD-PET SUVmaxa 0,117 0,683 0,226 – 0,684 HD-PET SUVpeak a 0,455 a Aus Subkollektiv mit initialem Glukosespiegel ≥150 mg/dl mit n=30 Unter der nichtparametrischen Annahme. c Nullhypothese: Wahrheitsfläche = 0.5 Quelle: Eigene Darstellung. b Mithilfe das Fehlerratendiagramms der Abbildung 40 konnte für die SUVmaxQuantifizierung in HD-PET auch in der Subpopulation mit initialen Glukosespiegeln ≥150 mg/dl der optimale Cut-off von 3,2 SUV bei niedriger FNR+FPR verbunden mit der höchsten Gesamtgenauigkeit nachgewiesen werden (@ SUV 3,2: Sensitivität: 72,7%; Spezifität 89,5%, FNR 27,3%; FPR: 10,5%; NPV: 85,0%; PPV: 80,0%; Accuracy: 83,3%; Prävalenz: 36,6%; n=30). Durch die höhere Prävalenz der LK-Metastasen von 36,7% waren die Zahlen der positiven und negativen Vorhersagewerte sowie die absoluten AUC-Werte jedoch nicht direkt auf das unselektierte Kollektiv übertragbar. 89 4 Auswertung Abbildung 40: Fehlerratendiagramm HD-PET SUVmax; LK von initial hyperglykämen Patienten mit einem Blutglukosespiegel von ≥150 mg/dl Quelle: Eigene Darstellung. 4.4.3.2 ROC- und AUC-Analyse bei initialem Glukosespiegel <150mg/dl Abbildung 41: ROC-Analyse für LK von Patienten mit initialem Blutglukosespiegel <150 mg/dl Quelle: Eigene Darstellung. 90 4 Auswertung Tabelle 13: AUC-Analyse bei LK mit initialem Glukosespiegel <150 mg/dl Variable(n) für Testergebnis OSEM 3i24s SUVmaxa AUC Standard- Asymptotische fehlerc Signifikanzd 95%CI 0,911 0,033 0,000 0,848 – 0,975 0,894 0,033 0,000 0,830 – 0,958 0,900 0,032 0,000 0,838 – 0,962 0,901 0,032 0,000 0,839 – 0,964 0,911 0,031 0,000 0,849 – 0,972 0,902 0,031 0,000 0,841 – 0,963 CT (kurze Achse) 0,820 0,034 0,000 0,754 – 0,885 LK HD-PET SUVmax / Primarius HD-PET SUVmaxb 0,853 0,033 0,00 0,788 – 0,918 LK HD-PET SUVpeak / 0,811 Primarius HD-PET SUVpeakb 0,035 0,000 0,741 – 0,881 LK HD-PET SUVmax / Leber HD-PET SUVmaxb 0,035 0,000 0,754 – 0,891 a OSEM 3i24s SUVpeak a OSEM 2i8s SUVmax OSEM 2i8s SUVpeak a a HD-PET SUVmax HD-PET SUVpeak a a 0,823 a+b Aus LK-Subkollektiv mit initialem Glukosespiegel <150 mg/dl mit n=241a + n= 240b c Unter der nichtparametrischen Annahme d Nullhypothese: Wahrheitsfläche = 0.5 Quelle: Eigene Darstellung. In der ROC- und AUC-Analysen der LK des Subkollektivs von Patienten mit initialen Glukosespiegeln unter 150 mg/dl (Abbildung 41 und Tabelle 13), erwies sich die OSEM 3i24s- und der HD-PET-Rekonstruktion mit der SUVmax-Quantifizierung gleich leistungsstark. Bei differenzierter Betrachtung der ROC-Kurve konnte jedoch durch den OSEM-Algorithmus in einem engen Intervall mittelhoher Sensitivitäten von 85% ±5% gegenüber HD-PET eine um ca. 13,6 Prozentpunkte höhere Spezifität erreicht werden (Spezifität bei einer definierten Sensitivität von 85%: OSEM 3i24s @SUVmax von 3,7: 89,1% // HD-PET @SUVmax von 3,5: 75,5%). Das Fehlerratendiagramm der HD-PET- und SUVmax-Quantifizierung in Abbildung 42 belegte für das Subkollektiv mit LK unter 150 mg/dl Glukose im Kapillarblut im Vergleich zu dem hyperglykämen Subkollektiv einen deutlich späteren Abfall der FNR+FPR mit negativen Peak um SUVmax von 4,7. Desweiteren zeigte sich ein späterer Anstieg der Accuracy mit Plateaubildung ab einem SUVmax von ebenfalls 91 4 Auswertung 4,7 (@ SUV 4,7: Sensitivität: 81,4%; Spezifität: 94,5%, FNR: 18,6%; FPR: 5,5%; NPV: 96,0%; PPV 76,1%; Accuracy: 92,2%; Prävalenz: 17,6%; n:244). Für den klinischen Einsatz - mit einer gewünschten hohen Sensitivität von über 90% bestätigte sich auch hier ein Cut-off von 3,2 SUVmax für die HD-PET (@ SUV 3,2: Sensitivität 93,0%; Spezifität: 62,7%, FNR: 7,0%; FPR: 37,3%; NPV: 97,7%; PPV: 34,8%; Accuracy: 68,0%; Prävalenz: 17,6%; n=244) Abbildung 42: Fehlerratendiagramm für HD-PET SUVmax; LK von initial normoglykämen Patienten mit einem Blutglukosespiegel von < 150mg/dl Quelle: Eigene Darstellung. Für die ROC-Analysen der SUV-Quotientenbildung aus LK und Primarius gegenüber LK und Leber konnten für die Rekonstruktionen HD-PET mit SUVmax folgende Ergebnisse zusammengefasst werden: In der Subpopulation mit Glukosespiegeln unter 150 mg/dl ergab der SUV-Quotient aus LK/Leber eine nicht signifikante und nur gering höhere AUC (Differenz der AUC: 0,035 ±0,0450; n=240; p=0,4410). In der Subpopulation mit Glukosespiegeln ≥150 mg/dl verursachte dagegen der Quotient aus LK/Leber gegenüber LK/Primarius einen hohen, jedoch nicht signifikanten Abfall der AUC (Differenz der AUC: 0,134 ±0,204; p=0,5106; n=30); In der 92 4 Auswertung Gesamtpopulation war der Abfall der AUC mit einer Differenz von 0,0603 ±0,0497 nur mäßig ausgeprägt und ebenfalls nicht signifikant (p=0,2256; n =270). Die Höhe des initialen Glukosespiegels beeinflusste zudem die Trennschärfe der Quotientenbildung aus LK- und Leber-SUV sehr stark. Im Kollektiv der LK hyperglykämer Patienten konnte so im Vergleich zur normoglykämen Gruppe ein signifikanter Abfall der AUC um 0,278 beobachtet werden (p=0,0228). 4.5 Validierung des Cut-offs durch patientenorientierte Analyse Zur Verifizierung des in der LK-Analyse berechneten optimalen SUV- Schwellenwertes wurde dieser für das N-Staging am Patientenkollektiv nach der aktuellen TNM-Klassifikation [21] angewandt. Für jeden Patienten wurde das SUVmax der für die N2- und N3-Stadium relevanten kontra- und ipsilateralen mediastinalen LK (nach der IASLC lymph node map von 2009 [100] entspricht dies den ipislateralen Zonen ≤9 oder einer beliebigen kontralateralen Zone) erhoben und mit den Ergebnissen der Histologie abgeglichen. Aus transbronchialen Biopsien wurden für das N-Staging nur histologisch und/oder zytologisch eindeutig maligne Proben gewertet, unauffällige Befunde konnten für das N-Staging nicht gewertet werden. Von 72 Patienten lagen bei 54 Patienten (334 mediastinale LK aus 145 mediastinalen LK-Zonen) eindeutige histo/zytologische Befunde dieser Zonen vor, dies entspricht im Mittel 2,7 analysierte LK-Zonen je Patient. Von 4 Patienten lagen keine, von 7 Patienten keine eindeutigen Ergebnisse der LK-Histologien aus den Zonen ≤ 9 vor. 12 negative transbronchial gewonnene Befunde durften nach den in der Methodik beschriebenen Kriterien nicht gewertet werden. 4.5.1 HD-PET: SUVmax Cut-off von 3,2 Durch den Einsatz des Cut-offs von 3,2 SUVmax in der HD-PET-Rekonstruktion konnte bei einer Prävalenz von 33,3% (18/54) für N2/N3-Stadien eine Sensitivität von 94,4% (17/18) und Spezifität von 52,8% (19/36), eine diagnostische Genauigkeit von 66,7% (36/54), einen positiven prädiktiven Wert (PPV) von 50,0% (17/34) und einen negativen prädiktiven Wert (NPV) von 95,0% (19/20) erreicht werden. Die falsch 93 4 Auswertung positiv Rate (FPR) betrug 47,2%, die falsch negativ Rate (FNR) war mit 5,6% die niedrigste unter allen Rekonstruktionsprotokollen. 4.5.2 HD-PET: SUVmax Cut-off von 4,7 Der nach der diagnostischen Gesamtgenauigkeit optimierte SUVmax Cut-off von 4,7 erreichte eine höhere diagnostische Genauigkeit von 87,0% (47/54), eine sehr hohe Spezifität von 94,4% (34/36) verbunden mit einem Absinken der Sensitivität auf 72,2%.(13/18). Der PPV betrug 86,7% (13/15) der NPV 87,2% (34/19), die Prävalenz ebenfalls 33,3% (18/54). Die FPR war mit 5,6% die niedrigste aller Rekonstruktionen, die FNR betrug 27,8%. 4.5.3 HD-PET: SUVmax Quotient LK/Primarius von 0,23 Die Quotientenbildung aus SUVmax LK/Primarius mit einem Cut-off von 0,23 führte zu einem Verlust an Sensitivität bei geringer Erhöhung der Spezifität (Sensitivität 87,5% (14/16); Spezifität 57,1% (20/35); diagnostische Genauigkeit 66,7% (33/51); PPV: 48,3% (14/29); NPV: 90,9% (20/22); Prävalenz 31,4% (16/51)). Die FPR betrug 42,9%, die FNR 12,5%. 4.5.4 OSEM 3i24s: SUVmax Cut-off von 4,0 Für den OSEM-Algorithmus in einer Rekonstruktion mit 3 Iterationen und 24 Subsets (OSEM 3i24s) und der SUVmax-Quantifizierung konnte in der patientenorientierten Analyse bei einem Cut-off von SUVmax = 4,0 eine Sensitivität von 83,3% (15/18) , eine Spezifität von 91,7% (33/36), eine diagnostische Genauigkeit von 88,9% (48/54) einen positiven prädiktiven Wert von 83,3% (15/18) und einen negativen prädiktiven Wert von 91,7% (33/36) bei einer Prävalenz von 33,33% (18/54) erreicht werden. Mit dem OSEM Cut-off von 4,0 SUV konnten unter allen analysierten Rekonstruktionsprotokollen die geringste summierte Fehlerrate aus FPR (8,3%) und FNR (16,7%) erreicht werden. 4.5.5 CT-morphometrisch ergänzter Cut-off der HD-PET von 3,2 SUVmax Um die Sensitivität und den NPV zu steigern, wurde die Größenbestimmung des LK in seiner kurzen Achse durchgeführt und bei Ausdehnungen ≥1 cm als Malignitätskriterium 2. Ranges einbezogen. Stellte sich der LK in der LK-Zone mit dem höchsten SUV-Uptake PET-negativ, jedoch CT-positiv dar, wurde diese 94 4 Auswertung insgesamt als positiv gewertet. PET-positive und CT-negative LK wurden aufgrund der höheren diagnostischen Genauigkeit des PET als positive gewertet. Die Überprüfung wurde aufgrund der höchsten Sensitivität mit der SUVmax- Quantifizierung in der HD-PET-Rekonstruktion und einem SUV-Schwellenwert von 3,2 durchgeführt. Durch die CT-morphometrischen Informationen erhöhte sich die Sensitivität auf 100% (18/18) und der positive prädiktive Wert auf ebenfalls 100% (16/16). Die Spezifität sank auf 44,4% ab (16/36). Die diagnostische Genauigkeit sank um 2 Trefferpunkte auf 62,9% (34/54). Der PPV betrug 47,4% (18/38), die Prävalenz 33,3% (18/54), die FPR 55,6% und die FNR 0%. Eine Übersicht der Testparameter auf LK- und Patientenebene findet sich in tabellarischer Form in Tabelle 18 der Diskussion. 4.6 Veränderung des N-Stadiums gegenüber visueller Auswertung Die Klassifizierung der LK-Metastasierung durch die SUV-Schwellenwerte erfolgte auch hier ebenfalls in ein N0/N1- sowie ein N2/N3-Stadium. In Tabelle 14 und 15 wurden die Raten für ein korrektes Up- und Downstaging gegenüber der visuellen Befundung - welche durch den Konsensus erfahrener Nuklearmediziner entstand aufgetragen. Als Referenzbefund diente die Dignitätseinteilung durch die Pathologie. Das N-Staging der visuellen Befundung durch die erfahrenen Nuklearmediziner konnte mit einer Sensitivität von 66,7% (12/18) bei einer Spezifität von 83,3% (30/36) angegeben werden (PPV: 66,7% (12/18); NPV: 83,3% (30/36); Accuracy: 77,8% (42/54); Pävalenz: 33,3% (18/54)). 95 4 Auswertung Tabelle 14: Veränderungen im N-Staging durch Anwendung der HD-PET SUVmax Cut-off Werte gegenüber der visuellen Auswertung durch erfahrene Nuklearmediziner Cutoff Upstaging Upstaging korrekt Downstaging Downstaging korrekt Up/DownStaging 22/54 (40,7%) Up/ DownStaging korrekt 8/22 (36,4%) SUV und visuell falsch 4/54 (7,4%) 3,2 19 5/19 (26,3%) 3 3/3 (100%) 3,2 +CT 23 7/23 (30,4%) 3 2/3 (66,7%) 26/54 (48,1%) 9/54 (16,7%) 3/54 (5,6%) 4,7 1 1/1 (100%) 4 4/4 (100%) 5/54 (9,3%) 5/5 (100%) 7/54 (13,0%) 4,7 +CT 4 2/4 (50,0%) 4 4/4 (100%) 8/54 (14,8%) 6/8 (75,0%) 6/54 (11,1%) Quelle: Eigene Darstellung. Tabelle 15: Veränderungen im N-Staging durch die Anwendung der OSEM 3i24s SUVmax Cut-off Werte gegenüber der visuellen Auswertung durch erfahrene Nuklearmediziner Cut-off 4,0 4,0 +CT Upstaging Upstaging korrekt Downstaging Downstaging korrekt Up/DownStaging 8/54 (14,8%) Up/ DownStaging korrekt 7/8 (87,5%) SUV und visuell falsch 5/54 (9,3%) 4 3/4 (75,0%) 4 4/4 (100%) 7 4/7 (57,1%) 3 3/3 (100%) 10/54 (18,5%) 7/10 (70,0%) 1/54 (1,9%) Quelle: Eigene Darstellung. Hervorzuheben waren hierbei die hohen Veränderungen der Stadieneinteilungen bei niedriger Trefferquote durch den Cut-off von 3,2 SUV in HD-PET gegenüber der hohen Trefferrate für korrekte Veränderungen des N0/N1- und N2/N3-Stadiums durch den Cut-off von 4,7 in der HD-PET-Rekonstruktion. Die OSEM 3i24s-Rekonstruktion zeigte sich mit einem Cut-off von 4,0 und den CTmorphometrischen Kriterien als gute Ergänzung zu der visuellen Auswertung. Hier konnten in nur 2% der Fälle weder durch die visuellen noch durch die SUV-Kriterien das N-Stadium korrekt klassifiziert werden. 96 4 Auswertung Die zusätzliche CT-morphologische Größenbestimmung führte für alle untersuchten Rekonstruktionen zu einer leichten Erhöhung der Staging-Veränderungen sowie zu einem Abfall der korrekten Up-/Downstagingraten. Das Downstaging konnte bis auf einen, durch den CT-morphometrisch suspekt eingeteilten LK, in 100% der Fälle durch die Anwendung des SUV Cut-offs in allen Rekonstruktionen korrekt durchgeführt werden. 4.7 Testqualität der Referenzmethoden Es wurden per (Ultraschall gesteuerter) transbronchialer Feinnadelpunktion 50 LKZonen biopsiert, wovon in nur 30 Proben eine repräsentative und eindeutige histologisch oder zytologische Aufarbeitung möglich war. Dies entspricht einer Erfolgsquote für eine erfolgreich biopsierte LK-Zone von 60%. 3 aus 30 dieser biopsierten LK-Zonen wurden innerhalb von maximal 6 Wochen bei nachfolgenden Operationen exstirpiert und erneut histologisch aufgearbeitet. Ein daraus resultierendes patientenbezogenes N-Staging zeigte gegenüber der Operation als Referenzmethode eine diagnostische Genauigkeit von 66,6% (2/3). Der einzige doppelt histologisch aufbereitete maligne LK wurde per transbronchialem Verfahren nicht erkannt, konnte jedoch durch das HD-PET mit dem SUVmaxSchwellenwert von 3,2 als maligne detektiert werden. 97 5 Diskussion 5 Diskussion 5.1 Zusammenfassung der Hauptergebnisse Die Analysen der vorliegenden Arbeit zeigen, dass die Höhen der SUVQuantifizierungen deutlich und signifikant von dem verwendeten Rekonstruktionsalgorithmus sowie der Quantifizierungsmethode abhängen. Die jeweiligen Messwerte korrelieren hierbei untereinander sehr stark, stimmen jedoch meist nur unzureichend überein. LK- und patientenorientierte Analyse Konsekutiv ist es sinnvoll, Rekonstruktionsalgorithmus für einen jede Quantifizierungsmethode individuellen und SUV-Schwellenwert für jeden die Klassifizierung der Dignität mediastinaler-LK anzuwenden. Die Quantifizierung von LK-Metastasen durch SUVmax erwies sich hierbei gegenüber SUVpeak bezüglich der Trennschärfe als überlegen. Die neue HD-PET-Rekonstruktion und die etablierte OSEM-Rekonstruktion mit 3 Iterationen und 24 Subsets zeigten sich in ihrer Leistungsfähigkeit hierbei nahezu identisch. Für HD-PET konnte ein SUVmaxSchwellenwert von 3,2 mit sehr hoher Sensitivität sowohl in CT-morphometrisch vergrößerten als auch in normal großen LK definiert werden. Die höchste diagnostische Genauigkeit der HD-PET ergab sich bei einem SUVmax Cut-off von 4,7. Die höchste diagnostische Gesamtgenauigkeit und die niedrigsten Fehlerraten der OSEM 3i24s-Rekonstruktion konnten bei einem Schwellenwert von 4,0 SUV erreicht werden. OSEM 3i24s zeichnete sich mit diesem Schwellenwert gegenüber der HD-PET mit den im Vergleich insgesamt geringeren Fehlerraten aus. Die Anwendung der Cut-off-Werte führte bei korrekten Downstagingraten von 100% gegenüber der visuellen Interpretation retrospektiv zu mindestens gleichwertigen Testparametern. Die Kombination aus quantitativen Cut-off-Wert und der Größeninformation aus der CT steigerte die Sensitivität und den NPV für LKMetastasen in HD-PET auf 100%. Eine Relation des LK-Uptakes zum Leber-Uptake konnte zu keiner Verbesserung der Trennschärfe führen und zeigte sich bei hohen Blutglukosewerten als zu unsicher. Die Quotientenbildung aus LK und Primarius konnte in der LK-orientierten Analyse die Spezifität im Bereich hoher Sensitivitäten stark verbessern, im abschließenden patientenorientierten Staging spiegelte sich dieser Vorteil jedoch nicht wieder. 98 5 Diskussion SUV-Konkordanzanalyse Wurde das Quantifizierungsverhalten der verschiedenen Rekonstruktionsalgorithmen und Quantifizierungsmethoden per se betrachtet, so wurden für LK und Primarien in den HD-Rekonstruktionen signifikant höhere SUVs berechnet als durch den OSEMAlgorithmus. Innerhalb der OSEM-Rekonstruktionen stieg der SUV mit der Anzahl angewandter Iterationen und Subsets. Zudem bestätigte sich die Hypothese, durch die SUVmax-Quantifizierung einen signifikant höheren Uptake als durch SUVpeak zu messen, wobei der Einfluss Rekonstruktionsalgorithmus der SUV-Quantifizierungsmethode überwog. Insgesamt zeigten sich den des für die Uptakebestimmungen zwischen den untersuchten Quantifizierungsmethoden trotz hoher Korrelation starke systematische Abweichungen und Verzerrungen mit einer Zunahme der absoluten Streuung bei hohen SUV-Werten. Die routinemäßige Verwendung eines Korrekturfaktors für die Glättung der Messunterschiede zwischen den unterschiedlichen Rekonstruktionsprotokollen erschien aufgrund der hohen Standardabweichungen für den klinischen Einsatz als zu ungenau. Mussten UptakeWerte trotzdem rekonstruktionsalgorithmusübergreifend verglichen werden, zeigte sich für die SUVpeak-Quantifizierung die höchste Persistenz. Wurde ein Verlauf von OSEM 3i24s rekonstruierten SUVmax-Werten mit Aufnahmen aus HD-PETScannern beurteilt, zeigte sich für letztere die SUVpeak-Quantifizierung am vergleichbarsten. Hierbei führte die Subtraktion eines Korrekturwertes von 1,2 SUV für LK (1,1 für Primarien) von den OSEM 3i24s SUVmax-Messwerten mit einer Standardabweichung von ±1 SUV im Mittel zu den entsprechenden Werten der SUVpeak-Quantifizierung in der HD-PET. Die in dieser Studie beobachteten kleinen LK (<1 cm) zeigten in allen Rekonstruktionen einen signifikant niedrigeren SUV-Uptake als vergrößerte. Hierbei war bei benignen LK nur ein geringer SUV-Anstieg bei ansteigender Lymphknotengröße zu beobachten. Maligne LK wiesen jedoch eine Zunahme des SUV bis rund 1,5 cm in kurzer Achse auf, danach kam es zu einem tendenziellen Abfall der 18 F-FDG Aufnahme. Insgesamt waren jedoch eine hohe Streuung und keine lineare Korrelation aus LK-Größe und der SUV-Aufnahme zu erkennen. Der initiale Blutglukosespiegel vor einer etwaigen Insulingabe stellte sich als relevanter Einflussfaktor für eine regelrechte 18 F-FDG-Aufnahme dar. Ein Spiegel von ≥150 mg/dl am Untersuchungstag führte bei LK und Primarien zu Uptake-Werten 99 5 Diskussion im Bereich des unteren Quartils von vergleichbaren normoglykämen Patienten. Die daraus folgende Überschneidung mit benignen LK senkte die Detektionsrate der PET unter die der CT-morphologischen Größenmessung. Hiervon waren die Rekonstruktionen mit niedrigem Iterationsäquivalent am stärksten betroffen, die HDPET am geringsten. 5.2 Diskussion des Patientenkollektivs und der Methoden Für die Diskussion der vorliegenden Arbeit wurden bezüglich der Methodik und Prävalenz maligner LK vergleichbare Studien ausgewählt und in Tabelle 16 und 17 zusammengefasst. Deren Prävalenz eines N2/N3-Stadiums war im Median mit 35% gegenüber den eigenen Daten von 33,3% nahezu identisch. Ebenfalls zeigten sich in den vergleichbaren Studien die Zusammensetzungen des Alters im Median mit 64 Tabelle 16: Patientenzusammensetzung vergleichbarer Untersuchungen Autor Reverenzmethode Max. Glukosespiegel (mg/dl) Anzahl Patienten/ LK Anteil Männer Mittleres Alter (Jahre) Intervall PET–Biopsie (Tage) Bryant et al. (2006) 397/ 1252 63% 67b - OP, MSK, VATS, EUSFNA - Hellwig et al. (2007) 95/ 371 79% 62 ±9 3 ±9 MSK + OP 160 Perigaud et al. (2009) 51/ - 86% 67 31 ±15,8 OP + MSK 126 Nguyen et al. (2011) 42 / -a 71% 64 - „bioptische Sicherung“ 200 Li et al. (2013) 219 / - 55% 61 ±11 < 28 OP Hülsewede (2013) 69 / 351 77% 64 ±8,6 15 ±10 bis 27±8 MSK +OP 160 Lee et al. (2014) 104 / 372 61% 65 ±0,7 - OP - I11,99 ±11,51I OP + MSK + EBUS Biopsien 160d (MW: 116,97 ±35,95) Vorliegende Dissertation (2015) a 72 / 274 69% 59 ±10,5 keine getrennte Anzahl mediastinaler LK angegeben Prävalenz von Diabetes mellitus Typ2: 22,3% d Prävalenz von Diabetes mellitus Typ2: 20,8% Quelle: Eigene Darstellung. b c - Alter im Median c 100 5 Diskussion Jahren sowie der Anteil männlicher Patienten mit 67% als gut vergleichbar. Mit einer Anzahl von 72 Patienten und 274 analysierten LK-Regionen lag die vorliegende Arbeit etwas unterhalb des Medians der in Tabelle 16 aufgeführten vergleichbaren Arbeiten (im Mittel 95 Patienten und 371 LK). Bei der Patientenauswahl wurde strikt auf ein definiertes Intervall zwischen LKQuantifizierung und histologischer Sicherung von maximal 42 Tagen geachtet um ein Fortschreiten der Metastasierung in diesem Zeitraum auszuschließen. Somit konnte im Vergleich zu anderen Arbeiten die Standardabweichung im Untersuchungsintervall herabgesetzt werden. Tabelle 17: Untersuchungsprotokolle vergleichbarer Untersuchungen Autor Akquisition p.i. Dosis (MBq) Scanner Schwächun gskorrektur Rekonstruktionsalgorithmus CT-basiert Iterative Rekon. nicht näher bezeichnet Bryant et al. (2006) 60 min 555 GE Discovery LS PET-CT Scanner Hellwig et al. (2007) 90 min 250 ±20 Siemens ECAT ART Cäsium Punktquelle OSEM 2i8s Perigaud et al. (2009) 60 min 5-7 /kg KG GE Discovery LS PET/CT CT-basiert OSEM Nguyen et al. (2011) 60 min 5,2/ kg KG Philips Gemini + Gemini TF CT-basiert - Li et al. (2013) 60 min 3,7/ kg KG Gemini TF PET/CT CT-basiert - Hülsewede (2013) 90 min 250 ±20 Siemens CTI ECAT CäsiumPunktquelle OSEM 2i8s Lee et al. (2014) 60 min 370 Discovery STE PET/CT CT- basiert Iterative Rekon. nicht näher bezeichnet 90 min 3/ kg KG Siemens Biograph 40 PET/CT CT-basiert OSEM 2i8s, OSEM 3i24s, HD-PET Vorliegende Dissertation Quelle: Eigene Darstellung. 101 5 Diskussion 18 Die in diesem Studienprotokoll applizierte Aktivität des F-FDG-Tracers war mit 3 MBq je kg Körpergewicht im Vergleich zu den internationalen Studien im unteren Bereich. Der Einsatz von 3D-fähigen Scannern verringert jedoch die benötigte Aktivität, so dass laut Bundesamt für Strahlenschutz ein Referenzwert für die 3D 18FFDG-PET von 200 MBq angestrebt werden soll [122]. Die applizierte Aktivität lag damit zwischen den Empfehlungen des Bundesamt für Strahlenschutz[122] und den EANM Guidelines[123] (13,8 x Körpergewicht in kg/Zeit pro Bettposition in min) sowie der DGN-Leitlinien von 2006 [75] (350MBq). Die Verwendung höherer Aktivitäten in den Studien nach Bryant et al.[124], Perigaud et al.[125] und Nguyen et al.[126] kann jedoch zu einer höheren Detektionsrate und kürzeren Scanzeiten führen. Die Applikation von geringeren Aktivitäten kann hingegen die Strahlenexposition durch das Radiopharmakon senken und den ökonomischen Aufwand durch das preisintensive 18F-FDG minimieren. Im Gegensatz zu den Studien von Bryant et al.[124], Perigaud et al. [125], Nguyen et al. [126] Li et al.[127] und Lee et al.[128] wurde ein Start der Akquisition von 90 Minuten nach 18 F-FDG-Injektion gewählt. Ziel war es, die unterschiedliche 18 F-FDG- Kinetik von malignen gegenüber entzündlich veränderten Geweben für eine höhere Trennschärfe auszunutzen. In den Studien, beispielsweise von Perigaud et al. [125] und Nguyen et al. [126] waren inflammatorisch veränderte LK häufig mit falsch positiven Ergebnissen assoziiert. Insbesondere in der SUV-Quantifizierung führten so hohe 18F-FDG-Uptakes entzündlich veränderter LK zu starken Überschneidungen mit den Uptake-Charakteristika von Lymphknotenmetastasen. Yamada et al.[129] beschrieben bereits 1994 einen Rückgang des Entzündungen ab 60 Minuten nach 18 F-FDG-Upaktes in akuten 18 F-FDG-Tracerinjektion. Zhuang et al.[130] zeigten in ihrer Arbeit hingegen einen stetigen Anstieg des SUV-Uptakes in verschiedenen Tumoren sowohl in der Zellkultur, im Tiermodell als auch auf Patientenebene für einen Zeitraum von über 90 Minuten bei gleichzeitigem Abfall in entzündlichen Läsionen. Diverse weitere Arbeiten legten auch für maligne pulmonale Rundherde einen signifikant stärkeren Anstieg der 18 F-FDG-Aufnahme bei gleichzeitigem Abfall in benignen Läsionen dar [131] [132]. Zudem wurden 2008 durch Shinya et al.[133] eine signifikant höhere Steigerung der 18 F-FDG- Traceraufnahme in LK-Metastasen von NSCLC-Patienten gegenüber unauffälligen und entzündlichen mediastinalen LK für einen Zeitraum von >60 Minuten p.i. verifiziert. Ein optimales Kontrastverhältnis zwischen fokalen Läsionen zu 102 5 Diskussion mediastinalem Hintergrund wurden von Pieterman et al.[134] ebenfalls für ein Intervall innerhalb der ersten 90 Minuten p.i. beschrieben [134]. Das vorliegende Studienprotokoll sollte diese 18 F-FDG-Kinetik zu berücksichtigen, wich deshalb für die speziellen Fragestellungen dieser Arbeit von den Leitlinien ab und orientierte sich an dem von Hellwig et al. 2007 durchgeführten Akquisitionsbeginn von 90 Minuten nach 18 F-FDG Applikation [97]. Zu klären bleibt, ob die SUV-Quantifizierung in dynamischen PET-Aufnahmesequenzen durch die Implementierung der 18 F-FDG- Kinetik als eigenständigen Faktor in der Beurteilung der Malignität zu einer signifikanten Erhöhung der Detektionsrate von LK-Metastasen beitragen kann. Bis auf die Arbeiten von Hellwig et al.[97] und Hülsewede[98] wurden alle aufgeführten Studien an einem PET/CT-Scanner mit CT-basierter Schwächungskorrektur durchgeführt. Durch die Zusatzinformationen der CT konnten die in den Operations- und Eingriffsberichten erwähnten anatomischen Strukturen für die SUV- Quantifizierung aufgesucht und die VOI exakt in die richtige LK-Zone platziert werden. Für jeden betrachteten LK konnte auf diese Weise eine Plausibilitätsprüfung durchgeführt werden, inwiefern dieser mit dem jeweiligen Biopsieverfahren erreicht werden konnte. Mittels der CT-morphometrischen Informationen konnte in der statistischen Auswertung zudem die 18 F-FDG Aufnahme in Abhängigkeit der LK-Größe untersucht sowie die Leistungsfähigkeit eines leitliniengerechten Ausschlusses von LK-Metastasen durch die Malignitätskriterien der PET und CT evaluiert werden [96]. Im Vergleich zu den anderen Arbeiten, beispielsweise von Hellwig et al.[97], wurden die LK nicht visuell durch einen erfahrenen Nuklearmediziner/Radiologen in mehrere Kategorien für einen Score eingeteilt, sondern ausschließlich retrospektiv anhand des schriftlichen Befundes und des eingeteilten N-Stadiums in einem patientenorientierten N-Staging mit den Ergebnissen der SUV-Quantifizierung analysiert [97]. Die statistische Konkordanzanalyse Auswertung der dieser Arbeit verbindet SUV-Quantifizierungen aus eine ausführliche verschiedenen Rekonstruktionsprotokollen mit einer LK- und patientenorientierten Analyse zur Validierung der gefundenen SUV-Schwellenwerte. Im Gegensatz zu den Arbeiten von Knäusl et al.[99] konnte die Konkordanzanalyse an in vivo quantifizierten Objekten in Form von LK und Primärtumoren mit bekannter Histologie und Größe 103 5 Diskussion durchgeführt werden und beschränkte sich somit nicht auf Messungen von avitalen geometrischen Objekten im Phantom. Diese Ergebnisse und die Kenntnisse des Quantifizierungs-Verhaltens verschiedener Rekonstruktionsprotokolle in Abhängigkeit der 18 F-FDG-Aktivitätsanreicherung bildeten wiederum eine fundierte Grundlage für die Bewertung der SUV-Schwellenwerte. Somit war konträr zu den ausschließlich auf SUV-Schwellenwert fokussierten Arbeiten in Tabelle 16-18 eine Aussage über die Übertragung von Cut-off-Werten sowie die Vergleichbarkeit von SUVs zwischen verschiedenen Rekonstruktionsprotokollen möglich [97] [98] [124] [125] [126] [127] [128]. Im Gegensatz zu einer ähnlich umfassenden Konkordanz- und LK-orientierten Analyse von Lasnon et al.[135] wurden die vermessenen LK-Regionen zu 100% durch eine eindeutige Histo/Zytologie in ihrer Dignität klassifiziert. Desweiteren wurde zusätzlich die SUVpeak-Quantifizierung mit in die Konkordanzanalyse und lymphknotenorientierte Analyse einbezogen [136]. Ergänzende Phantommessungen mit bekannten radioaktiven Aktivitäten wie in der Folgearbeit von Lasnon et al.[136] konnten in dieser Arbeit jedoch aufgrund der LK und patientenorientierten Auslegung nicht durchgeführt werden. In den letzten Jahren wurden ultraHD PET/CT-Scanner um die time of flight - Technik erweitert, die zusätzlich zur PSF das Signal-Rausch-Verhältnis verbessern soll [77]. Wenn diese Technik in Zukunft klinischen Einsatz findet, wäre in nachfolgenden Untersuchungen dessen Quantifizierungsverhalten im Vergleich zu den OSEM- und HD-PET-Rekonstruktionen zu analysieren und zu klären, ob die weitere Verbesserung der Bildqualität zu einer Steigerung der Detektionsrate maligner LK führen kann. 5.3 Diskussion der Ergebnisse Voraussetzungen für die Definition eines SUV-Schwellenwertes In den 274 analysierten mediastinalen LK-Regionen wiesen metastasierte LK in allen verwendeten Rekonstruktionen einen signifikant höheren SUV als benigne LK auf. Hierbei zeigte sich eine nur geringe Überschneidung in den absoluten SUV-Werten. Eine weitere Unterteilung in Subgruppen aus anthrakotisch- und anthrakosilikotisch veränderten LK anhand des Uptake-Spektrums war aufgrund einer nicht signifikanten 104 5 Diskussion SUV-Erhöhung nicht möglich. Die genaue Aufarbeitung der Präparate von benignen LK sowie die hohe Anzahl von anthrakotischen und anthrakosilikotischen LK führten zu einer fundierten Aussage in der Differenzierung benigner LK. Die saarländische Bergbau- und Schwerindustrie kann hierbei unter anderem als wichtige Ursache der hohen Prävalenz von Partikeln in mediastinalen LK genannt werden [137]. Shim et al.[138] fanden jedoch in anthrakosilikotisch veränderten LK eine wichtige Ursache für viele falsch positive Befunde in der SUV-Quantifizierung bei vergleichbar hoher Prävalenz von rund 10%. In Fallberichten wird sogar von einer anthrakosilikose bedingten 18 F-FDG-Aufnahme in Höhe des doppelten SUV-Schwellenwertes berichtet [139]. Unter Betrachtung des Aufnahmeprotokolls wird jedoch ersichtlich, dass Shim et al.[138] die Akquisition bereits 45 min post 18 F-FDG injectionem und somit 45 Minuten früher als in dieser Arbeit starteten [138]. Shinya et al.[133] beschrieben in ihrer Arbeit einen Abfall der 18 F-FDG-Konzentration entzündlicher mediastinaler LK bereits 60 Minuten nach Injektion und somit im Intervall zwischen den beiden Aufnahmezeitpunkten. Dies führt zu der Hypothese einer teilweisen Auswaschung des Tracers zum Aufnahmezeitpunkt nach 90 Minuten, so dass im Gegensatz zu einer Akquisition nach 45 Minuten kein signifikant höherer SUV-Uptake in diesen LK mehr zu beobachten war. Gleiches konnte auch in entzündlich veränderten LK beobachtet werden. Diese unterschieden sich in dem vorliegenden LK-Kollektiv 90 Minuten nach 18 F-FDG-Tracerinjektion ebenfalls in der SUV-Quantifizierung gegenüber unveränderten LK nicht signifikant. Aufgrund der niedrigen Anzahl von nur 4 entzündlichen LK ist diese berechnete Signifikanz jedoch statistisch nur bedingt aussagekräftig. Auch in vorangegangen Arbeiten von Hellwig et al.[97] und der Validierung dieser Ergebnisse durch Hülsewede [98] konnten 90 Minuten post injectionem ebenfalls nur geringfügig erhöhte Uptake-Werte in entzündlichen LK beobachtet werden. Perigaud et al.[125] sowie Nguyen et al.[126] schrieben hingegen bei Aufnahmen nach 60 Minuten inflammatorisch veränderten LK eine wichtige Ursache einer Uptake-Erhöhung und somit für falsch positive Befunde zu. Störfaktoren für eine regelrechte 18F-FDG-Aufnahme In dem untersuchten Patientenkollektiv führte ein initial erhöhter Blutglukosespiegel von ≥150 mg/dl - bei Patientenaufnahme am Untersuchungstag und vor Insulingabe 105 5 Diskussion in allen ausgewerteten Rekonstruktionsalgorithmen und Quantifizierungsmethoden zu einem signifikant geringeren SUV-Uptake von LK-Metastasen und deren pulmonalen Primärtumoren. Die Quotientenbildung aus LK zu Leber-Uptake zeigte sich durch einen ausgeprägten und signifikanten Abfall der Trefferrate hierfür besonders anfällig. Ein vergleichbarer Effekt zeigte sich durch die konsekutive Gabe von Insulin ebenfalls auf einem signifikanten Niveau. Das veränderte 18 F-FDG- Uptakeprofil maligner LK mündete dabei in einer konsekutiven Verschlechterung der Detektionsrate. Einflussfaktor Blutglukosespiegel Die Höhe des Glukosespiegels zum Zeitpunkt der 18 F-FDG-Applikation war hingegen ohne signifikanten Einfluss auf die Höhe des SUVs. Aufgrund des retrospektiven Studiendesigns war es jedoch nicht möglich dieselben Tumoren unter hyper- und normoglykämen Bedingungen zu quantifizieren. Lindholm et al.[140] zeigten dagegen ausführlich für Kopf-Hals-Tumore einen um bis zu 50% geringeren 18 F- FDG-Uptake identischer Läsionen bei hohen Glukosespiegeln vor und während der 18 F-FDG-Injektion. Diese Beobachtung konnte auf - von anderen Einflüssen isolierten - Zellkulturen verifiziert werden [141]. Auch im patientenangewandten Staging konnte retrospektiv eine in hyperglykämen Patienten signifikant höhere falsch negativ Rate festgestellt werden [142]. In der vorliegenden Arbeit sank die Detektionsrate des PETs im hyperglykämen Subkollektiv bis unter die Detektionsrate der reinen morphologischen Größenmessung durch das Low-Dose-CT ab. Eine SUVQuantifizierung der PET-Untersuchung verschlechterte somit sogar die geringe Genauigkeit des CT-morphometrischen Schwellenwertes von 10 mm und erscheint bei hyperglykämen Patienten als nicht sinnvoll. Konträr zu den in dieser Arbeit ermittelten Ergebnissen postulierte Roy et al.[143], dass der Einfluss des Glukosespiegels auf das SUV-Uptake vorrangig zur Injektionszeit entscheidend sei. Für den Einfluss des initialen Glukosespiegels fand er hingegen keine signifikante Relevanz [143]. Seine Arbeit berücksichtigte hier jedoch vor allem die 18 F-FDG- Verteilung im gesamten Körper, und die SUV-Unterschiede bezogen sich auf das Uptake der Skelettmuskulatur [143]. Die tumorale 18 F-FDG-Aufnahme wurde hingegen nicht per SUV-Quantifizierung analysiert [143]. Chronische Glukosestoffwechselstörungen wie in unserem Kollektiv in Form des Diabetes mellitus Typ 2 zu finden (Prävalenz in Patienten bzw. LK: 20,8% bzw. 106 5 Diskussion 22,2%), waren in der vorliegenden Arbeit ohne signifikanten Einfluss auf den 18 F- FDG-Uptake von LK und Primärtumoren. Torizuka et al.[141] fanden hier, im Gegensatz zu den oben beschriebenen kurzzeitigen Hyperglykämien, ebenfalls keine Signifikanz für chronische Hyperglykämien, wie sie in schlecht eingestellten Diabetes-Patienten zu finden sein können. Auch in dem vorliegenden Kollektiv konnten keine signifikanten Veränderungen im Tumor- sowie im LK-Uptake bei Diabetes mellitus Typ II-Patienten festgestellt werden. Dieses Ergebnis wird auch auf zellulärer Ebene gestützt, wo selbst sehr hohe stetige Glukosespiegel keinen Einfluss auf die SUV-Aufnahme von Adenokarzinomzellen zeigten [141]. Auch Rabkin et al. [142] fanden in ihrer retrospektiven Studie für das 18 F-FDG-PET keinen signifikanten Einfluss von Diabetes per se für falsch negative Ergebnisse in der Tumorsuche. Einflussfaktor Insulin Neben der initialen Hyperglykämie führte auch die Insulingabe zu einem signifikant niedrigeren SUV-Uptake von LK-Metastasen und deren Primärtumoren. Methodenbedingt erhielten jedoch auch alle Patienten mit Glukosespiegel über 160 mg/dl bis zur Unterschreitung dieser Grenze Insulingaben i.V. Die Einflussfaktoren des initialen Glukosespiegels und der Insulingabe waren somit miteinander verbunden. Roy et al. [143] konnten eine eindeutige 18 F-FDG Verteilungsstörung mit überhöhtem Muskeluptake nach einer hohen Insulingabe nachweisen, aber auch hier war die Insulingabe an einen hohen Glukosespiegel geknüpft. Die Häufigkeit dieser Verteilungsstörung war hier jedoch nicht von der Höhe der Insulingabe, sondern von der Höhe des Abfalls des Blutglukosespiegels abhängig [143]. Auch Minn et al.[144] zeigten eine signifikante Erhöhung des Muskeluptakes von Lymphompatienten nach einer Insulingabe. In den Lymphomen konnte sogar eine leichte Erhöhung der SUVs beobachtetet werden, ein signifikanter Einfluss auf die tumorale 18 F-FDG-Aufnahme konnte aber auch hier nicht nachgewiesen werden [144]. Auch Torizuka et al.[141] berichteten von einer Erhöhung des SUV-Uptakes von isolierten Adenokarzinomzellen durch die Insulingabe, da hierdurch der Glukosespiegel im Blut als kompetitiver 18 F-FDG-Antagonist gesenkt werden konnte. Da in Tumoren keine relevante Expression von insulinabhängigen GLUT4-Rezeptoren nachgewiesen werden kann, ist eine etwaige Veränderung des tumoralen Uptakes auch auf theoretischer Ebene auf eine verstärkte 18 F-FDG-Umverteilung zu von GLUT4107 5 Diskussion exprimierenden Geweben wie Muskel, Myokard und Fettgewebe anzunehmen [69] [70]. Eine wie von Roy et al. [143] beschriebene 18F-FDG Verteilungsstörung kann so im Extremfall einen Tumor zudem in der visuellen Auswertung überlagern. Ein höherer Korrelationskoeffizient legte in unserer Studie die Kausalität ebenfalls auf den initialen Glukosespiegel nahe. Auch waren vergleichbare 18 F-FDG- Verteilungsstörungen in unserem Patientenkollektiv weder visuell erkennbar, noch wurde der für eine regelrechte 18 F-FDG-Verteilung vorgeschlagene Mindestuptake der Leber unterschritten [143]. Einflussfaktor Gewicht Das Körpergewicht der Patienten zeigte in der vorliegenden Untersuchung einen signifikanten Einfluss auf das Leber-Uptake, wirkte sich jedoch nicht generell auf die SUV-Quantifizierung von LK-Metastasen aus. Eine Verschlechterung der Bildqualität durch eine vermehrte Schwächung und Streuung kann durch die Rekonstruktion kompensiert werden [135]. Zasadny et al.[145] beschrieben hierfür einen signifikanten Einfluss des Körpergewichtes auf die Höhe des SUVs von Organen wie Leber, Milz und Blut(gefäße). Durch die geringe Verhältnis zu Muskeln und 18 F-FDG-Aufnahme von weißem Fettgewebe im inneren Organen folgerten sie - durch die Mitberücksichtigung des Fettgewichts in der SUV-Berechnung - eine Überschätzung der SUV-Messungen um bis zum Faktor 2 gegenüber Patienten mit niedrigem Körpergewicht [145]. Pak et al. [146] bestätigten den Zusammenhang eines steigenden Leber-Uptakes in Abhängigkeit des Fettvolumens. Neben der Überschätzung durch die BMI und des viszeralen 18 F-FDG-Fehlverteilung durch das Fettgewebe kann auch eine chronisch entzündliche Komponente des Leberparenchyms - z.B. im Rahmen einer Steatosis hepatis - mit konsekutiver erhöhter Traceraufnahme Messunterschiede könnten diskutiert werden potentiell einen [146]. nicht Hieraus resultierende gewichtsnormierten SUV- Schwellenwert sowie einen SUV-Verlauf bei Gewichtsverlusten unter einer onkologischen Therapie beeinflussen [147]. Im Vergleich zu der Arbeit von Zasadny et al.[145] fand sich in dem vorliegenden Patientenkollektiv eine noch höhere Gewichtspanne mit rund 6% höherem mittleren Körpergewicht, bei insgesamt gemittelten grenzwertig präadipösen BMI [145]. Es 108 5 Diskussion zeigte sich auch in unserer Analyse eine mittlere bis starke Korrelation von Körpergewicht und Leber-Uptake (r bis 0,77) für alle Rekonstruktionsalgorithmen auf signifikantem Niveau (p<0,01). Eine Gewichtsnormierung auf die Körpergröße mittels BMI führte bei Werten von über 30 bzw. 35 kg/m2 jedoch zu keinem signifikanten Unterschied in der Höhe des SUVs im Vergleich zu normalgewichtigen Patienten. Ebenfalls fand sich kein signifikanter Einfluss auf die Trennschärfe von LK-Metastasen in den ROC-Analysen von Patienten mit einem BMI von größer bzw. kleiner 35 kg/m2 für SUVmax der HDPET- und OSEM 3i24s-Rekonstruktion (p=0,1975 bzw. p=0,1915). Folglich kann somit das gesteigerte Leber-Uptake neben der beschriebenen 18F-FDG-Umverteilung auch einer chronisch entzündlichen Veränderung des Leberparenchyms zugeschrieben werden [146]. Der in pharmazeutischen Fachinformationen bzw. Leitlinien empfohlene maximal zulässige Blutglukosespiegel von 120 mg/dl [67]. bzw. 150 mg/dl [76] sollte zugunsten einer hohen Detektionsrate und vergleichbarer standardisierter UptakeWerte nicht überschritten werden. Kann eine medikamentöse Insulinsenkung am Untersuchungstag nicht umgangen werden, sollte hier nach den gefundenen Ergebnissen und der Literaturrecherche ein Intervall von mindestens 60 Minuten zwischen Gabe von kurzwirksamen Insulin und 18 F-FDG, auch im Sinne einer regelrechten Tracerverteilung, eingehalten werden [143]. Konkordanzanalyse von Rekonstruktionsprotokollen In dem in dieser Arbeit untersuchten LK- und Patientenkollektiv zeigten sich bei der SUV-Quantifizierung identischer Objekte sehr starke Korrelationen, jedoch nur mäßige Übereinstimmungen Rekonstruktionsalgorithmen der sowie SUVs zwischen den verschiedenen SUV-Quantifizierungsmethoden in allen Kombinationen. Prieto et al.[148] postulierten anhand Untersuchungen am Phantom und Patienten mit Brust- und Lungenkarzinomen eine starke Abhängigkeit der berechneten SUVs durch das jeweilige verwendete Rekonstruktionsprotokoll. Gelee et al. [149] wiesen durch die Anwendung der point spread function signifikant höhere SUVs bei sehr starker Korrelation mit der OSEM-Rekonstruktion nach. Dies betrifft hierbei nicht nur die Implementierung der PSF durch den TrueX-Algorithmus, sondern auch Variationen von Iterationen und Subsets der OSEM-Rekonstruktion 109 5 Diskussion [99] [150]. Auch in der vorliegenden Arbeit unterschieden sich die Höhen der berechneten SUVs jeweils identischer Läsionen durch die Rekonstruktion mittels verschiedener Algorithmen signifikant voneinander. Durch die Untersuchung an einem größeren Patientenkollektiv mit im Vergleich 3 bis 10-facher Anzahl analysierter Objekte, sowie einer größeren Bandbreite an Läsionsgrößen, konnten wir diese Aussage auch für 18 F-FDG avide Läsionen, insbesondere für LK kleiner 10 mm, außerhalb eines Phantoms bestätigen [99] [148]. Dabei waren in allen fundierten Studien bei Anwendung der PSF gegenüber der konventionellen OSEM-Rekonstruktion systematische Abweichungen mit einer Tendenz zu höher berechneten 18 F-FDG-Aktivitäten zu beobachten. Diese betragen je nach Rekonstruktionsprotokoll, Studiendesign und Kollektiv für die SUVmaxQuantifizierung zwischen 20% und 48% [135] [136] [149] [150] [151]. Überraschenderweise führte die SUVmax- und SUVpeak-Quantifizierung von LK im Bereich kleiner SUVs (bis maximal 5) durch die HD-PET neben der Überschätzung auch regelmäßig zu einer Unterschätzung der Aktivität gegenüber der OSEM 3i24s SUVmax/peak um bis zu 20%. In der Quantifizierung größerer VOIs von Primärtumoren konnte dieser Effekt nicht beobachtet werden. Da Fehlplatzierungen der VOI durch die „copy VOI“ Funktion ausgeschlossen werden konnten, ist hier die Ursache vorrangig in den hohen Messschwankungen im Bereich niedriger SUVs und kleiner Objektgrößen zu suchen. Auf letztere wird in der weiteren Diskussion über das Quantifizierungs-Verhalten in Abhängigkeit der Objektgröße ausführlicher eingegangen. Dass diese systematischen Abweichungen in der SUVmax-Quantifizierung nicht durch einen einfachen prozentualen Korrekturfaktor ausgeglichen werden können, zeigte sich bereits in der prospektiven Studie von Lasnon et al. [135]. Zwar wurde auch hier eine starke Korrelation der OSEM- und HD-PET-Rekonstruktionen untereinander bestätigt, eine differenzierte Analyse der SUV-Paarungen zeigte jedoch hohe individuelle Schwankungen mit einem für den klinischen Einsatz zu breiten Übereinstimmungsbereich [135]. Im Sub-Zentimeterbereich verstärkten sich diese Schwankungen [99] [135]. Durch die zusätzliche Quantifizierung der pulmonalen Primärtumoren konnte die Quotientenbildung aus SUV-Uptakes unterschiedlicher Gewebe in dieser Studie über eine breitere Größen- und Aktivitätsspanne analysiert werden. Die Rekonstruktionen 110 5 Diskussion durch multiple Rekonstruktionsprotokolle aus jeweils einem Patientendatensatz des identischen PET-Scanners ermöglichten die Minimierung von Einflussfaktoren wie eine unterschiedliche Patientenvorbereitungen oder intra- sowie interinstitutionelle Aktivitätskalibrierungen auf die Konkordanzanalyse. Eine systematische Abweichung in der SUV-Berechnung zwischen nahezu allen Rekonstruktionsalgorithmen konnte auch hier an einem im Vergleich zu den aufgeführten Arbeiten etwas größeren LKKollektiv mit einem vielfachen an kleineren Läsionen für LK sowie zusätzlich für Primärtumoren bestätigt werden [135] [136]. Im Gegensatz zu den SUVmeanBerechnungen wurden hier neben der SUVmax- zusätzlich die SUVpeakQuantifizierungen durchgeführt, die vergleichbar mit den SUVmean-Analysen anderer Arbeiten, die Schwankungen zwischen den Rekonstruktionen aufgrund einer gemittelten Aktivitätsberechnung minimieren kann [92] [93] [94]. Konkordanzanalyse verschiedener SUV-Quantifizierungsmethoden Die Analysen zur SUV-Berechnung durch unterschiedliche Quantifizierungsmethoden bestätigten die durch die Art des Berechnungsverfahrens mathematische Hypothese, durch SUVpeak niedrigere Uptake-Werte als durch SUVmax zu berechnen [93] [152]. Der Betrag der Differenz der durch die unterschiedlichen Quantifizierungsmethoden berechneten Messwerte, zeigte sich in unserer Arbeit stark von der verwendeten Rekonstruktion und Aktivität abhängig. Das gemittelte Verhältnis zwischen SUVpeak und SUVmax betrug in diesem Kollektiv für LK ca. den Faktor 1,7 für die OSEM- bzw. den Faktor 1,8 für die HD-PETRekonstruktion (HD-PET SUVmax ≈ 1,8 x HD-PET SUVpeak bzw. OSEM 3i24s SUVmax ≈ 1,7 x OSEM 3i24s SUVpeak). Aktivitätsberechnungen durch SUVpeak zeigten dabei über verschiedene Rekonstruktionen hinweg eine höhere Persistenz. Dies gilt sowohl für die Analysen der vorliegenden Arbeit mit den Quantifizierungen aus OSEM- und den HD-PET, als auch in Bezug auf die neuen ultraHD-Scanner mit Implementierung der TOF-Technik [153]. Bei wiederholten Messungen zeigt sich die SUVpeak-Berechnung darüber hinaus mit deutlich geringeren Schwankungen, insbesondere bei schlechten Signal-Rausch-Verhältnissen, wie dies im klinischen Einsatz mit Ganzkörperprotokollen und relativ niedriger injizierter Aktivität sowie kurzen Akquisitionsszeiten zu finden ist [154]. Lodge et al. [154] folgerten hieraus einen Vorteil für die SUVpeak-Quantifizierung für multizentrische Studien, welche durch die vorliegende Konkordanzanalyse bestätigt werden konnte. 111 5 Diskussion Konkordanzanalyse kombinierter Rekonstruktionsprotokolle Die in dieser Arbeit durchgeführten Analysen konnten erstmals nachweisen, dass eine Anwendung der beschriebenen Effekte aus überschätzender Quantifizierung durch die HD-PET-Rekonstruktion in Kombination mit der VOI gemittelten SUVpeakQuantifizierung in einem Rekonstruktionsprotokoll (HD-PET SUVpeak), zu vergleichbaren Uptake-Werten der SUV-Quantifizierung in OSEM 3i24s SUVmax führen kann. Im Gegensatz zu einer, von Lasnon et al.[135] [136] bestätigten, prozentualen Abweichung der SUVmax-Quantifizierung zwischen der OSEM- und HD-PETRekonstruktion, verursachte die Verwendung der SUVpeak-Messung in HD-PET gegenüber der SUVmax-Quantifizierung in OSEM 3i24s auch bei steigenden Aktivitäten eine Abweichung der SUV-Werte um einen stetigen absoluten Betrag. Messschwankungen und Unterschiede in der SUV-Quantifizierung durch die Anwendung verschiedener Rekonstruktionsprotokolle oder Gerätefunktionen wie beispielsweise der PSF oder TOF spielen insbesondere bei der Anwendung von Schwellenwerten eine große Rolle. Dies beeinflusst unter anderem die Beurteilung der SUV-Berechnungen mit unterschiedlichen Scannern oder Untersuchungsprotokellen wie beispielsweise im langfristigen Therapieverlauf mit zwischenzeitlichem Scannerwechsel oder bei Beteiligung unterschiedlicher PET/CTs in multizentrischen Studien. Es zeigte sich darüber hinaus, dass die Bestimmung eines einfachen Korrekturfaktors zwischen verschiedenen Rekonstruktionsprotokollen für die SUVQuantifizierung mediastinaler LK aufgrund hoher Streuungen der einzelnen Messwerte - vor allem im niedrigen SUV-Bereich kleiner Objekte - nur im Mittelwert sicher möglich war. Eine individuelle Aussage auf Patientenebene war jedoch in unserer sowie in weiteren Arbeiten aufgrund der hohen Standardabweichung nur für wenige Kombinationen aus Rekonstruktionsalgorithmen und Quantifizierungsmethoden mit akzeptabler Genauigkeit möglich [135] [136]. Bei der Analyse von pulmonalen Primärtumoren zeigten sich Streuungen mit zunehmender Größe konvergent, so dass hier die Verwendung eines Korrekturfaktors weniger kritisch gesehen werden kann. Müssen OSEM 3i24s rekonstruierte SUVs nachträglich und ohne Möglichkeit einer einheitlichen Nachrekonstruktion aus den 112 5 Diskussion originalen Datensätzen mit Messungen aus HD-PET Scannern mit TrueX implementierten Algorithmen verglichen werden, empfehlen sich hierbei folgende Umrechnungen zwischen der HD-PET- und der OSEM-Rekonstruktion. Für den SUV-Uptake mediastinaler Lymphknoten: SUVmax(OSEM3i24s) ≈ SUVpeak(HD-PET) + 1,2 SUVpeak(HD-PET) ≈ SUVmax(OSEM3i24s) - 1,2 SUVpeak(OSEM3i24s) ≈ 0,95 x SUVpeak(HD-PET) SUVpeak(HD-PET) ≈ 1,05 x SUVpeak(OSEM3i24s) Für Lungenherde lauten die entsprechenden Formeln folgendermaßen: SUVmax(OSEM3i24s) ≈ SUVpeak(HD-PET) + 1,1 SUVpeak(HD-PET) ≈ SUVmax(OSEM3i24s) - 1,1 SUVpeak(OSEM3i24s) ≈ 0,87 x SUVpeak(HD-PET) SUVpeak(HD-PET) ≈ 1,15 x SUVpeak(OSEM3i24s) Die Ergebnisse der vorliegenden Arbeit unterstützen somit - insbesondere für multizentrische Studien – die von Boellaard et al. [123] postulierte Forderung nach: Einheitlichen Rekonstruktionsprotokollen, Harmonisierungen der Aktivitätsberechnung durch regelmäßige Qualitätskontrollen, Kalibrierungen und monatlichen Kreuzkalibrierungen sowie ggf. den Einsatz eines interinstitutionellen Recovery-Koeffizienten. Diese Anforderungen sind für intra- und interinstitutionell vergleichbare Aktivitätsmessungen essentiell und konnten bereits erfolgreich für NSCLC sowie deren Lymphknoten- und Fernmetastasen validiert werden [75] [76] [136] [155]. SUV-Quantifizierungs-Verhalten in Abhängigkeit der Aktivität und Objektgröße Durch die Quantifizierung von LK in allen Größenbereichen mit sowohl niedrigen als auch hohen Aktivitäten in benignen und malignen Geweben sowie der ergänzenden 113 5 Diskussion SUV-Berechnung von deutlich größeren Primärtumoren mit sehr hohen UptakeWerten, konnte durch die breite Fächerung von Messwerten eine umfassende Analyse zur SUV-Quantifizierung durchgeführt werden. LK standen hierbei mit einem histologisch bestimmten mittleren Größenbereich von 1,15 ±0,55cm exemplarisch für kleine Objekte. Es zeigte sich bei niedrigen Aktivitäten einerseits eine geringe absolute Differenz zwischen den SUV-Messungen der OSEM- und HD-PET-Rekonstruktion. Andererseits und konträr zu den Ergebnissen von Lasnon et al.[135] [136], konnten jedoch sehr hohe prozentuale Abweichungen in dem - besonders für den SUVSchwellenwert wichtigen - niedrigen 18 F-FDG-Aktivitätsbereich zwischen den SUV- Quantifizierungsmethoden und den Rekonstruktionsalgorithmen OSEM und HD-PET bei der Quantifizierung identischer Objekte festgestellt werden. Auch konnte keine homogene Verteilung der Differenzen der Messwerte über alle Aktivitätsbereiche, sondern ebenfalls eine starke Streuung im niedrigen SUV-Bereich nachgewiesen werden. Auch zwischen den Quantifizierungsmethoden war ein solcher Effekt messbar. Die Differenzen zwischen den SUVmax- und SUVpeak-Quantifizierungen betrugen so für einzelne Messwerte in den niedrigen SUV-Bereichen bis zu 140% ihrer Mittelwerte und machen somit einen Vergleich der SUV-Messwerte aus unterschiedlichen Quantifizierungsmethoden innerhalb eines Rekonstruktionsalgorithmus zu ungenau. Bei zunehmender Höhe der LK-SUVs ist in dieser Arbeit eine trichterförmige Annäherung der einzelnen Messdifferenzen an den Mittelwert der Differenzen zu erkennen. Trotz der generell höheren Differenz der Messwerte von LK-Uptakes in den Untersuchungen von Lasnon et al.[135] ist eine solche trichterförmige Tendenz - hypothetisch aufgrund weniger niedriger SUVUptake-Werte - in dessen Arbeit nicht zu erkennen [135]. Die geringe Anzahl niedriger SUV-Paarungen kann dort vermutlich auf die sehr hohe Prävalenz von LKMetastasen zurückgeführt werden, die in der Regel einen signifikant höheren 18 F- FDG-Uptake aufweisen [68] [69] [97] [135]. Zusätzlich wird durch die graphische Ausspielung visuell eine sehr gleichförmige Streuung vermittelt, anhand des Übereinstimmungsbereiches kann jedoch im Vergleich zu den Daten deren Arbeit insgesamt eine deutlich höhere Streuung ausgemacht werden. In der darauffolgenden Arbeit von 2013 [136] sind - im Abgleich mit ihrer Vorarbeit aus dem Jahr 2012 [135] - an einem neuen Patientenkollektiv deutlich mehr niedrige SUVPaarungen aus OSEM- und HD-PET-Rekonstruktionen bei vergleichbarem 114 5 Diskussion Übereinstimmungsbereich und identischer mittlerer Verhältnisse vorhanden [136]. Auch hier bildet sich im Gegensatz zu den vorliegenden Ergebnissen dieser Dissertation erneut eine über alle SUV-Beträge gleichförmige Streuung ab. Durch die Mischung aus großen Primärtumoren und kleinen mediastinalen LK ist deren Arbeit jedoch ebenfalls für eine gezielte Analyse von LK-Uptakes nur eingeschränkt aussagekräftig [135] [136]. Darüberhinaus konnte die vorliegende Arbeit durch die Auftragung der Verhältnisse von SUV-Messungen zwischen den Rekonstruktionsalgorithmen OSEM und TrueX (HD-PET) gegen die LK-Größe eine hohe Streuung der SUV-Quantifizierung im SubZentimeterbereich mit anschließender Fokussierung auf ein festes Verhältnis nachweisen. Die insgesamt größeren Primärtumore zeigten hingegen eine gleichförmige Streuung mit geringerer Standardabweichung der SUV-Verhältnisse zwischen der HD-PET- und der OSEM-Rekonstruktion, was die Hypothese einer zusätzlichen Abhängigkeit der Differenz der SUV-Messwerte von der Objektgröße folgern lässt. In dem LK-Kollektiv von Lasnon et al. [135] aus der Arbeit von 2012 konnte ebenfalls ein geringer, jedoch signifikanter Unterschied in der Streuung von SUV-Werten von LK größer und kleiner 1 cm in der kurzen Achse nachgewiesen werden. Auch in Bezug auf die wahre Aktivität führen kleine Objektgrößen zu größeren Abweichungen sowie zu der Tendenz, das SUV-Uptake u.a. aufgrund des Partialvolumeneffektes zu niedrig zu quantifizieren [148]. Die Hypothese wird ebenfalls durch die Arbeit von Gelle et al. [149] gestützt, da auch sie gegenüber den in der Regel deutlich kleineren LK in pulmonalen Primarien geringere Divergenzen der standardisierten UptakeWerte zwischen den OSEM- und HD-Rekonstruktionen nachweisen konnten. Da die Primarien, unabhängig von der Höhe des SUV, eine gleichförmig prozentuale Streuung zeigen, kann dies zu einer Glättung des von Lasnon et al.[136] im Jahr 2013 vorgestellten oben beschriebenen Streuungsdiagramms bei einem hohen Anteil an Primärtumoren führen [149]. In Bezug auf die wahre Aktivität konnten Knäusl et al. [99] 2012 sowohl für den OSEM- als auch den HD-PET-Algorithmus eine exponentielle Abweichung bei kleiner werdenden Objektgrößen nachweisen. Es wurden zwar keine direkten Korrelationen zwischen den Rekonstruktionen berechnet, bei genauerer Betrachtung der Abweichungen von der wahren Aktivität ist jedoch eine Divergenz des Kurvenverlaufs 115 5 Diskussion der Korrekturfaktoren für OSEM und HD-PET bei abnehmender Größe zu erkennen [99]. Die zusätzlich beschriebene größere SD des Korrekturfaktors für kleine Volumina lässt auf eine progrediente Streuung der SUV-Quantifizierungen um die wahre Aktivität bei kleiner werdenden Objekten folgern [99]. Werden die gleichförmigen Streuungen der SUV-Messwerte aus OSEM und HD-PET über alle Aktivitätsbereiche in den Arbeiten von Lasnon et al.[135] [136] im Hinblick auf die beschriebenen Effekte erneut betrachtet, stellt sich die Vermutung, dass dort insgesamt größere VOIs, z.B. in kompletter LK-Region platziert worden sind. Die Quantifizierung eines größeren Volumens würde zu einer konstanteren Streuung wie in der vorliegenden Primarienanalyse sichtbar - bei einer insgesamt höheren absoluten SUV-Differenz führen. 18 F-FDG-Uptake von LK in Abhängigkeit der Größe und Dignität Metastasenfreie Lymphknoten zeigen in der vorliegenden Untersuchung einen geringen wenn auch signifikanten linearen SUV-Anstieg bei zunehmender Größe. Lymphknotenmetastasen hingegen zeigen eine starke Zunahme der 18 F-FDG- Aufnahme bei Größenprogredienz mit anschließendem Abfall ab einem Bereich von 1,5 cm mit insgesamt sehr hoher Streuung und ohne signifikante Korrelation oder Regression. Zu berücksichtigen ist hierbei, dass das PET bei kleinen Objekten im SubZentimeterbereich aufgrund u.a. des Partialvolumeneffektes dazu neigt, die wahre Aktivität zu unterschätzen [92] [99]. So zeigten Knäusl et al. [99] in einem Phantom mit multiplen 18 F-FDG gefüllten Kugeln, dass die SUVmax-Quantifizierung in der HD- PET-Rekonstruktion zu einer Unterschätzung des SUVs im Bereich kleiner Objekte und anschließender Überschätzung der Aktivität mit Maximum im Bereich von 2-3 ml führt. Bei größer werdenden Objekten konnte eine Annäherung an die wahre Aktivität festgestellt werden [99]. Durch die Phantommessungen sind die Größen und die wahren Aktivitäten hierbei im Vergleich zu den vorliegenden Patientendaten exakt bestimmbar und Berechnungsfehler der Objektgrößen im Vergleich zum Low-DoseCT ausgeschlossen [99]. Eine direkte Übertragung der Phantommessungen auf die Patientenebene kann jedoch aufgrund diverser biologischer Einflussfaktoren nicht ohne weiteres getätigt werden [67] [68] [69]. 116 5 Diskussion Werden diese Ergebnisse mit den in dieser Arbeit durchgeführten Messungen maligner LK diskutiert, fand sich analog im Größenbereich von 1,5 cm Durchmesser, die bei ellipsoidem VOI einem Volumen von ca. 2 ml entspricht, die höchste Aktivität mit Abfall in beiden Richtungen [99]. Auch Prieto et al.[148] konnten in Kugeln mit 15mm Durchmesser die stärkste Überschätzung der wahren Aktivität durch die SUVmax-Quantifizierung erkennen und zudem große Schwankungen im SubZentimeterbereich nachweisen. Gegen eine rein messtechnische Beeinflussung des Kurvenverlaufs spricht jedoch der starke Abfall des SUVs bei weiter zunehmender Größe. Bei Phantommessungen anderer Arbeiten war hier ein Streben gegenüber der wahren Aktivität ab Volumina von 6 ml bzw. Kugeln mit 20 mm Durchmesser zu erkennen [99] [148]. In dem Kurvenverlauf der vorliegenden Arbeit kam es jedoch zu einem progredienten Abfall der berechneten 18 F-FDG-Aktivität bei Größenzunahme des Objektes. Auch die von Knäusl et al. [99] gemessene maximale Überschätzung von 10% ist als alleinige Ursache eines größenabhängigen Messfehlers der quantifizierten SUVs zu gering. Durch eine Aufsummierung mit weiteren Faktoren kann diese Schwankung jedoch noch verstärkt werden. Da auch der Kurve des durch die SUVpeak-Quantifizierung gemittelten Uptakes – welches in geringerem Ausmaß durch Messschwankungen und Überschätzungen der wahren Aktivität beeinflusst wird - einen vergleichbaren Verlauf zeigt, sind hier vielmehr biologische Ursachen für einen Abfall der maximalen und gemittelten Aktivität bei weiter zunehmender LK-Größe anzunehmen. Als biologische Ursachen können beispielsweise eine zunehmende (zentrale) Nekrosenbildung oder Minderperfusion in Lymphknotenbulks erwogen werden. Auch der annähernd lineare Kurvenverlauf von benignen LK über ein vergleichbares Größenintervall legt die Hypothese eines untergeordneten Einflusses der von Knäusl et al. [99] festgestellten Messschwankungen - mit einem Uptake-Maximum im Bereich von 1-1,5 cm Durchmesser - auf den in dieser Arbeit beobachteten Kurvenverlauf nahe. Der progrediente Einfluss des Partialvolumeneffektes mit Abflachung der SUVmax-Werte ist jedoch bei zunehmend kleiner werdenden LK-Metastasen zu berücksichtigen [92]. Aufgrund der technisch und physikalisch bedingten limitierten Auflösung der PETScanner treten diese bei sehr kleinen LK an die Grenzen ihrer Leistungsfähigkeit. Auch wenn in kleinen LK mittels der in dieser Arbeit definierten SUV-Schwellenwerte 117 5 Diskussion hohe Sensitivitäten erreicht werden können, sollte eine Aussage über die Höhe der 18 F-FDG-Aufnahme in LK im Sub-Zentimeterbereich somit immer kritisch in Bezug auf deren morphologische Größe beurteilt werden [99] [148]. Hier sind tendenziell höhere wahre Aktivitäten zu erwarten, so dass die Anwendung eines hohen SUVmax-Schwellenwertes dort zu einer erhöhten Rate an falsch negativen Befunden führen kann [99] [148]. Potentiell sinkende SUVs großer LK bzw. Lymphknotenkonglomerate sowie in Tumornekrosen können durch die computertomographische Beurteilung mit hoher Sensitivtät kompensiert werden [156]. Ermittlung eines Rekonstruktionsprotokolls mit der höchsten Trennschärfe in der SUV-Quantifizierung mediastinaler LK-Metastasen Im vorliegenden Kollektiv konnte durch die Kombination aus TrueX-Algorithmus der HD-PET-Rekonstruktion und der SUVmax-Quantifizierung die höchste Trennschärfe zwischen benignen und malignen LK erreicht werden. Eine signifikant höhere Leistungsfähigkeit konnte nur gegenüber der OSEM-Rekonstruktion mit niedrigem Produkt aus Iterationen und Subsets von 16 (2i8s) nachgewiesen werden. Die OSEM 3i24s-Rekonstruktion zeigte jedoch auch ohne point spread function gegenüber der HD-PET-Rekonstruktion eine nahezu identische Trennschärfe. Subjektiv waren die Läsionen durch den Einsatz der PSF jedoch visuell klarer abgrenzbar. Zu berücksichtigen bleibt ebenfalls, dass die LK-Vermessung initial mit der HD-PETRekonstruktion begonnen wurde und somit die Lage der zu messenden Läsionen für die OSEM-Auswertungen bereits bekannt war. Bei schwierigen Platzierungen der VOI, wurden diese zuerst in der HD-PET-Rekonstruktion lokalisiert und anhand der Koordinaten in die weiteren Rekonstruktionen übertragen. Dies hatte zum einen eine sehr gute Vergleichbarkeit der Uptake-Berechnungen zum Vorteil, verzerrte jedoch die Aussage über die Leistungsfähigkeit der nachfolgenden OSEM-Rekonstruktion. So wurden möglicherweise VOIs mit potentiell darin enthaltenen LK-Metastasen eingezeichnet, die bei normaler visueller bzw. verblindeter Auswertung in einer prospektiven Studie nicht als auffällig gewertet und somit quantifiziert worden wären. Die subjektive Verbesserung der Bildqualität wurde von Ozawa et al. [157] objektiv bestätigt und führt so zu einer signifikanten Steigerung der Diagnosesicherheit bei visueller Auswertung [157]. Die diagnostische Genauigkeit auf das patientenangewandte TNM-Staging von NSCLC konnte aber auch hier nicht 118 5 Diskussion verbessert werden [157]. Die geringe Patientenzahl in der Kombination mit der niedrigen Prävalenz von LK- Metastasen limitierten zudem das statistische Gewicht ihrer Aussagen [157]. An einem größeren LK- Kollektiv konnten Lasnon et al. [135] hingegen aufgrund der verbesserten Bildqualität durch die HD-PET eine signifikante Erhöhung der Sensitivität auf bis zu 98% sowie eine Verbesserung des negativen prädiktiven Wertes in mediastinalen Lymphknoten erreichen. Eine in der OSEM unauffällige Aktivitätsverteilung wird jedoch oftmals in der HD-PET-Rekonstruktion überhöht dargestellt, so dass der Zuwachs an Sensitivität oftmals auf Kosten einer sinkenden Spezifität erbracht wird [135]. Insbesondere die hohe Steigerung der falsch positiven Ergebnisse bei einer bereits sehr hohen Prävalenz maligner LK von über 70% Prozent lässt die gefundene potentielle Steigerung der Testqualität durch die Implementierung der PSF in der Arbeit von Lasnon et al. [135] kritisch erscheinen. Eine Steigerung der diagnostischen Gesamtgenauigkeit konnte durch ihre Arbeit ebenfalls nicht aufgezeigt werden [135]. Trotz einer besseren Vergleichbarkeit zwischen verschiedenen Scannern, Rekonstruktionsprotokollen sowie geringeren Messschwankungen - auch für den zukünftigen Einsatz von UltraHD-Scannern mit TOF-Technik - muss nach den Ergebnissen der vorliegenden Arbeit ein auf SUVpeak basierender Schwellenwert kritisch gesehen werden [154]. Über alle Rekonstruktionsalgorithmen hinweg wurden, wenn auch nur teilweise signifikant, jedoch von den Beträgen per se stetige Verschlechterungen der Trennschärfen zwischen malignen und benignen LK berechnet. Eine zusätzliche Erhebung des SUVpeak kann jedoch, wie oben bereits diskutiert, bei minimalem zusätzlichen Aufwand wertvolle Informationen liefern [153] [154]. Insbesondere kann die SUVpeak-Quantifizierung bei der Anwendung unterschiedlicher PET-Scanner und Rekonstruktionsprotokolle einen wichtigen Stellenwert für eine bessere Vergleichbarkeit einnehmen [153] [154]. Anwendungsbeispiele wären hierfür über einen längeren Zeitraum andauernde Verlaufsuntersuchungen, die Frage nach einem Therapieansprechen oder der Einsatz in multizentrischen Studien [153] [154]. Das Hinzuziehen von Verhältnisbildungen aus dem Uptake von LK zu Primarien sowie von Lymphknoten zu Leber zeigte in der vorliegenden Arbeit keine Steigerung der Trennschärfe in allen untersuchten Rekonstruktionsprotokollen. Zwar kann die Quotientenbildung von LK zu Primarien in der HD-PET-Rekonstruktion auf LK-Ebene 119 5 Diskussion zu einer relevanten Erhöhung der Spezifität im Bereich hoher Sensitivitäten führen, eine positive Auswirkung auf das patientenorientierte Staging konnte jedoch nicht bestätigt werden. Moloney et al. [158] untersuchten in ihrer aktuellen Studie ebenfalls ausführlich den Einfluss der Quotientenbildungen für LK mit grenzwertigen 18 F-FDG- Uptake und konnten einen signifikanten Zusammenhang aus der Höhe des SUVmaxVerhältnisses von LK zu dessen Primarius in Bezug auf die Dignität nachweisen [158]. Eine Steigerung der Sensitivität und Spezifität konnte aber auch hier gegenüber eines optimalen SUVmax-Schwellenwertes nicht erreicht werden [158]. Die Quotientenbildungen aus LK- und Leber-Uptake führte in der vorliegenden Arbeit lediglich bei Patienten mit normaler 18F-FDG-Verteilung zu einem zufriedenstellenden Ergebnis. Der Einfluss eines erhöhten hepatischen Glukose-Uptakes durch einen initial hohen Glukosespiegel, erhöhtes Körpergewicht sowie vermehrtem viszeralen Fettvolumen, mit hieraus folgenden chronisch entzündlichen Veränderungen, macht den Einsatz des Quotienten bei einem nicht selektierten Patientenkollektiv in der klinischen Routine vermutlich sehr störanfällig [90] [146]. Leistungsfähigkeit der SUV-Schwellenwerte in der Detektion maligner LK im Gesamtkollektiv sowie in CT-morphometrisch benigne klassifizierten LK Für den Einsatz eines Schwellenwertes in der SUV-Quantifizierung zeigte sich die Berechnung des LK-Uptakes mittels SUVmax gegenüber SUVpeak überlegen [154]. Im Gegensatz zu den Ergebnissen von Lasnon et al. [135] konnte wie bereits erwähnt, keine eindeutige Erhöhung der Leistungsfähigkeit durch die in den TrueXAlgorithmus der HD-PET-Rekonstruktion implementierte PSF-Funktion zur Auflösungsrückgewinnung erreicht werden. Vielmehr unterscheiden sich die OSEMund HD-Rekonstruktionen im Verhalten der SUV-Quantifizierung [99] [135] [148]. Desweiteren kann durch die Art der Definition des Schwellenwertes das Verhältnis von Sensitivität und Spezifität, wie in den Referenzarbeiten in Tabelle 18 sichtbar, nahezu beliebig variiert werden. Für den Einsatz als Suchtest sowie zum Ausschluss einer mediastinalen LKBeteiligung bei NSCLC - wie von Hellwig et al. [29] bereits 2009 empfohlen und in den S3 Leitlinien zur „Prävention, Diagnostik, Therapie und Nachsorge des Lungenkarzinoms“ [96] im Jahr 2010 übernommen - wurde der Schwellenwert analog den Arbeiten zur SUV-Quantifizierung von Hellwig et al.[97] und Hülsewede [98] auf eine niedrige FNR und FPR optimiert. Hier zeigt sich der SUVmax-Schwellenwert 120 5 Diskussion von 3,2 in der HD-PET-Rekonstruktion mit einer sehr hohen Sensitivität von 89% auf LK-Ebene und 94% auf Patientenebene. Aufgrund eines sehr hohen negativ prädiktiven Wertes ist dieser Schwellenwert für einen sicheren Ausschluss von Lymphknotenmetastasen sehr gut geeignet. Es konnte zum ersten Mal gezeigt werden, dass mit einem Schwellenwert von 3,2 SUVmax in der HD-PET-Rekonstruktion ohne relevanten Verlust an Sensitivität und diagnostischer Gesamtgenauigkeit sowohl in vergrößerten als auch normal großen LK die geringsten Fehlerraten bei der Differenzierung zwischen benignen und malignen LK erreicht werden können. Trotz der aufgezeigten Schwierigkeiten bei der Quantifizierung von kleinen Läsionen können, auch in CT-negativen LK, Metastasen mit einer hohen Sensitivität von 80% gegenüber 0% im CT zuverlässig detektiert werden [92] [99]. Gegenüber den Referenzarbeiten mit dem Ziel einer maximalen Trefferquote von Bryant et al.[124], Perigaud et al.[125], Nguyen et al.[126] und Lee et al.[128] konnte durch die auf Fehlerraten fokussierte Auslegung des Schwellenwertes der PPV und die Sensitivität Stagingmethoden auch für kleine gesteigert LK werden über [32]. das Niveau Insbesondere minimalinvasiver die technischen Schwierigkeiten bei der Detektion bzw. der Probenentnahme von kleinen LK durch die MSK und durch transbronchiale Verfahren führen dort zu einem noch stärkeren Abfall der Sensitivtät auf durchschnittlich 42% bzw. 66% [32] [96]. Bei höheren SUV-Schwellenwerten kam es in allen Rekonstruktionsmethoden zu einer steigenden FNR und FPR sowie zu einer Zunahme der diagnostischen Genauigkeit. Der Beginn des Plateaus der maximalen diagnostischen Genauigkeit lag in der vorliegenden Arbeit bei einem SUVmax von 4,7 für die HD-PETRekonstruktion. Im Vergleich zu dem Fehlerratendiagramm der Arbeit von Hellwig et al. [97] für die OSEM 2i8s-Rekonstruktion lag dieser Schwellenwert somit deutlich höher. Für die OSEM 3i24s-Rekonstruktion konnten bei einem Schwellenwert von 4,0 SUVmax sowohl die höchste Gesamtgenauigkeit als auch die geringsten Fehlerraten aller Rekonstruktionsprotokolle erreicht werden. Durch unterschiedliche Anforderungen an den Schwellenwert sowie unterschiedliche Patientenzusammensetzungen und Rekonstruktionsprotokolle wurden - wie in Tabelle 18 dargestellt - von vielen Autoren jeweils individuelle Cut-off Werte definiert [124] [125] [126] [128]. Anhand der fehlenden Angaben zu den 121 5 Diskussion Rekonstruktionsprotokollen in den Arbeiten von Bryant et al.[124], Lee et al.[128], Nguyen et al.[126] und Li et al.[127] wird deutlich, dass der Einfluss der Rekonstruktion und der Iterationsäquivalente auf die SUV-Quantifizierung in der Vergangenheit unterschätzt wurde. Ohne die Anwendung eines vergleichbaren Rekonstruktionsprotokolls ist die Verwendung eines vorgeschlagenen Schwellenwertes unzuverlässig [123] [136] [153]. Auch die uneinheitliche Festlegung des Schwellenwertes trägt in den Referenzarbeiten zu uneinheitlichen Werten bei. So wird in den Arbeiten von Perigaud et al.[125] sowie Lee et al.[128] eine deutliche Verschiebung von hohen Sensitivtäten zu hohen Spezifitäten bei zunehmendem Schwellenwert deutlich [125] [128]. Eine hohe Prävalenz von LK-Metastasen erlaubt ebenfalls die Anwendung eines höheren Schwellenwertes. [124] [126]. Bezüglich der vorliegenden Methodik sind hierbei die Arbeiten von Hellwig et al. [97] und Hülsewede [98] bei gleicher Definition des SUV-Cut-offs am vergleichbarsten. Auch in diesen Arbeiten wurde der Schwellenwert unter Berücksichtigung minimaler Fehlerraten definiert und in einem LK- und patientenorientierten Staging konsequent umgesetzt [97] [98]. Bei vergleichbarer Sensitivität ist die deutlich höhere Spezifität, PPV und Gesamtgenauigkeit gegenüber der Arbeit von Hülsewede [98] durch den Einsatz der HD-Rekonstruktion und der integrierten CT sichtbar. Dieser Einfluss wird im patientenangewandten Staging durch die Überprüfung mehrerer LK und somit durch eine Potenzierung der Testparameter noch deutlicher [98]. Gegenüber der Arbeit von Hellwig et al.[97] wurde für die schlechteren Testwerte die geringere Anzahl an unauffälligen LK mit konsekutiver Verschlechterung der Gesamtgenauigkeit und Spezifität durch die geringe Anzahl richtig negativer Befunde genannt [98]. Neben der Zusammensetzung der gemessenen LK könnte auch die Erfahrung des Untersuchers bei der reinen PET-Quantifizierung - ohne anatomische Informationen durch das CT - eine weitere noch nicht genannte Rolle spielen [97]. Eine exakte Platzierung des VOI, ohne Überschneidung angrenzender 18 F-FDG speichernder Strukturen wie Gefäße, Myokard, Knochenmark oder der Primärtumor, könnte so die Spezifität erhöhen. 122 5 Diskussion Tabelle 18: Testparameter vergleichbarer Untersuchungen auf LK- und Patientenebene Autor SUV Cut-off Definition SUV Cut-off Prävalenz maligne LK/Pat. Sens. LK / Pat. Spez. LK / Pat. Bryant et al.2006 [124] 5,3a ROC; Accuracy 36%b / - -/ 91%b -/ 88%b -/- Hellwig et al.2007 [97] 2,5 ROC; min. FNR+FPR 23% /- 89% / - 84% / 89% 61% / - 96% / - 85% / - Perigaud et al. 2009[125] 4 ROC - / 20%b - / 40% - / 85% - / 40% - / 85% - /- Nguyen et al.2011 [126] 3,6 ROC 35% / 62% -/ 87% -/ 89% -/ 81% -/ 92% -/- >2.3 ROC (Schulterpunkt) -/ 30% -/ 80.3% -/ 71% -/ 54% -/ 87% - / 74% 2,5 ROC; min FNR+FPR 14% / - 82% /100% 55% / 8% 23% / 32% 95% / 100% 62% / 36% Li et al. 2013 [127] Hülsewede 2013[98] PPV NPV Accuracy LK / Pat. - / 92%b Lee et al.2014 [128] >2,9a ROC;max 13% / Sens.+ Spez. - 47% / - 90%/ - -/ - -/ - -/ - Vorliegende Dissertation 3,2a (HDPET) ROC; min FNR+FPR 20% / 33%b 89% / 94% 66% / 53% 39% / 50% 97%/ 95% 71 %/ 67% Vorliegende Dissertation 4,7a (HDPET) ROC; max Accuracy 20% / 33%b 69% / 72% 95% / 94% 76% / 87% 92%/ 87% 89 % / 87% Vorliegende Dissertation 4,0a (OSEM 3i24s) ROC; min FNR+FPR und max. Accuracy 20% / 33%b 76% / 83% 94%/ 92% 75% / 83% 94% /92% 90 % / 89% Vorliegende Dissertation 3,2a und CT > 1 cm (HDPET) ROC; min FNR+FPR und LK ≥1 cm -/ 33%b /100% -/ 44% -/ 47% -/ 100% -/ 63% a SUVmax; b für N-Stadium ≥ 2 Eine wichtige Ursache für die sehr hohe Spezifität in der Arbeit von Hellwig et al.[97] gegenüber dem HD-PET-Cut-off von 3,2 SUVmax dieser Arbeit wird aus dem Fehlerdiagramm ersichtlich. Während sich in Hellwigs Analysen mit der OSEM 2i8sRekonstruktion - wie in der vorliegenden OSEM 3i24s-Rekonstruktion - die geringsten Fehlerraten und der Beginn des Plateaus der maximalen diagnostischen 123 5 Diskussion Genauigkeit auf einen schmalen SUV-Bereich fokussieren, divergieren diese in der HD-PET-Rekonstruktion über den Intervall eines ganzen SUV-Werts auseinander [97]. Die erst ab einem höheren SUV-Wert einsetzende maximale Gesamtgenauigkeit resultiert somit in eine deutlich geringere Spezifität für den Bereich minimaler Fehlerraten. Leistungsfähigkeit der SUV-Schwellenwerte im patientenorientierten Staging Essentiell für die weitere Therapieplanung sowie die Prognose des NSCLC ist das korrekte Staging mediastinaler LK [96]. Insbesondere die Einteilung in ein N0/1- oder N2/3-Stadium stellt meist die Indikation für eine potentiell kurative Operation dar [96]. Mit einem Schwellenwert von 3,2 SUVmax in der HD-PET-Rekonstruktion können die Sensitivitäten aus etablierten Schwellenwerten der OSEM-Rekonstruktionen sowie aus konventionellen visuellen Auswertungen erreicht bis übertroffen werden (siehe Tabelle 18 und 19) [124] [125] [126] [127]. Durch die hohe Sensitivität von 94% erfüllt auch die SUV-Quantifizierung des TrueX-Algorithmus die hohen Anforderungen an ein Diagnoseverfahren zum Ausschluss einer mediastinalen LK Metastasierung [97] [96]. Durch die Integration von CT-morphometrischen Kriterien kann die Sensitivität und der negative prädiktive Wert auf bis zu 100% gesteigert werden, da nicht avide LK-Metastasen noch mit ausreichender Sensitivität 18 F-FDG- durch die morphometrischen Informationen des CT abgefangen werden. Die geringe Spezifität und die hohe Rate an inkorrektem Upstaging macht jedoch bei diesem niedrigen SUV-Cut-off eine weitere Abklärung PET-positiver Befunde, wie auch in den aktuellen Leitlinien empfohlen, unabdingbar [96]. Da eine histo-/zytologische Probengewinnung für das Grading vor einer Therapie ein obligates Vorgehen darstellt, sollte dies zu keiner relevanten Verzögerung des Therapiebeginns führen [96] [159]. Die Steigerung der Sensitivität bei gleichzeitigem Abfall der Spezifität im Vergleich zur LK-orientierten Auswertung wird statistisch durch die Testwiederholungen für alle analysierten LK eines Patienten verursacht. 124 5 Diskussion Tabelle 19: Metaanalyse zur visuellen Auswertung durch erfahrene Nuklearmediziner; im Vergleich hierzu die Testwerte der Nuklearmedizin des Universitätsklinikums des Saarlands (UKS). Autor Scanner Anzahl LK / Pat. Prävalenz LK / Pat. Sensitivität LK / Pat. Spezifität LK / Pat. PPV LK/Pat. NPV LK/Pat. Silvestri (2007) [160] PET 608 / 2865 61%/ 29% 95% / 74% 90% / 85% 94% / - 92% / - Hellwig (2009) [29] - - / >691 - / 17-54%b - / 83%a - / 89%a -/- -/- Silvestri (2013) [161] PET/CT - / 2014 - / 22% - / 62 - / 90 - / 63% - / 90% Silvestri (2013) [161] PET - / 4105 - / 28% - / 80 - / 88 - / 72% - / 91% - / 83% - / 67% - / 83% UKS PET/CT - / 54 - / 33% - / 67% (2011) a für die Differenzierung zwischen N0/1- und N2/3-Stadium b für CT < bzw. ≥ 1 cm Die auf eine hohe diagnostische Gesamtgenauigkeit ausgelegten Cut-off-Werte zeigen auch auf Patientenebene eine sehr hohe Spezifität und gegenüber den Metaanalysen in Tabelle 19 vergleichbare positive und negative Vorhersagewerte [29] [160] [161]. Mit Sensitivitäten von 72% bzw. 83% und Spezifitäten von 84% bzw. 91% (Cut-off: 4,7 SUVmax in HD-PET bzw. 4,0 SUVmax in OSEM 3i24s) sind diese ebenfalls tendenziell mit der Leistungsfähigkeit konservativer PET/(CT)-Analysen durch erfahrene Untersucher vergleichbar [29] [160] [161]. Trotz der Implementierung der PSF zur Auflösungsrückgewinnung und subjektiv verbesserter Bildqualität, zeigt die HD-PET-Rekonstruktion nur eine mit der OSEM 3i24s vergleichbare diagnostische Gesamtgenauigkeit. Im patientenorientierten Staging zeigt die HDPET-Rekonstruktion darüber hinaus sogar einen stärkeren Abfall der Sensitivität im Bereich sehr hoher Spezifitäten. Dies ist bei vergleichbarer Trennschärfe zwischen benignen und malignen LK auf Lymphknotenebene auf den unterschiedlichen Verlauf der Fehlerraten bei zunehmenden SUV-Werten zurückzuführen. In den OSEMRekonstruktionen liegen diese deckungsgleich mit der höchsten diagnostischen Genauigkeit, in der HD-PET sind diese jedoch etwas divergent. Somit sind bei der Festlegung des Schwellenwertes eine etwas geringere FNR und FPR bzw. diagnostische Gesamtgenauigkeit in Kauf zu nehmen. Der drohende Verlust an 125 5 Diskussion Spezifität muss somit durch einen höheren SUV-Schwellenwert mit einem geringen Sensitivitätsverlust kompensiert werden. Auch im direkten Vergleich zu einer visuellen Auswertung der LK-Regionen durch einen erfahrenen Nuklearmediziner kann mittels Anwendung von SUV- Schwellenwerten für die Differenzierung zwischen N0/1- und N2/3-Stadium - je nach Anforderung an den Schwellenwert - eine vergleichbare Trennschärfe erreicht werden. Während Hellwig et al.[97] für die visuelle Analyse etwas höhere Werte für Sensitivitäten und Spezifitäten, für die Gesamtgenauigkeit sowie für die prädiktiven Werte fand, konnte diese Aussage durch die vorliegenden Ergebnisse nicht generell bestätigt werden. Vielmehr zeigten sich die Leistungen der Cut-off-Werte je nach Art der Anforderungen variabel. Die HD-PET-Rekonstruktion eignet sich so durch die mit einem niedrigen SUV-Schwellenwert von 3,2 verbundenen hohen Sensitivität und geringen FNR sehr gut als Suchtest für eine mediastinale LK-Metastasierung. Die Folgen der hohen Sensitivität sind u.a. ein Einbruch der Spezifität und der diagnostischen Gesamtgenauigkeit unter die Testleistungen der visuellen Auswertung durch erfahrenen Nuklearmediziner des UKS. Die Testparameter der visuellen Auswertung des UKS waren wiederum mit denen anderer Institute vergleichbar (siehe Tabelle 19) [29] [160] [161]. In einer der visuellen Beurteilung vergleichbaren Auslegung der Schwellenwerte auf eine hohe Spezifität und Trefferquote konnte durch den Cut-off von 4,0 SUVmax der OSEM 3i24s-Rekonstruktion die Spezifität um bis zu 10% und die Gesamtgenauigkeit um knapp 15% gegenüber der visuellen Auswertung, bei vergleichbarer Sensitivität, gesteigert werden. Da diese Schwellenwerte ebenfalls auf einer niedrigen FNR und FPR basierten, waren diese mit denen der Arbeit von Hellwig et al.[97] sowie von Hülsewede [98] gut vergleichbar, in welchen sich jeweils nur ein knapper und nicht signifikanter Vorteil für die visuellen Auswertungen zeigte [97] [98]. Das gegenüber der visuellen Interpretation in nahezu allen Fällen korrekte Downstaging durch alle beschriebenen Cut-off-Werte bestätigt die SUV- Quantifizierung zudem als wichtiges Instrument zum Ausschluss einer mediastinalen Metastasierung des NSCLC. Dies unterstützt wiederum das diagnostische Vorgehen, bei PET-negativen LK auf eine invasive Mediastinoskopie bzw. transbronchiale Biopsien verzichten zu können [96] [97] [98]. Dass dies auch durch einen SUVSchwellenwert der HD-PET-Rekonstruktion bei CT-morphometrisch unauffälligen LK 126 5 Diskussion kleiner 10 mm mit ausreichender Trefferquote möglich ist, konnte erstmals in dieser Arbeit belegt werden. Es bleibt jedoch zu berücksichtigen, dass mittels Auflösungsrückgewinnung (HD-PET mit PSF) der SUV gegenüber der wahren Aktivität regelmäßig überhöht dargestellt wird [92] [135]. In Größenbereichen kleiner der doppelten Ortsauflösung neigt das PET jedoch gleichzeitig aufgrund des Partialvolumeneffektes generell dazu, die wahren Aktivitäten zu gering zu quantifizieren [92] [99] [135]. 127 6 Schlussfolgerung 6 Schlussfolgerung Für den Ausschluss einer mediastinalen Lymphknotenmetastasierung zeigt sich die HD-PET-Rekonstruktion mit dem SUVmax-Schwellenwert von 3,2 aufgrund der sehr hohen Sensitivität am geeignetsten. Mithilfe dieses Schwellenwerts übertrifft die PET/CT auch in Lymphknoten (LK) mit Durchmessern unter 10 mm die Sensitivitäten minimalinvasiv endoskopischer oder mediastinoskopischer Stagingmethoden. Für maximierte Trefferraten eignet sich sowohl der SUVmax-Schwellenwert von 4,7 der HD-PET als auch der SUVmax-Schwellenwert von 4,0 der OSEM 3i24sRekonstruktion sehr gut. Die Sensitivitäten und Spezifitäten entsprechen hierbei denen der visuellen Auswertung durch erfahrene Nuklearmediziner. Bei einer für die weitere Therapieplanung wichtigen Differenzierung zwischen N0/1und N2/3-Stadium übertrifft die HD-PET mit einem Schwellenwert von 3,2 SUVmax die Sensitivität einer visuellen Auswertung deutlich. Insgesamt kann durch den Einsatz von Methoden zur Auflösungsrückgewinnung, wie die PSF des TrueX-Algorithmus der HD-PET-Rekonstruktion, gegenüber der OSEM 3i24s-Rekonstruktion keine Verbesserung der Trennschärfe zwischen benignen und malignen LK nachgewiesen werden. CT-morphometrisch suspekte Lymphknoten ≥10 mm zeigen einen signifkant höheren 18 F-FDG-Uptake als nicht vergrößerte LK <10 mm. Erwartungsgemäß zeigen maligne LK einen deutlich höheren 18 mm anhand des erhöhten 18 F-FDG-Uptake als benigne. Metastasen sind in LK <10 F-FDG-Uptakes deutlich von vergrößerten benignen LK unterscheidbar. Die SUVpeak-Quantifizierung sollte aufgrund der geringeren diagnostischen Testleistung nicht für die Dignitätsbeurteilung mittels SUV-Schwellenwert eingesetzt werden. Aufgrund der besseren Vergleichbarkeit zwischen verschiedenen PETMessungen eignet sich die zusätzliche SUVpeak-Quantifizierung bei minimalem zusätzlichen Aufwand eher für Verlaufskontrollen. Wegen der Robustheit gegenüber leichten Auflösungsunterschieden kann jedoch die Quantifizierung mittels SUVpeak einen zunehmenden Stellenwert bei der Anwendung unterschiedlicher PET-Scanner und Rekonstruktionsprotokolle, wie z.B. in Nachuntersuchungen oder multizentrischen Studien einnehmen. 128 6 Schlussfolgerung Ein direkter Vergleich der SUVs zwischen verschiedenen Rekonstruktionsprotokollen ist aufgrund des unterschiedlichen Quantifizierungs-Verhaltens nicht sinnvoll. Bei der Quantifizierung kleiner LK sowie bei hoher 18 F-FDG-Konzentration sind die Differenzen zwischen SUVs der HD-PET- und OSEM 3i24s-Rekonstruktion am stärksten. Ein einfacher Korrekturfaktor kann die hohen Messschwankungen und die Variablen wie die Objektgröße oder die Aktivitätskonzentration nur eingeschränkt ausgleichen. Es sollten deshalb wenn möglich immer die Originaldaten mit dem entsprechenden Rekonstruktionsprotokoll nachrekonstruiert und verglichen werden. Ist dies nicht möglich empfehlen sich hierbei folgende Umrechnungen zwischen der HD-PET- und der OSEM-Rekonstruktion. Für den SUV-Uptake mediastinaler Lymphknoten: SUVmax(OSEM3i24s) ≈ SUVpeak(HD-PET) + 1,2 SUVpeak(HD-PET) ≈ SUVmax(OSEM3i24s) - 1,2 SUVpeak(OSEM3i24s) ≈ 0,95 x SUVpeak(HD-PET) SUVpeak(HD-PET) ≈ 1,05 x SUVpeak(OSEM3i24s) Für Lungenherde lauten die entsprechenden Formeln folgendermaßen: SUVmax(OSEM3i24s) ≈ SUVpeak(HD-PET) + 1,1 SUVpeak(HD-PET) ≈ SUVmax(OSEM3i24s) - 1,1 SUVpeak(OSEM3i24s) ≈ 0,87 x SUVpeak(HD-PET) SUVpeak(HD-PET) ≈ 1,15 x SUVpeak(OSEM3i24s) Bei Patienten mit Glukosespiegeln über 150 mg/dl vor Insulingabe kann die diagnostische Testleistung des SUV-Schwellenwertes unter die der CT- morphometrischen Dignitätsbeurteilung absinken. SUV-Werte sind deshalb bei initial hyperglykämen Patienten besonders kritisch zu beurteilen. Berücksichtigung des Glukosespiegels zum Zeitpunkt der Neben der 18 F-FDG-Injektion muss 129 6 Schlussfolgerung deshalb der initiale Glukosespiegel bei Patientenaufnahme am Untersuchungstag mitberücksichtigt werden. Bei einer Hyperglykämie am Untersuchungstag sollte die 18 F-FDG-PET/CT- Untersuchung nach langsamer BZ-Korrektur auf die nächsten Tage verschoben werden. Der auf das Rekonstuktionsprotokoll angepasste SUV-Schwellenwert kann abschließend auch für die HD-PET-Rekonstruktion bei allen LK-Größen als wichtiges Werkzeug des Lymphknoten-Stagings empfohlen werden. 130 7 Literaturverzeichnis 7 Literaturverzeichnis 1. Robert Koch Institut (2013) Krebs - Lungenkrebs. URL: http://www.krebsdaten.de/Krebs/DE/Content/Krebsarten/Lungenkrebs/lungenkrebs_no de.html. Accessed 14 December 2014. 2. McNeill A (2004) Tobacco use and effects on health. Prepared by the Aspect Consortium EC, Hrsg. Tobacco or health in the European Union – past, present und future. Prepared by the Aspect Consortium, European Commission. Luxemburg: Office für Official Publication of the European Communities: 25–68. 3. Simonato L., Agudo A., Ahrens W. et al. (2001) Lung cancer and cigarette smoking in Europe: an update of risk estimates and an assessment of inter- country heterogeneity. Int J Cancer 91: 876–887. 4. Goeckenjan G., Sitter H., Thomas M. et al. (2010) Prävention, Diagnostik, Therapie und Nachsorge des Lungenkarzinoms. Interdisziplinäre S3-Leitlinie der Deutschen Gesellschaft für Pneumologie und Beatmungsmedizin und der Deutschen Krebsgesellschaft. Pneumol 64 (Suppl2): e1-e164. 5. Statistisches Bundesamt (2007) Statistisches Jahrbuch für die Bundesrepublik Deutschland. Wiesbaden. URL: http://www.destatis.de/jetspeed/ portal/cms/Sites/destatis/Internet/DE/Presse/pm/2007/05/ PD07__217__232,templateId=renderPrint.psml. 6. Novak D., Huber R. (2006) Berufliche Risikofaktoren, Berufskrankheit, arbeitsmedizinische Begutachtung. In: Tumorzentrum München, Hrsg. Manual der Tumore der Lunge und des Mediastinums. München: Huber RM. 7. Menzler S., Schaffrath Rosario A., Wichmann H et al. (2006) Abschätzung des attributablen Lungenkrebsrisikos in Deutschland durch Radon in Wohnungen IN: Wichmann HE, Schlipköter HW, Fülgraff G, Hrsg. Fortschritte der Umweltmedizin. Landsberg: ecomed Medizin. 8. Will C., Schewe C., Petersen I. (2006) Incidence of HPV in primary and metastatic squamous cell carcinomas of the aerodigestive tract: implications for the establishment of clonal relationships. Histopathol. 48: 605–626. 9. Mao Y., Pan S., Wen S. et al. (1999) Physical activity and the risk of lung cancer in Canada. Am J Epidemiol. 158: 564–575. 10. Alberg AJ., Samet JM. (2005) Epidemiology of lung cancer. Sadler MJ, Caballero B, Strain J, Hrsg. Encyclopedia of human nutrition. London: Academic Press. 272–284. 11. Wichmann H., Molik B., Pott F. et al. (1991) Luftverunreinigungen und Lungenkrebs – Ergebnisse einer Pilotstudie. Umweltbundesamt Berlin, Hrsg. Berlin: Erich Schmidt. 12. Ackermann H., Aden K., Aurich M. et al. (2012) ALLEX Alles fürs Examen. Georg Thieme Verlag. V 7 Literaturverzeichnis 13. Carbone P., Frost J., Feinstein A. et al. (1970) Lung cancer: perspectives and prospects. Ann Intern Med. 73: 1003–1024. 14. Spiro S., Gould M., Colice G. et al. (2007) Initial evaluation of the patient with lung cancer: Symptoms, signs, laboratory tests, and paraneoplastic syndromes.ACCP Evidenced-Based Clinical Practice Guidelines. Chest 132: 149S – 1606S. 15. Kreuter M., Eberhardt R., Herth F. (2008) Diagnostik des Bronchialkarzinoms. Pneumol. 5: 187–198. 16. Koyi H., Hillerdal G., Branden E. (2002) Patient’s and doctors’ delays in the diagnosis of chest tumors. Lung Cancer 35: 53–57. 17. Thomas M., Gatzemeier U., Georg R. et al. (2000) Empfehlungen zur Diagnostik des Bronchialkarzinoms. Pneumol. 54: 361–371. 18. Swensen S., Viggiano R., Midthun D. et al. (2000) Lung nodule enhancement at CT: multicenter study. Radiol. 214: 73–80. 19. Ries L., Elsner M., Kosary C. (2005) Cancer statistics review 1975–2002. In: Ries L, Elsner M, and Kosary C, Hrsg. Bethesda: MD National Cancer Institute. 20. Van Tinteren H., Hoekstra O., Smit E. et al. (2002) Effectiveness of positron emission tomography in the preoperative assessment of patients with suspected non-small-cell lung cancer: the PLUS multicentre randomised trial. Lancet 359: 1388–1393. 21. Sobin L., Gospodarowicz M., Wettekind C. (2009) TNM Classification of Malignant Tumours, 7th ed. Wiley Blackwell. 22. Mirsadraee S., Oswal D., Alizadeh Y. et al. (2012) The 7th lung cancer TNM classification and staging system: Review of the changes and implications. World J Radiol. 4: 128–134. 23. Layer G., Schmitteckert H., Steudel A. et al (1999) MRT, CT and sonography in the preoperative assessment of the primary tumor spread in malignant pleural mesothelioma. Rofo. 170: 365–370. 24. Wahidi M., Govert J., Goudar R. et al. (2007) Evidence for the treatment of patients with pulmonary nodules: when is it lung cancer?: ACCP evidence-based clinical practice guidelines (2nd edition). Chest 132 (Suppl 3): 94S – 107S. 25. Hellwig D., Ukena D., Paulsen F. et al. (2001) Metaanalyse zum Stellenwert der Positronen-Emissions-Tomographie mit F-18-Fluorodesoxyglukose (FDG-PET) bei Lungentumoren. Diskussionsbasis der deutschen Konsensus-Konferenz Onko-PET 2000. Pneumol. 55: 367–377. 26. Fischer B., Mortensen J., Hojgaard L. (2001) Positron emission tomography in the diagnosis and staging of lung cancer: a systematic, quantitative review. Lancet Oncol. 2: 659–666. VI 7 Literaturverzeichnis 27. Nomori H., Watanabe K., Ohtsuka T. et al. (2004) Evaluation of F-18 fluorodeoxyglucose (FDG) PET scanning for pulmonary nodules less than 3 cm in diameter, with special reference to the CT images. Lung Cancer 45: 19–27. 28. Ung Y., Maziak D., Vanderveen J. et al. (2007) 18Fluorodeoxyglucose positron emission tomography in the diagnosis and staging of lung cancer: a systematic review. J Natl Cancer Inst. 99: 1753–1767. 29. Hellwig D., Baum P., Kirsch C. (2009) FDG-PET, PET/CT and conventional nuclear medicine procedures in the evaluation of lung cancer: A systematic review. Nukl. 48: 59–69. 30. McDonald S., Hansell D. (2003) Staging of non-small cell lung cancer: imaging of intrathoracic disease. Eur J Radiol. 45: 18–30. 31. De-Langen A. (2006) The size of mediastinal lymph nodes and its relation with metastatic involvement: a meta-analysis. Eur J Cardio Thorac Surg Off J Eur Assoc Cardio Thorac Surg. 29: 26–29. 32. Detterbeck F., Jantz M., Wallace M. et al. (2007) Invasive mediastinal staging of lung cancer: ACCP evidence-based clinical practice guidelines (2nd edition). Chest: 202S – 220S. 33. Cerfolio R., Ojha B., Bryant A. et al. (2004) The accuracy of integrated PET-CT compared with dedicated PET alone for the staging of patients with nonsmall cell lung cancer. Ann Thorac Surg. 78: 1017–1023. 34. Halpern B., Schiepers C., Weber WA. et al. (2005) Presurgical staging of nonsmall cell lung cancer: positron emission tomography, integrated positron emission tomography/CT, and software image fusion. Chest 128: 2289–2297. 35. Major S. (2005) NICE issues guidance for diagnosis and treatment of lung cancer. BMJ 330: 439. 36. Herder G., Kramer H., Hoekstra O. et al. (2006) Traditional versus up-front [18 F] fluorodeoxyglucose-positron emission tomography staging of non-small-cell lung cancer: a Dutch cooperative randomized study. J Clin Oncol. 24: 1800–1806. 37. Weber W., Dietlein M., Hewllig D. et al. (2003) PET with (18)F-fluorodeoxyglucose for staging of non-small cell lung cancer. Nukl. 42: 135–144. 38. Honeybourne D., Babb J., Bowie P. et al. (2001) British Thoracic Society guidelines on diagnostic flexible bronchoscopy. Thorax 56 (Suppl 1): i1 – i 21. 39. Xie H., Cornwell R., Grossman J. et al. (2002) Bronchoscopy-guided transtracheal and transbronchial fine-needle aspiration biopsy: a 5-year institutional review of 111 cases. Diagn Cytopathol. 27: 276-281. 40. Yung R. (n.d.) Tissue diagnosis of suspected lung cancer: selecting between bronchoscopy, transthoracic needle aspiration, and resectional biopsy. Respir Care Clin N Am. 9: 51–76. VII 7 Literaturverzeichnis 41. Toloza E., Harpole L., McCrory D. (2003) Noninvasive staging of non-small cell lung cancer: a review of the current evidence. Chest 123: 137S – 146S. 42. Spira A., Ettinger D. (2004) Multidisciplinary management of lung cancer. Multidiscip Manag Lung Cancer 350: 379–392. 43. Bungay H., Pal C., Davies C et al. (2000) An evaluation of computed tomography as an aid to diagnosis in patients undergoing bronchoscopy for suspected bronchial carcinoma. Clin Radiol. 55: 554–560. 44. Micames C., McCrory D., Pavey D. et al. (2007) Endoscopic ultrasoundguided fineneedle aspiration for non-small cell lung cancer staging: A systematic review and metaanalysis. Chest. 131: 539–548. 45. Annema J., Versteegh M., Veselic M. et al. (2005) Endoscopic ultrasoundguided fineneedle aspiration in the diagnosis and staging of lung cancer and its impact on surgical staging. J Clin Oncol. 23: 8357–8361. 46. TolozaE., Harpole L., Detterbeck F. et al. (2003) Invasive staging of non-small cell lung cancer: a review of the current evidence. Chest 123: 157S–166S 47. Berquist T., Bailey P., Cortese D. et al. (1980) Transthoracic needle biopsy: accuracy and complications in relation to location and type of lesion. Mayo Clin Proc 55: 475– 481. 48. Porte H., Roumilhac D., Eraldi L. et al. (1998) The role of mediastinoscopy in the diagnosis of mediastinal lymphadenopathy. Role Mediastinoscopy Diagn Mediastinal Lymphadenopathy 13: 196–199. 49. Kramer H., Groen H. (2003) Current concepts in the mediastinal lymph node staging of nonsmall cell lung cancer. Ann Surg. 238: 180–188. 50. Hammoud Z., Anderson R., Meyers B. et al. (1999) The current role of mediastinoscopy in the evaluation of thoracic disease. J Thorac Cardiovasc Surg. 118: 894–899. 51. Eddy R. (1989) Cost-effectiveness of CT scanning compared with mediastinoscopy in the preoperative staging of lung cancer. Can Assoc Radiol J 40: 189–193. 52. Schreiber G., McCrory D. (2003) Performance characteristics of different modalities for diagnosis of suspected lung cancer: summary of published evidence. Chest 123: 115S – 128S. 53. Rivera M., Mehta A. (2007) Initial diagnosis of lung cancer. ACCP Evidence- Based Clinical Practice Guidelines (2nd edition). Chest 132: 131S – 148S. 54. Dennie C., Matzinger F., Marrier J. et al. (2001) Transthoracic needle biopsy of the lung: results of early discharge in 506 outpatients. Radiol 219: 247–251. 55. Mitruska S., Landreneau R., Mack M. et al. (1995) Diagnosing the indeterminate pulmonary nodule: percutaneous biopsy versus thoracoscopy. Surg. 118: 676–684. VIII 7 Literaturverzeichnis 56. Hartman T. (2002) Radiologic evaluation of the solitary pulmonary nodule. Semin Thorac Cardiovasc Surg. 14: 261–267. 57. Ohno Y., Hatabu H., Takenaka D. et al. (2003) CT-guided transthoracic needle aspiration biopsy of small (< or = 20mm) solitary pulmonary nodules. AJR Am J Roentgenol. 180: 1665–1669. 58. Chung T. (2002) Fine needle aspiration of the solitary pulmonary nodule. Semin Thorac Cardiovasc Surg. 14: 275–280. 59. Yamagami T., Iida S., Kato T. et al. (2003) Combining fine-needle aspiration and core biopsy under CT fluoroscopy guidance: a better way to treat patients with lung nodules? AJR Am J Roentgenol. 180: 811–815. 60. Manhire A., Charig M., Clelland C. et al. (2003) Guidelines for radiologically guided lung biopsy. Thorax 58: 920–936. 61. Augusti C., Xaubet A., Monton C. et al. (2001) Induced sputum in the diagnosis of peripheral lung cancer not visible endoscopically. Respir Med. 95: 822–828. 62. Antunes G., Neville E., Duffy J. et al. (2003) BTS guidelines for the management of malignant pleural effusions. Thorax 58 (Suppl 2): ii29–ii38. 63. Belani C., Einarson T., Arikian S. et al. (1995) Costeffectiveness analysis of pleurodesis in the management of malignant pleural effusion. J Oncol Manag 4: 24-36 64. Robinson L., Wagner H. Jr., Ruckdeschel J. (2003) Treatment of stage IIIA non-small cell lung cancer. Chest 123: 202–220. 65. Robinson L., Ruckdeschel J., Wagner H. Jr. et al. (2007) Treatment of nonsmall cell lung cancer-stage IIIA: ACCP evidence-based clinical practice guidelines (2nd edition). Chest 132: 243–265. 66. Schicha H., Schober O. (2013) Nuklearmedizin: Basiswissen und klinische Anwendung, 7. Auflage. Schattauer. 67. BSM Diagnostica Ges .m .b .H. (2014) Fachinformation FDG(F-18)-BSM Injektionslösung. URL:: http://www.pharmazie.com/graphic/A/15/4-00015.pdf. Accessed 27 December 2014. 68. Elstrom R., Bauer D., Buzzai M. et al. (2004) Akt Stimulates Aerobic Glycolysis in Cancer Cells. Cancer Res. 64: 3892. 69. Kuwert T., Grünwald F., Haberkorn U. et al. (2008) Nuklearmedizin, 4. Auflage. Thieme. 70. Ruhlmann J., Oehr P., Biersack H. (1998) PET in der Onkologie : Grundlagen und klinische Anwendungen, 1.Auflage. Springer. 71. Betazerfall - Lexikon der Physik (n.d.). URL: http://www.spektrum.de/lexikon/physik/betazerfall/1487. Accessed 28 December 2014. IX 7 Literaturverzeichnis 72. Werner Stolz, Radioaktivität. Grundlagen - Messung - Anwendungen (2005), 5. Auflage. Teubner. 73. Schmidt M. (n.d.) Betazerfall “b-Zerfall.” URL: http://www.idn.unibremen.de/cvpmm/content/radioaktivitaet/show.php?modul=23&file=3. 74. West R. (1973) Positron studies of condensed matter. Adv Phys. 22: 263–383. 75. Krause B., Beyer T., Bockisch A. et al. (2007) FDG-PET/CT in der Onkologie Leitlinien. Nukl. 46: 291–301. 76. Delbeke D., Coleman E., Guiberteau M. et al. (2006) Procedure Guideline for Tumor Imaging with 18F-FDG PET/CT 1.0*. J Nucl Med. 47: 885–895. 77. Siemens Medical Solutions USA, Inc. (n.d.) Biograph mCT The wolrd´s first molecular CT. 78. Siemens Medical Solutions USA, Inc. (2009) Inside Biograph TruePoint PET CT. 79. Badawi R. (1999) Introduction to PET Physics: Detection systems in PET. URL: http://depts.washington.edu/nucmed/IRL/pet_intro/intro_src/section5.html. Accessed 28 December 2014. 80. Rankine L. (2013) The Effects of PET Reconstruction Parameters on Radiotherapy Response Assessment and an Investigation of SUV-peak Sampling Parameters Duke Universitiy. Available: URL: http://dukespace.lib.duke.edu/dspace/bitstream/handle/10161/7306/Rankine_duke_00 66N_11919.pdf?sequence=1. 81. Geworski L. (2004) Voraussetzungen für die Quantifizierung in der EmissionsTomographie. URL: : http://www.google.de/imgres?imgurl=http%3A%2F%2Fedoc.huberlin.de%2Fhabilitationen%2Fgeworski-lilli-2004-0317%2FHTML%2FGeworski_html_m30f642d5.png&imgrefurl=http%3A%2F%2Fedoc.h u-berlin.de%2Fhabilitationen%2Fgeworski-lilli-2004-0317%2FHTML%2Fchapter4.html&h=505&w=609&tbnid=oS7LsTscSlQa1M%3A&zoom =1&docid=NCuk1KXE-1bPbM&ei=VibVISRNIHPOMmpgYAG&tbm=isch&iact=rc&uact=3&dur=353&page=2&start=17&nds p=22&ved=0CFMQrQMwEQ. Accessed 28 December 2014. 82. Powsner R., Powsner E. (2006) Essential Nuclear Medicine Physics, 2. Auflage. Blackwell. 83. Technik der Positronen-Emissions-Tomographie – Wikipedia (n.d.). URL: http://de.wikipedia.org/wiki/Technik_der_Positronen-Emissions-Tomographie. Accessed 28 December 2014. 84. Kehren F. (2001) Vollständige iterative Rekonstruktion von dreidimensionalen Positronen-Emissions-Tomogrammen unter Einsatz einer speicherresidenten Systemmatrix auf Single- und Multiprozessor-Systemen Technischen Hochschule Aachen.URL: http://publications.rwth-aachen.de/record/61010/files/Kehren_Frank.pdf X 7 Literaturverzeichnis 85. Katua A., Ankrah A, Vorster M. et al. (2011) Optimization of ordered subset expectation maximization reconstruction for reducing urinary bladder artifacts in singlephoton emission computed tomography imaging. World J Nucl Med. 10: 3–8. 86. Hudson H., Larkin R. (1994) Accelerated image reconstruction using ordered subsets of projection data. Med Imaging 13: 601–609. 87. Patlak C., Blasberg R., Fenstermacher (1983) Graphical evaluation of blood-to-brain transfer constants from multiple-time uptake data. J Cereb Blood Flow Metab. 3: 1–7. 88. Pixberg M. (2002) Skript - 4. Kurs für Klinische Onkologie Münster. 89. Lucignani G., Paganelli G., Bombardieri E. (2004) The use of standardized uptake values for assessing FDG uptake with PET in oncology: A clinical perspective. Nucl Med Commun. 25: 651–656. 90. Zasadny K., Wahl R. (1993) Standardized uptake values of normal tissues at PET with 2-[fluorine-18]-fluoro-2-deoxy-D-glucose: variations with body weight and a method for correction. Radiol. 189: 847–850. 91. Kessler R., Ellis J., Eden M. (1984) Analysis of emission tomographic scan data: limitations imposed by resolution and background. J Comp Assist Tomogr. 8: 514– 522. 92. Soret M., Bacharach S., Buvat I. (2007) Partial-Volume Effect in PET Tumor Imaging. J Nuc Med 48: 932–945. 93. Vanderhoek M., Perlman S., Jeraj R. (2012) Impact of the Definition of Peak Standardized Uptake Value on Quantification of Treatment Response. J Nucl Med. 53: 4–11. 94. Wahl R., Jacene R., Kasamon Y. et al. (2009) RECIST to PERCIST: Evolving Considerations for PET Response Criteriain Solid Tumors. J Nucl Med. 50: 122S – 150S. 95. Ghosh P. (2012) Lymphoma: Differences between SUVmax and SUVpeak for Therapy Response Assessment. Website Siemens Healthcare. 96. Goeckenjan G et al. (2010) Prävention, Diagnostik, Therapie und Nachsorge des Lungenkarzinoms. Interdisziplinäre S3-Leitlinie der Deutschen Gesellschaft für Pneumologie und Beatmungsmedizin und der Deutschen Krebsgesellschaft. 97. Hellwig D., Graeter T., Ukena D. et al. (2007) 18F-FDG PET for mediastinal staging of lung cancer: which SUV threshold makes sense? J Nucl Med. 48: 1761–1766. 98. Hülsewede (2013) 18F-FDG-PET zum mediastinalen Lymphknoten-Staging bei Lungenkarzinom: Validierung der SUV-Schwelle 2,5 Universität des Saarlandes. URL: http://d-nb.info/1069104310/34 99. Knäusl B., Hirtl A., Dobrozemsky G. et al. (2012) PET based volume segmentation with emphasis on the iterative TrueX algorithm. Z Für Med Phys. 22: 29–39. XI 7 Literaturverzeichnis 100. Rusch V., Asamura H., Watanabe H. et al. (2009) The IASLC Lung Cancer Staging Project - A Proposal for a New International Lymph Node Map in the Forthcoming Seventh Edition of the TNM Classification for Lung Cancer. J Thorac Oncol. 4: 568– 577. 101. Panin V., Kehren F., Michel C. et al. (2006) Fully 3-D PET reconstruction with system matrix derived from point source measurements. Med Imaging. 25: 907–921. 102. A.Gievers, Brinkmann J., Czyborra-Brinkmann (2009) Durchführung der Atemtriggerung beim PET-CT.URL: http://mtra.nuklearmedizin.de/fortbildungen/jata09_abstracts/TV3.pdf 103. Lynch R., Pitson G., Ball. D. et al. (2013) Computed tomographic atlas for the new international lymph node map for lung cancer: A radiation oncologist perspective. Pract Radiat Oncol. 3: 54–66. 104. Shapiro S., Wilk M. (1965) An analysis of variance test for normality. Biom. 52: 591– 611. 105. Lavene H. (1960) Contributions to Probability and Statistics: Essays in Honor of Harold Hotelling. Standord Univ Press. 278–292. 106. Huber P. (1964) Robust estimation of a location parameter. Ann Math Stat. 35: 73– 101. 107. Martens J. (2003) Statistische Datenanalyse mit SPSS für Windows, 2. Auflage. Oldenbourg Wissenschaftsverlag GmbH. 108. Turkey J. (1977) Exploratory Data Analysis. Addison Wesley Pub Co Inc . 109. Wilcoxon F. (1945) Individual Comparisons by Ranking Methods. Biom Bull.1 (6): 80– 83. 110. Mann H., Whitney D. (1947) On a test of whether one of two random variables is stochastically larger than the other. Ann Math Stat. 18: 50–60. 111. Kruskal W., Wallis W. (1952) Use of ranks in one-criterion variance analysis. J Am Stat Assoc . 47: 583–621. 112. Soper H.E., Young A. W., Pearson K. et al. (1917) On the Distribution of the Correlation Coefficient in Small Samples. Appendix II to the Papers of “Student” and R. A. Fisher. Biomtrika. 11: 328–413. 113. Kendall M. (1938) A New Measure of Rank Correlation. Biom. 30: 81–89. 114. Bland J., Altman D. (1986) Statistical methods for assessing agreement between two methods of clinical measurement. Lancet 327: 307–310. 115. Bland J., Altman D. (1995) Comparing methods of measurement: why plotting difference against standard method is misleading. Lancet 346: 1085–1087. XII 7 Literaturverzeichnis 116. Metz C. (1978) Basic principles of ROC analysis. Semin Nucl Med. 8: 283–298. 117. Griner P., Mayewski R., Mushlin A. et al. (1981) Selection and interpretation of diagnostic tests and procedures. Principles and applications. Ann Intern Med. 94: 557– 592. 118. DeLong E., DeLong D., Clark-Pearson D. (1988) Comparing the areas under two or more correlated receiver operating characteristic curves: a nonparametric approach. Biom. 44: 837–845. 119. D. Hellwig, M. Weissinger, Y. Kim et al. (2014) Lymphknoten-Staging des Lungenkarzinoms mit FDG-PET/CT und HD-Rekonstruktion: SUV-Schwellen für die Charakterisierung normal großer und vergrößerter Lymphknoten. Vortrag 52.DGNJahrestagung. URL: https://www.schattauer.de/index.php?id=5236&mid=20923 120. Seier E. (2002) Comparison of Tests for Univariate Normality. Johnson City: Department of Mathematics East Tennessee State University.URL: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.588.3885&rep=rep1&type=p df 121. Bland J., Altman D. (1999) Measuring agreement in method comparison studies. Stat Methods Med Res. 8: 135–160. 122. Bundesamt für Strahlenschutz im Auftrag Brix G. (2003) Bekanntmachung der diagnostischen Referenzwerte für radiologische und nuklearmedizinische Untersuchungen. Bundesanzeiger 143: 17503–17504. 123. Boellaard R., O´Doherty M., Weber W. et al. (2010) FDG PET and PET/CT: EANM procedure guidelines for tumour PET imaging: version 1.0. Eur J Nucl Med Mol Imaging 27: 181–200. 124. Bryant A., Cerfolio R., Klemm K. et al. (2006) Maximum Standard Uptake Value of Mediastinal Lymph Nodes on Integrated FDG-PET-CT Predicts Pathology in Patients with Non-Small Cell Lung Cancer. Ann Thorac Surg. 82: 417–423. 125. Perigaud C., Bridji B., Roussel C. et al. (2009) Prospective preoperative mediastinal lymph node staging by integrated positron emission tomography—computerised tomography in patients with non-small-cell lung cancer. Eur J Cardio-Thorac Surg. 36: 731–736. 126. Nguyen N., Kaushik A., Wolverson M. et al. (2011) Is there a common SUV threshold in oncological FDG PET/CT, at least for some common indications? A retrospective study. Acta Oncol. 50: 670–677. 127. Li S., Zheng Q., Ma Y. et al. (2013) Implications of false negative and false positive diagnosis in lymph node staging of NSCLC by means of 18F-FDG PET/CT. 8.10: e78552 XIII 7 Literaturverzeichnis 128. Lee A., Choi S, Jung K. et al. (2014) Characteristics of Metastatic Mediastinal Lymph Nodes of Non-Small Cell Lung Cancer on Preoperative F-18 FDG PET/CT. Nucl Med Mol Imaging 48: 41–46. 129. Yamada S., Kubota K., Kubota R. et al. (1995) High Accumulation of Fluorine-18Fluorodeoxyglucose in Turpentine-Induced Inflammatory Tissue. J Nucl Med. 36: 1301–1306. 130. Zhuang H., Pourdehnad M., Lambright E. et al. (2001) Dual Time Point 18F-FDG PET Imaging for Differentiating Malignant from Inflammatory Processes. J Nucl Med. 42: 1412–1417. 131. Matthies A., Hickeson M., Cuchiara A. et al. (2002) Dual Time Point 18F-FDG PET for the Evaluation of Pulmonary Nodules. J Nucl Med. 43: 871–875. 132. Hamberg L., Hunter G., Alpert N. et al. (1994) The dose uptake ratio as an index of glucose metabolism: useful parameter or oversimplification? J Nucl Med. 35: 1308– 1312. 133. Shinya T., Rai K., Okumura Y. et al. (2009) Dual-Time-Point F-18 FDG PET/CT for Evaluation of Intrathoracic Lymph Nodes in Patients With Non-Small Cell Lung Cancer. Clin Nucl Med. 34: 216–221. 134. Pieterman R., Van Putten J., Meuzelaar J. et al. (2000) Preoperative staging in nonsmall lung cancer with positoron-emission tomography. N Engl J Med. 343: 254–261. 135. Lasnon C., Hicks R., Beauregard J. et al. (2012) Impact of Point Spread Function Reconstruction on Thoracic Lymph Node Staging With 18F-FDG PET/CT in NonYSmall Cell Lung Cancer. Clin Nucl Med. 37: 971–976. 136. Lasnon C., Desmonts C., Quak E. et al. (2013) Harmonizing SUVs in multicentre trials when using different generation PET systems: prospective validation in non-small cell lung cancer patients. Eur J Nucl Med Mol Imaging 40: 985–996. 137. IHK Saarland (n.d.) Saarland - Data and economic facts. URL: http://www.saarland.ihk.de/ihksaarland/Integrale?SID=CRAWLER&MODULE=Frontend&ACTION=ViewPage&Page. PK=1579. Accessed 11 February 2015. 138. Shim S., Lee K., Kim b. et al. (2005) Non–Small Cell Lung Cancer: Prospective Comparison of Integrated FDG PET/CT and CT Alone for Preoperative Staging. Radiol.: 1011–1019. 139. Karabin-Kehl B., Mittmann-Frank M., Wilkens H. et al. (2011) Silikose mit Autoimmunphänomen eines Achatschleifers. 51. Wissenschaftliche Jahrestagung : der Deutsche Gesellschaft für Arbeitsmedizin und Umweltmedizin e. V.. URL: http://scidok.sulb.uni-saarland.de/volltexte/2011/3749/ 140. Lindholm P., Minn H., Leskinen-Kallio S. et al. (1993) Influence of the Blood Glucose Concentration on FDG Uptake in Cancer - A PET Study. J Nucl Med. 34: 1–6. XIV 7 Literaturverzeichnis 141. Torizuka T., Clavo A., Wahl R. et al. (1997) Effect of Hyperglycemia on In Vitro Tumor Uptake of Tritiated FDG, Thymidine, L-Methionine and L-Leucine. J Nucl Med. 38: 382–386. 142. Rabkin Z., Israel O., Keidar Z. (2010) Do Hyperglycemia and Diabetes Affect the Incidence of False-Negative 18 F-FDG PET/CT Studies in Patients Evaluated for Infection or Inflammation and Cancer? A Comparative Analysis. J Nucl Med. 51: 1015–1020. 143. Roy F., Beaulieu S. (2009) Impact of Intravenous Insulin on 18F-FDG PET in Diabetic Cancer Patients. J Nucl Med. 50: 178–183. 144. Minn H., Nuutila P., Lindholm P. et al. (1994) In vivo effects of insulin on tumor and skeletal muscle glucose metabolism in patients with lymphoma. Cancer 73: 1490– 1498. 145. Zasadny K., Wahl R. (1993) Standardized uptake values of normal tissues at PET with 2-[fluorine-18]- fluoro-2-deoxy-D-glucose: variations with body weight and a method for correction. Radiol. 189: 847–850. 146. Pak K., Kim S., Kim I. et al. (2012) Hepatic FDG Uptake is not Associated with Hepatic Steatosis but with Visceral Fat Volume in Cancer Screening. Nucl Med Mol Imaging 46: 176–181. 147. Adams M., Turkington T., Wison J. et al. (2010) A Systematic Review of the Factors Affecting Accuracy of SUV Measurements. Nucl Med Mol Imaging : 310–320. 148. Prieto P., Dominguez-Prado I., Garcia-Velloso M. et al. (2013) Impact of Time-of-Flight and Point-Spread-Function in SUV Quantification for Oncological PET. Clin Nucl Med. 38: 103–109. 149. Gelee S., Page J., Sanghera B. et al. (2014) Impact of the Point Spread Function on Maximum Standardized Uptake Value Measurements in Patients with Pulmonary Cancer. World J Nucl Med 13: 128–131. 150. Akamatsu G., Mitsumoto K., Taniguchi T. et al. (2014) Influences of point-spread function and time-of-flight reconstructionson standardized uptake value of lymph node metastases in FDG-PET. Eur J Radiol. 83: 226–230. 151. Orlandini L., Betti M., Fulcheri C. et al. (2013) Improvement in clinical evaluation of PET/CT images with high resolution algorithms. QJ Nucl Med Mol Imaging 57: 201– 206. 152. Hellwig A. (2006) Die Positronen-Emissions-Tomographie mit F-18Fluorodesoxyglukose in der Rezidivdiagnostik des Bronchialkarzinoms. Universität des Saarlandes.URL: https://www.deutsche-digitalebibliothek.de/binary/YFKX67XVJ27LC2C47PMLY2P66AC4W3ID/full/1.pdf 153. Brendle C., Kupferschläger J., Nikolaou K. et al. (2015) Is the standard uptake value (SUV) appropriate for quantification in clinical PET imaging? – Variability induced by XV 7 Literaturverzeichnis different SUV measurements and varying reconstruction methods. Eur J Radiol 84: 158–162. 154. Lodge M., Chaudhry M., Wahl R. et al. (2012) Noise Considerations for PET Quantification Using Maximum and Peak Standardized Uptake Value. J Nucl Med. 53: 1041–1047. 155. Boellaard R., Oyen W., Hoekstra O. et al. (2007) Applications of F18-FDG-PET in Oncology and Standardisation for Multi-Centre Studies. HOVON Imaging Workgr Neth Soc Nucl Med .URL: http://qibawiki.rsna.org/images/0/09/boellaardaanbevelingen_nedpas_2007_-_en-_17032009.pdf 156. King A., Tse G., Ahuja A. et al. (2004) Necrosis in Metastatic Neck Nodes: Diagnostic Accuracy of CT, MR Imaging, and US. Radiol. 230: 720–726. 157. Ozawa Y., Hara M., Shibamoto Y. et al. (2013) Utility of high-definition FDG-PET image reconstruction for lung cancer staging. Acta Radiol. 54: 916–920. 158. Moloney F., Ryan D., McCarthy L. et al. (2014) Increasing the accuracy of18F-FDG PET/CT interpretation of“mildly positive” mediastinal nodes in the staging of nonsmallcell lung cancer. Eur J Radiol. 83: 843–847. 159. Rafael O., Aziz M., Vele O. et al. (2014) Molecular testing in lung cancer: fine-needle aspiration specimen adequacy and test prioritization prior to the CAP/IASLC/AMP Molecular Testing Guideline publication. Cancer Cytopatho. 122: 454–458. 160. Silvestri G., Gould M., Margolis M. et al. (2007) Noninvasive Staging of Non-small Cell Lung Cancer* - ACCP Evidenced-Based Clinical Practice Guidelines (2nd Edition). Chest. 132.3 suppl: 178S-201S 161. Silvestri G., Gozalez A., Jantz M. et al. (2013) Methods for Staging Non-small Cell Lung Cancer - Diagnosis and Management of Lung Cancer, 3rd ed: American College of Chest Physicians Evidence-Based Clinical Practice Guidelines. Chest: 211–250. XVI 8 Abkürzungesverzeichnis 8 Abkürzungesverzeichnis 18 18 18 18 2D Zweidimensionalität 2i8s 2 Iterationen und 8 Subsets 3D Dreidimensionalität 3i24s 3 Itarationen und 24 Subsets 95%CI 95% Konfidenzintervall A Aktivität A1 Systemmatrix AUC area under the curve b Projektionsansicht C Aktivitätskonzentration CT Computertomograph/ie Cut-off Schwellenwert E Energie EBUS endobronchialer Ultraschall et al. et alii (Maskulinum), et aliae (Femininum) FN falsch negativ FNA Feinnadelaspiration FNP Feinnadelpunktion FN falsch negativ FNR falsch negativ Rate FP falsch positiv FPR falsch positiv Rate fT3 freies Triiodthyronin fT4 freies Tetraiodthyronin GLUT Glucosetransporter HD high definition HPV humanes Papillomavirus i.V. intravenös IASLC International Association for the Study of Lung Cancer F-FDG F-FDG-6-P F-2-Fluoro-2-desoxy-D-glukose /18F-Fluorodesoxyglukose F-Fluorodesoxyglukose -6-Phosphat XVII 8 Abkürzungsverzeichnis IQR Interquartilsabstand LK Lymphknoten log logarithmisch LOR line of response LSO Lutetium-Oxyorthosilicat MIP maximum intensitiy projection MLEM maximum likelihood expectation maximization MSK Mediastinoskopie M-Staging Metastasis staging =Stadieneinteilung von Fernmetastasen MW Mittelwert n Anzahl NaCl Natriumchlorid NPV negativ prädiktiver Wert NSCLC nicht kleinzelliges Bronchialkarzinom N-Staging Nodal staging = Stadieneinteilung von Lymphknotenmetastasen OSEM ordered subsets expectation maximization p Signifikanzwert p.i. post injectionem PET Positronen-Emissions-Tomograph/ie PM Photomultiplier PPV positiv prädiktiver Wert PSF point spread function r Korrelationskoeffizient R² Determinationskoeffizient/Bestimmtheitsmaß RC Recovery-Koeffizient Rekon. Rekonstruktion RN richtig negativ ROC receiver operating characteristic RP richtig positiv S3-Leitlinie Leitlinie mit allen Elementen einer systematischen Entwicklung SCLC kleinzelliges Bronchialkarzinom SD Standardabweichung XVIII 8 Abkürzungsverzeichnis Sens. Sensitivität SPECT Single-Photon-Emissions-Tomograph/ie Spez. Spezifität SUV standardized uptake value Tab. Tabelle TOF time of flight TSH Thyreoidea-stimulierendes Hormon T-Staging Tumor staging = Stadieneinteilung der Tumorausbreitung UICC Union internationale contre le cancer UKS Universitätsklinikum des Saarlandes US United States VOI volume of interest XIX 9 Abbildungsverzeichnis 9 Abbildungsverzeichnis Abbildung 1: Diagnostischer Algorithmus des NSCLC nach der aktuellen S3-Leitlinie zur Prävention, Diagnostik, Therapie und Nachsorge des Lungenkarzinoms............. 9 Abbildung 2: Metabolic trapping von 18F-FDG durch intrazelluläre Phosphorylierung ................................................................................................................................. 18 Abbildung 3: Beispiele für Koinzidenzen des PET-Scanns mit a) true- b) random- und c) scatter effects ....................................................................................................... 22 Abbildung 4: SPECT-Aufnahme von Becken und Blase. Aktivitätsdarstellung mit einer a) gefilterten Rückprojektion und b) iterativen Rekonstruktion......................... 24 Abbildung 5: Einfluss der Anzahl an Iterationen und der Größe des Gauß-Filters auf die Abbildungsqualität .............................................................................................. 25 Abbildung 6: Funktionsweise der point spread function (PSF) ................................. 28 Abbildung 7: Verändertes Signalprofil bei Detektion von Photonen außerhalb des Detektorzentrums ..................................................................................................... 28 Abbildung 8: Einfluss des Partialvolumeneffekts auf die rekonstruierte Aktivitätsverteilung .................................................................................................... 30 Abbildung 9: Methoden zur SUV-Quantifizierung ..................................................... 31 Abbildung 10: Siemens mCT40 PET/CT .................................................................. 36 Abbildung 11: Darstellung intrathorakaler Primarien und hilärer sowie mediastinaler LK-Metastasen durch das 18F-FDG-PET in der MIP-Darstellung.............................. 46 Abbildung 12: Verteilung des SUVmax-Uptakes der quantifizierten Lymphknoten sowie deren Primärtumoren in Bezug auf die histo-/ztyologische Referenz ............. 47 Abbildung 13: Scatterplotmatrix mit linearer Regressionsanalyse und Häufigkeitsverteilung der Lymphknoten-SUV (n=293). Teil 1/2 ................................ 54 Abbildung 14: Scatterplotmatrix mit linearer Regressionsanalyse und Häufigkeitsverteilung der Lymphknoten SUV (n=293). Teil 2/2 ................................ 55 Abbildung 15: Höhe des durch den SUVmax quantifizierten 18F-FDG-Uptake von LK der HD-PET Rekonstruktion in Abhängigkeit der CT-morphologisch bestimmten LK Größe in der kurzen Achse ....................................................................................... 56 XX 9 Abbildungsverzeichnis Abbildung 16: Höhe des durch den SUVmax quantifizierten 18F-FDG-Uptake von LK der HD-PET-Rekonstruktion in Abhängigkeit der CT-morphologisch bestimmten Größe in der kurzen Achse sowie der histologisch bestimmten Dignität (links: benigne LK, rechts: maligne LK)............................................................................... 57 Abbildung 17: Quantifizierungsverhalten von OSEM 3i24s gegenüber HD-PET in Abhängigkeit der Lymphknotengröße ....................................................................... 58 Abbildung 18: Quantifizierungsverhalten von OSEM 3i24s gegenüber HD-PET in Abhängigkeit der Primariusgröße ............................................................................. 59 Abbildung 19: SUVmax-Quantifizierung eines malignen 10,4 x 23,9 mm großen infracarinalen Lymphknotens per a) HD-PET- und b) OSEM 3i24s-Rekonstruktion . 59 Abbildung 20: Bland-Altman-Plot von LK: OSEM 3i24s und OSEM 2i8s für SUVmax (links) und SUVpeak (rechts) .................................................................................... 60 Abbildung 21: Bland-Altman-Plot von LK: SUVmax und SUVpeak für HD-PET (links) und OSEM 3i24s (rechts) ......................................................................................... 61 Abbildung 22: Bland-Altman-Plot von LK: SUVmax zwischen HD-PET und OSEM 3i24s (links) bzw. OSEM 2i8s (rechts) ...................................................................... 62 Abbildung 23: Bland-Altman-Plot von LK: SUVpeak zwischen HD-PET und OSEM 3i24s (links) und OSEM 2i8s (rechts) ....................................................................... 63 Abbildung 24: Bland-Altman-Plot von LK: HD-PET SUVpeak und OSEM 3i24s SUVpeak. Ordinaten als prozentuale Abweichung der Differenz der Messwerte von ihrem Mittelwert (links) und Quotient der Messwerte gegen den Mittelwert der Messwerte aufgetragen (rechts). .............................................................................. 64 Abbildung 25: Bland-Altman-Plot von LK: HD-PET SUVpeak gegen OSEM 3i24s SUVmax. Die Ordinate zeigt die Differenz der Messwerte (links) bzw. die Differenzen der Messwerte als Prozentzahl ihrer Mittelwerte (rechts) ......................................... 66 Abbildung 26: Bland-Altman-Plot von LK für HD-PET SUVmax gegen OSEM 3i24s SUVpeak mit den Differenzen der Messwerte (links) und der prozentualen Abweichung der Differenz der Messwerte vom Mittelwert aller Differenzen (rechts) 67 Abbildung 27:Bland-Altman-Plots für die Differenz der SUV-Messwerte von Primarien ................................................................................................................................. 68 Abbildung 28: Bland-Altman Plot von Primarien. In der Ordinate sind die Differenzen der Messwerte als Prozentzahl ihrer Mittelwerte des SUVpeak von HD-PET und XXI 9 Abbildungsverzeichnis OSEM 3i24s (links) bzw. HD-PET SUVpeak und OSEM 3i24s SUVmax (rechts) aufgetragen .............................................................................................................. 71 Abbildung 29: ROC-Analyse der LK-SUVs (Diagonale Segmente ergeben sich aus Bindungen) ............................................................................................................... 73 Abbildung 30: ROC-Analyse von SUV-Quotienten für LK der HD-PET-Rekonstruktion ................................................................................................................................. 75 Abbildung 31: ROC-Analyse von SUV-Quotienten für LK der OSEM 3i24sRekonstruktion (überlagernde ROC-Kurven wurden gestrichelt dargestellt) ............ 76 Abbildung 32: Fehlerratendiagramm für HD-PET SUVmax ...................................... 78 Abbildung 33: Fehlerratendiagramm für HD-PET SUVmax; optimaler Schwellenwert für CT-morphologisch vergrößerte und nicht vergrößerte LK ................................... 80 Abbildung 34: Fehlerratendiagramm HD-PET SUVmax; Quotientenbildung aus LKund Primarius-Uptake ............................................................................................... 81 Abbildung 35: Fehlerratendiagramm für OSEM 3i24s SUVmax ............................... 82 Abbildung 36: Fehlerratendiagram für HD-PET SUVmax; optimaler Schwellenwert für CT-morphologisch vergrößerte und nicht vergrößerte LK......................................... 83 Abbildung 37: SUV-Uptake von LK in Abhängigkeit der Dignität und des initialen Glukosespiegels ....................................................................................................... 86 Abbildung 38: SUV-Upkate von pulmonalen Primärtumoren in Abhängigkeit des initialen Glukosespiegels .......................................................................................... 87 Abbildung 39: ROC-Analyse für LK bei initialen Glukosespiegeln ≥150 mg/dl ......... 88 Abbildung 40: Fehlerratendiagramm HD-PET SUVmax; LK von initial hyperglykämen Patienten mit einem Blutglukosespiegel von ≥150 mgd/dl ........................................ 90 Abbildung 41: ROC-Analyse für LK von Patienten mit initialem Blutglukosespiegel <150 mg/dl ................................................................................................................ 90 Abbildung 42: Fehlerratendiagramm für HD-PET SUVmax; LK von initial normoglykämen Patienten mit einem Blutglukosespiegel von < 150mg/dl ............... 92 XXII 10 Tabellenverzeichnis 10 Tabellenverzeichnis Tabelle 1: Klinische Initialsymptome von Lungenkarzinomen..................................... 7 Tabelle 2: Stadieneinteilung des NSCLC nach Vorschlag der UICC in der 7. Auflage ................................................................................................................................. 15 Tabelle 3: Codierung der LK-Histo/Zytologie ............................................................ 41 Tabelle 4: Zusammensetzung der pulmonalen Tumoren.......................................... 45 Tabelle 5: Verteilung des SUVmax-Uptakes in der HD-PET-Rekonstruktion ........... 48 Tabelle 6: M-Schätzer nach Huber des 18F-FDG-Uptakes SUVmax quantifizierter Lymphknoten ............................................................................................................ 49 Tabelle 7: Kennzahlen der Bland-Altman-Plots für die SUV-Uptakes von Primarien 72 Tabelle 8: AUC-Analyse der LK-SUVs ..................................................................... 73 Tabelle 9: AUC-Analyse der Quotientenbildung mit LK-SUVs .................................. 77 Tabelle 10: Signifikanzanalyse von potentiellen Störfaktoren auf einen regelrechten SUV-Uptake von LK mit Darstellung des Signifikanzniveaus p des Mann-Whitney-UTests für alle analysierten Rekonstruktionsprotokolle, n= 272/274 LK ..................... 85 Tabelle 11: Signifikanzanalyse von potentiellen Störfaktoren auf einen regelrechten SUV-Uptake von Primarien mit Darstellung des Signifikanzniveaus p des MannWhitney-U-Tests für alle analysierten Rekonstruktionsprotokolle ............................. 85 Tabelle 12: AUC-Analyse für LK bei initialen Glukosespiegeln ≥150 mg/dl .............. 89 Tabelle 13: AUC-Analyse bei LK mit initialem Glukosespiegel <150 mg/dl .............. 91 Tabelle 14: Veränderungen im N-Staging durch Anwendung der HD-PET SUVmax Cut-off Werte gegenüber der visuellen Auswertung durch erfahrene Nuklearmediziner ...................................................................................................... 96 Tabelle 15: Veränderungen im N-Staging durch die Anwendung der OSEM 3i24s SUVmax Cut-off Werte gegenüber der visuellen Auswertung durch erfahrene Nuklearmediziner ...................................................................................................... 96 Tabelle 16: Patientenzusammensetzung vergleichbarer Untersuchungen ............. 100 XXIII 11 Publikationen im Zusammenhang mit dieser Dissertation Tabelle 17: Untersuchungsprotokolle vergleichbarer Untersuchungen .................. 101 Tabelle 18: Testparameter vergleichbarer Untersuchungen auf LK- und Patientenebene ...................................................................................................... 123 Tabelle 19: Metaanalyse zur visuellen Auswertung durch erfahrene Nuklearmediziner; im Vergleich hierzu die Testwerte der Nuklearmedizin des Universitätsklinikums des Saarlands (UKS)............................................................ 125 11 Publikationen im Zusammenhang mit dieser Dissertation M. Weissinger, Y. Kim, F. Langer, P. Fries, A. P. Hellwig, F. Khreish, A. Schaefer, R. Bals, H. J. Schaefers, A. Bücker, R. M. Bohle, C. M. Kirsch, D. Hellwig: Lymphknoten-Staging des Lungenkarzinoms mit FDG-PET/CT und HDRekonstruktion: SUV-Schwellen für die Charakterisierung normal großer und vergrößerter Lymphknoten Kongressbeitrag zur 52. Jahrestagung der Deutschen Gesellschaft für Nuklearmedizin 3/2014 XXIV 12 Danksagung 12 Danksagung Ich danke Herrn Prof. Dr. Hellwig nicht nur für die Überlassung des Themas, sondern auch für seine Unterstützung und sein Engagement über die Grenzen der Universität hinaus, sowie seine ansteckende Begeisterung für die Nuklearmedizin. Herrn Prof. Dr. Dr. C.-M. Kirsch danke ich für die Übernahme der Betreung dieser Doktorabeit auch nach seiner Emeritierung als Direktor der Klinik für Nuklearmedizin an dem Universitätsklinikum des Saarlandes. Ebenfalls danke ich meiner Familie und meiner Freundin für die Unterstützung und die ausführlichen Korrekturlesungen dieser Arbeit. Besonderer Dank gilt meinen Eltern, die mir erst das Medizinstudium und dieses Promotion ermöglicht haben. Desweiteren möchte ich mich bei den Ärzten, Physikern und MTRAs der Nuklearmedizin des UKS für die Bereitstellung und Rekonstruktion der Patientendaten bedanken. Ein besonderer Dank gilt Frau Dr. Schäfer für die allzeit schnelle Hilfe aus der Medizinphysik. Auch Herrn Prof. la Fougère und dem Dekanat des UKT danke ich für die Unterstüztung bei der Fertigstellung des abstracts und der freiwilligen Plagiatsprüfung. Bei Herrn Prof. Dr. Schäfers (Klinik für Thorax- und Herz-Gefäß-Chirurgie), Herrn Prof. Dr. Bals (Klinik für Pneumologie, Allergologie, Beatmungs- und Umweltmedizin) sowie Herrn Prof. Dr. Bohle und Herrn PD Dr. Kim (Institut für Allgemeine und Spezielle Pathologie) bedanke ich mich für die Gewinnung und Bereitstellung der histologischen Referenzbefunde. XXV Anhang Anhang Anhang 1: Klinische TNM-Klassifikation nach der 7. Auflage der UICC. Quelle: Sobin L., Gospodarowicz M., Wettekind C. (2009) TNM Classification of Malignant Tumours. 7th ed. Wiley Blackwell; 2009. Auszug der Abbildung aus: Annikka Weissferdt, Cesar A. Moran (2012) Diagnostic Pathology of Pleuropulmonary Neoplasia; Springer 2012. Anhang Anhang 2: Natürlicher (links) und log-transformierter (rechts) Q-Q-Plot der SUVVerteilung für in HD-PET SUVmax quantifizierte LK Quelle: Eigene Darstellung. Anhang 3: Natürlicher (links) und log-transformierter (rechts) Q-Q-Plot der SUVVerteilung für in HD-PET SUVmax quantifizierte Primärtumore Quelle: Eigene Darstellung. Anhang Anhang 4: Korrelation der SUVs nach Pearson für LK und Primarien Quelle: Eigene Darstellung. Anhang Anhang 5: Korrelation der SUVs nach Kendall-Tau-B für LK und Primarien Quelle: Eigene Darstellung. Anhang Anhang 6: Höhe des SUVpeak-Uptakes von LK der HD-PET-Rekonstruktion in Abhängigkeit der CT-morphometrisch bestimmten Ausdehnung in der kurzen Achse sowie der Dignität Quelle: Eigene Darstellung. Anhang 7: Bland-Altman-Plot von LK der HD-PET-Rekonstruktion mit SUVmax und SUVpeak quantifizierten Uptake-Werte. Ordinaten: Prozentuale Abweichung der Differenz der Messwerte von ihrem Mittelwert. Abszisse Mittelwert der Messwerte. Quelle: Eigene Darstellung. Anhang Anhang 8: Bland-Altman-Plot von LK für SUVmax zwischen HD-PET und OSEM 3i24s. Ordinaten: Prozentuale Abweichung der Differenz der Messwerte von ihrem Mittelwert. Abszisse Mittelwert der Messwerte. Quelle: Eigene Darstellung. Anhang Anhang 9: Bland-Altman-Plot von LK für SUVpeak zwischen HD-PET und OSEM 2i8s Quelle: Eigene Darstellung. Anhang 10: Fehlerratendiagram für OSEM 2i8s SUVmax Quelle: Eigene Darstellung.