Charakterisierung von Kataklasezonen durch ihre petrophysikalischen und geochemischen Eigenschaften mit multivariater Statistik Helmuth Winter 1, Helmut Küchenhoff 2, Susanna Adelhardt 2 und Heinrich Soffel 1,1 Institut für Allgemeine und Angewandte Geophysik, Ludwig-Maximilians-Universität München, Theresienstr. 41, D - 80333 München, email: [email protected] , 2 Institut für Statistik, Ludwig-Maximilians-Universität München, Akademiestr.1, D - 80799 München, e-mail: [email protected] Einführung Kataklase- und Störungszonen besitzen als tektonische Deformationsbahnen eine herausragende felsmechanische Bedeutung. Spezielle Mineralisationen können deutliche Veränderungen der chemischen und physikalischen Eigenschaften bewirken. Aufgrund der verringerten Festigkeit des Materials ist es oft schwierig, gut erhaltene Bohrkerne zur direkten Untersuchung aus solchen Bereichen zu erhalten. Neben den Bohrlochmessungen steht als Untersuchungsmaterial meist nur Bohrklein zur Verfügung. An dem sehr dicht beprobten Bohrkleindatensatz der KTB Hauptbohrung wurde mit multivariaten statistischen Verfahren versucht, die charakteristischen Eigenschaften von Kataklasezonen im Vergleich zu ungestörten Bereichen herauszufinden. Die Daten wie Dichte, Suszeptibilität, Gehalt an radiogenen Elementen, Ergebnisse von Röntgenanalysen (RDA und RFA), Infrarotspektroskopie (IRS) und mikroskopischen Beobachtungen wurden zu einem einheitlichen, tiefenorientierten Datensatz zusammengestellt. Diese Bohrklein-Datenmatrix umfaßt auf den 9101 m Tiefenstrecke 5922 Fälle und 68 Variable. Aus Arbeiten an Bohrkernen der KTB Vorbohrung ist bekannt, daß charakteristische Veränderungen in Kataklasezonen besonders von der umgebenden Lithologie beeinflußt sind (Zulauf et al., 1999). Für die statistische Bearbeitung der Bohrkleindaten wurden daher zwei Kataklasezonen ausgesucht, die innerhalb einer einheitlichen Gesteinsart gelegen sind: Eine Kataklasezone in Gneis (1738 - 2380 m, Abbildung 1) sowie eine Kataklasezone in Metabasit (4524 - 4908 m, Abbildung 2). Rechenverfahren Zur Erklärung von möglichen Zusammenhängen zwischen dem Kataklaseanteil im Bohrklein (CATR) und den geochemischen und petrophysikalischen Eigenschaften wurde die multiple lineare Regression angewendet. Es gilt folgende Modellgleichung: Yi = β 0 + β 1 X1i + β 2 X2i + ... + β k Xki + ε i wobei Yi β0 β 1 ... β k X1i ... Xki εi die Zielvariable (CATR) am Tiefenpunkt i = 1 ... n, eine berechnete Konstante, die berechneten Koeffizienten für die erklärenden Variablen (geochemische und petrophysikalische Daten) und die unerklärten Anteile (Residuen) sind. Bei der Regression wird ein optimales Modell gesucht, das möglichst viel Varianz der Zielvariable mit möglichst kleinen Residuen ε i bei optimaler Auswahl von Xk Variablen erklärt. Für die Erklärung der Varianz der Zielvariablen dient das Bestimmtheitsmaß R² , das als der Quotient von Streuung der Modelldaten durch die Gesamtstreuung der Daten definiert ist (Fahrmeir et al., 1996). Für die Rechnungen wurde das Statistikprogramm SPSS verwendet. 40 KTB Hauptbohrung 1738-2380 m Cataclastic rocks and selected explaining variables H2O Quartz Al2O3 Na2O Catacl. Sus. Th.Cond. Carbon Sulfur rocks [%] [103 SI] [W*K- 1*m- 1] [wt.-%] [wt.-%] [wt.-%] [wt.-%] [wt.-%] [wt.-%] 0 50 100 3 4 0 1 23 4 5 30 40 50 60 2 3 MgO [wt.-%] 4 Cr [ppm] 50 100 150 1700 1800 Depth [m] 1900 2000 2100 2200 2300 2400 0 1 2 0 0.5 1 1 2 3 15 20 1 2 3 4 5 Abbildung 1: Anteil kataklastischer Gesteine im Bohrklein sowie ausgesuchte petrophysikalische und geochemische Variable für eine Kataklasezone im Gneis (1738-2380 m). Tabelle 1: Ergebnis der multiplen linearen Regression für die Kataklasezone im Gneis (1738 - 2380 m). Zielvariable: LN_CATR. Erklärende Variable in der Modellgleichung: C, H2O, S, Th, ThC, Konstante. Die damit erklärte Varianz gegenüber der Gesamtvarianz (Bestimmtheitsmaß R² ) beträgt: 0.591. Variable (Constant) H2O C S Th ThC Unstandardized Coefficients B -5.052 1.749 1.746 .437 -.166 1.089 Std. Error .944 .246 .506 .147 .063 .255 Standardized Coefficients Beta .376 .269 .233 -.121 .149 t Sig. -5.351 7.122 3.453 2.965 -2.622 4.275 .000 .000 .001 .003 .009 .000 50 Predicted ln (CATR[%]+1) ln (CATR[%]+1) 012345 Depth [m] 1700 012345 Residuals -2 -1 0 1 2 1700 1800 1800 1900 1900 2000 2000 2100 2100 2200 2200 2300 2300 2400 2400 Standardized Predicted Values Observed Frequency Abbildung 2: Ergebnis der multiplen linearen Regression (Kataklasezone im Gneis, 1738 - 2380 m). Links: Beobachtete und vorhergesagte Werte für ln (CATR [%] + 1) 40 sowie die Residuen im Tiefenverlauf. Rechts oben: Histogramm der standardisierten Residuen. 30 Rechts unten: Streuplot der Residuen gegen die vorhergesagten Werte (beide standardisiert). 20 10 0 - 3 - 2 -1 0 1 2 3 4 Standardized Residuals 3 2 1 0 -1 -2 - 3 -2 -1 0 1 2 3 Standardized Residuals 41 KTB Hauptbohrung 4524-4908 m Cataclastic rocks and selected explaining variables H2O Quartz Al2O3 Catacl. Sus. Th.Cond. Carbon Sulfur rocks [%] [103 SI] [W*K-1*m -1] [wt.-%] [wt.-%] [wt.-%] [wt.-%] [wt.-%] 0 50 100 2 2.5 3 0 0.5 1 0 10 20 30 Na2O [wt.-%] MgO [wt.-%] 2 4 6 8 Cr [ppm] 0 300 4500 Depth [m] 4600 4700 4800 4900 5000 0 2 4 0 0.05 0.1 0 1 2 3 10 15 20 2 6 10 Abbildung 3: Anteil kataklastischer Gesteine im Bohrklein sowie ausgesuchte petrophysikalische und geochemische Variable für eine Kataklasezone im Metabasit (4524 - 4908 m). Tabelle 2: Ergebnis der multiplen linearen Regression für die Kataklasezone im Metabasit (4524 - 4908 m). Zielvariable: LN_CATR. Erklärende Variable in der Modellgleichung: DEPTH, H2O, SUS, Na2O, Konstante. Die damit erklärte Varianz gegenüber der Gesamtvarianz (Bestimmtheitsmaß R² ) beträgt: 0.636. Variable (Constant) DEPTH H2O SUS Na2O Unstandardized Coefficients B -13.036 .002 1.144 .193 .378 Std. Error 2.294 .001 .166 .041 .062 Standardized Coefficients Beta .287 .376 .202 .285 t Sig. -5.684 4.993 7.122 4.711 6.063 .000 .000 .000 .000 .000 30 Frequency Abbildung 4: Ergebnis der multiplen linearen Regression (Kataklasezone im Metabasit, 4524 - 4908 m). Links: Beobachtete und vorhergesagte Werte für ln (CATR [%] + 20 1) sowie die Residuen im Tiefenverlauf. Rechts oben: Histogramm der standardisierten Residuen. Rechts unten: Streuplot der Residuen gegen die vorhergesagten Werte (beide standardisiert). 10 Observed Predicted ln (CATR[%]+1) ln (CATR[ %]+1) Residuals 0 - 3 - 2 -1 4500 Depth [m] 4600 0 2 4 -2 -1 0 1 2 4500 4600 4700 4700 4800 4800 4900 4900 5000 5000 0 1 2 3 Standardized Residuals Standardized Predicted Values 012345 3 2 1 0 -1 -2 -3 -4 - 3 -2 -1 0 1 2 3 Standardized Residuals 42 Ergebnisse Erste Rechenversuche zeigten, daß eine Bedingung der linearen Regression, die Normalverteilung der Residuen, nicht erfüllt ist. Zur Lösung des Problems wurde die Zielvariable transformiert: LN_CATR = ln (CATR [%] +1). Da der Logarithmus nur für positive Werte definiert ist, für die kataklastischen Gesteine aber auch der Wert 0% beobachtet wird, wurde zu jedem Beobachtungswert 1 addiert und dieser dann logarithmiert. Für beide Zonen wurde ein Modell mit einem automatischen Variablenauswahlverfahren unter Einbeziehung von 26 Variablen erstellt. Als Kriterium für die Aufnahme einer Variable in die Modellgleichung dienen statistische Signifikanzprüfungen (Nullhypothesentests, siehe Fahrmeir et al., 1996). Diese Ergebnisse sind in den Tabellen 1 (Gneiszone) und 2 (Metabasitzone) wiedergegeben. Die Koeffizienten β k der Modellgleichung stehen in der Spalte "Unstandardized Coefficients". Ein vergleichbares Maß für den Einfluß der erklärenden Variable auf die Zielvariable sind die "Standardized Coefficients". In den Abbildungen 2 und 4 werden die Beobachtungswerte der Zielvariable LN_CATR mit den vorhergesagten Werten des Modells verglichen. Weiterhin sind jeweils die Residuen und ihre Verteilung aufgetragen. Bei der Metabasitzone ist auch die Tiefe als Variable vertreten, die in diesem Abschnitt den Trend modelliert. Vom statistischen Standpunkt aus gesehen sind beide Ergebnisse akzeptabel: Die Signifikanzprüfung weist nur minimale Abweichungen auf (kleine Werte "Sig." in Tabellen 1 und 2). Die Residuen sind normalverteilt und zeigen keine Strukturen bezüglich der Vorhersagewerte. Zum Verständnis ist es wichtig, daß kein direkter kausaler Zusammenhang zwischen der Zielvariable LN_CATR und den anderen Variablen in der Modellgleichung hergestellt, sondern damit die erklärte Varianz beschrieben wird. Sie beträgt bei der Kataklasezone in Gneis 59 % und bei der in Metabasit 63 %. Tabelle 3: Vergleich von Ergebnissen der multiplen linearen Regression mit Erwartungen (nach Rauen et al., 1994 und Zulauf et al. 1999). Plus bzw. Minus kennzeichnen eine Zu- bzw. Abnahme einer Variable in der Kataklasezone. Null bedeutet, daß kein Zusammenhang gefunden wurde. Das Fragezeichen in der Erwartungsspalte bedeutet, daß hierzu keine Angaben vorliegen. Vergleich: ⇔ Erwartung bestätigt. Mit H2O wurde eine gemeinsame, signifikante Variable in beiden Lithologien gefunden. Ergebnis für Vergleich Gneis Erwartung für Gneis Variable Erwartung für Metabasit + ⇔ + C + + ⇔ + H2O *) + 0 Na2O + ? S ? + Th 0 0 ? SUS + + ? Thermal conductivity ? *) Signifikante Variable in beiden Lithologien Vergleich ⇔ ⇔ Ergebnis für Metabasit 0 + + 0 0 + 0 43 Zusammenfassende Diskussion Mit multipler linearer Regression von Bohrkleindaten der KTB Hauptbohrung wurden charakteristische Variablen für zwei Kataklasezonen errechnet. In Tabelle 3 sind die Ergebnisse für die beiden Lithologien Gneis und Metabasit zusammengefaßt und werden mit den Erwartungen aus bisherigen Untersuchungen verglichen (Rauen et al., 1994; Zulauf et al., 1999). Es sind jeweils die Vorzeichen der Koeffizienten für die betreffende Variable in der Modellgleichung angegeben. Positive Koeffizienten beschreiben eine Zunahme des jeweiligen Variablenwerts mit höherem Kataklaseanteil im Bohrklein und negative bedeuten eine Abnahme. Neben den Unterschieden in beiden Zonen findet sich mit dem Kristallwasser auch eine gemeinsame Variable, die für Kataklasezonen in beiden Lithologien charakteristisch ist. Diese Ergebnisse sollen unter Einbeziehung von Bohrlochmessungen an weiteren Kataklasezonen der KTB Hauptbohrung sowie anderen Kristallinbohrungen verifiziert werden. Von unserer Arbeitsgruppe wird eine methodische Weiterentwicklung der statistischen Verfahren unter besonderer Berücksichtigung der speziellen Struktur von bohrungsbezogenen Daten angestrebt. So ist eine Korrektur der Autokorrelation und die Einführung von mit der Tiefe variierenden Koeffizienten vorgesehen. Aus der Sicht der statistischen Bearbeitung kann heute schon die Empfehlung gegeben werden, bei künftigen Bohrungen möglichst alle Messungen an identischen Proben in gleichen Tiefen durchzuführen, wie es bei den Bohrkleinuntersuchungen im KTB-Feldlabor schon teilweise verwirklicht wurde. Damit erleichtert man die Erstellung einer einheitlichen Datenmatrix erheblich. Danksagung Wir danken Herrn A. Jerak für die Mithilfe bei der Durchführung der Rechnungen sowie der Deutschen Forschungsgemeinschaft (DFG) für die Unterstützung des Projekts (Geschäftszeichen So 72/60). Literatur Fahrmeir, L., A. Hammerle, G. Tutz (1996). Multivariate statistische Verfahren. DeGruyter, Berlin. Rauen, A., J. Duyster, S. Heikamp, A. Kontny, G. Nover, T. Röckel (1994). Electrical conductivity of a KTB core from 7000 m effects of cracks and ore minerals. Scientific Drilling, 5, 197-206. Zulauf, G., S. Palm, R. Petschick, O. Spies (1999). Element mobility and volumetric strain in brittle-viscous shear zones of the superdeep well KTB. Chemical Geology, 156, 135-149. 44