Beispiel (Dr. S. Gräff, Institut 340, Uni Hohenheim, im Februar 2003): Der Fall Mittels Reflexionsmessungen wird versucht, den N-Ernährungsstatus von Pflanzen zu charakterisieren. Hypothese: die Reflexion einer Pflanze ändert sich ab einer bestimmten NKonzentration in der TM. Beim gegebenen Beispiel handelt es sich um Maispflanzen, die ab einer Konzentration von N < 3 % in der TM im Mangel sind (Optimum- und Mangelwerte sind definiert in der Literatur). Es wurde ein Feldversuch angelegt, mit 6 unterschiedlichen N-Düngungsstufen (0, 20, 40, 80, 120, 160 kg N ha-1). Die Reflexion der Maispflanzen wird zu unterschiedlichen Zeitpunkten in der Vegetationsperiode gemessen. Von der gemessenen Pflanze wird anschließend chemisch die tatsächlich vorliegende NKonzentration ermittelt. Im gegebenen Beispiel ändert sich der Reflexionsparameter Eb, wenn die NKonzentration in der TM 3 % unterschreitet. Über eine mathematische Funktion wird versucht die Änderung des Reflexionsparameters unter verschiedenen NKonzentrationen in der TM zu beschreiben. Über die angepasste Funktion soll ein Rückschluss gezogen werden, ob bei der Maispflanze ein Stickstoffmangel vorliegt und eine N-Düngung erfolgen muss, oder nicht. Die Daten sind in Abb. 1 geplottet. N (%) 6 5 4 3 2 1 0 2 4 6 8 10 12 14 Eb Abb. 1: Plot der Stickstoffgehalte [N (%)] gegen die Reflexionsmessung [Eb] Eine mögliche Auswertungsstrategie Das Ziel der Auswertung ist eine Vorhersage des N-Gehaltes aus der Reflexionsmessung (Eb). Daher ist eine Regression mit N (%) als Zielvariable und Eb als Prädiktorvariable sinnvoll. Sodann ist es von Interesse, denjenigen Wert der Reflexion zu bestimmen, für den der erwartete N Gehalt gleich 3% ist (Schwelle für N Mangel aus Literatur). Dieser Reflexionswert ist dann der Schwellenwert für die Reflexion, dessen Überschreitung einen N-Mangel anzeigt. Das gestellte Problem ist das einer inversen Regression (siehe B 6.2.2). Wir werden hier zeigen, wie das Problem mit Hilfe eines geeignet parametrisierten nichtlinearen Modells zu lösen ist. Aus Abb. 1 ergibt sich der Eindruck einer nichtlinearen Beziehung. Diesen Eindruck prüfen wir zunächst mittels eines Polynoms 2. Grades (y = N-Gehalt in %, x = Eb). Dependent Variable: Y Source X X*X DF Type I SS Mean Square F Value Pr > F 1 1 107.6569677 3.3737463 107.6569677 3.3737463 221.06 6.93 <.0001 0.0093 Der quadratische Term ist signifikant, was auf eine Abweichung von der Linearität hinweist. Die Daten in Abb. 1 könnten durch eine Exponentialfunktion der Form y = exp(x) zu beschreiben sein. In diesem Fall lässt sich das Modell durch eine logarithmische Transformation linearisieren: y' = log(y) = log() + x (1) wobei log() der Logarithmus zur Basis e ist. Wir plotten y' = log(y) gegen x. Es ergibt sich eine nahezu lineare Beziehung (Abb. 2). log[N (%)] 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0 2 4 6 8 10 12 14 Eb Abb. 2: Plot der logarithmierten Stickstoffgehalte [N Reflexionsmessung [Eb] mit angepasster Regressionsgerade. (%)] gegen die Anpassung eines Polynoms zweiten Grades für die Regression von y' auf x ergibt, dass nur noch der lineare Term signifikant ist, was sich mit dem Eindruck aus Abb. 2 deckt. Dependent Variable: log_Y Source X X*X DF Type I SS Mean Square F Value Pr > F 1 1 13.75853306 0.06165170 13.75853306 0.06165170 338.46 1.52 <.0001 0.2200 Dies Ergebnis führt uns dazu, fortan das exponentielle Modell anzunehmen, dessen Analyse auf der logarithmierten Skala durch eine einfache lineare Regression zu erhalten ist. Die Parameterschätzungen auf der logarithmischen Skale für y sind: Dependent Variable: log_Y Source DF Sum of Squares Mean Square F Value Pr > F Model Error 1 156 13.75853306 6.36244737 13.75853306 0.04078492 337.34 <.0001 Parameter Estimate Standard Error t Value Pr > |t| Intercept X 1.528864716 -0.103686881 0.02129310 0.00564531 71.80 -18.37 <.0001 <.0001 Somit ist das Modell: log yˆ 1,52886 0.10369x Wollen wir nun denjenigen Wert der Reflexion (x) ermitteln, für den der erwartete NGehalt gleich 3% ist, so ist folgende Gleichung zu lösen: log 3 1,52886 0.10369 x Auflösen nach x ergibt: x 1,52886 log 3 4,14937 0.10369 Die geschätzte Reflexion, bei welcher der erwartete N-Gehalt gleich 3% ist, beträgt somit Eb = 4,14937 Nun ist dies nur eine Schätzung, und es ist daher geboten, ein Vertrauensintervall zu berechnen. Hierzu kann das in B 6.2.2 beschriebene Verfahren verwendet werden, was allerdings etwas aufwendig ist. Einfacher ist es, einen alternativen Weg zu verfolgen, der jetzt beschrieben wird. Die Idee besteht darin, das lineare Modell so zu reparametrisieren, dass es den interessierenden Schwellenwert für die Reflexion als Parameter enthält. Hierzu setzen wir für y den Schwellenwert ys = 3% ein und finden y s log y s x s wobei ' = log() ist und xs den Schwellenwert der Reflexion bezeichnet. Dies lösen wir nach auf: log y s xs Setzen wir dies in das lineare Modell (1) ein, so finden wir log y y log y s x xs Dieses reparametrisierte Modell hat nun den interessierenden Schwellenwert xs als Parameter (neben dem Parameter '). Wir können dieses Modell nun nutzen, um den gesuchten Schwellenwert direkt zu schätzen. Hierbei ist zu beachten, dass das reparametrisierte Modell (2) nichtlinear in den Parametern ist und sich nicht durch eine einfache Transformation linearisieren lässt. Also müssen wir ein Verfahren zur eigentlichen nichtlinearen Regression verwenden. Wir verwenden die NLIN Prozedur von SAS. Da wir die Parameter bereits für das Modell (1) geschätzt haben, sind wir hier in der komfortablen Situation, perfekte Startwerte für die Parameter zu haben. Am geschätzten Modell ändert sich durch die Reparametrisierung nichts, aber wir bekommen zusätzlich ein 95% Vertrauensintervall für alle Parameter angegeben, so auch für den interessierenden Schwellenwert xs. proc nlin data=daten; parms a_prime=1.53 x_s=4.15; model log_y=a_prime + x*(log(3)-a_prime)/x_s; run; Ergebnis: DF Sum of Squares Mean Square Regression Residual Uncorrected Total 2 156 158 269.5 6.3624 275.8 134.7 0.0408 Corrected Total 157 20.1210 Source Parameter a_prime x_s Estimate Approx Std Error 1.5289 4.1495 0.0213 0.1798 1.0000000 0.3175929 Approx Pr > F 337.34 <.0001 Approximate 95% Confidence Limits 1.4868 3.7944 Approximate Correlation Matrix a_prime a_prime x_s F Value 1.5709 4.5047 x_s 0.3175929 1.0000000 Man beachte, dass das MQFehler dasselbe ist wie für die lineare Regression nach (1). Dies ist zu erwarten, da die Modelle (1) und (2) äquivalent sind. Die Schätzung für den Schwellenwert der Reflexion ist x s 4,1495 , was bis auf Rundungsfehler identisch ist mit der linearen Regression. Das 95%-Vertrauensintervall hat die Grenzen 3,79 und 4,51. Bemerkung Eine verfeinerte Analyse wird die Versuchsanlage (Blockbildung, applizierte NStufen) sowie die verschiedenen Messzeitpunkte durch ein entsprechend erweitertes Modell berücksichtigen. Daten N_ Eb_510 Y X 1.100 1.218 1.230 1.330 1.410 1.430 1.440 1.591 1.591 1.637 1.648 1.830 1.982 2.082 2.120 2.122 2.150 2.183 2.217 2.232 2.336 2.420 2.458 2.478 2.531 2.534 2.564 2.590 2.625 2.652 2.690 2.722 2.817 2.834 2.863 2.942 2.984 2.989 3.042 3.094 3.121 3.124 3.146 3.173 3.199 3.237 3.264 3.311 3.342 3.346 3.363 3.366 3.430 3.443 3.463 3.469 3.495 3.503 3.504 3.538 3.600 3.612 3.618 3.632 3.641 3.653 3.653 3.671 3.675 3.708 3.729 3.793 3.821 3.912 3.919 7.6667 10.6667 13.6667 12.6667 9.6700 12.6667 9.6700 9.0000 7.0000 9.6700 9.0000 11.0000 3.2500 6.2500 7.0000 5.2500 10.0000 3.2500 3.2500 4.2500 7.0000 5.0000 11.0000 3.2500 2.0000 3.2500 2.2500 4.0000 2.2500 5.0000 2.0000 1.2500 4.2500 3.2500 1.2500 3.2500 1.2500 1.5000 3.7500 4.2500 0.5000 1.2500 1.2500 2.7500 2.2500 2.2500 1.2500 1.5000 0.5000 1.5000 2.5000 3.2500 2.2500 2.7500 0.2500 1.7500 1.5000 1.2500 2.2500 3.2500 0.2500 1.5000 5.5000 4.5000 5.5000 0.5000 0.2500 0.2500 0.5000 1.7500 0.2500 2.7500 0.2500 0.7500 1.5000 3.977 4.002 4.009 4.014 4.024 4.033 4.041 4.049 4.052 4.053 4.063 4.087 4.097 4.130 4.160 4.205 4.213 4.264 4.273 4.275 4.279 4.331 4.371 4.377 4.394 4.401 4.407 4.429 4.483 4.512 4.537 4.593 4.600 4.625 4.650 4.670 4.680 4.684 4.695 4.699 4.710 4.722 4.750 4.753 4.759 4.760 4.764 4.768 4.772 4.773 4.792 4.793 4.797 4.826 4.836 4.875 4.876 4.877 4.880 4.880 4.893 4.894 4.915 4.925 4.932 4.935 4.950 4.982 4.987 4.988 4.994 5.002 5.029 5.058 5.071 5.082 0.5000 3.5000 1.2500 0.2500 0.5000 0.5000 0.7500 1.2500 1.2500 0.7500 1.5000 1.5000 3.5000 0.2500 0.7500 0.7500 0.5000 1.7500 1.5000 0.7500 1.5000 1.2500 2.5000 0.2500 0.2500 1.2500 1.2500 0.7500 0.2500 2.5000 0.7500 1.0000 1.7500 0.2500 0.2500 2.7500 0.7500 0.7500 1.7500 0.2500 1.2500 0.7500 1.5000 0.0000 0.2500 1.7500 0.2500 1.7500 0.7500 0.7500 0.2500 1.0000 2.2500 1.7500 1.0000 1.2500 2.2500 1.0000 2.2500 3.0000 2.0000 0.0000 1.0000 0.7500 2.0000 0.0000 2.7500 2.0000 1.0000 0.0000 1.7500 0.2500 0.2500 0.7500 1.2500 1.2500 5.097 5.112 5.119 5.137 5.189 5.293 5.303 1.7500 1.0000 0.7500 0.0000 1.2500 1.0000 0.2500