Fallstudie 1

Werbung
Beispiel (Dr. S. Gräff, Institut 340, Uni Hohenheim, im Februar 2003):
Der Fall
Mittels Reflexionsmessungen wird versucht, den N-Ernährungsstatus von Pflanzen
zu charakterisieren.
Hypothese: die Reflexion einer Pflanze ändert sich ab einer bestimmten NKonzentration in der TM.
Beim gegebenen Beispiel handelt es sich um Maispflanzen, die ab einer
Konzentration von N < 3 % in der TM im Mangel sind (Optimum- und Mangelwerte
sind definiert in der Literatur).
Es wurde ein Feldversuch angelegt, mit 6 unterschiedlichen N-Düngungsstufen (0,
20, 40, 80, 120, 160 kg N ha-1). Die Reflexion der Maispflanzen wird zu
unterschiedlichen Zeitpunkten in der Vegetationsperiode gemessen. Von der
gemessenen Pflanze wird anschließend chemisch die tatsächlich vorliegende NKonzentration ermittelt.
Im gegebenen Beispiel ändert sich der Reflexionsparameter Eb, wenn die NKonzentration in der TM 3 % unterschreitet. Über eine mathematische Funktion wird
versucht die Änderung des Reflexionsparameters unter verschiedenen NKonzentrationen in der TM zu beschreiben. Über die angepasste Funktion soll ein
Rückschluss gezogen werden, ob bei der Maispflanze ein Stickstoffmangel vorliegt
und eine N-Düngung erfolgen muss, oder nicht.
Die Daten sind in Abb. 1 geplottet.
N (%)
6
5
4
3
2
1
0
2
4
6
8
10
12
14
 Eb
Abb. 1: Plot der Stickstoffgehalte [N (%)] gegen die Reflexionsmessung [Eb]
Eine mögliche Auswertungsstrategie
Das Ziel der Auswertung ist eine Vorhersage des N-Gehaltes aus der
Reflexionsmessung (Eb). Daher ist eine Regression mit N (%) als Zielvariable und
Eb als Prädiktorvariable sinnvoll. Sodann ist es von Interesse, denjenigen Wert der
Reflexion zu bestimmen, für den der erwartete N Gehalt gleich 3% ist (Schwelle für N
Mangel aus Literatur). Dieser Reflexionswert ist dann der Schwellenwert für die
Reflexion, dessen Überschreitung einen N-Mangel anzeigt.
Das gestellte Problem ist das einer inversen Regression (siehe B 6.2.2). Wir werden
hier zeigen, wie das Problem mit Hilfe eines geeignet parametrisierten nichtlinearen
Modells zu lösen ist.
Aus Abb. 1 ergibt sich der Eindruck einer nichtlinearen Beziehung. Diesen Eindruck
prüfen wir zunächst mittels eines Polynoms 2. Grades (y = N-Gehalt in %, x = Eb).
Dependent Variable: Y
Source
X
X*X
DF
Type I SS
Mean Square
F Value
Pr > F
1
1
107.6569677
3.3737463
107.6569677
3.3737463
221.06
6.93
<.0001
0.0093
Der quadratische Term ist signifikant, was auf eine Abweichung von der Linearität
hinweist. Die Daten in Abb. 1 könnten durch eine Exponentialfunktion der Form
y =  exp(x)
zu beschreiben sein. In diesem Fall lässt sich das Modell durch eine logarithmische
Transformation linearisieren:
y' = log(y) = log() + x
(1)
wobei log() der Logarithmus zur Basis e ist. Wir plotten y' = log(y) gegen x. Es ergibt
sich eine nahezu lineare Beziehung (Abb. 2).
log[N (%)]
1.7
1.6
1.5
1.4
1.3
1.2
1.1
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0
2
4
6
8
10
12
14
 Eb
Abb. 2: Plot der logarithmierten Stickstoffgehalte [N
Reflexionsmessung [Eb] mit angepasster Regressionsgerade.
(%)]
gegen
die
Anpassung eines Polynoms zweiten Grades für die Regression von y' auf x ergibt,
dass nur noch der lineare Term signifikant ist, was sich mit dem Eindruck aus Abb. 2
deckt.
Dependent Variable: log_Y
Source
X
X*X
DF
Type I SS
Mean Square
F Value
Pr > F
1
1
13.75853306
0.06165170
13.75853306
0.06165170
338.46
1.52
<.0001
0.2200
Dies Ergebnis führt uns dazu, fortan das exponentielle Modell anzunehmen, dessen
Analyse auf der logarithmierten Skala durch eine einfache lineare Regression zu
erhalten ist. Die Parameterschätzungen auf der logarithmischen Skale für y sind:
Dependent Variable: log_Y
Source
DF
Sum of
Squares
Mean Square
F Value
Pr > F
Model
Error
1
156
13.75853306
6.36244737
13.75853306
0.04078492
337.34
<.0001
Parameter
Estimate
Standard
Error
t Value
Pr > |t|
Intercept
X
1.528864716
-0.103686881
0.02129310
0.00564531
71.80
-18.37
<.0001
<.0001
Somit ist das Modell:
log  yˆ   1,52886  0.10369x
Wollen wir nun denjenigen Wert der Reflexion (x) ermitteln, für den der erwartete NGehalt gleich 3% ist, so ist folgende Gleichung zu lösen:
log 3  1,52886  0.10369 x
Auflösen nach x ergibt:
x
1,52886  log 3
 4,14937
0.10369
Die geschätzte Reflexion, bei welcher der erwartete N-Gehalt gleich 3% ist, beträgt
somit
Eb = 4,14937
Nun ist dies nur eine Schätzung, und es ist daher geboten, ein Vertrauensintervall zu
berechnen. Hierzu kann das in B 6.2.2 beschriebene Verfahren verwendet werden,
was allerdings etwas aufwendig ist. Einfacher ist es, einen alternativen Weg zu
verfolgen, der jetzt beschrieben wird.
Die Idee besteht darin, das lineare Modell so zu reparametrisieren, dass es den
interessierenden Schwellenwert für die Reflexion als Parameter enthält. Hierzu
setzen wir für y den Schwellenwert ys = 3% ein und finden
y s  log  y s      x s
wobei ' = log() ist und xs den Schwellenwert der Reflexion bezeichnet. Dies lösen
wir nach  auf:

log  y s    
xs
Setzen wir dies in das lineare Modell (1) ein, so finden wir
log  y   y     
log  y s    
x
xs
Dieses reparametrisierte Modell hat nun den interessierenden Schwellenwert xs als
Parameter (neben dem Parameter '). Wir können dieses Modell nun nutzen, um
den gesuchten Schwellenwert direkt zu schätzen. Hierbei ist zu beachten, dass das
reparametrisierte Modell (2) nichtlinear in den Parametern ist und sich nicht durch
eine einfache Transformation linearisieren lässt. Also müssen wir ein Verfahren zur
eigentlichen nichtlinearen Regression verwenden.
Wir verwenden die NLIN Prozedur von SAS. Da wir die Parameter bereits für das
Modell (1) geschätzt haben, sind wir hier in der komfortablen Situation, perfekte
Startwerte für die Parameter zu haben. Am geschätzten Modell ändert sich durch die
Reparametrisierung nichts, aber wir bekommen zusätzlich ein 95%
Vertrauensintervall für alle Parameter angegeben, so auch für den interessierenden
Schwellenwert xs.
proc nlin data=daten;
parms a_prime=1.53 x_s=4.15;
model log_y=a_prime + x*(log(3)-a_prime)/x_s;
run;
Ergebnis:
DF
Sum of
Squares
Mean
Square
Regression
Residual
Uncorrected Total
2
156
158
269.5
6.3624
275.8
134.7
0.0408
Corrected Total
157
20.1210
Source
Parameter
a_prime
x_s
Estimate
Approx
Std Error
1.5289
4.1495
0.0213
0.1798
1.0000000
0.3175929
Approx
Pr > F
337.34
<.0001
Approximate 95% Confidence
Limits
1.4868
3.7944
Approximate Correlation Matrix
a_prime
a_prime
x_s
F Value
1.5709
4.5047
x_s
0.3175929
1.0000000
Man beachte, dass das MQFehler dasselbe ist wie für die lineare Regression nach (1).
Dies ist zu erwarten, da die Modelle (1) und (2) äquivalent sind.
Die Schätzung für den Schwellenwert der Reflexion ist x s  4,1495 , was bis auf
Rundungsfehler identisch ist mit der linearen Regression.
Das 95%-Vertrauensintervall hat die Grenzen 3,79 und 4,51.
Bemerkung
Eine verfeinerte Analyse wird die Versuchsanlage (Blockbildung, applizierte NStufen) sowie die verschiedenen Messzeitpunkte durch ein entsprechend erweitertes
Modell berücksichtigen.
Daten
N_
Eb_510
Y
X
1.100
1.218
1.230
1.330
1.410
1.430
1.440
1.591
1.591
1.637
1.648
1.830
1.982
2.082
2.120
2.122
2.150
2.183
2.217
2.232
2.336
2.420
2.458
2.478
2.531
2.534
2.564
2.590
2.625
2.652
2.690
2.722
2.817
2.834
2.863
2.942
2.984
2.989
3.042
3.094
3.121
3.124
3.146
3.173
3.199
3.237
3.264
3.311
3.342
3.346
3.363
3.366
3.430
3.443
3.463
3.469
3.495
3.503
3.504
3.538
3.600
3.612
3.618
3.632
3.641
3.653
3.653
3.671
3.675
3.708
3.729
3.793
3.821
3.912
3.919
7.6667
10.6667
13.6667
12.6667
9.6700
12.6667
9.6700
9.0000
7.0000
9.6700
9.0000
11.0000
3.2500
6.2500
7.0000
5.2500
10.0000
3.2500
3.2500
4.2500
7.0000
5.0000
11.0000
3.2500
2.0000
3.2500
2.2500
4.0000
2.2500
5.0000
2.0000
1.2500
4.2500
3.2500
1.2500
3.2500
1.2500
1.5000
3.7500
4.2500
0.5000
1.2500
1.2500
2.7500
2.2500
2.2500
1.2500
1.5000
0.5000
1.5000
2.5000
3.2500
2.2500
2.7500
0.2500
1.7500
1.5000
1.2500
2.2500
3.2500
0.2500
1.5000
5.5000
4.5000
5.5000
0.5000
0.2500
0.2500
0.5000
1.7500
0.2500
2.7500
0.2500
0.7500
1.5000
3.977
4.002
4.009
4.014
4.024
4.033
4.041
4.049
4.052
4.053
4.063
4.087
4.097
4.130
4.160
4.205
4.213
4.264
4.273
4.275
4.279
4.331
4.371
4.377
4.394
4.401
4.407
4.429
4.483
4.512
4.537
4.593
4.600
4.625
4.650
4.670
4.680
4.684
4.695
4.699
4.710
4.722
4.750
4.753
4.759
4.760
4.764
4.768
4.772
4.773
4.792
4.793
4.797
4.826
4.836
4.875
4.876
4.877
4.880
4.880
4.893
4.894
4.915
4.925
4.932
4.935
4.950
4.982
4.987
4.988
4.994
5.002
5.029
5.058
5.071
5.082
0.5000
3.5000
1.2500
0.2500
0.5000
0.5000
0.7500
1.2500
1.2500
0.7500
1.5000
1.5000
3.5000
0.2500
0.7500
0.7500
0.5000
1.7500
1.5000
0.7500
1.5000
1.2500
2.5000
0.2500
0.2500
1.2500
1.2500
0.7500
0.2500
2.5000
0.7500
1.0000
1.7500
0.2500
0.2500
2.7500
0.7500
0.7500
1.7500
0.2500
1.2500
0.7500
1.5000
0.0000
0.2500
1.7500
0.2500
1.7500
0.7500
0.7500
0.2500
1.0000
2.2500
1.7500
1.0000
1.2500
2.2500
1.0000
2.2500
3.0000
2.0000
0.0000
1.0000
0.7500
2.0000
0.0000
2.7500
2.0000
1.0000
0.0000
1.7500
0.2500
0.2500
0.7500
1.2500
1.2500
5.097
5.112
5.119
5.137
5.189
5.293
5.303
1.7500
1.0000
0.7500
0.0000
1.2500
1.0000
0.2500
Herunterladen