TECHNISCHE UNIVERSITÄT MÜNCHEN-WEIHENSTEPHAN MATHEMATIK UND STATISTIK INFORMATIONS- UND DOKUMENTATIONSZENTRUM Residuenanalyse R. KRAFT Grafische Residuenanalyse Biometrische und Ökonometrische Methoden I WS 99/00 Histogramm Wahrscheinlichkeitsplot Residuenplot Test auf Normalverteilung der Residuen Shapiro-Wilk-Test Anderson-Darling-Test Test auf Autokorrelation der Residuen Durbin-Watson-Test Residuenanalyse Test auf Zufälligkeit der Residuen Runs-Test Residuenanalyse KRAFT Residuenanalyse KRAFT Preis - Motorleistung Regression Preis - Motorleistung Residuen MTB > Regress 'DM' 1 'kW'; SUBC> Fits 'Fits'; SUBC> Residuals 'Res.'; SUBC> SResiduals 'St.Res.'; SUBC> GHistogram; SUBC> GNormalplot; SUBC> GFits; SUBC> GOrder. MTB > Print 'kW' 'DM' 'Fits' 'Res.' 'St.Res.'. Data Display Row kW DM Fits Res. St.Res. 1 2 3 4 5 6 7 8 9 74 92 110 142 75 85 110 125 142 38000 41600 48100 53600 38600 42100 48600 52200 57200 38410.3 43038.4 47666.6 55894.4 38667.4 41238.6 47666.6 51523.3 55894.4 -410.31 -1438.44 433.43 -2294.35 -67.43 861.38 933.43 676.66 1305.65 -0.38177 -1.21645 0.35969 -2.20767 -0.06225 0.74797 0.77462 0.58190 1.25631 Regression Analysis The regression equation is DM = 19384 + 257 kW Predictor Coef Constant 19384 kW 257.12 StDev 1863 17.09 T 10.40 15.04 P 0.000 0.000 60000 S = 1280 R-Sq = 97.0% R-Sq(adj) = 96.6% 55000 Analysis of Variance Preis [DM] Source DF SS MS F P Regression 1 370670207 370670207 226 0.000 Error 7 11469793 1638542 Total 8 382140000 Unusual Observations Obs kW DM Fit StDev Fit Residual St Resid 4 142 53600 55894 747 -2294 -2.21R 50000 45000 40000 35000 70 80 90 100 110 120 130 140 150 Leistung [kW] Residuenanalyse KRAFT Residuenanalyse KRAFT Preis - Motorleistung Grafische Residuenanalyse Preis - Motorleistung Grafische Residuenanalyse Histogramm Residuenplot (Residuen gegen Schätzwerte) Histogram of the Residuals Residuals Versus the Fitted Values (response is DM) (response is DM) 2 0 Residual Frequency 1000 1 -1000 -2000 0 -2500 -2000 -1500 -1000 -500 -0 500 1000 1500 40000 45000 Residual 50000 55000 Fitted Value Wahrscheinlichkeitsplot Residuenplot (Residuen gegen Reihenfolge) Normal Probability Plot of the Residuals Residuals Versus the Order of the Data (response is DM) (response is DM) 1.5 1000 0.5 Residual Normal Score 1.0 0.0 -0.5 0 -1000 -1.0 -2000 -1.5 -2000 -1000 0 1 1000 Residual Residuenanalyse 2 3 4 5 6 7 8 9 Observation Order KRAFT Residuenanalyse KRAFT Modellvoraussetzungen Shapiro-Wilk-Test auf Normalverteilung Regressionsmodell: y i ' b0 % b1xi % ê i ' ŷi % ê i ei normalverteilt E(ei) = 0 Var(ei) = F2 Cov(ei,ej) = 0 H0: Residuen normalverteilt H1: Residuen nicht normalverteilt Residuen sind normalverteilt mit Erwartungswert 0 und Varianz F2 keine Autokorrelation Zufälligkeit der Residuen Residuen Shapiro-Wilk-Test auf Normalverteilung Durbin-Watson-Test auf Autokorrelation Runs-Test auf Zufälligkeit 6 normal scores (Normalwerte) Quantilen der Standardnormalverteilung i&3/8 N &1 n%1/4 Bestimmung der Korrelation r Residuen - normal scores H0 ablehnen, wenn r < rkrit. rkrit. aus Tabelle oder Standardisierte Residuen êi & E(ei) si ' Residuenanalyse êi & 0 si ' êi rkrit..1.0071& 0.1371 0.3682 0.7780 & % n n2 n für " = 0.10 rkrit..1.0063& 0.1288 0.6118 1.3505 & % n n2 n für " = 0.05 rkrit..0.9963& 0.0211 1.4106 3.1791 & % n n2 n für " = 0.01 (0,1)-normalverteilt si KRAFT Residuenanalyse KRAFT Preis - Motorleistung Shapiro-Wilk-Test Preis - Motorleistung Test auf Normalverteilung der Residuen MTB > Let 'NScores' = NSCOR('Res.') MTB > Print 'Res.' 'NScores'. Shapiro-Wilk-Test auf Normalverteilung der Residuen Data Display .999 .99 1 2 3 4 5 6 7 8 9 Res. -410.31 -1438.44 433.43 -2294.35 -67.43 861.38 933.43 676.66 1305.65 .95 NScores Probability Row -0.56961 -0.93004 0.00000 -1.49513 -0.27322 0.56961 0.93004 0.27322 1.49513 .80 .50 .20 .05 .01 .001 -2000 -1000 0 1000 Res. Average: -0.0000000 StDev: 1197.38 N: 9 MTB > Correlation 'Res.' 'NScores'. W-test for Normality R: 0.9505 P-Value (approx): > 0.1000 Anderson-Darling-Test auf Normalverteilung der Residuen Correlations (Pearson) .999 Correlation of Res. and NScores = 0.950 .99 n " = 10% " = 5% " = 1% 5 10 15 20 25 30 0.9033 0.9347 0.9506 0.9600 0.9662 0.9707 0.8804 0.9180 0.9383 0.9503 0.9582 0.9639 0.8320 0.8804 0.9110 0.9290 0.9408 0.9490 Probability .95 .50 .20 .05 .01 .001 -2000 -1000 0 1000 Res. H0 auf 5% Signifikanzniveau nicht ablehnen, da r = 0.950 nicht kleiner ist als rkrit. = 0.918 (bei n = 10). Residuenanalyse .80 KRAFT Average: -0.0000000 StDev: 1197.38 N: 9 Residuenanalyse Anderson-Darling Normality Test A-Squared: 0.425 P-Value: 0.244 KRAFT Durbin-Watson-Test auf Autokorrelation Preis - Motorleistung Test auf Autokorrelation der Residuen Autokorrelationskoeffizient n r ' Corr(ei,ei&1) ' j e i e i &1 1000 i '2 n 2 0 e_i j e i &1 i '2 -1000 Durbin-Watson-Testgröße -2000 n dw ' 2 j (e i & ei&1) -2000 -1000 i '2 n 0 1000 e_(i-1) 2 j ei MTB > Regress 'DM' 1 'kW'; SUBC> DW. i '2 dw . 2 @ (1 & r) Regression Analysis [ ... ] Unschärfebereich positive Autokorr. 0 dwu dw < dwu dw > 4 ! dwu dwo < dw < 4 !dwo sonst Unschärfebereich keine Autokorr. dwo 2 Durbin-Watson statistic = 1.59 negative Autokorr. 4-dwo 4-dwu 4 positive Autokorrelation negative Autokorrelation keine Autokorrelation keine Aussage möglich n = 9: n dwu dwo 06 07 08 09 10 0.61 0.70 0.76 0.82 0.88 1.40 1.36 1.33 1.32 1.32 dwu = 0.82, dwo = 1.32 dwo = 1.32 < 1.59 < 2.68 = 4 ! dwo, also keine Autokorrelation Residuenanalyse KRAFT Residuenanalyse KRAFT Runs-Test auf Zufälligkeit Preis - Motorleistung Test auf Zufälligkeit der Residuen Runs-Test prüft die Zufälligkeit der Anordnung einer beliebigen Stichprobe Residuals Versus the Order of the Data (response is DM) Run: Folge von Stichprobenwerten größer oder kleiner als eine Konstante k (meist k = 0) 1000 Residual 0 Anzahl der Runs sollte bei zufälliger Verteilung der Residuen eines Regressionsmodells um den Wert k = 0 hoch sein, da die Werte möglichst abwechselnd um den Erwartunswert 0 schwanken sollten -1000 -2000 1 Vergleich der beobachteten Anzahl von Runs mit der erwarteten Anzahl von Runs p-Wert ist die Wahrscheinlichkeit, die beobachtete Anzahl von Runs oder eine kleinere zu erhalten (Approximation über Normalverteilung) 2 3 4 5 6 7 8 9 Observation Order MTB > Runs 0 'Res.'. Runs Test Res. K = 0.0000 The observed number of runs = 4 The expected number of runs = 5.4444 5 Observations above K 4 below * N Small -- The following approximation may be invalid The test is significant at 0.2964 Cannot reject at alpha = 0.05 Residuenanalyse KRAFT Residuenanalyse KRAFT Herbizidabbau im Boden Herbizidabbau - Lineares Modell MTB > Print 't_days' 'c_ppm'. c ' c0 % m @ t ' 65.6 ppm & 2.72 Data Display Row t_days c_ppm 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 99 94 76 66 55 53 46 38 32 28 23 22 19 17 14 14 10 10 8 7 6 5 5 4 4 3 3 2 2 1 1 Residuenanalyse ppm @t day MTB > Regress 'c_ppm' 1 't_days'; SUBC> Fits 'Fits'; SUBC> SResiduals 'St.Res.'; SUBC> DW. Regression Analysis The regression equation is c_ppm = 65.6 - 2.72 t_days Predictor Constant t_days S = 13.33 Coef 65.550 -2.7206 StDev 4.674 0.2677 R-Sq = 78.1% T 14.02 -10.16 P 0.000 0.000 R-Sq(adj) = 77.3% Analysis of Variance Source Regression Error Total DF 1 29 30 SS 18356 5152 23508 MS 18356 178 F 103.32 P 0.000 Durbin-Watson statistic = 0.10 KRAFT Residuenanalyse KRAFT Herbizidabbau - Lineares Modell Grafische Residuenanalyse Herbizidabbau - Residuenplot für lineares Modell I Chart of Residuals 3 2 2 Residual Residual Normal Plot of Residuals 3 1 0 1 1 1 1 3 0 -2 -1 0 1 2 11 0 Normal Score 3 3 1 1 11 1 3.0SL=0.6164 X=0.01463 1 -1 -1 1 12 1 1 1111 1 10 2 2 2 20 -3.0SL=-0.5872 30 Observation Number Histogram of Residuals Residuals vs. Fits 3 9 8 7 6 5 4 3 2 1 0 2 Residual Frequency 1 1 0 -1 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 -20 -10 0 10 20 30 40 50 60 70 Residual Fit Residuenanalyse KRAFT Herbizidabbau - Lineares Modell Shapiro-Wilk-Test auf Normalverteilung der Residuen Herbizidabbau - Shapiro-Wilk-Test für lineares Modell .999 .99 Probability .95 .80 .50 .20 .05 .01 .001 -1 0 1 2 St.Res. Average: 0.0146254 StDev: 1.02917 N: 31 Residuenanalyse W-test for Normality R: 0.9504 P-Value (approx): 0.0101 KRAFT Herbizidabbau - Lineares Modell Durbin-Watson-Test auf Autokorrelation Herbizidabbau - Exponentielles Modell c ' c0 @ 10k @ t Y lg c ' lg c0 % k @ t ' 2.00 ! 0.0604 @ t Y k = 1, n = 31: dwu = 1.36, dwo = 1.50 &1 c ' 100 ppm @ 10!0.06days @ t Anfangskonzentration: c0 ' 100 ppm dw = 0.10 < 1.36 = dwu, also positive Autokorrelation Halbwertszeit: c0 2 ' c0 @ 10 !0.06 days&1 @ tH Y tH ' MTB > Let 'lg c' = LOGT('c_ppm') MTB > Regress 'lg c' 1 't_days'; SUBC> Fits 'Fits'; SUBC> SResiduals 'St.Res.'; SUBC> DW. Herbizidabbau - Lineares Modell Runs-Test auf Zufälligkeit MTB > Runs 'St.Res.'. Regression Analysis Runs Test The regression equation is lg c = 2.00 - 0.0604 t_days St.Res. K = lg 2 days ' 5 days 0.06 Predictor Coef Constant 2.00405 t_days -0.0604261 0.0146 The observed number of runs = 3 The expected number of runs = 16.3548 14 Observations above K 17 below The test is significant at 0.0000 S = 0.0203 StDev 0.00712 0.0004075 R-Sq = 99.9% T 281.57 -148.27 P 0.000 0.000 R-Sq(adj) = 99.9% Analysis of Variance Source Regression Error Total DF 1 29 30 SS 9.0553 0.0119 9.0672 MS 9.0553 0.0004 F 21984.33 P 0.000 Durbin-Watson statistic = 2.58 Residuenanalyse KRAFT Residuenanalyse KRAFT Herbizidabbau - Exponentielles Modell Grafische Residuenanalyse Herbizidabbau - Residuenplot für exponentielles Modell Normal Plot of Residuals I Chart of Residuals 3 Residual Residual 2 1 0 -1 -2 -2 -1 0 1 4 3 2 1 0 -1 -2 -3 -4 2 3.0SL=3.285 X=0.002163 -3.0SL=-3.280 0 10 Normal Score Histogram of Residuals 30 Residuals vs. Fits 3 7 6 5 4 3 2 1 0 2 Residual Frequency 20 Observation Number 1 0 -1 -2 -2.0-1.5-1.0-0.5 0.0 0.5 1.0 1.5 2.0 2.5 0 1 Residual 2 Fit Residuenanalyse KRAFT Herbizidabbau - Exponentielles Modell Anderson-Darling-Test auf Normalverteilung der Residuen Herbizidabbau - Anderson-Darling-Test für exponentielles Modell .999 .99 Probability .95 .80 .50 .20 .05 .01 .001 -2 -1 0 1 2 St.Res. Average: 0.0021635 StDev: 1.01241 N: 31 Residuenanalyse Anderson-Darling Normality Test A-Squared: 0.174 P-Value: 0.919 KRAFT Herbizidabbau - Exponentielles Modell Durbin-Watson-Test auf Autokorrelation Lineares - Exponentielles Modell Herbizidabbau - Lineares Modell k = 1, n = 31: dwu = 1.36, dwo = 1.50 Y = 65.5700 - 2.71615X R-Sq = 77.8 % 4 ! dwo = 2.50 < 2.58 < 2.64 = 4 ! dwu, also keine Aussage über Autokorrelation möglich c_ppm 100 Herbizidabbau - Exponentielles Modell Runs-Test auf Zufälligkeit 50 0 0 10 20 30 t_days MTB > Runs 'St.Res.'. Runs Test Herbizidabbau - Exponentielles Modell St.Res. K = W = Logten(Y) W = 2.00405 - 6.04E-02X R-Sq = 99.9 % 0.0022 100 80 60 The observed number of runs = 17 The expected number of runs = 16.3548 14 Observations above K 17 below The test is significant at 0.8119 Cannot reject at alpha = 0.05 40 c_ppm 30 20 15 10 8.0 6.0 4.0 3.0 2.0 1.5 0 10 20 30 t_days Residuenanalyse KRAFT Residuenanalyse KRAFT