Zweifaktorielle Blockanlage Fruchtart Winterweizen Faktor N = Stickstoffdüngung (0, 80, 160, 240 kg /ha) Faktor S = Sorte (Monopol, Batis, Hybnos) S1 S3 S2 S1 S2 S3 S3 S2 S1 S3 S1 S2 N1 N4 N2 N3 N3 N1 N3 N4 N2 N2 N4 N1 S2 S3 S1 S3 S2 S1 S1 S3 S2 S2 S1 S3 N3 N1 N1 N4 N1 N3 N4 N2 N2 N4 N2 N3 S2 S1 S3 S1 S2 S3 S3 S2 S1 S3 S2 S1 N2 N1 N3 N2 N4 N2 N1 N1 N3 N4 N3 N4 S1 S2 S3 S3 S1 S2 S2 S3 S1 S2 S3 S1 N4 N1 N3 N4 N2 N2 N4 N2 N1 N3 N1 N3 Landwirtschaftliche Versuchsanlagen (Skript Seite 27) Grundsätzliches Messwerte im Experiment werden durch verschiedene Fehlerkomponenten verzerrt: Grobe Fehler: Irrtum, Nachlässigkeit oder extreme Witterungsverhältnisse Systematische Streuungsursachen: z.B. kontinuierliche Bodenunterschiede Zufällige Streuungsursachen: zufällige Bodenunterschiede, Einwirkungen auf die Pflanzengesundheit, Technisch bedingte ungenaue Arbeitsweise von Maschinen und Geräten, genetisch bedingte Variabilität, Wildverbiss Ziel der Versuchsplanung Systematische Fehler kontrollieren gleichmäßig auf Prüfglieder verteilen Zufällige Fehler minimieren gleichmäßig auf Prüfglieder verteilen Fehlervarianz schätzen Prinzipien der Versuchsplanung Fehlervarianz (Versuchsfehler) kann geschätzt werden wenn WIEDERHOLUNGEN vorhanden Prüfglieder zufällig auf Parzellen verteilen RANDOMISATION Randomisation ist wichtig, um zufällige Effekte tatsächlich zufällig auf die Prüfglieder zu verteilen Benachbarte Parzellen sind sich ähnlicher als weit entfernte Blockbildung Vollständig randomisierte Anlage (CRD) A B C A D D B C D C A B A B C D (-) Kein Ausgleich von Trends im Boden möglich (+) maximale Anzahl Freiheitsgrade Blockanlage (RCB) Block 3 • (+) Bodenunterschiede zwischen Blöcken gehen nicht in Versuchsfehler ein! Block 2 • (-) Blöcke kosten (r-1) Freiheitsgrade A B D C Block 4 C D A B B D C A D A B C Block 1 • Bodenunterschiede innerhalb Blöcken gehen in Versuchsfehler > Blöcke nicht zu groß Modell Blockanlage yij = µ + ai + bj + eij wobei: µ Allgemeiner Mittelwert ai Effekt der i-ten Behandlung bj Effekt des j-ten Blocks eij Fehler der Parzelle mit i-ter Behandlung im j-ten Block ~N(0, σ²e) F-Test Faktor A F = MQA / MQe Blockeffekt F = MQB / MQe Lateinisches Quadrat (Latin Square) B C D A Block 4 C D A B Block 3 D A B C Block 2 A B C D Sae 4 Sae 3 Sae 2 Sae 1 Block 1 • (+) Bodenausgleich in 2 Richtungen • (-) Blöcke und Säulen kosten Freiheitsgrade • Blöcke sollten nicht zu groß sein Modell Lateinisches Quadrat yij = µ + ai + bj + ck + eij wobei: µ Allgemeiner Mittelwert ai Effekt der i-ten Behandlung bj Effekt des j-ten Blocks cj Effekt der k-ten Säule eijk Fehler der Parzelle mit i-ter Behandlung im j-ten Block ~N(0, σ²e) F-Test Faktor A F = MQA / MQe Blockeffekt F = MQB / MQe Säuleneffekt F = MQC / MQe Gitteranlage (Lattice) Ziel kleinere Blöcke > unvollständige Blöcke Nicht mehr alle Prüfglieder in jedem Block Prüfgliedmittelwerte werden um Blockeffekte (Bodeneffekte) adjustiert Beliebt: Zwei- und Dreisatzgitter (=Gitterquadrate) Entwickeln von Gitterplänen Zweisatzgitter: 9 Varianten 7 8 4 5 1 2 Wh. I 9 6 3 3 2 1 Wh. 6 5 4 II 9 8 7 Dreisatzgitter: 9 Varianten Wiederholung I und II wie Zweisatzgitter • Nicht alle Vergleiche mit gleicher Präzision möglich! • Prüfglieder 1, 6 und 8 niemals im gleichen Block, d.h. nur indirekte Vergleiche möglich 7 4 1 Wh. 2 8 5 III 6 3 9 7 x 7 Gitter (49 Prüfglieder) 1 24 20 2 48 32 37 12 21 3 43 44 45 46 47 48 49 R R 4 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23 22 5 5 44 31 41 14 39 25 9 47 7 17 34 30 26 8 49 40 19 1 27 43 18 35 4 11 42 22 23 46 10 R R R R R 6 3 29 16 38 36 13 45 28 33 2. Wdh. 2 15 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 • Jeweils sieben Parzellen bilden einen Block • Jeweils sieben Blöcke bilden eine Wiederholung 1. Wdh. Modell Gitteranlage yij = µ + ai + rk + b(r)jk + eij wobei: µ Allgemeiner Mittelwert ai Effekt der i-ten Behandlung rk Effekt der k-ten vollständigen Wiederholung b(r)jk Effekt des j-ten unvollständigen Blocks innerhalb der k-ten Wiederholung ~N(0, σ²b) eijk Fehler der Parzelle mit i-ter Behandlung im j-ten Block der k-ten Wdh. ~N(0, σ²e) Mehrfaktorielle Versuchsanlagen Pläne für mehrfaktorielle Versuche Prinzipiell kann jeder mehrfaktorielle Versuch auch als Block- oder Gitteranlage angelegt werden! Kombination der Faktorstufen ist dann Versuchsglied Normalfall jedoch Spaltanlage Spaltanlage (Split-Plot) 3 7 1 8 2 10 5 4 9 6 ohne Fungizid 6 8 5 2 10 7 1 9 4 3 mit Fungizid 1. Wdh. mit Fungizid 2. Wdh. ohne Fungizid mit Fungizid 3. Wdh. ohne Fungizid 2 Fungizidstufen, 10 Sorten > Großteilstücke / Kleinteilstücke Spaltanlage Vorteil: Einfache Anlage auf dem Feld Nachteil: Statistische Analyse wird komplizierter (zweiter Fehlerterm: Großteilstückfehler) Weil mehr als ein Fehlerterm: „Gemischtes Modell“ Modell Spaltanlage yijk = µ + ai + rk + raik + bj + abij + eijk µ Allgemeiner Mittelwert rk Effekt der k-ten Wiederholung ai Effekt der i-ten Saatzeit raik Fehler des ik-ten Großteilstücks ~N(0, σ²ra) bj Effekt der j-ten Sorte abij Interaktion zwischen i-ter Saatzeit und j-ter Sorte eijk Fehler der Parzelle mit i-ter Saatzeit und j-ter Sorte in der k-ten Wiederholung ~N(0, σ²e) F-Tests Faktor A F = MQA / MQRA Faktor B F = MQB / MQe Interaktion A*B F = MQA*B / MQe Standardfehler der Differenz für Vergleich der Stufen des Großteilstückfaktors (A) 2 MQra sd rb Anzahl Freiheitsgrade = (a-1)(r-1) MQra Großteilstückfehler (Behandlung*Wdh) rb Anzahl Parzellen je Großteilstückfaktorstufe (= Anzahl Kleinteilstückfaktorstufen x Anzahl Wiederholungen) Standardfehler der Differenz für Vergleich der Stufen des Kleinteilstückfaktors (B) 2 MQe sd ra Anzahl Freiheitsgrade = a(b-1)(r-1) MQe Kleinteilstück- bzw. Restfehler ra Anzahl Parzellen je Kleinteilstückfaktorstufe (= Anzahl Großteilstückfaktorstufen x Anzahl Wiederholungen) Standardfehler der Differenz für Vergleich der Stufen des Kleinteilstückfaktors (B) auf gleicher Stufe des Großteilstückfaktors (A) 2 MQe sd r Anzahl Freiheitsgrade = a(b-1)(r-1) MQe Kleinteilstück- bzw. Restfehler r Anzahl Wiederholungen Standardfehler der Differenz für Vergleiche von Kleinteilstückfaktorstufen (A) auf unterschiedlichen Großteilstückfaktorstufen (B) 2 [MQra (b 1) MQe] sd rb a (r 1) (a 1) [( b 1) MQe MQra]² FG (a 1) (b 1) MQe ² (a) MQra ² MQra MQe a b r Großteilstückfehler Kleinteilstück- bzw. Restfehler Anzahl Großteilstückfaktorstufen Anzahl Kleinteilstückfaktorstufen Anzahl Wiederholungen Streifenanlage (Split-Block) 1. Wdh. A 1 2. Wdh. C 2 2 B 1 A 2 2 C 1 1 1 B 2 2 1 Faktor A (z.B. Saatzeit) : In Großteilstücken, in horizontaler Richtung, Stufen A-C Faktor B (z.B. Düngung) : In Großteilstücken, in vertikaler Richtung, Stufen 1 -2 Modell Streifenanlage yijk = µ + ai + rk + raik + bj + abij + eijk µ Allgemeiner Mittelwert rk Effekt der k-ten Wiederholung ai Effekt der i-ten Saatzeit raik Fehler des ik-ten Großteilstücks ~N(0,σ²ra) bj Effekt der j-ten Düngung rbjk Fehler des jk-ten Großteilstücks ~N(0,σ²rb) abij Interaktion zwischen i-ter Saatzeit und j-ter Düngung eijk Fehler der ijk-ten Parzelle ~N(0,σ²e) F-Tests Faktor A F = MQA / MQRA Faktor B F = MQB / MQRB Interaktion A*B F = MQA*B / MQe Dreifaktorieller Versuch Einfluss pflanzenbaulicher Maßnahmen auf FusariumBefall von Winterweizen. Zielvariable: DON-Gehalt (Deoxynivalenol) - Sorte (2 Stufen) - Bodenbearbeitung (2 Stufen) - Fungizid (2 Stufen) - 4 Wiederholungen Zweijähriger Versuch auf gleicher Fläche Messwiederholung in der Zeit Versuchsdesign Fungizidbehandlung in Streifen Mulch Pflug Pflug Mulch F1 F1 F1 F1 F0 F0 F0 F0 F0 F0 F0 F0 F1 F1 F1 F1 Sorte B Sorte A Sorte B Sorte A Pflug Sorte A Sorte B Sorte B Sorte A Mulch Mulch Pflug F1 F1 F1 F1 F0 F0 F0 F0 F0 F0 F0 F0 F1 F1 F1 F1 Sorte A Sorte B Sorte A Sorte B Sorte B Sorte A Sorte A Sorte B Versuchsdesign Bodenbearbeitung in Spalten Mulch Pflug Pflug Mulch F1 F1 F1 F1 F0 F0 F0 F0 F0 F0 F0 F0 F1 F1 F1 F1 Sorte B Sorte A Sorte B Sorte A Pflug Sorte A Sorte B Sorte B Sorte A Mulch Mulch Pflug F1 F1 F1 F1 F0 F0 F0 F0 F0 F0 F0 F0 F1 F1 F1 F1 Sorte A Sorte B Sorte A Sorte B Sorte B Sorte A Sorte A Sorte B Versuchsdesign Sorten in Unterspalten Mulch Pflug Pflug Mulch F1 F1 F1 F1 F0 F0 F0 F0 F0 F0 F0 F0 F1 F1 F1 F1 Sorte B Sorte A Sorte B Sorte A Pflug Sorte A Sorte B Sorte B Sorte A Mulch Mulch Pflug F1 F1 F1 F1 F0 F0 F0 F0 F0 F0 F0 F0 F1 F1 F1 F1 Sorte A Sorte B Sorte A Sorte B Sorte B Sorte A Sorte A Sorte B Modell yijkl = i+ j+ γk+ ij+ γik+ γjk+ γijk+ rl + ril+ rjl+ rijl+ rγjkl+ eijkl rl i j γk γijk ril rjl rijl rγjkl eijkl Effekt der l-ten Wiederholung Effekt der i-ten Fungizidstufe Effekt der j-ten Bodenbearbeitung Effekt der k-ten Sorte Interaktionen Fungizid*Bodenbearbeitung*Sorte Fehler des il-ten Großteilstücks ~ N(0,s²ra) Fehler des jl-ten Großteilstücks ~ N(0,s²rb) Fehler des ijl-ten Mittelteilstücks (Kombination Zeile/Spalte) ~ N(0,s²rab) Fehler des ikl-ten Mittelteilstücks (Kombination Spalte/Unterspalte) ~ N(0,s²rbc) Fehler der ijkl-ten Parzelle ~ N(0,s²e) fix zufällig SAS hilft... SAS führt automatisch die richtigen F-Tests durch und berechnet die korrekten Standardfehler Was muss der User tun? - Die Daten einfüttern - Das Modell in SAS-Code übersetzen - Computer-Output korrekt interpretieren Beratungsangebot des FG Bioinformatik nutzen! Statistik Basics Störfaktor Bodenunterschiede Bodenunterschiede in Praxisschlag: Biomasse Getreide Störfaktor Bodenunterschiede Bodenunterschiede in Praxisschlag: Ertragsvariabilität im Oberrheingraben Störfaktor Bodenunterschiede Versuchsflächen sind niemals homogen! Beispiel für Bodenunterschiede gute Bodenqualität mittlere Bodenqualität 32 m schlechte Bodenqualität 8m Einfluss von Bodenunterschieden Angenommen die beiden Felder des Landwirts unterscheiden sich in der Ertragsfähigkeit… Feld 1 im Mittel Ertrag 1,5 dt/ha über Durchschnitt Feld 2 im Mittel Ertrag 1,5 dt/ha unter Durchschnitt Wahrer Mittelwert von Sorte A = 48 dt/ha Wahrer Mittelwert von Sorte B = 50 dt/ha Zwei denkbare Experimente Feld 1 Feld 2 Sorte A Sorte B 48 +1,5 = 49,5 dt/ha 50 - 1,5 = 48,5 dt/ha Entscheidung: A ist besser Feld 1 Feld 2 Sorte B Sorte A 50 +1,5 = 51,5 dt/ha 48 - 1,5 = 46,5 dt/ha Entscheidung: B ist besser Sinn der statistischen Analyse Zwischen „echten“ und zufälligen Effekten unterscheiden Wahrscheinlichkeit von Fehlentscheidungen minimieren Aber: 100%ige Sicherheit gibt es nicht! Tolerierbare Irrtumswahrscheinlichkeit - 5% im Pflanzenbaulichen Versuchswesen üblich Wiederholung Statistik-Grundlagen Grundlagen (1) Nullhypothese zwischen den Prüfgliedern keine Unterschiede im Feldversuch ermittelte Differenzen rein zufällig Irrtumswahrscheinlichkeit Wenn Nullhypothese richtig wie wahrscheinlich zufälliges Auftreten des beobachteten oder eines noch größeren Effekts Grundlagen (2) Fehler erster Art (Alpha-Fehler) Zwischen den Prüfgliedern besteht kein Unterschied, zufällig wird im Experiment jedoch ein solcher ermittelt. Fehler zweiter Art (Beta-Fehler) Es bestehen tatsächlich Unterschiede, diese werden im Experiment aber nicht nachgewiesen bzw. können nicht statistisch abgesichert werden. Grundlagen (3) Grenzdifferenz Wenn Differenz zwischen zwei Prüfgliedmittelwerten größer als Grenzdifferenz, so gilt sie als signifikant, also statistisch abgesichert. Berechnen aus - Versuchsfehler - Irrtumswahrscheinlichkeit - Anzahl Wiederholungen je Prüfglied Grundlagen (4) Skalen Intervallskala (z.B. °Celcius) Verhältnisskala (metrische Einheiten) Ordinalskala (Ränge, z.B. Schulnoten) Nominalskala (Klassen, z.B. Blütenfarben) Unabhängige Abhängige Verfahren Variable Variable kardinalskaliert kardinalskaliert Regression, Korrelation kategorial kardinalskaliert t-Test, Varianzanalyse kategorial kategorial Chi²-Test Grundlagen (5) n arithmetischesMittel x x i 1 i n Median der mittlere der nach der Größe sortierten Werte Grundlagen (6) Varianz einer Stichprobe n ( xi x )² xi ² xi ² / n SQ i 1 i 1 s ² MQ i 1 FG n 1 n 1 n n Standardabweichung s s² Variationskoeffizient s s% x Beispiel - Kulturdeckungsgrad von Winterweizen-Sorten bestimmt - in jeder Parzelle an drei zufällig ausgewählten Punkten - Mittel auf Parzellenebene gebildet - Vier Parzellen je Sorte - Sorte „Monopol“ am 29. April 2003 folgende Parzellenmittelwerte (in Prozent, nach Größe geordnet): - 11,67 20,33 25,00 30,00 - arithmetisches Mittel beträgt 21,75 %. - Median 22,67% (arithm. Mittel aus 20,33 und 25,00). Beispiel (2) Summe der Abweichungsquadrate (SQ) berechnen Parzelle KDG Differenz zum Quadrierte Gesamtmittel Differenz ( xi x ) 1 2 3 4 Summe 11,67 20,33 25 30 87 ( x i x )2 -10,08 -1,42 3,25 8,25 0 101,61 2,02 10,56 68,06 182,25 n (x i 1 i x )² Beispiel (3) Varianz SQ 182,25 s 60,75 FG 4 1 2 Standardabweichung Variationskoeffizient s s 2 60,75 7,8 s 7,8 s% 28% x 27,75 Grundlagen (7) Standardfehler des Mittelwertes Im Beispiel 60,75 sx 3,90 4 s² sx n Grundlagen (8) 95%-Vertrauensbereich (Konfidenzintervall) für den wahren Mittelwert µ Mittelwert +/- (1,96 * Std.fehler Mittelwert) x 1,96 sx 1-(/2) Quantil der Standardnormalverteilung wenn =5% Grundlagen (9) Besser t-Verteilung nehmen 95%-Vertrauensbereich (Konfidenzintervall) für den wahren Mittelwert µ Mittelwert +/- (t * Std.fehler Mittelwert) x t sx 1-(/2) Quantil der t-Verteilung wenn =5% Abhängig von Fehler-FG Beispiel (4) = 0.05 n=4 Mittelwert = 21,7 n-1 = 3 Freiheitsgrade t=3,18 sx 3,9 Vertrauensbereich = 21,7 -(3,18*3,9) bis 21,7 + (3,18*3,9) [9,3 ; 34,1] t-Test Zwei Sorten Monopol: 11,67 20,33 25,00 30,00 Batis: 24,00 25,00 41,67 83,33 Mittelwert Monopol: 21,75 Mittelwert Batis: 43,50 Differenz signifikant? t-Test (2) Mittelwert Monopol: 21,75 Mittelwert Batis: 43,50 Differenz signifikant? Fehlervarianz berechnen SQ1 SQ2 s² (n1 n 2 ) 2 s² 182,25 2312,56 415,8 ( 4 4) 2 Standardfehler der Differenz sd 2s ² n sd 2 415,8 14,41 4 t-Test (3) Grenzdifferenz nach t-Test GD(t-Test) = LSD = Sd * t –Tabellenwert GD sd t 14,41 2,45 35,30 Grenzdifferenz ist größer als Differenz zwischen den Mittelwerten Differenz ist nicht signifikant Varianzanalyse Fünf Sorten zufällig auf 20 Parzellen verteilt Messwert 1 2 3 4 Mittelwert A 31 32 37 32 33 B 21 23 25 19 22 Sorte C 27 29 34 34 31 D 34 32 31 27 31 E 24 23 27 26 25 Mittelwertdifferenzen signifikant oder zufällig? Varianzanalyse (2) Varianzanalyse-Tabelle Ursache Sorten Fehler FG SQ MQ F 4 348,8 87,2 11,28 15 116 7,733 F-Tabellenwert für 4 Zähler- und 15 Nenner-FG = 3,06. 2 MQFehler LSD tTab [ FG ; ] r 2 7,733 LSD 2,131 4,19 4 GD nach Tukey: HSD(Tukey ) qTab [t ;FG ; ] MQFehler r HSD(Tukey ) 7,733 4,367 6,07 4 Varianzanalyse (3) Multipler Mittelwertvergleich Sorte A D C E B Grenzdifferenz t-Test (LSD) 33 a 31 a 31 a 25 b 22 b 4,19 Tukey (HSD) 33 a 31 ab 31 ab 25 bc 22 c 6,07 Mittelwerte mit dem gleichen Buchstaben unterscheiden sich nicht signifikant Computer zur Datenanalyse einsetzen Software zur Datenauswertung - SAS SPSS (Sozialwissenschaften) Systat Statistica PlabStat (Schwerpunkt Züchtung) Agrobase (Schwerpunkt Züchtung) ARM (Schwerpunkt Pflanzenschutz) Diverse kleinere Programme EXCEL Das Statistikpaket SAS SAS - teuer (Uni hat Sonderkonditionen, sonst ca. 2500 € pro Jahr) - zeilenorientiert = schwierig in der Handhabung (eigener Programmcode) - bietet das größte Methodenspektrum („state of the art“) > Trotz bekannter Nachteile erste Wahl für die Auswertung von Feldversuchen Datenanalyse mit dem SAS-System data Beispiel; input sorte$ @@; do Parzelle=1 to 4; input ertrag @@; output; end; cards; A 31 32 37 B 21 23 25 C 27 29 34 D 34 32 31 E 24 23 27 ; run; 32 19 34 27 26 Datenanalyse mit dem SAS-System (2) Proc glm data = Beispiel; class Sorte; model Ertrag = Sorte ; means Sorte / lsd tukey; run; Computer-Output (1) The GLM Procedure Dependent Variable: ertrag Sum of Source DF Squares Mean Square F Value Pr > F Model 4 348.8000000 87.2000000 11.28 0.0002 Error 15 116.0000000 7.7333333 Corrected Total 19 464.8000000 Computer-Output (2) t Tests (LSD) for ertrag NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 15 Error Mean Square 7.733333 Critical Value of t 2.13145 Least Significant Difference 4.1912 Means with the same letter are not significantly different. Mean N sorte A 33.000 4 A A 31.000 4 D A 31.000 4 C B 25.000 4 E B 22.000 4 B Computer-Output (3) Tukey's Studentized Range (HSD) Test for ertrag NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher TypeII error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 15 Error Mean Square 7.733333 Critical Value of Studentized Range Minimum Significant Difference 4.36699 6.072 Means with the same letter are not significantly different. Mean N sorte A 33.000 4 A B A 31.000 4 D B A 31.000 4 C B C 25.000 4 E C 22.000 4 B Praktische Übung Praktische Übung Im AB-Praktikum 2003 wurden in der ungedüngten Stufe im April folgende Kulturdeckungsgrade ermittelt: Monopol 11,67 20,33 25,00 30,00 Batis 24,00 25,00 41,67 83,33 Hybnos 2,67 16,67 2,33 23,33 Vergleichen Sie die Sortenmittelwerte mit Varianzanalyse, t-Test und Tukey-Test. Nutzen Sie hierfür das SAS-Programm Mehrfaktorielle Varianzanalyse Mehrfaktorielle Varianzanalyse Zum Beispiel: Versuch mit 3 Winterweizensorten und 4 Stickstoffstufen (0, 80, 160, 140 kg N/ha) Varianzanalyse-Tabelle FG 2 SQ SQSorten MQ SQ / 2 F-Test MQSorten / MQFehler Düngung 3 SQDüng. SQ / 3 MQDüng. / MQFehler Sorten x Düngung 6 SQSorten x Düng. SQ / 6 MQSorten x Düng. / MQFehler Fehler 36 SQFehler SQ / 36 Total 47 SQgesamt Sorten Mehrfaktorielle Varianzanalyse Modell: yijk = µ + si + nj + snij + eijk yijk Ertrag der k-ten Parzelle mit i-ter Sorte und j-ter Düngung µ der allgemeine Mittelwert si Effekt der i-ten Sorte nj Effekt der j-ten Düngung snij Interaktion der i-ten Sorte mit der j-ten Düngung eijk Restfehler k-te Parzelle der i-ten Sorte mit der j-ten Düngung Ordinale Interaktion 180 160 A 140 B 120 100 80 Int. 1 Int 2 Hybride Interaktion 180 160 A 140 120 100 B 80 Int. 1 Int 2 Disordinale Interaktion 180 160 A 140 120 100 B 80 Int. 1 Int 2 Keine Interaktion 160 140 A 120 B 100 80 Int. 1 Int 2 Keine Interaktion 160 140 A 120 B 100 80 Int. 1 Int 2 Keine Interaktion 140 A B 120 100 80 Int. 1 Int. 2 Datenbeispiel aus Praktikum SS 2003 Kulturdeckungsgrade (in Prozent, jeweils Mittel aus drei Messungen je Parzelle) N-Düngung 1 2 3 4 Sorte Monopol Batis Hybnos Monopol Batis Hybnos Monopol Batis Hybnos Monopol Batis Hybnos Wdh1 20,33 24,00 2,67 19,33 46,67 14,00 30,33 11,00 2,67 20,33 30,33 13,00 Wdh2 25,00 25,00 16,67 26,67 25,67 9,00 26,67 26,67 21,67 18,33 28,33 3,33 Wdh3 30,00 83,33 2,33 36,67 66,67 30,00 58,33 15,67 30,00 41,67 55,00 26,67 Wdh4 11,67 41,67 23,33 13,33 68,33 10,67 48,33 53,33 21,67 17,33 68,33 13,33 Mittel 21,75 43,50 11,25 24,00 51,83 15,92 40,92 26,67 19,00 24,42 45,50 14,08 Datenbeispiel aus Praktikum SS 2003 Kulturdeckungsgrade (in Prozent, jeweils Mittel aus drei Messungen je Parzelle) 60 Monopol 40 Batis 20 Hybnos 0 0 80 160 Stickstoffdüngung 240 Auswertung mit SAS data weizen3; input N Sorte Wdh KDG; datalines; 1 1 1 20.33 1 1 2 25.00 1 1 3 30.00 1 1 4 11.67 2 1 1 19.33 2 1 2 26.67 weitere Daten... 4 3 3 26.67 4 3 4 13.33 ; run; Auswertung mit SAS Proc glm data=weizen3; class N Sorte; model kdg = Sorte N Sorte*N ; means Sorte N / lsd; run; yijk = µ + si + nj + snij + eijk SAS-Output Sum of Source DF Squares Mean Square FValue Pr > F N 3 161.37 53.79 0.23 0.8778 Sorte 2 5756.22 2878.11 12.09 <.0001 N*Sorte 6 2288.56 381.42 1.60 0.1751 Error 36 8573.45 238.15 Total 47 16779.61 SAS-Output (2) t Tests (LSD) for KDG Alpha 0.05 Error Degrees of Freedom 36 Error Mean Square 238.1516 Critical Value of t 2.02809 Least Significant Difference 11.065 Means with the same letter are not significantly different. A B C Mean 41.875 27.770 15.063 N 16 16 16 Sorte 2 1 3 Alternative Auswertung Skalierung Sorte nominal Stickstoffdüngung metrisch, kardinalskaliert Auswertungsansatz für Stickstoffdüngung: > Regression Korrelation Kovarianz 1 n Co var( XY ) ( xi xm)( yi ym) n 1 i 1 Korrelation Corr ( XY ) Co var sxsy Regression y a ßx e wobei y abhängige Variable a absolutes Glied bzw. Achsenabschnitt ß Regressionskoeffizient, Steigung x unabhängige Variable e zufälliger Restfehler Lineare Regression z.B. Ertragssteigerung durch Stickstoffdüngung 70 Ertrag [dt/ha] 60 y = 12,2 + 0,24x 2 R = 0,94 50 dy 40 dx 30 ß = dy / dx 20 10 0 0 50 100 150 Stickstoffdüngung [kg N/ha] 200 250 Kovarianzanalyse Eine nominale und eine metrische Variable: Verknüpfung zwischen Varianzanalyse und Regressionsanalyse Kovarianzanalyse Anwendung ebenfalls sinnvoll um Störgrößen auszuschalten Beispiel Kovarianzanalyse Ertrag von Winterweizen nach verschiedenen Vorfrüchten Datenerhebung auf Praxisschlägen Vorfrucht Weizen Weizen Weizen Weizen Raps Raps Raps Raps Ackerzahl 90 85 80 75 82 77 68 54 Ertrag 100 95 87 82 96 88 83 61 Beispiel Kovarianzanalyse 110 Kornertrag Weizen 100 90 80 70 Vorfrucht Weizen 60 Vorfrucht Raps 50 Linear (Vorfrucht Raps) 70 Linear90 (Vorfrucht 110 Weizen) Ackerzahl 50