Mathematik III f u • r MT WS 2016/2017 [email protected] 2. Übungsserie: Kon…denzintervalle, Parametertests, einfaktorielle ANOVA 1. Die Messung des Bleigehalts von 40 Proben ergab folgende Werte (in %) 17.3 13.8 18.7 16.4 12.9 15.3 19.3 14.1 16.6 18.5 18.5 14.9 16.5 16.7 10.3 17.5 21.4 16.8 16.3 14.9 15.9 15.1 20.5 16.8 17.4 15.4 16.5 15.5 14.5 15.5 15.3 17.5 17.1 15.5 14.8 14.3 17.0 16.2 15.4 16.2 Bestimmen Sie ein zweiseitiges sowie ein einseitiges, nach oben o¤enes Kon…denzintervall zur Sicherheit 0.99 für den mittleren Bleigehalt. Welche Schlussfolgerung ziehen Sie daraus? Anleitung MATLAB Datenvektor a2_1 (Spaltenvektor) Schätzung von Mittelwert und Standardabweichung: m = mean(a2_1);s = std(a2_1) (1 ) Quantil der t-Verteilung mit n FG: q = tinv(1 ; n) q1 = tinv(0.995,39), q2 = tinv(0.99,39) s zweiseitiges 0.99-KI: m q1 p n s einseitiges 0.99-KI: (m q2 p ; 1) n oder mit Matlab- Kommando: [m, s, mci, sci] = norm…t(a2_1,alpha) schätzt Mittelwert, Standardabweichung und die zweiseitigen (1–alpha)-Kon…denzintervalle für beide Parameter der NV 2. Eine neue Sorte von Reagenzgläsern soll bezüglich ihrer Schmelztemperatur mit einer gebräuchlichen Sorte, bei der die mittlere Schmelztemperatur 745 C beträgt, verglichen werden. Bei der neuen Sorte werden in einer Stichprobe folgende Werte ermittelt 675 720 621 653 750 631 742 828 715 611 790 671 820 730 650 785. Die Messwerte können als normalverteilt angenommen werden. a) Bestimmen Sie ein zweiseitiges Kon…denzintervall zur Sicherheit 0.95 für die mittlere Schmeztemperatur der neuen Sorte und vergleichen Sie die Grenzen mit dem Wert der alten Sorte. b) Überprüfen Sie durch Anwendung eines geeigneten Tests bei Risiko 0.05 die Hypothese, dass die Schmelztemperatur der neuen Sorte 745 C beträgt. Anleitung MATLAB a) Datensatz a2_2 erstellen (Spaltenvektor), dann weiter wie Aufgabe 1 b) Einstichproben-T-Test: [h p ci stats]=ttest(a2_2,m0) mit m0 = 745 oder Testgröß e programmieren: n = size(a2_2,1), m = mean(a2_2), s = std(a2_2), q = tinv(0.975,n-1) H0 : = 745 m m0 p T = s= n Ablehnung, wenn jT j > q oder Berechnung des p-Werts: p = 1 tcdf (jT j ; n 1) und Vergleich mit 0.025 (Risiko wird auf beide Seiten verteilt) 3. Bei spektrometrischen Untersuchungen der Verunreinigung von Reinstmetallen wurden für zwei verschiedene Chargen in einer Reihe von Analysen folgende Messwerte erhalten Charge 1 0.75 0.82 0.92 0.88 1.10 0.95 1.15 1.07 1.06 0.98 . Charge 2 0.89 0.93 1.07 0.98 1.25 1.06 1.12 1.22 1.14 1.17 1 Unter Annahme der Normalverteilung prüfe man auf dem Signi…kanzniveau 5%, ob der Verunreinigungsgrad beider Proben der gleiche ist. (vorher Gleichheit der Varianzen prüfen!) Anleitung MATLAB Daten in Matrix a2_3 vom Typ 10x2, 1. Spalte: x1 = a2_3(:,1), 2. Spalte: x2 = a2_3(:,2) Vortest zum Vergleich der Varianzen: [h p ci stats]=vartest2(x1,x2) Vergleich der Erwartungswerte bei gleichen Varianzen: [h p ci stats]=ttest2(x1,x2, ’vartype’,’equal’) 4. Zur Messung des Graphitanteils von Stahlproben auf der Basis ebener Schnitte kommen zwei Messverfahren zum Einsatz: Messung des Flächenanteils durch Bildanalyse oder Bestimmung des Längenanteils auf Messlinien. Bei Probemessungen zum Vergleich der Genauigkeit beider Methoden erhielt man Linienmethode: n1 = 9; s1 = 0:012 Flächenmethode: n2 = 10; s2 = 0:025: Die Messwerte können jeweils als normalverteilt vorausgesetzt werden. Ist der Genauigkeitsunterschied zwischen beiden Messverfahren bei Risiko = 0:05 signi…kant? Anleitung MATLAB Urdaten (nicht verbunden) stehen nicht zur Verfügung, daher Testgröß e programmieren H0 : 12 = 22 Testgröß e: T = s1^2=s2^2 Ablehnbereich ( = 0:05): T < …nv(0.025,8,9) oder T > …nv(0.975,8,9) 5. Die Gewichtszunahme von Ratten bei Fütterung ohne bzw. mit Zugabe eines Hormons in 2 Zyklen über einen bestimmten Zeitraum ergab folgende Werte Tier Nr 1 2 3 4 5 6 7 8 Behandlung 1 10.1 7.3 12.6 6.1 2.2 10.6 11.2 4.8 Behandlung 2 15.3 3.6 16.5 13.3 3.3 8.2 10.7 3.6 Testen Sie unter Voraussetzung der NV, ob ein signi…kanter Ein‡uss des Hormons vorliegt, Risiko 0.05.die Daten können als normalverteilt vorausgesetzt werden. Anleitung MATLAB verbundene Daten, daher Einstichproben-T-Test auf den Vektor d der Di¤erenzen pro Tier anwenden Daten in Matrix a2_5 vom Typ 8x2 Di¤erenzen pro Tier: d = a2_5(:,1) - a2_5(:,2) H0 : d = 0 [h p ci stats]=ttest(d,0) oder mit selbst programmierter Testgröß e md = mean(d);sd = std(d) Testgröß e: T = md=(sd=sqrt(n)) Ablehnbereich ( = 0:05): jT j > tinv(0.975,7) 6. Die Wirksamkeit von 2 Medikamenten bei der Therapie desWeitwinkelglaukoms soll verglichen werden. Dabei werden vergleichbar schwer erkrankte Patienten zufällig in zwei Gruppen eingeteilt und in jeder der Gruppen eins der Mittel verabreicht 120 min nach Verabreichung erhält man folgende Änderung des Augeninnendrucks Pilocarpin 2.2 2.2 2.3 2.4 2.4 2.1 2.7 2.6 2.4 2.5 2.6 2.3 2.1 2.0 2.5 2.3 Chibro-T 2.6 2.8 3.1 3.3 2.9 2.5 2.8 2.9 3.1 3.2 3.2 3.0 2.7 3.0 3.0 2.7 a) Berechnen Sie unter Voraussetzung der NV für jedes Medikament ein 95%-Kon…denzintervall für die mittlere Änderung des Innendrucks. b) Testen Sie unter Voraussetzung der NV zur Sicherheit 0.95, ob sich die beobachtete Wirkung beider Medikamente signi…kant unterscheidet. Hilfsgröß en Mittelwert Standardabw. Pilocarpin n1 = 16 2.350 0.2000 Chibro-T n2 = 17 2.953 0.2503 Anleitung MATLAB nicht verbundene Daten, daher Zweistichproben-T-Test Achtung: separate Datenvektoren x1, x2, da verschiedene Länge der Stichproben 2 3.4 a) [m1, s1, mci1, sci1] = norm…t(x1,alpha) und [m2, s2, mci2, sci2] = norm…t(x2,alpha) b) wie Aufgabe 3 7. In einem Schulversuch wurde ein neues Sto¤gebiet in Biologie mit 4 verschiedenen Unterrichtsmethoden vermittelt. Dazu wurde eine Klasse von 24 Schülern in 4 Gruppen unterteilt, wobei darauf geachtet wurde, dass in jeder Gruppe leistungsstarke und -schwache Schüler vertreten waren. Anhand der erreichten Punkte eines Wissenstests ist der Erfolg der Methoden zu beurteilen. Testen Sie unter Voraussetzung der Normalverteilung, ob es einen signi…kanten Unterschied zwischen dem Erfolg der Methoden gibt ( = 0:05). erreichte Punkte Methode 1 41 38 42 34 30 37 Methode 2 79 69 63 72 76 58 Methode 3 62 81 70 75 78 71 Methode 4 74 76 69 77 66 81 Bei Berechnung zu Fußkönnen Sie folgende Hilfsgröß en verwenden Gesamtmittel: 63:292 , Gesamtvarianz: s2y = 277:52 Methode A: y1 = 37 Methode B: y2 = 69:5 Methode C: y3 = 72:833 Methode D: y4 = 73:833 Anleitung MATLAB Datenmatrix a2_7 aus Tabelle, aber transponiert, damit Werte der gleichen Methode/Stufe als Spaltenvektor stehen [p,t] = anova1(a2_7) 8. Untersuchen Sie, ob ein Zusammenhang zwischen den Rauchgewohnheiten und dem IQ besteht. Folgender Datensatz enthält den IQ, erhoben in einer zufälligen Stichprobe aus der Grundgesamtheit der Männer der Altersklasse 31-50 Jahre. Die IQ-Werte in den Gruppen können dabei als normalverteilt mit gleichen Varianzen angenommen werden. Nichtraucher mäß ige Raucher starke Raucher sehr starke Raucher 131 87 101 112 108 124 76 70 100 91 92 92 85 66 79 70 82 77 77 95 114 108 106 95 105 116 108 118 80 86 87 119 84 123 82 99 97 113 90 86 100 93 88 113 118 124 101 93 148 97 129 147 146 Deskriptive Statistiken 3 NR moderat stark sehr stark total n1 = 24 n2 = 11 n3 = 13 n4 = 5 n= 53 Mittelwert 107.75 98.45 93.85 87.70 100.5283 Standardabweichung 20.549 18.986 15.572 17.950 19.712 Anleitung MATLAB Datenvektor (Spalte) a2_8 durch Aneinanderhängen aller Spalten derTabelle, Gruppenzuordnung mittels Gruppierungsvektor g=[ones(24,1);2*ones(11,1);3*ones(13,1);4*ones(5,1)]; p=anovan(a2_8,g,’display’,’on’) oder Programmieren zu Fuß p = 4; n1 = 24; n2 = 11; n3 = 13; n4 = 5; n = n1 + n2 + n3 + n4; m1 = mean(a2_8(1:24)); s1 = std(a2_8(1:24)) m2 = mean(a2_8(25:35)); s2 = std(a2_8(25:35)) m3 = mean(a2_8(36:48)); s3 = std(a2_8(36:48)) m4 = mean(a2_8(49:53)); s4 = std(a2_8(49:53)) SSY = (n-1)*std(a2_8)^2 ; genauer ist die direkte Berechnung der Quadratsummen: SSY = sum((a2_8-mean(a2_8)).^2) SSE = (n1-1)*s1^2+(n2-1)*s2^2+(n3-1)*s3^2+(n4-1)*s4^2 MSE = SSE/(n-p-1) SSA = SSY - SSE MSA = SSA/(p-1) T= MSA/MSE Schwellwert = …nv(0.95,(p-1),(n-p-1)) 9. Ein Chemiker untersucht die Anwendbarkeit eines neu entwickelten Polymers zur Decontamination von Wasser. Die Versuche werden auf 5 Temperaturstufen durchgeführt. Folgende Tabelle enthält den Anteil beseitigter Verschmutzung bei jeder Temperaturstufe. Temperaturstufen I II III IV V 50 36 49 47 55 51 42 51 49 60 49 38 53 51 62 48 39 53 52 63 50 37 52 50 59 51 40 50 51 61 a) Berechnen Sie die Varianzzerlegung und den Globaltest auf einen signi…kanten Temperature¤ekt (Risiko 0.05). b) Prüfen Sie die Voraussetzung der Varianzhomogenität. c) Zwischen welchen Temperaturstufen gibt es signi…kante Unterschiede? Verwenden Sie den Tukey Test für paarweise Vergleiche (versuchsweises Risiko 0.05). Anleitung MATLAB Datenmatrix a2_9 wie in Tabelle a) anova1(a2_9) b) aus Datenmatrix Vektor erzeugen mit a2_9v = reshape(a2_9,30,1) Gruppierungsvariable: g=[ones(6,1); 2*ones(6,1);3*ones(6,1);4*ones(6,1);5*ones(6,1)] Bartlett-Test auf Varianzhomogenität: vartestn(a2_9v,g) c) damit der PostHoc-Test berechnet werden kann, ist bei ANOVA ein 3. Ausgabeparameter st zu belegen, der dann an multcompare übergeben wird: [p,t,st] = anova1(a2_9); [c] = multcompare(st,’display’,’on’); 4 10. Folgende Tabelle enthält die erreichten Punkte eines Tests zur Gedächtnisleistung von Versuchspersonen, die 3 Arten von Schockbehandlungen unterzogen wurden. Behandlung 1 Behandlung 2 Behandlung 3 5 4 5 6 3 6 9 8 1 3 10 7 1 8 5 2 9 8 7 6 7 2 7 3 4 9 3 2 0 a) Prüfen Sie auf Varianzhomogenität. b) Untersuchen Sie, ob ein signi…kanter Behandlungse¤ekt besteht. c) Im Fall eines signi…kanten Globaltests …nden Sie mit der Bonferroni-Methode sowie mit dem TukeyTest die Behandlungen, die sich bei versuchsbezogenem = 0:05 sign…kant unterscheiden. Anleitung MATLAB Daten: a2_10 mit allen Werten in einer Spalte, Gruppierungsvektor g=[ones(12,1);2*ones(9,1);3*ones(8,1)] a) vartestn(a2_10,g) b) [p t stats]=anovan(a2_10,g) c) [c, m]=multcompare(stats) für Tukey-Test (Standardmethode) bzw. [c,m]=multcompare(stats,’ctype’,’bonferroni’) 11. Drei homogene Gruppen von Forellen wurden unter sonst gleichen Bedingungen mit einem herkömmlichen Futter gefüttert, wobei Gruppe A nur das Futter bekam, Gruppe B einen nicht hormonellen Zusatzsto¤ und Gruppe C einen hormonellen Zusatzsto¤. Unterscheidet sich das Wachstum zwischen den Fütterungsarten signi…kant bei Irrtumswahrscheinlichkeit 0.05? Untersuchen Sie bei einem signi…kanten Globaltest, zwischen welchen Fütterungsarten signi…kante Unterschiede bestehen. Kontrolle Zusatz 1 Zusatz 2 18 25 24 15 22 24 15 23 26 17 21 24 17 22 27 16 24 22 Deskriptive Statistiken Mittelwert Standardabweichung Kontrolle 16:333 1:211 Zusatz 1 22:714 1:380 Zusatz 2 25:0 1:414 total 21:222 3:889 Anleitung MATLAB analog Aufgabe 10 12. Wasserproben von 4 Seen wurden auf Phosphorgehalt untersucht (in parts per million). Man erhielt folgende Mittelwerte über jeweils 20 Proben x1 = 0:02 x2 = 0:01 x3 = 0:001 x4 = 0:05: Die Varianzzerlegung ergab folgendes Ergebnis 5 Source A Error Total SS 0.0272 0.2280 0.2552 DF 3 76 79 MS 0.0091 0.0030 F 3.0333 a) Kann man signi…kante Unterschiede des mittleren Phosphorgehalts zwischen den Seen …nden? (Risiko 0.05). b) Untersuchen Sie bei signi…kantem Globaltest, zwischen welchen Seen signi…kante Unterschiede bestehen. Anleitung MATLAB keine Urdaten, aber aus ANOVA-Tabelle sind die Testgröß e sowie die FG für den Schwellwert des F-Tests entnehmbar Schwellwert mit Quantil …nv(0:95; 3; 76) a) Schwellwert mit Quantil …nv(0:95; 3; 76) b) Di¤erenzen sind signi…kant, r fallsr M SE 1 1 + jyi yk j > qp;N p;1 2 ni nk 6