Hans Walser Mathematik 2 für Naturwissenschaften Frühjahrssemester 2014 Übung 6 Testen von Hypothesen 7. - 10. April 2014 Aufgabe 6.1 Statistik der Geburten The Mitcham Public Health Department found an unexpected boom in boy birth during May. There were 60 boys and 35 girls born during the month. Die Wahrscheinlichkeit für eine Knabengeburt beträgt p = 0.514. Ist die oben stehende Meldung eine echte Sensation? Berechnen Sie die Wahrscheinlichkeit, dass die beobachtete Anzahl Knabengeburten um so viel oder mehr wie in der Zeitungsnotiz von der erwarteten Anzahl abweicht. Ergebnis 2.852% (zweiseitig). Also doch eine kleine Sensation. Bearbeitung Wir arbeiten mit der Normalverteilung. Es ist: n = 95, p = 0.514, µ = np = 48.83, σ = np (1 − p ) ≈ 4.8715 Für die obere Grenze 60 − 12 erhalten wir standardisiert: ub = 60− 12 − µ σ ≈ 2.1903 Die Tabelle liefert: Φ ( ub ) = Φ ( 2.19 ) = 0.98574 Die Wahrscheinlichkeit, dass 60 oder mehr Knaben geboren werden, ist: 1 − Φ ( 2.19 ) = 1 − 0.98574 = 0.01426 Entsprechend die Wahrscheinlichkeit für eine Abweichung nach unten. Somit das Resultat: 2 (1 − Φ ( 2.19 )) = 0.02852 = 2.852% In der folgenden Grafik ist das der Anteil außerhalb des roten Bereiches. Mathematik 2 für Naturwissenschaften. Übung 6 2/9 0.1 0.9715 40 50 60 97.15% im roten Bereich Aufgabe 6.2 99%-Vertrauensintervall Wir haben folgende acht Messwerte: 4.4 5.8 Für diese Messwerte gilt: 3.7 9.2 4.1 3.8 5.3 3.7 s x = 5, sx = SDx = 1.8655, SE x = x = 0.6595 8 Von wo bis wo geht das 99% Vertrauensintervall? Bevor Sie losrechnen: Die Messwerte sind dieselben wie im Beispiel in der Vorlesung. Statt α = 5% haben wir hier aber α = 1% . Wir wollen also eine kleinere Irrtumswahrscheinlichkeit, positiv formuliert: Mehr Sicherheit. Wird dadurch das Vertrauensintervall größer oder kleiner? Bearbeitung In unserem Beispiel ist ν = n −1 = 8 −1 = 7 . Relevanter Ausschnitt aus der Tabelle: FG ν 1 2 3 4 5 0.50 1.000 0.816 0.765 0.741 0.727 0.20 3.078 1.886 1.638 1.533 1.476 6 7 8 9 10 0.718 0.711 0.706 0.703 0.700 1.440 1.415 1.397 1.383 1.372 Irrtumswahrscheinlichkeit α für den zweiseitigen Test 0.10 0.05 0.02 0.01 0.002 0.001 6.3114 12.706 31.821 63.65 318.30 636.61 2.920 4.303 6.965 9.925 22.327 31.598 2.353 3.182 4.541 5.841 10.214 12.924 2.132 2.776 3.747 4.604 7.173 8.610 2.015 2.571 3.365 4.032 5.893 6.869 1.943 1.895 1.860 1.833 1.812 2.441 2.365 2.306 2.262 2.228 3.143 2.998 2.896 2.821 2.764 3.707 3.499 3.355 3.250 3.169 5.208 4.785 4.501 4.297 4.144 5.959 5.408 5.041 4.781 4.587 0.0001 6366.1 99.992 28.000 15.544 11.178 9.082 7.885 7.120 6.594 6.211 Schranken der t-Verteilung Es ist t krit = 3.499 ; der kritische Wert ist größer als im alten Beispiel. Die Latte wird höher gelegt. Mathematik 2 für Naturwissenschaften. Übung 6 3/9 99% Vertrauensintervall: [ x − t1%,7 ⋅ SE x , x + t1%,7 ⋅ SE x ] = [5 − 3.499 ⋅ 0.6595, 5 + 3.499 ⋅ 0.6595] = [2.6924, 7.3075] Das Vertrauensintervall ist länger geworden. Wir sind vorsichtiger mit dem Ablehnen der Nullhypothese. Anders formuliert: Wenn wir ein kleineres Vertrauensintervall wählen, wird die Irrtumswahrscheinlichkeit größer. Aufgabe 6.3 Länge von Kuckuckseiern Kuckuck Für 25 Kuckuckseier ergaben sich beim Ausmessen folgende Längen [mm]: aus Zaunkönigsnestern aus Rohrsängernestern 22.2 22.1 20.4 20.9 23.3 21.7 23.0 19.9 21.1 21.0 21.3 21.6 22.4 22.1 21.1 Mittelwert: 21.22 mm 21.0 21.1 20.1 22.1 21.7 22.9 22.3 22.7 21.3 22.0 Mittelwert: 22.24 mm Unterscheidet der Kuckuck zwischen Zaunkönigsnestern und Rohrsängernestern? Wir vergleichen die beiden Mittelwerte (zweiseitig, α = 5 %). Mathematik 2 für Naturwissenschaften. Übung 6 Bearbeitung Z 1 Z 1 Z 1 Z 1 Z 1 Z 1 Z 1 Z 1 Z 1 Z 1 Z 1 Z 1 Z 1 Z 1 Z 1 Anzahl 15 Mittelwert SD 19.9 22.2 21.6 21 22.1 21.1 22.4 21.1 20.4 21 22.1 20.1 20.9 21.3 21.1 4/9 R R R R R R R R R R 1 1 1 1 1 1 1 1 1 1 Anzahl 10 Mittelwert SD 21.22 0.754226188 23.3 22.1 22.3 21.3 21.7 21.7 22 22.1 23 22.9 22.24 0.641525959 Testgröße t 3.50785396 Zaunkönigsnester: n x = 15 x = 21.22 mm Rohrsängernester: n y = 10 y = 22.24 mm sx = 0.75422619 mm sy = 0.64152596 mm Testgröße: nx +ny −2 nx ny t Exp = ( x − y ) n +n x y = 1.02 ⋅ 15⋅10 25 sx2 ( nx −1)+sy2 ( ny −1) 23 0.75422619 2 ⋅14+0.64152596 2 ⋅9 Freiheitsgrad: ν = n x + n y − 2 = 15 + 10 − 2 = 23 α = 5% . Zweiseitiger Test. ≈ 3.507853954 Mathematik 2 für Naturwissenschaften. Übung 6 5/9 Tabelle (relevanter Ausschnitt): FG ν 0.50 0.20 21 22 23 24 25 0.686 0.686 01685 0.685 0.684 1.323 1.321 1.319 1.318 1.316 FG ν 0.25 0.10 Irrtumswahrscheinlichkeit α für den zweiseitigen Test 0.10 0.05 0.02 0.01 0.002 0.001 1.721 1.717 1.714 1.711 1.708 2.080 2.074 2.069 2.064 2.060 2.518 2.508 2.500 2.492 2.485 2.831 2.819 2.807 2.797 2.787 3.527 3.505 3.485 3.467 3.450 0.0001 3.819 3.792 3.767 3.745 3.725 0.05 0.025 0.01 0.005 0.001 0.0005 Irrtumswahrscheinlichkeit α für den einseitigen Test 4.784 4.736 4.693 4.654 4.619 0.00005 Schranken der t-Verteilung Wegen t Exp ≈ 3.5078 > 2.069 ist die Nullhypothese zu verwerfen. Der Kuckuck macht einen Unterschied zwischen Zaunkönigs- und Rohrsängernestern. Aufgabe 6.4 Fische Fisch Brauchen Fische in fließendem Wasser mehr Sauerstoff als in stehendem Wasser? Wasser fließend stehend Sauerstoffverbrauch 113 127 149 134 112 120 119 102 101 131 90 157 88 74 100 92 76 99 Wir prüfen zuerst mit dem F-Test, ob die Varianzen signifikant unterschiedlich sind ( α = 5% ). Anschließend wenden wir uns der Hauptfrage zu ( α = 5% ). Bearbeitung Wasser Sauerstoffverbrauch Mittelwert SD fließend 113 127 149 134 112 120 119 102 101 131 120.8 14.9056 stehend 90 157 88 97 26.0165 Varianzquotienten-Test Testgröße F 3.0465 74 100 92 76 99 Mathematik 2 für Naturwissenschaften. Übung 6 6/9 Für den Varianzenquotienten-Test müssen wir die zweite Datenzeile für x nehmen. Es ist dann: nx = 8 x = 97 sx = 26.0165 n y = 10 y = 120.8 sy = 14.9056 Wir erhalten für die Testgröße: FExp = sx2 sy2 ≈ 3.0465 Nun gehen wir in die Tabelle für α = 5% . Die Freiheitsgrade für beide Stichproben sind 8 −1 = 7 und 10 −1 = 9 . Freiheitsgrade für den Nenner (kleinere Varianz) F-Tabelle (relevanter Ausschnitt): 1 2 3 4 5 1 161 18.5 10.1 7.71 6.61 2 199 19.0 9.55 6.94 5.79 6 7 8 9 10 5.99 5.59 5.32 5.12 4.96 5.14 4.74 4.46 4.26 4.10 Freiheitsgrade für den Zähler (größere Varianz) 3 4 5 6 7 8 216 225 230 234 237 239 19.2 19.2 19.3 19.3 19.4 19.4 9.28 9.12 9.01 8.94 8.89 8.85 6.59 6.39 6.26 6.16 6.09 6.04 5.41 5.19 5.05 4.95 4.88 4.82 4.76 4.35 4.07 3.86 3.71 4.53 4.12 3.84 3.63 3.48 4.39 3.97 3.69 3.48 3.33 4.28 3.87 3.58 3.37 3.22 4.21 3.79 3.50 3.29 3.14 4.15 3.73 3.44 3.23 3.07 9 241 19.4 8.81 6.00 4.77 10 242 19.4 8.79 5.96 4.74 4.10 3.68 3.39 3.18 3.02 4.06 3.64 3.35 3.14 2.98 Schranken der F-Verteilung für das Signifikanzniveau 5% Aus der Tabelle erhalten wir in unserem Beispiel den kritischen Schrankenwert Fkrit = 3.29 . Dieser ist größer als FExp ≈ 3.0465 ; wir können also die Nullhypothese der Varianzengleichheit beibehalten und übergehen zum nächsten Schritt: Wir testen mit der t-Verteilung die Nullhypothese µ x = µ y gegen die Alternative µ x < µ y . (x entspricht dem stehenden Wasser). Wir testen also einseitig. Es sei wieder α = 5% . Testgröße: nx +ny −2 nx ny t Exp = ( x − y ) n +n x y sx2 ( nx −1)+sy2 ( ny −1) Freiheitsgrade: ν = n x + n y − 2 = 16 ≈ 2.44508 Mathematik 2 für Naturwissenschaften. Übung 6 7/9 In der t-Tabelle müssen wir (einseitiger Test) unten einsteigen. Relevanter Tabellenausschnitt: FG ν 1 2 3 4 5 0.50 1.000 0.816 0.765 0.741 0.727 0.20 3.078 1.886 1.638 1.533 1.476 16 17 18 19 20 0.690 0.689 0.688 0.688 0.687 1.337 1.333 1.330 1.328 1.325 ∞ FG ν 0.674 0.25 1.226 0.10 Irrtumswahrscheinlichkeit α für den zweiseitigen Test 0.10 0.05 0.02 0.01 0.002 0.001 6.3114 12.706 31.821 63.65 318.30 636.61 2.920 4.303 6.965 9.925 22.327 31.598 2.353 3.182 4.541 5.841 10.214 12.924 2.132 2.776 3.747 4.604 7.173 8.610 2.015 2.571 3.365 4.032 5.893 6.869 1.746 1.740 1.734 1.729 1.725 2.120 2.110 2.101 2.093 2.086 2.583 2.567 2.552 2.539 2.528 2.921 2.898 2.878 2.861 2.845 3.686 3.646 3.610 3.579 3.552 4.015 3.965 3.922 3.883 3.850 1.645 1.960 2.326 2.575 3.090 3.290 0.05 0.025 0.01 0.005 0.001 0.0005 Irrtumswahrscheinlichkeit α für den einseitigen Test 0.0001 6366.1 99.992 28.000 15.544 11.178 5.134 5.044 4.966 4.897 4.837 3.890 0.00005 Schranken der t-Verteilung Wir erhalten auf dem Signifikanzniveau 5% den kritischen Schrankenwert t krit ≈ 1.746 . Dies ist deutlich kleiner als unsere berechnet Testgröße t Exp ≈ 2.44508 . Wir können also die Nullhypothese verwerfen. Fische brauchen im fließendem Wasser mehr Sauerstoff als in stehendem. Aufgabe 6.5 Prüfungsnoten Im Frühjahrssemester 2009 wurde eine gemeinsame Lehrveranstaltung für Studierende der Uni-P und der Uni-Q veranstaltet. Die Studierenden wurden auch gemeinsam geprüft und erhielten folgende Noten: Studierende der Hochschule Noten Uni-P 4.5, 4.5, 4, 5, 5, 5 Uni-Q 4.75, 5.25, 4.75, 6, 5.5, 6, 5.5, 5.5, 5.5, 5.5, 4.75, 5.75, 5.5 Sind signifikante Unterschiede (α = 2.5%, einseitig) feststellbar? Mathematik 2 für Naturwissenschaften. Übung 6 8/9 Bearbeitung Wir verwenden den Mann-Whitney-U-Test. Die Daten entstammen einer Ordinalskala. Wir rangieren die Daten. Da die Tabellen so organisiert sind, dass n1 ≥ n2 , beginnen wir mit der Uni-Q. Uni-Q Uni-P Note Rang 6 1.5 6 1.5 5.75 3 5.5 6.5 5.5 6.5 5.5 6.5 5.5 6.5 5.5 6.5 5.5 6.5 5.25 10 4.75 15 4.75 15 4.75 15 Note Rang 5 12 5 12 5 12 4.5 17.5 4.5 17.5 4 19 n1 = 13 R1 = 100 n2 = 6 R2 = 90 Berechnung der Testgröße U aus den Stichprobenumfängen n1, n2 und der Rangsumme R1 der Stichprobe 1: U Exp = n1n2 + n1 ( n1 +1) 2 − R1 Mathematik 2 für Naturwissenschaften. Übung 6 9/9 In unserem Beispiel ist: U Exp = 13 ⋅ 6 + 13⋅14 − 100 = 69 2 Relevanter Tabellenausschnitt (α = 2.5%, einseitig): n1\n2 1 2 3 4 5 1 - 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 - 0 0 1 2 6 7 8 9 10 - 0 0 0 1 1 2 2 3 2 3 4 4 5 3 5 5 6 8 6 8 10 13 7 10 12 15 17 8 11 14 17 20 23 11 12 13 - 0 1 1 3 4 4 6 9 13 16 19 23 26 30 7 11 14 18 22 26 29 33 37 8 12 16 20 24 28 33 37 41 45 Aus der Tabelle erhalten wir für n1 = 13 und n 2 = 6 die kritische untere Schranke 16. Für die kritische obere Schranke gilt: kritische obere Schranke = n1 ⋅ n 2 − kritische untere Schranke Das gibt in unserem Fall: kritische obere Schranke = 13 ⋅ 6 − 16 = 62 UExp. = 69 ist also größer als die kritische obere Schranke aus der Tabelle für den MannWhitney-U-Test, d. h. der Gruppenunterschied ist signifikant (α = 2.5 %, einseitig). Bemerkung: Die Daten sind soweit echt. Allerdings sind die an der Lehrveranstaltung teilnehmenden Studierenden der Uni-P erst im zweiten Semester, diejenigen der Uni-Q aber im vierten Semester. Zudem haben die Studierenden der Uni-P eine quantitativ geringere spezifische Vorbildung.