Hans Walser Mathematik 2 für Naturwissenschaften

Werbung
Hans Walser
Mathematik 2 für Naturwissenschaften
Frühjahrssemester 2014
Übung 6
Testen von Hypothesen
7. - 10. April 2014
Aufgabe 6.1 Statistik der Geburten
The Mitcham Public Health Department found an unexpected boom in boy birth during
May. There were 60 boys and 35 girls born during the month.
Die Wahrscheinlichkeit für eine Knabengeburt beträgt p = 0.514. Ist die oben stehende
Meldung eine echte Sensation?
Berechnen Sie die Wahrscheinlichkeit, dass die beobachtete Anzahl Knabengeburten
um so viel oder mehr wie in der Zeitungsnotiz von der erwarteten Anzahl abweicht.
Ergebnis
2.852% (zweiseitig). Also doch eine kleine Sensation.
Bearbeitung
Wir arbeiten mit der Normalverteilung. Es ist:
n = 95, p = 0.514, µ = np = 48.83, σ = np (1 − p ) ≈ 4.8715
Für die obere Grenze 60 − 12 erhalten wir standardisiert:
ub =
60− 12 − µ
σ
≈ 2.1903
Die Tabelle liefert:
Φ ( ub ) = Φ ( 2.19 ) = 0.98574
Die Wahrscheinlichkeit, dass 60 oder mehr Knaben geboren werden, ist:
1 − Φ ( 2.19 ) = 1 − 0.98574 = 0.01426
Entsprechend die Wahrscheinlichkeit für eine Abweichung nach unten. Somit das Resultat:
2 (1 − Φ ( 2.19 )) = 0.02852 = 2.852%
In der folgenden Grafik ist das der Anteil außerhalb des roten Bereiches.
Mathematik 2 für Naturwissenschaften. Übung 6
2/9
0.1
0.9715
40
50
60
97.15% im roten Bereich
Aufgabe 6.2 99%-Vertrauensintervall
Wir haben folgende acht Messwerte:
4.4
5.8
Für diese Messwerte gilt:
3.7
9.2
4.1
3.8
5.3
3.7
s
x = 5, sx = SDx = 1.8655, SE x = x = 0.6595
8
Von wo bis wo geht das 99% Vertrauensintervall?
Bevor Sie losrechnen: Die Messwerte sind dieselben wie im Beispiel in der Vorlesung.
Statt α = 5% haben wir hier aber α = 1% . Wir wollen also eine kleinere Irrtumswahrscheinlichkeit, positiv formuliert: Mehr Sicherheit. Wird dadurch das Vertrauensintervall größer oder kleiner?
Bearbeitung
In unserem Beispiel ist ν = n −1 = 8 −1 = 7 .
Relevanter Ausschnitt aus der Tabelle:
FG
ν
1
2
3
4
5
0.50
1.000
0.816
0.765
0.741
0.727
0.20
3.078
1.886
1.638
1.533
1.476
6
7
8
9
10
0.718
0.711
0.706
0.703
0.700
1.440
1.415
1.397
1.383
1.372
Irrtumswahrscheinlichkeit α für den zweiseitigen Test
0.10
0.05
0.02
0.01
0.002
0.001
6.3114 12.706 31.821
63.65
318.30 636.61
2.920
4.303
6.965
9.925
22.327 31.598
2.353
3.182
4.541
5.841
10.214 12.924
2.132
2.776
3.747
4.604
7.173
8.610
2.015
2.571
3.365
4.032
5.893
6.869
1.943
1.895
1.860
1.833
1.812
2.441
2.365
2.306
2.262
2.228
3.143
2.998
2.896
2.821
2.764
3.707
3.499
3.355
3.250
3.169
5.208
4.785
4.501
4.297
4.144
5.959
5.408
5.041
4.781
4.587
0.0001
6366.1
99.992
28.000
15.544
11.178
9.082
7.885
7.120
6.594
6.211
Schranken der t-Verteilung
Es ist t krit = 3.499 ; der kritische Wert ist größer als im alten Beispiel. Die Latte wird
höher gelegt.
Mathematik 2 für Naturwissenschaften. Übung 6
3/9
99% Vertrauensintervall:
[ x − t1%,7 ⋅ SE x , x + t1%,7 ⋅ SE x ] = [5 − 3.499 ⋅ 0.6595, 5 + 3.499 ⋅ 0.6595]
= [2.6924, 7.3075]
Das Vertrauensintervall ist länger geworden. Wir sind vorsichtiger mit dem Ablehnen
der Nullhypothese.
Anders formuliert: Wenn wir ein kleineres Vertrauensintervall wählen, wird die Irrtumswahrscheinlichkeit größer.
Aufgabe 6.3 Länge von Kuckuckseiern
Kuckuck
Für 25 Kuckuckseier ergaben sich beim Ausmessen folgende Längen [mm]:
aus Zaunkönigsnestern
aus Rohrsängernestern
22.2
22.1
20.4
20.9
23.3
21.7
23.0
19.9
21.1
21.0
21.3
21.6
22.4
22.1
21.1
Mittelwert: 21.22 mm
21.0
21.1
20.1
22.1
21.7
22.9
22.3
22.7
21.3
22.0
Mittelwert: 22.24 mm
Unterscheidet der Kuckuck zwischen Zaunkönigsnestern und Rohrsängernestern?
Wir vergleichen die beiden Mittelwerte (zweiseitig, α = 5 %).
Mathematik 2 für Naturwissenschaften. Übung 6
Bearbeitung
Z
1
Z
1
Z
1
Z
1
Z
1
Z
1
Z
1
Z
1
Z
1
Z
1
Z
1
Z
1
Z
1
Z
1
Z
1
Anzahl
15
Mittelwert
SD
19.9
22.2
21.6
21
22.1
21.1
22.4
21.1
20.4
21
22.1
20.1
20.9
21.3
21.1
4/9
R
R
R
R
R
R
R
R
R
R
1
1
1
1
1
1
1
1
1
1
Anzahl
10
Mittelwert
SD
21.22
0.754226188
23.3
22.1
22.3
21.3
21.7
21.7
22
22.1
23
22.9
22.24
0.641525959
Testgröße t 3.50785396
Zaunkönigsnester:
n x = 15
x = 21.22 mm
Rohrsängernester:
n y = 10
y = 22.24 mm
sx = 0.75422619 mm
sy = 0.64152596 mm
Testgröße:
nx +ny −2
nx ny
t Exp = ( x − y ) n +n
x
y
= 1.02 ⋅ 15⋅10
25
sx2
( nx −1)+sy2 ( ny −1)
23
0.75422619 2 ⋅14+0.64152596 2 ⋅9
Freiheitsgrad:
ν = n x + n y − 2 = 15 + 10 − 2 = 23
α = 5% . Zweiseitiger Test.
≈ 3.507853954
Mathematik 2 für Naturwissenschaften. Übung 6
5/9
Tabelle (relevanter Ausschnitt):
FG
ν
0.50
0.20
21
22
23
24
25
0.686
0.686
01685
0.685
0.684
1.323
1.321
1.319
1.318
1.316
FG
ν
0.25
0.10
Irrtumswahrscheinlichkeit α für den zweiseitigen Test
0.10
0.05
0.02
0.01
0.002
0.001
1.721
1.717
1.714
1.711
1.708
2.080
2.074
2.069
2.064
2.060
2.518
2.508
2.500
2.492
2.485
2.831
2.819
2.807
2.797
2.787
3.527
3.505
3.485
3.467
3.450
0.0001
3.819
3.792
3.767
3.745
3.725
0.05
0.025
0.01
0.005
0.001
0.0005
Irrtumswahrscheinlichkeit α für den einseitigen Test
4.784
4.736
4.693
4.654
4.619
0.00005
Schranken der t-Verteilung
Wegen t Exp ≈ 3.5078 > 2.069 ist die Nullhypothese zu verwerfen. Der Kuckuck macht
einen Unterschied zwischen Zaunkönigs- und Rohrsängernestern.
Aufgabe 6.4 Fische
Fisch
Brauchen Fische in fließendem Wasser mehr Sauerstoff als in stehendem Wasser?
Wasser
fließend
stehend
Sauerstoffverbrauch
113 127 149 134 112 120 119 102 101 131
90 157
88
74 100
92
76
99
Wir prüfen zuerst mit dem F-Test, ob die Varianzen signifikant unterschiedlich sind
( α = 5% ). Anschließend wenden wir uns der Hauptfrage zu ( α = 5% ).
Bearbeitung
Wasser
Sauerstoffverbrauch
Mittelwert
SD
fließend
113 127 149 134 112 120 119 102 101 131
120.8
14.9056
stehend
90 157 88
97
26.0165
Varianzquotienten-Test
Testgröße F 3.0465
74 100 92
76
99
Mathematik 2 für Naturwissenschaften. Übung 6
6/9
Für den Varianzenquotienten-Test müssen wir die zweite Datenzeile für x nehmen. Es
ist dann:
nx = 8
x = 97
sx = 26.0165
n y = 10
y = 120.8
sy = 14.9056
Wir erhalten für die Testgröße:
FExp =
sx2
sy2
≈ 3.0465
Nun gehen wir in die Tabelle für α = 5% . Die Freiheitsgrade für beide Stichproben sind
8 −1 = 7 und 10 −1 = 9 .
Freiheitsgrade für den Nenner
(kleinere Varianz)
F-Tabelle (relevanter Ausschnitt):
1
2
3
4
5
1
161
18.5
10.1
7.71
6.61
2
199
19.0
9.55
6.94
5.79
6
7
8
9
10
5.99
5.59
5.32
5.12
4.96
5.14
4.74
4.46
4.26
4.10
Freiheitsgrade für den Zähler (größere Varianz)
3
4
5
6
7
8
216
225
230
234
237
239
19.2
19.2
19.3
19.3
19.4
19.4
9.28
9.12
9.01
8.94
8.89
8.85
6.59
6.39
6.26
6.16
6.09
6.04
5.41
5.19
5.05
4.95
4.88
4.82
4.76
4.35
4.07
3.86
3.71
4.53
4.12
3.84
3.63
3.48
4.39
3.97
3.69
3.48
3.33
4.28
3.87
3.58
3.37
3.22
4.21
3.79
3.50
3.29
3.14
4.15
3.73
3.44
3.23
3.07
9
241
19.4
8.81
6.00
4.77
10
242
19.4
8.79
5.96
4.74
4.10
3.68
3.39
3.18
3.02
4.06
3.64
3.35
3.14
2.98
Schranken der F-Verteilung für das Signifikanzniveau 5%
Aus der Tabelle erhalten wir in unserem Beispiel den kritischen Schrankenwert
Fkrit = 3.29 . Dieser ist größer als FExp ≈ 3.0465 ; wir können also die Nullhypothese
der Varianzengleichheit beibehalten und übergehen zum nächsten Schritt:
Wir testen mit der t-Verteilung die Nullhypothese µ x = µ y gegen die Alternative
µ x < µ y . (x entspricht dem stehenden Wasser). Wir testen also einseitig. Es sei wieder
α = 5% .
Testgröße:
nx +ny −2
nx ny
t Exp = ( x − y ) n +n
x
y
sx2
( nx −1)+sy2 ( ny −1)
Freiheitsgrade:
ν = n x + n y − 2 = 16
≈ 2.44508
Mathematik 2 für Naturwissenschaften. Übung 6
7/9
In der t-Tabelle müssen wir (einseitiger Test) unten einsteigen. Relevanter Tabellenausschnitt:
FG
ν
1
2
3
4
5
0.50
1.000
0.816
0.765
0.741
0.727
0.20
3.078
1.886
1.638
1.533
1.476
16
17
18
19
20
0.690
0.689
0.688
0.688
0.687
1.337
1.333
1.330
1.328
1.325
∞
FG
ν
0.674
0.25
1.226
0.10
Irrtumswahrscheinlichkeit α für den zweiseitigen Test
0.10
0.05
0.02
0.01
0.002
0.001
6.3114 12.706 31.821
63.65
318.30 636.61
2.920
4.303
6.965
9.925
22.327 31.598
2.353
3.182
4.541
5.841
10.214 12.924
2.132
2.776
3.747
4.604
7.173
8.610
2.015
2.571
3.365
4.032
5.893
6.869
1.746
1.740
1.734
1.729
1.725
2.120
2.110
2.101
2.093
2.086
2.583
2.567
2.552
2.539
2.528
2.921
2.898
2.878
2.861
2.845
3.686
3.646
3.610
3.579
3.552
4.015
3.965
3.922
3.883
3.850
1.645
1.960
2.326
2.575
3.090
3.290
0.05
0.025
0.01
0.005
0.001
0.0005
Irrtumswahrscheinlichkeit α für den einseitigen Test
0.0001
6366.1
99.992
28.000
15.544
11.178
5.134
5.044
4.966
4.897
4.837
3.890
0.00005
Schranken der t-Verteilung
Wir erhalten auf dem Signifikanzniveau 5% den kritischen Schrankenwert t krit ≈ 1.746 .
Dies ist deutlich kleiner als unsere berechnet Testgröße t Exp ≈ 2.44508 . Wir können
also die Nullhypothese verwerfen. Fische brauchen im fließendem Wasser mehr Sauerstoff als in stehendem.
Aufgabe 6.5 Prüfungsnoten
Im Frühjahrssemester 2009 wurde eine gemeinsame Lehrveranstaltung für Studierende
der Uni-P und der Uni-Q veranstaltet. Die Studierenden wurden auch gemeinsam geprüft und erhielten folgende Noten:
Studierende der Hochschule
Noten
Uni-P
4.5, 4.5, 4, 5, 5, 5
Uni-Q
4.75, 5.25, 4.75, 6, 5.5, 6, 5.5, 5.5, 5.5, 5.5, 4.75,
5.75, 5.5
Sind signifikante Unterschiede (α = 2.5%, einseitig) feststellbar?
Mathematik 2 für Naturwissenschaften. Übung 6
8/9
Bearbeitung
Wir verwenden den Mann-Whitney-U-Test. Die Daten entstammen einer Ordinalskala.
Wir rangieren die Daten. Da die Tabellen so organisiert sind, dass n1 ≥ n2 , beginnen
wir mit der Uni-Q.
Uni-Q
Uni-P
Note
Rang
6
1.5
6
1.5
5.75
3
5.5
6.5
5.5
6.5
5.5
6.5
5.5
6.5
5.5
6.5
5.5
6.5
5.25
10
4.75
15
4.75
15
4.75
15
Note
Rang
5
12
5
12
5
12
4.5
17.5
4.5
17.5
4
19
n1 = 13 R1 = 100 n2 = 6 R2 = 90
Berechnung der Testgröße U aus den Stichprobenumfängen n1, n2 und der Rangsumme
R1 der Stichprobe 1:
U Exp = n1n2 +
n1 ( n1 +1)
2
− R1
Mathematik 2 für Naturwissenschaften. Übung 6
9/9
In unserem Beispiel ist:
U Exp = 13 ⋅ 6 + 13⋅14
− 100 = 69
2
Relevanter Tabellenausschnitt (α = 2.5%, einseitig):
n1\n2
1
2
3
4
5
1
-
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20
-
0
0
1
2
6
7
8
9
10
-
0
0
0
1
1
2
2
3
2
3
4
4
5
3 5
5 6 8
6 8 10 13
7 10 12 15 17
8 11 14 17 20 23
11
12
13
-
0
1
1
3
4
4
6 9 13 16 19 23 26 30
7 11 14 18 22 26 29 33 37
8 12 16 20 24 28 33 37 41 45
Aus der Tabelle erhalten wir für n1 = 13 und n 2 = 6 die kritische untere Schranke 16.
Für die kritische obere Schranke gilt:
kritische obere Schranke = n1 ⋅ n 2 − kritische untere Schranke
Das gibt in unserem Fall:
kritische obere Schranke = 13 ⋅ 6 − 16 = 62
UExp. = 69 ist also größer als die kritische obere Schranke aus der Tabelle für den MannWhitney-U-Test, d. h. der Gruppenunterschied ist signifikant (α = 2.5 %, einseitig).
Bemerkung: Die Daten sind soweit echt. Allerdings sind die an der Lehrveranstaltung
teilnehmenden Studierenden der Uni-P erst im zweiten Semester, diejenigen der Uni-Q
aber im vierten Semester. Zudem haben die Studierenden der Uni-P eine quantitativ
geringere spezifische Vorbildung.
Herunterladen