Jungen- und Mädchengeburten sind ungefähr gleich häufig. Es soll

Werbung
Jungen- und Mädchengeburten sind ungefähr gleich häufig. Es soll nun untersucht werden, ob die Wahrscheinlichkeit der Geburt eines Jungen genau 50%
beträgt, oder ob sie, wie es in der Literatur immer wieder behauptet wird, gößer
als 50% ist. Allerdings schließen wir bei unseren nachfolgenden Betrachtungen
die Möglichkeit von Mehrlingsgeburten aus.
Die Wahrscheinlichkeit, dass eine schwangere Frau einen Jungen zur Welt
bringt, bezeichnen wir mit p. Wir wollen also die Hypothese p = 0.5 überprüfen.
Hierfür benutzen wir eine Stichprobe von 9534 Kölner Geburten aus dem Jahr
2006, unter denen sich 4939 Jungengeburten befanden. Wenn unsere Hypothese
zutrifft, so sind ungefähr die Hälfte, also 4767 Jungengeburten zu erwarten.
Wenn die beobachtete Zahl zu sehr von 4767 abweicht, indem sie größer als ein
kritischer Wert c ist, so fassen wir dies als ein Anzeichen dafür auf, dass unsere
Hypothese falsch war.
– Typeset by FoilTEX –
1
Aber was soll diesmal dieses “zu sehr” bedeuten? Entsprechend der oben
gemachten Bemerkung wird der Wert c so bestimmt, dass die Wahrscheinlichkeit
mehr als c Jungengeburten in einer Stichprobe von 9534 Geburten zu beobachten
kleiner als α = 5% ist. Das bedeutet also, dass man das Risiko eingeht, in
20 von 100 Fällen die Hypothese zu verwerfen, obwohl sie richtig ist. Wir
bestimmen also für die binomialverteilte Zufallsvariable
X = Anzahl der Jungengeburten unter 9534 Geburten
einen kritischen Wert c aus der Gleichung
P (X > c) = α = 0.05,
wobei der Parameter p der zugrunde liegenden Binomialverteilung mit n = 9534
entsprechend unserer Hypothese mit p = 0.5 angenommen wird.
– Typeset by FoilTEX –
2
Wenn der aus der Stichprobe entnommene Wert x = 4767 der Realisation der
Zufallsvariablen X größer als c ist, so verwerfen wir die Hypothese. Ist hingegen
4939 < c, so nehmen wir unsere Hypothese an. Die Binomialverteilung kann in
diesem Fall aufgrund des zentralen Grenzwertsatzes durch eine Normalverteilung
mit Mittelwert
µ = n · p ≈ 4767
und Varianz
σ 2 = n · p · (1 − p) ≈ 2384
brauchbar angenähert werden.
Es gilt also:
P (X > c) = 1 − P (X ≤ c) ≈ 1 − Φ
– Typeset by FoilTEX –
c − 4767
√
2384
= 0.05.
3
Diese Gleichung kann man nun in die Gleichung
c − 4767
Φ √
2384
= 0.95
umschreiben. Das heißt, dass der Wert
c − 4767
√
2384
gleich dem 95%-Quantil der Standardnormalverteilung entsprechen muss.
Schaut man nun den entsprechenden Wert in der Tabelle nach, so erhält
man die Gleichung
c − 4767
√
= 1.945
2384
woraus sich der Wert c ≈ 4862 berechnen lässt.
– Typeset by FoilTEX –
4
Abbildung 1: Skizze der Lage des kritischen Wertes c = 4862 bezüglich der (angenäherten) Verteilung der Variablen X im Falle der Richtigkeit der Hypothese.
Da 4939>4862 ist, verwerfen wir die Hypothese und nehmen die Alternativhypothese bzw. Alternative an, dass p > 0.5 ist.
– Typeset by FoilTEX –
5
Herunterladen