Jungen- und Mädchengeburten sind ungefähr gleich häufig. Es soll

Jungen- und Mädchengeburten sind ungefähr gleich häufig. Es soll nun untersucht werden, ob die Wahrscheinlichkeit der Geburt eines Jungen genau 50%
beträgt, oder ob sie, wie es in der Literatur immer wieder behauptet wird, gößer
als 50% ist. Allerdings schließen wir bei unseren nachfolgenden Betrachtungen
die Möglichkeit von Mehrlingsgeburten aus.
Die Wahrscheinlichkeit, dass eine schwangere Frau einen Jungen zur Welt
bringt, bezeichnen wir mit p. Wir wollen also die Hypothese p = 0.5 überprüfen.
Hierfür benutzen wir eine Stichprobe von 9534 Kölner Geburten aus dem Jahr
2006, unter denen sich 4939 Jungengeburten befanden. Wenn unsere Hypothese
zutrifft, so sind ungefähr die Hälfte, also 4767 Jungengeburten zu erwarten.
Wenn die beobachtete Zahl zu sehr von 4767 abweicht, indem sie größer als ein
kritischer Wert c ist, so fassen wir dies als ein Anzeichen dafür auf, dass unsere
Hypothese falsch war.
– Typeset by FoilTEX –
1
Aber was soll diesmal dieses “zu sehr” bedeuten? Entsprechend der oben
gemachten Bemerkung wird der Wert c so bestimmt, dass die Wahrscheinlichkeit
mehr als c Jungengeburten in einer Stichprobe von 9534 Geburten zu beobachten
kleiner als α = 5% ist. Das bedeutet also, dass man das Risiko eingeht, in
20 von 100 Fällen die Hypothese zu verwerfen, obwohl sie richtig ist. Wir
bestimmen also für die binomialverteilte Zufallsvariable
X = Anzahl der Jungengeburten unter 9534 Geburten
einen kritischen Wert c aus der Gleichung
P (X > c) = α = 0.05,
wobei der Parameter p der zugrunde liegenden Binomialverteilung mit n = 9534
entsprechend unserer Hypothese mit p = 0.5 angenommen wird.
– Typeset by FoilTEX –
2
Wenn der aus der Stichprobe entnommene Wert x = 4767 der Realisation der
Zufallsvariablen X größer als c ist, so verwerfen wir die Hypothese. Ist hingegen
4939 < c, so nehmen wir unsere Hypothese an. Die Binomialverteilung kann in
diesem Fall aufgrund des zentralen Grenzwertsatzes durch eine Normalverteilung
mit Mittelwert
µ = n · p ≈ 4767
und Varianz
σ 2 = n · p · (1 − p) ≈ 2384
brauchbar angenähert werden.
Es gilt also:
P (X > c) = 1 − P (X ≤ c) ≈ 1 − Φ
– Typeset by FoilTEX –
c − 4767
√
2384
= 0.05.
3
Diese Gleichung kann man nun in die Gleichung
c − 4767
Φ √
2384
= 0.95
umschreiben. Das heißt, dass der Wert
c − 4767
√
2384
gleich dem 95%-Quantil der Standardnormalverteilung entsprechen muss.
Schaut man nun den entsprechenden Wert in der Tabelle nach, so erhält
man die Gleichung
c − 4767
√
= 1.945
2384
woraus sich der Wert c ≈ 4862 berechnen lässt.
– Typeset by FoilTEX –
4
Abbildung 1: Skizze der Lage des kritischen Wertes c = 4862 bezüglich der (angenäherten) Verteilung der Variablen X im Falle der Richtigkeit der Hypothese.
Da 4939>4862 ist, verwerfen wir die Hypothese und nehmen die Alternativhypothese bzw. Alternative an, dass p > 0.5 ist.
– Typeset by FoilTEX –
5