Jungen- und Mädchengeburten sind ungefähr gleich häufig. Es soll nun untersucht werden, ob die Wahrscheinlichkeit der Geburt eines Jungen genau 50% beträgt, oder ob sie, wie es in der Literatur immer wieder behauptet wird, gößer als 50% ist. Allerdings schließen wir bei unseren nachfolgenden Betrachtungen die Möglichkeit von Mehrlingsgeburten aus. Die Wahrscheinlichkeit, dass eine schwangere Frau einen Jungen zur Welt bringt, bezeichnen wir mit p. Wir wollen also die Hypothese p = 0.5 überprüfen. Hierfür benutzen wir eine Stichprobe von 9534 Kölner Geburten aus dem Jahr 2006, unter denen sich 4939 Jungengeburten befanden. Wenn unsere Hypothese zutrifft, so sind ungefähr die Hälfte, also 4767 Jungengeburten zu erwarten. Wenn die beobachtete Zahl zu sehr von 4767 abweicht, indem sie größer als ein kritischer Wert c ist, so fassen wir dies als ein Anzeichen dafür auf, dass unsere Hypothese falsch war. – Typeset by FoilTEX – 1 Aber was soll diesmal dieses “zu sehr” bedeuten? Entsprechend der oben gemachten Bemerkung wird der Wert c so bestimmt, dass die Wahrscheinlichkeit mehr als c Jungengeburten in einer Stichprobe von 9534 Geburten zu beobachten kleiner als α = 5% ist. Das bedeutet also, dass man das Risiko eingeht, in 20 von 100 Fällen die Hypothese zu verwerfen, obwohl sie richtig ist. Wir bestimmen also für die binomialverteilte Zufallsvariable X = Anzahl der Jungengeburten unter 9534 Geburten einen kritischen Wert c aus der Gleichung P (X > c) = α = 0.05, wobei der Parameter p der zugrunde liegenden Binomialverteilung mit n = 9534 entsprechend unserer Hypothese mit p = 0.5 angenommen wird. – Typeset by FoilTEX – 2 Wenn der aus der Stichprobe entnommene Wert x = 4767 der Realisation der Zufallsvariablen X größer als c ist, so verwerfen wir die Hypothese. Ist hingegen 4939 < c, so nehmen wir unsere Hypothese an. Die Binomialverteilung kann in diesem Fall aufgrund des zentralen Grenzwertsatzes durch eine Normalverteilung mit Mittelwert µ = n · p ≈ 4767 und Varianz σ 2 = n · p · (1 − p) ≈ 2384 brauchbar angenähert werden. Es gilt also: P (X > c) = 1 − P (X ≤ c) ≈ 1 − Φ – Typeset by FoilTEX – c − 4767 √ 2384 = 0.05. 3 Diese Gleichung kann man nun in die Gleichung c − 4767 Φ √ 2384 = 0.95 umschreiben. Das heißt, dass der Wert c − 4767 √ 2384 gleich dem 95%-Quantil der Standardnormalverteilung entsprechen muss. Schaut man nun den entsprechenden Wert in der Tabelle nach, so erhält man die Gleichung c − 4767 √ = 1.945 2384 woraus sich der Wert c ≈ 4862 berechnen lässt. – Typeset by FoilTEX – 4 Abbildung 1: Skizze der Lage des kritischen Wertes c = 4862 bezüglich der (angenäherten) Verteilung der Variablen X im Falle der Richtigkeit der Hypothese. Da 4939>4862 ist, verwerfen wir die Hypothese und nehmen die Alternativhypothese bzw. Alternative an, dass p > 0.5 ist. – Typeset by FoilTEX – 5